Gradbeni vestnik • letnik 66 • junij 2017138 Daniela Dvornik Perhavec, Danijel Rebolj, Milan Zorman•PODPORA UMETNE INTELIGENCE PRI PROJEKTIH PRENOVE IN UPRAVLJANJA STAVB PODPORA UMETNE INTELIGENCE PRI PROJEKTIH PRENOVE IN UPRAVLJANJA STAVB ARTIFICIAL INTELIGENCE AS A SUPPORT IN RENOVATION PROJECT AND FACILITY MANAGEMENT dr. Daniela Dvornik Perhavec, univ. dipl. inž. grad. daniela.d-perhavec@um.si red. prof. dr. Danijel Rebolj, univ. dipl. inž. grad. danijel.rebolj@um.si Univerza v Mariboru, Fakulteta za gradbeništvo, prometno inženirstvo in arhitekturo, Smetanova 17, 2000 Maribor red. prof. dr. Milan Zorman, univ. dipl. inž. rač. in inf. milan.zorman@um.si Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko, Smetanova 17, 2000 Maribor ZNANSTVENI ČLANEK UDK 004.896:725.1(497.4) Povzetek l Pridobivanje znanja iz podatkov (ang. Knowledge Discovery from Da- tabase, krajše KDD) in podatkovno rudarjenje (ang. Data Mining, krajše DM) spadata v področje racionalne umetne inteligence (ang. Artificial Inteligence, krajše AI). Metode umetne inteligence na podlagi podatkovnih baz omogočajo ustvarjanje modelov, od- krivanje novih znanj in napovedovanje novih rešitev. Vključevanje umetne inteligence v različne segmente gradbeništva in gradbene industrije je šele v povojih, kaj kmalu pa si lahko obetamo širšo vključenost, ki bo pogojena z razvojem podatkovnih baz in podat- kovnih skladišč. Z uporabo tehnologij BIM pri projektiranju novogradenj bomo dragocene podatke lahko pridobili, za stare, že obstoječe stavbe pa bo podatke treba pridobiti, zbrati, prečistiti in organizirati tako, da jih bomo lahko modelirali s tehnologijami umetne inteli- gence. V članku predstavljamo uporabo zbranih podatkov kot ideje za pobudo razvoja podatkovnih baz. Predstavljamo rezultate dveh raziskav. V prvi raziskavi smo preučevali karakteristiko »nosilni zid« za stanovanjske stavbe z etažnostjo klet, pritličje, nadstropje in mansarda; stavbe so bile grajene v obdobju med letoma 1857 do 1948. Članek pred- stavlja dva vidika potrebe po sistematičnem zbiranju, urejanju in skladiščenju podatkov, prvič, kot možnost prikaza uporabe, in drugič, kot ideja za pobudo za razvoj podatkovnih baz. Predstavljamo rezultate dveh študij. V prvi raziskavi smo preučevali značilnost zu- nanjega nosilnega zidu za stanovanjske stavbe s kletjo, pritličjem, prvim nadstropjem in mansardo; stavbe so bile zgrajena med letoma 1857 in 1948. Cilj te raziskave je bil ust- variti model za napovedovanje lastnosti objektov, za katere arhivsko gradivo ne obstaja. V drugi raziskavi smo proučevali kombinacijo značilnosti objektov in porabe toplotne en- ergije v stavbah na Tehniški fakulteti Univerze v Mariboru. Cilj druge študije je razviti model za določitev vpliva posameznih značilnosti predmetov na porabo toplotne energije. Oba modela temeljita na uporabi umetne inteligence pri gradnji odločitvenih dreves. Ključne besede: stavba, podatkovne baze, umetna inteligenca, podatkovno rudarjenje, odločitvena drevesa Gradbeni vestnik • letnik 66 • junij 2017 139 INTEGRIRANI MONITORING KOT ORODJE ZA UČINKOVITO IN EKONOMIČNO ENERGETSKO UPRAVLJANJE JAVNIH STAVB• Daniela Dvornik Perhavec, Danijel Rebolj, Milan Zorman 1•UVOD Summary l Knowledge discovery from database (KDD) and data mining (DM) belong to the field of artificial intelligence (AI). Based on the AI methods and a lot of data we can create models, discover new knowledge and predict new solutions. he integration of artificial intelligence in different segments in the construction industry is still in its infancy, but soon we can expect a wider involvement, which will be conditioned by the development of databases and the data warehouses. By using BIM technology when designing new buildings, we can gain valuable information, although informa- tion about old existing facilities will also have to be obtained, collected, consolidated and organized in a way that they can will be modeled with techniques of artificial intel- ligence. The paper shows how to use information as an idea for an initiative to devel- oping databases. We present the results of two studies. In the first study, we studied the characteristic “external main wall” for residential buildings with basement, ground floor, first floor and attic, built between 1857 and 1948. The aim of this research was to create a model to predict the characteristics of the object for which the archival mate- rial does not exist. In the second study, we studied a combination of characteristics of objects and consumption of thermal energy in the buildings of the Technical Faculty of the University of Maribor. The goal of the second study was to develop a model to deter- mine the impact of individual characteristics of objects on the consumption of thermal energy. Both models are based on the use of artificial intelligence in the construction of decision trees. Key words: building, databases, artificial intelligence, data mining, decision trees Umetna inteligenca (ang. Artificial Inteligence, krajše AI) je po definiciji področje znanosti, ki spada v informatiko z interdisciplinarnim značajem [Russell, 2004]. Z njeno pomočjo lahko na podlagi obstoječih podatkov odkri- jemo novo, do zdaj skrito znanje in ga upora- bimo za uspešnejše diagnosticiranje, analizo, načrtovanje, trženje, odločitev ipd. Umetna inteligenca se ukvarja s spozna- vanjem in razlago problemov, pri katerih se zahtevajo inteligenten pristop in proučevanje, načrtovanje in razvoj umetno vodenih inteli- gentnih tehnologij. Z razvojem umetne inteli- gence sta povezani dve imeni, in sicer Turing (znan po Turingovem stroju) in McCarthy; razvijati se je začela leta 1950 [Gams, 2012]. V svetu sicer štejejo za začetek umetne in- teligence letnico 1956, ko je McCarthy v ZDA organiziral konferenco, ki je povzročila izbruh navdušenja nad novim pojmom umetna in- teligenca, z njo pa so se začeli ukvarjati po vsem sveta.1 Umetna inteligenca je prepletena z matematiko, nevrologijo, psihologijo, logiko, 1 Turing je govoril o »machine intelligence« (inteligenci stroja). filozofijo in drugimi vedami ter obsega vsaj štiri področja (vizualno, govorno, manipulativno in racionalno inteligenco) in več podpodročij. Izvorni cilj umetne inteligence je bil izdelati napravo, ki posnema človeško razmišljanje. Pri tem bi bili vključeni tudi čustva in zav- est. Danes je cilj umetne inteligence razvoj tehnologij in naprav, ki se vedejo, kot bi razpo- lagale z naravno inteligenco. Z njo se razvijajo metode in tehnike reševanja problemov, ki jih je težko rešiti s klasičnimi metodami. Z metodami umetne inteligence, kot sta me- toda pridobivanja znanja iz podatkov (KDD) in metoda podatkovnega rudarjenja (DM), smo preverili možnost odkrivanja novih znanj in up- orabnost le-teh pri ciljno usmerjenem modelu v gradbeništvu. Zanimalo nas je, ali z novo pri- dobljenim znanjem lahko koristno pomagamo projektantom, vzdrževalcem, načrtovalcem, ki obstoječo stavbo proučujejo in analizirajo zaradi potreb po izdelovanju študij, projektov, investicijske dokumentacije ipd. Nadalje nas je zanimalo, ali z metodami umetne inteligence, natančneje z metodo odločitvenih dreves, lahko zapolnimo vrzel tam, kjer so se projekti v dolgi zgodovini izgubili, ter je obstoječo stavbo treba spoznati in raziskati z vsemi karakteristi- kami in materiali. V skladu z razvojnoraziskovalnim projektom »E-nepremična inženirska zakladnica« smo za ciljno določene stavbe opravili razisko- valni in razvojni del z namenom povezo- vanja vsebin interdisciplinarne narave, in sicer karakteristične podatke o stavbi in porabi toplotne energije [Dvornik Perhavec, 2015]. Največje ovire, na katere smo naleteli pri raziskovalnem delu, so bile naslednje: • podatkovne baze za tovrstne potrebe ne obstajajo, • projekti, iz katerih bi lahko pridobili karakteristične podatke o stavbah, so neustrezno arhivirani (razen v pokrajin- skih arhivih), • poraba toplotne energije se beleži za sklop stavb skupaj in ne ločeno za posa- mezne stavbe. V 2. poglavju bomo podrobneje predstavili del racionalne inteligence, in sicer metode prido- bivanja znanja iz podatkov, in podatkovno rudarjenje. V tretjem poglavju predstavljamo podatkovno modeliranje in proces gradnje odločitvenih dreves. V četrtem poglavju sle- di predstavitev rezultatov ter v nadaljevanju zaključek, zahvala in literatura. Gradbeni vestnik • letnik 66 • junij 2017140 2• ODKRIVANJE ZNANJA V PODATKIH (KNOWLEDGE DISCOVERY FROM DATA) IN PODATKOVNO RUDARJENJE (DATA MINING) 2.1 Splošno Odkrivanje znanja v podatkih (KDD) je za- pleten proces za odkrivanja asociacij, spre- memb, anomalij, dogodkov, potencialnih upo- rabnih in navsezadnje razumljivih vzorcev iz podatkov, ki predstavljajo implicitne, prvotno nepoznane zakonitosti ali informacije v danih podatkih [Witten, 2005]. Definicijo podatkovnega rudarjenja sta post- avila Han in Kamber leta 2001 [Han, 2006], in sicer: »Podatkovno rudarjenje je proces odkrivanja zanimivih in pomembnih vzorcev ter znanja iz ogromne količine podatkov, shranjenih v podatkovnih bazah, podatkovnih skladiščih in drugih informacijskih odlagališčih s koriščenjem metod strojnega učenja.« [Han, 2006] Odkrivanje znanja v podatkih (KDD) je proces [Zorman, 2003], ki vsebuje devet (9) korakov, in sicer od razumevanja uporabe področja za odkrivanje znanja v bazah, ustvarjanja in oblikovanja nabora ciljnih podatkov, čiščenja in predobdelave podatkov (zbrati je treba informacije za model, odločiti o strategijah za obravnavo manjkajočih podatkov in po- dobno), izbiranja podatkov v odvisnosti od namena naloge. Opraviti je treba izbiro funkcij podatkovnega rudarjenja, izdelati modeliranje in raziskovalno analizo, ki pomeni izbiro al- goritmov, izbiro metode ali metod, ki se upo- rabljajo pri iskanju vzorcev podatkov. Nadalje se izvede podatkovno rudarjenje (Data Min- ing), ki je sedmi korak v postopku KDD in v bistvu predstavlja iskanje vzorcev v določenih reprezentativnih oblikah ali nizu teh reprezen- tacij [Oteiza, 2011]. Sledita tolmačenje in pojasnjevanje rezultatov z možnostjo vrnitve za nekaj korakov nazaj ali od začetka do sedmega koraka z dodatnimi ponovitvami. Ta korak lahko vključuje tudi vizualizacijo. Sledijo uporaba in predstavitev odkritega znanja ter predstavitev uporabe znanja in vključevanja poznavanja v drug sistem za nadaljnje ukrepanje zainteresiranim stranem oz. končnemu uporabniku. Proces podatkovnega rudarjenja izvajamo po naslednji shemi: nepoznano in potencialno koristno znanje [Munoz, 2014], npr. napovedovanje nečesa na podlagi množice dejstev o tem, zbranih v preteklosti. Gre za odkrivanje vzorcev v podatkih z avtomatiziranim ali polavtoma- tiziranim načinom. Strojno učenje je v bistvu »trening«, torej gre za učenje računalnika. Arthur L. Samuel je leta 1959 podatkovno rudarjenje definiral kot področje učenja, ki daje računalnikom možnost, da se naučijo, ne da bi bili izrecno programirani [Munoz, 2014]. Tom Mitchel je v pregledu The Disci- pline of Machine Learning [Mitchel, 2006] ra- zlago strojnega učenja podal kot odgovor na vprašanje: »Kako lahko gradimo računalniške sisteme, ki samodejno povečujejo znanje z izkušnjami, in kaj so temeljni zakoni, ki urejajo vse učne procese?« Začetek razvoja tehnik strojnega učenja in uporabe algoritmov je povezan z J. Rossom Quinlanom [Quinlan, Slika 1•Proces podatkovnega rudarjenja. 1986]. Med metode podatkovnega rudarjenja spadajo odločitvena drevesa, asociacijska oz. povezovalna pravila, metoda podpornih vektorjev, evolucijski algoritmi in druge. Podatkovno rudarjenje praviloma izkorišča metode s področja inteligentnih sistemov, strojnega učenja in razpoznavanja vzorcev, ki omogoča, da se odkriva implicitno, prej 2.2 Podatkovno rudarjenje z odločitvenimi drevesi Odločitvena drevesa spadajo med simbolične metode, veljajo za preprostejše metode stro- jnega učenja in se uporabljajo za reševanje klasifikacijskih problemov [Zorman, 2003]. Učijo se iz informacijskega vira oz tabele, ki predstavlja učno množico. Imajo opisne in odločitvene atribute. Atributi so lahko dis- kretni ali zvezni. Pri tem se išče funkcija, ki opisne atribute pretvori v prostor odločitve. Imajo strukturo, ki je podobna hierarhičnim diagramom poteka. Drevo je sestavljeno iz notranjih in zunanjih vozlišč ter vej. Zunanja vozlišča se imenujejo listi. Vsak list predstav- lja klasifikacijsko oznako, ki je hkrati rezultat posameznega primera. Postopek generiranja odločitvenega drevesa iz učne množice im- enujemo indukcija odločitvenega drevesa. Pri indukciji začnemo s praznim drevesom in celotno množico učnih vzorcev. Zvezni atributi niso primerni za gradnjo odločitvenega dreve- sa, zato jih moramo preslikati v diskretno ob- liko. Način preslikave zveznega atributa v dis- kretni prostor, poimenovan tudi diskretizacija, je zelo pomemben in lahko odločilno vpliva na uspeh ali neuspeh zgrajenega odločitvenega drevesa. Odločitvena drevesa ne zahtevajo nastavljanja parametrov oziroma posebnega znanja o učni množici. Pomembna lastnost je tudi ta, da je posamezne vzorce mogoče opisati z velikim številom atributov oziroma lastnosti. Najpomembnejši faktor pri gradnji odlo- čitvenega drevesa so metrike čistosti (ang. purity measure, heuristic evaluation func- tion) za izbiro atributov. Njihova naloga je pregledati vse atribute, ki na poti do trenutnega vozlišča niso bili uporabljeni, in med njimi izbrati tistega, ki najbolj enolično razdeli učno množico vzorcev. Pri dobljenih podmnožicah postopek ponavljamo, dokler ne pride do enega izmed ustavitvenih pogo- jev, ki pomeni, da ni dovolj učnih vzorcev, da bi lahko zanesljivo nadaljevali postopek gradnje drevesa ali da vsi učni vzorci pri- padajo istemu razredu, kar pomeni, da im- ajo isto odločitev, vsi primeri so člani istega razreda, ali da je zmanjkalo atributov, ker smo na poti do vozlišča porabili vse atrib- ute. Ko se zgodi eden izmed ustavitvenih pogojev, vozlišče označimo za list in ga identificiramo kot razred. Ena izmed najbolj in najpogosteje uporabljenih metrik čistosti [Quinlan, 1979] je informacijski prirastek (ang. information gain). Iz tega izhaja iz- raz entropija, ki v informacijski teoriji meri nezanesljivost sporočila kot vira informacij. Čim več informacij vsebuje sporočilo, tem manjša je vrednost entropije. Daniela Dvornik Perhavec, Danijel Rebolj, Milan Zorman•PODPORA UMETNE INTELIGENCE PRI PROJEKTIH PRENOVE IN UPRAVLJANJA STAVB Gradbeni vestnik • letnik 66 • junij 2017 141 Slika 2•Proces gradnje odločitvenega drevesa. Z gradnjo odločitvenih dreves je povezanih nekaj osnovnih enačb [Zorman, 2003]. Na učni množici lahko opišemo naslednje verjetnosti: pij=nij/n; pi=ni/n; pj=nj/n; pi/j=nij/nj (1) Entropija E atributa A poljubnega učnega vzorca z možnimi diskretnimi vrednostmi izhodnega atributa a1, a2,…..,am in verjetnostjo porazdelitve p(A(w))=ai je definirana kot: (2) Za izračun EC se uporablja ista formula kot za izračun EA, le da se verjetnost pj nadomesti s pi. Naj bodo EC, EA, ECA entropija porazdel- itve razredov, entropija vrednosti atributov in entropija združene porazdelitve odločitvenih razredov in vrednosti atributov: (3) Pričakovana entropija porazdelitve razredov glede na atribut A je definirana kot: EC|A = ECA ─ EA (4) Informacijski prirastek je definiran kot: Igain (A) = EC – E C|A. (5) V vsakem notranjem vozlišču se izbere atribut, ki doseže najvišjo vrednost Igain. Slabost informacijskega prirastka je njegov trend k uporabi atributov s čim več možnimi diskretnimi vrednostmi. Z namenom odstran- itve te slabosti je Quinlan [1986] predstavil stopnjo informacijskega prirastka (ang. Infor- mation Gain Ratio), ki je definiran, kot sledi: (6) S S običajno označujemo celotno množico učnih vzorcev, opisanih z atributi A in razredi C. V predstavlja vrednost, ki jo zavzema dani atribut n, in označuje število vzorcev v učni množici; ni je število učnih vzorcev, ki pripada- jo razredu Ci, nj označuje število učnih vzorcev, ki imajo j-to vrednost danega atributa, in nij označuje število učnih vzorcev, ki pripadajo razredu C in imajo j-to vrednost danega atributa. Postopek generiranja odločitvenega drevesa iz učne množice imenujemo indukcija (ang. induction) odločitvenega drevesa. Pri učenju začnemo s praznim drevesom in celot- no množico vzorcev. Algoritem za učenje ima dostop samo do učne množice, s katero mora ustvariti hipotezo. Če želimo preveriti možnost pravilnosti učenja, množico vzorcev S razdeli- mo na učno in testno množico. Razdelitev 2/3 : 1/3 je običajna. Testna množica se uporabi v namen testiranja kakovosti dobljene hipoteze in podaja predikcijsko predvideno natančnost za nevidne vzorce. Proces gradnje odločitvenega drevesa je pri- kazan na sliki 2. Cilj gradnje odločitvenega drevesa je, da krovno vozlišče učinkovito loči podatke tako, da bo drevo čim manjše. Najboljša delitev je tista, ki nam da največjo informacijsko prido- bitev. Informacija ima matematični pomen, ki je povezan z gotovostjo pri odločanju. 3•PODATKOVNE BAZE Osnovno vodilo pri raziskovanju je bilo ugo- toviti, ali imajo stavbe skupne elemente in ali jih lahko enoznačno določimo. Proučili smo javno dostopne podatkovne baze ([GURS, 2015], [PAM, 2015], [Emporis, 2015]) in želeli pridobiti podrobnejše podatke o kon- strukcijskih elementih stavb. Ugotovili smo, da baze vsebujejo preskope podatke za nadaljnjo uporabo, zato ne moremo pridobiti podatkov o vgrajenih materialih [Stegnar, 2012]. Zato je bilo treba razmisliti, kako podatke pridobiti in kako bi na podlagi znanih podatkov o stavbah (pridobljenih iz literature, arhivskih projektov, dokumentov) lahko napovedovali elemente stavb, za katere so se arhivski podatki izgubili. S tem bi na enostavnejši in hitrejši način prido- bivali znanje o obstoječih stavbah in bi lahko zapolnili vrzeli tudi takrat, ko se o obstoječih stavbah ni ohranil noben zapis (načrti in dovoljenja za gradnjo) ([Dvornik Perhavec, 2010], [Dvornik Perhavec, 2014]). Stavba je kompleksen element, zato smo se pri delu omejili na konstrukcijski element nosilni zid, na stavbe etažnosti K+P+1+M, grajene v obdobju med letoma 1857 in 1948. Iz podatkovnih baz znanje najhitreje pridobimo z algoritmi umetne inteligence in strojnim učenjem. Rezultat stro- jnega učenja je dober toliko, kolikor sta dobra vhodni podatek in znanje tistega, ki te podatke upravlja. Ker človeški možgani ne morejo zge- nerirati tolikšne množice podatkov in pridobiti vzorcev rešitev, smo nad rezultati bolj kot ne presenečeni. V primerih, ko podatkovne baze niso dovolj obsežne ali jih (še) ni, moramo model stavbe/objekta/ceste/mostu/dogodka Slika 3• Razstavljanje in ponovno sestavljanje stavb z namenom opisa sestavnih delov in berljivosti algoritmom umetne inteligence. INTEGRIRANI MONITORING KOT ORODJE ZA UČINKOVITO IN EKONOMIČNO ENERGETSKO UPRAVLJANJE JAVNIH STAVB• Daniela Dvornik Perhavec, Danijel Rebolj, Milan Zorman Gradbeni vestnik • letnik 66 • junij 2017142 razstaviti, opisati, analizirati in ponovno ses- taviti tako, da bo iz njih s strojnim učenjem mogoče pridobiti znanje in ga posredovati uporabniku (slika 3). Pri delu je treba uporabiti različne pristope in načine, treba je opraviti analizo projektov, analizo literature, analizo porabe toplotne en- ergije, raziskave področij umetne inteligence s poudarkom na odkrivanju znanja v podatkih (Knowledge Discovery from Data) in podat- kovnem rudarjenju (Data Mining). Podatko- vno rudarjenje smo opravili z uporabo orodja Weka (akronim za: Waikato Environment for Knowledge Analysis), ki so ga zasnovali in razvili na Univerzi Waikato na Novi Zelandiji. 3.1 Podatkovne baze elementa »nosilni zid« stavb, grajenih med letoma 1857 in 1948 Na podlagi podatkov iz Stavbnega reda za vojvodino Štajersko iz leta 1857 [Deželni zakonik, 1857], zatem Stavbnega reda za vo- jvodino Krajnsko iz leta 1875 [Deželni zakonik, 1875] ter Zakona o graditvi objektov [Službeni list kraljevske banske uprave Dravske bano- vine, 1931] in Splošnih navodil za izdelavo uredbe o izvajanju regulacijskega načrta in gradbenega pravilnika [Službeni list kraljevske banske uprave Dravske banovine, 1933] smo za element zunanji nosilni zid za stanovanjske stavbe maksimalne etažnosti K+P+2 sestavili podatkovno bazo z delovnim imenom RLDB (Rules and Legislation Database). Na ta način smo dobili pravila za gradnjo zunanjih nos- ilnih zidov za obdobje 90 let (do leta 1948). Drugo bazo (BDB – Building Database) smo sestavili na podlagi podatkov iz načrtov za stanovanjske stavbe K+P+1, ki smo jih dobili v pokrajinskih arhivih. Na podlagi rezultatov modeliranja v Accessu smo ugotovili, da so rezultati v bazi RLDB prav enaki s podatki iz baze BDB [Dvornik Perhavec, 2014]. 3.1.1 Izbira oz. vzorčenje podatkov Vzorčenje podatkov (izbira reprezentativnih vzorcev) običajno poteka zaradi izredne ve- likosti podatkovnih baz, ki lahko vsebujejo milijone zapisov (npr. bančne transakcije) in jih praktično ni mogoče obdelati v celoti. Za gradnjo modela podatkovnega rudarjenja smo uporabili združeni podatkovni bazi RLDB in BDB (slika 4). Podatkovna baza je obsegala 394 vzorcev. Vsak vzorec je bil opisan z 12 atributi, od katerih je zadnji predstavljal raz- redni atribut. Iz analize navedenih predpisov (Deželni za- konik, 1875, Deželni zakonik, 1857, Službeni list kraljevske banske uprave Dravske bano- vine, 1933) in druge literature smo dodali podatke o opeki in njenih karakterističnih vred- nostih v različnih časovnih obdobjih (tlačna trdnost, vodovpojnost, toplotna prevodnost). Podatki so zbrani v preglednicah od 1 do 3. Podatki za leto 1857 so približni, pridobljeni na podlagi preizkušancev pri obnovi Kolizeja v Ljubljani [Kržan, 2008]. Podatek o odstotku Slika 4• Vzorec podatkovne baze BDB-stavb. Tlačna trdnost [MPa] 1857 1931 [Antunović-Kobliška, 1936] 1947 [Službeni list FNRJ, 1956] Marka opeke za zidanje normirana povprečna minimalna posamezna povprečna minimalna posamezna 200 20 16 150 15 12 110 8,5 11 9 11 8,5 70 7 5,5 7 5,5 Preglednica 1• Tlačna trdnost opeke Preglednica 2• Odstotek vodovpojnosti in toplotne prevodnosti opeke [Willems, 2006] Preglednica 3• Mere opeke ([Deželni zakonik, 1857], [Deželni zakonik, 1875], [Wienerberger, 2015]) Odstotek vodovpojnosti [%] Toplotna prevodnost [W/mK] 1857 15 0,58 1933 8 0,55 1947 8 0,55 beton 4 1,15 vodovpojnosti je povprečna vrednost vodovpo- jnosti 16 preizkušancev, tlačna trdnost prav tako.2 Za tlačno trdnost betona prevzamemo po- 2 Vrednosti za tlačno trdnost so prevedene v MPa (v obravnavanem obdobju se je upora- bljala enota kg/cm2). Mera opeke [cm] Število opek na m3 Teža [kg] do 1933 29x14x6,5 300 4–5 od 1875 do 1933 28x14x6,35 318 4–5 od 19331 25x12x6,5 400 3–4 2015 25x12x6,5 417 3 Daniela Dvornik Perhavec, Danijel Rebolj, Milan Zorman•PODPORA UMETNE INTELIGENCE PRI PROJEKTIH PRENOVE IN UPRAVLJANJA STAVB Gradbeni vestnik • letnik 66 • junij 2017 143 Preglednica 4• Oznaka velikost gradbenega materiala Preglednica 5• Seznam atributov in klasifikacijskega razreda datek 10 MPa [Antunović-Kobliška, 1936]. V različnih obdobjih se je uporabljala opeka različnega formata. Mere in drugi podatki so navedeni v preglednici 3. 3.1.2 Čiščenje oz. predobdelava podatkov Podatke je treba pripraviti za obdelavo z algoritmom za podatkovno rudarjenje, ki obsega brisanje ali zamenjavo neustreznih podatkov in pretvorbo podatkov v primeren format. Podatkovne baze, katerih del je prikazan na slikah 2 in 3, smo zapisali v zapis struk- turnega vzorca. Vzorci so opisani z lastnostmi (a1, …….., an) in razredom klasifikacije (c). Vrednosti, podane v preglednicah 1 do 3, smo preoblikovali v diskretne zapise, kot je npr. za mere opeke razvidno iz preglednice 4. Vsak vzorec (vrstica v preglednici) je opisan z 11 atributi in razrednim atributom c, ki pove pripadajoči razred. Za iskanje karakteristik zunanjega nosilnega zidu smo oblikovali atrib- ute, kot so zapisani v preglednici 5. Klasifikacijski razred je sestavljen iz obdobja veljavnosti predpisa, to je od 1857–1933, 1875–1933, 1933–1948 ali letnice izdane- ga gradbenega dovoljenja in območja, kjer je stavba postavljena (npr ST = Štajerska). Množico vzorcev smo preoblikovali v obliko, ki je primerna za obdelavo z algoritmi, kar je razvidno s slike 5. 3.1.3 Podatkovno rudarjenje Za podatkovno rudarjenje smo uporabili orodje Weka, ki so ga zasnovali in razvili na Univerzi Waikato na Novi Zelandiji. Weka je zbirka orodij in algoritmov, s katerimi ana- liziramo podatke in modeliramo napovedo- vanje. Zasnovana je tako, da omogoča hitro in fleksibilno preizkušanje na novih podatko- vnih nizih, in zagotavlja celostno podporo za proces podatkovnega rudarjenja, vključno s pripravo podatkov in vizualizacijo. Vsi algo- ritmi v Weki berejo vhodne podatke v isti obliki, v datoteki tipa ARFF (attribute – relation File Format). Programsko orodje Weka vsebuje vse standardne metode podatkovnega rudar- jenja, kot so klasifikacija, regresija, gručenje podatkov, asociativnost pravil in izbiro atributov. Iz skupka histogramov porazdelitve vzorcev za posamezne parametre vzorcev na sliki 6 razberemo, da je največ vzorcev za obdobje 1933LRS1948 (turkizno modro), sledi obdob- je 1857ST1933 (rdeče) in na koncu obdobje 1875KR1933 (temno modro). Histograme sicer lahko analiziramo za vsak parameter, iz katerega je sestavljen posamezni vzorec. atributi Naziv atributa Vrednost a0 etažnost KP1, KP2 ... a1 etaža prva, druga ... a2 material opeka, beton a3 razpon a, b, c, ... , h a4 velikost gradbenega materiala A, B, C, D, E a5 število opek na m3 zidu 300, 400 a6 topoltna prevodnost ƛ (W/mK) 1, 2 (1= 0,58, 2=0,55) 2= 0,55) a7 vrsta konstrukcijskega dela stavbe nosilni zid a8 položaj zunanji, notranji a9 debelina zidu (cm) 45, 60 ... a10 leto 1910, 1896 c oznaka 1896ST Mera opeke v cm Oznaka velikost materiala (za modeliranje) Do 1933 29x14x6,5 A 1875–19332 28x14x6,35 B 1933 25x12x6,5 C Kamen ni podatka D Beton ni podatka E Slika 5• Množice vzorcev. INTEGRIRANI MONITORING KOT ORODJE ZA UČINKOVITO IN EKONOMIČNO ENERGETSKO UPRAVLJANJE JAVNIH STAVB• Daniela Dvornik Perhavec, Danijel Rebolj, Milan Zorman Gradbeni vestnik • letnik 66 • junij 2017144 Rezultati po opravljeni gradnji odločitvenega drevesa so prikazani na sliki 7. Kvaliteto klasifikatorja najpogosteje me- rimo na osnovi nekaterih indikatorjev, kot so natančnost, senzitivnost in specifičnost, grafični prikaz pravilno klasificiranih pozitivnih vzorcev proti napačno klasificiranim pozi- tivnim vzorcem za družino klasifikatorjev (kri- vulja ROC) in različne metode za delitev baze podatkov na učno in testno množico. Množica vzorcev je sestavljena iz dveh podatkovnih baz RLDB in BDB, zato smo pričakovali okoli 80-% pravilnost klasificiranja v posamezne razrede. V praksi namreč ni pričakovati, da bi se konstrukcijska pravila obdržala celotno obdobje trajanja določenega predpisa in da so se pravila grajenja dosledno upoštevala v praksi. Ob 341 vzorcih z 10 različnimi atributi je natančnost klasifikatorja dosegla 100-% pravilnost vzorca, kar je razvidno s slike 8. 3.1.4 Cenitev in predstavitev rezultatov Rezultate kot posledice klasifikacije moramo v zaključni fazi ovrednotiti. S tem se ugoto- vita dejanska kakovost dobljenih rezultatov in posredno kakovost uporabljenih algoritmov. Z upoštevanjem konstrukcijskih pravil in karak- teristik obstoječih stavb ugotovimo, da so rezultati z uporabo metod umetne inteligence na majhnem vzorcu nadpovprečni. Predstavitev rezultatov je namenjena pri- redbi rezultatov obdelave v obliko, prirejeno končnemu uporabniku. S tem približamo informacije uporabniku tako, da razume, kako informacije, ki jih je mogoče enostavno razumeti, postanejo zanj uporabno znanje. Največji informacijski prirastek predstavlja atribut velikostGrMateriala, ki je razviden s slike 7. Na podlagi tega atributa zanesljivo in z gotovostjo uvrstimo stavbo v primerno časovno obdobje in mu določimo preostale karakteristike, kot so podatki o opeki, debelina nosilnega zidu za posamezno vrsto stavbe in etažo in podobno. Znanje, ki je skrito v informacijah, nazorno kaže, da se je beton na Štajerskem začel uporabljati pred letom 1940, kar je prikazano na sliki 9. Če želimo preveriti, v katerem delu stavbe je beton, izberemo drugo kombinacijo atributov (material, etaža) in na podlagi rezultata ugotovimo, da je beton v kletnih zidovih, kar je razvidno s slike 10. Do- bljene rezultate smo preverili na terenu pri poljubnih stavbah etažnosti K+P+1+M v Mariboru. 3.2 Podatkovne baze karakteristike »poraba Slika 6• Skupek histogramov glede na vzorce in posamezne parametre (atribute). Slika 7• Odločitveno drevo. Slika 8• Evalvacija klasifikatorjev. Daniela Dvornik Perhavec, Danijel Rebolj, Milan Zorman•PODPORA UMETNE INTELIGENCE PRI PROJEKTIH PRENOVE IN UPRAVLJANJA STAVB Gradbeni vestnik • letnik 66 • junij 2017 145 Slika 9• Znanje, ki je skrito v informacijah; pojavnost betona v obstoječih Slika 10• Znanje, skrito v informacijah; beton v kletni etaži. Slika 11• Pogled na stavbo J1 (levo) in stavbo B (desno). (Fotografija: Daniela Dvornik Perhavec) toplotne energije« za stavbe tehniških fakultet Sklop tehniških Fakultet Univerze v Mariboru obsega 12 med seboj povezanih stavb, gra- jenih v obdobju 1964–2006. Podatkovno bazo smo oblikovali na podlagi načrtov, arhi- viranih v prostorih tehniških fakultet. V prvi fazi smo s skupnimi značilnostmi opisali stavbi J1 in J2, pozneje smo dodali značilnosti še za druge stavbe. Za arhitekturno zasnovo in tipologijo stavb smo upoštevali tipologijo stavb Tabula [Grad- beni inštitut ZRMK, d. o. o, 2009–2012] in podatke o ovoju stavbe. Podatke o porabi toplotne energije stavb na območju tehniških fakultet smo za obdobje od leta 2012 do de- cembra 2016 pridobili od dobavitelja ELTEC Petrola, d. o. o. Podatki so zbrani po posa- meznih toplotnih podpostajah tabelarično in grafično z navedbo porabe toplotne energije posamezne toplotne podpostaje (TOP 809, TOP 808 in TOP 807). Količina toplotne ener- gije za TOP 809, ki je namenjena za ogrevanje stavb J1 in J2, je prikazana v preglednici 6. Poraba toplotne energije za stavbi J1 in J2 po mesecih in letih je razvidna s slike 12. 3.2.1 Podatkovno rudarjenje po elementih skupnih značilnosti stavb z razdeljeno porabo toplotne energije – vse stavbe Postopek, naveden v poglavju 3.1.3, smo ponovili na podatkovni bazi za stavbe tehniških fakultet s tem, da smo porabo top- lotne energije upoštevali za celo leto 2014 in jo razdelili glede na delež skupne tlorisne površine posamezne stavbe. Podatkov o po- rabi toplotne energije za posamezno stavbo namreč ni na razpolago. V odvisnosti od porabe toplotne energije na m2 površine smo v skladu s Pravilnikom o metodologiji izdelave in izdaje energetskih izkaznic stavb [Uradni list RS, 2014] določili energetske razrede. Vzorec smo opisali z naslednjimi atributi: tip fasade, tlorisna površina stavbe, volumen, površina fasade glede na smer neba (sever, jug, vzhod, zahod), površina odprtin glede na smer neba (sever, jug, vzhod, zahod), leto gradnje in odločitveni atribut oznaka stavbe (J1, B, C ...). Del podatkov je razviden iz preglednice 7. Podobno kot vrednosti, navedene v pregled- nicah 1–3, smo vrednosti za ogrevalno površino in porabo toplotne energije preob- likovali v diskretne zapise. Pri tem smo dis- kretizacijsko oznako prilagodili energetskim razredom, kot je razvidno iz preglednice 8. INTEGRIRANI MONITORING KOT ORODJE ZA UČINKOVITO IN EKONOMIČNO ENERGETSKO UPRAVLJANJE JAVNIH STAVB• Daniela Dvornik Perhavec, Danijel Rebolj, Milan Zorman Gradbeni vestnik • letnik 66 • junij 2017146 Preglednica 6• Količina toplotne energije toplotne podpostaje TOP 809 Preglednica 7• Množica vzorcev Slika 12• Grafični prikaz porabe toplotne energije v TOP 809 po letih in mesecih. Na sliki 13 je razviden skupek histogramov za učno množico. Po opravljenem učenju smo dobili rezultate klasifikacije, kot je razvidno iz odločitvenega drevesa na sliki 14. TipFasade Površina Volumen Fasada sever Steklene površine sever Fasada jug Steklene površine jug Fasada vzhod Steklene površine vzhod Fasada zahod Steklene površine zahod Leto gradnje Stavba[m2] [m3] [m2] [m2] [m2] [m2] [m2] [m2] [m2] [m2] [leto] [oznaka]fasadna opeka 496,64 10218,35 623,07 379,44 623,07 368,72 0 0 339,48 41,4 1983 J1fasadna opeka 633,92 13122,14 585,81 280,08 585,81 345,44 463,68 0 0 0 1986 J2teranova 798,06 13814,45 979,05 276 979,05 598,5 81,42 0 0 26,7 1964 Ateranova 851,243 14735,02 814,09 306,18 814,09 291,41 104,44 8,645 104,44 47,25 1964 Bteranova 577,88 4727,1 164,33 10 0 0 226,18 103,25 226,18 127,19 1964 Cne 798,06 3295,99 233,59 31,36 233,59 39,2 19,42 0 0 7,875 1980 A+ne 851,243 4145,55 229,04 29,4 229,04 23,52 29,38 0 29,38 0 1980 B+fasadna opeka 606 10362,58 625 362,34 625 374,82 0 0 0 0 1969 D1fasadna opeka 207,25 3543,97 213,75 141,856 213,75 139,276 283,52 60,78 0 0 1990 D2teranova 2000,5 11294,1 193,79 103,11 0 0 65,74 7,04 0 0 1969 Eteranova 645,17 5445,24 0 0 0 0 169,48 113,875 0 77,875 1969 Fteranova 501,75 8710,38 195,3 186,774 390,6 239,91 0 0 0 0 1981 G1teranova 385,86 5012,4 198,75 111,01 198,75 198,75 0 0 0 0 2006 G1+fasadna opeka 542,66 5030,49 0 0 0 0 0 0 0 1982 H Rezultati za primer, ki smo ga obravnavali, kažejo, da največji informacijski prirastek predstavlja tip fasade, nadalje pa bi na pod- lagi volumna stavbe posamezno stavbo lahko uvrščali v posamezne energetske razrede. Ker gre za eksperiment, bo za natančnejše napovedi treba dopolniti baze tako vsebinsko kot količinsko. Daniela Dvornik Perhavec, Danijel Rebolj, Milan Zorman•PODPORA UMETNE INTELIGENCE PRI PROJEKTIH PRENOVE IN UPRAVLJANJA STAVB Gradbeni vestnik • letnik 66 • junij 2017 147 Preglednica 7• Množica vzorcev Celotna ogrevalna površina Odstotek površine Razred diskretizacije oznaka Poraba 2014MWh Poraba 2014KWh na m2 površine Razred diskretizacije Diskretizaci- jska oznaka 3 2483,2 44 41-50 e 137,54 55,38821 35-60 C 3169,6 56 51-60 f 175,06 55,23094 35-60 C 3404,972 36 31-40 d 176,1 51,71849 35-60 C 1155,76 12 11-20 b 58,71 50,79774 35-60 C 851,243 9 0-10 a 44,02 51,71261 35-60 C 3030 24 21-30 c 258,6 85,34653 60-105 D 1036,25 8 0-10 a 86,2 83,18456 60-105 D 2508,75 19 11-20 b 204,72 81,60239 60-105 D 1929,3 15 0-10 a 161,63 83,7765 60-105 D Slika 13• Skupek histogramov glede na vzorce in posamezne atribute. Slika 14• Rezultati klasifikacije v obliki odločitvenega drevesa. 4•SKLEP Iskanje korelacij med vsebinsko različnimi zadevami je s podatkovnim rudarjenjem smiselno, če imamo podlago v obširnih bazah. V raziskavi smo eksperimentirali s podatki, ki se nanašajo na karakteristične elemente stavbe kot tudi v kombinaciji s porabo top- lotne energije. Dobljeni rezultati prvega modela kažejo, da velikost opeke kot del nosilnega zidu poda največ informacij in da lahko na podlagi tega stavbe pravilno uvrstimo v geografsko in časovno obdobje ter določimo karakteristike nosilnega zidu po različnih etažah. Na podlagi narejenih analiz in rezultatov ugotovimo, da imajo stavbe, grajene v določenem časovnem obdobju, skupne imenovalce in da na pod- lagi dobljenih rezultatov lahko napovedujemo skupne značilnosti obstoječih stavb. Na osnovi uporabe algoritmov umetne inteligence pride- mo do novo odkritega znanja, v fazi analize obstoječe stavbe pa imamo možnost, da s tehnologijami upravljanja znanja to znanje tudi uporabimo. Posledično to pomeni, da lahko zmanjšamo čas in stroške faze raziskovanja stavb in povečamo determiniranost celotnega projekta prenove [Dvornik Perhavec, 2014] kot tudi upravljanja. Pri drugem modelu so odločilni tip fasade ter nadalje volumen stavb in poraba toplotne energije. Nadaljnja razisko- vanja v tej smeri pomenijo, da s spremljanjem porabe toplotne energije, zasedenosti stavbe, notranjih in zunanjih temperatur lahko pridobi- vamo nova spoznanja o možnosti prihrankov energije z izboljšanim energetskim upravljan- jem [Dvornik Perhavec, 2016]. Rezultat eksper- imenta, opisanega v poglavju 3.2, je nastal na podlagi sodelovanja pri razvojnoraziskovalnem projektu E-nepremična inženirska zakladnica. Projekt je sicer zasnovan na dolgoročnem sodelovanju deležnikov iz gospodarstva in okolja. Ob dejstvu, da se področja umetne inteligence vse bolj razvijajo in da je npr. na Univerzi Stan- ford 90 % vseh dodiplomskih študentov izbralo in poslušalo že leta 2013 vsaj en računalniški predmet [Žerdin, 2013], je vprašanje, ali bomo temu sledili tudi na področju gradbeništva in grajenega okolja, povsem odveč. Z razvojem tehnologij BIM bomo s časom podatkovne baze o stavbah pridobili. Razmisliti bo treba, kako upravljati podatke in jih arhivirati z na- menom zagotavljanja dostopnosti in varnosti, saj se bodo istočasno razvijali novi poklici, npr. podatkovni upravljavci, ki bodo v času ob- stoja obstoječih objektov podatke upravljali v različne interdisciplinarne namene. Vendar pri tem ne gre le za stavbe, saj lahko podobno up- ravljamo podatkovne baze drugih inženirskih in infrastrukturnih objektov. Eksperimenti so bili narejeni za kombinacijo podatkov podatkovnih baz cestne infrastrukture in pogostosti promet- nih nesreč [Dvornik Perhavec, 2016] ter podat- kov iz podatkovnih baz monitoringa ogrevanja in zasedenosti vrtcev [Praper, 2016]. 5 Oznaka ustreza oznakam energetskih raz- redov. INTEGRIRANI MONITORING KOT ORODJE ZA UČINKOVITO IN EKONOMIČNO ENERGETSKO UPRAVLJANJE JAVNIH STAVB• Daniela Dvornik Perhavec, Danijel Rebolj, Milan Zorman Gradbeni vestnik • letnik 66 • junij 2017148 Zahvaljujemo se podjetjema Energetika Mari- bor, d. o. o., in EUTRIP, d. o. o., za zaupanje in 5•ZAHVALA 6•LITERATURA izkazan interes pri podpori raziskovalnemu delu. Antunović-Kobliška, M., Cigola, S. A., Poznavanje građevinskog materijala udžbenik i priručnik. Beograd, 1936. Deželni zakonik, Stavbni red za Štajersko, Gradec, 1857. Deželni zakonik, Stavbni red za Vojvodino Kranjsko, Ljubljana, 1875. Dvornik Perhavec, D., Conservation of cultural heritage – disorders, deficiencies and building project, Žabljak: Faculty of Civil Engineering, University of Montenegro, 2010. Dvornik Perhavec, D., Databases and Data Warehouses in a Systemic Approach for Historical Building Reconstruction Projects, Civil Prompt Proceedings Napoly, 2014. Dvornik Perhavec, D., E-Nepremična inženirska zakladnica, Tehniške fakultete, Fakulteta za gradbeništvo, prometno inženirstvo in arhitekturo Univerze v Mariboru, 2015. Dvornik Perhavec, D., Kataster gospodarske javne infrastrukture kot osnova za modeliranje s podatki, Portorož, DRC, Družba za raziskave v cestni in prometni stroki Slovenije, str. 1–9, 2016. Dvornik Perhavec, D., Rebolj, D., Praper, P., Pridobivanje informacij iz razpoložljivih podatkov o stavbah z uporabo metod umetne inteligence, Ljubljana, 2016. Dvornik Perhavec, D., Rebolj, D., Šuman, N., Journal of cultural heritage. Systematic approach for sustainable conservation, 17. februar 2014. Dvornik Perhavec, D., Tibaut, A., Journal of Civil Engineering and Architecture Research, Databases in the Process of Maintenance and Reconstruction Projects of Existing Buildings, 25. oktober, str. 251–259, 2014. Emporis, https://www.emporis.com/, 2015. Gams, M., Alan M. Turing, Izumitelj univerzalnega stroja, 1912–1954 in 2012, http://home.izum.si/cobiss/oz/2012_2/html/clanek_00.html, 2012. GURS, Geodetska uprava Republike Slovenije, Register nepremičnin, Ljubljana, 2015. GI ZRMK, Gradbeni inštitut ZRMK, d. o. o, IEE Tabula, številka pogodbe IEE/08/495/SI2.528393, Narodna in univerzitetna knjižnica, Ljubljana, 2009–2012. Han, J., Kamber, M., Data Mining Concepts and Techniques, Elsevier, 2006. Kržan, M., Parametrična analiza potresne odpornosti Kolizeja v Ljubljani, http://drugg.fgg.uni-lj.si/570/1/GRU_3028_Krzan.pdf, 2008. Mitchel, T. M., The Discipline of Machine Learning, http://www.cs.cmu.edu/~tom/pubs/machinelearning.pdf, 2006. Munoz, A., Machine Learning and Optimization, https://www.cims.nyu.edu/~munoz/files/ml_optimization.pdf, 2014. Oteiza, J., http://smartdatacollective.com/josueoteiza/38043/difference-between-knowledge-discovery-and-data-mining, 2011. PA Maribor, Pokrajinski arhiv Maribor, Republika Slovenija, Ministrstvo za kulturo RS, Maribor, 2015. Praper, P., Integrirani monitoring kot orodje za učinkovito in ekonomično energetsko upravljanje javnih stavb, magistrska naloga, Univerza v Mariboru, Maribor, 2016. Pravilnik o metodologiji izdelave in izdaje energetskih izkaznic stavb, Uradni list RS 92/2014, 2014. Quinlan, J., Discovering Rules by Introduction from Large Collections of Examples, Expert Systems in the Microelectronic Age, 1979. Quinlan, J., Introduction of decision tree, Machine learning, Zvezek 1, 1986. Russell, S., Norvig, P., Artificial Intellegence, A modern Approach, Prentice Hall, 2004. Sistory, Službeni list Kraljevske banske uprave Dravske banovine za leto 1932, 1. polletje, http://www.sistory.si/publikacije/prenos/ ?Urn=SISTORY:ID:185#page=100, 1932. Službeni list FNRJ, Uredba o privremenim normama i privremenim tehničkim propisima u građevinarstvu, 18. april 1947, ured. Građevinska knjiga, Beograd, 1956. Službeni list Kraljevske banske uprave Dravske banovine, letnik II, št. 47, 13. Avgusta 1931, Ljubljana, 1931. Službeni list Kraljevske banske uprave Dravske banovine, Splošna navodila za izdelavo uredbe o izvajanju regulacijskega načrta in gradbenega pravilnika, Ljubljana, 1933. Stegnar, G., Šijanec Zavrl, M, Stankovski, V., Uporaba informacijskih virov pri tipizaciji stavb v Sloveniji, Gradbeni vestnik, zvezek 61, str. 256–262, november 2012. Wienerberger, Tehnični list, Ormož, 2015. Willems, W. M., Schild, K, Dinter Vieweg, S., Handbuch Bauphysik, Teil 1, Springer, 2006. Witten, I. H. & Frank, E., Data Mining, Second edition, Elsevier, San Francisco, 2005. Zorman, M., V. Podgorelec, V., Lenič, M., Povalej, P., Kokol, P., Tapajner, A., Inteligentni sistemi in profesionalni vsakdan, Center za interdisciplinarne in multidisciplinarne raziskave in študije Univerze v Mariboru, Maribor, 2003. Žerdin, D., dr. Jure Leskovec, Dnevnik, https://www.dnevnik.si/1042576652, 2013. Daniela Dvornik Perhavec, Danijel Rebolj, Milan Zorman•PODPORA UMETNE INTELIGENCE PRI PROJEKTIH PRENOVE IN UPRAVLJANJA STAVB