RAZPRAVE E3 Semantika podatkov in ontologije Dejan LavbiC, Marjan Krisper Univerza v Ljubljani. Fakulteta za računalništvo in informatiko, Tržaška 25, 1000 Ljubljana (Dejan.Lavbic, Marjan Krisper}®fri.unMj si Povzetek Semantično strukturi ranje, ki ga dosežemo z uporabo ontologij, se razlikuje od površinskega oblikovanja informacij, ki nam jih nudijo relacijske in XML podatkovne baze, saj mora biti pri podatkovnih bazah večina semantične vsebine zajete v uporabniških programih. Ontologije predstavljajo objektivno specifikacijo informacij za določeno domena, kjer s predstavitvijo konceptov in medsebojnih relacij prikažemo znanje. Ta specifikacija je prvi korak pri gradnji naprednejših informacijskih sistemov, ki temeljijo na souporabi obstoječega znanja V prispevku prikažemo stopnjo inteligence, ki so jo podatki skozi čas pridobivali, se ustavimo ter podrobneje opišemo najvišja raven, ontologije in avtomatsko sklepanje. Predstavljena je opredelitev ontologij s filozofskega stališča in uporaba na področju računalništva in informatike, kjer omenimo jezike za opis in predstavitev ontologij. Abstract DATA SEMANTICS AND ONTOLOGIES Semantic structuring, achieved by ontologies, differs from superficial formatting of information offered by relational and XML data bases because with databases the major part of semantic content is captured in application logic. Ontologies provide an objective specification of specific domain information where the knowledge is expressed by means of concepts and relations among them. This specification is the first step in building advanced information systems Lhat are based on reusing the existing knowledge. In the following paper vue present the level of intelligence the data gained through time and describe its highest level in more detail ontologies and automated reasoning, Ttie definition of ontologies from the philosophical point of view is being presented as well as its practical use in the field of computer and information science, where we emphasize languages for describing and representing ontologies 1 Uvod Kot je na konferenci u San Franciscu leta 1999 poudaril Tim Berners Lee, idejni uodja semantičnega spleta, je prui korak pri gradnji semantičnega spleta objava podatkov na svetovnem spletu u takšni obliki, da jih bodo računalniki razumeli [Z]. Tako pridemo do semantičnega spleta, to je spleta podatkov, ki jih lahko posredno ali neposredno obdelujemo z računalniki. Osnovna ideja Tirna Berners Leeja ni bila le v dostopu do spletnih strani na strežnikih, ampak v ustvarjanju medsebojnih povezav med posameznimi podatki. Svetovni splet teli medsebojnih povezav v tem trenutku nima opredeljenih, zato se je pojavila tehnologija RDF/S,' ki je namenjena ravno zajemu teh povezav. Težava nastane pri poskusu opisovanja le-teh, saj potrebujemo dodatne metapodatke (zaradi samodejne računalniške obdelave vsebin), ki pa se v tem trenutku na svetovnem spletu ne nahajajo. Danes se soočamo z vprašanjem, kako Zgraditi splet podatkov, ki bi ga lahko računalniki samodejno obdelovali. Najprej moramo spremeniti pogled na podatke. V preteklosti so bili podatki shranjeni in zaklenjeni v zaščitenih programih ter pri sami obdelavi niso igrali glavne vloge. Takšni podatki, za katere se je uveljavil izraz GIGO,2 imajo veliko pomanjkljivost v odvisnosti od njihove obdelave oz, odvisnost programske opreme od dobrili podatkov. Ker so nekateri spoznali, da takšen pristop ni pravilen, so začeli razmišljati v drugo smer. Velik uspeh je doživet internet in z njim XM!.1 ter v zadnjih časih zelo priljubljeni semantični splet, kjer se vedno bolj osredotd&amo na podatke in ne na programe. Ključni element pri samodejni računalniški obdelavi podatkov pa je priprava »pametnejših«4 podatkov |2J. 1 Resource Definition Framework/Schema (RDF/S) ■■ S pomočjo Jezika RDF predstavimo semamiine relacije na ravni primerkov v obliki trojčkov osebi predmet >. Z RDF/S pa opišemo relacije no ravni koncepta ontologije, kjer določimo sprejemljive relacije za raven primerkov. 1 Garbage In, Garbage Out - Računalniki, v nasprotju z večino ljudi, brez vpraianj sprejmejo nesmiselne podatke, ¡ih obdelajo in tudi vrnejo kup ne: datkov na ¡¡hodu, če jum lega izrecno ne prepovemo v programski kodi. 3 extensible Markup Language - Raziirljivi označevalni jozik, ki predstavlja format podatkov za izmenjam strukturimnih tfaffumentovvsptetu, 4 Od aplikacij neodvisni podatki; lahko jih enostavno dopolnjujemo, klasificiramo in predstavljajo del večjega infonnacijskega ekosistema, to je ontologij Z005 - številka 3 - letnik XIII UCUHIUNA INFORMATIKA 121 Dejan Lavbič, Marjan Kri t per: Semantika podatkov in ontologiji? Slika 1 Rastoča »inteligenca« v podatkih Slika 1 prikazuje stopnjo inteligence, ki so jo podatki pridobivali skozi čas. Začnemo s takšnimi, ki za nadaljnje sklepanje vsebujejo zelo malo semantičnih informacij, in končamo pri ontologijah: • Tekst in podatkovne baze (pred XML) Začetna faza, kjer so podatki pripadali določenemu programu. Inteligenca je zato bila skrita v samem programu in ne v podatkih, • XML dokumenti za določeno domeno Faza, kjer podatki v določeni problemski domeni dosežejo določeno neodvisnost od programov. Podatki so sedaj dovolj »inteligentni«, da se lahko prenašajo med različnimi programi znotraj določene problemske domene. Kot primer lahko navedemo XML standarde v zdravstvu, zavarovalništvu ali nepremičninski industriji. ■ Taksonomije5 in dokumenti z mešanimi slovarji Podatke lahko združimo i/, različnih domen in jih tudi ustrezno klasificiramo v obliki hierarhične tak-sohomije. Pravzaprav lahko klasifikacijo uporabljamo za odkrivanje podatkov, enostavna razmerja med kategorijami in taksonomijo pa za povezovanje in združevanje podatkov. Podatki so v tej fazi dovolj »inteligentni«, da jih lahko enostavno odkrijemo in razumno združimo z ostalimi podatki. • Ontologije in pravila Na tej ravni lahko iz obstoječih podatkov izpeljemo nove s pomočjo logičnih pravil. Podatki so sedaj že na dovolj visoki ravni, da jih lahko 5 Slstematika, nauk a klasifikaciji, ki predstavlja segment,icijo ter ureditev elementov v razvrstitveni sistem glede no medsebojne povefMe. opišemo z dejanskimi medsebojnimi povezavami in naprednimi formalizmi, s pomočjo katerih nad to »semantično algebro« izvajamo logične izračune. Takšne podatke lahko povezujemo na bolj atomarnem nivoju in izvajamo analize podatkov z majhnimi zrni. V tem primeru podatki ne predstavljajo zgolj surovine, ampak so del nekakšnega naprednega mikrokozmosa. Primer takšne predstavitve podatkov je samodejni prevod dokumenta iz enega problemskega področja v ekvivalenten (oz. čimbolj podoben) dokument v drugi problemski domeni. Ko govorimo o pogledu razvijalcev na evolucijo podatkov, si lahko na sliki 2ogledamo vpliv podatkov na razvoj programske opreme [13], Proceduralno programiranje je osredotočeno na funkcionalno dekom-pozicijo opravil. Podatke so spreminjale in obvladovale procedure, kjer je veljalo, da so podatki manj pomembni od kode. Pri objektno usmerjenem razvoju se pojavijo en-kapsulacija, dedovanje in polimorfizem. Ideja o varo- objektno procctlmulno usmerjen programiranja razvoj MDA Podatki so Podatki so Podatki so manj enako bolj pomembni pomembni pomembni cxJ kode. kol koda. kol koda. v._S \-1-h 5-1970 19KMÄ14 1904-7000 5000-2003 2003-Sliko S: Pogled razvijalcev na podatke 122 upORAONA INFORMATIKA 2005 • Jlevilka3 - IcinikXIN Dejan Liivbif. M.irjan Krispen Sem.intika podatkov in ontologije vanju podatkov s pomočjo rezerviranih besed in metod za dostop povzroči dvig ravni pomembnosti podatkov, tako da postanejo enakovredni metodam, ki s temi podatki manipulirajo. S prihodom XML-a, MDA-jafl in podpore meta podatkom v času izvajanja vstopamo v obdobje, kjer podatki postajajo bolj pomembni kot sama koda. V ospredje ne prihaja zgolj sintaktična pravilnost ampak predvsem semantična. 2 Opredelitev ontologije Ontologijo opredeljujejo besede in njihov pomen, ki se uporabljajo za opis in predstavitev znanja določenega področja. Vendar, kaj ta opredelitev sploh pomeni? Če pogledamo v ustrezne slovarje |5, 6|, najdemo naslednje opredelitve: . filozofska disciplina, veja metafizike, ki obravnava osnovo, vzroke in najsplošnejše lastnosti stvarnosti, . določena teorija o naravi bitij in njihovem obstoju. Opredelitvi nakazujeta, da izraz ontologija izhaja iz filozofije. Ontologija je tako po eni strani filozofska disciplina, medtem ko se ontologija na področju računalništva in informatike ukvarja s predstavitvijo podatkov in znanja. Tudi za ontologijo na področju informatike poznamo več opredelitev: . ontologijo Opredeljujejo besede in njihov pomen, ki se uporabljajo za opis in predstavitev znanja določenega področja; ■ ontologijo sestavljata slovarja, ki opisujeta določeno domeno in eksplicitne domneve o pomenu slovarja - specializacija konceptualizacije.7 Če si podrobneje pogledamo zgornji opredelitvi, ju lahko razdelimo na dva deta: i opis in predstavitev znanja določenega področja, . opredelitev uporabljanih besed in njihov pomen. 2.1 Opis ontologije Opisovanja znanja določenega področja se lahko lotimo v pisni ali ustni obliki, tako da poudarimo pomembnejše elemente. Če želimo opisati potovanje z letalom, ga lahko na način, ki ga prikazuje tabela 1. Ko opisujemo znanje določenega področja, opisujemo samo pomembne stvari, njihove lastnosti, medsebojne povezave in pravila, ki veljajo za to področje. Takšen opis je torej ontologija in vsebuje pojme: razred, primerek, razmerje, lastnost, vrednost in pravilo, kot je razvidno iz tabele 1. 2.2 Predstavitev ontologije Ko ontologijo opišemo, jo moramo tudi predstaviti, kar pomeni, da jo zapišemo v obliki, ki jo lahko uporabljajo tudi drugi uporabniki." Opis je sestavljen iz besed in fraz v naravnem jeziku (slovenščina, angleščina, japonščina itd.) oz. uporabljamo slovar pojmov in stavke, ki predstavljajo povezavo med pojmi. Pojem PrilnEr Rairedi [splošne stvari) Letalo, letalska družba, let. razred potovanja, letališče, pitat itd Primerki [določene stvari] Boeing 777-200LR Airbus A340. TP121, AF1019. Air France. Lufthansa, Iberia. ekonomski, poslovni, Caracas Simon Bolivar, Bogota El Dorado, Jean-Luc Piccard itd. Raimerja p odraze d, del. primerek, ima-koncno- Airbus A340 je primerek letala.Let TP121 ima končno destinacijo na -dest,inaci|D, izvaja, uporablja, upravlja itd. letališču Caracas Simon Bolivar. lastnosti Število sedežev, čas patnvenia, razdalja, ne na. npremljenost. izkušenost itd Urednosti 405, 1D ur 30 min. B2D9 km. 164,000 SIT itd Pravita IF letalo (X, 'Airbus A34D'I S s t-sedežev (X, 405) THEN st-ekonamskih-sedezev (X, 325) [Pomen: Letalo Airbus A340 ima skupno 405 sedežev, od tega jih 325 spada v ekonomski raired,] Tabela 1: Primer enostavni! ontologije na področju letalskih potovanj c Model-Driven AichitectufO Je metodologija za razvoj programske opreme, ki sojo predlagali pri Object Managemeni Group (OMG). Funkcionalnosti sistema določimo v nmleb, kije neodvisen od platforme (PIM), »pomočjo ustr&nega jezika za modeliranje (npr. UMU. Za dejansko implementacijo pa je treba model PIM prevesti v model, ki je specifičen za izbrano platformo CPSM). ' Način razmiiljanja o delu sveta oz, ustvarjanje pojmov za abstraktne izraze. 8 To je pomembno predvsem zaradi dejstva, daje ena od ključnih lastnost) ontologij souporaba znanja med različnimi uporabniki področja, ki ga opisuje ontologija. 2005 -številka 3-letnik XIII UPonogHA INFORMATIKA 123 Dejan L.ivbič. Marjan Krisper Semantiko podatkov in ontologije Predstavitev ontologije tako pomeni predstavitev znanja v obliki pojmov in stavkov, kjer najprej določimo pojme {oz. jih že imamo izoblikovane v našem mentalnem modelu slovarja), kasneje pa te pojme medsebojno povežemo in tako izdelamo Še poglobljeno znanje o določeni domeni. V informatiki se uporablja nekoliko bolj zapleten način predstavitve, saj moramo izdelati model, ki ga lah* ko programska oprema neposredno uporabi. Za predstavitev znanja tako uporabljamo razrede, primerke, razmerja, lastnosti, vrednost! in pravila, S katerimi izražamo pomen na določenem področju, pojme naravnega jezika pa uporabljamo za oznake prej omenjenih konceptov. Za predstavitev ontologije po navadi namesto naravnega jezika uporabimo logični jezik za predstavitev znanja, saj je logični jezik bolj jasno in točno izrazno sredstvo, medtem ko je naravni jezik pogosto dvoumen. Formalne jezike za predstavitev ontologij si bomo podrobneje ogledali v razdelku 8. 3 l/loga ontologij Ontologije so ključni element pri semantičnem spletu, kjer se prepleta Človeško razumevanje simbolov z zmožnostjo računalniškega procesiranja. V zadnjem času se ontologije vedno bolj uporabljajo na področjih integracije inteligentnih sistemov, zbiranja informacij, elektronske trgovine in obvladovanja znanja. Razlog za vedno večjo priljubljenost leži v njihovi obljubi: »skup no razumevanje domene, ki ga lahko souporabljajo ljudje in računalniški sistemi« [8]. Uporaba ontologij na področju kognitivnih agentov* prav tako vzbuja vedno več zanimanja, saj se potencial uporabe ontologij odpira predvsem pri medsebojni komunikaciji in mehanizmih sklepanja pri delovanju agentov v veČagent-nih sistemih.1" Uporaba ontologij in podpornih orodij prinaša možnosti za izboljšanje obvladovanja znanja predvsem v večjih organizacijah. Ključni koraki pri uporabi ontologij so: • pridobivanje oz, učenje ontologij in povezovanje le-teh z velikimi količinami podatkov - zaradi prilagodljivosti mora biti ta proces avtomatiziran s pomočjo metod za luŠčenje informacij in procesiranje naravnega jezika; ■ shranjevanje in vzdrževanje ontologije in njenih primerkov - sprejeti je treba odločitev, v kakšni obliki bo shranjena ontologija, tako da nam je na voljo repozitorij z lastnostmi podatkovne baze in preprosti obrazci za sklepanje na podlagi elementov ontologije; ■ iskanje po semantično obogatenih informacijskih virih - sama predstavitev znanja in informacij ni dovolj, uporabniki ontologije morajo uporabljati in po njih povpraševati. Pojavljajo se novi načini povpraševanja, ki nam omogočajo pridobivanje znanja i7. porazdeljenih virov, vse raziskave pa kon-vergirajo k semantično obogatenim iskalnikom. Pri vseh omenjenih korakih so zaradi lažjega obvladovanja ontologij potrebna orodja, ki so podrobneje predstavljena v razdelku 9. 3.1 Semantični splet Svetovni splet doživlja zelo velik uspeh, kar nakazuje število uporabnikov in dokumentov," ki se na njem nahajajo. Vendar ostaja dostop do informacij še vedno težaven, saj mora uporabnik vsebino najprej poiskati, nato pa še tolmačiti. Pri tem se pojavljajo vprašanja, kaj je vsebina dokumenta in kakšna je semantika samih povezav. Pri iskanju informacij na svetovnem spletu moramo tako poznati bodisi natančen naslov iskanega dokumenta, bodisi ga poiščemo s pomočjo spletnega iskalnika. Problem spletnih iskalnikov je predvsem v predstavitvi iskalne zahteve vmesniku iskanja, kasneje pa tudi predstavitev rezultatov iskanja. Tim Berners Lee je zato v začetku tega tisočletja predstavil idejo semantičnega spleta kot nadgradnjo obstoječega spleta, kjer informacije dobijo pomen, kar omogoča boljše medsebojno sodelovanje ljudi in računalnikov [21. Moč semantičnega spleta je v združevanju tehnologij za obvladovanje znanja na področju umetne inteligence in spletnih tehnologij. Največ raziskovanja poteka na področju spletnih ontologij, saj predstavljajo način obvladovanja raznovrstnih predstavitev spletnih virov. Domenski model iz ontologije se lahko uporabi kot enotna struktura za skupno predstavitev in semanliko informacij. Prav tako se v viziji semantičnega spleta jasen pomen dialoga med oddaljenimi aplikacijami ali agenti doseže s pomočjo uporabe in s sklicevanjem na ontologije. " ¿a agenta kot entiteto velja. da je sposoben delovati v svojem okolju, deluje avtonomno - ima kontrolo nad svojim delovanjem, lahko komunicira z drugimi agenti in je zmožen zaznavanja svojega okolja. Kognitivni agent pa kot specializacija agenta ob vseh že omenjenih lastnostih deluje proaktivno in uporablja svojo lastno predstavo okolja 112). 10 Vciagentni sistum (MAS) je sestavljen iz množice agentov, ki medsebojno sodelujejo v imenu uporabnikov z različnimi cilji. 11 Trenutne statistike kažejo, da je bilo konec leta 2002 kar 320 milijonov uporabnikov intemeta, svetovni splet pa vsebuje več kot 800 milijonov spletnih strani. 124 iriiini INFORMATIKA 2005 - številka 3 - letnik XIII Dejan Lavbic. Marjan Knsper: Semantifca podatkov in ontologijo Semantični splet je zgrajen v obliki sklada, kjer zgornje ravni nadgrajujejo spodaj ležeče, kot to prikazuje slika 3. Zaupanje (Varnost + istovetnost ] --- Sklepanjeidokaiovanje v - ( Odločitveni model J c Višja semantlka f DAML+OIL, OWL J c Semantika [ RDRRDF shema s ~ Struktura f XML shema ]1 -J Sintaksa: podatki (XML j^ Slika 3: Sklati arhitektur semantičnega spleta Vsi jeziki semantičnega spleta na vseh ravneh uporabljajo XML sintakso, vsaj za potrebe izmenjave podatkov. Na sliki 3 lahko vidimo, da se XML nahaja na dnu sklada in ima vlogo osnovne sintakse za medsebojno izmenjavo podatkov na svetovnem spletu. Nad ravnijo XML-a se nahaja XML shema, ki omogoča strukturiranje spletnih objektov, podobno tistemu v podatkovnih bazah in je tako primerljiva s shemami podatkovnih baz. Naslednja raven je RDF/S, s katero pridobimo enostaven jezik za izražanje ontologij (pojmov, relacij in primerkov). To raven razSirja DAML+OIL12 ali OWL,13 s katerima lahko veliko bolj podrobno zapišemo ontologije in uporabljamo raven RDF/S za predstavitev primerkov konstruktov ontologije. DAML+OIL in OWL oba neposredno uporabljala podatkovne tipe sheme XML, Na najvišji ravni, t. i. »spletu zaupanja«, se nahajajo metode za sklepanje in dokazovanje, ki uporabljajo samodejno dokazovanje, kot tudi varnostne ele- mente in elemente, povezane z istovetnostjo, ki so še zelo slabo raziskani in nezreli za uporabo. Na samem vrhu sklada arhitektur se nahajajo programi, ki uporabljajo vse spodaj ležeče tehnologije in jih lahko imenujemo »inteligentne aplikacije«, saj opravila opravljajo na naprednejši način in prinašajo bolj «inteligentne« storitve. 3.2 Praktični primeri ontologij Aplikacije, kjer se uporabljajo ontologije, so iz dneva v dan številčnejše in jih lahko najdemo na različnih področjih semantično obogatenih spletnih aplikacij, pora zdel j enega obvladovanja znanja, luščenja informacij itd. V svetovnem spletu se ontologije uporabljajo za povezovanje vsebine v celoto, kjer se pojavljajo semantični por tali,14 kol je npr. OntoWeb,15 ki je eden najbolj razširjenih. Namen projekta je omogočiti integracijo informacij na svetovnem spletu s podporo semantični integraciji porazdeljenih virov, vpeljavo semantičnih poizvedb in navigacijskih pogledov ter ne nazadnje tudi programskim agentom omogočiti dostop do vsebine portala. Zelo veliko raziskovanja na področju ontologij poteka v medicini, kjer je najbolj razširjena ontologija GALEN.16 Ne samo da jo odlikuje velika izrazna moč pri zajemu bogate set nan tike na področja delovanja zdravnikov, ampak se ukvarja tudi z. začasnimi in prostorsko razpršenimi vidiki znanja ter sklepanjem na podlagi znanja. Ena od prednosti so tudi zelo razširi ji va razvojna orodja, saj uporabnikom omogočajo prilagajanje osnovne terminologije specifičnim zahtevam. Obstajajo še številne druge ontologije, kol je npr. Cyc,17 ki velja za eno največjih in najbolj popolnih splošnih baz znanja z integriranim mehanizmom sklepanja, OBO!8 na področju biologije, SUMO,19 kot prav tako ena največjih formalnih ontologij v splošni rabi, DOLCE2' kot del WonderWeb21 in mnoge druge. U OARPA fDefensf? Advanced Research Program) Agent Markup Language Ontology inference Layer. Jezika, ki podpirata semantični splet in temeljito na svetovnem spiefu inXML. DAW t. se je razvil iž program a, sponzoriranega s strani ameriike DAFtPA-e, OIL pa iz projekta, ki ga financira Evropska unija. Skupaj taito tvorita enega semantično najbolj izraznih jezikov za opis dokumentov na svetovnem spletu in sta podprta tudi s strani IV3C konzorcija. 13 Wet) Ontology Language oz. Ontology Wei) Language je razvila skupina za spletne ontologije na konzorciju W3C in igra vlogo naslednika DAML+OIL. OWL je if tem trenutku najbolj izrazen ¡ezik za predstavitev znanja na podroiju semantiinego spleta. 14 SEAL SEmanticportALs 15 http://OntoWeb.org 16 http://www.opengalen.org 17 h tip.'/Awvw. opencyc. org 18 http://obo.sourceforge.net it suggested Upper Merged Ontology, littp://www.ontologyportal.org *°ht tp://www. loa ■ cnr. It/DOLCE. html " http://wonderweb seman ticweb. org/ 200S - številka 3 • letnik XIII iimuhi INFORMATIKA 125 Dejan Lavbič. Marjan Knspei: Semantika podatkov in ontologije 4 Različni pogledi na ontologije Ontologije so povezane s številnimi področji in tehnologijami. Na sliki 4 vidimo, da se pri pojmovanju ontologije razširjeni modeli HI<" in predikatna logika, h podporo odločanju, mehanizmi sklepanja in EAI,33 nahajajo bolj v zalednem delu (spodnji del slike 4), saj je na tej ravni semantika formalno določena. Drugi elementi pridejo v ospredje pri opravilih, kot so povpraševanje, pridobivanje informacij, navigacija in ne nazadnje predvsem souporaba znanja. Najprej si podrobneje poglejmo taksonomijo, ki predstavlja segmentacijo o z. klasifikacijo in ureditev elementov v razvrstitveni sistem, glede na medsebojne povezave. Slika 5 prikazuje preprost primer iz akademske sfere. Modeliranje začnimo s splošnim objektom in pojmi (oseba, tema, dokument), ki se nam za razumevanje zdijo pomembni. Vemo tudi, da sla študent in raziskovalec nekako povezana z osebo in da imamo študente no doktorskem študiju oz. doktorske študente. Za nas zanimiva tema je tudi semantika, kjer je OWL priljubljen jezik za predstavitev ontologij. To je na kratko taksonomija konceptov. Če želimo to predstavitev nadgraditi, pridemo do slovarja, kjer se ukvarjamo s terminologijo natančno ( besedišče ) (tematski sklopi) ^ (^navigacija^ (taksonomije) ^^pri dobival» Intomiacji / ( 50up0r3b, ž„,n]3) ^ Ontologije ^ —► ( semantična omrežja^ (^povprašava o jo J ( razširjeni ER modeli ) /V ^ [, prev«, (posrodovanje) \ 'l EAI J (sklepanje) ER modeli ) \ ^ pr&vflrjanje konsistenco ^ (predikatna logika) Slika 4: Različni pogledi na ontologiji! Slika 5: Primer taksonomjje in slovarja n Emily Relation - entiteta razmerij, hi se uporablja zo prikaz relacij med dvema aH več entitetami. ?3 Enterprise Applicn(ton Integration inlegracija aplikacij: metode, tehnike in orodja za povezovanje in ushladitev tiporahniških programov in podatkov zaradi veije združljivosti. 126 upohteni informatika 2005 - številka 3 ■ letnik XIII Dejan Lavbič, M,m j,in Ktisper; Semantika podatkov in ontologije določenega področja. V našem primeru se pojavita dve fiksni povezavi, s katerima povemo, da je študent na doktorskem študiju sinonim za doktorskega študenta in da je koncept OWL podoben ontologiji. Omeniti je treba, da pri gradnji slovarja temeljimo na bibliografiji.24 Naslednji korak bi predstavljal uvedbo tematskega sklopa, prikazanega na sliki 6. Uvedemo medsebojne povezave, kot je »oseba pozna temo« in »tema je opisana v dokumentu«. Taka predstavitev se uporab- lja predvsem za navigacijo in vizualizacijo, saj lahko npr, pri pregledovanju dokumentov preprosto poiščemo še druge dokumente, ki jih je napisala neka oseba. Na tej ravni uvedemo tudi atribute, s katerimi lahko opišemo dodatne podatke o študentu na doktorskem študiju, kot je npr. telefon in mentor. Tako pridemo do preprostega primera ontologije, prikazanega na sliki 7. Nadgradnjo predstavlja predvsem hierarhija tipa »je«, s čimer opišemo dedovanje. V omenjenem primeru npr. velja, da študent na ^ os o lia y-.....-(pni nil).........^ téma .....-(npisarTv) / ............. študent na doktorskem študiju f student J i raziskovalec J f semantika J -—* ( sinonim*) doktorski študent - (owl) (ontologija^ __¿ if _ ,|j ('telefon^) ( mentor '] Slika G: Primer tematskega sklopa f oseba ...........(potna)......................u tima }—(opitan v)......«/ dokument J int^ ( razi s i ^ /A—, -1-■ ( mentor J (študent) ( raziskovalec ) ( somantika j ( OWL j (ontologija") (pnrinhna^ / ' ^poctpodfo¿jq_ody študent na doktorskem študiju D* ■fpi imvfuK i Dejan Lavbič Pravila {jTj-Opiic) ■ ■ - (npnuu> ■ J^) [*M1 17 6fl 167 j I M.nrj.m Kri spor"] Slika 7 Primer ontologije w Po določeni tematik urejen seznam dd. 2D05 šlevilka 3 - letnik XIII MoHpKi INFORMATIKA 127 Dejan Lavbtč, M.irjan Kri^pet Semantikj podatkov in ontologijo doktorskem študiju podeduje vse lastnosti, ki jih ima raziskovalec. Prav tako to velja tudi za medsebojna razmerja, saj če oseba pozna določeno temo, potem jo pozna tudi Študent. Ravno zaradi tega se koncepta OWL in ontologija pomakneta raven više, saj ni nujno, da vse, kar velja za semantiko, velja tudi za ontologijo. Da pa ne izgubimo semantičnega razmerja, dodamo relacijo, ki pravi, da je semantika podpodročje ontologije. Če je potrebno, lahko v tem primeru dodamo tudi dodatne tranzitivne povezave. V ontologiji lahko za dva koncepta zapišemo, da sta si popolnoma enaka in ne samo podobna, kol lo v našem primeru velja za študenta na doktorskem študiju in doktorskega študenta. Pri modeliranju domene s pomočjo ontologij nam je na voljo tudi večkratno dedovanje. Primer je študent na doktorskem študiju, ki poleg obstoječega telefona od raziskovalca deduje Še lastnost mentor. Poleg tega na ravni sklepanja dodamo tudi pravila, s pomočjo katerih lahko izpeljemo novo znanje. Na sliki 7 je prikazan preprost primer sklepanja, kjer za osebo, ki napiše dokument o določeni temi, velja, da ta oseba tO temo pozna. Dejansko uporabo ontologij si bomo podrobneje pogledali v razdelku 9, kjer bo za predstavitev uporabljen jezik OVVL, kot eden od jezikov z največjo izrazno močjo, 5 Slovar in ontologija Da bi si lažje predstavljali, kaj sploh je ontologija, poskusimo najti razliko med izrazom in predstavo. En stvar v realnem svetu "X A mvm opn t \ Slika 8: Homonim "jaguar" v trikotniku pomena pogled na to je razlikovanje slovarja in ontologije. Kot primer si poglejmo izraz »jaguar«, ki lahko v realnem svetu predstavlja številne stvari ¡5J {glej sliko 8): • leopardu podobna črna lisasta zver, ki živi v Ameriki, ■ avtomobil angleške tovarne Jaguar, ■ kodno ime operacijskega sistema Mac OS X 10.2, ■ športno kolt) angleške tovarne Jaguar. Slika 9 poskuša v strnjeni obliki prikazati tri komponente pomena |2j (oglišča trikotnika), kise pojavljajo v naravnem jeziku (npr. v slovenščini). Prva komponenta v spodnjem levem kotu je izraz, ki ga sestavljajo simboli (oznake za predstavo) ali besede v slovenskem jeziku in pravila za združevanje leh izrazov v stavke. Sami po sebi nimajo pomenov, dokler jih ne povežemo z ostalima komponentama oz. ogliščem a trikotnika, to je predstavo in stvarjo v realnem svetu. Če nas npr. nekdo vpraša, kaj pomeni izraz »D23978BMF1MB8H77E8X9TJB9D3«, verjetno ne bomo poznali odgovora, saj za nas nima pomena. V nasprotnem primeru bomo skoraj zagotovo poznali pomen izraza »avtomobil«, ker imamo predstavo o tem izrazu v realnem svetu (ima štiri kolesa, motor, porabi določeno količino goriva itd.). Ravno zaradi tega je v trikotniku {giej sliko 9) med izrazom in stvarjo v realnem svetu povezava črtkana, saj ni neposredne povezave, ker človek pri povezovanju pojmov in stvari v realnem svetu potrebuje predstavo. Slovar se v splošnem ukvarja z levo stranjo trikotnika (izrazi in predstave), medtem ko je ontologija večinoma osredotočena na desno stran (predstave in stvari v realnem svetu), kot to prikazuje slika 9, Slovar je v prvi vrsfi klasifikacijski prostor v določeni domeni ali množici domen ali celo v širšem svetu, predvsem za potrebe iskanja in pridobivanja informacij. Semantika klasifikacijskega prostora je tako relativno šibka, z enostavnimi semantičnimi relacijami med izrazi, ki so strukturirani s taksonomijo relacij širši in ožji. Vse, kar moramo poznati o izrazu v slovarju, je, da se semantično razlikuje od drugih (s čimer izločimo dvoumnost) in da je širši oz. ožji pojem kot drugi. Na drugi strani Želi ontologija predstaviti zapleteno semantiko predstav in relacij med predstavami, njihovimi lastnostmi, vrednostmi, omejitvami in pravili. Namen ontologije se razlikuje od namena slovarja, saj skuša ontologija zajeti in predstaviti pomen določenih domen, množice domen ali celotnega sveta, ker skuša 128 uporabni informatika 2DD5 - številka 3 - telnik XIII Dejan Lavbič. M.irjan Krisper; Semantika podatkov in ontologije Nadzorovan slovar Termini: letalo, let, razred potovanja, letališče, pilot itd. Rolacije: uporablja, uporabljan-za, širši-pojem, ožji-pojem, soroden-pojem predstava (semantika: pomen) ( ontologija ) loglčno-konceptualna semantika (močna) semantika pojmov (šibka) izraz (sintaksa: simboli) 'semantične* relacije: enakovreden = uporabljen za širši pojem ožji pojem soroden pojem stvar v realnem svetu (pragmatika: uporaba) Logične predstave Entitete: lelalo, let. razred potovanja, letališče, pilot itd, Razmcrla: podrazred, del. primerek. Ima-koncno-destinaeljo, izvaja, uporablja, upravlja itd. Lastnosti: število sedežev, čas poiovanja. razdalja, cena, opremljenost, izkušenost itd. Vrednosti: 405,10 ur 30 min, 8200 Hm. 164.800 SIT ild. Pravila: IF letalo(X, 'Airbus A340') & sl-sedezgv(X. 405) THEN si-ekonomskih-sedezev(X, 325) semantično relacije: • podrazred • del • poljubna relacija • meta last nos 11 na relacijah Slike 9 tlloga slovarja in ontologije u trikotniku pomena eksplicitno simulirati razumevanje, ki ga ima človek v svojih mentalnih modelih problemske domene ali sveta. V nasprotju s slovarjem želimo pri ontologijah Konceptualno semanliko izraziti čimbolj natančno, obsežno in konsistentno. G Podatkovna modeliranje in ontologije V nasprotju s podatkovnim modeliranjem je glavna prednost ontologij v neodvisnosti od programskih rešitev, saj je ontologija sestavljena iz sorazmerno splošnega znanja, ki ga lahko uporabljamo pri različnih opravilih in v različnih programih. Korak bliže konceptu ontologij je globalni konceptualni podatkovni model, ki je tudi neodvisen od programskih rešitev. Računalniška ontologija predstavlja dogovor o konCeptualizaciji ter vsebuje slovar {terminov in oznak) in opredelitve konceptov ter njihove medsebojne odvisnosti v določeni domeni. Podatkovni model v nasprotju z ontologijo predstavlja strukturo in integriteto podatkovnih elementov praviloma v določenem programu, ki uporablja ta podatkovni model. Konceptualizacija in uporaba slovarja podat- 2005 • številka 3 ■ letnik XIII kovnega modela tako ni a priori namenjena za souporabo v več različnih programih [1], Kot primer omenimo ontologijo knjigarne, kjer npr. obstaja pravilo, ki pravi, da je vsaka knjiga določena s številko ISI3N. Vsi programi, ki uporabljajo to interpretacijo ontologije knjigarne, morajo upoštevati to pravilo. Programi /a podporo dela v knjigarni, ki ne predvidevajo ISBN številke za vsako knjigo, ne morejo uporabiti oz. souporabi ti ontologije knjigarne. Brez. tako definirane ontologije dva programa ne moreta komunicirati med seboj (ni souporabe slovarja in pravil, ki veljajo za določeno domeno, med dveina programoma). 6.1 Modeliranje podatkovnih shem in ontoloških modelou Podatkovni modeli, kot so podatkovne baze ali XML sheme, določajo strukturo in integriteto podatkov. Izdelava podatkovnih modelov je v podjetju po navadi odvisna od določenih zahtev in opravil, ki morajo izvedena biti v podjetju. Semantiko podatkovnih modelov v veČini primerov določajo neformalni dogovori med razvijalci in uporabniki podatkovnega modela. UPOBA0N» INFORMATIKA 129 Dojon Lavbič. Marjan Krisper. Semantika podatkov in ontologije Najdemo jo za kodirano v programih, ki ta podatkovni model uporabljajo, V nasprotju s podatkovnimi modeli, ki so odvisni od opravil in usmerjeni k implementaciji, so ontologije že v osnovi in po opredelitvi Čimbolj splošne in kar se le da neodvisne od opravil. Bolj ko se ontologija približa idealu formalnega in dogovorjenega zapisa, večja je raven souporabe, V nadaljevanju si bomo pogledali, kako (formalno izražena) pravila določene domene vplivajo na sploš-nost modelira nega znanja. Spodnji seznam predstavlja elemente, kjer se ontologije razlikujejo od podatkovnih modelov: ■ Nivo delovanja - Pravila problemske domene lahko zapišemo na nižji ravni, usmerjeni k implementaciji, z uporabo podatkovnih tipov, primarnih ključev itd. Na višjem nivoju pa lahko vključimo bolj abstraktna pravila, kot so popolnost, togost, identiteta, ki so neodvisna od ravni implementacije. Bolj ko so pravila o problemski domeni abstraktna, bolj so le-ta splošna in ponovno uporabljiva na več mestih. . Moč izražanja - Namen jezikov za manipulacijo s podatki, kot je SQL, je ohranitev integritete podatkov in uporaba splošnih konstruktov, kot so npr. ključi. V splošnem morajo pravila o domeni izražati ne samo integriteto podatkov, ampak tudi kon-ccptualizaajo domene. Tako mora jezik za izražanje pravil o problemskem področju vsebovati kon-strukte, s katerimi lahko izrazimo druge pomenske omejitve, kot je taksonomija ali podpora sklepanju, kar najdemo npr. pri DAML+OIL in OWL. ■ Povezanost z uporabnikom, namenom in ciljem -Podatkovni model se zelo dobro prilega določenim ciljem in potrebam uporabnikov, ki program uporabljajo. Jasno je, da na ta račun trpi splušnost koiv ceptualizacije, ki je odvisna od granularnosti pro- cesa modeliranja, odločitev, ali določeno dejstvo modeliramo kot razred ali atribut, uporabo tipa objekta iz slovarja ali ne itd. • Razširijivost - Pri konceptualizaciji ontologije problemskega področja je pomembno, da elemente obravnavamo ločeno od problema ali opravil in tako omogočimo uporabo in razširitev slovarja v splošnih primerih, ki jih pri gradnji mogoče nismo predvideli. 7 Ravni predstavitve ontologije Ko govorimo o ontologijah, moramo razlikovati med različnimi ravne mi predstavitve. Teh razlik se moramo zavedati, saj si lahko ontologije predstavljamo kot jezike ali sintaktične slovarje, opremljene s semantiko. Ontologije predstavljajo vsebino, ki jo lahko predstavimo le z ustreznim jezikom, ki ga imenujemo jezik za predstavitev znanja. Zaradi omenjenih razlogov govorimo vsaj o naslednjih ravneh predstavitve: • o ravni predstavitve znanja, ki jo imenujemo tudi metaraven, ker je zgrajena nad predstavitvijo konceptov in jo tudi razširja; • o ravni predstavitve ontologije oz. objektni ravni predstavitve znanja, kjer se nahaja vsebina in kjer so izražene ontologije; ■ o ravni primerkov ontologije, kjer najdemo primerke razredov ontologij. Raven predstavitve znanja (najvišja metaraven) opredeljuje konstrukte, ki se bodo uporabljali na ravni koncepta ontologije. Ti konstrukti so razred, razmerje, primerek itd., kot je prikazano v tabeli 2, Jezike za predstavitev znanja (2) delimo na tiste, ki so nastali pred semantičnim spletom (KL-ONL, Ontolingua, Classic, LOOM, KIJ*,2" CycL, UML2"), in jezike, ki jih povezujemo s semantičnim spletom (RDF/5, DAML+OIL, OVVL). Kauen Primer konstruktov Raven predstavitve znanja (KR^S) Razrfid. razmerie, primerek., funkcija, atribut, lastnost, ame|itev, aksiom, pravilo Raven koncepta ontologije (0Cati) Oseba, avto. lokacija, dogodek, financnaTransakcija, nacrtovanjcPc tavanja, nakupHise itd. Raven primerkov IDI27) Dejan LavbiC, oseba312, Lanos 1 5 SE itd. Tabela 2 Raunt predstauitue ontologij 15 Knowledge representation 16 Ontology concept 37 Ontology instance n Knowledge Interchange Format je jezik za predstavitev znan/a, hi je bil razvit pred pojavom semantičnega spleta. Temelj: na predikatni logiki prvega reda, v današnjem času pa obstaja standard ISO-K/F. hi podpira f.tevilne obfifts, vključno z XML in konceptualnimi grafi n Unified Modeling Language je iczik za specificirale, vizuoliiiranje. modeliranje in dokumentacijo izdelkov pri razvoju objektno usmerjenih sistemov. UML ni omejen samo na modeliranje programske opreme, ampak se pogosto uporablja tudi na drugih področjih (npr. modeliranja poslovnih procesov, organizacijske strukture Ud,). 130 u c o « « 8 r. í INFORMATIKA 2005 - številka 3 - letnik XIII Dejan Lavbič. Marjan Krisper; Semantika podatkov ¡n ontologije Na naslednji ravni, ravni koncepta ontologije, so ontologije, definirane z uporabo konstruktov iz ravni predstavitve znanja. Tukaj se ukvarjamo z modeliranjem generične oz. univerzalne vsebine - domenskega znanja o osebah, lokacijah, dogodkih, finančnih transakcijah itd., kot prikazuje tabela 2. Na najnižji ravni, ravni primerkov, se nahajajo konstrukti, ki so primerki konstruktov na ravni koncepta ontologije. Ta raven se ukvarja z bazo znanja oz. bazo dejstev in je sestavljena iz posameznih primerkov, kot so npr. oseba3L2, Lanos 1.5 SE itd. 8 Jeziki za predstavitev ontologij Na področju predstavitve znanja poznamo veliko jezikov. Eden prvih je bil KIF. To je računalniški jezik za izmenjavo znanja med različnimi programi in ima deklarativno semantiko {pomen izrazov v predstavitvi je razumljiv brez uporabe prevajalca za omenjene izraze). S svojo splošnostjo (predstavitev poljubnih stavkov v obliki predikatnega računa prvega reda) omogoča predstavitev znanja o znanju, opredelitev objektov, funkcij in relacij. Omembe vreden je tudi ©KBC,30 saj je prinesel enoten model predstavitve znanja in temelji na splošni konceptualizadji razredov, primerkov, dedovanja itd. V nadaljevanju se bomo osredotočili predvsem na jezike za predstavitev ontologij, ki so povezani s semantičnim spletom, saj se v praksi tudi najpogosteje uporabljajo. 8.1 ROHSJ RDF" je bil razvit za potrebe opisovanja metapodat-kov virov na svetovnem spletu v obliki stavkov, dru- gih virov in lastnosti. Stavki v RDE opisujejo vire v obliki , ki so lahko spletne strani ali dejanski objekti (osebe, organizacije itd.), kot prikazuje primer na sliki 10. Vire in lastnosti opišemo s pomočjo sheme RDF32 (RDF/S), ki RDE razširja z dodatnimi načrtovalskimi gradniki in jih pogosto najdemo pri jezikih za predstavitev ontologij: razredi, dedovanje razredov, dedovanje lastnosti, domena, obseg omejitev itd. S pomočjo sheme RDF lahko predstavimo razrede, vloge in omejitve nad vlogami, medtem ko lahko s pomočjo KDF predstavimo primerke in dejstva. V takšnem jeziku ne moremo predstaviti aksiomov in edini mehanizem sklepanja, ki nam je na voljo, temelji na obstoječih povezavah med razredi. Prednost RDE-ja je v uporabi XML,-a in URI-j a,33 saj je njegov namen ponovna uporaba entitet na svetovnem spletu. 8.2 DAML+OIL DAML+OIL34 sta jezika, ki podpirata semantični splet in temeljita na svetovnem spletu in XML. DAML se je razvil iz programa, ki ga sponzorira ameriška DARPA, OIL pa iz projekta, ki ga financira Evropska unija. Skupaj tako tvorita enega semantično najbolj izraznih je/.ikov za opis dokumentov na svetovnem spletu in ju podpira konzorcij W3C.K V zadnjem času se je pojavila razširitev DAML-Service36 (DAML-S), ki predstavlja množico ontologij v DAML+OIL in se ukvarja s semantiko spletnih storitev, storitev modeliranih v obliki procesov, profilov storitev, storitvenih modelov in osnov samih storitev (npr. konkretnih realizacij abstraktno definiranih komponent storitev, primerljivih z delom jezika WS D L'17 za povezovanje). ( Celje ) predikat (lastnost) osebek omrežna Skupina © predmet £rdf:Description rdf : about.^ "#Cel;je"> ComroinaSkupina>03 e/rd f;De3cr it ipn> Slika 10 Trditev RDF v obliki grata in formalnega zapisa 20 Ope d Knowledge Base Connectivity JJ http://www.w3.org/RDF 21 littp:/!w\w.w3.orgJTRfrÜt-schcma JJ Uniform Resource Identifier - Sploien Identifikator. ki se uporablja za razlikovanje konkretnih in abstraktnih virov na svetovnem spletu ¡14). 3J http://www.daml.org/2001/03/dan)l+oilindex.html Jä World Wide VVot> Consortium 36 http://www.daml.org/services/owl-s 31 Web Service Description Language 2005 -Številka 3 -letnik XIII upobíuuí INFORMATIKA 131 Dejan Lavbič, Marjan Krisper: Semanlika podatkov in ontologije 8.3 DWL Wob Ontology Language3* oz. Ontology Web Language je v tem trenutku najbolj izrazen jezik za predstavitev znanja na področju semantičnega spleta. V nasprotju z DAML+OIL je OWL nastal pod sponzorstvom W3C, ki je prvo verzijo tega jezika predstavila leta 2003. OWL ima tri ravni: OWL Lite, OWL DL (za opisno logiko) in OWL Full {glej sliko 11). Omenjene ravni predstavljajo naraščajočo stopnjo izraznosti, kjer višje ravni jezika vsebujejo nižje oz. jih razširjajo. Trditev, veljavna v OWL Lite, je še vedno veljavna v OWL DI, in OWL Full. Prav tako je trditev, veljavna v OWL DL, veljavna tudi v OWL Fuli, vendar ne nujno v OWL Lite. ICfikJlan OWL. Npr razred fahko obstaja Kot mroitea ïposarro/nfo razredov ali kal po&aine,znik. ¡Nokolllto omejen ÖWL. Npr. Lristno3ti no mornju utwlajaU ¡ ¡lAmeítolno Bolj izrazne timejltvn Wbvrius'i ' M.i,' . ', ji*/k vdmlar '■" vaUna bolj tzraurt kot rdi ¡ iS Nfi voljo le ofufilavne onmjitvo {0 ali 1) glodo Étevnosh. ¡ Slika 11: Ravni jtriiku OWL OWL je zgrajen na konceptih DAML + OIL, saj ima, podobno kot predhodnik, razrede (in podrazre-de), lastnosti (in podlastnosti), omejitve nad lastnostmi in primerke razredov ter lastnosti. OWL, podobno kol DAML + OIL, za opisovanje razredov in informacij o podatkovnih tipih (iz XML sheme) uporablja kon-strukte subCIassOf, disjointWith in omogoča logične kombinacije izrazov nad razredi (intcrsectionOf, unionO/, compkmentOf), kot tudi razvrščanje razredov v sezname. OWL si preprosto lahko predstavljamo kot množico RDF trojčkov, vendar le-ti uporabljajo OWL slovar, ki jim daje v okviru OWL jezika poseben pomen. Praktični primer uporabe jezika je predslavljen v razdelku 10. 38 hltp://www.w3.oriyTR/owl fealure5 39 http://pmege.sianford.edu/ 40 ht tp://www. ksl. sta nford, eúu/sofiware/on tolingua/ " http://www.opcncyc.org/ "2 http://oiled.man.ac.uk/ 43 http://www.ontoknowleage.org/tools/toolrep.shtml 9 Orodja za obuiadovanje ontologij Pri razvoju, integraciji, opisovanju, shranjevanju ontologij in povpraševanju po njih lahko uporabimo Številna orodja, ki so na voljo kot komercialni produkti ali plod dela akademskih skupnosti in so prosto dostopna. Če izpostavimo Širino in raznolikost lastnosti, je zelo primerno orodje Protégé/1 ki so ga razvili na Stanford Medical ln forma tics. Razvojno okolje je odprtokodna rešitev urejevalnika ontologij, katerega funkcionalnosti je mogoče razširili s številnimi vtičniki. S stališča natančne podpore jezikom za zapis ontologije sta dobra izbira orodji Ontolingua4" in OpenCyc,41 ki prinašata visoko izrazno moč in popolno podporo specifikacijam. Med urejevalniki, ki neposredno podpirajo DAML+OIL, je zaradi močne podpore pri uporabi opisne logike uporabno orodje OilEd.1- Paket On-To-Knowledge tool suite4-1 je prav tako zanimiva rešitev, sestavljena iz številnih orodij: OntoEdit, OntoShare, OntoExtract, OntoWrapperitd. Vsako od orodij pokriva doiočeno funkcionalnost: od urejanja ontologij do uporabe ontologij pri souporabi znanja, polavtomatskega učenja ontologij iz naravnega jezika, luščenja strukturiranih informacij iz spletnih virov itd. Nekateri avtorji pa predlagajo uporabo UML-ja kot predstavitvenega jezika ontologij. Prednost uporabe tega jezika je v dostopnosti orodij za modeliranje, slabost pa nekoliko slabša podpora specifikacijam in s tem tudi omejena izrazna moč. Ključ pri uporabnosti orodja za organizacijo in obvladovanje ontologij leži tudi v intuitivni predstavitvi ontologije ter preprostemu obvladovanju povezovanja konceptov in relacij. Ker številni modeli omogočajo večkratno dedovanje pri hierarhičnih konceptih in relacijah, je tudi obvladovanje teh asociacij pogosto velik izziv. Po navadi se uporablja pristop pogledov v obliki drevesne strukture z zmožnostjo razširjanja in ožanja nivojev. Predstavitev v obliki grafa ni tako razširjena, čeprav je lahko zelo uporabna pri urejanju konceptov in medsebojnih relacij. Korak naprej je uporaba grafov za brskanje po ontologiji, kjer lahko povečamo podrobnosti le na določenem delu, ki nas zanima. V orodju Protégé obstaja celo vtičnik Jamba laya, s katerim lahko izvajamo grafično približevanje, kjer podrejeni koncepti ostanejo v sklopu nadrejenega, tako da se lahko prosto sprehajamo po mreži konceptov, povezanih z medsebojnimi relacijami. Ena od pomembnih lastnosti urejevalnika je tudi podpora delu z lupino odločitvenega sistema, ki nam 132 ttpoRABN* INFORMATIKA Z00& - številka 3 - letnik XIII Dejan Lsvbič. Marjan Krisper: Semantika podatkov In ontologije omogoča povpraževanje po ontologiji. Kljub temu da lahko ontologije obravnavamo kot samostojne specifikacije, se navsezadnje uporabljajo tudi za iskanje odgovorov na vprašanja, ki jih vsebuje ontologija. Nekateri urejevalniki celo omogočajo uporabo dodatnih aksiomov in pravil, vendar so rešitve na tem področju implementirane različno za vsako orodje, tako da trenutno ne obstaja standardni jezik za zapis pravil in neposredne manipulacije z izrazi in strukturami v ontologiji. Eden od zelo Verjetnih kandidatov, ki bo podprt v naslednjih urejevalnikih ontologij, je prav gotovo RuleML. 10 Primer uporabe ontologije V tem razdelku si bomo ogledali preprost primer uporabe ontologije, v katerem bomo za predstavitev znanja uporabili jezik OWL. Predpostavimo, da je prišlo do oboroženega ropa, kjer ropar na kraju zločina izgubi orožje in pobegne v neznano [4]. Ko na kraj zločina prispe policija, zberejo ustrezne podatke, poberejo dokaze, kjer najdejo tudi izgubljeno orožje. Poročilo je zapisano v obliki, prikazani na sliki 12. ... .,. 1234-5678