111 G eo de ts ki v es tn ik 4 8/ 20 04 – 1 K N JI Ž N E N O K N JI Ž N E N O K N JI Ž N E N O K N JI Ž N E N O K N JI Ž N E N O V IC E I N S IM P O V IC E I N S IM P O V IC E I N S IM P O V IC E I N S IM P O V IC E I N S IM P O Z IJ I Z IJ I Z IJ I Z IJ I Z IJ I KNJIŽNE NOVICE Tomaž Podobnikar Naslov monografije: Semantična integracija zbirk prostorskih podatkov Avtor: dr. Marjan Čeh Leto izdaje: 2003 Izdajatelj: Prostorskoinformacijska enota ZRC SAZU Založnik: Založba ZRC, ZRC SAZU Strani: 151 ISBN 961-6500-03-1 Predstavljamo vam monografijo – knjigo z naslovom Semantična integracija zbirk prostorskih podatkov, ki jo je napisal dr. Marjan Čeh in jo je jeseni leta 2003 izdala Založba ZRC. Na začetku velja poudariti, da gre pri tem za obravnavo tematike, ki se naslanja na dejstvo, da se komunikacije med prostorskimi zbirkami podatkov (medopravilnost) nepretrgoma povečujejo, skupaj z naraščanjem količine digitalnih podatkov, kar povečuje njihovo nepreglednost. Delo vsebuje 8 poglavij na 151 straneh in je dodatno oplemeniteno s 26 ilustracijami in 20 preglednicami. Poleg obsežnega spiska citirane literature je knjiga dopolnjena tudi z bogatim besednjakom ter stvarnim kazalom. Vsakodnevno se hote ali nehote srečujemo z najrazličnejšimi podatki. Pri tem uporabljamo sposobnosti komuniciranja ali pa si pomagamo z najrazličnejšimi knjigami, učbeniki, enciklopedijami, pravopisi, imeniki, slovarji ter drugimi »zbirkami podatkov«. Vse večjo korist nam prinaša medmrežje, na katerem lahko z iskalniki najdemo informacije o (skorajda) vsem, kar nas zanima. Vendar lahko za iskani izraz dobimo več pomenov, lahko pa se istemu pomenu pripiše več izrazov. Omenjena zadrega nam sicer lahko v lingvističnem smislu popestri vsakdanje 112 G eo de ts ki v es tn ik 4 8/ 20 04 – 1 K N JI Ž N E N O K N JI Ž N E N O K N JI Ž N E N O K N JI Ž N E N O K N JI Ž N E N O V IC E I N S IM P O V IC E I N S IM P O V IC E I N S IM P O V IC E I N S IM P O V IC E I N S IM P O Z IJ I Z IJ I Z IJ I Z IJ I Z IJ I življenje. Če pa se na primer nepredvidljivi rezultati iskanja pojavljajo med iskanjem informacij v prostoru – po podatkovnih shemah – nam to lahko oteži delo. Za primer vzemimo iskanje besede »baza«. V računalništvu si pod tem izrazom največkrat predstavljamo, da gre za »bazo podatkov«. Vendar lahko ta izraz v drugačnih razmerah (na pomenski oz. semantični ravni) razumemo tudi kot »osnovo« ali »podlago«, lahko gre za »vojaško bazo« ali pa morda za kemično »bazično snov«. Če se vrnemo k računalništvu, lahko izraz »baza podatkov« brez spremembe pomena zamenjamo z izrazom »zbirka podatkov«. Avtor v svojem delu s celostnim pristopom obravnava medopravilnost zbirk prostorskih podatkov, ki vključujejo geografski prostor in geoinformacijsko tehnologijo. Pomembno je vedeti, da že obstajajo orodja – jeziki, kakršna sta GML in XML, ki omogočajo zapis pomenskih – semantičnih koordinat zbirk podatkov. S tem se ustvari pogoje za analizo, prevajanje in kasnejšo integracijo prostorskih podatkov. Eksplicitno je predložen koncept organizacije podatkov, pri katerem za vsak podatek poznamo semantične značilnosti, kot je na primer globina. Omenjeni koncept med drugim omogoča podporo pri odločanju pri samodejni generalizaciji, kar bi lahko s pridom uporabili kartografi. Pri semantičnem prevajanju in opredelitvi nekega predmeta, pojma ali aktivnosti si lahko pomagamo z ontologijo kot filozofsko disciplino, ki obravnava vzroke in najsplošnejše lastnosti stvarnosti. Ontologija omogoča semantično opredelitev zbirk prostorskih podatkov. Podoben problem je pred štiristo leti rešil René Descartes za geometrične podatke, ki jih je umestil v koordinatni sistem kot osnovo prostorskih referenčnih sistemov. Geometrični podatki, ki so lahko predstavljeni kot karte, načrti, posnetki in podobno, omogočajo uporabnikom geografskih informacijskih sistemov opredelitev prostorskih podatkov glede na njihov položaj in geometrijo, ne pa tudi glede na pomen. Analogno bi bilo treba za semantično uvrstitev, opredelitev, prevajanje in integracijo posameznih podatkov ter zbirk vzpostaviti t. i. semantični referenčni sistem v domeni prostorskih podatkov. Omenjenega problema se je za izhodišče svoje raziskave na filozofsko-logični in tehnično-organizacijski ravni lotil avtor pričujoče knjige. Marjan Čeh se v delu ukvarja z že znanimi teorijami, ki so izhodišče za semantično analizo prostorskih podatkov. V prvem delu knjige na teoretični ravni podrobno opisuje obstoječe metode semantične integracije podatkov. Nato obravnava metode integracije konceptualnih shem, semantične bogatitve shem, reševanje problemov spajanja shem ter ocenjevanja kakovosti integracije podatkov. Kot orodje mu služijo principi konceptualnega modeliranja. V ta namen podrobno opredeli klasifikacijo in abstrakcijo v konceptualnem modeliranju, formalno modeliranje konceptov ter konceptualno modeliranje z vidika informacijskih sistemov. Uporaba ontologij je v geoinformatiki predmet živahnih raziskav, zato obravnava nekatere filozofske teorije prostora, kot so ontologija, merologija, semiotika ter kognitivno kartiranje. Drugi del knjige je v teoretskem smislu najpomembnejši. Avtor je razvil neodvisno metodologijo za izvedbo semantičnega referenčnega sistema, ki jo imenuje »ontologija prostora geografskih razsežnosti«, skrajšano OPGR. Njegova univerzalna ontologija predstavitve znanja o prostoru geografskih razsežnosti je zasnovana kot sistem človeških aktivnosti in prostorskih pojavov. Pri tem uvaja temeljne mere za ocenjevanje semantičnih značilnosti zbirk podatkov, kot so semantična 113 G eo de ts ki v es tn ik 4 8/ 20 04 – 1 K N JI Ž N E N O K N JI Ž N E N O K N JI Ž N E N O K N JI Ž N E N O K N JI Ž N E N O V IC E I N S IM P O V IC E I N S IM P O V IC E I N S IM P O V IC E I N S IM P O V IC E I N S IM P O Z IJ I Z IJ I Z IJ I Z IJ I Z IJ I razdalja, globina in razpršenost (horizontalna, vertikalna) zbirke podatkov. Na ta način poda osnove za semantično integracijo zbirk prostorskih podatkov. Ob koncu knjige se ukvarja s praktičnimi vidiki pri medopravilni integraciji zbirk prostorskih podatkov. Pri vsakdanjih praktičnih opravilih z zbirkami prostorskih podatkov je treba izpostaviti vlogo skrbnika podatkov. Ta mora najprej sprejeti t. i. ontološko obveznost glede uporabe OPGR. S tem se naveže na semantični referenčni sistem, v katerega uvrsti svojo zbirko podatkov. Sledi t. i. semantično kartiranje, pri katerem dobi vsak podatek semantično koordinato, ki se v obliki oznake vodi kot metapodatek. Enak postopek se izračuna za vse podatke v zbirki. Za zbirko kot celoto se nato izračuna mere semantičnih značilnosti (semantična razdalja, globina, razpršenost ipd.), ki se shranijo kot metapodatek zbirke. Sledi objava omenjenih metapodatkov v porazdeljenem prostorskem informacijskem sistemu. Objava je pomembna za morebitno nadaljnjo integracijo zbirk, skrbništvo ali pa trženje. Po opisanem postopku se poveča organiziranost podatkov in s tem zmanjša entropija, uporabniki pa se lahko glede na objavljene mere semantičnih značilnosti lažje odločajo o morebitni uporabi zbirke podatkov. Z obravnavano tematiko bi se morali seznaniti skrbniki (načrtovalci) in tudi uporabniki zbirk prostorskih podatkov ter jo poznati vsi, ki se ukvarjajo s prostorsko informatiko in odločajo o uporabi posameznih zbirk podatkov. K dodelavi enotnega koncepta standarda semantične opredelitve prostorskih podatkov na državni, evropski in svetovni ravni pa bi nenazadnje pripomogla tudi politična podpora. Semantična opredelitev podatkov je skupaj z neprimerno bolj raziskano in standardizirano geometrično opredelitvijo pomembna in koristna, saj omogoča lažjo in učinkovitejšo uporabo prostorskih podatkov. dr. Tomaž Podobnikar Inštitut za antropološke in prostorske študije Znanstvenoraziskovalni center SAZU Novi trg 2, 1000 Ljubljana E-pošta: tomaz@zrc-sazu.si