OPREDELI1,EV P OST RS H P doc.dr. Radoš Šwnrada FGG-Oddelek za geodezijo, Ljubljana Prispelo za objavo: 1996-06-20 Pripravljeno za objavo: 1996-06-20 Izvleček V članku sta predstavljena pomen in vloga osnovnih pokazateljev za določanje kvalitete prostorskih podatkov. Opisani elementi so pojmqvno opredeljeni v kakovostnem modelu in predstavljeni v poročilu o kakovosti, ki je ponavadi obvezen sestavni del standardov za izmenjavo prostorskih podatkov. Prinmja/110 so določeni tudi identifikato1ji kakovosti med poročilom komisije za kakovost prostorskih podatkov ICA, ameriškim standardom SDTS ter predlogom novega evropskega standarda tehničnega odbora CEN/TC 287. Ključne besede: elementi, opredelitev kakovosti, osnovni pojmi, prostorski podatki, standardi Abstract This paper presents ihe role and importance of crucial elements or indicators that detennine the qua!ity of spatial data. Described quality indicators are conceptually defined in the qualily model and presented in the quality report, which is generally a mandato;y constiluent part oj spatial dala transfer standards. The paper also gives a shorl comparative disrnssion and the definitions of spatial dala quality elements as they are implemenled in 1/ie american national standard SDTS, described in the special rcport of ihe JCA Commission on Spatial data qualily and dcfined in the proposals for the ncw Europcan spatial data siandards developed under the auspices of CEN/TC 287. Keywords: basic tenns, definition of quality, element s, spatial data, standards 1 UVOD UDK (UDC) 528+912(086.5): 659.24/.25.002.61 061.3(497.12-2) Portorož "1996":528 VOSTI Al~ OV akovost prostorskih podatkov je ključen problem v obdobju skokoviteg2. razvoja elektronske tehnologije in komunikacijskih omrežij, ki zagotavljajo hiter in enostaven dostop do podatkov. Veliko zbirk prostorskih podatkov lahko uporabniki dosežejo z vključitvijo v lokalno ali svetovno medomrežje (Internet). Brez poglavitnih elementov1, ki opredeljujejo kakovost podatkov, se zdijo vsi pridobljeni podatki natančni in popolni. Med obdelavo pa bo uporabnik lahko opazil, da podatki iz različnih virov, ki jih primerja, niso enakovredni in se ne ujemajo v celoti. Pri grafični predstavitvi in povezovanju takšnih raznovrstnih podatkov se točke, linije in območja Geodetski vestnik 40 ( 1996) 3 ne prekrivajo natančno, čeprav predstavljajo iste prostorske pojave. Brez ustreznih pokazateljev kvalitete prostorskih podatkov, pridobljenih iz različnih virov, uporabnik nima nobenega oprijemljivega merila, da bi lahko razrešil nastala odstopanja. V obdobju analogne kartografije je bila glavna pozornost za kvaliteto prostorskih podatkov usmerjena v natančnost planimetričnega kartiranja objektov (položajna pogreška my in mx v ravnini upodobitve) v odnosu do njihove dejanske lege v prostoru. Na računalniških prikazih so videti digitalni prostorski podatki dovršeni. Zelo hitro se zato lahko ustvari varljiv občutek o njihovi navidezni natančnosti vkljub vsem vsebovanim pogreškom v samih podatkih. Izkušen uporabnik mora zato imeti na voljo ustrezne metode za opredelitev poznane kakovosti izbranih podatkovnih nizov pri njihovi analizi ali prikazovanju. Čeprav obstaja soglasje, da kvaliteta podaja neko vrsto zaželjene vrednosti, pa je dejanski pomen takšne vrednosti relativen oziroma intuitiven. ISO-va (International Standards Organisation) opredelitev pojma kvalitete v okvirih kontrole kakovosti je naslednja (ISO WWW): o kvaliteta je skupek značilnosti in lastnosti proizvoda ali storitve, ki podpirajo njeno sposobnost, da zadovolji izražene ali vsebovane potrebe. Taka opredelitev kvalitete poudarja njen relativen značaj. Kakovost se vedno meri v odnosu do potreb, ki so lahko izražene izrecno ali pa posredno. Zaradi take definicije se lahko kvaliteta določenega objekta spreminja, če obstajajo različne potrebe. Da bi zagotovili podatke o kvaliteti, ki so neodvisni od načina uporabe, je treba opredeliti kvalitetne norme. V primeru prostorskih podatkov temeljijo takšne kakovostne norme na osnovnih elementih, ki opredeljujejo kvaliteto podatkov in morajo biti sestavni del poročila o kvaliteti podatkov. Ce se delno priredi že navedeno opredelitev ISA, potem je lahko kvaliteta prostorskih podatkov definirana (Guptill et al., 1995): • kvaliteta prostorskih podatkov je skupek značilnosti in lastnosti podatkovne zbirke, ki podpirajo njeno sposobnost, da zadovolji izraženi niz zahtev" Kakovost prostorskih podatkov opredeljujejo standardni pokazatelji, ki so povezani in se ne nanašajo samo na položajno natančnost ali točnost Opredelitev ključnih elementov, ki so pomembni za določitev kakovosti podatkov, je samo pr1i korak. Naslednja pomembna stopnja je opredelitev metodologije za specifikacijo kvalitete prostorskih podatkov glede na vse pomembne dejavnike, ki jo določajo. Pri izboru in izdelavi metodologije za določitev kakovosti so torej pomembne predvsem naslednje tri faze: o razvoj in opredelitev ustreznega standardnega niza kriterijev oziroma elementov za opredelitev kvalitete prostorskih podatkov o razvoj in opredelitev enostavnih metod za testiranje ter opredelitev kakovosti prostorskih podatkov in povezav med njimi o opredelitev primernih metod za predstavitev in upodobitev kvalitete prostorskih podatkov (standardno poročilo) ter ustrezna grafična ponazoritev elementov k:ak:ovostL Geodetski vestnik 40 (1996) 3 Tržna oziroma ekonomska vrednost prostorskih podatkov je prav tako tesno povezana z njihovo kakovostjo. Kvalitetnejši podatki so dražji zaradi številnih dejavnikov in postopkov, ki so potrebni za pridobivanje, zajemanje, urejanje, obdelavo, noveliranje ( ažuriranje ), hranjenje, predstavitev ter posredovanje prostorskih podatkov. cena Slika 1 in ekonomsko sprejcmljivZi natenčnost p@iiaUrnv 75% 85% 95% Stoodstotna natančnost2 ali točnost podatkov je zgolj hipotetična predpostavka tako s tehničnega in z metodološkega kot tudi z ekonomskega vidika. Cena takšnih podatkov bi bila za proizvajalca in zlasti za uporabnika ekonomsko nesprejemljiva. Glede na praktične izkušnje oziroma hevristične predpostavke se kot minimalni tehnološki prag pričakuje nad 75-odstotna natančnost Tehnološko izvedljiva in hkrati za nekatere uporabnike ekonomsko še sprejemljiva se ocenjuje do 95-odstotna natančnost podatkov. Na sliki l so prikazani opisani odnosi, 2 DOLOČANJE IN PODAJANJE KVALITETE PROSTORSKIH PODATKOV Pred izdelavo poročila o kakovosti je treba določiti oziroma izbrati ustrezno metodologijo za testiranje in formalno določitev k'valitete prostorskih podatkov v podatkovnih zbirkah. Kvaliteta podatkov se lahko preizkusi glede na vse elemente, ki jo določajo. Obstajajo uveljavljene metode za določitev kakovosti podatkov, ki temeljijo na ustreznem testiranju in statistični obdelavi izbranega podatkovnega vzorca. Takšni testi se običajno izvajajo ločeno za vsak posamični pokazatelj kvalitete podatkov. Prav tako je treba določiti tudi ustrezne načine za numerično in grafično predstavitev k'valitete prostorskih podatkov. Poročilo o značilnostih in kakovosti prostorskih podatkov mora vsebovati vsaj naslednje pomembne postavke: o podatki o primernosti za uporabo3 morajo biti na voljo neodvisno od podatkov, tako da lahko možni uporabniki ocenijo kakovost podatkovne zbirke pred njihovo uporabo, o zanesljivost kakovostnih postavk predstavlja odgovornost za proizvajalca in uporabnika podatkov. Proizvajalec mora sporočiti vse standardne elemente o poznani kvaliteti podatkov. Uporabnik se mora zanesljivo odločiti o primernosti podatkov za nameravano uporabo, Geodetski vestnik 40 ( 1996) 3 o prožnost omogoča širjenje in dopolnjevanje elementov kakovosti podatkov. Najboljša je uporaba ustreznega metapodatkovncga standarda4 o kvaliteti prostorskih podatkov. Glede na raven, na katero se nanašajo razni elementi kvalitete prostorskih podatkov, se kakovost veže na posamezne podatkovne elemente, ki so lahko: podatkovna zbirka ali karta, podatkovna tematika, podatkovni niz ali sestavljeni objekt, objekt, entiteta, pojav ali podatkovni zapis, podatkovni zapis ali polje. Standardizirane metode in načini za podajanje poročila o kvaliteti prostorskih podatkov so prav tako zelo pomembni ter so lahko zlasti naslednji: poročilo in tekstualni opisi, grafični prikazi kakovosti, statistična opredelitev in obdelave izbranih testnih vzorcev. 3 OPREDEU'fEV ELEMENTOV KVALITETE PROSTORSKIH PODATKOV Prostorski podatki so običajno organizirani v podatkovne nize, ki so razpoznavne zbirke podatkov. Prostorski podatki se lahko pridobijo iz neposrednih opazovanj, izpeljejo se lahko iz drugih podatkovnih virov, lahko so inačica ali posredna izpeljava iz opazovanj, ali pa so pridobljeni iz različnih interpretacij podatkov (CEN/TC 287, 1995c). Uporabnik kljub sodobni tehnološki podpori ni sposoben zajeti in obdelati vseh možnih podatkov o opazovanih prostorskih pojavih. Rezultat je posploševanje oziroma izbor in absti,akcija samo tistih podatkov, ki so pomembni za določeno vrsto uporabe ali aplikacije. V postopkih zajemanja in urejanja prostorskih podatkov je navzoča pristranskost tistega, ki podatke zajema. Pomembni so tudi njegov osebni izbor, obravnava in interpretacija. a jasno razpoznavanje posameznih podatkovnih nizov mora biti na voljo dovolj metapodatkov. Obvezni del metapodatkov je tudi poročilo o kakovosti podatkov, ki mora vedno spremljati dejanske podatke pri standardnem prenosu. Kvaliteto prostorskih podatkov v poročilu ICA opredeljuje naslednjih sedem pomembnih elementov: o izvor podatkov (vir in tehnologija) o položajna natančnost (georeferenčna ali lokacijska) grafičnih podatkov o opisna natančnost (zanesljivost opisnih podatkov) o popolnost podatkov (podatkovni model in opisi) o logična usklajenost podatkov ( doslednost različnih povezav med geometričnimi ter opisnimi podatki) o semantična natančnost podatkov ( odnos med podatkovnim modelom ter stvarnostjo) o ažurnost podatkov (časovne značilnosti in sistem noveliranja). Določitev ali ocena vrednosti posameznih pokazateljev kvalitete se mora izvesti v skladu z izbrano metodologijo za testiranje kakovosti. Poročilo o kakovosti podatkov mora biti na voljo ne samo skupaj z dejanskimi prostorskimi podatki, temveč tudi neodvisno od samih podatkov. Tako lahko uporabniki predhodno ocenijo primernost podatkov pred njihovo uporabo oziroma nakupom. 4 OBRAVNAVA ELEMENTOV KVAU'fE'lfE PROSTORSKlH PODATKOV V naslednji preglednici so prikazani obravnavi pokazatelji kvalitete prostorskih podatkov v ameriškem nacionalnem standardu za prostorske podatke SDTS (Spatial Data Transfer Standard), v že omenjenem poročilu posebne komisije ICE in Geodetski vestnik 40 (1996) 3 1 predlogu standarda CEN tehničnega odbora TC 287 za Geografske informacije (CEN/TC 287, 1995b). Prikazan vrstni red izhaja iz izvornega vrstnega reda predloga ICE, ki je strokovno najbolj celovito opredeljen in predpostavlja obstoj sedmih ključnih elementov kakovosti podatkov. 1 . ' SDTS (1992) ICA (poročilo,1995) CENJTC 287 (1996) izvor podatkov izvor podatkov izvor podatkov in uporaba opisna natančnost opisna natančnost lematska natančnost natančnost opisnih podatkov natančnost opisnih podatkov natančnost opisnih podatkov popolnost podatkov popolnost podatkov popolnost podatkov logična usklajenost podatkov logična usklajenost podatkov logična usklajenost podatkov semantična natančnost podatkov ažumost podatkov časovna na/ančnost 5 CEN(fC 287 MODEL KAKOVOST[ PROSTORSKIH PODATKOV Predlog CEN/TC 287 temelji na tradicionalni triravenski arhitekturi kot podlagi za opisovanje različnih ravni podatkovne abstrakcije. Za opredelitev potrebnih shem se na konceptualni ravni uporablja formalni opisni jezik Express (ISO 10303-11 ). Shema vsebuje opis pomena, vsebine, sestave, odnosov in pravil v podatkovnem modelu. Predlog TC 287 za kakovostni model prostorskih podatkov je prikazan na sliki 2. Kvalitetni model je formalno opredeljen v kvalitetni podshemi. Ta je podlaga za oceno in določitev pokazateljev kvalitete, ki se predstavijo standardizirano v izkazu o kakovosti prostorskih podatkov. 5.1 Opredelitve osimvnih pojmov in razlaga Poreklo 5 je edini obvezni pokazatelj kvalitete prostorskih podatkov, ki opisujejo zgodovino geografskega podatkovnega niza ali podniza v smislu odgovornega proizvajalca, tehničnega opisa izvornih materialov in izvedenih obdelav. Uporaba6 se lahko uporabi za opis predhodne uporabe prostorskega podatkovnega niza ali podniza. Kakovostni parametri7 so kvantitativni pokazatelji kvalitete geografskega podatkovnega niza ali podniza. Predlog kakovostnega modela CEN/TC 287 vsebuje pet primarnih in en sekundarni parameter kvalitete, katerih opredelitve so naslednje: • pozicijska natančnost8 je primarni kakovostni parameter, ki prikazuje točnost geografskega položaja v geografskem podatkovnem nizu ali podnizu • tematska natančnost9 je primarni kakovostni parameter, ki prikazuje točnost opisov v geografskem podatkovnem nizu ali podnizu • časovna natančnost10 je primarni kakovostni parameter, ki prikazuje točnost časovnih zapisov v geografskem podatkovnem nizu ali podnizu • logična usklajenost11 je primarni kakovostni parameter, ki prikazuje stopnjo strukturne celovitosti določenega podatkovnega niza Geodetski vestnik 40 (1996) 3 o popolnost12 je primarni kakovostni parameter, ki prikazuje razliko med dejanskim podatkovnim nizom in njegovo opredelitvijo o zanesljivost besedila 13 je sekundarni kakovostni parameter, ki prikazuje pravilnost besedila v geografskem podatkovnem nizu ali podnizu. Metrika 14 je rezultat opisanega in datiranega preizkusa, ki ga tvori vrednost ali niz vrednosti opredeljenega podatkovnega tipa. 1eovaM