Strokovne razpravi-, Geokodirane velike baze podatkov Republike Slovenije Toma: B a novec Zavod RS za statistiko, Voiarski pol 12, 61000 Ljubljana 1. UVOD, ZGODOVINSKI PREGLED IN DANAŠNJE STANJE 1.1 Prejšnja Jugoslavija, statistika, evidence in uvod v geokodiranje s pomočjo statistike V prejšnji Jugoslaviji je bilo mogoče, da smo v Sloveniji, podobno kot nekateri deželni uradi za statistiko v Zvezni republiki Nemčiji in v drugih zveznih državah, izvrševali poleg obveznega programa statističnih raziskovanj, ki so imela pomen za vso bivšo Jugoslavijo, tudi lastna statistična raziskovanja in administrativne registracije, določene v slovenskem republiškem parlamentu. V prejšnji federaciji so statistični uradi in druge pooblaščene organizacije za zbiranja v tedanjih republikah letno izvajali povprečno okrog 300 naslovov raznih statističnih raziskovanj - Republika Slovenija pa je k temu dodala Še okrog 70 svojih naslovov in aktivnosti. Te slovenske aktivnosti so bile poleg novih raziskovanj predvsem v dopolnjevanju in povezovanju že obstoječih administrativnih registrov med seboj in hkrati v vertikalnem posploševanju nekaterih njihovih izbranih vsebin za statistične namene. V tem okviru je bilo in je še zelo pomembno sodelovanje med statističnim zavodom, geodetsko službo in nekaterimi drugimi informacijskimi službami, s katerimi poteka intenzivno sodelovanje skoraj 20 let. 1.2 Osnovni pristopi h geokodiranju Osnova za geokodiranje najpomembnejših entitet (opazovanih enot) in na njih vezanih podatkov (atributov) v Sloveniji je bila dana že leta 1973 s projektom "Prostorski informacijski sistem"(3) in drugimi raziskavami. Prišli smo do konceptualnih rešitev, ki smo jih praktično uresničevali skoraj 20 let. Praktične, taktične in strateške poteze smo vlekli na zelo različnih koncih v različnih časih in tudi v različnih institucijah, včasih namenoma tako, da nekateri niso vedeli kaj je končni cilj in kaj konkretno delajo. Boj za pristojnosti med resorji in institucijami se namreč vedno znova začenja in praviloma nikoli ni pokrit s kasnejšimi konkretnimi prispevki. V prejšnji Jugoslaviji in Sloveniji smo najprej imeli opisen, slabo kartografsko, a za statistične namene dovolj dobro teritorialno opredeljen statistični Register teritorialnih enot (SRTE), ki je temeljil na statističnem katastru. Enote tega katastra so bili kartirani obrisi popisnih in statističnih okolišev na otočni (vsak zase ločeno) način. SRTE pa je že imel precej zbranih socioekonomskih statističnih podatkov iz dveh prejšnjih popisov prebivalcev gospodinjstev, stanovanj in kmečkih gospodarstev (Popisi 1971 in 1961). Iz SRTE-ja smo razvili večnamenski Register območij teritorialnih enot (ROTE) in enotno evidenco hišnih številk (EHIS), kot tudi koordinatno geokodiranje izbranih nepremičnin s hišnimi številkami (KGHŠ), s čimer razpolagamo danes, Slovenija je torej v letu 1981 za popise prebivalstva, gospodinjstev, stanovanj in kmečkih gospodarstev dobila pomembno sredstvo za zbiranje in izkazovanje geolociranih podatkov tudi na evidenčni ravni za uporabo v administratvinih registracijah. V kasnejših letih, do 1991 pa še koordinatne opredelitve in digitalizirane obrise omenjenih administrativnih enot. 2. NEKATERI IZBRANI KRITERIJI ZA UVAJANJE GEOKODIRANJA V SLOVENIJI Ponovili bomo nekatere delovne kriterije postavljene v sedemdesetih letih, ob takrat še nerazviti računalniški tehnologiji. ■ Okrog 80 % zbranih podatkov vezanih na opazovane entitete za razne administrativne in tudi statistične namene, ima relevantno prostorsko referenco; pomeni, da je sam dogodek metodološko, vsebinsko in informativno dovolj pomemben, da je geokodiranje entitete, na katere se lahko vežejo podatki, tudi v fizičnem (geografskem, realnem) prostoru ekonomsko in drugače upravičeno. Torej je treba določiti vsaj geokodo tistim entitetam, ki "nosijo" že največ informatiziranih dogodkov in že priznano »porabo nanjo vezanih atributov (zbrani in zbirani ter uporabljeni atributi so kriterij za geokodiranje uporni* vi NFORMATIKA Strokovne razpravi-, entitete, katero opisujejo). m Podatkovna substanca "zemljiškega informacijskega sistema" in stroški za naložitev, vzdrževanje in vsebinske transformacije ter normalizacije, sestavljajo danes že do 80 % stroškov izgradnje delujočega administrativnega in forma tiziranega registra ali sistema. V letu 1973 pa so bila razmerja v ceni precej bolj v korist programske (software) in strojne opreme (hardware). Tedaj k sreči nismo mogli z digitalizacijami takoj frontalno in nekritično napasti vsega, kar je bilo takrat že narisano in kartir-ano ter že takrat slabo vzdrževano. I/, tega sledi - geokodiraj (digitaliziraj) predvsem tiste entitete, katerih skupna informatizacija je pomembna in uporabna še v drugih prostorih (sociološki, ekonomski, ekološki) in selektivno dodajaj nove fizične podatke na iste entitete, po potrebi in ne na zalogo. ■ Zbiranje in komplementiranje novih povezanih večnamenskih podatkovnih baz traja zelo dolgo, posebej pri zahtevanem integriranem zadovoljevanju več funkcij. Praviloma traja 8-10 let, da izgradimo katerikoli večji administrativni register, ki je tudi ustrezno geokodiran in v časovnih serijah ter po vsebini ustrezno harmoniziran z okoljem, ■ Določanje bodočih informacijskih potreb za 8 do 10 let v naprej je skoraj nemogoče. Zelo "komprehenzivnih" projektov naj bi zato ne izvajali. Dobra je strategija, ki jo poznamo kot l-'M/AM (FcasibUity Management /Automatic Mapping), ki dovolj dobro omogoča strateško ravnanje tudi zelo dologoročno. ■ Samo resnični, konkretni uporabniki podatkuv-analitiki in praktične administrativne racionalizacije v upravi omogočajo tudi narodno gospodarno uporabo in dolgoročno perspektivo takih integracij, naložitev in dodatnih kodiranj v raznih analitskih prostorih (Cost bene-fit)(l){8). ■ Vzdrževanje in večnamenska uporaba zbranih podatkov mora biti tudi v geokodiranih bazah vedno pripravljena za nove integracije in nove uporabe. Zahteve uporabe morajo nekoliko celo prehitevati sama zbiranja podatkov. Pri tem je važno dejstvo, da se večina splošnih zahtev po zadovoljevanju informacijskih potreb postopoma uresniči in prenese v izvajanje Centralnim zavodom za statistiko in drugim državnim zbiralcem podatkov. Iz tega sledi - geokodiraj predvsem žc nastavljene in uporabne baze podatkov in dodajaj samo nujno potrebne atribute, ki jih bodo uporabili tudi drugi. a Ce je slovenska državna statistika dolgoročno in srednjeročno orientirana na administrativne registre in podobne vire, na velike popise in tudi na indirektne tehnike zajemanja podatkov (satelitska teiedetekcija, prevzemanja podatkov iz delov kart, digitalni model reliefa in drugih virov), mora pri tem prevzeti del ustrezne koordinacije modela podatkov države. ■ V koordinaciji morajo biti istočasno že prisotna tudi medsebojna horizontalna povezovanja in integracije z raznimi administrativnimi registri, kar naj poteka stalno, koordinirano in praviloma spel narodno gospodarsko učinkovito. To pomeni, da je treba enitete iz celega modela podatkov geokodirati v realnem prostoru, so-ciokodirati v socialnem prostoru in podobno določiti položaj entitet v poslovnem prostoru. Tt prostori pomenijo predstave o stvareh in njihovem statusu, so analitski prostori in predstave in ne realnost sama, ■ Vse to vodi k odločitvi, da je Slovenija svojo informacijsko infrastrukturo ali svoj model podatkov gradila in uredila s pomočjo izgradnje zelo velikih, vertikalno in horizontalno povezanih kooperativnih baz podatkov in se bo tako ravnala tudi v bodoče. Različne registre nameravamo izgrajevati kot državne podlage ali državno infrastrukturo za splošno uporabo (sekundarne statistike) ob hkratni evropeizaciji (Eurostat) in njegovi globaliza-ciji v okviru ECE (Economic Commison for Europe) in CES-a (Conierence of European Stalisticians)(4)(9). 3. VLOGA CENTRALNEGA STATISTIČNEGA URADA Centralni statistični urad Republike Slovenije (sedaj Se Zavod Republike Slovenije za statistiko) je po osamosvojitvi Slovenije še naprej ostal koordinacijski organ za vse uradne državne statistične dejavnosti, s tem tudi za vse "površinsko pokrivajoče" (Flaechendeckende) evidence v Sloveniji predvsem zaradi njihovega pomena za vertikalno integracijo in statistična posploševanja. Velja zakonsko določilo (po starem še veljavnem in novem zakonu), po katerem morajo vsi, ki uvajajo neko novo zbiranje podatkov v državi in nove vsebine za njihove registre, to prijaviti Uradu in pridobiti njegovo strokovno mnenje v 30 dneh (4). Tako imamo v Sloveniji sicer blago statistično koordinacijo raznih baz tudi administrativnih baz podatkov, kar pospešuje tudi medsebojne horizontalne povezave med resornimi organizacijami in uporabniki teh podatkov, pri čemer Urad tudi pomembno sodeluje, Ta povezovanja, tako glede n3 iniciativo kot tudi na pomen in verjetno tudi znanje Urada se v bistvu ne odvijajo izven njegove vednosti in vpliva. Tako smo v Sloveniji praktično koordinirali in korakoma tudi precej integrirali najbolj važen del podatkovnega modela države tudi vertikalno, kar pa vsebuje tudi povezovanje entitet in dogodkov vezanih na njih i ç*™fnifll NFORM ATHÍA Strokovne razpravi-, v razne analitične prostore, kot so že omenjeni geopr-ostor, socioprostor, eko(loŠki)prostor in podobni analitični prostori. 4. INFRASTRUKTURA, KOOPERATIVNI ADMINISTRATIVNI REGISTRI, KI POVRŠINSKO POKRIVAJO SLOVENIJO, IN V NJIH SPREMLJANE OSNOVNE ENTITETE. V letu 1983 so bili s posebnim zakonom (DSI-Družbeni sistem informiranja), do tedaj že izgrajeni veliki slovenski osnovni registri, določeni kot obvezno integracijsko sredstvo za vse druge evidence, tako v javni rabi kot za zasebnike. Še pred tem pa so bili ti registri uvedeni ali vsaj koncipirani z drugimi metodološkimi predpisi in tudi na precej drugih področjih (4), Nekatere najbolj pomembne integracijske infrastrukturne administrativne registre na kratko opisujemo. 4.1. Centralni register prebivalcev Slovenije (CRP) Slovenski CRP temelji na enotni opredelitvi prebivalca s pomočjo EMŠO-ja (PIN-Person Identification Number) in je tekoče interaktivno vzdrževan od leta 1983, pri čemer so, kar zadeva prijavo in odjavo ter podobna stanja prebivalstva, odgovorni za vsebino uradi na občinski ravni. Osnovna - izvorna baza podatkov je vodena v matičnih službah v občini, ki prevzemajo tudi polno odgovornost za vsebine svojih zbiranj, kot tudi odgovornost za to, da Zavod s pomočjo centralnega registra prebivalstva, ki je samo praktična kopija teh matičnih registrov, dobi ustrezne, za statistiko pomembne atribute. CRP je eden od najpomembnejših integrirajočih administrativnih registrov, saj povezuje in integrira vse občinske registre, pa tudi tiste podatke o prebivalcih, za katere uporabo so pooblaščeni drugi organi (posameznika), ki vežejo na njih še druge atribute. Sedanji upravitelj CRP-ja je Urad, v zakonu (1993) pa se predvideva, da bo ta naloga prešla kasneje na pristojni organ za notranje zadeve in bo Zavod iz CRP-ja in drugih virov gradil za statističen namen svoj Statistični register prebivalstva Slovenije (SRPS). Drugi, zakonsko določeni "izvenobčinski" uporabniki teh - na osebo vezanih podatkov, ki imajo zakonsko utemeljen interes za podatke iz tega registra, za entitete v celem teritoriju Slovenije potrebujejo te osebne podatke za svoje delovne potrebe (Primer: lastniki vseh parcel v občini niso istočasno tudi prebivalci občine in ne registrirani kot prebivalci v občini). Torej je nujno, da se taki podatki izmenjujejo tudi medregionalno in v okviru države na enem mestu in preko CKP-ja. Centralni register prebivalstva vodi Urad interaktivno v centralnem računalniku državnih upravnih organov. Tudi mešanja raznih podatkov (datamatehing) z ostalimi infrastrukturnimi registri in delnimi registri vezani- mi na osnovno skupni stavek CRP-ja, ki jih je okrog 40, se v principu izvajajo interaktivno oz. tudi paketno preko tega velikega centralnega računalnika. Uporaba podatkov iz centralnega registra prebivalstva je izredno pestra. Tako je Urad del teh podatkov tudi predtiskal na približno 2 milijona popisnic za zajemanja podatkov iz Popisov 1991. Predtiskali smo ime, priimek, naslov (Post code). Obrazci so bili pripravljeni za optično čitanje z OCR tehnologijo. Vsak obrazec je imel tudi povezavo z geokodo iz EHIŠ. Vsi zbrani in obdelani podatki iz popisa so tako tudi geokodirani. Pomeni, da smo za statističen namen izvedene popise in njihove rezultate geo kodira It ali da smo ca 10 milionov DEM, kolikor je stal popis, tudi preko nekaterih entitet, istočasno računalniško naložili kot novo geokodirano bazo Republike Slovenije. Ta je kot agregatna baza komercialno že na na voljo tudi za nekoliko močnejši PC. Relativno dobra povezava CRP-ja z drugimi dobrimi na osebo vezanimi registri: vseh delojemalcev, vseh zdravstvenih zavarovancev in nekaterimi drugimi delnimi registri (do 40), praktično omogoča tudi geokodiranje teh podatkov. CRP je voden kot kooperativna baza podatkov, izmeni jiva in uporabna med več upravnimi organi, geokoda je samo eden od podatkov povezanih z njim. Podobno je z ostalimi registri, ki so tudi določeni z ustreznimi zakonskimi predpisi. Omejitve uporabe so določene z zakonom o varstvu osebnih podatkov, ki ga je Slovenija sprejela leta 1988 in ki je dovolj strog tudi za izmenjavo osebnih podatkov med upravnimi organi. Tako poteka neprofitna prodaja in izkazovanje podatkov v agregirani deindividualizira-ni obliki, za večino uporabnikov na ravni popisnega okoliša na PC-jih in delovnih postajah povezano tudi z drugimi registri in bazami podatkov. Za uporabo podrobneje geokodiranih osebnih podatkov je treba imeti posebno zakonsko pooblastilo. S pomočjo EMŠO-ja in kot delni registri so evidentirani tudi lastniki in uporabniki nepremičnin v zemljiškem katastru (s približno 6 milijonov enot) ter nekatere druge nepremičninske evidence, poleg tega pa so posamezne kategorije prebivalstva opremljene in povezane s tem registrom tudi na evidenčni ravni kot so npr. evidence študentov, evidence učencev, nekatere lastninske evidence, nekatere posebne zavarovalniške evidence, pokojninske in ostale evidence, zadeve okrog privatizacije in podobne. Na ta način lahko tudi Urad na osnovi teh evidenc in seveda EMŠO-ja dobiva tudi potrebne podatke za razne druge analize, kot sekundarni vir za svoje potrebe. Ocenjujemo, da je bilo konec leta 1992 v Sloveniji približno 40 takih delnih registrov, ki so uporabljali in so imeli pravico uporabljali osnovni podatkovni stavek iz centralnega registra prebivalstva, V principu je tako precejšen del podatkovnega modela neke države že urejen, posebej, ko so prebivalci kot entitete geokodirani glede na ijfjrrnl/iriJNFORM ATI KA Strokovne razpravi-, kraj bivanja in na kraj zaposlitve (4). Ker pa so ti administrativni registri povezani medsebojno in istočasno vzporedno preko najpomembnejših entitet tudi gc oko d i ran i, ali vsaj povezani s prostorom, lahko govorimo o so-cioekonomskem modelu podatkov, ki je tudi ustrezno prostorsko struktuiran in geokodiran na evidenčni ravni kot tudi za potrebe statističnih raziskovanj. Tako integrirane in povezane podatkovne baze omogočajo analitikom široko paleto novih možnosti za današnjo rabo in tudi precej novih obveznosti za bodoče. Določena težava pri identifikacijah in uvajanju EMŠO-ja za lastnike nepremičnin, predvsem v zemljiški knjigi ni tako povezana s samim problemom uporabe te številke, ki je zakonsko že omogočena, ampak je to povezano z organizacijskimi problemi v pristojnem organu za zemljiško knjigo. Vendar pa je velik uspeh že pri zemljiškem katastru in nekaterih drugih evidencah, kjer je 10 let trajajoče tudi ročno prenašanje EMŠO-ja v katastrski operat omogočilo sedanje enolične zveze l delujočim CRP-jem in podobno z Poslovnim registrom. Nekateri atributi vezani na entiteto - prebivalec, ne bodo nikoli ali zelo redko povezani na individualen način, ker smo že omenili, da imamo od leta 1988 v Sloveniji relativno strog zakon o varovanju podatkov. Tako je generalna zaščita osebnih podatkov že usklajena celo nekoliko prestrogo tudi z priporočili Evropskega sveta (4)(9). 4.2. Poslovni register Slovenije in IŠEPR (Identifikacijska številka enote v Poslovnem ie&1stru) v modelu podatkov Slovenije Poslovni register Slovenije (PRS) bo v kratkem z zakonom urejen, na novo evropeiziran in preurejen za potrebe tržne ureditve. Vendar ima že sedanja organizacija teh registracij v Sloveniji nekatere dobre vsebine in pristope bodočega PRS-ja. Trenutno je to ROS (ROS register organizacij in skupnosti in EKO), ki je tudi glavna podlaga vseh zasebnih ponudb za tako imenovane poslovne imenike v Sloveniji in ga sestavlja precej delnih registrov, ki imajo izvor v raznih resornih registracijskih virih. Tudi ta register je vzdrževan interaktivno, tekoče pokriva popolnoma ves slovenski teritorij in je ena od največjih kooperacijskih baz podatkov v Sloveniji. V prehodu na novo, posebej po sprejemu zakona o gospodarskih družbah, ki bo določil ekonomskim subjektom precej drugačne statuse, bomo imeli v prehodnem času še celo več virov. KOS je operativen od leta 1976. Nekatere registrirane skupine v ROS-u lahko navedemo: državna podjetja, dosedanja družbena podjetja v raznih oblikah, družinska podjetja, obratovalnice oz. članice enotnega registra obratovalnic, samostojni umetniki, davkoplačevalci posebej ter podobno. Poleg tega so v register vključene še številne druge pravne osebe, politične stranke, razna društva, prijavljeni sindikati, verjetno bodo v bodočnosti tudi samostojni poklici ter vsi davkoplačevalci iz dejavnosti. Novi fbslovni register Slo- venije bo harmoniziran z Evropo in priporočili CCE, ki bodo v letošnjem letu 1993 dokončno usklajene in bo prevzel kasneje tudi druge funkcije. Sedanji ROS je že sredstvo za zbiranje izredno velikih količin podatkov. V novo predlaganem nacionalnem programu statističnih raziskovanj bo za okrog 200 raziskovanj samo Urad uporabil naslove poročevalskih enot in s tem njihove geokode iz ROS-a in ERO-ja. V bodoče bo v PRS-ju registrirana vsaka družba ali zasebnik, ki bo izvajal katerokoli ekonomsko dejavnost in bo seveda istočasno tudi davkoplačevalec (VAT), Mogoče je, da bo vsaj identifikacija enote, če ne ves bodoči register kmetij, sestavina tega registra. Naš sedanji ROS je bil prej logični in tehnični del jugoslovanskega registra organizacij in skupnosti, ki pa ni bil tako široko definiran, ne tako voden in tudi ni zajel toliko entitet kot slovenski. Vsaka enota v tem poslovnem registru dobiva pri Uradu enolično matično številko in določene razvrstitve po ekonomskih aktivnostih, Sedanja, v letu 1993 zadnje leto veljavna enotna klasifikacija dejavnosti bo prevedena 1.1.1994 v novo Slovensko nacionalno klasifikacijo dejavnosti 93 (SNKD 93), ki bo temeljila na klasifikaciji ekonomskih dejavnosti Evropske skupnosti NACE Rev.l in ISCO-ju. Že sedaj je po zakonu o družbenem sistemu informiranja uporaba te identifikacijske številke obvezna, vendar je nekateri, dosedaj podjetniški sistemi kot so elektrogospodarstvo, PTT in drugi še niso uporabili kot svojo povezovalno številko. To zdaj spreminjamo. Tako bomo v bodoče lahko dobili s pomočjo takih medsebojnih povezovanj, torej IŠEPR (identifikacijske številke enote iz poslovnega registra) ali sedanje matične številke podjetja, ustrezne zelo pomembne količine podatkov za statistično posploševanje iz sekundarnih virov, ki bodo s tem tudi geokodirani. Tudi geodetske uprave so za zemljiške parcele, ki jih vodijo v svojih registrih, uvedle matično številko podjetja, podobno kot EMŠO-je /a fizičnega lastnika. Tako kot zasebno življenje tudi podjetniške aktivnosti potekajo praktično v stanovanjskih, industrijskih in poslovnih stavbah in so zato tudi vsa podjetja vezana na poštno kodno Številko (Post code), ki je kot rečeno za vse stavbe v državi ustrezno geokodirana. 4.3. Regjster teritorialnih enot (RTE) Slovenije, ROTE, EHIS in Centroidi. Nastanek RTE-ja s svojimi modernimi sestavinami ROTE-ja, EHIŠ-a in z izvedenim geokodiranjem s koordinatami (centroidi), smo načelno opisali v uvodnem poglavju. 4,3.1 Splošna načela V RTE-ju so poleg administrativnih teritorialnih enot enolično s šiframi določene vse ulice in hišne številke, ki enotno pokrivajo ves slovenski prostor. Razvite teoretične osnove in praksa so pomagale k dejstvu, da llfX mjbruA NFORM ATIKA Strokovne razpravi-, smo že v letu 1981 za popise imeli dovolj točno, čeprav samo kartografsko določene obrise statističnih ter drugih teritorialnih enot in tudi zelo dobro teritorializirane popisne obrazce. Osnova je bil metodološko usklajen preris in prekartiranje dotedanjih obrisov enot statističnega katastra v tedaj nove topografske karte 1: 25 000 in tudi zelo točno v karte 1:5 000 in 1:10 000 in deloma v foto-mozaike, kjer kart velikih razmerij šc ni bilo. Osnovni kriterij je bil, da stanovanjske stavbe, ki so bile prej predmet popisovanja (Cenzusi 71 in 61) ohranijo pri prekar-tiranju svojo pripadnost istemu statističnemu okolišu, ki je že 30 let določen kot nespremenljiva statistična teritorialna enota v državi. Temeljno sredstvo za oblikovanje geokodiranih baz podatkov pa je bilo geokodiranje teritorialnih enot in fizičnih objektov - entitet, spremljanih in informatiziranih že dotedaj za upravne in evidenčne naloge in za potrebe državne statistike, ki je že zbirala precej podatkov vezanih na njih. To so stavba, popisni okoliš, statistični okoliš, naselje, krajevna skupnost, katastrska občina, republika). Tako smo s praktično normalizacijo podatkov na isto geolocirano entiteto in s kartografiranjem statističnega katastra v KOTE in s tem s geolociranjem vsega kar spremlja statistike od lela 1963 v prostoru ohranili tudi demografske in podobne časovne vrste iz dotedanjih popisov. Princip izvedbe prehoda iz statističnega katastra na administrativni register (v RTE in ROTE z EHIŠ) je bil z vrha navzdol (From Top Down). Ta princip pa tudi pri drugih vertikalnih integracijah velikih baz podatkov ni nič posebnega. Ko Urad predlaga spremljanje in zajemanje za statistiko zanimivih znakov tudi v administrativnih in podobnih virih, je to običajen postopek. 4.3.2 Najbolj pomembni tehnični in vsebinski principi za izgradnjo registra in nastavitev teritorialnih enot Nekatere najpomembnejše principe, ki smo jih določili leta 1973, deloma pa dopolnili, navajamo v nadaljevanju. Vse stanovanjske, industrijske in poslovne stavbe dobijo v naravi ali na karti kot entiteta ali statistična enota: najmanj centroid, potem ime ulice ali naselja in tekočo Številko v ulici. Ti podatki so vodeni preko občinskih geodetskih upravnih organov, prevzeti in registrirani ter integrirani v republiški register teritorialnih enot. Največkrat te podatke dobivata Urad in Republiška geodetska uprava s pomočjo EDI {Electronic Data ln-terchhange) tehnik na disketah (6). Osnova za tekočo registracijo te geometrije slovenskega prostora so karti-rane stavbe v slovenskem "dookvirnem" sistemu kart (Rhamenkarte, System map) TTN {Temeljni Topografski Načrt) v razmerjih 1: 5000 in 1:10 000 in tudi drugi pomožni kartografski viri. Uporabljajo tudi fotoposnet-ke in druge kartografske podlage. Slovenijo večnamensko ciklično slikajo iz zraka z višine približno 4 000 m. Vsakih pet let je bila slikana v celoti, sedaj pa bolj na redko, ker že uporabljamo za fotointerpretacijo tudi satelitsko teledetekcijo. Eksperimenti z novim sredstvom GPS (Global Fbsi-tioneering System) so se pri terenskem geolociranju posamičnega objekta (zgradba) izkazali kot zelo ustrezni. 4.3,3. Kako je stanovanjska ali poslovna stavba identificirana in registrirana v RTE-ju? Vsak hišni lastnik dobi za svojo posamično stavbo (458.563 stanje 1.12.1992) ob registraciji nove stavbe ali ob spremembi njenega statusa formular, s katerim uvede tudi osnovne podatke za ta register. Lega same stavbe v eni od 6 milijonov zemljiških parcel sicer avtomatiziranega operata zemljiškega katastra je samo eno od takih registracijskih možnosti. Pristojna geodetska uprava mu določi osnovne identifikacije, jih registrira in pošlje inform a tizi rane naprej v centralno republiško bazo podatkov KTE-ja in EHIŠ-a, Stavba torej dobi sledeče posebne znake, pomembne za RTE in gekoding (stanje 31.12.1992): a/ centroid - X in V koordinate za vsako zgradbo od že omenjenih 458.563; b/ naslov ulice ali naslov naselja {9.098 uličnih imen v Sloveniji v celoti) C/ tekočo hišno številko za vsako od stavb hiš v Sloveniji (EHIŠ); d/ pripadnost katastrski parceli in katastrski občini, ki jih imamo 2.695 v Sloveniji; e/ podatek o registrskem uradu ali matični okoliš, v katerem se registrira prebivalstvo (262 enot skupaj); f/ pripadnost popisnemu okolišu ali najbolj dinamični statistični in teritorialni enoti {14.330 v Sloveniji, december 1992); g/ pripadnost statističnemu okolišu (8.015 zelo stabilnih statističnih teritoriianili enot v Sloveniji); h/ pripadnost naselju {5.943 v Sloveniji); i/ pripadnost krajevni skupnosti (1202 v Sloveniji); j/ pripadnost občini (65 v Sloveniji). Zelo važno je, da ima vsaka enota od a do j svoj lastni centroid z X in Y državnimi koordinatami. Vse imajo v okviru ROTE-ja določene zelo točne obrise svojih območij, ki so že vsi digitalizirani iz istih kartnih osnov (TTN-5 in TTN-10) (Temeljni topografski načrt 1:5 000 in 1:10 000). S približno 3 metri pozicijske točnosti za koordinatno opredelitev centroida je tudi lokacija stavbe določena dovolj dobro, Centroid kot fiktivna točka mora ležati v tlorisu stavbe, kar je metodološka obveznost (2) {6). 4.3.4 Centroidi so istočasno govoreča šifra (geopozicija s koordinatami) in identifikacija posamezne teritorialne enote in vseh nepremičninskih enot v modelu podatkov Republike Slovenije. Natančnejša geokodiranja s pomočjo centroida niso naš končni cilj, vendar naj bi v entitetnem modelu na logični uporabi idlNFORM ATtKA Strokovne razpravi-, ravni kot na identifikacijo nepremičnine, nanj vezali svoje podatke geodeti, statistiki in drugi, ki sedaj potrebujejo ustrezno lokacijo in tudi identifikacijo posamezne nepremičninske enote. Centroid zaenkrat zadovoljuje v glavnem vse statistične in tudi nekatere druge na statistiko naslonjene funkcije. (1) (2). Kot je EMŠO (PIN) v socialnem prostoru, IŠPR (INUBP-Identication Number of Unit in Business Register) v poslovnem prostoru, je centroid lahko sedaj govoreča identikacija nepremičninske ali podobne administrativne teritorialne enoie (INE). že 20 let star koncept oziroma model dovoljuje uporabo decentralizirane in nepovezane tehnologije za zajemanje podatkov in določanje identifikacij, ker delo z nepremičninami ne prenese in ne zahteva centralnega podeljevanja enoličnih identifikacij, kot je to slučaj in obveza pri podeljevanju EMŠO-ja in IŠPR-ju. Identifikacije določene z X in Y lahko določamo tudi "ročno" na terenu, iz ustreznih kartografskih in podobni!) podlag, vse še brez takojšnje povezave s centralno bazo, ker jih lahko zaradi izrazite govorice kasneje enostavno integriramo. To je zelo pomembno za decentralizirano vzdrževanje in nastavljanje RTE - ja, v katerem opravijo skupaj geodetski in drugi strokovnjaki okrog 60.000 sprememb na leto, Centroid bo poleg identifikacijske funkcije postal eden od pomembnih atributov v RTE-ju, ali bodočem RNERS (Register nepremičninskih enot Republike Slovenije), prevzel bo podobno vlogo kot EMŠO v v socioprostoru (3). Predlagam, da naj bi ta prehod izvršili v letu 1993, ko bodo popisi iz leta 1991 dokončno obdelani, preden bomo določili osnovni entitetni model za nova registra stanovanj in kmetij in preden bomo v Republiki prešli na novo upravno in teritorialno ureditev (iz 65 sedanjih velikih na okrog 250 malih evropeiziranih občin). 5. MODEL PODATKOV REPUBLIKE SLOVENIJE IN LOKACIJA V GEOPROSTORU 5.1 Prvi računalniško podprti poskusi z uvajanjem cen-troida v zemljiški kataster Vidimo, da je naš model podatkov odprt in ustrezno omogoča integracijo statističnih ter evidenčnih funkcij. Projekti v letu 1973 so že dokazali možnost prenosa, saj smo z preprostimi računalniškimi sredstvi prenašali nekatere podatke s pomočjo lokacije - centroida vsake zemljiške parcele v katastrski občini DOB - občina Domžale. Takrat smo smo za vsako od parcel v tej katastrski občini lahko pridobili iz različnih gekodiranih virov precej novih podatkov - računalniško s pomočjo določanja lokacije centroida v drugih kartah. Seveda so bili pridobljeni podatki informativni, ker so nekateri "layerji" tudi opredeljeni informativno in so tudi podatki iz njih lahko uporabljeni predvsem za statistično in informativno posploševanje. V katastrski občini Dob smo tako pridobili za centroid posamezne parcele, površino, kulturo, naslov lastnika, katastrski razred in vse druge netopografske elemente iz osnovnega katastrskega operata. Z uporabo centroida za vsako od parcel in "presekovanjem" njegove koordinatne lokacije z drugimi datotekami, ki so bile tudi digitalizirane, smo pridobiti se druge dodatne informativne podatke za vsako parcelo.{2). To so bili zlasti podatki: (i) ocena nadmorske višine lege centroida te parcele s pomočjo preboda centroida s takratnim digitalnim modelom reliefa 100 x 100(DMR 100); (ii) približno oceno nagnjenosti pobočja, na katerem leži centroid oziroma parcela v procentih tudi iz DMR 100; (iii) oceno sončne ekspozicije oz, energetskega potenciala pobočja in konkretnega zemljišča iz DMR 100, (iv) pedo-ekološki podatek iz karte 1:20.000, ki je bila za ta namen tudi na novo digitalizirana. če ne drugače lahko sedaj izračunamo samo iz popisa s podobno informativno točnostjo distribucije stavb in njihovih prebivalcev po nadmorskih višinah za Slovenijo, regijo, občino ali katerokoli drugo enotofod b do h). Izračun nagnjenosti teh bivalnih enot na pobočjih omogoča določanje osončenja stavb in bivalnih enot in podobno. S prevzetimi podatki iz tekoče vzdrževanega CRP-ja, fcRO-ja jn drugh evidenc lahko spremljamo prostorsko dinamiko prebivalstva in zaposlenih, rojstva in smrti ter podobna statistična raziskovanja. Danes takim podatkom ne rečemo več datoteka, ampak "layer". Leta 1973 in kasneje smo seveda uporabili druge izraze (ravnine, režimi, tematski objekti po profesorju Imhoffu in podobno). Ocene o tem, koliko digitaliziranih obrisov tlorisov parcel imamo v Sloveniji in koliko je evidenčno uporabnih, pa ta hip ne moremo dati. Geo-pozicioniranje in identifikacija stavb s centroid i je bilo za Slovenijo tehnično in vsebinsko popolnoma smiselno, zato predlagamo podoben postopek za vse druge skupine nepremičnin, zlasti za 6 milionov zemljiških parcel v izredno razdrobljeni zemljiški strukturi naše države. V Sloveniji je sedaj se prisotna zelo nevarna "eufor-ija" popolne izgradnje celovitih GIS-ov (Geographical Information System) z digitalizacijami in vektorizac i jami vsega kar je na kartah predstavljeno. Predvsem pa bi radi nekateri dokončno digitalizirali vse obrise zemljiških parcel, ki pa so bile največkrat kar ti rane pred 150 in več leti v grafični izmeri in v razmerju 1:2880. Druge ekipe nameravajo digitalizirati in vektorizirati karte TTN-a, ki so stare skoraj dvajset let in razen po otokih praviloma ne vzdrževane. Nehomogenost katastrskih map (1:2880) in slabo vzdrževanje kartiranih elementov v teh kartah (TTN) je se vedno osnovni problem in so seveda tudi stroški za tako drage digitalizacije pri tem neupravičeni (4)(5). ¡qx mbruA NFOR M ATI KA Strokovne razpravi-, Centroid kot identifikacijsko sredstvo in govorečo šifro lahko uporabimo za identifikacijo vseh nepremičninskih enot dovolj točno za večino statističnih in tudi evidenčnih namenov. To si lahko privoščimo poceni, ne da bi takoj popolno digitalizirali vse, tudi ne vzdrževane, slabo urejene in nepregledne katastrske mape in druge podlage (predstave). Stroški za tak namen so enormni in uporabnik, četudi je pripravljen to nastavitev plačati, večinoma kasneje ni sposoben vzdrževanja in tega kar ima tudi uporabiti ne (i,8). Uporaba velikih količin tako povezanih podatkov na določeno nepremičnino še ni dovolj razvita ne na evidenčni in ne na analitični ravni. Življenje se odvija predvsem in zlasti v vseh vrstah zgradb ali bolje stavb in njegova informatizacija je potrebna prav tu, 'ludi vsi sedanji administrativni registri in statistične rabe so prevzemali vsaj naslove stavb, tako da so bila statistična raziskovanja že praktično spuščena na raven evidenc. Torej so že dolgo orientirana: ■ ali na osebo (EMŠO - PIN); ■ ali na stavbo (EHIŠ - Centroid); ■ ali na takoimenovano podjetniško osebo (matična številka iz ROS- in ERO-ja). Veliko bolje je, da s pomočjo preprostega opisanega geokodinga stavb in podobnih nepremičninskih enot v Sloveniji pridobimo možnosti prenosa v prostor - na centroide stavb množico večnamensko in tekoče zbirariih podatkov ali odgovore na okrog 100 popisnih vprašanj (Izpisi 91), kot da /.a nepremičnino digitaliziramo sporne in slabe obrise in tako zapravimo ves čas in sredstva za pridobitev nekega zelo specializiranega in celo spornega podatka samo za evidenčni namen (2). Če potreba za točno določenim in digitaliziranim ter vektoriziranim obrisom realno obstaja, pa lahko posamičen točno opredeljen obris priključimo konkretnemu cenfroidu (INERS-u) podobno kot vsak drug atribut v kateremkoli administrativnem registru. Tako kot poklic dodamo EMŠO-ju, če ga oseba ima in je za nas pomemben ali izvozni podatek konkretnemu ISPR-ju - podjetju, če je podatek pomemben in potreben. 6. KAJ NAJ BI STORILI DO KONCA STOLETJA? Verjamemo, da so naše evidenčne in statistične strategije in taktike dovolj razvidne iz tega prispevka. Kaj je pomembno? To, da še naprej gojimo in razvijamo tak model podatkov Republike Slovenije, kot je opisan, in ga pripravimo predvsem za širšo analitično uporabo. Bodoči popis prebivalstva, stanovanj, gospodinjstev in kmečkih gospodarstev leta 2001 bomo izvajali čimveč iz harmoniziranih in evropeiziranih adminstrativnih registrov, tako da bodo: (i)prenosi velikih mas podatkov med analitičnimi prostori logično in vsebinsko možni, (ii) da bodo informacijske tehnologije tega sposobne (te nas vedno prehitevajo), (iii)da bomo s temi sredstvi podprli tudi razne nove naloge povezane s povezovanjem Slovenije v Evropske ureditve in (iv)da bo mogoč prevzem svetovnih standardov. Omenimo še nekaj konkretnih slovenskih problemov. Kako preiti iz 65 sedanjih občin v novih 250 ali več novih lokalnih samoupravnih skupnosti in ohraniti ter pripraviti sedanje velike baze podatkov za novo razdelitev in med nove upravlja tce. Na sploh pa je treba omeniti znane "preddigitalne probleme", ki so prisotni tudi v Sloveniji in to so: ■ Nerazumevanje med eksperti in analitiki, nerazumevanja med njihovimi strokami, razlike v definicijah, drugačne terminologije, razlike v znanjih in motivih, premalo skupnih /.nanj, ■ Drugi problem so težave s tekočim vzdrževanjem teh velikih baz podatkov (karte kot baze podatkov v Sloveniji so tu lep primer). ■ Tretji zelo pomemben problem je pomanjkanje analitičnih metod in sredstev, kriza analitskih metod kot so: ekonometrija, sociometrija in "geometrija", ki bi z boljšo uporabo povratno vplivale na vsebine baz podatkov (8,10). Varovanje in razvoj tega modela podatkov sestavljenih iz večnamenskih baz podatkov in njihovih kombinacij je za Slovenijo zelo pomembno. Nujno je v tem modelu povezovati in zadovoljevati hkrati tako evidenčne kot statistične namene. Geo-prostor v tej filozofiji in modelu je samo eden od mnogih analitičnih in relativno najmanj abstraktnih prostorov. Se vedno pa je lo samo predstava {ali iluzija) o statusu pojavov, ki so deležni velikih vsebinskih redukcij. Analitiku, splošnemu uporabniku in predvsem laiku je predstava v tem prostoru Še bolj nevarna, ker je ta prostor navidezno lažje predstavljiv in razumljiv, saj ga lahko gledamo in spremljamo v kartah, barvah in tudi mul ti medijsko. Oblika tako lahko zamenja vsebino. Tu je realna nevarnost za manipuliranje povezana z nevarnostjo, da se odvadimo bolj abstraktnih načinov analize in sinteze. Entitetni model, kot jedro celega modela podatkov, mora postati sestavni del normiranja in standardizacije na državni ravni in mednarodno. Zelo pomembno vlogo pri tem ima tudi danes in v bodoče Zavod Republike Slovenije za statistiko z vsemi sodelujočimi uradi in pooblaščenimi organizacijami, ker mora Slovenija ves svoj model podatkov v dveh do treh letih tudi ustrezno evropeizirati, vsaj s statističnega, če ne z vidika samih administrativnih evidenc (4). Evropeizacija tehničnih osnov gekodiranih evidenc se bo srečala s projektom MEGRJN (Multi-purpose European Ground Related Information Network) cbarwins- i <7* mil* intNFORM ATI KA Strokovne razpravi-, ki 1991>, v okviru CERCO-ja (Comité Européen des Responsables de la Cartographie Officielle). Evropeizadja statistike pa se bo srečala najmanj z NUTS-om, Eurosta- tovimi in ECE standardi. Te pogoje pa lahko Slovenija ob primerni koordinaciji in racionalizacijah nepotrebnih aktivnosti relativno hitro izpolni. 6. LITERATURA 1. Ranovcc Toma/, "Zasnova Študije; o prostorskih informacijskih sistemih", InätitutGZSRS, Ho str. Elaborat, Ljubljana 1971. 2. lin novec TomaŽ "Lokacija informacij in prostorski prenos informacij", Kartographie in Raumplan nuns, Ljubljana-November 1973, Referat C L-1, 18 Seiten; 3. Banovec Tomaž "Prenos informacija preko lokuciju - primjer u potrebe u katastru zemljiSta", Kongresspub! i kation der GIG Bf^d.-1972, s.275-29! 4. Banovec Tomaž "Statistike, evidence, model podatkov, koordinacija evidenc v Sloveniji", Konzept für den Aushau der Evidenzen und statistischen Forschungen in Slowenien" Dokument Tür die Rcgiereung, 1990, Iii Seiten. 5. Bregenzcr W and Kaufmann]. "Gis in the Swiss Cantons, a Gase Study" 1991-April, 25 Seiten; Vortrag an GlS-Seminar, St.Paul D-Vcnce f>. PIG Symposium "Environment and land Information" FIG Symposium, Innsbruck Geodäten Tag 9L Witwer, 1991,355 Seiten. 7. Geo Data institute "The CIS Survival Guide" En introduction for first-time GIS users and huvers who need more than a trade leaflet bur less than 3 textbook". Produced for IBM 22 pages, Separat, 199Ü 8. Eden Roger "GIS Gost Benefit Ana lysis-Problem and Solutions" Lugica April 1991, Vortrag an GIS Seminar.St.Paul D-Vence 9. Jensen Poul Tbwards a register based statistical system - sam Danish experience" Stat.Jornal of UN, Vol.1, No 3, March 1989, p 341-365; 10. Kainz Wolfgang "BegnefbeStimmungen,"Definitionen, Datenarten, Datenmodelle, Raeumliche Relationen, raumbezojiene Datenstrukturen" Institut fur Geographie-Ilniversitact, Wien, SAG IT-1lJ90 IL Petkoväek and all. "Relief Slovenije v digitalni obliki" (Relief der Republik Slowenien tri digitaler Form), Inst.GZ SRS. Elabnrat, Lj.Januar 1972; 12. iC$0 in RGII) "Computer Atlas der Gemeinde Sežana" mit 25 rechnerteehmsch generierten mehrfarbigen thematischen Karten-auf der Grundlage der Volks/ach lung Sloweniens 1981. Ljubljana 1984. upombnd NFORM AT1KA