REŠITVE KLASJE Strežnik za statistične KLASIFIKACIJE Sandi temažar, Oracle Software d.o.o., WTC. Dunajska 156, Ljubljana scemazar@si.oracle.com Lovro Munda, SRC.SI d.o.o.. Tržaška 116, Ljubljana [ovra,munda@link.si Jožica Kiep, Tatjana Šeremet, Andreja Ve se I, Statistični urad Republike Slovenije, Vo fars k i pot 12. Ljubljana joza.klep@gov.$i, tatjana.seremet@gov.si, andreja.vesef@gov.si Izvleček V članku so predstavljene temeljne predpostavke, izrazi in definicije ter funkcije strežnika za statistične klasifikacije. Nova programska rešitev osrednje zbirke statističnih klasifikacij je bila izdelana v okviru Programa posodobitve državne statistike. Rešitev, ki smo jo razvili na SURS, je zasnovana na dveh modelih - New Zealand Statistics Classifications and Related Standards System (CARS) in na modelu, kot smo ga povzeli po ISO/IEC 11179 Information technology -Specification and standardisation of data elements. Abstract The paper describes basic assumptions, terms, definitions and functioning of the classification server which was def/ned as a pari of development programme of government statistics. The solution is based on New Zealand Statistics Classifications and Related Standards System (CARS) and on the model, described in ISO/IEC 11179 Information technology • Specification and standardisation of data elements. Uvod Ena od nalog Statističnega urada Republike Slovenije je ludi oblikovanje in vzdrževanje različnih klasifikacij, ki se uporabljajo za potrebe statističnih obdelav, pa tudi v poslovnem svetu. Take klasifikacije so, na primer, Standardna klasifikacija dejavnosti, Standardna klasifikacija poklicev, Klasifikacija gradbenih objektov, Nomenklatura Industrijskih proizvodov, itd. Klasifikacije se sčasoma dopolnjujejo in spreminjajo, kar zahteva na eni strant skrb za organizirano oblikovanje in uveljavljanje novih verzij ter arhiviranje starih, na drugi strani pa je potrebno zagotoviti primerljivost rezultatov statističnih obdelav v daljšem obdobju, v katerem so bile veljavne različne verzije klasifikacije. Avtorji verjamemo, da je obravnavanje klasifikacij lahko problematično pri gradnji podatkovnih skladišč, zato smo pripravili prikaz rešitve, ki smo jo zgradili. Na pomembnost obravnavanja šifer v svoji knjigi Opozarja tudi Kimball, ki pravi, da moramo za vsako Šifro vedeti njen pomen1. 1. Izrazi in definicije V nadaljevanju bomo na kratko predstavili uporabljene izraze in njihove definicije (slika 1). 102 upombi «I NFORM ATIKA Klasifikacija Klasifikacija je niz povezanih kategorij, ki se uporabljajo za razvrščanje podatkov. Klasifikacija je lahko: standardna, nestandardna ali neodvisna. Raven Raven je v klasifikaciji niz kategorij, s katerimi opazovano populacijo lahko razvrstimo do zahtevanih podrobnosti. Vsaka klasifikacija ima vsaj eno raven. Kavni imajo lahko različna imena (nazive), na primer: področje, oddelek, skupina, razred, itd. Verzija Verzija klasifikacije je niz kategorij klasifikacije, ki se uporablja, oz. je na razpolago v določenem časovnem intervalu, O novi verziji govorimo, ko se spremenijo kategorije. Lastnik klasifikacije lahko odloči, ali bo oblikoval novo verzijo klasifikacije kot prvo verzijo nove klasifikacije. Spremembe kategorij, ki vplivajo na število ravni in na vzorec klasifikacije, se morajo obvezno odraziti kot oblikovanje prve verzije nove klasifikacije. 2000 -Številka 2 -letnik VIII S. Čemažar, L. Munda, J. KI ep. T. Šeremet, A. Vesel: KLASJE, Strežnik za statistične klasifikacije Diggram iiruov in definicij Generični izraz v o ti v i ru CADOS a Kiuifikjuij» Cluiificition of f'pdntrifs (NZSCC) Lastnik - C & S ' .Status s pre [C t osti- Sljikiaidii j ^"Generični izraz - Ekcmoms Vzorec ravni - 1233 V/Acec rov ni dotoi»; • prowlit vrljavnaiti iifer • primlj i/.ka/oi .ulji • nadrejene runi pri Vmmi kutegorij Začetek veljavnosti (VII 01 01.1995 Kategoriji) (t «buje Šifro. denkriplnr. ttundaritnu oznak o...) 2101 2107 Occam» and Amanita Australia New South Wales Victona Nc« Zealand New Zealand includes Ross Dependency Europe &. the former USSR The United Kingdom ;uid Ireland F.ngland Ireland ! 2Í Eastern Europe Ü5Ü1-- Bulgaria "CScfiosTovatia Začetek veljavnosti Czech Republic 2507 Slovakia Rwlikt med VI in V2. Tudi osnova za izdelavo pretvornika med verzijama Slika 1: KLASJE, dciagram izrazov in definicij Izraz verzija se nanaša na časovno obdobje, v katerem je prišlo do zaporednih ažuriranj ali revizij standardnih, nestandardnih ali neodvisnih klasifikacij. Vsaka klasifikacija se praviloma začne s prvo verzijo, ki se postopoma, v nekem časovnem obdobju, razvije v zaporedne verzije. Vsaka verzija klasifikacije ima določen datum, od katerega velja. Na primer, prva verzija Klasifikacije gradbenih objektov velja od 1, 1.199«. V določenem Časovnem obdobju bomo imeli vrsto verzij, vendar bo imela vsaka svoj, določen datum, od katerega velja. Veljavna verzija je običajno tudi zadnja verzija izbrane klasifikacije. Podatki so praviloma šifrirani skladno z veljavno verzijo. Kategorija Kategorija je del populacije statističnih enot, razdeljenih skladno z izbranimi opazovanimi lastnostmi teh enot. 2000 - številka 2 - letnik VIII iipombitd NFO-RM AT I KA S. Čemažar, L. Munda, J. KI ep. T. Šeremet, A. Vesel: KLASJE, Strežnik za statistične klasifikacije "Šifra" je simbol /a kategorijo, ki omogoča lažje shranjevanje in priklic. "Deskriptor" razlaga in določa pomen kategorije v tekstualni obliki. "Oznaka" je okrajšava deskriptorja. Standardna oznaka ne presega 40 znakov in se predvsem pri standardnih klasifikacijah uporablja kol orodje za zagotavljanje enotnega izrazja pri izdelavi rezultatov raziskovanj (izpisov) in izkazovanju podatkov. "Formalna vključitev" je postavka v obliki besedila, ki se v povezavi z deskriptorjem v nekaterih verzijah klasifikacij uporablja za natančne] i o opredelitev ključnega zajetja kategorije. Na primer: v Klasifikaciji gradbenih objektov (1999) kategorija Lokalni cevovodi za dobavo vode pokriva tudi: lokalne cevovode za dovod vroče vode, pare ali stisnjenega zraka ter vodne stolpe, zajetja, vodnjake in hidrante. Pretvornik Pretvornik določa prevajanje kategorij iz izvorne verzije klasifikacije v ciljno verzijo klasifikacije z uporabo določenega postopka ali kriterija. Pretvarjamo lahko med različnimi verzijami iste klasifikacije ali med verzijami različnih klasifikacij. Vsak pretvornik ima pare kategorij. Vsak par kategorij povezuje kategorijo izvorne verzije s kategorijo ciljne verzije klasifikacije. Enostaven pretvornik je pretvornik, ki vsebuje samo povezave ena proti ena in mnogo proti ena. V tem primeru podatke lahko neposredno pretvorimo iz ene verzije klasifikacije v drugo. Če pretvornik ni enostaven (če vsebuje povezave ena proti mnogo) potrebujemo pretvorno orodje, ki je lahko v numerični obliki (na primer odstotki). V tem primeru lahko razdelimo podatke, razvrščene v "eno" kategorijo ene verzije klasifikacije na "mnogo" kategorij ciljne verzije. Kodirni seznam Kodirni seznam je seznam verjetnih odgovorov na določeno vprašanje v raziskovanju. Kodirni seznam vsebuje deskriptorje in formalne vključitve izbrane verzije klasifikacije ter njihove sinonime. 2. Model podatkov Kot smo opisali, nastopa v sistemu klasifikacij množica entitet, ki so medsebojno relacijsko odvisne. Vse relacije so enolično določene. V nadaljevanju so opisane osnovne entitete in relacije med njimi (slika 2). Osnovni element klasifikacije je kategorija, ki nosi informacijo npr. o posamezni dejavnosti, poklicu, Soli... Vsako kategorijo je možno bolj detajlno opisati s poljubno mnogo vključitvami in izključitvami. Kategorije so organizirane v drevesno hierarhijo, ki ima poljubno mnogo ravni. Vsaka raven ima svoje ime. Šifre kategorij so sestavljene po vzorcu, ki je enolično določen za vsako posamezno raven. Ker se klasifikacije sčasoma spreminjajo, ohranjati pa jc potrebno vsa posamezna stanja, je uvedena tudi verzija klasifikacije kot posebna entiteta. Da bi bile verzije iste klasifikacije med seboj primerljive, so uvedeni pretvorniki, ki opisujejo pravila preslikave posameznih kategorij v različnih verzijah. Pri oblikovanju modela podatkov smo sledili ugotovljenim relacijam, ki na koncu vedno opredeljujejo odnos nadrejeni-podrejeni. Vendar obstaja v praksi tudi izjema - klasifikacija je lahko na poljubni vmesni ravni brez kategorije, kar ruši hierarhijo. Na taki ravni smo uvedli umetno kategorijo s predpisano šifro, ki je v predstavitvenem modelu ne prikazujemo. CA DOS KLASIFIKACIJA GENERIČNI UIRA2I GENERIC M I2HAZI KLASIFIKACIJA . L.fr KLASIFIKACIJA HAVL.N KLASIFIKACIJE VtRZUA KLASIFIKACIJE £ VER2UA KLASIFIKACIJE h* i* KATEGORIJE VERiU KLASIFIKACIJ CNOTA ME H L VKLJUČITVE tu INSTITUCIJA J KLASIFIKACIJA INSTITUCIJA ZASUTA PODATKOV ■SIFIKACIJA . _ 1MSItTuclJ„ . ; STITUCIJA ^ ! UPORABNIŠKA SKUPINA SKUPINE UPORABNIK — ^UPORABNliTj ppETVomm fj PARI KATE GOR L! PRETVORNIK 4— Slika 2: Shematični prikaz kljuČniti entitet 3. Postopki procesa V procesu obdelave klasifikacije se lahko pojavlja množica postopkov, ki jih izdelana računalniška rešitev podpira. Obstoječo verzijo klasifikacije lahko kopiramo v novo verzijo ali celo v novo klasifikacijo. Kategorijam klasifikacije lahko spreminjamo posamezne lastnosti. Kategorije lahko dodajamo ali brišemo, seveda v takem zaporedju, ki ne ruši hierarhije. Do popolnoma nove klasifikacije je možno priti na več načinov. Lahko jo kreiramo od začetka, določimo ravni in vzorec šifer kategorij, nato pa vpisujemo kategorije 104 iipombi id NFO R M ATIKA 2000 - Številka 2 - letnik VIII S. Čemažar, L. Munda, J. KI ep. T. Šeremet, A. Vesel: KLASJE, Strežnik za statistične klasifikacije na posamezne ravni. Če klasifikacija že obstaja v kakršnikoli obliki, ki se da pretvoriti v tekstovni računalniški zapis, jo lahko polnimo v sistem preko univerzalnega postopka polnjenja. S tem postopkom lahko tudi zgolj dopolnimo že obstoječo klasifikacijo s podatki, vpisanimi v zunanjem viru. Vsaka verzija klasifikacije ima svoj življenjski cikel, sestavljen iz posameznih stanj. Glavna stanja so: kreiranje, preverjanje, objavljanje, umik v popravljanje in opustitev. V danem trenutku je lahko objavljena in veljavna le ena verzija klasifikacijo. Za vsako stanje je predpisano, kdo od uporabnikov ima dostop do klasifikacije in kaj lahko z njo počne. 4. Načrtovanje in izbira tehnologije Pri načrtovanju računalniško podprtega sistema je bil prvi cilj izdelati univerzalen sistem za hranjenje in obdelavo vseh klasifikacij, ki bo zajemal vse specifičnosti posameznih klasifikacij. Sistem mora zagotavljati konsistentnost podatkov, omogočati mora le dovoljene postopke za posamezno stanje življenjskega cikla, posameznim uporabnikom pa dovoljevati le postopke, ki so jim dovoljeni, kar vključuje vpogled, spreminjanje in kreiranje klasifikacij. Sistem naj bo odprt in dostopen drugim sistemom, npr. statističnim obdelavam. Aplikacija mora biti dokumentirana in razvita z orodjem, ki omogoča nadgrajevanje in skupinsko delo. Za hranjenje, vnos in obdelavo podatkov je bila izbrana tehnologija podjetja Oracle, ki se je v praksi že mnogokrat dokazala kot zanesljiva in robustna tehnologija na področju kompleksnih informacijskih sistemov. Oraciova baza podatkov omogoča varno hranjenje podatkov in zagotavlja konsistentnost le-teh, orodja za razvoj aplikacij pa omogočajo hiter razvoj aplikativnih rešitev. Za prczentacijski model je bil izbran Microsoft Access / dostopanjem do Oraclove baze preko ODBC2. MS Access je tudi standardno in razširjeno orodje na Statističnem uradu RS in omogoča izdelavo preglednih vpoglednih modulov. Objekt no-relacijska baza podatkov Oracle8i'1 omogoča izdelavo rešitev opisanih zahtev. Tako smo pri oblikovanju aplikacije največ aplikacijske logike in pravil namestili neposredno v bazo podatkov v obliki referenčnih omejitev (eon-straints), prožilcev (triggers) in procedur, funkcij ter paketov (stored procedure s). Prednost takega pristopa je v celovitosti shranjevanja podatkov skupaj s poslovnimi pravili, kar omogoča enoten nivo varnosti in prezentacije vsem orodjem in aplikacijam, ki lahko dostopa j o do baze podatkov, bodisi neposredno bodisi preko ODBC. Aplikacija pri odjemalcu se tako lahko osredotoči zgolj na uporabniški vmesnik. Tak način prispeva nenazadnje tudi k boljši odzivnosti aplikacije, k zmanjšanemu prometu po mreži in h koncentraciji moči strojne opreme na enem strežniku, ne pa na množici odjemalcev. Za razvoj aplikacije smo uporabili Oracle Desig-nerJ, ki je orodje ČASE za načrtovanje in oblikovanje aplikacij. Omogoča analizo procesov, modela podatkov, funkcij, tokov podatkov ter oblikovanje fizičnega modela podatkov, modulov aplikacije in tudi gradnjo fizičnega modela ter modulov. Vse faze so med seboj povezane, hkrati pa nobena ni obvezna. Ker podpira različne metode razvoja aplikacij in kontrolirano skupinsko delo, se je izkazal za zelo učinkovito orodje, ki nudi tudi veliko pripravljene dokumentacije o aplikaciji. Aplikacija je sestavljena iz modulov Oracle Developer Forms5, ki so v celoti razvili z De-signerjem. Pri tem smo uporabili tudi dodatek Oracle Headstart6, ki še poveča učinkovitost in nudi že pripravljeno okolje za začetno oblikovanje aplikacije. Tak pristop nudi maksimalno osredotočenost na vsebino in zahteva najmanj rutinskega programiranja. 5. Opis aplikacije za hranjenje, vnos in obdelavo podatkov Aplikacija ima preko menija dva glavna vhoda - "klasifikacija" in "kategorije". Obrazec za vnos klasifikacije (slika 3) omogoča vnos in spremembo vseh podatkov, ki se nanašajo neposredno na klasifikacijo (oznaka, naziv, opis.,.). Z nje lahko z gumbom odpremo obrazec za vnos in urejanje ravni hierarhije kategorij. V zgornjem delu so >f* ri«- ifpknr»t»/ VRf/ltO HI krHjitJ.Kipi HA um* tnvnt i ri J~l- vw.yi ¿Wr» Jjnji oi is« ||?ocd jo i oi ¿ono p J fvttiAir [FTTmS pv» *«mi Mihn ¿M* »i*»»« Miš*» ?F trn ii.i 1 - .... j T nuicuviuMj 73 THKBB89SBK v»» pjj |ai 01 ¿oao J J Al- [ii 1? 1*» ¡PtlFfUVI JANJI J Slika 3: Vnos podatkov o verziji klasifikacije 2000 - Številka 2 - letnik Vili (ifjiiiiit>niH NFORM ATIKA 105 S. Čemažar, L. Munda, J. KI ep. T. Šeremet, A. Vesel: KLASJE, Strežnik za statistične klasifikacije prikazani osnovni podatki izbrane klasifikacije, spodaj pa je seznam ravni z vsemi pripadajočimi podatki. Poleg imena je pomembna številka ravni, ki določa globino v hierarhiji. Ko so na posamezne ravni dodeljene tudi kategorije, zaporedja ravni ni več možno spreminjati, za kar skrbi vgrajena funkcionalnost baze podatkov OrarleSi. Pomemben podatek ravni je tudi vzorec šifre kategorije, ki se uporablja za kontrolo vpisane šifre nove kategorije ter za določanje ravni pri polnjenju kategorij iz zunanjega vira. Drugi vhod dostopa do kategorij in vodi do vseh postopkov, povezanih z obdelavo kategorije (slika 4). Obrazec je sestavljen iz treh sinhroniziranih blokov. V gornjem bloku je seznam klasifikacij (do katerih ima uporabnik dostop). V srednjem bloku se nahaja seznam verzij klasifikacije iz gornjega bloka. Od tu je možen dostop do detajlnih podatkov verzije, med katerimi je tudi informacija o stanju življenjskega cikla, v katerem se nahaja ta verzija. V spodnjem bloku je seznam kategorij na prvi ravni verzije klasifikacije iz srednjega bloka z gumbom za dostop do podrobnih podatkov o kategoriji. Taka razporeditev nudi visoko preglednost nad ključnimi entitetami in zmanjšuje možnost napačne gradnje hierarhije. Hkrati omogoča vpisovanje in pregled velike količine raznovrstnih podatkov, ki opisujejo vsako kategorijo. Ob izbrani kategoriji na prvi ravni lahko dostopa mo do obrazca za vnos in pregled kategorij na nižjih ravneh. Ta ima zgoraj osnovne podatke o nadrejeni kategoriji (samo en zapis) skupaj s podatki o ravni, na kateri se nahaja. V spodnjem delu je seznam neposredno podrejenih kategorij. Na obrazcu sta tudi dva gumba za preskok na nižjo oz. višjo raven. Tak način omogoča zanesljivost pri razvrščanju kategorij, saj je vedno dobro vid- [UptJV^ llfr /tM|AVDV [ ¡1 i«™*. | |imoi | M n (17 | ¡ms 03 | |iiit< IM I («33J IT. i.-»-. "s; "p "P ~p "p "r; "r 'r 'r "r "r ~r "r vl.f.ii'.-t.^yyHvt |_ rj';J-■('■'■ JllHdvti.tfecAfpf-tvhjIk* J'-•*»»■! ' ' . : .1 ol ? | Ceinto A.'i; »r.J l v.1 -.-Ji NktIiWVï j ru™in j~ i .' i ■ ^ ? p" «UmiNti p r r DT Podatki n vkHuCitvnh in ifkliufitvah v k ni» i|Q nju vi r» M g k HB P Ap-fr O Jv-fl [UiiiMdlci/uiiiJvliJkd ptnltmiktg« ¿eti.ivj f jUpHAvli^arf/uprnVlfiUtcA ft*M4Wlh*-Q* /r |V 14 P? [s (l J (M aA&v/urrfdvMk^ * .^rltàflg.1 Jcq.iv * . jv > |U(M*vl|10. V drugem koraku iz prikazanega seznama klasifikacij izberemo tisto, katere lastnosti in vsebino želimo pregledati. Lastnosti izbrane klasifikacije so prikazane v treh sklopih, med katerimi preklapljamo s klikanjem na Ufrnftnctu uiail: fkonomikO gvfpttdwk* piuncva gradbeništvo mdusti ij i la p, o izv od izobraževanji prebivalstvo lufiztin 7' .i' V|. tfgovin« kli-.ini.m-ljr: i-1- rfcrrwEjalfli ■ < P ■ > h. '1 i poklicev fta;lvo ■ Vnír» red lpii'vj Vcn||> | Kluiahicijj K»»! | ravni; I rqwiuti Inavii 3PUJÍNE STATISTIKE PRFTIIV ALSTVO [N SOCIALNE RA?.ME bkujt kl»«iflkar)jf N*¡rlv favtil: 1 glavna »kupina paklicflv 2 podskupin» poklicev 3 podroCna r, k . j f i i,poklicev 4 enota poilr skupine poklicev 1234 5 naziv poklica t234 55 Rmrd; "I iT i » I1**1 5 Slika 5; Obrazec, na katerem poiščemo klasifikacijo; izbrali smo kartico z opisom ravni jeziček kartice. Razporejene so v sklope: verzije, klasifikacija in ravni. Kartica "Verzija" prikazuje podatke za vsako posamezno verzijo (oznaka verzije, začetni in končni datum veljavnosti, ali je klasifikacija standardna ali nestandardna in veljavnost verzije. Kartica "Klasifikacija" prikazuje poleg kratice in naziva klasifikacije še naziv skupine uporabnikov, zadolžene za klasifikacijo in naziv institucije, ki je klasifikacijo sprejela. Kartica "Ravni" prikazuje že omenjena stroga pravila gradnje ravni, ki določajo globino hierarhije pri vnosu kategorij za vsako posamezno klasifikacijo. Prikazani so število ravni, naziv ravni, vzorec ravni, šifre ravni in dolžina deskriptorja. Z izbiro določene verzije klasifikacije se odpre nov obrazec, na katerem lahko pregledujemo vse kategorije izbrane verzije. Drugi način iskanja klasifikacij je, da z gumbom "Iskanje klasifikacij" odpremo obrazec, na katerem poiščemo klasifikacijo iz seznama vseh klasifikacij v bazi ali pa vnesemo kratico ali del kratice v pripravljeno polje za vnos. Pregled kategorij izbrane verzije klasifikacije je možen z odpiranjem drevesne strukture ravni ali pa z izbiro posamezne ravni {slika 6). Pri vnosu novih in vzdrževanju obstoječih klasifikacij je uvedena stroga kontrola vnosa kategorij po ločno predpisani hierarhiji. Ker ima vsaka posamezna kategorija urejena "družinska razmerja" - kdo je komu oče in kdo sin (parent - child relationship), smo v Access-u uporabili objekt, imenovan TreeVievv", ki omogoča drevesni prikaz podatkov. Način odpiranja kategorij znotraj posameznih ravni je tak, kot je npr. v Raziskovalcu urejeno odpiranje map. Iskanje kategorij je možno tudi z vnosom teksta ali delom teksta. Z izborom kategorije se odpre seznam vseh njej neposredno podrejenih kategorij, ki so na naslednji ravni. Lastnosti vsake posamezne kategorije postanejo vidne, ko izberemo kategorijo iz seznama. Odpre se obrazec, na katerem je definicija kategorije, kratica nadrejene kategorije, seznam vključitev, ki po d robnej e opredeljujejo V/muc rjivni: t 12 123 ± 2000- Številka2-letnikVIII ifljuwÍBiídNFORMATIKA 107 ► S. Če ma žar, L. Munda, J, Klep. T. Šeremet. A. Vesel; KLASJE, Strežnik za statistične klasifikacije s ovoji«i poklici S 01VÜJASH POKUCI B O1IVWASKIPOW.IO Sh 0110 V^^JVMJ..* >i istnto'iafen UnO 01 tjiln*./ij;!rKS BI mo:' PaltaHt /(viBi.vlrjts OliaOJVoBl.'va^rvi - t Saj: ONOD« ALCICAKÜNODAJA L KC, VISOKI URADNIK IWlSOKE URADNICE. MENEELE RJI/ME NE GIERKE ltau.O»tODAJ*LCiOKOfiOCAtAu:C.viSOiyunAEiNiW/VISOKEuFwDMICE w 111 Zaf-ONO[iWflia/ZOXOHODAJAH,£ •: 11? VISOKI DRSaVNI URADNIKJMSOmE DR2AVNE URADNICE IM VISOKI URADNIKI/VISOKE URADNICE INTERESNIH OHt¿ANIZfcOJ V IJOlUEKTOFWlítlHEKIORICE.MENÉBitftlIiWENEDÍERKE DRIIÍB K T 3 MtNEI^E RJI/MENE DÍERKf MAMJÍIHORUÍB f-í 131 MEHEDÍERJI^EHED2ER|;E MANJŠIH DRU2B '•' 1311 Menedíw - [.I., iJ KTv;rvil -J'.", mftxítvu :.. 1312 Menwtíef|i/fAsnídítfk' manith dfuíb v rud« > *>* k. . ^^.«■v.'.tj- 71 oikrbo z f^fíio. pfcno™ vodo > 1J'3 MtnOdfejtAnpnvdEWk* ntcrish4u& v ' 1314 - ' puvfi. putHsvIü motorni verf r. I:«■:>- ■ 1315Menpd¿ei|i/nvr)e&efkvrrLdnc£tii}u¿b v floslnit^j * ¡1' Ivene :.--■ - ".Vi:t OI..- v ¡uwneiu . I.:r''ir i .1 v „•> + 1317 MervidtapWrvdfetke —Tu. M [viikivrv :liv, f • 1318 MflMdfetptoMOdtafct iv. ih ¡ta Tiof've. ' C1 > 1319 Mtrwd«i|i/ri\£r»ed:epkeiT>*i|šdidiijib d " • i SI nOKOVMJAKJ/S T flOKOVH J ÍWHJE Vse to pa skupaj z dejstvom, da so vsi moduli zgrajeni iz definicije v repozitoriju brez kasnejših popravkov, obljublja enostavno in poceni vzdrževanje aplikacije. Varno shranjene podatke pa lahko prikazuje poljubna aplikacija - v načrtu je tudi izdelava vpogleda v veljavne klasifikacije preko interneta. Slika 6: Drevesni način prikaza hierarhije kategorij v standardni klasifikaciji poklicev ključno zajetje kategorije, ter mejnih objektov, ki jih je potrebno uvrstiti drugam (seznam izključitev). Drugi način pregledovanja klasifikacije je pregled vseh kategorij posamezne ravni. Iz seznama, ki prikazuje število ravni, naziv ravni, vzorec ravni in števila vseh kategorij za posamezno raven, izberemo eno in prikaze se seznam vseh pripadajočih kategorij izbrane ravni. Uporabniški vmesnik omogoča tudi izdelavo različnih poročil za izbrano verzijo klasifikacije (slika 7), ki jih lahko izpišemo ali prenesemo v program Word ali Excel. V uporabniški vmesnik smo vključili pregled teza-vra CADOS, iz katerega smo za potrebe strežnika izbrali 214 generičnih izrazov. Za vsak izbran izraz dobimo seznam tezavrov, v katerem se ti izrazi pojavijo. Tudi vsebino izbranega tezavra lahko pregledujemo z odpiranjem drevesne strukture. Povezava MS Access in Oracle preko vmesnika ODBC Pri povezavi ODBC na podatkovni strežnik Oracle, smo naleteli na težave. Ugotovili smo, da Access v nekaterih primerih ne privzame pravilnega primarnega ključa iz podatkovne baze Oracle. V takem primeru so lahko podatki, ki jih vrne strežnik, nepopolni ali pa celo napačni. Kasnejša poizvedovanja so pokazala, da je tako zaradi zgradbe vmesnika ODBC in da ne gre za hrošča v Accessu ali Oraclu. Vmesnik ODBC namreč ne razlikuje med različnimi vrstami indeksov iz tabele Oraclove baze. Access zato za primarni ključ izbere prvega iz abecedno urejenega seznama indeksov. Ena izmed rešitev, ki se ponuja sama od sebe, je ta, da preimenujemo indeks, ki predstavlja primarni ključ v Oraclu tako, da je v abecedno urejenem seznamu na prvem mestu. Ugotovili smo torej, da: m sami ne moremo vplivati na izbiro primarnega kij uča. 8. Zaključek Izdelana aplikacija omogoča enostaven vnos in zanesljivo obdelavo podatkov poljubnih klasifikacij. Celotna definicija aplikacije je skupaj z definicijo podatkovnega modela shranjena v repozi-toriju orodja Oracle Designer, kar zagotavlja zaščito opravljenega dela, dokumentiranost in transparent-nost tudi za razvijalce, ki niso sodelovali na projektu. AJO Aíjlf^ítfll AJO ¿4 *koiwr>i.kv J ll!. CC1W3 Uliti i<-ip (rnflimh Mijill« ('-J/Avl l-' j« '.. j * p <'■ ' * lunini* kNCT krrrhri',-1 nnn4nklt11,n rftiinUt Hirf» h; S1506 Klai&an)* M NIP *i':m""*¡i'..ii jridu'iTryskih jifWivcHíoi, tW PojlImj Vlilni -viJ rigsto SWJIOTJ 5línd»rdn»klMift«ijjdtjJvn' . l'i nnJjijTf aJríl ¡'2 r nf ill trtW 1 Woia (RTF) ItVíiIV f xr»l /tii: vvi'hiiii:11: i íift-3 I !' -.'•] '.' ."i 'i . k i;r ^:i. :). I' ."r¡':"! . : i:i, j 'L' : I ■: 1 I": J I k, I'.:;.. í Je jjaifrl», fUOMQ vki it'.ír .' ik:r¿: r.-.' - n: { . íilfrft |H"1'I" 'l-r^.-fi' ilf5rjjn\ irr.' ti: u-1 uk^urútv íifra k iTecnnj". vVJ: :¿:l"-'. Víapohj Slika 7: Obrazec, na katerem izberemo vsebino in obiiko poročila 108 u/xtinbi id NFORM ATI KA 2000 - številka 2 ■ lelnik VIII S. Čemažar, L. Munda, J. KI ep. T. Šeremet, A. Vesel: KLASJE, Strežnik za statistične klasifikacije ■ so upoSteva pravilni primarni ključ na tabeii le, če v isti tabeii nimamo še kakšnega drugega enoličnega polja (unique constraint), ali če je indeks v abecednem redu na prvem mestu. Strežnik je v fazi delujočega prototipa". Večjih sprememb ne pričakujemo več, polna funkcionalnost prototipa pa bo dosežena z gradnjo modula za pretvornike in nekaterih dodatnih fukcionalnosti uporabniškega vmesnika. Predvidena je tudi izdelava rešitve za dostop in pregledovanje podatkov preko interncta. Nova programska rešitev osrednje zbirke statističnih klasifikacij je bila izdelana v okviru Programa posodobitve državne statistike. Rešitev, ki smo jo razvili na SURS, je zasnovana na dveh modelih - New Zealand Statistics Classifications And Related Standards System (CARS)13 in na modelu, kot smo ga povzeli po ISO/IEC 11179 Information technology - Specification and standardisation of data elements14. Naša rešitev ni identična kopija novozelandske15(razlik je precej), saj smo morali upoštevati okolje, ki velja na SURS in v državni upravi. To pomeni, da ni bilo moč kar kupiti gotovega izdelka (podprt je s Sybase), pač pa je biio potrebno rešitev ponovno postaviti in informacijsko podpreti z Oraciom in MS Access-om, ki sta predvideni standardni programski opremi za delo pri nas. Ob tem smo veliko pridobili tudi ob študiju pravil in postopkov, s katerimi so Novozelandci podprli svoje delo. Viri: 1 Kimball R,, The Data Warehouse Toolkit, Practical techniques for Building Dimensional Data Warehouses, John Wi ley & Sons, Inc., 1996 2 Microsoft Developers Network (MSDN), hnp:DDmsrtn.microsoft.com 3 Koch G., Loney K., OracleSi The Complete Reference; Oracle Press, Os borna 4 Peter Koletzke, dr. Paul Dorsey, Designer Handbook; Kenneth Atkins, Paul Dirksen, Zikri Askin Ince, Designer Generation; Oracle Press, Osborne 5 Robert J, Muller, Oracle Developer/2000 Handbook, Oracle Press, Osborne 7 Billings S.. Rhemann J.,etak, Access® 97 Programming, SAMS Publishing, Indianapolis, 1997 8 CADOS, Theasaurus 1-9. Collection, Eurostat, March 89, 0 in ce for Official Publications of (he European Communities, Luxembourg 9 S-rnik i.; Berce J.. Informacijska ponudba na področju približevanja Slovenije Evropski uniji. Dnevi slovenske informatike 2000. Portorož, 19,-22. april 2000, zbornik posvetovanja, str, 143-148 10 Služba Vlade RS za evropske zadeve in Center Vlade RS za informatiko, Vodič po IDC • informacijska podpora približevanju Republike Slovenije v Evropsko unijo, Ljubljana, December 1999 11 Mesojedec U„ Visual basic, sodobno programiranje: priročnik za obvladovanje programiranja z visual basicom, Pasadena, Ljubljana. 1998 12 Cajhen J., Jereb Puhar V., Kaviek A., Klep J., SeremetT., Vesel A., Strelni k za statistične klasifikacije - opis prototipne reiitve, v: Elektronsko poslovanje in statistika. Statistični dnevi '99, Radenci 1999 13 Dunnet G., The Components which lead tn Statistics Mew Zealand's Output Database Environment, Output Database Workshop, Avstralija, 1999 14 1SO/IEC 11179 (E) Information tecnnology - Specification and standardisation of data elements, Parts 1, 2, 3, 4, 5, 6 15 Dokumentacija CARS, ki nam jo je brezplačno odstopila Novozelandska statistika: CARS demo; CARS entity,ils; CARS/'pr ogrnanl.doc; logical model; physical model; views and stored procedures: accessing CARS usingSAS; accessing CARS using Microsoft products; accessing CAHS data using SQL Windows; coding and WINSCM; appendix one: list of mam CARS views CARtyur.mast.doc: CARS requirement specifications; CARS/urdeis.doc; Appendix A - terms and definiiions CARSi'urruIes2.doc; Appendix B - CARS business rules; CARS/userdoc.doc ♦ Sondi Čemažar je diplomiral na Fakulteti za strojništvo in Visoki šoli za organizacijo dela, smer informatika. Dela v podjetju Oracle Software d.o.o. kot svetovalec za gradnjo informacijskih sistemov in specialist za orodja Oracle Designer, Oracle Head s ta rt ter Oracle Developer v klasični (o d jemale c-strcžn ikj ter v inter net ni tehnologiji. ♦ Lovro Mu od a je ing. matematike. Po končanem študij v je delal na področju računalniškega izobraževanja. Ukvarja se z načrtovanjem informacijskih sistemov, podatkovnih baz in spletnih strežnikov. V projektu je sodeloval kot konzultant za MS Access. ♦ Jožica Klep, prof. s o c. ped., je svetovalka direktorja na Statističnem ur ado RS. Sodeluje v programu posodobitve državne statistike. V programu projektov Informacijsko-dokumentacijski center (IDC), ki ga je leta 1998 definirala Vlada RS kot celovito informacijsko podporo približevanju Slovenije Evropski uniji, dela v projektu IDC6 ■ Dokumentni viri. Sodelovala je tudi pri projektu IDC2 - Prevodi in terminologija. * 7af/ana Šeremet je diplomirana organizatorka-menedžerka informatike. Zaposlena je na Statističnem uradu RS v oddelku za Razvoj in administracijo baz podatkov. Ima več let delovnih izkušenj na področju priprave programske opreme za operativno izvajanje statističnih raziskovanj. Opravlja analizo in načrtovanje podatkovnih baz in izdeluje aplikacije v MS Accessu. ♦ Andreja Vesel, u ni v. dipl mg. rac,, je diplomirala na Fakulteti za računalništvo in informatiko v Ljubljani v letu 1991. Dela na Statističnem uradu RS v Ljubljani v oddelku za Razvoj in administracijo baz podatkov. Opravlja predvsem analizo in načrtovanje podatkovnih baz (podatkovna baza Oracle 8i) in razvija programe za vnos in polnjenje podatkov z Oradovimi razvojnimi orodji. 2000 -številka 2 -lelnik Vili i/porubi m! NFORM ATI KA