MINISTRSTVO ZA NOTRANJE ZADEVE REPUBLIKE SLOVENIJE STATISTIČNO POROČILO IN ANALIZA O DEJAVNOSTIH UPORABNIKOV NA SPLETNIH STRANEH SPECIALNE KNJIŽNICE MNZ OBDOBJE OD 01.01.2011 DO 31.12.2011 IZDELAL: DR. KARL PETRIČ LJUBLJANA, 2012 Kazalo 1 Uvod 4 1.1 Cilj statističnega poročila 4 2 Pregledni podatki o obiskih spletnih obiskovalcev 5 2.1 Preglednica 1: Izbrani statistični kazalci v letu 2010 5 2.1.1 Slika 1: Obročni diagram izbranih statističnih kazalcev v letu 2010 5 2.2 Preglednica 2: Statistični kazalci z istimi enotami 6 2.2.1 Slika 2: Grozdenje kazalcev po mesecih v letu 2010 7 2.2.2 Slika 3: Prikaz evklidske razdalje s pomočjo vizualne tehnike distančne mape po mesecih v letu 2010 8 2.2.3 Slika 4: Analiza bližine in povezav znotraj podatkovne pokrajine po mesecih v letu 2010 9 2.3 Drugi podatki o dejavnostih spletnih obiskovalcev 10 2.3.1 Slika 5: Spletni obiskovalci po svetu, ki so obiskali strani SKMNZ v letu 2010 10 2.4 Preglednica 3: Spletni obiskovalci iz Slovenije 11 2.4.1 Slika 6: Spletni obiskovalci iz Slovenije v letu 2010 12 2.5 Preglednica 4: Oskrbovalci internetnih storitev (angl.: Internet service providers) 13 2.6 Preglednica 5: Uporaba brskalnikov po domenah (del podatkov) 14 2.6.1 Slika 7: Vizualizacijska tehnika RadViz 14 2.7 Preglednica 6: Brskalniki, operacijski sistemi in obiski 15 2.8 Preglednica 7: Uporaba različnih verzij Internet explorerja (IE) v letu 2010 16 2.9 Preglednica 8: Uporaba različnih verzij operacijskih sistemov Microsoft Windows (IE) v letu 2010 16 3 Analiza vsebine 17 3.1 Preglednica 9: Najbolj obiskane spletne strani in dolžina spletnih sej 17 3.2 Preglednica 10: Ključne besede, ki so jih najpogosteje uporabili spletni obiskovalci pri poizvedovanju 18 3.2.1 Slika 8: Del klasificiranega pojmovnega omrežja na osnovi poizvedb 20 3.2.2 Slika 9: Raztreseni diagram razvrščenih poizvedb po UDK razredih 21 3.2.3 Slika 10: Gostost grozdov pomembnejših ključnih besed za leto 2011 22 3.2.4 Slika 11: Gostost besednih grozdov za leto 2011, 2010, 2009 in skupaj 23 3.2.5 Slika 12: Karta znanja na osnovi UDK in KE 24 4 Nekatere slikovne primerjave med statističnimi podatki za leto 2009, 2010 in 2011 26 2 4.1 Slika 13: Grozdenje kazalcev po mesecih v letu 2009, 2010 in 2011 26 4.2 Slika 14: Distančna mapa po mesecih v letu 2009, 2010 in 2011 27 4.3 Slika 15: Analiza bližine in povezav znotraj podatkovne pokrajine po mesecih v letu 2009, 2010 in 2011 28 5 Zaključek 29 6 Uporabljena programska orodja 29 POIZVEDBE OSTANEJO V IZVIRNI OBLIKI IN NISO LEKTORIRANE !!! 3 1 Uvod V statističnem poročilu in analizi o dejavnostih uporabnikov na spletnih straneh Specialne knjižnice Ministrstva za notranje zadeve (v nadaljevanju: SK MNZ) bodo prikazane njihove ključne dejavnosti s pomočjo različnih statističnih kazalcev. Za analizo se bodo uporabila različna programska orodja s sveta odkrivanja zakonitosti v podatkih in besedilih z namenom, da bi se odkrila še nova znanja oziroma vedenja o naših uporabnikih. Uporabniki spletnih strani SKMNZ nam v bistvu v obliki sledov (npr. ogledi, kliki na spletne povezave) sporočajo svoje informacijske potrebe, ki so v našem primeru pretežno profesionalno usmerjena. Uporabniki na nek način ovrednotijo informacijsko ponudbo na spletnih straneh in hkrati nam včasih v obliki izvedenih poizvedb posredujejo nove ideje ali celo rešitve. Prav zaradi tega bo v tem statističnem poročilu glavni poudarek na odkrivanju novih idej/rešitev v poizvedbah. Zgradba statističnega poročila bo konceptualno gledano naslednja: - podatki o spletnih obiskovalcih SKMNZ in njihovih dejavnostih (npr. obiski, ogledi, čas sej, geografski vidik, informacijska tehnologija uporabnikov) - podatki o ogledu najbolj priljubljenih vsebin (npr. glavna stran SKMNZ) - podatki o poizvedbah spletnih obiskovalcev na zunanjih iskalnikih (npr. Google, Najdi.si) 1.1 Cilj statističnega poročila Prikaz dejavnosti uporabnikov na spletnih straneh SKMNZ in ekstrakcija novih znanj/vedenj o njih. 4 2 Pregledni podatki o obiskih spletnih obiskovalcev Na podlagi izmerjenih podatkov od 01.01.2011 do 31.12.2011 s pomočjo programskega orodja Google Analytics so bile ugotovljene naslednje vrednosti kazalcev (gl. preglednico 1 in sliko 1 ter opis). 2.1 Preglednica 1: Izbrani statistični kazalci v letu 2011 No Nog Ndo Rob Tpop %Nno Nob/Nog Nd Nkb Januar 268 448 81 121 0:01:34 33,21 1,67 7 50 Februar 259 454 47 153 0:02:14 43,63 1,75 8 63 Marec 290 451 47 143 0:01:41 34,48 1,56 6 74 April 215 335 52 127 0:01:36 39,53 1,56 11 43 Maj 235 403 23 138 0:01:52 38,3 1,71 7 49 Junij 228 410 52 136 0:01:14 43,42 1,8 4 52 Julij 204 328 24 104 0:01:42 37,25 1,61 9 50 Avgust 162 232 27 111 0:00:46 46,3 1,43 4 46 September 230 389 35 120 0:01:52 38,26 1,69 5 54 Oktober 219 431 24 96 0:02:17 31,51 1,97 7 55 November 240 390 22 137 0:01:48 43,75 1,62 10 82 December 193 357 31 101 0:02:29 39,38 1,85 5 58 Celota 2743 4628 465 1487 0:01:46 38,83 1,69 26 468 Januar Februar Marec April Maj Junij Julij Avgust September Oktober November December 2.1.1 Slika 1: Obročni diagram izbranih statističnih kazalcev v letu 2011 5 Preglednica 1 in slika 1 prikazujeta izbrane statistične kazalce v letu 2011, ki so bili izmerjeni s programskim orodjem Google Analytics po mesecih in celokupno. Pomen kratic je naslednji: No ... število obiskov Nog ... število ogledov Ndo ... število direktnih obiskov Rob ... število različnih spletnih obiskovalcev Tpop ... povprečni čas spletne seje (povprečni čas ogleda strani) %Nno ... odstotek novih obiskov na strani Nob / Nog ... razmerje med številom obiskov in ogledov strani Nd ... število držav, ki so obiskale spletne strani SK MNZ Nkb ... število uporabljenih ključnih besed po mesecih in v enem letu Najvišje vrednosti je možno zaznati v mesecih januar, februar in marec 2011. V nadaljevanju sem zaradi ugotavljanja povezanosti in bližine med kazalci izbral tiste, ki imajo isto enoto tj. izražene vrednosti v številčnosti oziroma frekventnosti. 2.2 Preglednica 2: Statistični kazalci z istimi enotami No Nog Ndo Rob Januar 268 448 81 121 Februar 259 454 47 153 Marec 290 451 47 143 April 215 335 52 127 Maj 235 403 23 138 Junij 228 410 52 136 Julij 204 328 24 104 Avgust 162 232 27 111 September 230 389 35 120 Oktober 219 431 24 96 November 240 390 22 137 December 193 357 31 101 Preglednica 2 prikazuje statistične kazalce z istimi enotami kot so No, Nog, Ndo in Rob po mesecih v letu 2011. Zaradi analize grozdenja, povezav in bližine je nujno potrebno, da imajo preučevani kazalci isto enoto tj. v našem primeru frekvenca obiskov, ogledov, direktnih pristopov na strani SKMNZ in različnih spletnih obiskovalcev. Tako si bo možno na 6 naslednjih straneh ogledati diagrame grozdenja, podatkovne pokrajine in distančne mape. Pri vizualni analizi podatkov sem si pomagal s programskim orodjem MeV 4.5.1.r2149. Za prikaz povezanosti in bližine med različnimi kazalci z istimi enotami sem uporabil algoritem evklidske razdalje, ki je najbolj enostaven in nazoren za razumevanje. 1 V tem kontekstu bo možno ugotoviti, v katerih mesecih so si informacijski vedenjski vzorci spletnih obiskovalcev strani SKMNZ najbolj identični in različni. 2.2.1 Slika 2: Grozdenje kazalcev po mesecih v letu 2011 Slika 2 prikazuje grozdenje kazalcev po mesecih v letu 2011. Različne barve označujejo bližine in oddaljenosti med vrednostmi, ki so v razponu od 0,0 do 335,0 (gl. vrhnji del slike 2, kjer je vidna barvna lestvica, ki se razteza od črne, temnomodre, zelene, rumene, oranžne do rdeče. Črna in temnomodra barva označujeta bližino, medtem ko rdeča označuje največjo oddaljenost med vrednostmi v primerjavi z ostalimi kazalci). Slika 2 prikazuje tudi vrednosti (gl. dendrogram ali drevo v vodoravni – po kolonah in navpični smeri – po vrsticah), v kolikšni meri se kazalci oziroma njihove vrednosti po barvitih celicah med sabo podpirajo. Vodoravno ali pogled po kolonah: največjo podporo (z ozirom na vrednosti pri kazalcih) je možno zaznati pri številu ogledov različnih obiskovalcev (Rob) in direktnih obiskov (Ndo). V dendrogramu je zapisana vrednost. Med številom obiskov (No) in direktnih obiskov (Ndo) lahko opazimo nižjo podporo, kajti v dendrogramu je zapisana vrednost 92. Izjemno nizko 1 V zvezi z evklidsko razdaljo si lahko bralke/bralci ogledajo vir: http://en.wikipedia.org/wiki/Euclidean_distance 7 podporo je možno opaziti med kazalcem število ogledov (Nog) in drugimi kazalci, saj znaša vrednost skoraj 0. Direktnih obiskov na spletnih straneh SKMNZ je sorazmerno malo, če ta števila primerjamo s številom obiskov in drugimi kazalci. Iz tega bi lahko sklepali, da večina spletnih obiskovalcev do naših strani dostopa preko iskalnika. Gre pretežno za zunanje uporabnike, ki niso zaposleni na MNZ in Policiji, vendar kažejo zanimanje za našo informacijsko ponudbo. Opažam pa, da je spletnih obiskovalcev nekoliko manj kot v predhodnem letu in povrhu tega lahko opazimo, da imamo opravka s konstantnimi kazalci. Navpično ali pogled po vrsticah oziroma mesecih: dendrogram na levi strani slike 2 ponazarja podporo vrednosti po mesecih. Najbolj soroden informacijski vedenjski vzorec z ozirom na izbrane kazalce opazimo v mesecu januarju, februarju in marcu (gl. vrednost 85 in 72). Ostali meseci so si glede vrednosti preučevanih kazalcev precej podobni. V mesecu avgustu je možno opaziti največji odmik med Ndo, Rob in Nog, No, kajti dejavnosti uporabnikov na spletnih straneh SKMNZ so bila manj intenzivna, kar bi lahko povezovali z letnimi dopusti in počitnicami. 2.2.2 Slika 3: Prikaz evklidske razdalje s pomočjo vizualne tehnike distančne mape po mesecih v letu 2011 Še nazornejši vpogled med kazalci po mesecih dobimo s pomočjo vizualne tehnike distančne mape (gl. sliko 3). Lestvica evklidske razdalje se giblje od 0,0 do 1,0 (gl. levo stran slike 3). Z 8 rumeno barvo so označena polja, kjer obstaja manjša razlika med vrednostmi po mesecih, medtem ko so z oranžno in rdečo barvo označena polja, kjer je razlika bistveno večja. Izrazito največjo razdaljo opažamo v mesecu avgustu, medtem ko so si ostali meseci bolj podobni gl. malo polj je rdeče obarvanih). V bistvu lahko zaznamo tri različne vedenjske informacijske vzorce spletnih obiskovalcev, ki so naslednji: - Januar, februar in marec: je največje število obiskov in ogledov - Avgust: je najmanj obiskov in ogledov (ciklus dopustov in počitnic.) - Ostali meseci: značilna je sorazmerno konstantna dinamika preučevanih kazalcev Obravnavan vedenjski vzorec je v bistvu deloma posledica tega, da so spletne strani Specialne knjižnice MNZ težje najdljive in da imamo očitno opraviti s stalnimi uporabniki. 2.2.3 Slika 4: Analiza bližine in povezav znotraj podatkovne pokrajine po mesecih v letu 2011 Slika 4 prikazuje vizualizacijsko analitično tehniko podatkovne pokrajine po mesecih v letu 2011. Algoritem je evklidska razdalja, medtem ko sem za prag ( angl.: threshold) vrednosti 9 določil najprej 0.8 in potem še 0.5 (slika 4 kaže prag vrednosti 0.5). Ugotovil sem, da v bistvu med meseci ni izrazitega centralnega predstavnika kot smo to lahko opazili prejšnja leta. Tudi ta analiza je v bistvu pokazala, da gre za relativno konstantno in manj dinamično dogajanje na spletnih straneh SKMNZ. 2.3 Drugi podatki o dejavnostih spletnih obiskovalcev 2.3.1 Slika 5: Spletni obiskovalci po svetu, ki so obiskali strani SKMNZ v letu 2011 Slika 5 prikazuje spletne obiskovalce po svetu, ki so obiskali spletne strani SKMNZ v letu 2011. Spletni obiskovalci so prihajali iz Nemčije, Poljske, Italije, Avstrije, Nizozemske, Belgije, Francije, ZDA, Armenije, Bolgarije, Danske, Španije, Finske, Velike Britanije, Grčije, Luksemburga, Latvije, Romunije, bivših jugoslovanskih republik idr. in seveda največ jih je bilo iz Slovenije. S tujimi spletnimi obiskovalci se v tem pregledu ne bom podrobneje ukvarjal, ampak se bom posvetil spletnim obiskovalcem iz Slovenije, ker so prispevali največ poizvedb in s tem tudi največ ključnih besed. Prav ključne besede bodo v nadaljevanju zastavljene analize najbolj pomembne. 10 2.4 Preglednica 3: Spletni obiskovalci iz Slovenije Mesto Število obiskov Povprečni čas seje Ljubljana 2,051 0:01:52 Maribor 149 0:00:38 Žalec 114 0:03:41 Celje 109 0:00:31 Komen 48 0:01:59 Kranj 28 0:00:43 Koper 24 0:02:08 Kisovec 19 0:04:32 Ptuj 15 0:00:17 Velenje 10 0:00:09 Novo Mesto 9 0:00:10 Sladki Vrh 9 0:00:00 Krško 7 0:00:00 Jesenice 6 0:00:05 Žirovnica 6 0:00:20 Ajdovščina 5 0:00:04 Dravograd 5 0:00:06 Portorož 5 0:00:23 (not set) 3 0:00:07 Izola 3 0:00:02 Rogaška Slatina 2 0:00:00 Šoštanj 2 0:00:00 Trzin 2 0:00:00 Domžale 1 0:00:00 Kamnik 1 0:00:00 Kočevje 1 0:00:00 Kranjska Gora 1 0:08:51 Medvode 1 0:00:00 Škofja Loka 1 0:00:00 Stari Trg Pri Lozu 1 0:00:00 Preglednica 3 prikazuje spletne obiskovalce iz Slovenije, število obiskov in povprečni čas določene spletne seje. Največ obiskov je bilo iz Ljubljane (2051 obiskov), Maribora (149 obiskov), Žalca (114 obiskov), Celja (109 obiskov), Komna (48 obiskov), Kranja (28 obiskov), Kopra (24 obiskov), Kisovca (19 obiskov), Ptuja (15 obiskov), Velenje (10 obiskov) itd. Najdaljše povprečne spletne seje so izvedli spletni obiskovalci iz Kranjske gore (0:08:53), Kisovca (0:04:32), Žalca (0:03:41), Kopra (0:02:08), Komna (0:01:59), Ljubljane (0:01:52) itd. Povprečni čas spletne seje se je v primerjavi s predhodnim letom precej skrajšal. 11 2.4.1 Slika 6: Spletni obiskovalci iz Slovenije v letu 2011 Slika 6 prikazuje obisk slovenskih spletnih obiskovalcev v letu 2010 (gl. preglednico 3). Opazimo lahko, da spletnih obiskovalcev iz Murske Sobote in Nove Gorice ni. 12 2.5 Preglednica 4: Oskrbovalci internetnih storitev ( angl.: Internet service providers)2 Oskrbovalci internetnih storitev Obiski Povprečni čas spletne seje ministrstvo za javno upravo 1,028 0:02:48 ministry of the interior - police 285 0:01:17 telekom slovenije d.d. 273 0:00:46 t-2 access network 144 0:00:59 siol d.o.o. (slovenia online) 135 0:00:47 triera internet 119 0:03:02 broadband network services 88 0:00:07 amis 78 0:01:15 t-2 d.o.o. 48 0:00:39 kks networks 31 0:02:47 telemach communication services d.o.o. 29 0:00:03 osnovna sola nazarje 28 0:03:17 ip`s for mobitel`s users 26 0:00:17 university of maribor 20 0:00:52 univerza v ljubljani 18 0:00:03 ministrstvo za obrambo rs 15 0:00:12 amis d.o.o. 14 0:00:11 elektro turnsek d.o.o. 12 0:00:33 voljatel dsl network 11 0:03:51 (not set) 10 0:00:37 t-com croatia internet network 9 0:00:07 voljatel cable network 9 0:03:08 studentski domovi v ljubljani 8 0:00:10 arnes 6 0:01:58 narodna in univerzitetna knjiznica - nuk 6 0:00:13 amis ip pool dsl 5 0:00:00 Drugi 288 Preglednica 4 prikazuje prvih 26 oskrbovalcev internetnih storitev (od 218 različnih), ki jih uporabljajo spletni obiskovalci. Vrstni red je naslednji: Ministrstvo za javno upravo (1028 obiskov), Ministry of the interior – police (285 obiskov), Telekom Slovenije d.d. (273 obiskov), t-2 access network (144 obiskov), Siol d.o.o. (Slovenia online) (135 obiskov), Triera internet (119 obiskov), Broadband network services (88 obiskov), Amis (78 obiskov), T-2 d.o.o. (48 obiskov), KKS networks (31 obiskov), Telemach communication services d.o.o (29 obiskov), Osnovna šola Nazarje (28 obiskov), ip`s for mobitel`s users (26 obiskov), Univerza v Mariboru (20 obiskov), Univerza v Ljubljani (18 obiskov), Elektro Turnšek (12 2 Vsi oskrbovalci so navedeni na naslednjem spletnem naslovu (gl. list 4): http://www.mnz.gov.si/fileadmin/mnz.gov.si/pageuploads/SK/slike/2012/E_publikacije_2012/Vsi_podatki_2011 .xls (2012-02-14) 13 obiskov), Voljatel dsl network (9 obiskov), Študentski domovi v Ljubljani (8 obiskov), Arnes (6 obiskov), Narodna in univerzitetna knjižnica (6 obiskov), Amis IP pool dsl (5 obiskov) in drugi (288 obiskov). 2.6 Preglednica 5: Uporaba brskalnikov po domenah (del podatkov) Rang Brskalnik Domena Obiski Povprečni čas na strani Novi obiski 1 Internet Explorer gov.si 949 0:02:54 6.62% 2 Firefox siol.net 162 0:00:41 56.77% 3 Internet Explorer policija.si 148 0:01:16 50.70% 4 Internet Explorer siol.net 134 0:01:02 60.94% 5 Firefox policija.si 129 0:01:20 37.10% 6 Internet Explorer triera.net 116 0:03:49 6.31% 7 Firefox Neznano 96 0:01:28 64.13% 2.6.1 Slika 7: Vizualizacijska tehnika RadViz 14 S preglednice 5 in slike 7 je možno razbrati naslednje: - spletni obiskovalci z domeno gov.si najpogosteje uporabljajo brskalnik IE (949 obiskov in čas spletne seje je 00:02:54), - na drugem mestu sledijo spletni obiskovalci z domeno siol.net, ki uporabljajo brskalnik Firefox (162 obiskov in čas spletne seje je 00:00:41), - sledijo spletni obiskovalci z domeno policija.si, ki uporabljajo brskalnik IE (148 obiskov in čas spletne seje je 00:01:16), - na četrto mesto so se uvrstili spletni obiskovalci z domeno siol.net, ki uporabljajo brskalnik IE (134 obiskov in čas spletne seje je 00:01:02), - na petem mestu se nahajajo spletni obiskovalci z domeno policija.si, ki so uporabili brskalnik Firefox (129 obiskov in čas spletne seje je 00:01:29), - sledijo spletni obiskovalci z domeno triera.net, ki so uporabili brskalnik IE (116 obiskov in čas spletne seje je bil najdaljši t.j. 00:03:49) in - na zadnje mesto so se uvrstili spletni obiskovalci z neznano domeno, ki so uporabili brskalnik Firefox (96 obiskov in čas spletne seje je 00:01:28). 2.7 Preglednica 6: Brskalniki, operacijski sistemi in obiski Rang Brskalniki in operacijski sistemi Obiski 1 Internet Explorer / Windows 1,685 2 Firefox / Windows 815 3 Chrome / Windows 180 4 Opera / Windows 15 5 Safari /Macintosh 13 6 Firefox / Linux 11 7 Android brskalnik / Android 4 8 Firefox / Macintosh 4 9 Safari / ipad 3 10 Safari / ipod 3 11 Safari / Windows 3 12 Safari / Android 2 13 Chrome / Linux 1 14 Chrome / Macintosh 1 15 IE with Chrome Frame / Windows 1 16 Opera Mini / ni podatka 1 17 Safari / iphone 1 Preglednica 6 prikazuje imena brskalnikov in operacijskih sistemov, ki jih uporabljajo spletni obiskovalci spletnih strani Specialne knjižnice MNZ. Spletni obiskovalci, ki so uporabili " Internet Explorer in Windows" so izvedli 1685 obiskov. Na drugem mestu se nahaja 15 kombinacija Firefox in Windows. S pomočjo te opreme so spletni obiskovalci izvedli 815 obiskov itd. Nasploh lahko v nadaljnjem razvoju brskalnikov pričakujemo, da bosta Firefox in Microsoft IE še vnaprej razvijala oziroma izboljšala brskalniško tehnologijo . V nadaljevanju bodo prikazani še podrobnejši podatki o brskalniku Internet Explorer in Windowsu. 2.8 Preglednica 7: Uporaba različnih verzij Internet explorerja (IE) v letu 2011 R Brskalnik IE Obiski 1 8.0 1226 2 6.0 203 3 7.0 182 4 9.0 72 5 5.01 2 Preglednica 7 pokaže, da naši spletni obiskovalci najbolj pogosto uporabljajo brskalnik IE 8.0 (gl. preglednico 7: 1226 obiskov). Sledijo mu druge verzije brskalnika IE kot npr. IE 6.0 (203 obiskov), IE 7.0 (182 obiskov), IE 9.0 (72 obiska) in IE 5.01 (dva obiska). Zunanji uporabniki so v preučevanem obdobju najbolj pogosto uporabljali sodobnejšo verzijo IE 8.0, kar pomeni določen premik v smeri sodobnejše komunikacijske opreme. 2.9 Preglednica 8: Uporaba različnih verzij operacijskih sistemov Microsoft Windows v letu 2011 R Operacijski sistem Windows Obiski 1 XP 1,893 2 7 557 3 2000 127 4 Vista 118 5 Server 2003 4 Preglednica 8 prikazuje, da še vedno največje število spletnih obiskovalcev SKMNZ uporablja operacijski sistem Windows XP (1893 obiskov). Na drugem mestu se nahaja operacijski sistem Windows 7 (557 obiskov), na tretjem Windows 2000 (127 obiskov), sledi Vista (118 obiskov) in na zadnjem mestu se nahaja Server 2003 (4 obiske). Uporabniki spletnih strani SKMNZ so v letu 2011 precej bolj uporabili sodobno informacijsko opremo. Še zlasti zunanji uporabniki so v tem obdobju pogosteje uporabljali operacijski sistem Windows 7. 16 3 Analiza vsebine V tem poglavju bom obravnaval analizo vsebine s poudarkom na uporabljene ključne besede, ki so jih uporabniki spletnih strani SKMNZ najpogosteje uporabili. 3.1 Preglednica 9: Najbolj obiskane spletne strani in dolžina spletnih sej Rang Spletna stran Ogledi strani Povprečni čas 1 Specialna knjižnica 2779 0:02:19 2 E-publikacije knjižnice 517 0:03:01 3 E-pregled novosti 490 0:03:35 4 Seznami in povezave 462 0:02:24 5 Storitve 371 0:02:23 Preglednica 9 prikazuje najbolj gledane spletne strani na SKMNZ. Najbolj pogosto je bila obiskana glavna stran SKMNZ (2779 ogledov, povprečni čas spletne seje je bil 00:02:19), sledi ji stran E-publikacije knjižnice (517 ogledov, povprečni čas spletne seje je bil 00:03:01), E-pregled novosti (490 ogledov, z najdaljšim povprečnim časom spletne seje, ki je bil 00:03:35), Seznami in povezave (462 ogledov, povprečni čas spletne seje je bil 00:02:24) in na zadnje mesto se je uvrstila spletna stran Storitve (371 ogledov, povprečni čas spletne seje je bil 00:02:23). V nadaljevanju bo izvedena analiza ključnih besed. Ključne besede so bile izvožene v Excel, nakar so bile razvrščene s pomočjo lastno izdelanega in UDK klasifikacijskega sistema. Klasifikaciji bosta predstavljeni v nadaljevanju. 3 3 O UDK si lahko ogledate naslednjo spletno stran: http://www.informatika.bf.uni- lj.si/gradivo/pred_klasifikacije%20-%20UDK%20-%20Univerzalna%20decimalna.pdf (2011-06-02) 17 3.2 Preglednica 10: Ključne besede, ki so jih najpogosteje uporabili spletni obiskovalci pri poizvedovanju4 Rang Ključna beseda Obiski KE UDK 1 mnz 408 1 35 2 ministrstvo za notranje zadeve 223 1 35 3 revija varnost 182 3 0 4 specialna knjižnica mnz 97 1 35 5 knjižnica mnz 77 2 35 6 mnz knjižnica 43 1 35 7 alenka klepac 39 1 35 8 direktorat za upravne notranje zadeve 34 1 35 9 ministrstvo za notranje zadeve uradne ure 26 1 35 10 knjižnica ministrstva za notranje zadeve 22 1 35 11 e-publikacije 20 3 0 12 e publikacije 14 3 0 13 ministrstvo za notranje zadeve knjižnica 13 1 35 14 prijava javne prireditve 13 3 35 15 e pregled novosti 10 3 0 16 kriminaliteta mnz 10 5 343.3/.4 17 mnz ljubljana 9 1 35 18 notranje ministrstvo 9 1 35 19 register mnz 9 3 35 20 nacionalni preiskovalni urad 8 1 35 21 npu 8 1 35 22 specialna knjižnica 8 1 35 23 vključevanje v slovensko družbo 7 5 314.7 24 ministerstvo za notranje zadeve 7 3 0 25 janez rupnik policija 6 2 9 26 ministrstvo za notranje 6 1 35 4 Gl. spletno povezavo (gl. list 7): http://www.mnz.gov.si/fileadmin/mnz.gov.si/pageuploads/SK/slike/2012/E_publikacije_2012/Vsi_podatki_2011 .xls (vse ključne besede, obiski in klasifikacija) 18 3.2.1 Slika 8: Del klasificiranega pojmovnega omrežja na osnovi poizvedb Preglednica 10 in slika 8 prikazujeta najbolj pogoste poizvedbe (s pogojem Obiski < 3,1 sem izločil mnogo poizvedb), ki so razvrščene v posebne klasifikacijske skupine (v nadaljevanju: KE) od 1 do 7 in po univerzalni decimalni klasifikaciji (v nadaljevanju: UDK). Pomen skupin je naslednji: - KE 1: gre za sociološke sisteme in njihove dele (npr. MNZ, Specialna knjižnica), - KE 2: gre za osebe (npr. Miroslav Žaberl, Karl Petrič), - KE 3: intelektualne kulturne stvaritve (npr. knjige, dokumenti, tehnični sistemi, obrazci), - KE 4: predmeti / materiali (npr. stanovanja, cena osebne izkaznice), - KE 5: gre za sociološke kategorije (npr. znanost, umetnost, šport), - KE 6: gre za dejavnosti, stanja in dogodke (npr. komuniciranje, e-anonimna prijava), - KE 7: gre za vprašanja, ki so jih v preteklosti zastavili spletni obiskovalci (npr. kaj potrebuje tujec za prijavo bivanja?). Znotraj poizvedb oziroma ključnih besed so bile najbolj pogoste (glede na število obiskov) predstavnice iz treh skupin (trojica: delovna organizacija, stvaritve / izdelki in dogodki / stanja / procesi). V tem pogledu obstaja zelo močna asociacijska povezava med entitetami DELOVNA ORGANIZACIJA – STVARITVE - DOGODKI. V tem vpogledu se ugotovljena 19 asociacijska povezava iz leta 2011 razlikuje od 2010. 5 Spletni obiskovalci so v letu 2011 pogosteje poizvedovali po zaposlitvah, razpisih in uradnih urah, medtem ko je bilo precej manj poizvedb po osebah. Uporabniki spletnih strani SKMNZ so s pomočjo poizvedb na iskalnikih posredovali še druge splošne poizvedovalne vzgibe kot npr. želja, da dobi na zastavljena vprašanja natančne odgovore (v ta sklop bi lahko uvrstili poizvedbe iz skupin 4, 6 in 7). V tem primeru uporabnik posredno povprašuje po izkustvenih znanjih, ki so potrebna za reševanje manj zapletenega življenjskega problema (npr. prijava javne prireditve, kako napisati pritožbo?, kako do vozniškega dovoljenja?). Poizvedbe, ki so bile razvrščene v skupino 5 se približujejo želji uporabnika, da bi si pridobil določena faktografska znanja (npr. mladinska kriminaliteta, droga in kriminaliteta idr.), tako da so tovrstne poizvedbe v srednji močni povezavi s skupinama 2 in 3. Na podlagi teh izidov, bi lahko trdili, da so bili uporabniki spletnih strani SKMNZ v letu 2011 bolj ciljno oziroma k problemom usmerjeni kot v predhodnih letih. V nadaljevanju bom predstavil analizo razvrščenih poizvedb po UDK. 3.2.2 Slika 9: Raztreseni diagram razvrščenih poizvedb po UDK razredih 5 Gl. statistično poročilo in analizo o dejavnostih uporabnikov iz leta 2010 in 2011! 20 Slika 9 prikazuje raztreseni diagram, s katerim primerjamo med sabo pogostost obiskov, ki so bili posledica poizvedb (gl. Y-os: Obiski ali frekvenca) in razvrščene poizvedbe v posamezne UDK razrede (gl. X-os). Med najbolj pogoste poizvedbe lahko navedem naslednje (po UDK razredih): 1. UDK 35 (javna uprava gl. svetlomodro barvo): 271 poizvedb s 1372 obiski (npr. MNZ, matični urad, Specialna knjižnica MNZ, centralni register prebivalcev). 2. UDK 0 (knjige, revije, podatkovne baze, seznami idr. gl. temnomodra barva): 68 poizvedb s 302 obiski (npr. revija varnost, e-publikacije, temelji policijskih pooblastil, kult žrtve). 3. UDK 351.74 (Policija, varnost, promet gl. modro barvo): 36 poizvedb s 44 obiski (npr. Policija, Nacionalni preiskovalni urad, varnost, promet za otroke). 4. UDK 9 (npr. geografske lokacije, osebe gl. temno zeleno barvo): 43 poizvedb s 65 obiski (npr. Velika Britanija, Alenka). 5. UDK 314.7 (npr. migracije, prebivalci gl. rdečo barvo): 8 poizvedb s 18 obiski (npr. vključevanje v slovensko družbo, glas azila, integracijska hiša). 6. UDK 34 (pravo gl. zeleno barvo), UDK 340.6 (sodne vede gl. oranžmo barva), UDK 343 (kazensko pravo gl. rumeno barvo) in UDK 343.3/.7 (kazniva dejanja / kriminaliteta gl. rožnato barvo): 35 poizvedb s 53 obiski (npr. slovenski pravni register, sodne vede, legalizacija orožja, mladinska kriminaliteta, preprečevanje gospodarske kriminalitete). 7. UDK 37 (izobraževanje / usposabljanje gl. modro barva): 2 poizvedbi s 4 obiski (npr. Waldorfska šola, vzgoja za enake možnosti spolov). 8. Ostale poizvedbe so bile s področja UDK 6 (medicina, tehnika, vozila, aplikativne vede), UDK 5 (naravoslovje, raziskovalne agencije), UDK 34 (pravo) in UDK 7 (šport). Tovrstnih poizvedb je bilo zelo malo (22 poizvedb s 28 obiski). Na podlagi po UDK razvrščenih poizvedb in vizualizacijske tehnike raztresenega diagrama sem lahko ugotovil iz katerih področij spletni obiskovalci SKMNZ najpogosteje potrebujejo informacije. V nadaljevanju bom ekstrahiral in vizualiziral poizvedbe iz leta 2011 z namenom, da izpostavim najbolj ključne vsebinske tokove. Analizo omrežja bom izvedel s pomočjo programskega orodja Vos Viewer. 21 3.2.3 Slika 10: Gostota grozdov pomembnejših ključnih besed za leto 2011 Slika 10 prikazuje gostost grozdov ali klustrov pomembnejših ključnih besed znotraj vseh poizvedb, ki so bile izvedene v letu 2011 s strani uporabnikov spletnih strani SKMNZ. Največji in najgostejši klustri so predvsem organizacijske enote (mnz, knjižnica idr.) in intelektualni viri (npr. zakoni, akti, podatki, knjige, članki). Osebe se sicer sorazmerno pogosto pojavljajo, vendar redkeje v različnih kontekstih, zato je njihova gostost pojavljanja nižja. Ob primerjavi med letom 2011, 2010, 2009 in vseh poizvedb skupaj dobimo vpogled v gostotost nekaterih besednih klustrov, sezonske (občasne) ali pa posamične informacijske potrebe uporabnikov spletnih strani SKMNZ. Preden bom predstavil kartiranje znanja za klasificirane poizvedbe iz leta 2011, naj še kot zanimivost prikažem spreminjanje gostosti besednih klustrov v času. Gostost besednih klustrov je v mnogih primerih odvisno od odmevnih dogodkov, objav, prepoznavnih oseb, navad uporabnikov (npr. pri poizvedovanju uporablja kratico) idr. 22 3.2.4 Slika 11: Gostost besednih grozdov za leto 2011, 2010, 2009 in skupaj Slika 11 prikazuje gostost besednih grozdov za leto 2011, 2010, 2009 in skupaj. Nemudoma je možno spoznati, da gre za vpad števila in obsega pomembnejših besednih grozdov. Povrhu tega je možno ugotoviti, da prispevajo besedni grozdi iz leta 2009 več k skupni zbirki poizvedb kot pa zbirki poizvedb iz leta 2010 in 2011. Kakšni bi morali biti ukrepi, da bi izboljšali obiskanost spletnih strani SKMNZ so znani, vendar težje uresničljivi (npr. posebna pasica za SKMNZ na indeksni strani MNZ, bi povečala obisk in gledanost teh pod- strani, vendar do takšne pasice posamezna notranja organizacijska enota ni upravičena, kajti do posebne pasice sta upravičena zgolj organa v sestavi). 23 3.2.5 Slika 12: Karta znanja na osnovi UDK in KE 24 Slika 12 prikazuje karto znanja na osnovi UDK in KE, pri čemer so izpostavljena velikostna razmerja med posameznimi področij človekovega znanja in ključnimi entitetami kot so npr. delovne organizacije, intelektualni viri ali izdelki, dogodki, osebami in materialnimi viri. Povrhu tega je še prikazan površinski delež tistih poizvedb, ki so s področja znanosti, umetnosti in športa. Na podlagi tega izida je možno spoznati, da je pravih poizvedb s področja različnih znanosti sorazmerno malo. Največje število teh poizvedb lahko najdemo pod UDK 0, UDK 351.74, UDK 343, UDK 343.3/.7 in UDK 34. V letu 2011 ni bilo niti ene poizvedbe s področja človekovih pravic (UDK 342, kar bi uvrstil pod UDK 34) in se ta izid bistveno razlikuje iz preteklih let. Nekakšno stalnico so predstavljale poizvedbe o zakonih, aktih, pravilnikih in uredbah. Uporabniki so izvedli največ takšnih poizvedb na svetovnih iskalnikih (npr. Google) v obliki obrazcev (intelektualni viri), knjižničnih gradiv in organizacijskih enot. Prav te poizvedbe so v bistvu tesneje povezane z UDK 35 (npr. Direktorat za upravne notranje zadeve je organizacijska enota in se razvršča pod javno upravo) in UDK 0 (npr. obrazci, knjige, članki pomenijo intelektualni izdelek). Na podlagi izidov bi lahko sklepal, da so uporabniki spletnih iskalnikov od organizacijskih enot pričakovali več povratnih informacij, vendar so ugotovili, da vsebujejo strani teh notranjih organizacijskih enot zgolj osnovne informacije o njihovem delu. To je verjetno tudi glavni motiv, da so obiskali še spletne strani SKMNZ, da bi o delovanju, izdelkih, virih ipd. izvedeli oziroma dobili mnogo več kot samo osnovne informacije o delovanju? V tem primeru bi bilo smiselno premisliti o preučevanju uporabnikovih pričakovanj tako do različnih spletnih strani na MNZ kot tudi do SKMNZ. Posebno kategorijo predstavljajo poizvedbe, ki so jih uporabniki spletnega iskalnika izvedli v obliki vprašanj. Prav teh je bilo zelo malo (gl. KE 7 zavzema najmanjšo površino). 25 4 Nekatere slikovne primerjave med statističnimi podatki za leto 2009, 2010 in 2011 4.1 Slika 13: Grozdenje kazalcev po mesecih v letu 2009, 2010 in 2011 26 4.2 Slika 14: Distančna mapa po mesecih v letu 2009, 2010 in 2011 27 4.3 Slika 15: Analiza bližine in povezav znotraj podatkovne pokrajine po mesecih v letu 2009, 2010 in 2011 28 5 Zaključek V letu 2011 na spletnih straneh MNZ in s tem tudi SKMNZ ni prišlo do večjih sprememb. Število spletnih obiskovalcev in ogledov je na straneh SKMNZ pojemalo. Prav zaradi te »umirjene« dinamike dejavnosti uporabnikov spletnih strani SKMNZ je bilo tudi manj poizvedb na svetovnih iskalnikih (npr. Google), ki bi spletnega obiskovalca lahko usmeril na spletne strani MNZ in SKMNZ. Že pri analizi iz leta 2009 in 2010 je bilo možno trditi, da so spletometrični podatki v ustrezno pripravljeni obliki zelo zgovorni in analitiku lahko posredujejo nova vedenja. Navkljub dejstvu, da je bilo v letu 2011 število poizvedb še manjše, je možno oceno iz leta 2009 in 2010 prenesti tudi na leto 2011. Pričakujemo lahko, da se ugotovljeni informacijski vedenjski vzorec (ob pogoju, da ne pride do bistvenih vsebinskih in oblikovnih sprememb na spletnih straneh idr.) v prihodnje ne bo bistveno spreminjal Kot zaključno sporočilo za leto 2011, bi ponovno izpostavil zamisel (iz leta 2010) o izgradnji posebnega kontroliranega slovarja ali pa ontologije poizvedb (npr. Ontogen), ki bi lahko spodbudil razvijanje novih idej in znanj znotraj MNZ in organov v sestavi. Povrhu tega menim, da je zelo smiselno imeti organiziran in analiziran pregled nad informacijskimi potrebami državljanov ter javnih uslužbencev, kajti le na takšen način je možno še bolj nadgraditi kakovost delovanja MNZ in OVS (npr. inovacije v obliki prijaznejših storitev, aplikacij, aplikacijskih sistemov). Priporočal bi še obsežnejšo analizo poizvedb tako na spletnih straneh MNZ kot tudi Policije za leto 2011. Obe analizi bi po mojem mnenju še bolj prispevali k dodani vrednosti naše spletne ponudbe. 6 Uporabljena programska orodja 1. MeV 4.5.1 2. Microsoft Visio 2007 3. ORA Casos 2.0.5 4. Orange Canvas 2.0b 5. Treemap 29