SPECIALNA KNJIŽNICA MNZ ; ; v r, Inforniii cijsko opLsmenj evânje upora bnikov za ^analizo^ organizacijo in iskanje podatkov / informacij s poudarkom na kriminalitet CIP - Kataložni zapis o publikaciji Narodna in univerzitetna knjižnica, Ljubljana 371.3:003:659.2:004(0.043.2) 343.3/.7(0.043.2) PETRIČ, Karl, 1964- Informacijsko opismenjevanje uporabnikov za analizo, organizacijo in iskanje podatkov, informacij s poudarkom na kriminaliteti [Elektronski vir] / avtor Karl Petrič. - V Ljubljani : Ministrstvo za notranje zadeve RS, 2007 Način dostopa (URL): http://www.mnz.gov.si/fileadmin/mnz.gov.si/pag euploads/SK/pdf/Microsoft_Word_-_objava_delovna_verzija.pdf. - Opis temelji na verziji z dne 26. 9. 2007 ISBN 978-961-6043-70-0 235210240 Lektorirala Janja Šusteršič-Nučič Povzetek Priročnik za informacijsko opismenjevanje uporabnikov v Specialni knjižnici Ministrstva za notranje zadeve RS (v nadaljevanju MNZ) je razdeljen na dva dela. V prvem delu predstavlja uporabo različnih programskih in spletnih orodij za analizo kriminalitete in s tem varnosti v družbi. Drugi del se ukvarja z organizacijo podatkov/informacij in iskanjem le-teh s pomočjo različnih tehnik, programskih in spletnih orodij. Ob tem se posredno dotika tudi morebitnega uvajanja novih informacijskih/bibliotekarskih storitev za uporabnike in koristnih raziskav v zvezi z njimi, da bi se tako nekoliko razblinil monotoni izraz knjižnic. Po avtorjevem mnenju je tovrstne raziskave smotrno razvijati, ker lahko občutno prispevajo k večji kakovosti in učinkovitosti dela uslužbencev MNZ in policije! Kazalo 1 Uvod 6 □1.1 Kriminaliteta in občutenje varnosti v družbi {^ir^i del) 6 □1.2 Namen prvega dela 7 □1.3 Cilj prvega dela 7 □2 Odkrivanje zakonitosti v podatkih {podatkovno rudarjenje) 8 □2.1 Na kratko o razvoju OZVP 8 □2.2 Nekatere metode in vizualizacijske tehnike OZVP 9 □2.2.1 Metoda klasifikacije 9 □2.2.2 Asociacijska pravila 9 □2.2.3 Razvrščanje v skupine ali grozde (clustre) 10 □2.2.4 Vizualizacijske tehnike 10 □2.3 Programska orodja za OZVP 12 □2.3.1 UML Visual Paradigm Community edition 13 □2.3.2 Slika 1: Scenarij varnosti in kriminalitete 13 □2.3.3 Slika 2: Družba in predznak dogodkov 14 □2.3.4 Slika 3: Metodologija CRISP za OZVP in pot ekstrakcije ... 15 □2.4 Analiza povezav (link analysis) 16 □2.4.1 Slika 4: Model analize povezav med žrtvijo in osumljencem 17 2.4.2 Analiza povezav simuliranih podatkov 18 □2.4.3 Preglednica 1: Vedenjske značilnosti/lastnosti žrtve in osumljenca 19 2.4.4 Slika 5: Vizualizacija analize povezav 19 □2.5 Orange Canvas 21 □2.5.1 Slika 6: Delovna plošča Orange Canvas in podatkovna tabela 22 □2.5.2 Slika 7: Primer Filadelfije - Umori glede na vrsto orožja, starost, raso, spol, datum in čas (2001-2006) 22 2.6 Ilog Discovery 24 □2.6.1 Slika 8: Lokalni histogram umorov skozi čas in starost, vključujoč vrsto uporabljenega orožja, spol, starost, ime žrtve, datum in rasno pripadnost 24 □2.7 yED 2.3.1_02 25 □2.7.1 Slika 9: Prometna infrastruktura od Garmischa do Flensburga 25 □2.7.2 uDig 26 □2.7.2.1 Slika 10: Gostota velikih mestnih skupnosti 26 □2.8 Sociogram 27 □2.8.1 Slika 11: Odnosi med ljudmi znotraj določene skupine 27 □3 Odkrivanje zakonitosti podatkov v besedilih (angl.: Text Mining) 28 □3.1 AntConc 28 □3.1.1 Slika 12: Programsko orodje AntConc za OZVP v besedilih 28 □3.2 CBA Association Rules software 29 □3.2.1 Slika 13: Ugotavljanje asociacijskih pravil v zvezi z izkrivljenimi informacijami v rumenem tisku 30 3.3 Statistična programska orodja 31 □3.3.1 WinIdams 32 □3.3.2 Slika 14: Analiza časovne vrste za samomore od leta 1954 do 2001 32 □3.3.3 Slika 15: Prikaz gostote števila samomorov (Y - os) po letih (X - os) 33 □4 Organizacija podatkov/informacij in učinkovito iskanje le-teh 36 □4.1 Namen drugega dela 36 4.2 Cilj drugega dela 36 □5 Organizacja podatkov/informacij in programsko orodje MIDOS THESAURUS 2000 37 □5.1 Slika 16: Postopkovni model za učinkovitejšo organizacijo in iskanje informacij 37 5.2 Tezaver 38 □5.2.1 Slika 17: Različica odnosov med pojmi v tezavru 39 5.2.2 Uporabnost tezavra 40 □5.3 Programsko orodje MIDOS THESAURUS 2000 40 □5.3.1 Slika 18: Nadzorna plošča in pregledovalnik programskega orodja MIDOS THESAURUS 2000 (v nadaljevanju MT2000) 41 □6.1.3 Potek klasifikacijske variante MV 45 □6.1.4 Zakaj je lahko tehnika MV koristna? 45 □6.2 Slikovna tehnika miselnih vzorcev 46 □6.2.1 Slika 21: Miselni vzorec za izdelavo magistrskega dela v zvezi ... 46 □6.3 Facetna teorija kot zanimivost 47 □7 Iskanje informacij na iskalniku Google 48 □7.1 Slika 22: Glavne prvine pri svetovnem iskalniku Google 48 □7.2 Nastavitve in jezikovna orodja 49 □7.3 Google - pomembna opomba 49 □7.4 Najpomembnejši ukazi na iskalniku Google 49 □7.5 Iskanje na vzajemnem katalogu COBISS/COBIB 52 □7.5.1 Slika 23: Maska kataloga COBISS/COBIB 52 □7.5.2 Slika 24: Maska kataloga COBISS/COBIB za ukazen način ... 53 □7.6 Koristni poizvedovalni prijemi 54 □8 Zaključek 56 □9 Viri in uporabljena programska orodja 56 □10 Priloga: primeri poizvedb s področja kriminologije, kriminalitete, kaznivih dejanj in viktimologije - ukazni način 61 1 Uvod Pričujoče delo za informacijsko opismenjevanje uporabnikov v Specialni knjižnici Ministrstva za notranje zadeve RS (v nadaljevanju MNZ) je razdeljeno na dva dela. V prvem delu je opisana uporaba različnih programskih in spletnih orodij za analizo kriminalitete in s tem varnosti v družbi. Drugi del se ukvarja z organizacijo in iskanjem podatkov/informacij s pomočjo različnih tehnik, programskih in spletnih orodij. Ob tem pa se posredno dotika tudi morebitnega uvajanja novih informacijskih/bibliotekarskih storitev za uporabnike in koristnih raziskav v zvezi z njimi, da bi se s tem nekoliko razblinil monotoni izraz knjižnic. 1.1 Kriminaliteta in občutenje varnosti v družbi (prvi del) Kriminaliteta povzroča družbi veliko stroškov in zmanjšuje stopnjo (občutenja) varnosti. Če je družba podobna ladji z mnogimi luknjami, je kot takšna manj varna. Pri kriminaliteti gre za proučevanje negativnih družbenih pojavov in dogodkov, ki so v neskladju z družbenimi pravili (zakoni, etika, morala idr.), kjer se po eni strani obravnavajo udeleženci, ki s kaznivimi dejanji prispevajo k negativni družbeni klimi, po drugi strani se s tem večinoma vzpostavlja razmerje do žrtev, ki so do nedavnega še živeli v varni družbi in tako izkusili, kako okrutna in nevarna zna biti družba. Pri umorjenih osebah to seveda pomeni, da je bila tovrstna izkušnja morda prva, vendar pa vsekakor zadnja v življenju. Podobno bi lahko zapisali za osebo, ki se je smrtno ponesrečila na nepregledni cestni površini brez prometnih označb, kajti tovrstne prometne površine ne zagotavljajo optimalne varnosti za udeležence v prometu. V družbi, kjer se dogaja mnogo, še zlasti (za javnost) evidentnih pozitivnih dogodkov (pomoč človeku v stiski, reševanje ponesrečenca, umiritev nasilnežev, pomembna inovacija, ki izboljša kakovost življenja idr.) ter zelo malo negativnih (pretepi, podtaknitev požara, umori, hudi prometni prekrški idr.), ljudje menijo, da je življenje lepo in varno. Zadnje navedeno bi nas lahko napeljalo k razmišljanju, da bi lahko proučevali razmerja med negativnimi in pozitivnimi družbenimi dejavniki, z namenom, da bi po eni strani ocenili stanje v družbi, po drugi strani, da bi morda lahko lažje napovedali pojavljanje kriminalitete. Pri napovedovanju prihodnjih družbenih dogodkov lahko pomagajo naslednja vprašanja: a) Kje potekajo dogodki (geografska - prostorska opredelitev)? b) Kdaj se zgodijo (časovna opredelitev)? c) Kdo je izvajalec (dimenzija subjekta - npr. storilec)? č) S kom (dimenzija organizacije in/ali načrtovanja določenega kaznivega dejanja)? d) Proti komu (dimenzije žrtve) e) Kako ali način izvedbe (dimenzija metodologije, tehnike, orodja/pripomočki ipd.)? f) Zakaj se nekaj dogaja (dimenzija motiva storilca in/ali neustrezne organizacije idr.)? Na voljo imamo različne metodologije (npr. CRISP OZVP), tehnike, orodja idr., da se dokopljemo do novih spoznanj oziroma vedenj o našem okolju, ki pa ni vedno varno, saj skriva v sebi nevarne pasti ali zanke in prevečkrat terja nepotrebne žrtve. 1.2 Namen prvega dela Predstavil bom: a) uporabo (vsakomur dostopnih) programskih orodij s področja OZVP, statistike in organiziranja podatkov za preučevanje kriminalitete ter s tem posledično varnosti v družbi (večji kot je odstotek kriminalitete, manj varna je družba). Kot predlog bom predstavil zbirko izbranih programskih orodij za proučevanje kriminalitete, ki sem jo poimenoval KRIMISET; b) simulacijo dogodkov, znotraj katere bom prikazal delo s številnimi in kompleksnimi podatki; c) spodbudo za timsko in interdisciplinarno delo. 1.3 Cilj prvega dela Prikazano bo odkrivanje novih vzorcev oziroma znanj v podatkih s pomočjo uporabe koristnih programskih orodij, simulacij, timskega in interdisciplinarnega dela, da bi lažje ugotovili določeno stanje ali dogajanje v družbi ter tako lažje napovedali prihodnje dogodke. 2 Odkrivanje zakonitosti v podatkih (podatkovno rudarjenje) V tem poglavju bom najprej na kratko predstavil področje odkrivanja zakonitosti v podatkih (v angl.: Data Mining; v nadaljevanju OZVP), vključno z metodami, vizualizacijskimi tehnikami in programskimi orodji. 2.2 Na kratko o razvoju OZVP Začetki OZVP so prisotni že pri klasični statistiki, vendar je pojem nastal v zgodnjih 90. letih prejšnjega stoletja. Razvoj OZVP ima tri stopnje: 1. Klasična statistika - regresijske analize, diskriminantne analize, standardna distribucija, standardni odklon, variance, analize grozda (angl. clusters) idr. Klasična statistika je osnova za OZVP. 2. Umetna inteligenca - heuristične analize, posnemanje človekovega mišljenja, reševanje problemov, izgradnja ustreznih izvedb ipd. 3. Strojno učenje - združevanje spoznanj in metod s področja klasične statistike in umetne inteligence; računalniški programi se učijo iz podatkov, razvijanje kompleksnih odločitvenih modelov in programskih izvedb v poslovne namene idr.1 "OZVP je področje, ki temelji na metodah in algoritmih umetne inteligence in njenega ožjega ■J področja strojnega učenja." OZVP poskuša odkriti značilne vzorce, pravila in težnje (trendi) v podatkih z velikim obsegom, da potem lahko iz njih izlušči določena spoznanja in v naslednji stopnji nova znanja. Tovrstna na novo odkrita oziroma izpeljana znanja se potem lahko uporabijo za izdelavo različnih vrst izvedb, od programskih orodij, spletnih trgovin do smotrno urejenih digitalnih knjžnic (informacijski sistemi za upravljanje z znanjem -organizirane informacije, ki so prilagojene potrebam uporabnikov za pomembne odločitve) idr. Podpodročji odkrivanje zakonitosti v besedilih (angl.Text Mining) in odkrivanje zakonitosti v numeričnih podatkih prav tako spadata v področje OZVP. Po mnenju nekaterih izvedencev se OZVP od statistike razlikuje v naslednjih pogledih:3 a) pri OZVP so za razliko od statistike podatkovni vzorci obsežnejši in kompleksnejši, b) OZVP uporablja spoznanja s področja statistike, umetne inteligence in strojnega učenja, zato je OZVP nekakšna nadgradnja statistike, 1 Izpeljava: Bratko, I., Kubat, M. & Ryszard, S.(1998). MACHINE learning and data mining : methods and applications. Chichester [etc.] : J. Wiley & Sons, XVI, 456 str. 2 Opredelitev sem prevzel na podlagi naslednjega članka: Rupnik, R. & Krisper, M.(2004). Aplikativni sistemi za odkrivanje zakonitosti v podatkih na str. 2. 3 Mena, J.(2003). Investigative Data Mining for Security and Criminal Detection. Oxford: Buterworth-Heinemann. XVI, 452 str. c) OZVP ni popolnoma eksaktna veda, ker tudi nekatere uporabljene metode niso docela eksaktne (npr. metoda asociacijskih pravil, analiza povezav itd.), tako da bi lahko za OZVP trdili, da je to področje, ki se nahaja med eksaktno znanostjo in intuicijo/umetnostjo (uporaba kompleksnih vizualizacijskih motivov, kot npr. podatkovne pokrajine, in priprava sestavljenih kazalcev iz številnih kompleksnih ipd.). 2.2 Nekatere metode in vizualizacijske tehnike OZVP Na splošno se metode OZVP delijo na opisne in napovedovalne, ki so: klasifikacija, asociacijska pravila in razvrščanje v skupine (metode); distribucija, prikaz statističnih atributov, Scatter Plot in matrika, Sievov diagram, dendrogram in distančna mapa (vizualizacijske tehnike). 2.2.1 Metoda klasifikacije Metoda klasifikacije pri OZVP je tako opisne kot tudi napovedovalne narave. Sestavljena je iz dveh stopenj. V prvi stopnji se opredelijo lastnosti podatkov, kar se lahko prikazuje z odločitvenimi drevesi ali pravili.V drugi stopnji se predhodno pridobljeni model uporablja za razvrščanje novih primerov v razrede. 2.2.2 Asociacijska pravila Metoda asociacijska pravila (Associaton Rules) je opisne narave in omogoča prepoznavanje razmerij, povezav, asociacije med vrednostmi oziroma lastnostmi znotraj preučevane podatkovne množice. Najbolj znan primer uporabe asociacijskih pravil je analiza nakupovalne košarice. Pri tej analizi lastniki spletnih trgovin na podlagi nakupov ugotavljajo, katere informacije o izdelkih na spletni strani je smiselno ponuditi skupaj, da bi s tem povečali prodajo. Nekateri izdelki so z uporabnega vidika stranke tako zelo povezani med sabo, da je treba ponudbo izdelkov organizirati tako, da se bodo stranke takšnih povezanosti zavedale in kupile ne le en izdelek, temveč še druge izdelke (npr. stranka kupi čips in poleg tega še pivo). Takšno asociacijsko pravilo lahko zapišemo tako: X ^ Y (zanesljivost, podpora) Določneje lahko to pravilo zapišemo na naslednji način: Čips ^ Pivo (0,80 0,07) Ta kratki zapis ima naslednji pomen: v primeru, da je stranka kupila čips, je v 80,00 % primerov kupila tudi pivo. Delež strank, ki so kupile oba izdelka, se je pojavilo v 7,00 % vseh prenosov ali transakcij. Pri proučevanju kriminalitete bi bilo prav tako možno uporabiti metodo asociacijskih pravil. Na primer: Vlom ^ Žica (0,95 0,04) Vlom ^ ... Vlom ^ ... V primeru, da je vlomilec vlomil v avtomobil, je v 95,00 % primerov uporabil žico. Delež vlomilcev, ki so pri vlomu v avtomobil uporabili žico, se je pojavilo v 4,00 % vseh odkritih dejanj. Na podlagi odkrivanja asociacijskih pravil znotraj vlomov v avtomobile, bi bilo v nadaljevanju možno morda učinkoviteje profilirati storilce in tako najti oziroma izdelati nove pripomočke, s katerimi bi lahko bolje zavarovali avtomobile. 2.2.3 Razvrščanje v skupine ali grozde (angl. clusters) Razvrščanje v skupine pri OZVP je prav tako opisne narave. Pri tej metodi želimo ugotoviti značilne predstavnike znotraj velike množice podatkov. Različne skupine znotraj velike množice se med seboj razlikujejo po lastnostih, medtem ko so si predstavniki znotraj skupine po lastnostih podobni, kljub dejstvu da obstajajo znotraj teh manjših množic hierarhije. Na podlagi te metode je možno ugotoviti, s katerimi skupinami storilcev kaznivih dejanj imamo opraviti in poleg tega lahko posredno dokaj podrobno odkrijemo njihove vzgibe ali potrebe. Skratka, ta metoda nam lahko posreduje vedenje o miselnih modelih/hierarhijah manjših in večjih skupin storilcev kaznivih dejanj. Prav tako bi lahko to metodo uporabili pri ugotavljanju skupin kaznivih dejanj, ki so se časovno in lokacijsko gledano izkazale kot kritične (nerazrešeni primeri), da bi se lahko v prihodnje izdelale takšne strategije, s katerimi bi bilo možno tovrstne primere že vnaprej preprečiti oziroma zmanjšati. 2.2.4 Vizualizacijske tehnike Današnja programska orodja OZVP omogočajo številne vizualizacijske tehnike (kot tudi uporabo različnih metod), med katerimi so: a) Distribucija - s pomočjo slikovne tehnike distribucije je možno ponazoriti frekvenčno porazdelitev množice podatkov. Poleg tega lahko pri mnogih programskih orodjih za OZVP prikažemo tudi krivuljo verjetnosti (angl.: probabilitiy - verjetnost) in zaupanja (angl.: confidence interval - pomeni sorazmerna vrednost množice, ki je zanesljiva oziroma ji je še mogoče zaupati). V forenzični psihologiji bi morda lahko to vizualizacijsko tehniko uporabili pri ugotavljanju porazdelitve vedenjskih značilnosti serijskih morilcev glede na vrsto psihopatoloških motenj in predvidevanja, kateri dražljaji iz okolice so zanje kritični oziroma impulzivni. Tovrstna spoznanja bi bila koristna tako za prepoznavanje serijskih morilcev, za hitrejše odkrivanje umorov kot tudi za preprečevanje le-teh, kar bi povečalo stopnjo varnosti v družbi. Morda je za tovrstna prizadevanja mnogo učinkovitejša vizualizacijska tehnika »mozaik diagram«, s pomočjo katere dobimo kot izid nekakšno signaturo morilca. b) Statistični atributi - z opcijo statistični atributi je dana možnost, da slikovno in v številkah prikažemo statistične lastnosti podatkovne množice (povprečje, mediano, minimalne vrednosti, maksimalne vrednosti, posamezne frekvence, variance idr.), pri čemer si je možno prihraniti veliko časa in energije pri obdelavi podatkov. c) Scatter Plot - z njim je možno slikovno med seboj primerjati različne lastnosti in razrede in s tem prikazati različne odvisnosti oziroma razmerja med njimi (hiperbolična odvisnost med spremenljivkama, parabolična odvisnost med spremenljivkama, linearne odvisnosti idr.). Zelo primeren za vizualni prikaz metode zakona moči (angl.: Power Law), s katero lahko pokažemo neko univerzalno obnašanje določenih pojavov tako v naravi kot tudi v družbi oziroma kompleksnih sistemih, kar nam lahko olajša njihovo razumevanje (npr. ali vzorec prometnih nesreč v Sloveniji kaže na neko univerzalno obnašanje, ki se tudi za daljše obdobje ne spreminja oziroma se šele takrat spreminja, ko prihaja do novih cestnih infrastruktur?). č) Sievov diagram - ponazarja frekvence v dvosmerni kontingenčni tabeli z ozirom na relacijo neodvisnih pričakovanih frekvenc, nakar izpostavlja asociacijske vzorce med stolpčnimi in vrstičnimi spremenljivkami. Uporabno tudi za prikaz gostote kaznivih dejanj v soodvisnosti s časom in lokacijo. Primer: nočne ure in nepregledne mestne četrti v velikih mestnih skupnostih. d) Dendrogram - podatkovno hierarhično zgradbo grozda (ali clustra) je možno slikovno ponazoriti s pomočjo dendrograma. Dendrogram (grško: Dendros = drevo) posnema zgradbo drevesa, kjer se hierarhično razgradijo podatkovne množice v čedalje manjše enote. Korenina drevesa pomeni temeljni grozd, listi predstavljajo posamezne skupine, medtem ko vozlišča predstavljajo združitev določenih podskupin. V tem pogledu je pomembna funkcija oddaljenosti tako med posameznimi objekti kot tudi med množicami oziroma količinskimi enotami različnih objektov. S pomočjo dendrograma bi morda lahko ponazorili interesna področja storilcev kaznivih dejanj in tako ugotovili povezanost med njimi (segmentacija ali razčlenitev storilcev kaznivih dejanj po področjih zanimanja). e) Distančna mapa - to vizualizacijsko tehniko je možno uporabiti za ponazoritev oddaljenosti in povezanosti oziroma bližine med posameznimi kaznivimi dejanji, tako s časovnega kot tudi lokacijskega vidika. f) Linearna projekcija - s to vizualizacijsko tehniko je možno prikazati različne kazalce hkrati, kar omogoča vpogled v zgradbo in povezanost med umori (npr. proučijo se kazalci za morilce in žrtve z naslednjimi kazalci: datum, ura, spol, rasa, verska pripadnost, socialni status, starost, lokacija, vrsta uporabljenega orožja). Na podlagi tovrstnih prizadevanj bi bilo možno učinkovito ponazoriti kavzalno povezanost med storilcem in žrtvijo, kar bi lahko posredno povečevalo učinkovitost napovedovanja prihodnosti in s tem bi se lahko izdelale posebne strategije za zavarovanje potencialnih žrtev. g) Lokalni histogram in pokrajinske mape (Terrain map) - s pomočjo tovrstnih vizualizacijskih tehnik je možno prikazati zelo kompleksne vzorce, ki so prikazani v obliki različnih prostorov v soodvisnosti s časom in raznovrstnimi lastnostmi proučevanega področja. Znotraj zelo kompleksnih vzorcev je možno odkriti šibke ali močne povezave med mrežami dogodkov in oseb. h) Vizualna analiza povezav (visual link analyses) - ta slikovna tehnika je zelo primerna za prikaz različnih razvojnih scenarijev dogodkov, družbenih situacij, interakcij med družbenimi omrežji, posamezniki idr. Ta tehnika ni učinkovita, če znotraj enega slikovnega prikaza uporabimo preveč entitet. i) Vizualni geografski prikazi - s to slikovno tehniko dobimo vpogled v dogodke, ki so prostorsko opredeljeni, kar kriminalistom olajša vpogled v pozicije različnih negativnih dogodkov v družbi, še zlasti kriminalitete. 2.3 Programska orodja za OZVP V tem podpoglavju bom predstavil nekatera brezplačna programska orodja za OZVP (znotraj tega tudi za odkrivanje zakonitosti v besedilih, v nadaljevanju OZVB - angl.: Text Mining), ki so kakovostna in dostopna vsakomur. Predstavil bom zbirko različnih programskih orodij, ki sem jo poimenoval KRIMISET. Zamisel sem ponovno odkril ob iskanju kriminalističnih programskih orodij z nazivom Crime Mapping (obseg okoli 340 MB). KRIMISET je nekakšen hibrid med Crime Mapping in lastnim izborom programskih orodij, ki lahko podpirajo različna kriminalistična preučevanja, od analize povezav do odkrivanja zakonitosti v besedilih. V zbirko KRIMISET sem uvrstil naslednja programska orodja, ki jih v tem delu zaradi obširnosti ne bom vseh predstavil: UML Visual Paradigm Community Edition, Microsoft Visio Professional 2007, HP-Sim Petri networks, Netlogon - Sim, Free Mind, Think Graph, Compendium, Tulip 3.0.0.B.2, Pajek, Yed Graph editor, CrimStat, Dragnet Batch File Builder, Udig, Vista Statistics, Stats4U, WinIDAMS12-EN, Knime Miner, Orange Canvas, Rapid Miner, Mangrove, CBA Association Rules, HCE3.5-Power, TMEV 4.0, Ilog Discovery, Rule Discovery System, AntConc 3.2.ow, Tn32, TropesV62, VisuMap, Midos Thesaurus 2000, Greenstone Digital Library, Eclipse, Microsoft Visual Studio .NET 2003, Word Web, Sage, Everest, Google Earth, Arc Explorer, Sada 4, Excel idr. 2.3.1 UML Visual Paradigm Community edition Programsko orodje UML Visual Paradigm Community edition se lahko uporablja za razvijanje aplikacij in kot didaktični pripomoček (npr. za predavanje, za predstavitev diplomskega dela idr.), za organizacijo informacij v določeni digitalni knjižnici (npr. knjižnica za programske aplikacije v zvezi z OZVP in OZVB itd.) kot tudi za konstrukcijo resničnosti, izdelavo situacijskih scenarijev, za analizo povezav med različnimi entitetami (npr. med ljudmi), za modeliranje različnih sistemov, od družbenih (delovnih/poslovnih, kriminalne združbe itd.), tehničnih (informacijski sistemi za upravljanje z znanjem, objektno relacijske podatkovne zbirke) do naravnih (biološk, rastlinski, sončni sistemi itd.). S pomočjo programskega orodja UML Visual Paradigm Community edition je možno podatke tudi pripraviti in ponazoriti, tako da so primerni za posebne analize s področja OZVP in OZVB (ob tem je treba omeniti, da je profesionalna različica UML Visual Paradigm zmogljivejša, vendar pa je za posameznika cenovno dokaj neugodna). Programsko orodje si je možno na disk naložiti z naslednje spletne lokacije: http://www.visual-paradigm.com . V nadaljevanju so ustrezni slikovni prikazi v obliki modelov, scenarijev ipd. 2.3.2 Slika 1: Scenarij varnosti in kriminalitete Slika 1 prikazuje scenarij varnosti v povezavi s kriminaliteto z vidika družbene hierarhije, družbenega omrežja in posameznikov. Družbeni pojavi ali dogodki (kot kriminaliteta), nevtralni pojavi ali dogodki, evidentni pozitivni pojavi ali dogodki so prostorsko in časovno opredeljeni, kar se odraža na stanju pozitivne ali negativne družbene klime. Prav družbena klima vpliva na zaznavanje oziroma občutenje varnosti posameznikov, družbenih omrežij in globalne družbe. Za profiliranje družbe, družbenih omrežij in posameznikov obstajajo različni psihosociološki modeli, ki proučevalcem lahko pomagajo razkriti žarišča oziroma vozlišča s pozitivnim, nevtralnim in negativnim predznakom. Ocenjevanje družbene klime na podlagi kriminalitete, evidentnih pozitivnih dejanj in vsakdanjih dejanj (100 % - % kriminalitete - % evidentnih pozitivnih dejanj) bi morda bila dobrodošla novost, vendar obstaja v tem pogledu težko premostljiv problem, ki ga bom predstavil s pomočjo slike 2. Drugi problem oziroma del problema bi bil v tem, da npr. policija opazuje, zbira, analizira in vrednoti podatke za različne vrste kaznivih dejanj, medtem ko se z evidentnimi pozitivnimi dogodki v družbi ne ukvarja, kar v bistvu niti ni njena naloga, razen v primeru, če bi se v prihodnosti ukvarjala tudi s tem in bi zato zaposlila nove kadre. 2.3.3 Slika 2: Družba in predznak dogodkov Slika 2 prikazuje družbeni sistem, ki deluje na principu dveh sistemov vhodnih (input) in izhodnih enot (output). To sta kavzalni (vzrok --> učinek) in etialni sistem (pogoj --> posledica). Sistem je potrjen s kavzalno (dogodki, pojavi, pravila) in etialno družbeno realnostjo (postopki, procesi, nastavitve). Obema resničnostima je možno določiti predznak, ki je lahko (za javnost evidentno) negativen (npr. kriminaliteta), (za javnost nevidentno) vsakdanji/nevtralen (npr. nakup živil v delikatesni trgovini) ali pa (za javnost evidentno) pozitiven (npr. reševanje človeških življenj). Za negativne evidentne dogodke, pojave v povezavi s pravili obstajajo še zlasti za kriminaliteto obsežne in dokaj natančno izdelane klasifikacije, medtem ko tega za evidentne pozitivne dogodke, pojave v povezavi s pravili ne moremo trditi. Skratka, klasifikacija evidentnih pozitivnih dogodkov bi bila nujno potrebna, tako da bi lažje ocenili oziroma napovedali sedanje in prihodnje stanje v družbi z namenom, da bi se izboljšali varnostni mehanizmi in bi se tako dosegla večja varnost ter posledično večja kakovost življenja vseh prebivalcev. 2.3.4 Slika 3: Metodologija CRISP za OZVP in pot ekstrakcije novih znanj Slika 3 prikazuje stanja in dejavnosti pri izvajanju metodologije CRISP za OZVP (razumevanje področja, razumevanje, priprava, modeliranje, ovrednotenje in izgradnja podatkov), v nadaljevanju pa možno pot ekstrakcije novih znanj (gl. končni izid - podatkovni vzorci prihodnosti). 2.4 Analiza povezav (link analysis) Analiza povezav je podkategorija analize omrežij, ki proučuje asociacije med objekti. Kot primer analize povezav je možno navesti preučevanje domačih ali službenih naslovov tako osumljencev kot žrtev; v tem kontekstu je tudi koristno določen čas spremljati telefonske komunikacije in razne denarne transakcije, pri čemer je zelo smiselno v preiskavo (npr. kriminalistično) vključiti še družinske povezave med obravnavanimi osebami. Metoda analize povezav lahko izpostavi bistvene odnose, razmerja in asociacije med mnogimi objekti različnih vrst, ki preiskovalcem omogočajo celovitejši vpogled v določeno družbeno dogajanje.4 Metoda analiza povezav tudi spada v področje OZVP, pri čemer je treba poudariti, da ta metoda ni zelo natančna, zato preiskovalcem služi bolj kot nekakšna intuitivna ocena določenega socialnega omrežja, ki je prostorsko in časovno opredeljeno. Poleg tega je treba paziti, da v analizo povezav ne vključimo preveliko število entitet, temveč zgolj bistvene, saj se sicer lahko pripeti, da se preiskovalci določenega primera znajdejo v množici nepreglednih in nepovezanih konceptov. 4 Opredelitev je prilagojena na podlagi naslednjega vira: http://en.wikipedia.org/wiki/Network analysis (200707-13). 2.4.1 Slika 4: Model analize povezav med žrtvijo in osumljencem Slika 4 prikazuje možen model analize povezav med žrtvijo in osumljencem, s pomočjo katerega se po eni strani proučujejo asociativne povezave med entitetami subjektov, ki so časovno in geografsko opredeljeni (mestna skupnost, čas - gl. uro na sliki 4), kot so medosebne povezave v zasebnem življenju (npr. starši, družina, znanci, prijatelji, sodelavci idr.) in na delovnem mestu znotraj delovne organizacije oziroma podjetja (npr. delovni kolektiv, poslovni družabniki idr.), po drugi strani pa se proučujejo entitete dejavnosti (gl. sliko 4: pogostnost telefonske komunikacije, denarni prenosi, konjički, udeleževanje zabav, potovanja, gradnja hiše ipd.). S programskim orodjem UML Visual Paradigm CE je možno znotraj entitet oziroma slikovnih objektov vgraditi podatkovne zbirke in druge koristne aplikacije, kot npr. Microsoft Visio Professional 2007 s Pivot diagrami. Z že omenjenim orodjem je možno podatke npr. iz Excelovih preglednic pretvoriti v zelo pregledne diagrame, ki nam izračunajo skupne in posamezne vrednosti podatkov za obdobje, ki smo ga sami določili. Prav tako lahko v slikovne objekte vgradimo programska orodja s področja OZVP z že opravljenimi analizami in novimi spoznanji. Tovrstna analiza povezav preiskovalcem ne pomaga zgolj odkrivati ključne povezave med koncepti, temveč je lahko tudi zelo koristna metoda za izdelavo ustreznih scenarijev oziroma v nadaljnji stopnji za pripravo podatkov pri OZVP. Za analizo povezav obstaja mnogo profesionalnih orodij, ki so (izključno) prirejena za tovrstne analize (npr. i2 Analyst, Daisy 2003, Net Map, Crime link, Clementine, SAS Data Miner idr.), vendar so ta orodja tako za posameznike kot tudi za policijske postaje zaradi cene skorajda nedostopna. Z združevanjem različnih brezplačnih in kakovostnih programskih orodij je možno prej omenjeno vrzel precej omiliti in tako uporabiti pripomočke, ki pomagajo pri individualnem, timskem in interdisciplinarnem delu. V tem primeru predstavljeno programsko orodje UML Visual Paradigm CE v kombinaciji z drugimi orodji s področja OZVP idr. povsem zadošča za resno preiskovanje/raziskovanje. Raba brezplačnih programskih orodij ima lahko še dodatno prednost, kajti posameznik ali organizirana združba si lahko sam/-a izbere, katere pripomočke bo uporabil/-a, medtem ko tega pri komercialnih cenovno neugodnih programskih orodjih (ti so večinoma zgrajeni iz številnih modulov) pogosto ni možno uresničiti, ker izdelovalci programskih orodij večinoma ponujajo zelo sestavljene proizvode. Mnogo programskih modulov znotraj teh programskih paketov pa večina preiskovalcev/raziskovalcev (morda) nikoli ne bo potrebovala. 2.4.2 Analiza povezav simuliranih podatkov V nadaljevanju sem na podlagi prej pripravljenega scenarija (gl. prejšnje podpoglavje v zvezi z UML Visual Paradigm CE) izvedel analizo povezav simuliranih podatkov (dogodkov) s pomočjo programskega orodja Multiple Array Viewer. Pri tem sem si pomagal z vizualizacijsko tehniko Expression Terrain Map. Za računanje razdalj med podatki bi se lahko uporabil algoritem evklidske razdalje, vendar sem v tem primeru znotraj omenjenega orodja uporabil že ponujeni opciji genov (genes) in 20 sosedov (20 neighbors). O tem bom podrobneje poročal v nadaljevanju, in sicer v obliki preglednice in slike. 2.4.3 Preglednica 1: Vedenjske značilnosti/lastnosti žrtve in osumljenca Leto 2006 NKom_Zrt NDP_Zrt Zas_Zrt Obis_Zrt Geo_Zrt Zab_Zrt Prev_Zrt Januar 50 1300 1400 5 1000 1 10000 Februar 49 1300 1400 3 1000 0 10000 Marec 23 1300 1400 2 1000 0 10000 April 324 1300 1400 5 1000 0 25000 Maj 424 1400 1400 6 2000 5 25000 Junij 500 1200 1400 10 1000 10 25000 Julij 10 1000 1400 25 3000 10 25000 Avgust 20 1100 1400 30 4000 15 25000 September 25 1500 1420 35 5000 20 25000 Oktober 20 1300 1350 50 6000 15 25000 November 40 10000 1400 75 3310 15 40000 December 10 0 0 5 1000 4 40000 Leto 2006 NKom_Osum NDP_Osum Zas_Osum Obis_Osum Geo_Osum Zab_Osum Prev_Osum Januar 10 1300 1000 5 1000 20 7000 Februar 15 1300 1000 6 1000 20 7000 Marec 15 1300 1000 9 1000 12 7000 April 12 1300 1000 2 1000 12 7000 Maj 200 -1500 1000 12 2000 12 7000 Junij 150 -2000 1000 15 1000 0 7000 Julij 320 -3000 1000 50 1000 0 7000 Avgust 11 0 1000 20 1000 0 7000 September 12 0 1000 33 1000 0 5000 Oktober 23 0 1000 30 6000 0 5000 November 14 0 1200 40 3000 5 5000 December 2 10000 1400 45 1000 21 5000 2.4.4 Slika 5: Vizualizacija analize povezav ' Gre za simulacijo izmišljenih dodgodkov - podatke je sestavil avtor. Preglednica 1 prikazuje vedenjske značilnosti žrtve in osumljenca, slika 5 pa ponazarja vizualizacijo analize povezav med žrtvijo in osumljencem od januarja do decembra 2006. V simuliranem podatkovnem naboru sem določil naslednje značilnosti/lastnosti za žrtev (npr. žrtev je bila hudo pretepena, okradena, umorjena idr.) in za osumljenca: Nkom_Žrt ... pomeni število žrtvinih telefonskih komunikacij v preučevanem obdobju Nkom_Osum ... pomeni število osumljenčevih telefonskih komunikacij v preučevanem obdobju NDP_Žrt ... žrtvine denarne transakcije (v evrih) v preučevanem obdobju NDP_Osum ... osumljenčeve denarne transakcije (v evrih) v preučevanem obdobju Zas_Žrt ... žrtvin zaslužek (v evrih) v preučevanem obdobju Zas_Osum ... osumljenčev zaslužek (v evrih) v preučevanem obdobju Obis_Žrt ... število obiskov na žrtvinem domu po mesecih v letu 2006 Obis_Osum ... število obiskov na osumljenčevem domu po mesecih v letu 2006 Geo_Žrt ... kraj nahajanja žrtve skozi vse leto (npr. 1000 = Ljubljana, 2000 = Maribor itd.) Geo_Osum ... kraj nahajanja osumljenca skozi vse leto (npr. 1000 = Ljubljana, 2000 = Maribor itd.) Zab_Žrt ... število zabav, katerih se je žrtev udeležila v letu 2006 po posameznih mesecih Zab_Osum ... število zabav, katerih se je osumljenec udeležil v letu 2006 po posameznih mesecih Prev_Žrt ... žrtvino prevozno sredstvo in nakup ali prodaja le-tega po mesecih v letu 2006 (v evrih) Prev_Osum ... osumljenčevo prevozno sredstvo in nakup ali prodaja le-tega po mesecih v letu 2006 (v evrih) Določene značilnosti/lastnosti žrtve in osumljenca sem v nadaljevanju vizualiziral s pomočjo tehnike Expression Terrain Map, pri čemer sem določil opciji genov (genes) in sosedstvo (20 neighbors). Opisana vizualizacijska tehnika preiskovalcem nazorneje prikaže bližine in oddaljenosti med obravnavanimi značilnostmi/lastnostmi oziroma vrednostmi žrtve in osumljenca po posameznih mesecih določenega obdobja. Poleg tega bi bilo možno npr. geografske podatke upodobiti na zemljevidu in tako dodati še prostorske razsežnosti (npr. Google Earth, Arc Viewer idr.), kar bi še dodatno obogatilo analizo povezav. Sliki v obliki hribovite pokrajine in skeleta ali prostorske mreže prikazujeta bližine in oddaljenosti v obliki hribov, ki predstavljajo mesece, in v obliki rdečih povezav, ki ponazarjajo povezanosti (različnosti, identičnosti) določenih značilnosti/lastnosti žrtve in osumljenca skozi preučevana mesečna obdobja. Preiskovalci lahko s pomočjo tovrstne tehnike ugotovijo prelomnico v vedenju osumljenca pred dejanjem in po njem, povezanosti med žrtvijo in osumljencem oziroma ključnih oseb v primeru in še mnogo več. V nadaljevanju bo predstavljeno slovensko programsko orodje za OZVP, ki so ga izdelali na Fakulteti za računalništvo in informatiko v Ljubljani. Naziv programskega orodja je Orange Canvas, redno ga posodabljajo in s tem tudi izboljšujejo. 2.5 Orange Canvas Orange Canvas je programsko orodje za OZVP, še zlasti uporabno za strojno učenje in genetiko, vendar ga nekateri uporabljajo tudi za področja, kot so trženje, jezikoslovje, psihologija, sociologija idr. Menim, da je brezplačno programsko orodje Orange Canvas uporabno tudi za OZVP s področja kriminalitete v družbi (v nadaljevanju bom prikazal primer Filadelfije - UMORI GLEDE NA OROŽJE, STAROST, RASO, SPOL, DATUM IN ČAS). Kje ga dobimo? Na spletni strani http://www.ailab.si/orange/downloads.asp si je možno na disk naložiti (download) inštalacijsko datoteko "orange-w-python-0.9.64-py2.5.exe" (vključuje Orange in Pyton, sicer so na voljo še druge datoteke). Približno na tri mesece Orange Canvas posodabljajo in ga s tem tudi dopolnjujejo oziroma izboljšujejo. Obseg inštalacijske datoteke je približno 21,6 MB. 2.5.1 Slika 6: Delovna plošča Orange Canvas in podatkovna tabela Slika 6 prikazuje delovno ploščo programskega orodja Orange Canvas in vgrajeno podatkovno preglednico s podatki o umorih v Filadelfiji v ZDA. Z delovno ploščo Orange Canvasa je možno vizualno programirati, kar pomeni, da lahko kot uporabnik metode, tehnike in algoritme določamo s slikovnimi objekti, kar zelo olajša analizo in s tem OZVP. V nadaljevanju bom prikazal že opisani primer umorjenih oseb v Filadelfiji s pomočjo geografske mape Filadelfije in vizualizacijske tehnike distribucije ter linearne projekcije. 2.5.2 Slika 7: Primer Filadelfije - Umori glede na vrsto orožja, starost, raso, spol, datum in čas (2001-2006) Zgornji del slike 7 prikazuje lokacijo in število umorov po času, spolu, rasni pripadnosti, starosti in po vrsti uporabljenega orožja znotraj zemljevida mesta Filadelfija, ki so se zgodili od leta 2001 do 2006 (interaktivni zemljevid je dosegljiv na naslednjem spletnem naslovu: http://inquirer.philly.com/graphics/murders map). Spodnji del slike prikazuje vizualizacijsko tehniko linearne projekcije (gl. levo stran) in distribucije (gl. desno stran). Sicer spodnji del slike 7 prikazuje isto snov kot zgornji del slike, vendar s to razliko, da sem vrsto uporabljenega (morilskega) orožja razvrščal v številčne klasifikacijske skupine od 1 do 8 (npr. 1 pomeni strelno orožje, 2 hladno orožje ... 8 blazina itd.). Dejstva, ki izrazito izstopajo, so naslednja: a) največ umorov je bilo storjenih s strelnim (klasifikacijska skupina 1) in hladnim orožjem (klasifikacijska skupina 2); b) največ umorov je bilo v zgodnjih jutranjih in nočnih urah; c) največ žrtev, ki so podlegle strelnemu orožju, je bilo starih od 15 do 40 let; č) veliko več je bilo temnopoltih žrtev kot žrtev drugih rasnih pripadnosti; d) žrtev ženskega spola je bilo izrazito manj; e) na zemljevidu mesta Filadelfija sta izrazito izpostavljeni dve lokacijski žarišči, to sta Market street in okolica, južno od Germantown Avenue, ki sta sorazmerno blizu. Že iz teh vpogledov je možno sklepati, da prevladuje moško nasilje znotraj skupine temnopoltih ljudi, starih od 15 do 40 let, ki živijo lokacijsko sorazmerno blizu v t. i. getih, kjer je verjetno huda revščina in kriminalno vzdušje, od drog do prostitucije (verjetno je v teh okolših znatno manj gospodarske kriminalitete). Iz teh podatkov lahko tudi sklepamo, da se znotraj obeh žarišč nahaja tudi največ različnih kriminalnih združb (npr. Gangs), v katere bi težko uvrstili žrtve, starejše od 50 let. Na podlagi danih podatkov je prav tako možno sklepati, da je stopnja brezposelnosti v obeh žariščih izjemno visoka (število brezdomcev je po vsej verjetnosti izjemno visoko, še zlasti mlajših, vendar ob tem ne izključujem starejših od 60 let). Poleg tega lahko predpostavimo, da v omenjenih žariščih prevladuje rasna nestrpnost med pripadniki belske in temnopolte rase. Z urbanističnega vidika morda lahko predpostavimo, da je v obeh lokacijskih žariščih veliko starih stanovanjskih blokov in manj zasebnih stanovanjskih hiš. Lahko bi predpostavili še, da je v obeh žariščnih jedrih veliko gostinskih lokalov (beznic, igralnic, diskotek, restavracij, bordelov in drugih lokalov). Na podlagi predhodne predpostavke bi lahko izpeljali naslednjo, tj. da je znotraj obeh žarišč mnogo alkoholikov in morda tudi duševnih bolnikov s hujšimi psihičnimi motnjami. S pomočjo OZVP bi bilo možno v nadaljevanju izluščiti najprej mnogo drugih predpostavk, nato pa tudi dokazov in novih spoznanj oziroma novih znanj o mestu in njegovih prebivalcih (npr. razmerje med nataliteto in mortaliteto prebivalstva), vendar pa ta namera presega ambicije tega dela. 2.6 Ilog Discovery Programsko orodje Ilog Discovery spada, podobno kot UML Visual Paradigm CE, med komercialne proizvode, vendar s to razliko, da si lahko pri obeh proizvajalcih naložimo na disk brezplačno različico z določenimi omejitvami. Pri Ilog Discovery je za brezplačno različico treba licenčni ključ vsake tri mesece podaljšati in aktivirati. Prejmemo ga lahko preko elektronske pošte. S programskim orodjem Ilog Discovery (dostopen na naslednjem spletnem naslovu: http://www2.ilog. com/preview/Discovery ) je možno slikovno upodobiti zelo sestavljene podatke z velikim obsegom. Še posebej zanimiva in uporabna je vizualizacijska tehnika lokalnih histogramov. Primer s tovrstno slikovno tehniko bom v tem delu tudi prikazal in pri tem uporabil podatke iz prejšnjega primera (umori v Filadelfiji). 2.6.1 Slika 8: Lokalni histogram umorov skozi čas in starost, vključujoč vrsto uporabljenega orožja, spol, starost, ime žrtve, datum in rasno pripadnost Slika 8 ponazarja lokalni histogram umorov skozi čas in starost, vključujoč podatke o vrsti uporabljenega orožja, spolu, starosti, imenu žrtve, datumu in rasni pripadnosti v mestu Filadelfija. Največ žrtev je starih od 17 do 32 let, večinoma so podlegle strelnemu orožju. Na drugem mestu so žrtve, stare od 33 do 49 let, ki so tudi večinoma podlegle strelnemu orožju, vendar je v tej skupini z ozirom na uporabljeno orožje vzorec nekoliko bolj pester. Na tretjem mestu so žrtve, stare od 50 do 64 let, poleg uporabe strelnega orožja je tu uporabljeno tudi hladno. Na četrtem mestu so žrtve, stare od 0 do 16 let, pri katerih so storilci uporabili strelno orožje in strup; na petem mestu pa so žrtve, stare od 76 do 82 let (v tem majhnem vzorcu težje vzpostavimo določeno preferenco glede vrste uporabljenega orožja). Opisani kompleksni podatki nakazujejo na že skoraj uveljavljeni aksiom v kriminalistiki, da je največ žrtev v starostni skupini od 15 do 35 let in da so tudi storilci približno iste starosti, kajti ti si večinoma izberejo žrtev, ki je približno isto stara. 2.7 yED 2.3.1_02 Programsko orodje yED slikovni urejevalnik je dosegljivo na naslednjem spletnem naslovu: http://www.opensource.org/licenses/bsd-license.html . Uporablja se za prikazovanje različnih zapletenih omrežij, h katerim lahko prištejemo tudi geografska omrežja (primer tovrstnega omrežja bom prikazal v nadaljevanju). 2.7.1 Slika 9: Prometna infrastruktura od Garmischa do Flensburga Slika 9 prikazuje avtocestno infrastrukturo od Garmischa do Flensburga v Nemčiji. S tem pripomočkom je laže ponazoriti dogodke na avtocestah, še zlasti prometne nesreče (preučevanje črnih točk) in število prometnih prekrškov (vzorec divjih voznikov). 2.7.2 uDig Programsko orodje uDig (angl.: user friendly desktop internet geographic information system) je namenjeno za vizualizacijo geografskih razsežnosti, kot urejevalnik, in za izdelavo namiznega internetnega geografskega informacijskega sistema, kamor je možno shraniti različne pomembne informacije. Programsko orodje uDig je brezplačno (under GNU licence - open source) in ga je možno dobiti na naslednji spletni lokaciji: http://udig.refractions.net/confIuence/display/UDIG/Home (obseg inštalacijske datoteke je 63,8 MB). Za prikazovanje in odkrivanje vzorcev kriminalitete različnih prostorskih (geografskih) in časovnih razsežnostih so lahko orodja, kot je obravnavani uDig, za kriminaliste dober pripomoček. 2.7.2.1 Slika 10: Gostota velikih mestnih skupnosti v svetu Slika 10 prikazuje gostoto velikih mestnih skupnosti, ki je največja v Evropi. Na podlagi gostote velikih mestnih skupnosti je morda možno sklepati, da je zaradi tovrstnega stanja relativno višje tako število kaznivih dejanj kot tudi število prometnih nesreč. Z organizacijskega vidika bi morda lahko domnevali, da je Evropska unija najbolj organizirana celina na svetu?! Ali bi ta predpostavka obveljala tudi za organizirano kriminaliteto, ki ima najbolj učinkovito socialno omrežje v Evropski uniji?! 2.8 Sociogram Programsko orodje Soziogramm je lahko zelo koristen pripomoček za upodobitev manjših socialnih omrežij, v katerem so ovrednoteni odnosi naklonjenosti, obojestranske naklonjenosti, nevtralnosti, nenaklonjenosti in nenazadnje obojestranske nenaklonjenosti. Soziogramm si je možno naložiti na disk z naslednje spletne lokacije: http://pabst.heim.at/Soziogramm/Download.htm (2007-07-17) 2.8.1 Slika 11: Odnosi med posamezniki znotraj določene skupine Slika 11 prikazuje različne odnose (naklonjeni odnosi = zelene puščice, nevtralni = nič in odnosi nenaklonjenosti = rdeče puščice) znotraj manjše skupine ljudi, ki so lahko protagonisti znotraj kriminalne združbe ali pa znotraj kriminalistične skupine, ki dejavno preiskujejo mladinsko kriminaliteto v Ljubljani in okolici. S tem pripomočkom je možno laže napovedati morebitne prihodnje konflikte znotraj manjše skupine ljudi in jo posledično tako bolje organizirati. 3 Odkrivanje zakonitosti podatkov v besedilih (angl.: Text Mining) Odkrivanje zakonitosti podatkov v besedilih (angl.: Text Mining) pomeni raziskovanje novih, pravilnih, relevantnih podatkov/informacij v besedilih, ki je še zlasti v današnjem času podprto z učinkovitimi in kakovostnimi programskimi orodji. Bistvena razlika med OZVP v besedilih in OZVP je v tem, da so podatki pri OZVP v besedilih manj strukturirani kot pri OZVP. Pri OZVP v besedilih velja težnja, da je treba nestrukturirane ali manj strukturirane podatke pripraviti tako, da jih preoblikujemo v bolj strukturirano obliko, nakar jih lahko s postopkom OZVP nadalje obdelujemo. Jezikoslovne analize navadno potekajo tako, da se besedilo razgradi na manjše gradnike, npr. na stavke, besedne zveze (fraze) in posamezne besede. 3.1 AntConc AntConc 3 1.302 {Windows) Lč)ui«nce Anthony, 200é 3.1.1 Slika 12: Programsko orodje AntConc za OZVP v besedilih Slika 12 prikazuje uporabniško okensko okolje programskega orodja AntConc 3.1.302 za OZVP v besedilih (AntConc si je možno naložiti na disk z naslednje spletne lokacije: http://www. antlab. sci. waseda. ac.jp/software.html) in del naložene .txt datoteke s prispevki v raznih slovenskih časnikih in revijah, še zlasti tistih iz rumenega tiska. S programskim orodjem AntConc bom v prvi fazi načrtoval predelavo manj strukturiranih tekstovnih podatkov v strukturirane. V poznejši fazi priprave podatkov bo treba podatke še prečistiti ter integrirati s kazalcem pomembnosti ali moči ključne besede (angl.: keyness --> v nadaljevanju K) in seznamom nepotrebnih besed (angl.: stop list). Ocenjujem, da podrobnejša predstavitev tovrstnega programskega orodja v tem primeru ni potrebna, kajti podrobnosti o AntConcu si lahko ogledamo na domači strani prof. dr. Laurencea Anthonyja (http://www.antlab.sci.waseda.ac.jp/index.html). V kombinaciji s tem programskim orodjem bo predstavljeno tudi programsko orodje CBA 1.0 (tj. za odkrivanje asociacijskih pravil). Dejavnik K nam posreduje povratno informacijo o tem, katere besede pomembno označujejo določen besedni korpus. Pri izračunu K določene ključne besede v besedilu se upoštevajo naslednji kazalci: - frekvenca ključne besede v manjšem seznamu besed, - vsota vseh besed v manjšem seznamu besed, - frekvenca ključne besede v referenčnem korpusu besed, - vsota vseh besed v referenčnem korpusu. S programskim orodjem za besedne analize (oziroma OZVP v besedilih) AntConc je možno ključnim besedam določiti K, vendar je treba podatke predhodno ustrezno pripraviti. 3.2 CBA Association Rules software Programsko orodje demo (orodje ima določene omejitve, ki jih profesionalna različica nima) CBA 1.0 je nekoliko starejše (najnovejša različica je CBA 2.1 - podatek z dne 17. 7. 2007) in je dostopno na naslednjem spletnem naslovu: http://www.comp.nus.edu.sg/~dm2. CBA je orodje, s katerim je možno sorazmerno enostavno določiti asociacijska pravila znotraj velikega in kompleksnega podatkovnega vzorca. Poleg tega je CBA izjemno pregleden, saj razvršča, nakar tudi prikaže asociacijska pravila v obliki drevesnega pogleda. S CBA je možno dobljena asociacijska pravila izvoziti v .RTF datoteko, ki jo je možno pretvoriti v .doc datoteko. Za večjo nazornost je tu primer ugotavljanja asociacijskih pravil.6 ' Podatke za ugotavljanje asociacijskih pravil si je izmislil avtor. 3.2.1 Slika 13: Ugotavljanje asociacijskih pravil v zvezi z izkrivljenimi informacijami v rumenem tisku Slika 13 prikazuje možen primer ugotavljanja asociacijskih pravil v zvezi z izkrivljenimi informacijami v rumenem tisku. Leva stran slike 13 prikazuje delovno ploščo programskega orodja CBA, ki je posebej izdelano za ugotavljanje asociacijskih povezav med besedami, desna stran slike 13 pa ponuja drevesni pogled asociacijskih pravil. Delo s tem programom je zelo enostavno in pregledno. Podatke je treba pripraviti v .tra (Transaction Association Format) datotečno obliko in jo ustrezno poimenovati. V nadaljevanju naložimo ustrezno .tra datoteko (npr. revijamine37.tra) in jo najprej z opcijo »Pretvornik, čistilec podatkov (Data Convertor, Cleaner)« očistimo, nakar s pomočjo ukaza »Začni OZVP (Start Mining)« izdelamo asociacijska pravila. Pri tem je predhodno treba določiti omejitve tako glede dejavnika podpore (določimo minimalno podporo 5 %), zaupanja (določimo minimalno zaupanje 50 %), omejitve števila pravil na največ 10000 kot tudi glede dolžine izdelanega pravila (Conds = 4). Asociacijska pravila si je možno shraniti (npr. v .doc obliki) in si jih ogledati. Kot drugo možnost programsko orodje CBA 1.0 ponudi tudi možnost drevesnega pogleda, ki je zelo nazoren. Prav na podlagi asociacijskih pravil je možno ugotoviti najmočnejša asociacijska pravila med objavljenimi informacijami, ki so lahko zelo enolične oziroma prekomerno pristranske ter tako lahko prejemnika informacij precej zavedejo (npr. izmišljeno dejstvo o ugrabljenih otrocih, o pogrešanih osebah ipd.), kar je nedopustno in škodljivo. Nekaj primerov asociacijskih pravil: Pravilo 1: Trgovina z ljudmi = Y -> Slovenija = Y (11.765 % 50.00 % 2 1) Pravilo 2: Pogrešane osebe = Y Trgovina z ljudmi = Y -> Slovenija = Y (10.882 % 100.00 % 1 1) Pravilo 3: Slovenski razcvet = Y Trgovina z ljudmi = Y -> izginule osebe = Y (5.882 % 100.00 % 1 1) Pravilo 4: ... Na podlagi tovrstnih asociacijskih pravil je možno ugotoviti zelo izkrivljene informacije, ki jih lahko ponuja rumeni tisk, kajti da v Sloveniji cveti trgovina z ljudmi, je vsekakor zelo izkrivljeno dejstvo, ki morda temelji na posamičnem primeru? Tovrstne dezinformacije služijo dvigovanju naklade obravnavanih časnikov, kar je izrazito v nasprotju s poslovno etiko in moralo. 3.3 Statistična programska orodja Na spletu je možno najti mnogo brezplačnih programskih orodij za statistično obdelavo in vizualizacijo podatkov, ki so kakovostna in brez omejitev. Microsoft Excel ponavadi povsem zadošča, vendar včasih potrebujemo določene statistične analize, ki jih Excel brez dodatnih modulov ne vsebuje. Tedaj si z interneta naložimo takšno programsko orodje na disk. V tem delu bom predstavil programsko orodje za statistično obdelavo podatkov; tj. WinIdams (še zlasti primeren za izdelavo matrik in analizo časovnih vrst). V kombinaciji z drugimi, že obravnavanimi programskimi orodji, je možno trditi, da takšna zbirka, kot je npr. predstavljena zbirka KRIMISET, presega zmožnosti celo takšnih profesionalnih in cenovno neugodnih programskih orodij, kot sta SPSS in Statistica. 3.3.1 WinIdams WinIdams je programsko orodje (WinIdams je dosegljivo na naslednjem spletnem naslovu: http://www.unesco.org/idams (2007-07-15)), ki je še zlasti primerno za analizo časovnih vrst. V tem delu bom na kratko prikazal analizo samomorov v Sloveniji od leta 1954 do 2001.7 3.3.2 Slika 14: Analiza časovne vrste za samomore od leta 1954 do 2001 Slika 14 prikazuje analizo časovne vrste za samomore v Sloveniji od leta 1954 do 2001. Na spodnjem delu slike je možno opaziti, da je število samomorov v Sloveniji vse od leta 1954 do 1970 strmo rastlo, medtem ko v nadaljevanju spremljanja krivulje opazimo, da se je dvig 7 Podatke za število samomorov v Sloveniji sem dobil na http://www.stat.si/doc/pub/rr798-2003/10/T10-01-01.htm (2007-07-20). števila samomorov nekoliko umiril. V letih od 1998 do 2001 pa število samomorov v primerjavi z obdobjem od leta 1991 do 1997 nekoliko pada in je to obdobje rahlo identično z obdobjem od leta 1977 do leta 1985. Kljub rahlemu pojemanju števila samomorov je ta vrednost še vedno precej visoka. Na podlagi podatkov in prikazov je možno ugotoviti naslednje: a) večje število samomorov je pri moškem spolu, število samomorov pri ženski populaciji je precej nižje; b) porast števila prebivalstva v letih od 1954 do 1970 vpliva tudi na povečano število samomorov v Sloveniji; c) opazni so izraziti dvigi in padci števila samomorov po Sloveniji zaradi prelomnih družbenih dogodkov (npr. obdobje osamosvajanja Slovenije, gospodarska kriza itd.); č) krivulja vsote vseh samomorov (Vsam) je kakovostno dokaj podobna krivulji, ki prikazuje samomore moških (SamM); d) v letu 1988 je možno opaziti sorazmerno visok porast števila samomorov pri ženskah, medtem ko je za predstavnike moškega spola to dejstvo zaznavno leto kasneje. Glede na to da predstavniki moškega spola diktirajo gibanje celotne vsote samomorov, je prej ugotovljeno zaznavno tudi v letu 1989. 3.3.3 Slika 15: Prikaz gostote števila samomorov (Y - os) po letih (X - os) Slika 15 (prikaz je izdelan s pomočjo programskega orodja Rapid Miner Beta version) ponazarja že opisana opažanja. Vrhnji del slike 15 prikazuje gostoto vseh samomorov v letih od 1954 do 2001 z barvnim spektrom od modre, svetlomodre, zelene, rumene, oranžne do rdeče barve, pri čemer je pomen barv naslednji: - nižja gostota samomorov je prikazana z modro barvo, - nekoliko višja gostota samomorov je prikazana s svetlomodro barvo, - gostota samomorov, ki je tudi najpogostejša, je prikazana z zeleno barvo, - še višja gostota samomorov je prikazana z rumeno barvo, - in najvišja gostota samomorov je prikazana z oranžno in rdečo barvo. Slikovni prikaz 15 je lahko koristen dodatni pripomoček pri preučevanju samomorov v Sloveniji in tako nazorneje prikaže gostoto določenega pojava, ki ga sicer v preglednični ali linijski obliki težje zaznamo. Odveč oziroma nepopolno bi sedaj bilo, če bi na podlagi pomanjkljivih podatkov izpeljali globlja spoznanja o samomorih v Sloveniji. Ob tem bom posredoval zgolj nekaj spodbud, ki gredo v smeri interdisciplinarnega in timskega pristopa k temu predmetu preiskave in raziskave. Gre za intenzivno vključitev v timsko delo tako preiskovalcev kot tudi raziskovalcev z različnih področij znanosti in umetnosti. Pri vključitvi umetniških videnj gre za razvijanje domišljije in intuicije, ki lahko odpirajo stvari, ki jih eksaktno znanstvenoraziskovalno delo zaradi dosledno izpeljane metodologije ni zaznalo (npr. občutenje simbolov znotraj področja simbologije). Pri tovrstnem kompleksnem predmetu preiskave/raziskave bi bili lahko poleg kriminalistov in forenzikov vključeni tudi sociologi, psihologi, informatiki, bibliotekarji/dokumentalisti, filozofi, simbologi, semiotiki, jezikoslovci, astrologi, radiostezisti, vremenoslovci, geografi, fiziki, etnologi, ekonomisti, didaktiki, slikarji, pesniki, mediji - profilerji idr. V tovrstnem preiskovalnem/raziskovalnem timu bi lahko bilo vključenih od 12 do 15 različnih izvedencev. Poleg tega bi takšen tim po potrebi sodeloval še z drugimi strokovnjaki zaradi pridobivanja dodatnih mnenj oziroma informacij. Interdisciplinarni preiskovalni/raziskovalni timi bi lahko uporabili različne tehnike in metode za kreativno razvijanje novih zamisli ali idej, kot so viharjenje možganov, miselni vzorci, konceptne mreže, facetna metoda, metoda scenarijev in alternativ idr. Zapisano velja tudi za druge predmete preiskave/raziskave, kot so umori, ugrabitve, vlomi, ropi, roparski napadi, pretepi, gospodarska kriminaliteta, organizirana kriminaliteta, tihotapljenje orožja, terorizem, prostitucija, goljufije, računalniška kriminaliteta idr. Nekaj prej navedenih metod in tehnik bo predstavljenih v drugem delu tega priročnika, ko se bom ukvarjal s pripravo/organizacijo in iskanjem informacij na internetu in na vzajemnem katalogu COBISS/COBIB. S pomočjo kakovostno pripravljenih informacij in /ali znanj z različnih strokovnih področij, je možno razvijati različne iskalne tehnike in strategije. Tovrstna znanja niso koristna samo za bibliotekarje/dokumentaliste, pač pa tudi za druge izvedence v našem družbenem sistemu, kajti učinkovita organizacija podatkov/informacij in znanja s področja iskanja informacij sta ključ do novih spoznanj in/ali znanj ter v naslednji stopnji omogočita reševanje problemov s pomočjo preventivnih strategij in z izdelavo različnih koristnih in učinkovitih izvedb ali aplikacij. Prav kakovostne in učinkovite rešitve ter zavzet/intenzivni kolektivni duh pri zatiranju kriminalitete različnih oblik, bi pripomogle k še večji varnosti v družbi. 4 Organizacija podatkov/informacij in učinkovito iskanje le-teh V drugem delu tega priročnika bom najprej predstavil programsko orodje za organizacijo informacij, tj. Midos Thesaurus 2000, s katerim je možna izdelava večjezičnega tezavra za določeno strokovno (npr. za kriminalistiko in varnost) in znanstvenoraziskovalno področje. V 5. poglavju bo predstavljena vizualizacija fragmenta strokovnega tezavra s pomočjo programskega orodja UML Visual Paradigm CE. Tovrstnih orodij s področja izdelave tezavra in vizualizacije le-tega je veliko, vendar bi natančnejša eksploracija presegala namen prve izdaje tega priročnika. V 6. poglavju bo na kratko predstavljenih nekaj znanih in priljubljenih metod in tehnik za kreativno razvijanje zamisli. Že navedeno lahko v nadaljevanju pomeni odlično izhodišče za iskanje podatkov/informacij (7. poglavje) na internetu (COBISS/COBIB in Google) in trdem disku osebnega računalniškega sistema oziroma vzpostavljene objektno orientirane digitalne knjižnice. Pri iskanju podatkov/informacij na internetu obstaja nekaj koristnih ukazov, ki uporabnikom omogočajo manjšo porabo energije in časa, poleg tega pa še boljši zajem želenih podatkov/informacij. 4.1 Namen drugega dela a) Predstavitev programskega orodja Midos Thesaurus za izdelavo strokovnega tezavra s področja kazenskega prava in javne uprave, kar spada v področje organizacije podatkov/informacij. V tem kontekstu bom s pomočjo programskega orodja UML Visual Paradigm CE predstaviti vizualizacijo (zgolj fragment, tj. s področja kriminologije) strokovnega tezavra in s tem posledično prvi korak k vzpostavitvi objektno orientirane digitalne knjižnice ali informacijskega sistema za upravljanje z znanjem. b) Predstavitev metod in tehnik (mind mapping, brainstorming, metoda faset idr.) in s tem programskega orodja za kreativno razvijanje idej (Free Mind). c) Kratka predstavitev iskalnih tehnik na COBISSU/COBIBU in Googlu. 4.2 Cilj drugega dela Informacijsko opismenjevanje uporabnikov Specialne knjižnice MNZ na področju organizacije strokovnih informacij, kreativnega razvijanja idej in uporabe iskalnih tehnik oziroma ukazov na Googlu in na COBISSU/COBIBU. 5 Organizacja podatkov/informacij in programsko orodje MIDOS THESAURUS 2000 Organizacija podatkov/informacij dobiva tudi v javni upravi vedno večjo veljavo, kajti ustrezno organizirane informacije in znanje so osnova za sisteme upravljanja z znanstvenoraziskovalnim, strokovnim in izvedbenim znanjem. V tem delu bom predstavil možen model postopkov pri organizaciji podatkov/informacij, končni izid pa bo aplikacija, ki upravlja s pomembnimi poizvedbami, udarnimi ali zelo pomembnimi ključnimi besedami z določenega strokovnega področja in hkrati pomeni nekakšno dodatno pripravo podatkov za analizo oziroma OZVP in pridobivanje novih znanj. Za večjo nazornost je tu naslednji slikovni prikaz: obogatitev te^avia MDOS Thesunjs 2000 -piiogiiamíJío orodje +oiiganiziranje UKB() I se izgrajuje „ ^ , ^ y_ Uprava dokumertov UM-Wsual Paradigm Œ -pno grani íJí o orodje -aplil posnetek tezaverskega pregledovalnika) s področja kriminologije je možno izdelati tudi s pomočjo programskega orodja UML Visual Paradigm CE. Gre v bistvu za vizualizacijo od UKB, povezav, odnosov, razmerij do raznovrstnih znanstvenoraziskovalnih ali strokovnih podatkovnih zbirk. V naslednjem poglavju bodo predstavljene tehnike, ki lahko uporabniku olajšajo in popestrijo iskanje pomembnih podatkov/informacij. 6 Tehnike, ki uporabnikom lahko popestrijo in olajšajo iskanje pomembnih informacij9 Kadar se srečate z zelo sestavljenim informacijskim problemom, je priporočljivo, da ga razdelite na manjše prvine in poimenujete v enostavnejše celote. Pri tem je možno uporabiti miselno tehniko t. i. možganskega viharjenja ali možganske nevihte (ang.: Brainstorming, nem.: Gedankensturm) in slikovno tehniko Buzanovih miselnih vzorcev. 6.1 Tehnika možganskega viharjenja (Brainstorming, Gedankensturm) Idejni oče te tehnike je bil konec 50. oziroma na začetku 60. let znanstvenik Osborn. (iz tega časa so tudi "MIND MAPS", miselni vzorci - avtor Tony Buzan). Glavni cilj možganskega viharjenja (MV) je spodbujanje ustvarjalnejšega in celovitejšega razmišljanja ter razvijanje timskega dela. Tehnika MV lahko združuje tako detektivski (intuicija, analitično zaporedno razmišljanje), znanstveni (celovitejše razumevanje problema in konteksta, boljši vpogled v širšo problematiko, zasledovanje gibanj, beleženje idej, ipd.), literarni (v širšem kontekstu umetniški) način razmišljanja (npr. pisec kriminalk, pisec znanstvene fantastike, svoboden razvoj domišljije, iskanje novih izraznih možnosti pri jeziku, odkrivanje novih pesniških oblik, ugotavljanje in ustvarjanje ozračja, itd.) kot tudi didaktični način razmišljanje (MV lahko predstavlja učinkovito orodje pri poenostavljanju kompleksnega problema, študijske snovi ipd.). 6.1.1 "MOZGANSKO viharjenje (MV)" Gre za spodbujanje oziroma vrtinčenje, viharjenje misli, ki se nahajajo v naši zavesti, polzavesti (predzavedno mišljenje) in celó podzavesti. Mnoge misli je možno takoj priklicati, mnoge zelo težko, mnogih pa sploh ne moremo. S tehniko MV se nam lahko posreči priklicati tako imenovane skrite misli. V današnjem času obstaja mnogo različic tehnike MV, s katerimi se v tem delu ne bomo ukvarjali. 6.1.2 Uporaba tehnike MV Uporablja se na različnih področjih družboslovnih (intuitivni timski pristop pri razreševanju zapletenega kaznivega dejanja idr.), humanističnih in naravoslovnih znanostih (tudipri tehničnih vedah) kot tudi pri iskanju notranje inspiracije umetnika pisane besede (npr. pesnik 9 Staro izdajo, dosegljivo na spletnem naslovu http://www.beepworld.de/members98/iskanie, sem nekoliko skrajšal in posodobil. išče nove skovanke za svojo pesem, ipd). Mnogi pedagogi pogosto posežejo po tej tehniki. Ko jo enkrat osvojiš, je ne pozabiš in kadar jo rabiš, jo tudi zanesljivo uporabiš. Nekateri poslovneži jo uporabljajo na poslovnih sestankih, prav tako jo včasih uporabljajo iskalci informacij (menedžerji, politiki, bibliotekarji /dokumentalisti, informatiki, študenti, dijaki idr.). 6.1.3 Potek klasifikacijske variante MV Ta varianta poteka v treh stopnjah s končnim ciljem, da pridemo do zadovoljive oziroma optimalne rešitve: A Prva stopnja: Na list papirja si npr. v zvezi s primerom s področja kriminalistike povsem spontano ali intuitivno zapišemo nekaj besed (okoli 15 različnih besed, možne so tudi številke ali drugi simboli). Na tej stopnji moramo biti nekritični, zato ne vrednotimo zapisanega, kajti vse, kar smo si zapisali, se lahko pozneje izkaže kot zelo pomembno. B Druga stopnja: Na tej stopnji klasificiramo ali razvrščamo zapisane besede v različne skupine (npr. ljudje, orožja, ravnanja, itd.), nakar poskusimo najti povezave med posameznimi besedami ali pojmi. C Tretja stopnja: Poskusimo najti rešitev za dani primer (npr. s področja kriminalistične prakse idr.). To stopnjo imenujemo tudi evalvacijska oziroma ocenjevalna. Na tej stopnji si posameznik ali tim izdela ocenjevalno lestvico in povezave (bolj povezano, manj povezano, močno povezano ipd.) za tiste pojme, ki so že bili razvrščeni v posamezne razrede. 6.1.4 Zakaj je lahko tehnika MV koristna? S pomočjo te tehnike lahko kriminalisti, policisti, administrativni uslužbenci, uradniki v javni upravi idr. odkrivajo nove miselne in praktične rešitve, nove oblike, povezave in poti za odpravo manj pomembnih podatkov, s čimer se zmanjšuje stopnja entropije v možganih, ki jih včasih ta t. i. spoznavna preobremenjenost (kognitive overload) povzroči. Poveča se lahko tudi samozavest posameznika in celotnega tima in morda celo velikega kolektiva?! Odkrivajo se lahko globinski vzroki za probleme med ljudmi, nakar se lahko intuitivno ali zavestno najde prava rešitev. Tehnika MV je tudi nekakšno orodje, da lahko ključni predstavniki (npr. kriminalisti, policisti, uradniki idr.) bolje med sabo sodelujejo, kar je še zlasti za obstoj kakovostne in učinkovite javne uprave ter posledično za družbo izrednega pomena. 6.2 Slikovna tehnika miselnih vzorcev 6.2.1 Slika 21: Miselni vzorec za izdelavo magistrskega dela v zvezi z vlomi Slika 21 ponazarja miselni vzorec pri razreševanju informacijskega problema za izdelavo magistrskega dela v zvezi z vlomi in vlomilci. Miselni vzorec je izdelan s programskim orodjem Free Mind, ki si ga lahko uporabniki naložijo na disk z naslednje spletne lokacije http://freemind.sourceforge.net/wiki/index.php/Main Page#Download and install (2007-0727), nakar je treba orodje še inštalirati na disk. S tem programskim orodjem si je možno informacije organizirati tako, da se sleherni gradnik (starševsko in otroška vozlišča) opremi, ali s spletno ali pa s povezavo do lokalnih dokumentov. V nadaljevanju lahko ta vzorec pomaga posamezniku pa tudi timu pri poizvedovanju na iskalnikih in vzajemnih katalogih (v našem primeru sta to Google in COBISS/COBIB) npr. v zvezi s področjem kazenskega prava in proučevanjem kaznivih dejanj. Na takšen način je možno pregledno prikazati informacijski problem in ovrednotiti izide po nastalih poizvedbah s pomočjo spletnih iskalnikov ali vzajemnih katalogov. Slikovna tehnika miselnih vzorcev v bistvu poskuša na vizualni način posnemati človekovo mišljenje. Podatki oziroma informacije niso nanizani kar po vrsti, kot je v tej knjižici, ampak so znaki besednega, številčnega in še zlasti slikovnega značaja predstavljeni nelinearno (nezvezno; po domače bi rekli krivo oziroma neravno). S tovrstno tehniko se postopoma razvijejo kakovostne možganske povezave, večji del možganov postaja dejaven in napor pri preiskovalnem ali znanstvenoraziskovalnem delu postaja vse manjši. 6.3 Facetna teorija kot zanimivost Facetna teorija pomeni metodološki pristop, ki omogoča sistematično ukvarjanje s problemi.10 Teorija se pogosto uporablja na področju konstrukcijske teorije za izdelavo raziskovalnih načrtov in obdelavo dobljenih podatkov. Temelji na definicijskem sistemu univerzuma opazovanj in empirični ali izkustveni strukturi opazovanj znotraj nekega sistema. V končni fazi facetna teorija išče neko primerjavo med teorijo in empiriko oziroma med opredelitvijo in opazovanjem nečesa. Uporaba facetne teorije se sestoji iz naslednjih korakov: - opredeliti je treba področje zanimanja - strukturirati definicijski sistem, kar pomeni, da je nujno: a) opredeliti populacijo (P) b) opredeliti univerzum postavk (Q in R) c) preučiti skupni obseg postavk č) znotraj univerzuma razlikovati med posameznimi vrstami postavk d) razložiti semantiko in vlogo facet - uporabiti raziskovalno orodje - analizirati podatke v odnosu do sistema, ki ga proučujemo - nazadnje uporabiti metode, kot so posploševanje, razširitev in razlaga ugotovitev. Facete sicer pomenijo množico različnih lastnosti; v njih se razvrščajo preučevani predmeti, prvine z različnimi vrednostmi, ki logično opisujejo variacije znotraj vzorca. Sicer poznamo populacijske, vsebinske in odzivne facete. 10 Več o facetni teoriji na spletnem naslovu: http://193.2.70.110/Katedre/gradiva podipl/2 (2006-01-15). 7 Iskanje informacij na iskalniku Google11 Svetovni iskalnik (Search Engine, Suchmaschine) Google ima svoj glavni sedež v Združenih državah Amerike. Google ima po svetu mnogo predstavništev, tako je možno s tem iskalnikom izvesti poizvedbe v mnogih svetovnih jezikih (tudi v slovenščini). Vsebine na WWW v večji meri ne urejajo ljudje, temveč spletni pajki roboti (v angl.: Web Spider Robots). Tovrstni roboti preletijo vsebine številnih spletnih dokumentov po svetu in jih najprej indeksirajo, nato pa reindeksirajo. Nekateri posamezniki so vešči manipulacije s svojimi spletnimi stranmi do te mere, da preslepijo omenjene spletne pajke z raznimi zvijačami, tako da se njihova spletna stran pojavlja ob mnogih poizvedbah spletnih obiskovalcev na prvih mestih, če že ne kot prvi zadetek (npr. podjetje E- Bay, kasneje bo naveden konkreten primer iskanja na to temo). Ko imamo pred sabo odprto spletno stran Google (URL: http://www.google.com), se nam mogoče zdi prav špartanska, če že ne prekomerno skopa, po drugi strani pa je prav ta spletna stran zelo enostavna za uporabo, navigacijo ipd. Ko malce povrtamo, pa spoznamo, da skriva Google v sebi mnogo različnih storitev in veliko drugih možnosti (npr. programsko orodje za mape, zemljevide Google Earth, Google Maps, slikovni iskalnik Google Touch Graph, Google LABS idr.). V tem delu se bomo ukvarjali s številnimi možnostmi iskanja podatkov/informacij. Ob tem je treba opozoriti, da Google dovoljuje uporabo 32 besed pri iskanju in nič več (podatek z dne 15. 2. 2006). liil^liii ^unb Progam - ^Toogie ' o Goo gli}-1: 7.1 Slika 22: Glavne prvine pri svetovnem iskalniku Google Za naš namen bodo za začetek zelo pomembne spletne povezave, ki se imenujejo »Google -vse o Googlu, Nastavitve in Jezikovna orodja«. 11 Na kratko bom povzel iskalne ukaze v prilagojeni obliki z naslednje spletne lokacije: http://www.beepworld.de/members98/iskanie (2007-07-27). 7.2 Nastavitve in jezikovna orodja Na teh dveh spletnih straneh si lahko spletni obiskovalci nastavijo jezik za iskanje spletnih izdelkov (npr. knjige v PDF obliki itd. ) in jezik (in/ali državo), s katerim bi želeli poizvedovati. Na koncu določitve je treba tisto (kar smo označili, samo shraniti- pritisk na gumb »Shrani nastavitve«). Ta nastavitev je zelo enostavna. Sicer si lahko ogledate različne koristne pomoči in znanja na spletni strani, ki se imenuje »Google - vse o Googlu«! Stran je dostopna z naslednje spletne lokacije: http://www.google.si/intl/sl/about.html. Na tej strani je možno najti veliko ponudbo kakovostnih in brezplačnih storitev! 7.3 Google - pomembna opomba Preden se bomo osredotočili na poizvedbe, je treba napisati, da tovrstni iskalniki še zdaleč niso t. i. inteligentni iskalniki, ki bi zmogli dejansko tematsko razlikovati poizvedbe, ki zmorejo ugotoviti, kaj je določen spletni obiskovalec mislil, ko je izvedel poizvedbo na Googlu. Indeksni iskalniki poiščejo iz določenega besedila s spleta zgolj vsebino in če določenih besed ali pojmov v teh besedilih ni, potem prav gotovo ne boste našli zaželeno. Skratka npr. Google popiše zgolj tisto, kar je v spletnih dokumentih. 7.4 Najpomembnejši ukazi na iskalniku Google 1) Ukaz cache: S tem ukazom in dodano spletno povezavo ter operatorja AND (+) in iskalnega pojma (logistika) Google odpre želeno spletno stran in barvno označi tisto besedilo, v katerem se pojavi pojem. Tega ukaza morda mnogi ne potrebujejo in ga raje zamenjajo po izvedeni poizvedbi s klikom na besedno povezavo "Posnetek strani", kajti končni učinek je identičen. 2) Uporaba operatorjev + (and, in), OR (ali) in - (and not, in ne) Raba operatorjev je včasih je izjemno koristna, kajti poizvedovalcu lahko dejansko prikliče na površje vse tiste spletne dokumente, ki so zanj bolj uporabni oziroma relevantnejši. a) Operator AND (in) - pri iskalniku Google je predstavljen v obliki plusa, vendar Google presledek samodejno upošteva kot operator AND, tako dajanje + ni potrebno (vsaj večinoma ne). Sicer z operatorjem AND (v slovenščini IN) ožamo predmet našega zanimanja. Skratka določen spletni dokument mora vsebovati vse poizvedovalne pojme, kajti v primeru odsotnosti določenega pojma, iskalnik zaželenega dokumenta ne bo našel b) Operator OR (ali) - ta operator je treba pri iskalniku Google navesti z velikima črkama OR. Z njim širimo predmet našega zanimanja. Ta operator je zelo primeren, kadar iščemo določeno tujko v ednini ali množini. Npr.: vlomilec OR vlomilci. V tem primeru bo iskalnik poiskal vse spletne naslove, ki vsebujejo pojem vlomilec (edninska oblika) in vlomilci (množinska oblika). Ta operator je tudi zelo primeren za iskanje dveh različnih tematik npr. (kriminalistika OR kazensko pravo). Rezultat po takšni iskalni poizvedbi bo zelo širok, kajti dobili bomo spletne naslove za kriminalistiko ali kazensko pravo. Informacijska znanost pozna tudi ekskluzivni OR (XOR), ki pa se ne uporablja zelo pogosto, saj upošteva samo eno ali pa drugo npr. (kriminalistika XOR kazensko pravo). c) Operator AND NOT (in ne) - ta operator je pri iskalniku Google predstavljen kot minus. Operator NOT izpostavi razliko med dvema področjema, je izločevalne narave. Npr. (kriminalistika OR kazensko pravo) -(pravo). Uporaba tega operatorja je zelo primerna, kadar želimo pri poizvedbi izločiti komercialnega ponudnika kot je to npr. Ebay (npr. poizvedba computer - ebay). Ta operator je med drugim tudi zelo koristen za izločitev iskalnih pojmov, ki se enako napišejo, imajo pa drug pomen. Npr. iščemo spletne strani za gosenice in metulje (živali), vendar pa ne želimo dobiti gosenice od tanka. Iskalna poizvedba bi bila naslednja: (gosenice and metulje) -(tank). Conputer -ebay Q:ogle^arch 3) Iskanje s pomočjo točno določene besedne zveze ali fraze Pri iskanju točno določene besedne zveze se kot ukaz uporabljata dve navednici ("X"). Iskalnik bo našel zgolj tisti spletni dokument, v katerem se nahaja prej omenjena besedna zveza tj. "tihotapljenje oziroma nedovoljen" 4) Iskanje sinonimov s pomočjo znaka tilde (~) -droge-mamila Iskanje S pomočjo tovrstne poizvedbe bo iskalnik zajel vse tiste poizvedbe o drogah in mamilih, saj znak obravnava droge kot sinonim mamil in obratno. 5) Poizvedbe po različnih formatih npr. HTML, DOC, PDF, PPT, RTF, PPS idr. Iskanje (kriminaliteta OR krininal) +.FDF - .h™l Največje število spletnih dokumentov je objavljenih v obliki HTML, čeprav se v zadnjih letih tudi povečuje število drugih oblik kot npr. PDF in PPT. Tovrstne nekoliko bolj sestavljene poizvedbe niso tako zelo zapletene, vendar pa zahtevajo poznavanje kratic različnih formatov. Spodaj je primer poizvedbe kjer uporabnik želi odkriti vse spletne strani v slovenščini in to zgolj v PDF obliki. Vse HTML dokumente pa želi pri tej poizvedbi izključiti. 6) Ukaz define, dvopičje in beseda Z ukazom DEFINE, dvopičjem in navedbo pojma v angleščini lahko pridobimo raznovrstne opredelitve za določen pojem iz različnih spletnih enciklopedij. Slabost tovrstne poizvedbe je morda, da od uporabnika zahteva, da vsaj malo obvlada angleški jezik. 7) Poizvedba s pomočjo številčnega območja tj. ukaz N1..N2 (išči od_do_) iskanje samomori 1954„200i S tem ukazom je možno iskati npr. entitete v določenem številčnem obsegu npr. samomori od leta 1954 do 2001, razne cene aparatur, ki se gibljejo npr. od 250 do 350 dolarjev (npr. DVD player $250..350) ipd. Obravnavane ukaze je možno smiselno združiti v sestavljene ali zapletene poizvedbe in tako povečati relevantnost zadetkov po poizvedbah in hkrati zmanjšati število zadetkov (raba poizvedovalnih ukazov lahko predstavlja nekakšen filter). Za poizvedovanje na Googlu obstajajo še mnogi drugi koristni ukazi, ki jih pa v tem delu zaradi preglednosti ne navajamo.12 Pri sestavljenem ali kompleksnem poizvedovanju na Googlu lahko uporabniki sami preizkušajo različne kombinacije in s tem odkrijejo nove kakovostne učinke. Morebitne nadgradnje poizvedovalnih veščin spadajo že v okvir osebnih ali znanstvenoraziskovalnih prizadevanj, kar pa presega zastavljeno vsebino tega dela. V podpoglavju 7.5 bodo 12 Več o ukazih je na naslednjih spletnih straneh: http://www.google.si/intl/sl/about.html in http://www.beepworld.de/members98/iskanie (2007-07-27) predstavljeni spletni dokumenti za iskanje podatkov/informacij znotraj COBISSA/COBIBA, na kratko pa tudi ukazni način iskanja dokumentov na COBISSU/COBIBU. 7.5 Iskanje na vzajemnem katalogu COBISS/COBIB Osnovni in izbirni način iskanja so nekatere fakultetne knjižnice dobro predstavile, pomembni sta naslednji spletni povezavi Visokošolske knjižnice na Fakulteti za družbene vede v Ljubljani: Spletni vodnik za iskanje informacij po COBISSU/COBIBU: http://www.odk.fdv.uni-lj.si --> http://www.odk.fdv.uni- lj.si/izobrazevanje/spletni vodic/spletni vodic1.htm#1del. Gre za power pointove predstavitve, kjer je omenjena snov izjemno kakovostno in izčrpno predstavljena. V tem delu bodo na kratko predstavljene poizvedbe s pomočjo ukaznega načina iskanja, ki je koristen in učinkovit, čeprav nekoliko zahtevnejši, saj je včasih zaradi največje možne poizvedovalne učinkovitosti in natančnosti treba uporabiti različne operatorje, predpone in pripone. Uporabniki lahko na COBISS/COBIB dostopajo z naslednje spletne lokacije: http://www.cobiss.si, nakar npr. kliknejo na spletno povezavo COBIB.SI vzajemna bibliografsko-kataložna baza podatkov , nakar se odpre naslednje okno, katerega posnetek je spodaj: 7.5.1 Slika 23: Maska kataloga COBISS/COBIB Slika 23 prikazuje masko vzajemnega kataloga COBISS/COBIB, znotraj katere je možno iskati na osnovni, izbirni in ukazni način. Pri osnovnem načinu uporabnik išče po avtorjih, naslovih, letnicah, ključnih besedah in založnikih. Pri izbirnem načinu se išče po določenih dodatnih opcijah kot npr. po ISBN, ISSN, ISSN pri članku, UDK, kodi za literarno vrsto, korporativnih avtorjih, zbirkah, kodah za vrsto vsebine, predmetni oznaki vsebine, predmetni oznaki korporacije, prosto oblikovani predmetni oznaki, vseh predmetnih oznakah, državi/regiji izida, kodi za predvidene uporabnike, jeziku, šifri ustanove/organizacije itd. Ukazen način v bistvu ponudi največ možnosti, vendar je za uporabnike nekoliko zahtevnejši. Pri zahtevnem načinu iskanja se lahko uporabniki odločijo tako za vključitev predpon in pripon kot tudi brez njih, vendar morajo ob vključitvi predpon iskalni izraz opremiti še z oklepaji in zaklepaji, sicer poizvedba ne bo učinkovala. Pri oblikovanju poizvedbe je predpone enostavneje kar izpustiti. Ko uporabnik kataloga COBISS/COBIB klikne navigacijski gumb #Ukazno iskanje#, se odpre iskalna maska, ki jo prikazuje slikovni prikaz na tej strani (gl. spodaj). 7.5.2 Slika 24: Maska kataloga COBISS/COBIB za ukazen način iskanja Slika 24 prikazuje masko vzajemnega kataloga COBISS/COBIB za ukazen način iskanja, kamor uporabniki ali iskalci podatkov/informacij v iskalno polje (gl. rdeči pravokotni okvir na sliki 24) vtipkajo ustrezen izraz. S pomočjo ukaznega načina poizvedovanja je možno kot izid dobiti najbolj relevantne podatke/informacije. Nekaj tovrstnih primerov poizvedovanja bo v nadaljevanju. O ukaznem načinu poizvedovanja lahko uporabniki dobijo izčrpnejše informacije, če kliknejo besedno spletno povezavo "tehnike iskanje". Če si želijo dobiti vpogled v predpone in pripone, ki se lahko uporabljajo pri tem načinu iskanja, pa sprožijo navigacijski gumb "Pregled predpon in pripon". Če želi uporabnik dobiti na vpogled pregled pojmov, potem klikne sivo obarvani navigacijski gumb z obrnjeno puščico na desni strani. 7.6 Koristni poizvedovalni prijemi a) iskanje v območju --> PY=2000:2007 --> po izvedeni poizvedbi bodo prikazani zgolj zadetki iz časovnega območja od leta 2000 do leta 2007; b) iskanje po jeziku in območju: LA=slv AND PY=2006:2007 --> gre za omejitev poizvedbe po slovenskem jeziku (LA=slv) in območja letnice izida od leta 2006 do 2007 (PY=2006:2007); c) uporaba logičnih in kontekstnih operatorjev pri iskanju: OR, AND, NOT, W, nW, N, nN, S. Raba logičnih operatorjev (+, OR, -) je bila obravnavana na straneh od 48 do 50. Pri poizvedovanju na COBISSU/COBIBU se namesto matematičnih znakov uporabljajo besedni izrazi (npr. AND, OR, NOT). Predstavljeni pa bodo tudi kontekstni operatorji, ki določajo relativno bližino med iskalnimi pojmi in so lahko za poizvedovalca izjemno dragoceni. a) WITH (W) --> ta operator zahteva, da se oba iskalna pojma v zapisu pojavita skupaj v navedenem vrstnem redu: kriminalistična (W) tehnika --> izid iskanja je vse v zvezi s kriminalistično tehniko. b) nWITH (nW) --> oba iskalna pojma morata biti v navedenem vrstnem redu, vendar se med njima lahko nahaja n-število besed (n je lahko od 1 beseda do ...): trgovina (1W) ljudmi --> izid je npr. trgovina z ljudmi. c) NEAR (N) --> oba iskalna pojma se morata v zapisu pojaviti skupaj, vendar lahko v poljubnem vrstnem redu: Hans (N) GroB č) nNEAR (nN) --> oba iskalna pojma se lahko pojavita v poljubnem vrstnem redu in med njima lahko nastopi n- število besed: boj (1N) kriminaliteti --> izid: boj proti kriminaliteti. d) SUBFIELD (S) --> ta kontekstni operator zahteva, da se oba iskalna pojma nahajata v istem polju/podpolju določenega zapisa znotraj vzajemnega kataloga COBISS/COBIB: uspešnost (S) policija --> možen izid npr. znotraj polja/podpolja 610a (npr. v prostih predmetnih oznakah se pojavita tako ključna beseda "uspešnost" kot tudi ključna beseda "policija"!). Včasih je pri poizvedovanju koristno uporabiti znak "*" ali asterisk s katerim krajšamo določen pojem. Npr. uspe* (S) poli* --> pri čemer dobimo kot izid veliko zadetkov, kajti iskalnik bo zajel tako uspeh, uspešnost, uspešni, policija, policijske, policijsko itd. (več o tem lahko preberete na COBISSU/COBIBUpod tehnike iskanja). Bralkam in bralcem tega dela priporočam še ogled seznama poizvedb na COBISSU po posameznih strokovnih področjih iz prakse (gl. stran od 66 naprej). Seznam se bo tudi dopolnjeval! 8 Zaključek Tako v svetovnem kot tudi slovenskem merilu je možno ugotoviti, da delujejo knjižnice s precejšnjim številom neizkoriščenih potencialov, kar je še posebej zaznavno pri ponudbi storitev, ki se navadno raztezajo od izposoje gradiva, obveščanja o novostih do enostavnejšega svetovanja pri iskanju podatkov/informacij, kar ni pravilno stališče do videnja knjižnic, kajti knjižnice so pomemben dejavnik v organiziranih družbah in pogosto žrtev stereotipnih pogledov. Še zlasti za Specialno knjižnico MNZ menim, da je razvijanje novih in koristnih storitev na področju informacijskega opismenjevanja javnih uslužbencev MNZ in policije dejavnost, ki je nujna za prihodnost. Specialna knjižnica MNZ ima takšne potenciale pri razvijanju novih storitev na področju informacijskega opismenjevanja, ki lahko javnim uslužbencem posredujejo določena vedenja in znanja, ki bi lahko pripomogle k še večji kakovosti ter učinkovitosti dela. V tej izdaji, ki pa bo v prihodnosti verjetno še dopolnjena in posodobljena, sem prikazal naslednje: - posredovanje (novih) vedenj/znanj o vsakomur dostopnih programskih orodjih, ki lahko po eni strani olajšajo in izboljšajo analitične dejavnosti na področju organizacije in poslovanja javne uprave oziroma MNZ, po drugi strani pa učinkovito pomagajo pri dodatnem razvijanju timskega in interdisciplinarnega dela policije; - posredovanje (novih) vedenj/znanj o vsakomur dostopnih programskih orodjih, ki bi lahko pripomogli k boljši pripravi in organizaciji podatkov/informacij na področju administracije pa tudi operativnega policijskega dela; - posredovanje (novih) vedenj/znanj o iskalnih tehnikah, s katerimi bi si lahko uporabniki občutno izboljšali zajem pomembnih podatkov/informacij. Za Specialno knjižnico MNZ vse navedeno v oprijemljivejši obliki pomeni, da se želi poleg ponudbe klasičnih knjižničnih storitev (izposoja, bibliografija raziskovalcev, obvestila o novostih, bežno svetovanje idr.), spogledoval z izzivi prihodnosti, med katerimi naj izrecno izpostavim sodobni informacijski sistem za upravljanje z znanjem ali digitalno knjižnico. 9 Viri in uporabljena programska orodja Ackermann, E. & Hartmann, K.(2000). The information specialist's guide to searching & researching on the Internet & the World Wide Web. 2 nd. ed. Chicago, London : Fitzroy Dearborn Publishers, 438 str. Aitchison, J.(2000). Thesaurus construction and use : a practical manual. London: Aslib IMI, XIV, 218 str. Arms, W.Y.(2000). Digital Libraries. Cambridge (Mass.) ; London : The MIT Press. X, 287 str. (Digital libraries and electronic publishing). Bernstein, P.(1999). Finding statistics online : how to locate the elusive numbers you need. Medford : Information Today, 356 str. Berry, M. J. A. & Linoff, G.S.(2004). Data mining techniques : for marketing, sales, and customer relationshipmanagement. - 2nd ed. - Indianapolis (Ind.) : Wiley Pub. - XXV, 643 str. Bjorneborn, L.(2004). Small-world link structures across an academic web space : a library and information science approach. Forlag: Department of Information Studies, Royal School of Library and Information Science, 399 str. Broughton, V.(2006). Essential Thesaurus construction. London: Facet, 296 str. Buzan, T.(1980). Delaj z glavo : uspešnejše branje, hitrejše učenje, ustvarjalno mišljenje, učinkovit študij, boljše pomnjenje, reševanje problemov. Ljubljana: Univerzum, 127 str. Carter, R.(1998). Mapping the mind. London: Seven dials, 224 str. Chowdhury, G.G.(2003). Introduction to digital libraries. London : Facet. XV, 359 str. DE Ville, B.(2001.) Microsoft data mining : integrated business intelligence for e-commerce and knowledge management / Barry de Ville. - Boston [etc.] : Digital Press. - XX, 315 str. Ghaoui, C.(2004). E-education applications : human factors and innovative approaches. Hershey (PA), London [etc.] : Information Science Publishing : Idea Group, 363 str. Hatmaker.(2003). Visual thesaurus : a quick-flip brainstorming tool for graphic designers. Gloucester, Mass: Rockport, 312 str. Kljajić, M.(2002). Teorija sistemov. Kranj: Moderna organizacija, 238 str. Konchady, M.(2006). Text Mining Application Programming. Boston: Charles River Media. XIX, 412 str. + CD-ROM. Martin, E.(2004). Specialist computing's computer jargon : dictionary and thesaurus. Tonbridge: Biddles, 352 str. McCue, C.(2007). Data Mining and Predictive Analyses : intelligence gathering and crime analyses. Oxford ...: Butterworth-Heinemann. XXXI, 332 str. Mena, J.(2003). Investigative Data Mining for Security and Criminal Detection. Oxford: Buterworth-Heinemann. XVI, 452 str. Pace, A. K.(2003). The ultimate digital library : where the new information players meet. Chicago : American Library Association. XVII, 168 str. Urbanija, J.(1996). Metodologija izdelave tezavra. Ljubljana: Filozofska fakulteta, Oddelek za bibliotekarstvo, 70 str. WESTPHAL, C. & Blaxton, T.(1998). Data mining solutions : methods and tools for solving real-world problems. New York [etc.] : J. Wiley & Sons, XXII, 617 str. : Članki Lavbič, D. & Krisper, M.(2005). Semantika podatkov in ontologije. V: Uporabna informatika. - ISSN 1318-1882. Letn.13, št. 3 (2005), str. 121-135. Rosemann, U.(2003). Information networks and specialized virtual libraries: The beginning of a marvelous collaborative effort?. ZEITSCHRIFT FÛR BIBLIOTHEKSWESEN UND BIBLIOGRAPHIE, 50 (1), 13-18 JAN-FEB. Saracevic T. & Dalbello, M.(2001). A survey of digital library education. PROCEEDINGS OF THE 64TH ASIST ANNUAL MEETING, VOL 38, PROCEEDINGS OF THE ASIST ANNUAL MEETING, 38, 209-223. McKay D. & Cunningham S.J.(2003). Browsing a Digital Library : A new approach for the New Zealand Digital Library. DIGITAL LIBRARIES: TECHNOLOGY AND MANAGEMENT OF INDIGENOUS KNOWLEDGE FOR GLOBAL ACCESS LECTURE NOTES IN COMPUTER SCIENCE, 2911, 329-339. Woldering, B.(2004). EU-project The European Library (Tel) successfully finished. Knjižnica, 48(1-2), 223-235. Spletni viri Google vse o Googl-u.[elektronski vir]. Dosegljivo na URL: http://www.google.com/intl/sl/about.html (2005-11-15). Podlesek, A. [elektronski vir]. Facetna teorija : metodologija psihološkega raziskovanja. Dosegljivo na URL dne: http://193.2.70.110/Katedre/gradiva podipl/2 (200601-15) http://inquirer.philly.com/graphics/murders map (2006-11-12) http://www.stat.si/doc/pub/rr798-2003/10/T10-01-01.htm (2007-07-20) Digitalne knjižnice (DK) Evropska unija (EU) http://www.delos.info/files/pdf/events/2004 Jul 8 10/D8.pdf (2007-06-02) Prihodnja vizija DK. http://www.ercim.org/publication/Ercim News/enw66/ioannidis.html (2007-06-02) Prihodnost DK in dosedanje stanje. http://delos-noe.iei.pi.cnr.it/activities/researchforum/Brainstorming/brainstorming-report.pdf (2007-06-02) EU raziskovalni program DK. http://ec.europa.eu/information society/activities/digital libraries/index en.htm (2007-06-02) Digitalne knjižnice v EU leta 2010. http://www.davidmattison.ca/wordpress/?p= 1416 (2007-06-02) Vizija EU glede DK. http://www.edis.sk/ekes/interim report 16 10 06.pdf (2007-06-02) Pobude EU glede DK. Uporabljena programska orodja UML Visual Paradigm Community edition --> dosegljivo na URL: http://www.visual-paradigm.com (2007-09-03). Programsko orodje uporabil z dovoljenjem proizvajalcev! TMeV 4.0 --> Saeed AI, Sharov V, White J, Li J, Liang W, Bhagabati N, Braisted J, Klapa M, Currier T, Thiagarajan M, Sturn A, Snuffin M, Rezantsev A, Popov D, Ryltsov A, Kostukovich E, Borisovsky I, Liu Z, Vinsavich A, Trush V, Quackenbush J. TM4: a free, open-source system for microarray data management and analysis. Biotechniques. 2003 Feb;34(2):374-8. --> dosegljivo na URL: http://www.sigenae.org/index.php?id=88 (2007-0903). Saeed et al., Methods in Enzymology, Volume 411 (Part B), Chapter 9, pp. 134-193, A. Kimmel, B. Oliver ed., Elsevier Inc., London, 2006. http://www.amazon.com/DNA-Microarravs-Part-Statistics- Enzvmoloqv/dp/0121828166/ref=si3 rdr bb product/103-4162286-5329410 Programsko orodje uporabil z dovoljenjem proizvajalcev! Orange Canvas dosegljivo na URL http://www.ailab.si/orange (2007-09-03) --> prosta koda (open source). Ilog Discovery dosegljivo na URL http://www2.ilog.com/preview/Discovery @inproceedings{ 1148642, author = {Thomas Baudel}, title = {De la visualisation \&\#224; la manipulation directe d'information avec ILOG discovery}, booktitle = {IHM 2004: Proceedings of the 16th conference on Association Francophone d'Interaction Homme-Machine}, year = {2004}, isbn = {1-54321-876-9}, pages = {183--186}, location = {Namur, Belgium}, doi = {http://doi.acm.org/10.1145/1148613.1148642}, publisher = {ACM Press}, address = {New York, NY, USA}, } @inproceedings{1166265, author = {Thomas Baudel}, title = {From information visualization to direct manipulation: extending a generic visualization framework for the interactive editing of large datasets}, booktitle = {UIST '06: Proceedings of the 19th annual ACM symposium on User interface software and technology}, year = {2006}, isbn = {1-59593-313-1}, pages = {67--76}, location = {Montreux, Switzerland}, doi = |http://doi.acm.org/10.1145/1166253.1166265l, publisher = {ACM Press}, address = {New York, NY, USA}, } and @inproceedings{985925, author = {Thomas Baudel},title = {Browsing through an information visualization design space}, booktitle = {CHI '04: CHI '04 extended abstracts on Human factors in computing systems}, year = {2004}, isbn = {1-58113-703-6}, pages = {765--766}, location = {Vienna, Austria}, doi ={http://doi.acm.org/10.1145/985921.985925}, publisher = {ACM Press}, address = {New York, NY, USA},} Programsko orodje uporabil z dovoljenjem proizvajalcev! AntConc 3.2.1 dosegljivo na URL: http://www.antlab.sci.waseda.ac.ip/software.html (200709-03) Programsko orodje uporabil z dovoljenjem proizvajalca! Sicer spada to orodje pod prosto kodo (open source) yED 2.3.1_02 dosegljivo na http://www.opensource.org/licenses/bsd-license.htm (2007-0903) --> odprta koda (open source) uDig dosegljivo na URL: http://udig.refractions.net/confluence/display/UDIG/Home (200709-03) --> odprta koda (open source) Soziogramm dosegljivo na URL: http://pabst.heim.at/Soziogramm/Download.htm (2007-0903) --> odprta koda (open source) CBA 1.0 dosegljivo na URL: http://www.comp.nus.edu.sg/~dm2 (2007-09-03) Programsko orodje uporabil z dovoljenjem proizvajalca! WinIdams dosegljivo na URL: http://www.unesco.org/idams (2007-09-03) --> odprta koda (open source). Rapid Miner Beta version dosegljivo na URL: http://rapid-i.com/content/view/26/82 (200709-03) Programsko orodje uporabil z dovoljenjem proizvajalca! Midos Thesaurus 2000 demo version dosegljivo na URL: http://www.progris.de (2007-09-03) Programsko orodje uporabil z dovoljenjem proizvajalca! Free Mind 0.8.0 dosegljivo na URL: http://freemind.sourceforge.net/wiki/index.php/Main Page#Download and install (2007-0903) --> odprta koda (open source). 10 Priloga: primeri poizvedb s področja kriminologije, kriminalitete, kaznivih dejanj in viktimologije - ukazni način Znanstveni članki v Sloveniji - poizvedbe na COBISS/COBIB MNZ RS LEGENDA kratic in kod: TD ... tipologija dokumentov ; 1.01 ... koda za znanstvene članke ; LA ... jezik ; slv ... koda za slovenščino ; PY ... leto izida ; 1991:2007 ... od 1991 do 2007 ; and ... Booleov operator in ; OR ... Booleov operator ali ; (W) ... kontekstni operator z / s (angl. with) ; (S) ... kontekstni operator podpolje (angl. subfield) policija and TD=1.01 and LA=slv and PY=1991:2007 viktimologija and TD=1.01 and LA=slv and PY=1991:2007 prometna (W) varnost and TD=1.01 and LA=slv and PY=1991:2007 kazensko (W) pravo and TD=1.01 and LA=slv and PY=1991:2007 penologija and TD=1.01 and LA=slv and PY=1991:2007 policija (S) policijsko (1W) delo and TD=1.01 and LA=slv and PY=1991:2007 policija (S) organizacija and TD=1.01 and LA=slv and PY=1991:2007 sodna (1W) medicina and TD=1.01 and LA=slv and PY=1991:2007 kriminologija and TD=1.01 and LA=slv and PY=1991:2007 kriminologija and umori and TD=1.01 and LA=slv and PY=1991:2007 gospodarska (W) kriminaliteta and TD=1.01 and LA=slv and PY=1991:2007 javna (W) uprava and TD=1.01 and LA=slv and PY=1991:2007 terorizem and TD=1.01 and LA=slv and PY=1991:2007 Znanstveni članki v Sloveniji - poizvedbe na COBISS/COBIB kriminologija and TD=1.01 and LA=slv viktimologija and TD=1.01 and LA=slv kriminalistika and TD=1.01 and LA=slv and PY=1991:2007 kriminalistične tehnike and TD=1.01 and LA=slv and PY=1991:2007 kriminalistične taktike and TD=1.01 and LA=slv and PY=1991:2007 kriminalistične tehnike and TD=1.01 and LA=slv and PY=1991:2007 kriminalistična metodika and TD=1.01 and LA=slv and PY=1991:2007 (kriminaliteta OR kazniva (W) dejanja) and TD=1.01 and LA=slv kriminaliteta and TD=1.01 and LA=slv TD=1.01 and LA=slv and kriminalna (W) statistika OR policijska (W) statistika OR kriminalitetna (W) statistika kazniva dejanja and TD=1.01 and LA=slv