MINISTRSTVO ZA NOTRANJE ZADEVE RS Vizualna analiza bibliografskega omrežja in odkrivanje novih znanj Predstavitev postopka in nekaterih programskih orodij Avtor: Dr. Karl Petrič V Ljubljani, 2011 Kazalo 1 Uvod 3 1.1 Namen oziroma cilj dela 3 1.2 Metodologija in metodološka orodja 3 2 Postopek priprave, procesiranja, obdelave in analize podatkov 5 2.1 Slika 1: Priprava podatkov za procesiranje obdelavo in analizo omrežij 5 2.2 COBISS/COBIB 7 2.2.1 Slika 2: Del prikaza prenosa zapisov s COBIB 7 2.2.2 Slika 3: Zgradba datotečnega formata .RIS 8 2.3 JabRef 9 2.3.1 Slika 4: Posnetek delovne plošče programskega orodja JabRef 9 2.4 Network workbench 10 2.4.1 Slika 5: Posnetek delovne plošče programskega orodja Network workbench 10 2.4.2 Slika 6: Posnetki različnih omrežij s pomočjo vizualizacijske tehnike Gem 11 2.4.3 Slika 7: Analiza omrežja s pomočjo programskih orodij Cytoscape, dyNet in Biolayout express 12 3 Vizualna analiza 13 3.1 Slika 8: APC grozdenje znotraj združenega omrežja za avtorje, revije ... 14 3.2 Slika 9: Grozdenje z MCODE in AllegroMcode 18 3.3 Slika 10: Ugotavljanje najbližjih sosedov in najkrajših poti s pomočjo ... 19 3.4 Slika 11: Najmočnejši grozdi 20 3.5 Slika 12: Stopnja moči vozlišč oziroma grozdov 21 3.6 Preglednica 1: Izidi za najpomembnejša vozlišča oziroma grozde 22 3.6 Slika 13: Glay vizualizacija za najpomembnejše grozde 22 3.7 Slika 14: Vizualizacija K-means grozdenja s pomočjo gnezd 24 3.8 Slika 15: Vizualizacija in simulacija grozdov z Biolayout express 25 3.9 Slika 16: Vizualno programiranje podatkov o vhodih in izhodih grozdov 25 3.9.1 Slika 17: Vizualizacijske tehnike izdelane s pomočjo Orange Canvas 26 3.9.2 Preglednica 2: Del podatkov o 10 grozdih 27 3.9.3 Slika 18: Raztreseni diagram 10 grozdov 27 4 Zaključek 29 5 Viri in uporabljena programska orodja 30 5.1 Uporabljena programska orodja 36 1 Uvod Odkrivanje zakonitosti oziroma novih znanj znotraj številnih bibliografskih zapisov je v današnjem času lahko podprto z različnimi odprtokodnimi programskimi orodji. Gre za programska orodja, ki zmorejo procesirati različne formate in jih analizirati v učinkovite mrežne vizualizacije. Omenjene vizualizacije je v nadaljevanju možno uporabiti kot pripomoček za nadaljnje razvijanje idej in znanj. Programska orodja za vizualizacijo omrežij so si nekoliko podobne, vendar tudi precej različne. Vizualizacijske tehnike, ki jih omogočajo ta orodja se bistveno ne razlikujejo med sabo. Večje razlike je možno najti glede na zmožnosti podpiranja različnih formatov kot so npr. graphml, xgmml, tgf, sif, cys, nwb, xml, dyn, layout. V tej poplavi številnih datotečnih formatov, se različni proizvajalci odprtokodnih rešitev še niso uspeli dogovoriti o tem, da bi še tesneje med sabo sodelovali. V tem času vlada osnovno pravilo, da je zelo koristno in smiselno poznati ter uporabljati različna orodja za vizualno analizo velikih omrežij (npr. avtorjeva, semantična) in s tem lahko izrazito povečamo možnosti analize podatkov. 1.1 Namen dela oziroma cilj dela a. predstavitev možnega postopka za analizo 537 bibliografskih zapisov s področja sodstva, demonstracij, migracij, človekovih pravic, kriminologije, sodnih ved idr. v letu 2011 s slovenske vzajemne zbirke podatkov COBIB. b. prikaz različnih možnosti (vizualnih) analiz. c. kratka predstavitev možne analize bibliografskega omrežja 1.2 Metodologija in metodološka orodja Metoda raziskovanja: a. zajetje 537 bibliografskih zapisov za leto 2011 s področja migracij, človekovih pravic, kazenskega prava, kriminalitete, kriminologije, javne uprave, policije, sodnih ved in strelnega orožja. b. pretvorbe v ustrezne datotečne formate c. procesiranje, obdelava in analiza pripravljenih podatkov s pomočjo programskih orodij za analizo in vizualizacijo velikih omrežij. Metodološka orodja: a. COBISS/COBIB - vzajemna zbirka podatkov kataložnih oziroma bibliografskih zapisov. Na tej zbirki sem z ustreznimi poizvedbami (npr. TD=1.* and PY=2011 and (SU=kriminlogi* OR SU=kriminalis*) pripravil podatke v obliki RIS formata. b. JabRef - v programsko orodje za upravljanje z bibliografskimi zapisi sem uvozil 537 pripravljenih oziroma zajetih zapisov v RIS formatu. Ob tem je JabRef zaznal dvojnike, ki sem jih lahko s pomočjo ukaza izločil. V naslednji stopnji sem uvožene zapise shranil v obliki BIB. c. Network workbench - v programsko orodje sem naložil .BIB datoteko, nakar sem sprožil ukaz kot npr. Extract directed network. V nadaljevanju sem določil vir in cilj podatkovne množice, nakar sem še določil vizualizacijsko tehniko Guess/Gem (podrobneje o tem postopku v naslednjem poglavju). d. Druga uporabljena programska orodja za pretvorbo v ustrezne datotečne oblike (npr. XGMML, GML, GRAPHML, TGF, .LAYOUT, CYS idr.) in nadaljnjo analizo - dyNet, visualizer, Cytoscape, Biolayout express, Yed graph editor, VosViewer). Preizkusil sem še druga orodja kot npr. Visone, Gephi, Netdraw, Pajek, ORA Casos in SCI2 tool, ki se v tej kratki pilotni raziskavi niso najboljše izkazale. e. Alternativna programska orodja za odkrivanje zakonitosti v podatkih / besedilih npr. CBA 1.0 (za ugotavljanje asociacijskih pravil) in Orange Canvas (npr. za ugotavljanje razmerja med različnimi preučevanimi entitetami). 2 Postopek priprave, procesiranja, obdelave in analize podatkov 2.1 Slika 1: Priprava podatkov za procesiranje obdelavo in analizo omrežij Slika 1 prikazuje pripravo podatkov za procesiranje, obdelavo in analizo omrežij s programskimi orodij. Na vzajemni zbirki bibliografskih podatkov COBIB sem najprej izvedel poizvedbe. Na podlagi poizvedb sem kot izid dobil zapise oziroma zadetke, ki sem jih nato izvozil v košarico. Zapise sem na disk shranil v obliki RIS formata, nakar sem jih uvozil v programsko orodje JabRef. S pomočjo JabRef sem lahko samodejno izbrisal okoli 20 dvojnikov zapisov, tako da sem kot končni izid imel 537 bibliografskih zapisov. Dobljeno zbirko podatkov sem nato shranil v .BIB datotečno obliko. Prav ta datotečni format je ključen za procesiranje podatkov skozi programsko orodje Network workbench in posredno tudi pomemben, za pridobivanje drugih od XGMML, XML, CYS, Dyn, LAYOUT, TGF in celo GRAPHML. V tem labirintu različnih datotečnih formatov, se pojavlja še precejšnje število odprtokodnih programskih rešitev, ki zmorejo vizualno analizirati velika socialna in semantična omrežja, ki pa ne podpirajo vseh formatov enakovredno. Prav zaradi tega je bilo potrebno kar nekaj znajdljivosti in preizkušanja, da sem lahko prvotno dano analitično zmožnost uspešno nadgradil. V tem delu ne nameravam podrobneje poročati o pretvorbah različnih datotečnih formatov in o njihovem uvozu ali izvozu v številna programska orodja, ampak bom raje predstavil pilotno vizualno analizo omrežja avtorji v odnosu z revijami. K sliki 1, bi zgolj še zapisal, da sem pri tej analizi uspešno uporabljal programska orodja kot npr. Network workbench, dyNet, Cytoscape, Biolayout express in deloma Yed graph editor ter CIKNOW Visualizer. Manj uspešno sem uporabljal SCI2 tool (ne podpira znake Windows CP 1250), Visone, Gephi, Ora Casos in Netdraw. V nadaljevanju dela sem še kot koristno zanimivost uporabil programski orodji (na sliki 1 ju nisem navedel) CBA 1.0 association rules in Orange Canvas zaradi odkrivanja zanimivih vzorcev oziroma razmerij med preučevanimi entitetami oziroma kazalci. 2.2 COBISS/COBIB Q Baze podatkov G^ Iskanje fŽBri Rezultati iskanja Košarica Moja knjižnica Prenos zapisov za osebno uporabo Pojasnilo Pri tekstovnem formatu se izpisi p rilca Žejo na zaslonu v tekstovni obliki in jih lahko shranimo v datoteko v svojem lokalnem okolju ali pa Jih izpišemo na tiskalnik. Pn formatu RIS se pokaže besedilo o pogojih uporadein povezava do izbranih zapisov, ki so za prenos na voljo tri Oni, Ce kliknemo povezavo, se zapisi pnka!ejc na zaslonu in jih lahko shranimo v datoteko v svojem lokalnem okolju, Shranjeno datoteko lahko uvozimo v različne programe za upravljanje z referencami, kot so npr, Refrvorks. EndNete, EndNote Web. ProCite, Reference Manager, način uvoza pa je odvisen cd samega programa, Pri uvažanju je treba izbrati format RIS. v nekaterih programih (npr, Reworks i pa tudi nabor znakov UTF-S, Pogoji uporabe - Uporaba zapisov iz fcaz podatkov in online katalogov v sistexu C03IS5/0FAC sa osebne uporabe }e fcrez creji-ev in brezplačna. - Knjižaioe in drugi uporabnim ne ssejo v nobeni obliki reproducirati rezultatov iaJcanj« v bazah podatkov z nasiencsi preprodaje. - Knjižnice in drugi uporabniki nimajo pravice prenosa oziroma jcopiranja zapiscr/psdattar, pridobljenih z uporabo prenosa zapiacv iz košarice 'v'_ Strinjam se s pogoji uporabe: j POTRDI [ T NA VRH | Baze podatkov tekanje I Rezultati tskanja I Košarica ! Moja knjižnica ! izhcd POGOJI UPORm.BE © iZUF,r, 1997-2011 Baze podatkov C^ Iskanje Rezultati iskanja Košarica Košarica * Št Avlor Naslov Vrsta gradiva Jezik Leto 17 1. 1:itnil Odreja, 1 985 Ferspelti.e kriminologije y času brez perspektive [5] članek - sestavni del siv 2011 17 2. S.....>lle Afimache im IJet kirK!.■ rj.■ m ograifte članek - sestavni del ger 2011 !7 3. Biutin. Heike. 1971-GroS, Kathrfh Produl t und F.larl enpiraterie; die Bekampfung der Produkt- und I.lari:enpir3terie .'his Sicht or. Polizei. Zoltf3hndung und Unternehmen clentk - sestavni del ger 2011 17 J. Wamecke, Volker Knabe. Oliver -bofallen und Simloekeritfemunsen : ermrttlungstaktische Erjatirungen und rechtliche ee.vcrtung spezieler Forrvren der luk-Kriminalrtat članek-sestavni del ger 2011 |7 C Simmrofc Ttiomas Kriminalpoliiei im 21 Jshihundeil • Anpassung oder ADschatlfting? članek-sestavni del ger 2011 [7 6. Bedingungsios bnilal članek - sestavni del ger 2011 17 7. Bud den brock. Andrea von f.lantrailing ais Ermiitiungshilfe - dargesteilt an konkreten Fallen Članek - sestavni del ser 2011 17 S Stoa.Jiirgen Hen Annette Die international KnnmnaipoliLeiliche Organisation ilKPO-lnterpol). l Teli članek ■ sestavni del ger 2011 17 a. NIssb, Reingard 20 Jahre Knminaiitaisbekamprung - Zu emigen ausgetvShlten Enhvicklungspro-essen in der kilmlnalletlsctien Trie arte und P ranis ^ članek - sestavnidel ger 2011 17 10. Mlscnkowitz, Robert. 1953-BeCKer, Helmut Die neue Poliieilicne Knminalsfcatishk: ein erster Ertaftrungsberlcht g] Članek - sestavni del ger 2011 [7 11. Unjer. Joachim ieichichii ernes Kriegsschicksals Fund von Bombe no pfern in Dresden Hj članek - sestavni del ger 2011 17 12. Hoppmenn. Gerhard -Jterssesummung Dei Knochenfunden ein Fall aus der P ranis [r] članek - sestavnidel ger 2011 P 13. Čelifc. Fails Kriminalistično usposabljanje naših varnostnih sii11 zgodovine ^ članek - sestavni dei Siv 2011 F 14. Jaeger, RoKRainer 200 Jahre Kripo in Berlin Loti den Krimmalisten. ener auoh fehlende A-ertscnafrjng krimlnelletlBcher Aibe jt durch die PolKttc - Persp^Srtii und Hendlungszwange? g članek - sestavni del ger 2011 [7 15. Hliz, Robert Drogen, Brands Schuhspuren Knminallechmk članek - sestavni del ger 2011 1? 16. Brauer. Michael Sniffing - eine neue Form des Skimmings7 g članek - sestavni del ger 2011 (7 17, Trsutie. Daniela l.loglichkeiten deutscher Slraf*erfol§ungsbehčrden bei der EekampfLing des Skimmings g članek-sestavni del ger 2011 2.2.1 Slika 2: Del prikaza prenosa zapisov s COBIB Slika 2 deloma prikazuje prenos zapisov s COBIB in njihovo pretvorbo v RIS format. Ob tem je potrebno nujno izpostaviti problem o velikanski omejitvi izvoza bibliografskih zapisov na število sto, kar precej ovira učinkovito in hitro pripravo podatkov. Mimogrede bi zgolj Število zapisov: 50 Nabor znakov; | Windows 1250 3 Formal zapisov: | RIS 3 Opozorilo: Nabor znakov za format zapisov RiS je lafcfoo sa«no Uncoae (UTF-E Izberite vrsto prenosa r po e-pošti na naslov: |_ C na zaslon: COBiSS/OPAC, V6.0 Predlogi' Pošljite jih na: ccbis3uger©izjjm.si Moja knjižnica pripomnil, da bi lahko IZUM vsaj članom sistema COBISS omogočal izvoz vsaj do 1000 zadetkov. TY - JOUR ID - 11534961 TI - Perspektive kriminologije v česj brez perspektive JF - FF AU - Tretnik, Andreje Y1 - 2011///22. 3ep. KW - kriminologije KW - konference KW - ocene in poročile VL - 30 IS - 3 6 5F - str. 29 CY - Lj\ibljene F3 - Go3pcdar3ki ve3tnik SN - 0352-0730 ER - TY - JOUR ID - 3261354 TI - Sexuelle Anmecne im. Metz : Kinderpornogrefie JF - Kriminalpolizei Y1 - 2011///Jan./Jul. HI - Gle; tudi: http ://www. inhope . org./Lifcrarie3/Annua.l_repcrt3/2 010_iinnua.l_repcrt. 3f It. a3l-;x NI - Glej tudi: http ://www. dcfpi . de/trcschueren-zu-queliteet33tenderd3 .html KW - otroci KW - spolne zlorete KW - žrtve KW - pedofilije KW - zlorabe internets KW - krimir.elistične preiskeve KW - preprečevanje kriminalitete IS - 67 5F - 3tr. 8 EF -9 CY - Nien FB - #Die #KrimineIi3ter. SN - Y5Q5-04Q5 ER - 2.2.2 Slika 3: Zgradba datotečnega formata .RIS Slika 3 prikazuje bibliografski zapis v obliki datotečnega formata .RIS. Ustrezno .RIS datoteko sem v nadaljevanju raziskovalnih prizadevanj uvozil v programsko orodje JabRef. O tem nameravam poročati v nadaljevanju. 2.3 JabRef ihft . . -V f / ■ S^PHfŠ ur. 2.3.1 Slika 4: Posnetek delovne plošče programskega orodja JabRef Slika 3 prikazuje posnetek delovne plošče programskega orodja JabRef, ki se uporablja za upravljanje z bibliografskimi podatki. Omenjeno orodje poleg organizacije podatkov omogoča tudi učinkovito iskanje in filtriranje zadetkov. Ob nadgradnji osnovnega modula JabRef s številnimi vtičniki, lahko zelo obogatimo njegovo funkcionalnost. Zgradba .BIB datotečnega formata je naslednja: @ARTICLE{, author = {Batis, Roman}, title = {Facebook demonstracije}, journal = {Varnost}, year = {2011}, volume = {59}, pages = {str. 23--24}, number = {1}, address = {Ljubljana}, comment = {Strokovni prispevki Nasl. z nasl. zaslona Opis vira dne 19.5.2011}, issn = {2232-318X}, keywords = {demonstracije, neredi, protesti, Hrvaška, socialna omrežja}, owner = {Petric}, publisher = {Ministrstvo za notranje zadeve, Sektor za notranje zadeve}, refid = {3203528}, timestamp = {2011.09.27}, url = {http://www.mnz.gov.si/fileadmin/mnz.gov.si/pageuploads/VARNOST/Varnost01_11.pdf} } Prikazana zgradba podatkov je osnova, ki jo lahko procesira npr. programsko orodje Network workbench. 2.4 Network workbench File Preprocessing Modeling Analysis Visualization Scientometrics Help jnjxj S Console rhe Network Workbench project (http://nwb.slis.indiana.edu) is supported in part by the N5FIIS-0513650 award. The primary investigators are Dr. Katy Borneo Dr. Albert-liszlo Barabasi, Dr. Santiago Schnell, Dr. Alessandro Vespignani, Dr. Stanley Wasserman, and Dr. Eric A. Wernert. The NWB tool was developed by Weixia (Bonnie) Huang, Russell J. Duhon, Micah W. Linnemeier, Patrick Phillips, Chintan Tank, Joseph Biberstine, Timothy Kelley, Duygu Balcan, Mariano Beiro, Bruce W. Herr II, Santo Fortunato, Ben Markings, Felix Terkhorn,Heng Zhang, Megha Ramawat, Cesar A, Hidalgo, Ramya Sabbineni, VivekThakre, Ann YlcCranie, Alessandro Vespignani, and Katy Borner. Network Workbench uses the Cyberinfrastructure Shell (http://cishell.org) developed at the Cyberinfrastructure for Network Science Center (http://cns.slis.indiana.edu) at Indiana University, Jlease cite as follows: \IWB Team. (2006), Network Workbench Tool, Indiana University, Northeastern University, and University of Michigan, http://nwb.slis.indiana.edu, ,oad,.. was selected, documentation: https://nwb.slis.indiana.edu/community/?n=DataFormats.HomePage .oaded: D:\Lokalni dokumenti\Kniiznic_inform_problemov\AvtorSeman_mre2a\Meritve_COBIB\COBIB_MT.bib d Remove From List Remove completed automatically Remove all completed | (j^) j .■j i 4 ! ;Alyorithm.Name Date Time. | % Complete 0 ■štract Directed: Networt 09/30/201.1 11:54:36 AM BBBSBBBBBBBi 0 loadl. 09/30/2011 li;:53:54AM IlilllKKilliiiiri iiiai.Qata Manager B jS-.BjbTeX File: S:fatalni dal Metwork with directec d 2.4.1 Slika 5: Posnetek delovne plošče programskega orodja Network workbench Slika 5 prikazuje posnetek delovne plošče programskega orodja Network workbench (v nadaljevanju: NWB). S procesiranjem podatkov v .BIB obliki NWB nima posebnih težav, saj jih predela brez zapletov in izgub. NWB omogoča različne vrste ekstrakcij podatkov od npr. usmerjenega, avtorjevega / pojmovnega pa tja do omrežja sočasnega pojavljanja različnih entitet (avtorji, ključne besede, revije idr.). NWB vsebuje tudi zavihek za vizualizacijo podatkov, znotraj katerega sem uporabljal še zlasti Guess vizualizacijski vmesnik. Znotraj Guess lahko izberemo različne vizualizacijske tehnike kot npr. Gem, Physics, Fruchtermann Rheingold, klasične krožne vizualizacije idr. V tem primeru sem se odločil za vizualizacijski prikaz Gem. 2.4.2 Slika 6: Posnetki različnih omrežij s pomočjo vizualizacijske tehnike Gem Slika 6 prikazuje posnetke različnih omrežij, ki so bila izdelana s pomočjo vizualizacijske tehnike Gem. Izbral sem naslednja omrežja: a. omrežje avtor - revija: gre za prikaz odnosa med avtorji in revijami oziroma serijskimi publikacijami (avtorji so vhodne točke, medtem ko revije izhodne), b. omrežje avtor - leto: prikazuje se plodovitost avtorjev v določenem časovnem obdobju, c. omrežje avtor - URL: razmerje med avtorji in URL, d. omrežje avtor - ključna beseda: ugotavlja se v bistvu, s katerim področjem je kakšen avtor povezan?, e. omrežje so- pojavljanja avtorjev: preučuje se kateri avtorji pogostokrat nastopajo skupaj?, f. omrežje avtorji - naslovi del: prikaže se odnos med avtorji in naslovi del. V primeru, da smo kot raziskovalci zadovoljni s prikazanimi izidi, lahko raziskavo nemudoma zaključimo. V nasprotnem primeru pa moramo najti poti in orodja, ki bi nam lahko omogočila analitično nadgradnjo. Kot prvo je potrebno NWB-jevo shranjeno .XGMML/XML (prefused) datoteko uvoziti v programsko orodje dyNet in jo shraniti kot .XGMML. Šele nato lahko to .XGMML datoteko uvozimo v programsko orodje Cytoscape, ki omogoča uporabo številnih koristnih vtičnikov za nadaljnjo (statistično) analizo omrežij. Dynet tudi omogoča izvoz podatkov v .layout format (tudi v graphviz, pajek idr.), tako da je možno podatke še procesirati in analizirati s programskim orodjem Biolayout express. Nekoliko več o tem v nadaljevanju. 2.4.3 Slika 7: Analiza omrežja s pomočjo programskih orodij Cytoscape, dyNet in Biolayout express Slika 7 prikazuje analizo omrežja avtorji - revije, ki je bila izvedena s pomočjo programskih orodij Cytoscape, dyNet in Biolayout express. Na osnovi že zapisanega postopka je bilo možno podatke iz NWB procesirati skozi dyNet (analiza K-means grozdenje: razvrščanje v skupine na principu bližine preučevanih vrednosti) in nato še skozi Cytoscape (npr. APC grozdenje t.j. v prenesenem pomenu napovedovanje kritičnih točk v omrežju, sicer v biologiji APC pomeni gen, ki je lahko odgovoren za določeno rakavo obolenje, pertubacijska analiza t.j. ocena učinkov razmnoževanja interakcij znotraj omrežja pred in po nastanku motenj), ustvarjanje besednih oblakov gl. srednji del slike 7) ter Biolayout express (odkrivanje nenaravnih grozdov, znotraj katerih se nahajajo nekatera vozlišča, ki imajo zelo malo povezav). V nadaljevanju si bomo pobliže ogledali primer možne analize bibliografskega omrežja s pomočjo NWB, dyNet in Cytoscape. Na podlagi ugotovitev oziroma spoznanj, bom poskušal razviti nova znanja, ki se v bistvu skrivajo v podatkovnih množicah. 3 Vizualna analiza V tem poglavju bom predstavil možno analizo 537 bibliografskih zapisov. Kot prvo je potrebno odgovoriti na naslednjo vprašanje: V čem je koristnost analize bibliografije? Bibliografije vsebujejo mnogo podatkov kot npr. avtorje, naslove del, kraj izdaje dela, letnico izdaje dela, vrsta publikacije, založbe, konferenčna dogajanja, ključne besede idr. Bibliografija je že sama po sebi namenjena temu, da posreduje uporabniku osnovne informacije o gradivu in vsebini. Z vidika bibliografa / bibliotekarja pomeni bibliografija tudi pripomoček za organizacijo podatkov / informacij, s katerim je možno določene podatke / informacije laže najti. Pri analizi bibliografij lahko izluščimo povezave med npr. avtorji / publikacije, avtorji / založbe, kraji / konference in časovne vrste, tematike / avtorji, revije / spletni naslovi (katere revije obstajajo zgolj ali pa tudi v elektronski obliki?), so- pojavljanje avtorjev znotraj bibliografije, najbolj citirane revije, najbolj citirani avtorji, sodobnost knjižničnega gradiva v času. Vizualna analiza bibliografij nam omogoča ugotoviti najbolj obdelana področja znanosti in stroke v določeni državi ali celo v svetu, manjkajoča prizadevanja pri objavljanju publikacij s področja, ki bi ga bilo bolj potrebno spodbuditi, plodovite (kje se nahaja največ koristnega znanja z določenega področja) in manj plodovite avtorje, znamenite avtorje in publikacije (odkrivanje velikih in majhnih socialnih omrežij), kateri dogodki npr. seminarji, konference utegnejo biti za določeno organizirano združbo koristni, odkrivanje novih projektov idr. 3.1 Slika 8: APC grozdenje znotraj združenega omrežja za avtorje, revije, ključne besede, založbe in geografske lokacije Slika 8 predstavlja celovit vpogled APC grozdenja znotraj združenega omrežja za avtorje, revije, ključne besede, založbe in geografske lokacije. Algoritem APC (sicer bolj uveljavljen v bioinformatiki) je namenjen temu, da znotraj velikega omrežja prepozna pomembne grozde ali klustre. Vse pomembne grozde je označil z rumeno barvo. Pri preučevanju omrežja sem tudi uporabil MCODE algoritem, ki najde tiste grozde znotraj podgrafov, za katere je značilna visoka stopnja povezanosti z drugimi. S pomočjo MCODE sem izpeljal 19 najpomembnejših grozdov. Dobljene grozde sem razvrstil z ozirom na število članov oziroma zadetkov na naslednji način (predstavniki grozdov so avtorji in založbe): 1. Grozd 1 vsebuje 34 zadetkov (npr. Pirc Musar, Ribičič) 2. Grozd 16 vsebuje 22 zadetkov (npr. Dolata, Ritter) 3. Grozd 26 vsebuje prav tako 22 zadetkov (npr. Dobovšek, Lobnikar) 4. Grozd 2 vsebuje 19 zadetkov (npr. Trampuž, Munc) 5. Grozd 22 vsebuje 18 zadetkov (npr. Drobnič, Meško) 6. Grozd 11 vsebuje 16 zadetkov (npr. Remic, Smrkolj) 7. Grozd 20 vsebuje 13 zadetkov (npr. Gorenak, Bernik) 8. Grozd 14 vsebuje 10 zadetkov (npr. Ferlinc, Cunk) 9. Grozd 27 vsebuje 10 zadetkov (npr. Slovensko zavarovalno združenje, Zavod za pokojninsko in invalidsko zavarovanje) 10. Grozd 19 vsebuje sedem zadetkov (npr. Jere, Košarac) 11. Grozd 23 vsebuje prav tako sedem zadetkov (npr. Leskovšek, Drev) 12. Grozd 12 vsebuje šest zadetkov (npr. Buddenbrock, Jaeger) 13. Grozd 10 vsebuje pet zadetkov (npr. Bergant, Kovič) 14. Grozd 13 vsebuje pet zadetkov (npr. Felten, Bruhn) 15. Grozd 15 vsebuje pet zadetkov (npr. Hudej, Horvat) 16. Grozd 17 vsebuje štiri zadetke (npr. Robnik, Kovači č) 17. Grozd 18 vsebuje štiri zadetke (npr. Bavcon, Brvar) 18. Grozd 21 vsebuje štiri zadetke (npr. Grebenc, Jandl) 19. Grozd 25 vsebuje prav tako štiri zadetke, vendar za založbe (npr. Ministrstvo za šolstvo in šport, Urad predsednika Republike Slovenije) V nadaljevanju sledi izdelava asociacijskih pravil preučevanih APC grozdov. Pri izpeljavi asociacijskih pravil sem si pomagal s programskim orodjem CBA 1.0. Za dejavnik podpore (angl.: support) sem določil 1 %, medtem ko sem za dejavnik zaupanja (angl.: confidence) vzel 50 %. Asociacijska pravila so bila naslednja: Pravilo 1: sodišča = Y -> Evropsko sodišče za človekove pravice = Y (3.426% 71.43% 21 15 2.447%) Pravilo 2: Evropsko sodišče za človekove pravice = Y -> sodišča = Y (3.752% 65.22% 23 15 2.447%) Pravilo 3: človekove pravice = Y sodišča = Y -> Evropsko sodišče za človekove pravice = Y (2.447% 93.33% 15 14 2.284%) Pravilo 4: človekove pravice = Y Evropsko sodišče za človekove pravice = Y -> sodišča = Y (3.589% 63.64% 22 14 2.284%) Pravilo 5: sodisca = Y Evropsko sodišče za človekove pravice = Y -> človekove pravice = Y (2.447% 93.33% 15 14 2.284%) Pravilo 6: sodišča = Y -> človekove pravice = Y Evropsko sodišče za človekove pravice = Y ( 3.426% 66.67% 21 14 2.28%) Pravilo 7: Evropsko sodišče za človekove pravice = Y -> človekove pravice = Y sodišča = Y ( 3.752% 60.87% 23 14 2.28%) Pravilo 8: Evropsko sodišče za človekove pravice = Y -> človekove pravice = Y (3.752% 95.65% 23 22 3.589%) Pravilo 9: sodna praksa = Y -> Evropska unija = Y (2.447% 53.33% 15 8 1.305%) Pravilo 10: sodišča = Y -> človekove pravice = Y (3.426% 71.43% 21 15 2.447%) Pravilo 11: policijsko delo = Y -> policija = Y (2.121% 53.85% 13 7 1.142%) Pravilo 12: kriminalistično preiskovanje = Y -> kriminalistika = Y (2.447% 73.33% 15 11 1.794%) Pravilo 13: kriminalistika = Y -> kriminalistično preiskovanje = Y (2.773% 64.71% 17 11 1.794%) Pravilo 14: prometna varnost = Y -> cestni promet = Y (1.142% 100.00% 7 7 1.142%) Pravilo 15: prometne nesreče = Y -> cestni promet = Y (1.794% 100.00% 11 11 1.794%) Pri asociacijskih pravilih gre v bistvu za predmetne oznake iz bibliografskih zapisov, ki so jim bile izmerjene najvišji dejavniki podpore in zaupanja. Opazimo lahko, da v tem sklopu ni močnejših asociacijskih pravil v zvezi s sodnimi ali forenzičnimi vedami. Ugotovitev v bistvu sploh ne preseneča, kajti ko preverimo številčnost publiciranja člankov in drugih sestavnih delov s področja sodnih ved v letu 2011 na COBISS/COBIB dobimo kot izid zgolj 17 zadetkov. Še manj zadetkov dobimo s poizvedbo za strelno orožje. Ob teh ugotovitvah naj predstavim zamisel, ki se mi zdi v sklopu tega dela mnogo bolj pomembna. S pomočjo tovrstnih in podobnih raziskav, bi lahko spremljali oziroma analizirali razvoj pojmov znotraj stroke skozi čas. Na ta način bi bilo možno ugotoviti, kateri avtorji so v neki stroki in/ali znanstveni panogi uvedli nov pojem, ki se je ali pa tudi ni obdržal? Prav tako bi bilo možno spremljati različne druge spremembe pri pojmih kot npr. nova slovnična pravila ipd. Spremljali in analizirali bi lahko tudi vplivne in manj vplivne avtorje. V nadaljevanju bom prikazal še eno možnost uvoza določene datotečne oblike v programsko orodje Cytoscape, kar je možno izvesti s pomočjo JabRef. Preučevane zapise najprej iz JabRef izvozimo v .CSV za Excel, nakar .CSV (z ukazom besedilo v stolpce) datoteko pretvorimo v .XLS, ki je potem primerna za uvoz v programsko orodje Cytoscape. Znotraj Cytoscape lahko potem v nadaljevanju določimo z uvoženimi .XLS datotekami omrežja, ki imajo svoj vir, vrsto povezave in cilj (drugače povedano: vhod, pot in izhod). Na takšen način se ustvarjajo usmerjena omrežja (angl.: directed networks). 3.2 Slika 9: Grozdenje z MCODE in AllegroMcode Slika 9 prikazuje grozdenje z MCODE in AllegroMcode. Grozdenje z MCODE in Allegromcode poteka na zelo podoben način (t.j. iskanje pomembnih grozdov ali vozlišč, ki imajo veliko število povezav znotraj zapletenih in velikih omrežij), vendar s to razliko, da poteka procesiranje podatkov z algoritmom Allegrocode precej hitreje. Skratka algoritem Allegrocode je izdelan na osnovi MCODE z različnimi dodatki. Algoritem AllegroMcode je primeren tako za raziskovanje bioloških kot tudi socialnih omrežij (npr. diskusijske skupine in člani). 3.3 Slika 10: Ugotavljanje najbližjih sosedov in najkrajših poti s pomočjo vtičnika CytoHubba Slika 10 prikazuje pridobljeno omrežje iz predhodno prikazanega (gl. sliko 9), ki je izid ugotavljanja najbližjih sosedov in najkrajših poti s pomočjo vtičnika CytoHubba. Na podlagi rangirne metode "STOPNJA" (angl.: degree), določevanja 10 glavnih skupin, preverjanja vozlišč prve stopnje in prikaza najkrajše poti, je CytoHubba analiziral in vizualiziral novi graf oziroma omrežje. Za vsa vozlišča sem s pomočjo vtičnika "Calculate node degree" izračunal stopnjo vpliva. Izide bom posredoval v nadaljevanju. 3.4 Slika 11: Najmočnejši grozdi Slika 11 prikazuje 10 najmočnejših grozdov, ki sem jih dobil na podlagi prej omenjene metode. V tem vpogledu izstopajo entitete kot so geografska lokacija (Ljubljana), založbe (npr. Fakulteta za varnostne vede, Faculty of criminal justice and security, Kriminalistik-Verlag, Gospodarski vestnik in Heymann) in serijske publikacije (npr. Delo, Kriminalistik, Die Polizei, Pravna praksa). Na naslednji strani bom predstavil izide v zvezi s stopnjo moči ali vpliva vozlišč, ki so v bistvu glavni predstavniki omenjenih grozdov ali klustrov. Glavna vozlišča bodo predstavljena v obliki obarvanih krogov (npr. rdeča, oranžna, rumena). Node Color ID 3elo h n(J I>ie Polizei 14 ^ • -acuity oF Griming Justice -and Security nd "akjulteta 2a varnostne vede 19 nd • Gospodarski vestnrik l;sj Heymann 15 fid • (riminalistik 22 ruf • ^riminalistik-verlag 23 *i Ljubljana, GV izobraževanje, SAZU itd. 2. Grozd 1 = 49 --> Gospodarski vestnik, Pravna praksa, Kovač, Bergant itd. 3. Grozd 2 = 25 --> Heidelberg, Kriminalistik-Verlag, Kriminalistik, Fuchs itd. 4. Grozd 6 = 25 --> Faculty of criminal justice and security, Dobovšek, Meško itd. 5. Grozd 4 = 19 --> Fakulteta za varnostne vede, Banutai, Vedenik itd. 6. Grozd 3 = 17 --> Heymann, Die Polizei, Stock, itd. 7. Grozd 0 = 14 --> Delo, Republiški sekretariat za notranje zadeve, Meško itd. Na podlagi dobljenih izidov je možno sklepati, da so bile založbe in avtorji na področjih kot so migracije, človekovih pravic, sodstva, kazenskega prava, kriminalitete, kriminologije, javne uprave, policije, sodnih ved in strelnega orožja najbolj dejavne v Ljubljani. Ugotovljeno v bistvu pomeni, da so ostali predeli Sloveniji manj dejavni glede publiciranja (npr. Maribor, Celje, Kranj), kar nakazuje na izrazito centralno razvitost obravnavanih področij. Prav tako večina avtorjev objavlja svoje članke in prispevke na področju Ljubljane, zato ne presenečajo koloidi že uveljavljenih avtorjev, ki nemalokrat objavljajo v istih serijskih publikacijah. Obravnavani bibliografski zapisi iz leta 2011 v bistvu kažejo na znanstveno- strokovno centralizacijo publiciranja v Sloveniji. Obravnavani mrežni graf sem v nadaljevanju izvozil iz Cytoscape v obliki .XGMML datoteke, ki sem jo nato uvozil v programsko orodje dyNet. Podatke sem vizualiziral s pomočjo organske postavitve (angl.: organic layout), nakar sem začel s postopkom K-means grozdenja (določil sem tri skupine in maksimalno število interakcij do 1000). Skupinam ali grozdom sem določil gnezda (angl.: nest clusters). Na naslednji strani sledi prikaz mrežnih grafov znotraj gnezd. 3.7 Slika 14: Vizualizacija K-means grozdenja s pomočjo gnezd Slika 14 prikazuje vizualizacijo K-means grozdenja s pomočjo gnezd, znotraj katerih se nahajajo skupine. Algoritem K-means v bistvu razvršča opazovane množice v že vnaprej določene skupine tako, da poišče najbližje vrednosti (aritmetična sredina). Ugotovimo lahko, da obstajajo med grozdoma N1 in N2 določene povezave (med avtorji in revijami), medtem ko je grozd N0 osamljen oziroma brez povezav do drugih dveh grozdov. Na podlagi konkretnega primera K-means grozdenja lahko hitro ugotovimo ustvarjalne in manj ustvarjalne avtorje, ki objavljajo ali v različnih serijskih publikacijah ali pa zgolj v eni. Prav tako lahko ugotovimo, kateri avtorji mnogokrat skupaj objavljajo kakšen članek ipd. Na osnovi danega vzorca je možno ugotoviti, da so najbolj ustvarjalni avtorji Gorazd Meško (objavljal je v Delu in Reviji za kriminalistiko in kriminologijo), Matjaž Ambrož (objavljal je v Reviji za kriminalistiko in kriminologijo ter Pravni praksi) in Boštjan Polegek (objavljal je v Pravniku in Pravni praksi). Pokazal bom še vizualizacijo podatkov s pomočjo programskega orodja Biolayout express, kajti iz dyNet je možno podatke izvoziti v .layout datotečno obliko. Omenjeno snov je možno še z drugimi programskimi orodji procesirati (npr. Medusa, Pajek, Graphviz), kar v tej pilotni raziskavi ne bom prikazal. 3.8 Slika 15: Vizualizacija in simulacija grozdov z Biolayout express Slika 15 prikazuje vizualizacijo in simulacijo grozdov s pomočjo programskega orodja Biolayout express. S tem je v bistvu dana dodatna možnost za preučevanje podatkov. V tej pilotni raziskavi sem kot .txt tabelarično obliko izvozil 10 grozdov, ki so izid računanja z algoritmom MCL. Grozde z njihovimi vrednostmi sem nato še preučeval s programskim orodjem Orange Canvas. 3.9 Slika 16: Vizualno programiranje podatkov o vhodih in izhodih grozdov Slika 16 prikazuje vizualno programiranje podatkov o vhodnih in izhodnih enotah posameznih grozdov. Z Orange canvas sem preizkusil različne vizualizacijske tehnike, med katerim naj omenim statistične atribute, raztreseni diagram, paralelna koordinata, Sievov diagram in distančno mapo. 3.9.1 Slika 17: Vizualizacijske tehnike izdelane s pomočjo Orange Canvas Slika 17 prikazuje vizualizacijske tehnike izdelane s pomočjo Orange canvas. V tem delu bom nekoliko podrobneje pogledal raztreseni diagram. 3.9.2 Preglednica 2: Del podatkov o 10 grozdih Ime Vhodi Izhodi MCL_3.0_6 Accetto, Matej 0 1 Cluster01 Bergant Rakocevič, Vesna 1 0 Cluster01 Burnik, Jelena 1 0 Cluster01 Cunk, Zoran 1 0 Cluster01 Erbeznik, Anze 1 0 Cluster01 Ferlinc, Andrej, pravnik 1 0 Cluster01 Gak, Natali 1 0 Cluster01 3.9.3 Slika 18: Raztreseni diagram 10 grozdov Preglednica 2 predstavlja majhen del podatkov o desetih grozdih, medtem ko slika 18 prikazuje raztreseni diagram vseh grozdov. Kot x-os sem določil vhode, medtem ko sem za y-os določil izhode. Za sleherni MCL grozd je Orange Canvas določil lastno barvo. Največ izhodnih enot imajo revije, ki imajo vse po en vhod. Lestvica revij z ozirom na izhodne enote je naslednja: 1. Revija Pravna praksa (PP) je razvrščena v grozd 1 in ima 46 izhodov. 2. Revija Kriminalistik je razvrščena v grozd 2 in ima 21 izhodov. 3. Revija Die Polizei je razvrščena v grozd 3 in ima 13 izhodov. 4. Revija za kriminalistiko in kriminologijo spada v grozd 5 in ima 10 izhodov. 5. Časnik Delo spada v grozd 4 in ima devet izhodov. 6. Revija Pravnik spada v grozd 6 in ima šest izhodov. 7. Revija Verkehrsunfall und Fahrzeugtechnik je glavni predstavnik grozda 7 in ima prav tako šest izhodov. 8. Revija Der Kriminalist spada v skupino 8 in ima pet izhodov. 9. Revija Podjetje in delo spada v skupino 9 in ima štiri izhode. 10. Revija Polizei & Wissenschaft je razvrščena v grozd 10 in ima prav tako štiri izhode. Pri avtorjih izstopata dve osebi, ki imata po dve vhodni enoti, vendar nič izhodnih enot. Največje število avtorjev ima po eno vhodno enoto in nič izhodnih. 10 avtorjev ima po nič vhodnih enot in eno izhodno enoto. Obravnavani vzorci so pomembni, saj lahko preučevalcu pomagajo napovedati prihodnjo ustvarjalnost avtorjev in število objav kakovostnih člankov. Ob tem je potrebno pripomniti, da bi moral biti vzorec podatkov precej večji in bi moral zajeti vsaj desetletje publiciranja avtorjev. Na osnovi večletnega časovnega razpona, bi lahko tudi ugotovili prihod novih avtorjev znotraj posamezne znanstvenoraziskovalne panoge ter povrhu tega bi bilo možno lažje določiti posamezne t.i. šole, ki nastanejo na osnovi določenih znanstvenih avtoritet. 4 Zaključek V tem delu je v bistvu šlo za predstavitev pilotne analize bibliografskega omrežja s pomočjo različnih odprtokodnih programskih orodij in pretežno algoritmov s področja biomedicinske informatike. Omrežja katerekoli vrste (biološka, pojmovna, socialna, informacijska, tehnološka idr.) imajo določene skupne lastnosti, po katerih jih lahko identično ovrednotimo (npr. znotraj omrežja iščemo zakon moči ali potence, ugotavljamo premer, iščemo skupnosti ali grozde itd.). Na osnovi pilotnega primera oziroma analize lahko poročam, da so bili algoritmi s področja biomedicinske informatike (APC grozdenje, MCODE, AllegroMcode idr.) zelo učinkoviti. V tem delu sem tudi dokaj podrobno prikazal pretvorbo različnih datotečnih oblik, da bi lahko popestril analizo in v naslednji stopnji odkrivanje novih znanj. Začel sem z .RIS formatom, ga s pomočjo JabRef pretvoril v .CSV, .XLS in .BIB, nakar sem ga s pomočjo Nwb pretvoril v .XGMML itd. Kot ste lahko opazili sem pri tej pilotni analizi uporabil veliko število programskih orodij (celoten seznam bo objavljen v podpoglavju 5.1). Že ta pilotni primer odkrivanja novih znanj iz bibliografskega omrežja mi je nazorno pokazal, da bibliografije niso zgolj same sebi namen. Poleg tega, da z njimi lahko učinkovito organiziramo in iščemo različne vsebine, organizacije in avtorje, nam bibliografije dajejo še vrsto drugih vedenj oziroma znanj (npr. nabavna politika knjižnic, povezava avtorjev, moč vpliva uredniškega odbora, vpliv revije, povezanost med različnimi vsebinami, razvoj določene skupine, časovnica konferenčnih dogodkov, geografska razvitost založb in avtorjev itd.). Analize bibliografij patentov, inovacij in izumov bi lahko dajali še mnogo več različnih znanj, ki bi jih lahko tudi politiki in gospodarstveniki koristno uporabili. Gre še zlasti za preučevanje razvitosti določenih znanstvenih ali pa industrijskih panog znotraj določene občine, regije, pokrajine, države ali pa celo celine. V primeru, da je inovacij ipd. v določeni državi premalo (npr. pri nas v Sloveniji), rastejo na dolgi rok tudi stroški, kajti kdor nima lastnih izvirnih izdelkov, jih mora drago kupovati. Lastni izumi ipd. krepijo tudi identiteto naroda. Po mnenju nekaterih psihologov in sociologov smo Slovenci prej narod s šibkejšo identiteto. Identiteto našega naroda bi krepila tudi tesnejša sodelovanja z našimi rojaki v tujini, ki bi nam lahko odpirali marsikatera tržišča, kamor bi lahko svoje izdelke bolje prodajali. Današnje možnosti, ki nam jih ponuja sodobna informacijska tehnologija, bi lahko bila dobra popotnica za tesnejše sodelovanje. Nazadnje bi še omenil koristno raziskavo v zvezi z inovacijami v širšem smislu (npr. tehnološke, organizacijske, postopkovne, informacijske, komunikacijske) znotraj Ministrstva za notranje zadeve in Policijo. Prav ta bi nam lepo pokazala, kje se v tem trenutku nahajamo in kaj bi lahko dosegli, da še bolj izboljšamo svet?! 5 Viri in uporabljena programska orodja Cobo, M. J. et al. (2011). Science mapping software tools : review, analysis, and cooperative study among tools. Journal of the American Society for Information Science and Technology, 62(7), 1382 - 1402 Yan, E. & Sugimoto, C. R. (2011). Institutional interactions : exploring social, cognitive, and geographic relationships between institutions as demonstrated through citation networks. Journal of the American Society for Information Science and Technology, 62(8), 1498 - 1514 Gu, Y. (2004). Global knowledge management research : a bibliometric analysis. Scientometrics, 61(2), 171 - 190 http://udkclick.bravehost.com/hierarhologija.htm (2011-10-11) http://www.inf.uni-konstanz.de/algo/publications/behhm-gprsl-01.pdf (2011-10-11) Kuščer, M. (2009). Generiranje naključnih omrežij z metodo strojnega učenja : diplomsko delo. Ljubljana: [M. K.] Dostopno pod: http://lovro.lpt.fri.uni- lj.si/resources/material/students/theses/kuscer diploma.pdf (2011-10-11) Martins, W. S. et al. (2010). Assessing the quality of scientific conferences based on bibliographic citations. Scientometrics, 83(1), 133 -155 Seol, S. S. & Park, J. M. (2008). Knowledge sources of innovation studies in Korea: a citation analysis. Scientometrics, 75(1), 3 -20 Verbeek, A. et al. (2002). Linking science to technology : using bibliographic references in patents to build linkage schemes. Scientometrics, 54(3), 399 - 420 Zou, J., Le, D. & Thoma, G. R. (2010). Locating and parsing bibliographic references in HTML medical articles. International journal on document analysis ana recognition, 13(2), 107 - 119 Na COBISS/COBIB 2009 do 2009 ANALIZA OMREŽIJ Analysis, N. & Conference, H. (2010), 'Network analysis and history. Approaches, tools, problems', Network analysis and history. Approaches, tools, problems , Lausanne University, Lausanne, -- . Batagelj, V.; Ferligoj, A. & Doreian, P. (), 'The nine nations of North America'Tnternational Classification Conference incorporating the Symposium on Bourdieu and Geometric Analysis of Data, School of Medical & Biological Sciences, University of St Andrews, 11 - 15 July, 2011', s. n., [S. l., Str. 14--. Batagelj, V. & Mrvar, A. (), 'Viszards XXXI session''Sunbelt XXXI', International Network for Social Network Analysis, [S.l.], --. Batagelj, V. & Mrvar, A. (), 'Analysis of large two-mode networks : extended abstract', , 11 str.-- . Breznik, K. & Batagelj, V. (), 'Some networks generated by chess games''Program - abstracts - participants', Joanneum Research, Graz, Str. 12--. Breznik, K. & Batagelj, V. (), 'Networks generated by FIFA soccer games played between countries''Sunbelt XXXI', International Network for Social Network Analysis, [S.l.], --. Buchin, K.; Cabello, S.; Gudmundsson, J.; Loffler, M.; Luo, J.; Rote, G.; Silveira, R. I.; Speckmann, B. & Wolle, T. (), 'Detecting hotspots in geographic networks', , Str. 217--231. Coromina, L.; Capo, A.; Coenders, G. & Guia, J. (2011), 'PhD students' research group networks. A qualitative approach', Metodološki zvezki 8(2), str. [173]--189. Coromina, L.; Coenders, G.; Ferligoj, A. & Guia, J. (2011), 'PhD students' research group social capital in two countries : a clustering approach with duocentred network measures', Metodološki zvezki 8(2), str. [137]--155. Doreian, P.; Ferligoj, A. & Kronegger, L. (2011), 'On the dynamics of national scientific systems : a reply', Quality & quantity 45(5), str. 1025--1029. Ferligoj, A. & Batagelj, V. (2011), Special issue on Network Analysis : preface by the guest editors, Springer, Berlin, pp. str. 77--79. Hlebec, V. & Kogovšek, T. (), 'How (not) to measure social support networks? : the name generator vs. the role relationship approach''Book of abstracts', European Survey Research Association, [S. l.], Str. 35--. Hlebec, V. & Kogovšek, T. (2011), 'How (not) to measure social support networks : the name generator vs. the role relation approach', Metodološki zvezki 8(2), str. [191]--207. Hlebec, V.; Kogovšek, T. & Ferligoj, A. (2011), 'The influence of social support and personal networks on doctoral student performance', Metodološki zvezki 8(2), str. [157]--171. Hlebec, V.; Mrzel, M. & Kogovšek, T. (2009), 'Social support network and received support at stressful events', Metodološki zvezki 6(2), str. 155--171. International Sunbelt Social Network Conference, 30. (2010), 'Sunbelt XXX', International Network for Social Network Analysis, [S. l.], -- . International Workshop on Social Network Analysis, 3. (2011]), Collaboration networks and knowledge diffusion : theory, data and methods : book of abstracts, in , s. n., [S. l., pp. 80 str.- Kogovšek, T. & Hlebec, V. (), '"Please name the first two people you would ask for help" : the effect of the limitation of the number of alters on network composition''Program and abstracts', Statistical Society of Slovenia, Ljubljana, Str. 32--. Kogovšek, T. & Hlebec, V. (2009), 'Stability of typologies produced on the basis of repeated measurement with the role relationship and the name generator approach', Metodološki zvezki 6(2), str. 85--97. Kogovšek, T.; Hlebec, V. & Coenders, G. (), 'Validity and reliability of measurement of egocentered network composition indicators''Social relations in turbulent times', European Sociological Association; University of Geneva; Swiss Sociological Association, [S. l.]; Geneva, -- . Kogovšek, T.; Hlebec, V. & Ferligoj, A. (2011), 'From busy bees to science geeks and party animals : a typology of slovenian doctoral students', Metodološki zvezki 8(2), str. [121]--136. Kogovšek, T.; Mrzel, M. & Hlebec, V. (2010), 'Please name the first two people you would ask for help : the effect of limitation of the number of alters on network composition', Metodološki zvezki 7(2), str. 95--106. Kronegger, L. (), 'Dynamics of scientific co-authorship networks of Slovenian researchers''Quaderni', Universita degli studi di Salerno, Dipartimento di scienze economiche e statistiche, Salerno, Str. 79--80. Kronegger, L. (), 'Dynamics of scientific co-authorship networks of Slovenian researchers''Program and abstracts', Statistical Society of Slovenia, Ljubljana, Str. 30--. Kronegger, L. (), 'Structures of collaboration among Slovenian sociologists''Sociology on the move', Proquest, [Ann Arbor], Str. 253--. Kronegger, L.; Doreian, P. & Ferligoj, A. (), 'Structures of collaboration in Slovenian science systems''Sunbelt XXX', International Network for Social Network Analysis, [S. l.], Str. 579--. Kronegger, L.; Ferligoj, A. & Doreian, P. (), 'Collaboration structures in Slovenian scientific communities''Collaboration networks and knowledge diffusion', s. n., [S. l., Str. 39--. Kronegger, L.; Ferligoj, A. & Doreian, P. (2011), 'On the dynamics of national scientific systems', Quality & quantity 45(5), str. 989--1015. Kronegger, L.; Mali, F.; Ferligoj, A. & Doreian, P. (2011), 'Collaboration structures in Slovenian scientific communities', Scientometrics , Elsevier; Akademiai Kiado, Amsterdam; Budapest, 17 str.--. Kropivnik, S. & Kejžar, N. (), 'Exploratory network analysis as an add-on to internet metrics : joining reach figures with positions' characteristics''Collaboration networks and knowledge diffusion', s. n., [S. l., Str. 40--. Kropivnik, S. & Kejžar, N. (jan.), 'Potenciali opisne analize omrežij za trženjsko načrtovanje na internetu', Teorija in praksa 48(1), str. 45--69. Marino, M. & Stawinoga, A. (2011), 'Statistical methods for social networks : a focus on parallel computing', Metodološki zvezki 8(1), str. [57]--77. Martinez, D. A. (2011), A verification of selected properties of telecommunication traffic generated by opnet simulator : Erasmus exchange project work, [D. A. Martinez], Ljubljana. Mrvar, A. (2010), 'Social Network Analysis', [s. n.], [S. l.], --. Mrvar, A. (2010), 'Analiza socialnih omrežij', [s. n.], [S. l.], --. Muller, K. H. (2010), 'The radical constructivist movement and its network formations', Constructivist Foundations 6(1), str. 31--39. Nooy, W. d.; Mrvar, A. & Batagelj, V. (2009), Exploratory social network analysis with Pajek, Tokyo Denki Daigaku shuppankyoku, Tokyo. Ojsteršek, M. (2010), Spreminjanje označenega omrežja skozi čas - primer: odnosi v študentskem naselju : diplomsko delo, [M. Ojsteršek], Ljubljana. Stanonik, D. (2010), Analiza socialnega omrežja zaupanja v podjetju Polycom Skofja Loka d.o.o. : diplomsko delo, [D. Stanonik], Ljubljana. Tuškej, U. (2010), Uporaba analize omrežja asociacij pri merjenju korporativnega ugleda diplomsko delo, [U. Tuškej], Ljubljana. Valand, Šp. (2009), Analiza spletnega socialnega omrežjaMySpace : "Top Friends" : diplomsko delo, [Š. Valand], Ljubljana. Valant, M. (), 'Aspekti razvoja informacijskih sistemov v turizmu''Management, izobraževanje in turizem', Turistica, Fakulteta za turistične študije, Portorož, str. 268--269. Valant, M. (), 'Aspekti razvoja informacijskih sistemov v turizmu', , str. 2195--2199. Vehovar, V.; Žiberna, A.; Kovačič, M.; Mrvar, A. & Doušak, M. ([2009]), 'Technical report on an empirical investigation of paedophile keywords in eDonkey P2P network : Measurement and analysis of P2P activity against paedophile content project', Measurement and Analysis of P2P Activity Against Paedophile Content, [S. l.], --. Wasserman, S. & Faust, K. (1994), Social network analysis : methods and applications, Vol. 8, Cambridge University Press, New York [etc.]. Wasserman, S. & Faust, K. (1994), Social network analysis : methods and applications, Vol. 8, Cambridge University Press, New York [etc.]. Zemljič, B. (2010), 'Preučevanje kakovosti merjenja popolnih omrežij : doktorska disertacija', PhD thesis, [B. Zemljm]. Škrjanec, A. L. (2010), Udeležba študentov različnih fakultet na izbranih družabnih dogodkih :pristop z analizo dvovrstnih omrežij : diplomsko delo, [A. L. Škrjanec], Ljubljana. Šubelj, L.; Blagus, N.; Furlan, Št.; Klemenc, B.; Kumer, A.; Lavbič, D.; Zrnec, A.; Žitnik, S. & Bajec, M. (), 'Analiza kompleksnih omrežij : osnovni pojmi in primeri uporabe v praksi', , Str. 1--10. Žiberna, A. & Vehovar, V. (), 'Using social network to predict the behavior of active members of online communities', , 6 str.--. Žnidaršič, A.; Ferligoj, A. & Doreian, P. (), 'The impact of different non-response treatments on the stability of blockmodels''Sunbelt XXXI', International Network for Social Network Analysis, [S.l.], --. (2011), The SAGE handbook of social network analysis, SAGE, Los Angeles [etc.]. 5.1 Uporabljena programska orodja Spletne povezave in kratke opise navedenih programskih orodij si lahko preberete na posebnem seznamu Biolayout express COBISS/COBIB Cytoscape dyNet Gephi JabRef Netdraw Network workbench Ora casos Orange Canvas Pajek SCI2 tool Visone Vos viewer Yed graph editor