54 ORGANIZACIJA ZNANJA 2015, LETN. 20, ZV. 1
Med 1. in 3. decembrom 2014 se je v Bonnu odvijala šes-
ta konferenca SWIB (Semantic Web in Libraries), ki se je 
je udeležilo 165 udeležencev iz 24 držav. Konferenca je 
bila razdeljena v dva dela: prvi dan je bil namenjen delav-
nicam, drugi in tretji dan pa se je zvrstilo 17 predavanj. 
Namen konference je bil predstaviti novosti ter spodbu-
diti izmenjavo idej in izkušenj med udeleženci v zvezi 
z objavo in povezovanjem knjižničnih metapodatkov na 
spletu ter razvojem storitev in orodij, ki jih knjižnice in 
sorodne institucije že razvijajo na osnovi paradigme LOD 
(Linked Open Data). Povzetki, prosojnice in posnetki 
delavnic ter predavanj so na voljo na spletni strani  
http://swib.org/swib14/. Naslednja konferenca SWIB15 
bo v Hamburgu med 23. in 25. novembrom 2015.
DELAVNICE
Introduction to Linked Open Data
Delavnico sta vodila Felix Ostrowski in Adrian Pohl 
iz nemškega podjetja graphthinking. Namen te uvodne 
delavnice je bil predstaviti bistvo pristopa povezanih 
podatkov (angl. linked data) in osnovna zakonita dolo-
čila odprtih podatkov (angl. open data). Udeleženci smo 
z ustvarjanjem in izpopolnjevanjem dokumentov RDF 
poglobili svoje znanje o tej temi. Predstavljeni in hkrati 
preizkušeni so bili principi povezanih podatkov, kot je 
npr. objava opisov RDF v spletnem okolju. Pokazalo se 
je, da sta prednosti objave povezanih podatkov zbira-
nje podatkov iz različnih virov in ustvarjanje poizvedb, 
shema RDF pa je bila predstavljena kot učinkovit način 
podatkovne integracije. 
Introducing RDFa with schema.org for web 
applications
Zelo praktično naravnano delavnico je vodil Dan Scott 
(Laurentian University, Kanada). Po kratki uvodni pred-
stavitvi smo samostojno reševali naloge, razdeljene v štiri 
sklope:
1. RDFa  
Leta 2008 je W3C (World Wide Web Consortium) 
objavil prvo specifikacijo RDFa (Resource Descrip-
KONFERENCA SwIB14
SEmANTI^ni SpLEt v knjižnicAH
tion Framework in Attributes) za razširitev sintakse 
XHTML s podporo specifikaciji RDF (Resource De-
scription Framework). RDFa je takoj postal ključna 
metoda za povezovanje podatkov na spletu; leta 2013 
je bil razširjen s specifikacijo RDFa 1.1 (www.w3.org/
TR/rdfa-lite/) in novo specifikacijo RDFa Lite (www.
w3.org/TR/rdfa-lite/), ki zajema minimalno podmno-
žico atributov za predstavitev podatkov RDF v sple-
tnih dokumentih HTML, SVG in XML. To je oživilo 
zanimanje za združevanje semantičnega in dokumen-
tnega spleta. Na delavnici smo na vzorčnem doku-
mentu HTML z dodajanjem strukturiranih podatkov 
na praktičnih primerih preizkusili bistvene koncepte 
specifikacije RDFa Lite.
2. shema.org (https://schema.org/)  
V drugem delu delavnice smo v naš vzorčni dokument 
dodajali še elemente iz strukture shema.org za podatke 
o knjižnicah, kot so npr. naslov, lokacija, delovni čas. 
Schema.org je besednjak, ki so ga leta 2011 pripra-
vili Google, Yahoo in Yandex, da bi s tem omogočili 
preprost način objave metapodatkov o priljubljenih 
iskalnih temah, kot so dogodki, ljudje, proizvodi itd. 
Razvoj besednjaka je leta 2013 prevzel W3C. Pred-
nosti uporabe besednjaka shema.org za knjižnične 
aplikacije je več: knjižnica lahko ponudi natančnejše 
in bogatejše rezultate iskanja po svojih metapodatkih, 
izboljša lahko algoritme razvrstitve rezultatov iskanja 
po pomembnosti (angl. search ranking), omogoči pa 
lahko tudi podrobnejše iskanje in predstavitev svojih 
organizacijskih informacij.
3. Spletni iskalnik 
Google nam, poleg indeksiranja vsebine, ki je dosto-
pna preko njegovega iskalnika google.com, omogoča 
kreiranje svojega lastnega, osebno prilagojenega sple-
tnega iskalnika CSE (Custom Search Engine, https://
cse.google.com/cse/), ki ponuja hitro nameščeno in 
hkrati zelo prilagodljivo iskalno storitev. V tem delu 
delavnice smo ustvarili enostaven spletni iskalnik za 
izbrane knjižnične kataloge s strukturiranimi podatki 
po besednjaku shema.org, na osnovi katerih smo, z 
zajemanjem in filtriranjem bibliografskih podatkov, 
zgradili svoj vzajemni katalog.
4. Zajemanje podatkov 
V tem delu delavnice je bil predstavljen enostaven 
doi:10.3359/oz1501054                                                                                                                        1.25: DRUGI ČLANKI ALI SESTAVKI 
55ORGANIZACIJA ZNANJA 2015, LETN. 20, ZV. 1
odprtokodni spletni pajek RDFLib, napisan v pytho-
nu, za zajemanje strukturiranih podatkov (na primeru 
podatkov RDFa po besednjaku shema.org) z uporabo 
sitemaps.org (http://www.sitemaps.org/) za specifika-
cijo seznama naslovov URL-strani knjižničnih kata-
logov, od koder smo črpali podatke (VuFind, Koha, 
Evergreen, Blacklight, Islandora). Na ta način smo 
indeksirali želene bibliografske podatke in omogočili 
lažje iskanje in prikazovanje podatkov iz shranjenih 
indeksnih datotek.
PREDAVANJA
Using linked data to annotate semantically 
the BBC‘s content
Tom Grahame (BBC, Združeno kraljestvo) je predstavil 
uporabo povezanih podatkov za semantično označevanje 
BBC-jevih vsebin. Povezane podatke so vpeljali kot sku-
pek idej, metod in tehnologij pri gradnji njihovih spletnih 
strani, kar je poenostavilo potek dela ter ponudilo nove 
zanimive avtomatizirane agregacije podatkov za njihove 
uporabnike. Uspeh uporabe te tehnologije pri pokrivanju 
online vsebin pomembnih športnih dogodkov je pokazal, 
kakšne so možnosti za ponovno uporabo semantične 
infrastrukture kot osrednjega dela BBC-jevega produk-
cijskega procesa. Vizijo semantičnega objavljanja so 
razvili s povezovanjem uporabnikom zanimivih vsebin z 
različnih področij, npr. politika, šport, glasba, ter vsebin v 
zvezi z različnimi dogodki, mesti, temami itd. BBC vsak 
dan ustvari obilo vsebin (od člankov, programov, izo-
braževalnih priročnikov do odlomkov in receptov), ki se 
med seboj povezujejo in na različne načine prikazujejo v 
ločenih proizvodih, namenjenih različnim tipom uporab-
nikov – vsebina pa je vedno enaka. Tako je novinarjem in 
vsebinskim urednikom omogočen enoten dostop do hete-
rogenih in doslej izoliranih kreativnih del. Predavatelj je 
opisal, kako je BBC Sport razširil in razvil uporabo pove-
zanih podatkov od izdelave spletne strani, ki je pokrivala 
svetovno prvenstvo v nogometu leta 2010, do dinamič-
nega zbiranja dnevnih športnih prispevkov in pokrivanja 
velikih dogodkov, kot so bili London 2012, Soči 2014 in 
Svetovno prvenstvo v nogometu leta 2014. Predstavil je 
še, kako isti tehnološki pristop uvajajo znotraj BBC-ja na 
različnih področjih, kot so izobraževanje, novice, radio in 
glasba, in kako se lahko pristop povezanih podatkov upo-
rabi pri podobnih izzivih v bibliotekarskem okolju. 
schema.org: machine-readable cataloguing 
for the open web
Dan Scott (Laurentian University, Kanada) je predstavil 
prizadevanja za uporabo besednjaka schema.org v bibli-
ografskem okolju. Medtem ko so ga spletne strani nav-
dušeno prevzele v upanju po boljših iskalnih rezultatih in 
uvrstitvah, so knjižnice pri integriranju tega besednjaka 
nekoliko bolj zadržane. Namen uporabe besednjaka 
shema.org je zagotoviti točke dostopa za knjižnične vire 
v velikih spletnih iskalnikih preko bibliografskih meta-
podatkov, podatkov o zalogi in podatkov o knjižnicah. 
Poudaril je prednosti integriranih knjižničnih sistemov 
Evergreen in Koha, odprtokodnih vmesnikov Blacklight 
in VuFind ter repozitorijev, kot sta Islandora in Scho-
larSphere, pridobljenih z objavo metapodatkov schema.
org (od nestrukturiranih do strukturiranih in povezanih 
podatkov). Omenjena je bila vloga skupine W3C Schema 
Bib Extend Community Group (https://www.w3.org/com-
munity/schemabibex/) pri zapolnjevanju vrzeli v besed-
njaku schema.org in dokumentiranju najboljših praks za 
uporabo tega besednjaka v knjižnicah. Nazadnje je bilo 
predstavljeno, kako se lahko običajni delovni procesi v 
knjižnicah (npr. kreiranje vzajemnega kataloga in pre-
verjanje dostopnosti gradiva), ki so trenutno implemen-
tirani s specifičnimi protokoli za posamezne knjižnice/
institucije, poenostavijo s standardnimi spletnimi orodji 
za zajemanje strojno berljivih podatkov, strukturiranih po 
besednjaku shema.org.
Moving from MARC: How BIBFRAME moves 
the Linked Data in Libraries conversation to 
large-scale action
Eric Miller (Zepheira, ZDA) je predstavil tri vidike mig-
racije s formata MARC na model povezanih knjižničnih 
podatkov z uporabo modela in besednjaka BIBFRAME 
(http://www.loc.gov/bibframe/). To so kontekstni vidik, 
vidik s stališča orodij za transformacijo ter vidik kreiranja 
vsebine in prepoznavnosti na spletu. Knjižnice veže dolga 
zgodovina z bibliografskim formatom MARC kot sofisti-
ciranim in zelo prilagojenim opisnim besednjakom z mi-
lijardami zapisov; le-ti so zelo razširjeni preko različnih 
knjižničnih sistemov in ponudnikov. Z namenom ohraniti 
vrednost te zapuščine in jo predstaviti na nov, sodoben 
način je Kongresna knjižnica na principih povezanih 
podatkov in standardov semantičnega spleta razvila BIB-
FRAME; pri tem je bil njen cilj, da omogoči razširljivost 
besednjakov glede na različne profile knjižnic, fleksibilna 
orodja za transformacijo metapodatkov, iterativni proces 
povezovanja podatkov iz različnih virov in izboljšavo 
spletne prepoznavnosti knjižnic in njihovega notranjega 
delovanja. Praktični nasveti, ki jih je navedel v zvezi z 
zagotovitvijo pomoči knjižnicam pri prehodu na BIB-
FRAME, so:
•  vrednotenje trenutnih podatkov knjižnic,
•  določanje prioritet lokalnih podatkov,
•  izvedba obsežne konverzije podatkov,
•  specifikacija besednjakov za izvirno vsebino,
•  prepoznavanje možnosti povezovanja podatkov,
POROČILO
56 ORGANIZACIJA ZNANJA 2015, LETN. 20, ZV. 1
•  prehod z enostavnega prikaza obstoječih podatkov na 
prikaz, ki izkorišča vse prednosti principa povezanih 
podatkov z uporabo besednjakov BIBFRAME in 
schema.org.
Entification: The Route to ‘Useful’ Library Data
Richard Wallis (OCLC, Združeno kraljestvo) je predstavil 
nekatere prednosti kreiranja knjižničnih podatkov kot 
opisov entitet resničnega sveta v modelu WorldCat Enti-
ties ter težave, ki se pri tem pojavljajo. Pri povezovanju 
podatkov gre za prepoznavanje "stvari", opisovanje le-teh 
in njihovih zvez v mreži drugih "stvari" ali entitet. Britan-
ska knjižnica (z verzijo britanske nacionalne bibliografije, 
ki temelji na povezanih podatkih) je bila pionir pri obli-
kovanju entitet resničnega sveta kot osnove za njihov po-
datkovni model. Podobna raziskava znotraj OCLC-ja, ki 
je vodila k izdaji entitet kot povezanih odprtih podatkov 
WorldCat.org, je pokazala prednosti tovrstnega pristopa. 
Raziskava dokazuje tudi, da je za splet entitet resničnega 
sveta treba storiti mnogo več kot samo konvertirati za-
pis za zapisom. Pri tem igrajo pomembno vlogo procesi 
podatkovnega rudarjenja, odprte normativne podatkovne 
baze (kot so VIAF, FAST, LCSH) ter uporaba prilagodlji-
vih in širše sprejetih besednjakov. 
                   Nevenka Zupančič, Gordana Budimir
POROČILO