KRMARJENJE V SREDNJEM VEKU INFORMACIJSKE DOBE: ALI NAM BO USPELO OHRANITI NAŠO PISNO DIGITALNO DEDIŠČINO? Alenka Kavčič-Čolić Oddano: 19. 10. 2007 – Sprejeto: 29. 11. 2007 Strokovni članek UDK 004.6:005.921.1»746« UDK 930.25:004.9 Izvleček Prispevek obravnava problematiko trajnega ohranjanja elektronskih virov in daje kratek pregled prakse na tem področju v svetu in v Narodni in univerzitetni knjižnici. Predstavljena so izhodišča, ki so vplivala na zakonske spremembe za ureditev tega področja v Sloveniji, ter izzivi, s katerimi se bo morala Narodna in univerzitetna knjižnica soočati v prihodnosti. Ključne besede: elektronski viri, digitalni arhivi, trajno ohranjanje, strategije, NUK Professional article UDC 004.6:005.921.1»746« UDC 930.25:004.9 Abstract The article deals with the problem of long-term preservation of electronic resources. A brief overview of the practice in this field worldwide as well as in the National and University Library of Slovenia is given. Some of the foundations that were the starting point for legislative changes in the field of long-term preservation of electronic resourc- KAVČIČ-ČOLIĆ, Alenka. Steering in the digital dark ages: shall we succeed to preserve our written digital heritage?. Knjižnica, Ljubljana, 51(2007)3-4, p. 149-161 149 Knjižnica 51(2007)3-4, 149-161 es in Slovenia are presented as well as the new challenges that the National and University Library is facing in this regards. Key words: electronic resources, digital archives, long-term preservation, strategies, National and University Library, Slovenia 1 Uvod Koncept “digitalni srednji vek” iz naslova je vzet iz prispodobe Terryja Kunyja (1998)1, ki v svojem članku navaja, da se knjižničarji nahajamo v “temnem srednjem veku digitalne dobe”, kajti tako kot srednjeveški opati s svojimi dejanji skušamo rešiti za prihodnost vse, kar predstavlja našo pisno kulturno dediščino, iz bojazni, da bo velik del le-te zgubljen za vselej. O značilnostih elektronskih publikacij2 in vplivu razvoja informacijske tehnologije je bilo veliko govora tako v znanstvenih kot tudi v strokovnih in poljudnih prispevkih. Pred dvema desetletjema smo knjižničarji med prvimi začeli opozarjati na potrebo reševanja teh publikacij, ne samo strokovno in praktično, ampak tudi s pomočjo sprememb zakonodaje. Sedaj, ko je digitalna pisna produkcija3 v svojem največjem razmahu, smo končno dobili dolgo pričakovani Zakon o obveznem izvodu publikacij (2006), ki slovenski nacionalni knjižnici daje zakonsko podlago za zbiranje elektronskih publikacij ne glede na njihove nosilce. Seveda ostaja nerešenih še veliko problemov, izpostavili bi skupinsko reševanje avtorskih pravic za dostop do avtorsko zaščitenih elektronskih del in nenehno iskanje optimalnih metod in strategij za trajno ohranjanje tega gradiva. 1 V prispevku “The digital dark ages? Challenges in the preservation of electronic information” Terry Kuny navaja: “We are, to my mind, living in the midst of digital Dark Ages; consequently, much as monks of times past, it falls to librarians and archivists to hold to the tradition which reveres history and the published heritage of our times.” International preservation news. 17, May, 1998. Pridobljeno 15. 12. 2006 s spletne strani http://www.ifla.org/VI/4/news/17-98.htm#2 2 Za označevanje del, ki so bila ustvarjena v elektronski ali digitalni obliki v tem prispevku izmenično uporabljamo različne sinonimne termine, glede na perspektivo in kontekst obravnave. Tako na primer “elektronski vir” po standardu ISBD(ER) “obsegajo gradiva, s katerimi upravlja računalnik, vključno z gradivi, za katere je potrebna na računalnik priključena periferna oprema”. Elektronske publikacije po Zakonu o obveznem izvodu publikacij so “ elektronske knjige, elektronski časopisi in časniki, spletne strani in podbno, ki so objavljene na fizičnih nosilcih (npr. na magnetnih trakovih, kasetah, disketah, CD-romih ipd.) ali so dostopne na računalniških omrežjih ali svetovnem spletu)” (Uradni list RS 69/2006 z dne 3. 7. 2006) 3 V prispevku je pod “digitalno pisno produkcijo” ali “digitalno produkcijo” mišljeno vse, kar je bilo napisano s pomočjo računalnika in je zato v digitalni ali elektronski obliki. Ravno tako pod “pisno digitalno dediščino” razumemo vso digitalno pisno produkcijo, ki smo jo nasledili od naših zanamcev oz. jo bodo naši potomci nasledili od nas. 150 Kavčič-Čolić, A. Krmarjenje v srednjem veku informacijske dobe: ali nam bo uspelo ohraniti našo pisno digitalno dediščino? Ko govorimo o trajnem ohranjanju, mislimo na metode in strategije, ki omogočajo časovno neomejeno dostopnost do relevantnih pisnih vsebin. Izraz “trajno ohranjanje” elektronskih publikacij je posredni prevod angleškega izraza “long-term preservation”. Čeprav prevod naznanja neko trajnost ali dolgoročnost, smo ga izbrali pred nekaj leti, da bi označili težnjo knjižničarjev po ohranjanju gradiva za nedoločen čas ter da bi preprečili mešanje z arhivsko dikcijo, za katero dolgoročno ohranjanje oznanja proces hranjenja gradiva od 5 do 30 let4. Namen tega prispevka je razložiti dejavnost trajnega ohranjanja elektronskih publikacij in predstaviti nekaj v svetu uveljavljenih pristopov. Dotaknili se bomo izhodišč, ki so vplivala na zakonske spremembe za ureditev tega področja, ter na kratko predstavili obstoječo prakso v tujih nacionalnih knjižnicah. Nekaj besed bomo posvetili tudi temu, kako smo se te problematike lotili v Narodni in univerzitetni knjižnici (v nadaljevanju NUK) in kateri izzivi nas čakajo v prihodnosti. 2 Razvoj dejavnosti trajnega ohranjanja pisne digitalne dediščine Tiskano dediščino na papirju ni bilo težko ohraniti, saj je papir nosilec, ki omogoča dvodimenzionalni dostop do vsebin. Potrebno je bilo poskrbeti le za ohranjanje fizične podlage, katere življenjski ciklus je lahko znašal celo sto in več let. Pri pisni digitalni dediščini se knjižničarji soočamo z novimi problemi, kajti digitalne vsebine5 so odvisne od informacijske tehnologije, ki se vsakih nekaj let povsem zamenja. Te vsebine so kompleksne, pa tudi tridimenzionalne,6 in jih velikokrat zaznamujeta določena struktura in funkcionalnost. Kontekst v digitalnem okolju prevzema zelo pomembno vlogo in postaja usoden za razumevanje digitalnih vsebin. 4 Po Zakonu o varstvu dokumentarnega in arhivskega gradiva ter arhivih (2006) je “»dolgoročna hramba gradiva« hramba gradiva za časovno obdobje, daljše od petih let“. Po tridesetih letih to gradivo postane arhivsko. 5 Izraz “digitalne vsebine“ uporabljamo kot sinonim elektronskih virov, vendar s poudarkom na konceptualni (vsebinski) ravni elektronskih virov, ki je nosilec glavnih informacij (npr. slika, tabela, baza podatkov, besedilo, itd.). 6 Za razliko od del na papirju, pri katerih sledimo vsebini linearno (poglavja se vrstijo eno za drugim), se pri elektronskih publikacijah pojavlja občutek prostornine: skačemo iz ene ravni v drugo, iz kazala v poglavje in nazaj, odpiramo tabele ali slike na različnih ravneh elektronskega vira. Pri spletnih straneh imamo celo časovno dimenzijo, ki nam omogoča vpogled v različne izdaje, ki so bile ustvarjene v času. 151 Knjižnica 51(2007)3-4, 149-161 Zaradi hitre spremenljivosti informacijske tehnologije, je postalo trajno ohranjanje sodobni problem. V raziskavi Britanske knjižnice (Warning of data…, 2007) ugotavljajo, da zaradi pomanjkanja trajnega ohranjanja digitalnih vsebin, Evropa letno izgublja okrog tri milijarde evrov. Britanski Nacionalni arhiv hrani več kot 580 Tb podatkov (enakovredno 580.000 enciklopedijam) v starejših datotečnih formatih, ki niso več komercialno dostopni. Že nekaj let se skuša najti rešitev v obliki standardizacije postopkov, ki bi pripeljali do optimalnega ohranjanja digitalnih vsebin. Vesoljske agencije skupaj z NASO so se med prvimi soočale s problematiko izgube informacij, ki so bile digitalno ustvarjene zaradi zastarevanja tehnologije. Zato so tudi prve začele iskati trajno rešitev. Rezultat je bil referenčni model OAIS, ki določa vse procese, ki naj bi se izvajali v digitalnem arhivu, pri ohranjanju njegovih vsebin. OAIS je bil sprejet za standard (ISO 14721) leta 2003. Vendar to ni bilo vse. Vzporedno s tem je skupina ameriških raziskovalnih knjižnic (Research Libraries Group - RLG) prevzela iniciativo pri določanju pogojev zaupanja vrednih institucij pri trajnem ohranjanju. Tako je nastalo poročilo7, ki je vplivalo tudi na dejavnosti evropskih depozitnih knjižnic pri trajnem ohranjanju. Poročilo ne govori o digitalnih arhivih, ampak o zaupanja vrednih repozitorijih, ker je bila v ZDA praksa, da vlogo digitalnega arhiva prevzemajo tudi druge institucije, ne le knjižnice ali arhivi. Posledica dvojne terminologije je bila strokovna zmeda, kajti mnogi niso vedeli, ali lahko oba termina, digitalni arhiv in digitalni repozitorij, enačimo. Danes se operira z obema konceptoma, tako za imenovanje institucije, ki je zadolžena za trajno ohranjanje, kot tudi za označevanje njenega sistema za upravljanje z digitalnimi objekti8 (elektronskimi viri), ki ima za cilj tudi urejanje procesov trajnega ohranjanja, čeprav je repozitorij le skladišče digitalnega arhiva. V zadnjih nekaj letih poteka na področju trajnega ohranjanja elektronskih virov več pomembnih projektov in iniciativ, ki skušajo uveljaviti prakso in standarde, ki bi v prihodnosti omogočili ohranitev dostopa do elektronskih publikacij. Med njimi so iniciativa britanskega Centra za digitalno skrbništvo (Digital Curation 7 Trusted Digital Repostiories: Attributes and responsibilities : an RLG-OCLC Report (2002). V tem poročilu so med ostalim navedeni naslednji pogoji, ki opredeljujejo digitalne arhive kot zaupanja vredne institucije za trajno ohranjanje elektronskih virov: morajo zagotavljati organizacijsko, finančno, strokovno in kadrovsko zanesljivost, morajo zagotavljati tehnološko in procedurno ustreznost pri trajnem ohranjanju; morajo prevzeti odgovornost za vse postopke pri trajnem ohranjanju; njihov arhivski sistem mora biti usklajen z referenčnim modelom OAIS. Več o tem glej v članku: Kavčič-Čolić, A.: Pristop k izgradnji digitalnih arhivov. V: Tehnični in vsebinski problemi klasičnega in elektronskega arhiviranja, št. 4 (2005), str. 480-490. 8 “Digitalni objekt” je samostojna intelektualna enota informacij v digitalni obliki, ne glede na vsebino ali format. Običajno je sestavljen iz elektronskega vira, podatkov o viru, metapodatkov in enotnega označevalca vira. Izraz je prišel v knjižničarstvo iz področja sistemske analize in se uporablja pri opisovanju procesov, ki se izvajajo v digitalnem arhivu. Njegov pomen lahko enačimo s pomenom elektronskega vira. 152 Kavčič-Čolić, A. Krmarjenje v srednjem veku informacijske dobe: ali nam bo uspelo ohraniti našo pisno digitalno dediščino? Centre)9, avstralski informacijski portal PADI10 in pobuda za ustvarjanje mreže za trajno ohranjanje nemško govorečih institucij NESTOR11 oz. projekt KOPAL12 ter drugi projekti, npr. PLANETS13, Digital Preservation Europe14, CASPAR15 in drugi. 3 Ali vemo, kaj je vredno ohraniti? Dejstvo je - ne glede na naša prizadevanja - , da nam ne bo uspelo ohraniti vse digitalne pisne produkcije. Tehnologija se prehitro spreminja, število elektronskih publikacij iz leta v leto eksponencialno narašča. Ne soočamo se le s problemom rasti količine informacij, ampak tudi z njihovim podvajanjem. Poleg publikacij, ki so bile ustvarjene v digitalni obliki, število reprodukcij z digitalizacijo in njihovo razmnoževanje v različnih datotečnih formatih ustvarja informacijsko onesnaženost. Prav zato, kljub zmanjševanju cene digitalnih nosilcev, je nujno potrebno tehtno razmisliti, kaj je vredno ohraniti. V sedanjosti ne moremo predvideti, kaj bo za prihodnje generacije pomembno ali zanimivo. Idealno bi bilo ohraniti vse, kar lahko, vključno z vsemi različicami. Seveda je to nemogoče, predvsem zaradi količine podatkov oz. njihove kratke življenjske dobe. Zato si depozitne institucije skušajo pomagati s pravilniki, ki določajo kriterije, po katerih naj bi se izbirale in zbirale elektronske publikacije. Ti kriteriji se lahko omejijo na produkcijo le v digitalni obliki in izključijo vse oblike reprodukcij, kot so digitalizirane kopije publikacij na papirju. Lahko pa se osredotočijo na teme, ki so pomemben prikaz političnega, kulturnega ali znanstvenega življenja sodobne družbe. Kriteriji selekcije morajo biti usklajeni s celotno strategijo trajnega ohranjanja in se zato morajo nanašati ne le na vsebino 9 Digital Curator Centre (DCC). Pridobljeno 8. 9. 2007 s spletne strani http://www.dcc.ac.uk/ about/ 10 Preserving Access to Digital Information (PADI). Pridobljeno 8. 9. 2007 s spletne strani http:// www.nla.gov.au/padi/index.html 11 Network of Expertise in Long-Term Storage of Digital Resources (NESTOR). Pridobljeno 8. 9. 2007 s spletne strani http://www.langzeitarchivierung.de/index.php?newlang=eng 12 Co-operative Development of a Long-term Digital Information Archive (KOPAL). Pridobljeno 8. 9. 2007 s spletne strani http://kopal.langzeitarchivierung.de/index.php.en 13 Preservation and Long-term Access through NETworked Services (PLANETS). Pridobljeno 8. 9. 2007 s spletne strani http://www.planets-project.eu/ 14 DigitalPreservationEurope (DPE). Pridobljeno 8. 9. 2007 s spletne strani http://www.digitalpreser vationeurope.eu 15 Cultural, Artistic and Scientific knowledge for Preservation, Access and Retrieval (CASPAR). Pridobljeno 8. 9. 2007 s spletne strani http://www.casparpreserves.eu/ 153 Knjižnica 51(2007)3-4, 149-161 oz. obliko, ampak tudi na tehnične lastnosti elektronskih virov, kot so datotečni formati, ki prenesejo daljše obdobje trajanja, programsko opremo, ki omogoča delovanje digitalnih objektov ali dostop do le-teh, odpravo tehničnih zaščit pri nekaterih bazah ali dokumentih in podobno. Kot posledica izkoriščanja možnosti, ki jih ponuja nova informacijska tehnologija, dokumenti na spletu prevzemajo različne oblike, tradicionalni žanri pridobivajo nove manifestacije in funkcije - tako nastajajo hibridni tipi publikacij oz. novi žanri, ki se uveljavljajo predvsem med pripadniki “google generacije”. Zato tudi mnoge nacionalne knjižnice v svojih kriterijih selekcije dokumentov na spletu zajemajo bloge, online enciklopedije, wikije in podobne oblike. V naslednjih letih je moč pričakovati, da se bodo nove oblike, ki komaj nastajajo, še bolj uveljavile, in prevzele enakovredno vlogo dosedanjim tradicionalnim oblikam, kot so elektronske serijske publikacije ali monografije. 4 Strategije trajnega ohranjanja Strategija trajnega ohranjanja določa procese in dejavnosti, ki se izvajajo v de-pozitnih ustanovah v smislu ohranjanja dostopnosti do pisne digitalne dediščine. Optimalno je, da se trajno ohranjanje izvaja od trenutka ustvarjanja dokumenta. Zato je zelo pomembno sodelovanje med ustvarjalci in depozitnimi ustanovami. Tako ustvarjalci lahko izberejo optimalne datotečne formate in strukture, ki bodo omogočili daljši življenjski ciklus svojim vsebinam. Depozitna ustanova16 mora ob prejemu digitalnega objekta ugotoviti, katero je njegovo bistvo oz. katere so njegove značilnosti, ki bi jih bilo vredno ohraniti. Na primer, pri monografiji, ki obravnava likovne podobe, je zelo pomembno, da se datoteke likovnih podob ohranijo v izvirni obliki. Pri multimedijskem gradivu je potrebno ohraniti vse funkcionalnosti, vključno z glasbenimi oz. video zapisi. Pri izvirni programski opremi pa je pomemben sam zapis programa. Vse strategije za trajno ohranjanje obravnavajo po eni strani ohranjanje toka podatkov, po drugi pa ohranjanje dostopa do vsebin digitalnega objekta. Velikokrat se tok podatkov, ki je digitalni zapis v določenem programskem jeziku na nekem 16 V tem prispevku je depozitna ustanova knjižnica, ki je po zakonu zadolžena za trajno ohranjanje del ali celovito nacionalno pisno produkcijo. 154 Kavčič-Čolić, A. Krmarjenje v srednjem veku informacijske dobe: ali nam bo uspelo ohraniti našo pisno digitalno dediščino? nosilcu, meša z njegovim nosilcem17. Zato pri obveznem izvodu in arhiviranju elektronskih publikacij prihaja do napačnega enačenja koncepta originala analognih z originalom digitalnih oblik. Pri elektronskih publikacijah predstavljajo original vsebine in njihovo izvirno prikazovanje oz. delovanje, izjemoma je programski zapis, vendar le, če je govora o programski opremi. Zato je odveč govoriti o trajnem ohranjanju dokumentov na prvotnih fizičnih nosilcih, kajti ti so neodvisni od nosilca, ki so kratkotrajni. Osvežitev nosilcev vsakih nekaj let je del vseh strategij za trajno ohranjanje. Nosilci se tudi hitro menjajo in celo optični mediji, ki so ob svojem nastanku veljali za bolj trpežne in trajnejše od magnetnih trakov, kažejo zelo majhne, vendar značilne izgube podatkov celo na letni ravni. Ohranjanje dostopnosti je bolj kompleksno in zahteva strokovni pristop infor-matikov, ki bodo predvideli in ocenili potrebe po konverzijah v enostavnejše ali širše dostopne datotečne formate. Strokovnjaki trdijo, da je optimalno hraniti elektronsko publikacijo v treh različicah: v izvirnem, arhivskem in dostopnem datotečnem formatu. Arhivski datotečni format je tisti, ki je najbolj razširjen in omogoča ohranjanje vseh izvirnih lastnosti v digitalnem objektu (npr. za besedila je to PDF/A ali RTF, za glasbene zapise WAV; za slike pa TIFF).18 Dostopni datotečni format je manjši od arhivskega (npr. pri slikah namesto TIFF datoteke uporabljamo datoteke z večjo stopnjo zgoščenosti, kot so *.gif ali *.jpeg) in zato omogoča uporabniku hitrejši ter enostaven dostop do elektronskega vira. Obenem elektronski vir lahko zaščitimo, tako da ga uporabnik ne more naložiti na svoj računalnik. V primeru, da se arhivski datotečni format s časom izkaže za napačnega, mora obstajati možnost vrnitve v izvirni datotečni format, tj. format, v katerem je bil elektronski vir prvotno ustvarjen. Pri vsem tem govorimo o različnih konverzijah oz. migracijah v višje ali druge datotečne formate. Lahko pa se zgodi, da se ob konverzijah izgubijo osnovne lastnosti digitalnega objekta. V tem primeru se nekateri opredeljujejo za uporabo posnemovalnikov (emulator-jev). To so naprave ali računalniški programi, ki posnemajo delovanje starejših računalnikov ali operacijskih sistemov z novejšo tehnologijo19. Nekateri prise- 17 Pri vseh elektronskih virih ločimo štiri različne ravni, in sicer: fizično raven, ki predstavlja nosilec zapisa (npr. disketa ali CD-ROM); logično raven, ki se nanaša na zapis v nekem programskem jeziku na omenjenem nosilcu (npr. zapis v Javi ali C++); konceptualno raven, ki prinaša vsebino elektronskega vira (npr. ločimo med različnimi zvrstmi besedil ali sliko in drugimi oblikami informacij); ter raven vseh specifičnih lastnosti samega elektronskega vira (npr. čeprav vemo, da imamo dostop do besedila, na tej ravni opazimo razliko med npr. formati Word in PDF glede na razlike v funkcijah, ki jih omogočata). V prispevku pod “digitalnim zapisom” mislimo na logično raven. 18 Strokovnjaki za trajno ohranjanje elektronskih virov verjamejo, da imajo formati, ki so najbolj razširjeni, večjo možnost za preživetje, ker je to v interesu širše skupnosti. 19 Po definiciji Terminološkega slovarja jezikovne sekcije Slovenskega društva Informatika je to “program ali naprava, ki omogoča računalniku posnemanje druge naprave, npr. drugačnega računalnika.” 155 Knjižnica 51(2007)3-4, 149-161 gajo na “muzejski pristop” ali ohranjanje tehnologij. Čeprav na prvi pogled najenostavnejši, je to najdražji pristop. Če ohranjamo stare računalnike in računalniško opremo, moramo zagotoviti dovolj rezervnih delov in strokovnjakov20, ki bodo znali uporabiti in vzdrževati to tehnologijo. Poleg omenjenih pristopov, so tudi različni kombinirani pristopi, kot je hranjenje v digitalni obliki vzporedno s tiskanjem na papirju, ali pristopi, ki mejijo z znanstveno fantastiko, kot je pristop R. Lorie (2001) z uporabo univerzalnega virtualnega računalnika (UVC - Universal Virtual Computer). Po njegovih besedah bi vsak datotečni format (npr. Adobov PDF) prevedli v jezik UVC (zelo enostaven strojni jezik), s katerim bi zapisali vsa pravila kodiranja in dekodiranja podatkov. V prihodnosti bi ga s pomočjo UVC tolmača (interpreterja) lahko prebral katerikoli računalnik (Slika št. 1). Pomanjkljivost tega pristopa je, da UVC omogoča shranjevanje le omejenega števila funkcij in seveda, bila bi potrebna dodatna sredstva za opis vsakega datotečnega formata v jeziku UVC. Slika št. 1: Uporaba UVC programa pri trajnem ohranjanju datotečnih formatov: Lorie R. A. A Project on Preservation of Digital Data. RLG DigiNews. 5, 3( 2001). http://www.rlg.org/preserv/diginews/diginews5-3.html#feature2, Figure 3) Za vsak datotečni format in digitalni objekt je treba posamično določiti strategijo za ohranjanje njihove dostopnosti. Poleg tega je pri kompleksnejših oblikah 20 Splošna ocena je, da je tehnološka generacija vezana na generacijsko znanje, ki se menja povprečno vsakih 15 let. V tem času je enostavno najti strokovnjake, ki se spoznajo na to tehnologijo, kakor tudi rezervne dele računalniške opreme, čeprav so jih nehali proizvajati. 156 Kavčič-Čolić, A. Krmarjenje v srednjem veku informacijske dobe: ali nam bo uspelo ohraniti našo pisno digitalno dediščino? zelo pomembno ohraniti tudi strukturo in podatke o načinu delovanja. Metapo-datki so zelo pomemben dejavnik pri trajnem ohranjanju, ker nam lahko pomagajo razumeti, kako lahko dostopamo do določenih vsebin, kako so le-te nastale in kakšna je njihova struktura. Zahtevnejši repozitoriji digitalnih arhivov omogočajo prenos digitalnih objektov v XML in pri tem tudi prenos pomembnejših meta-podatkov, posebej tistih, ki so pomembni za njihovo trajno ohranjanje. Danes obstaja več bibliografskih metapodatkovnih shem v XML, ki omogočajo ohranjanje podatkov o strukturi in drugih značilnostih dokumentov. Primer teh shem so METS (Metadata Encoding and Transmission Standard) ali MODS (Metadata Object Description Schema)21. 5 Zakonske podlage za ustvarjanje digitalnih arhivov Arhiviranje elektronskih virov obsega njihovo zajemanje ali prevzem, skladiščenje v digitalnem repozitoriju in omogočanje dostopa do digitalnih objektov. Za omenjena dejanja se uveljavljajo različne pravice. Zajem elektronskih publikacij zahteva njihovo reproduciranje, zato je potrebno preskrbeti dovoljenje od imetnikov avtorskih pravic. Angleži so zelo striktni in to pravico omejujejo tako, da prepovejo vsako reproduciranje, tudi prosto dostopnih publikacij na spletu22. Mnoge nacionalne knjižnice, med prvimi je bila Norveška, so uspele že v začetku tega tisočletja posodobiti zakonodajo o obveznem pošiljanju publikacij. Po dolgoletnem opozarjanju na ta problem smo v Sloveniji leta 2006 končno dobili Zakon o obveznem izvodu publikacij (2006), ki je prvič uzakonil zbiranje elektronskih publikacij, objavljenih na spletu, ter omogočil nadaljnji razvoj rešitev v zvezi z zajemanjem in hranjenjem elektronskih publikacij. Vendar samo zajemanje ne zagotavlja trajnega ohranjanja elektronskih virov. Kot smo videli v prejšnjem poglavju, je za trajno ohranjanje potrebno v samem začetku izbrati metodo, ki jim bo zagotovila daljši življenjski ciklus in dostop do digitalnih vsebin. Če je dokument zaščiten, je potrebno tehnično zaščito odpraviti, ker drugače ni mogoče izvajati strategije trajnega ohranjanja. Poleg tega je 21 Več o METS-u na spletni strani: http://www.loc.gov/standards/mets/, o MODS-u pa na spletni strani http://www.loc.gov/standards/mods/ 22 Junija 2002 smo na straneh britanske Copyright Licencing Agency lahko prebrali: “The World Wide Web is subject to copyright, and Web pages are themselves literary works”. Prepovedana je kakršnakoli reprodukcija, razen če ni bilo explicitno navedeno, da je le-ta dovoljena. Informacija pridobljena 8. 6. 2002 s spletne strani http://www.cla.co.uk/copyrightvillage/internet.html 157 Knjižnica 51(2007)3-4, 149-161 potrebno datotečne formate pretvoriti v arhivski in v dostopni datotečni format. Ker je to poseg v vsebino (barva slike, zmanjševanje funkcij elektronskega vira ali sprememba oblike) in zapis (sintaksa oz. logična raven) elektronskega dokumenta, bi brez novega Zakona o obveznem izvodu publikacij za najmanjšo spremembo v elektronski publikaciji morali pridobiti dovoljenje od imetnikov avtorskih pravic. To bi povzročalo veliko zamud pri njihovem zbiranju, zato bi bile mnoge za vselej izgubljene. Poleg pravne podlage za zajem (reproduciranje) in arhiviranje (poseg v datotečni format dokumenta) pri ustvarjanju digitalnih arhivov, je zelo pomembno pridobivanje dovoljenja za dostop. Dostop je vedno lahko le omejen (časovno ali lokacijsko), vendar je zelo pomemben, kajti le z uporabo elektronskih virov lahko ugotavljamo njihovo pravilno delovanje in potrebe po posodabljanju v druge datotečne formate ali nosilce. Vendar je pravica javnega dostopa do elektronskih publikacij, posebej pri komercialnih publikacijah, vezana na dogovore in licenčne pogodbe z imetniki avtorskih pravic. 6 Praksa v nacionalnih knjižnicah V Evropi je trenutno prisotna zelo visoka ozaveščenost o potrebah trajnega ohranjanja digitalne kulturne dediščine. Sama Strategija Evropske komisije i2010 posveča temu področju zelo velik pomen. Različni evropski programi sofinanciranja (eVsebinePlus, eTEN, 7. okvirni program) dajejo prednost ravno projektom, ki obravnavajo različne vidike trajnega ohranjanja. Ustvarjajo se delovne skupine in strokovne mreže, katerih namen je povezovanje in standardizacija postopkov. Največjo odgovornost pri trajnem ohranjanju prevzemajo nacionalne knjižnice in nacionalni arhivi. Razvite evropske nacionalne knjižnice skušajo ohraniti čim več nacionalne digitalne pisne produkcije. Pri tem večina le-teh gradi dve vrste arhivov: digitalne, ki zajemajo vso produkcijo elektronskih publikacij in reprodukcij publikacij na papirju, ter spletne arhive, ki so rezultat vnaprej določenih zajemov s spletnimi orodji, tako imenovanimi roboti ali pajki. Pri digitalnem arhivu je pomembnejši sistem repozitorija, ki omogoča zbiranje, hranjenje, arhiviranje in dostop do digitalne zbirke. Knjižnice se odločajo zelo različno, odvisno od števila informatikov v njihovih vrstah ali višine sredstev, predvsem nacionalnega izvora, ki naj bi omogočilo razvoj in vzdrževanje teh ogromnih sistemov. Na spletu je nekaj zelo dobrih odprto-kodnih sistemov, ki so jih že implementirale nekatere knjižnice, kot je na primer Fedora23 iz Univerze 23 Fedora (Virginia University, ZDA). Pridobljeno 8. 9. 2007 s spletne strani http://www.fedora.info/ about/ 158 Kavčič-Čolić, A. Krmarjenje v srednjem veku informacijske dobe: ali nam bo uspelo ohraniti našo pisno digitalno dediščino? v Virginiji ali DSpace24 iz Massachusetts Institute of Technology (MIT), obstajajo pa tudi komercialne rešitve, kot je na primer DigiTool25 od exLibrisa. Druge premožnejše knjižnice so sposobne vlagati več sredstev v lastni razvoj, in tako sta na primer pred nekaj leti nemška nacionalna in nizozemska kraljeva knjižnica v sodelovanju z IBM-om26 razvili svoj lastni digitalni arhiv. Po drugi strani se ustvarjajo spletni arhivi. V zadnjih nekaj letih se nacionalne knjižnice združujejo v konzorcij IIPC27, ki razvija odprto-kodne rešitve za zajemanje, hranjenje in dostop do publikacij na spletu. Veliko sredstev je vloženih v razvoj in v njem sodelujejo Internet Archive28 iz ZDA, Avstralska nacionalna knjižnica in skandinavske dežele, ki so med prvimi začele zajemati splet. Pristopi so zelo različni: od zajemanja publikacij na spletu po najvišjih domenah, do striktnega omejevanja na podlagi teme. Vendar se v zadnjih časih knjižnice pogosteje opredeljujejo za kombiniran pristop, ker je avtomatski zajem zaradi obstoja datotečnih formatov in aplikacij, ki jih spletni roboti ne zaznavajo, neizčrpen, medtem ko ročni zajem na določeno temo ali izbrane spletne strani lahko zagotovi celovitost zbirke. 7 Kako krmarimo v NUK-u? V NUK-u že nekaj let spremljamo razvoj digitalnih arhivov v razvitih evropskih knjižnicah. Za vzpostavitev tako kompleksnega sistema je potrebna ekipa infor-matikov in veliko finančnih sredstev, ki jih v NUK-u nismo imeli. Groba ocena stroškov pri uvajanju sistema digitalnega repozitorija, ki bi ga potrebovali, na podlagi estonskih29 in avstrijskih30 izkušenj, se giblje med dvesto in več tisoč evri. Francozi na novo gradijo digitalni arhiv in vanj bodo vložili od 8 do 10 milijonov evrov. Rešitev za to smo skušali poiskati v sodelovanju z različnimi domačimi in evropskimi raziskovalnimi projekti. Teoretske analize in raziskave smo opravili s 24 DSpace (MIT). Pridobljeno 8. 9. 2007 s spletne strani http://dspace.org/introduction/index.html 25 DigiTool (ExLibris). Pridobljeno 8. 9. 2007 s spletne strani http://www.exlibrisgroup.com/ digitool.htm 26 IBM. Pridobljeno 8. 9. 2007 s spletne strani http://www-5.ibm.com/nl/dias/ 27 International Internet Preservation Consortium (IIPC). Pridobljeno 8. 9. 2007 s spletne strani http://www.netpreserve.org/about/index.php 28 Internet Archive. Pridobljeno 8. 9. 2007 s spletne strani http://www.internetarchive.org 29 V okviru projekta reUSE je estonska Nacionalna knjižnica zgradila digitalni arhiv s pomočjo programske opreme Fedora, ki je dostopna z odprto kodo (http://www.fedora.info/about/). 30 Naši sosedje so v avstrijski Nacionalni knjižnici implementirali Ex Librisov sistem DigiTool (http:/ /www.exlibrisgroup.com/digitool.htm). 159 Knjižnica 51(2007)3-4, 149-161 pomočjo projekta “Zbiranje in arhiviranje slovenskih elektronskih publikacij na medmrežju”, ki je bil sofinanciran z javnimi sredstvi v okviru Ciljnih raziskovalnih programov. Za izdelavo programja za zbiranje in arhiviranje publikacij na slovenskem medmrežju smo se obrnili na Institut Jožef Stefan, s katerim smo nekaj let sodelovali pri dveh projektih. Žal to sodelovanje ni bilo uspešno. Tako smo ostali brez delujočega robota za zajemanje spleta in celotnega sistema za shranjevanje in dostop do spletnega arhiva. Vendar gre razvoj na vso srečo naprej. Prvega aprila 2007 je tudi NUK pristopil h konzorciju IIPC31, ki razvija odprto-kodne rešitve za zajemanje, hranjenje in dostop do publikacij na spletu. Tovrstna orodja smo v NUK-u začeli prilagajati našim potrebam. To je bilo mogoče z zaposlitvijo dveh informatikov. Sredstva za izgradnjo in zagon celovitega digitalnega arhiva pa nam bo omogočil nov mednarodni projekt iz norveških finančnih mehanizmov “Digitalna knjižnica Slovenije” (dLib.si). Zakonodajo o obveznem izvodu publikacij, ki podpira našo dejavnost, smo že dobili. Ravnokar je bil sprejet Pravilnik v zvezi z zajemom in selekcijo elektronskih publikacij32. Procese trajnega ohranjanja bo potrebno vključiti v organizacijo dela Narodne in univerzitetne knjižnice. Poleg že vključenih v projekt, bodo potrebni dodatni kadri. 8 Pred nami so novi izzivi Kljub temu, da trajno ohranjanje zahteva veliko sredstev in kadrov, je nujno potrebno, če želimo ohraniti pomembno digitalno produkcijo našega naroda za prihodnost. K temu moramo pristopiti temeljito in zelo premišljeno, kajti vsaka napaka na začetku ima lahko hude posledice čez nekaj let. V vseh dvestotih letih zbiranja obveznega izvoda se verjetno naša nacionalna knjižnica nikdar ni soočala s tolikšnimi spremembami pri svojem delovanju, kot jih prinašajo elektronske publikacije. Novi procesi pri prevzemanju tovrstnih publikacij, ravnanju z njimi in njihovo dajanje na voljo javnosti je povsem vezano na informacijsko tehnologijo, ki ne le da obstaja le nekaj let, ampak se nenehno spreminja in zahteva pogosto prenavljanje ter permanentno izobraževanje knjižničarjev in uporabnikov. Posledica razširjanja in uporabe elektronskih virov so novi pristopi v procesih nabave, obdelave in dajanja na voljo uporabniku. Zato bomo v NUK-u poleg organizacijskih sprememb morali 31 International Internet Preservation Consortium (IIPC). Pridobljeno 8. 9. 2007 s spletne strani http://www.netpreserve.org/about/index.php 32 Pravilnik o vrstah in izboru elektronskih publikacij za obvezni izvod, Uradni list Republike Slovenije št. 90/07, 5. 10. 2007. 160 Kavčič-Čolić, A. Krmarjenje v srednjem veku informacijske dobe: ali nam bo uspelo ohraniti našo pisno digitalno dediščino? tudi konkretizirati mnoge protokole pri zajemanju (urejanje avtorskih pogodb pri upoštevanju različnih scenarijev, preverjanje kvalitete in celovitosti elektronskih virov itd.), arhiviranju (izvajanje strategije trajnega ohranjanja) ter pri omogočanju dostopa do teh virov (upravljanje s stisnjenimi datotekami, povezovanje z različnimi programskimi opremami, ki niso več v uporabi, admini-striranje dovoljenj dostopa itd.). Pri tem je zelo pomembno nenehno spremljanje veljavnih standardov za to področje, kakor tudi nenehno osveščanje avtorjev in založnikov in izobraževanje bibliotekarjev. Vsekakor pa smo le začeli in pred nami je zelo zanimiva in dolga pot. Viri in literatura 1. Kuny, Terry. The digital dark ages? Challenges in the preservation of electronic information. International preservation news. (17. 5. 1998). Pridobljeno 15. 12. 2006 s spletne strani http://www.ifla.org/VI/4/news/17-98.htm#2 2. Lorie, R. A. A Project on Preservation of Digital Data. RLG DigiNews. 5, 3(2001). Pridobljeno 8. 9. 2007 s spletne strani http://www.rlg.org/preserv/ diginews/diginews5-3.html#feature2 3. Metadata Encoding & Transmission Standard (METS). Pridobljeno 8. 9. 2007 s spletne strani http://www.loc.gov/standards/mets/ 4. Metadata Object Description Schema (MODS). Pridobljeno 8. 9. 2007 s spletne strani http://www.loc.gov/standards/mods/ 5. Trusted Digital Repostiories: Attributes and responsibilities : an RLG-OCLC Report. Mountain View, CA: RLG, 2002. Pridobljeno 3. 11. 2006 s spletne strani http://www.rlg.org/longterm/repositories.pdf 6. Zakon o obveznem izvodu publikacij. (3. 7. 2006). Uradni list Republike Slovenije, št. 69, str. 7230-7234. 7. Zakon o varstvu dokumentarnega in arhivskega gradiva ter arhivih. (2006). Uradni list Republike Slovenije, št. 30. 8. Warning of data ticking time bomb. BBC News, 3.7.2007. Pridobljeno 8. 9. 2007 s spletne strani http://news.bbc.co.uk/go/pr/fr/-/1/hi/technology/ 6265976.stm Dr. Alenka Kavčič-Čolić, višji bibliotekar specialist, je zaposlena kot vodja Centra za raziskave in razvoj pri Narodni in univerzitetni knjižnici. Naslov: Turjaška 1, 1000 Ljubljana Naslov elektronske pošte: alenka.kavcic-colic@nuk.uni-lj.si 161