Matija Ogrin1 in Tomaž Erjavec2 UDK 821.163.6:801.73:004.91 ' Ljubljana, Znanstvenoraziskovalni center SAZU ^ Ljubljana, Institut »Jožef Stefan« EKDOTIKA IN TEHNOLOGIJA: ELEKTRONSKE ZNANSTVENOKRITIČNE IZDAJE SLOVENSKEGA SLOVSTVA Zbirka znanstvenokritičnih izdaj eZISS je nastala s povezavo treh prvin: z oživljenim zanimanjem za primarne vire slovenskega slovstva; z intenzivno metodološko vpeljavo temeljnih filološko-historičnih ved, zlasti ekdotike ali tekstne kritike; in naposled z uporabo sodobnih odprtih standardov elektronskega označevanja in obdelave besedil. Članek predstavi izhodišča in metode, uporabljene v pripravi teh znanstvenih izdaj, zlasti povezanost teh metod s tehnologijo elektronskega označevanja besedil. Priprava izdaj je temeljila na smernicah konzorcija Text Encoding Initiative (TEI), v katerih se tehnološki standardi povezujejo s klasičnimi filološkimi metodami znanstvenokritičnih izdaj. Ta pristop se je izkazal kot smiseln tudi za izdajanje znanstvenokritičnih izdaj slovenskega slovstva in je spodbudil intenzivnejše zanimanje za raziskovanje in objavljanje primarnih virov slovenske književnosti. Ključne besede: znanstvenokritične izdaje, slovenska književnost, ekdotika, tekstna kritika, XML, TEI Izhodišča Znanstvenokritične izdaje predstavijo literarna dela na znanstven način. Zato največkrat šele v njih literarna dela postanejo dejanski predmet literarne vede. V tem smislu znanstvenokritične izdaje tudi v slovenistiki kakor v vsaki nacionalni literarni zgodovini soustvarjajo temeljno podlago same literarne vede, saj v dobršni meri konstituirajo njen predmet. Priprava kritičnih izdaj mora ob poglabljanju v primarne vire, v biografiko avtorjev in v sociokulturni kontekst dobe posegati skorajda po najširšem možnem okviru silnic, v katerih nastaja literarno delo. Znanstvenokritična izdaja implicira predvsem temeljno raziskavo nekega dela ali celega opusa; izdaja kot taka je šele posledica, učinek. Temeljna raziskava virov je bistvo; izdaja je le fenomen te raziskave. Kritična izdaja je raziskava primarnega vira besedila, dosledno izpeljana po filoloških metodah do končne objave. Zato je njena priprava dejanje, s katerim si literarna veda osvoji nov predmet, nova tla za nadaljnje raziskovalne poti. Klasična filologija in biblicistika sta se kot vedi v veliki meri razvili in konstituirali prav v večstoletnem razvoju znanstvenega izdajanja Svetega pisma in antičnih klasikov. Ob tem, da znanstvenokritična izdaja odkrije, (re)konstituira in posreduje besedilo kot predmet literarne vede, v določeni meri konstituira tudi njen razvoj, njeno avtentičnost in aktualnost. Znanstvenokritične izdaje in slovenska literarna zgodovina Kljub temu je za slovensko literarno zgodovino značilno, da znanstvenokritične izdaje v nji dokaj dolgo sploh niso začele nastajati. Razlogi za to so povezani s posebnostmi našega prostora in zgodovine (prim. Dolinar 2005: 159ss). Urejenega, sistemsko usidranega mesta niso dobile vse do Ocvirkove ustanovitve eminentne znanstvene zbirke Zbrana dela slovenskih pesnikov in pisateljev, ki je v naslednjih desetletjih postala osrednja institucija znanstvenih edicij. In vendar je bil celo z njo status znanstvenokritičnih izdaj le deloma urejen. Občasno je s posodabljanjem jezika morala delati koncesije tudi širši bralski namembnosti (Dolinar 2005: 163). Pregled zgodovine znanstvenega izdajanja pri nas vzbuja podobo, da z odhodom starejše generacije slovenskih literarnih zgodovinarjev - zlasti Prijatelja, Grafenauerja in Kidriča - priprava znanstvenih izdaj poslej ni bila več razumljena kot ena prednostnih, prvovrstnih nalog literarnega zgodovinarja, ampak kvečjemu še »spremno«, »pomožno« opravilo, ki so se mu marljivi in vztrajni posamezniki še naprej posvečali - toda nekako navkljub glavnemu toku literarne vede. Ta je poslej potekal nekoliko drugače. Poudarek se je prenesel s samega besedila in njegovega tekstnega izročila, skratka od gradiva kot empiričnega vira tekstov, na razne interpretacije in vrednostne, tudi ideološke ocene in sinteze. Besedilo kot pozitivni objekt - s tem pa njegova empirična podlaga v rokopisih, tiskih in drugem izročilu - ter njegovo pozitivno ozadje v avtorju in historičnem kontekstu sta se začela umikati interpretaciji. V povojnih desetletjih so začele prevladovati razne govorice ali diskurzi o literaturi - deloma pod ideološkim pritiskom komunistične doktrine, ki je hotela družbi, prenarejeni z revolucijo, prenarediti tudi vrednostni in kulturni spomin; nemalo pa so se interpretacije krepile prav kot opozicija ideološkim pritiskom v smeri estetske, imanentne in strukturalistične interpretacije. Znanstveno izdajanje literature je v takšnih razmerah postajalo manj pomembno. Kaj in kako se je govorilo o slovenski literaturi, je postajalo čedalje pomembnejše od ekdotične analize in posredovanja literature same, od njenih konkretnih virov, verzij, variant, od njenih nosilcev, rokopisov, tipkopisov in starih tiskov. Neogibna posledica tega splošnega stanja je, da tudi ekdotična ali tekstnokritična metodološka vprašanja - tako teoretična kakor praktična - v literarni vedi na Slovenskem nimajo tako obsežne in razčlenjene tradicije, kakor bi jo lahko imela vsaj v povojnih desetletjih, ko je veda že imela vse potrebne institucionalne osnove. Poleg Zbranih del se je ekdotična problematika podrobneje in bolj celovito razvila v naši literarni vedi šele razmeroma pozno - v znanstvenih izdajah Inštituta za slovensko literaturo ZRC SAZU, zlasti s kritično izdajo Brižinskih spomenikov (BS 1992). Namen projekta eZISS Prvotni namen projekta eZISS ()1 je bil poskus, kako prenesti klasične filološko-historične metode ekdotike oziroma tekstne kritike tiskanih znanstvenih izdaj v okolje elektronskega medija in novih informacijskih tehnologij. Vendar se je ta cilj, ki je bil sprva čisto metodološki in deloma tehnološki, ob samih praktičnih poskusih s pripravo prvih pilotskih elektronskih izdaj kmalu poglobil. Temeljna ambicija projekta eZISS je spontano prerasla v postopno oživitev zanimanja za raziskovanje primarnih virov in njihovo posredovanje v znanstvenih izdajah nasploh. Zdelo se je, da je oživitev tega interesa potrebna tudi v slovenski literarni vedi nasploh: povezati temeljne raziskave besedil in metode za njihovo predstavitev v izdajah - povezati torej analizo literature in njeno znanstveno posredovanje kot dve prepleteni niti istega procesa, ki je na raznih stopnjah deloma analitičen, deloma deskriptiven, deloma interpretativen. Za takšno raziskovalno in edicijsko delo z viri je bilo potrebnih več metodoloških konceptov in postopkov, ki smo jih deloma lahko sprejeli že iz tradicije znanstvenega izdajanja na Inštitutu za slovensko literaturo, deloma pa jih je bilo treba šele na novo razviti ali izpopolniti - predvsem pa premisliti, kako jih udejanjiti v elektronskem mediju. Metode znanstvenega izdajanja besedil Filološka tradicija, katere rezultat so znanstvene izdaje literarnih in bibličnih besedil, je zelo široka. V nji so se izoblikovale številne koncepcije in usmeritve. Vendar je večino pristopov k besedilu mogoče razvrstiti v dve krovni skupini, in to glede na eno samo temeljno vprašanje: ali urednik oziroma prepisovalec besedilo prepisuje brez sprememb in ga reproducira ali pa, nasprotno, vnaša v besedilo kakšne koli, velike ali majhne spremembe in ga s tem modificira. V prvo skupino spadata faksimile in diplomatični prepis (v angloameriškem okolju je zanj v rabi tudi izraz dokumentarna izdaja). V drugo skupino spadajo razne vrste kritičnih izdaj oziroma, točneje, kritičnih prepisov. 1 V dveh organizacijskih oblikah ali stopnjah je potekal na Inštitutu za slovensko literaturo ZRC SAZU v letih 2001-2007. Diplomatično prepisovanje izhaja iz diplomatike kot pomožne historične vede o starih listinah. Diplomatični prepis zvesto reproducira zapis listine z vsemi originalnimi historičnimi posebnostmi: okrajšav ne razvezuje, reproducira dodatke nad črto ali pod njo, robne pripise, tudi prečrtana mesta, pomote ipd. Diplomatični prepis ne le reproducira izvirnik, ampak prepisovalca predvsem prisili, da pravilno prebere vsa zagonetna mesta, kjer je besedilo morda zapisano eno prek drugega, dodano, vrinjeno, prečrtano. Avtor diplomatičnega prepisa skuša zgolj razbrati vse prvine zapisa in jih reproducirati, ne da bi se pri tem kakor koli odločal, kaj od prečrtanega, vrinjenega, dodanega ipd. bo sprejel kot »pravilnejše«, »lepše« ipd. Nasprotno, razbrati in reproducirati mora ves tekst v viru kot tak, pri tem pa seveda ločevati, ali je vse zapisano od prve roke ali pa so v dokumentu dodatki in popravki poznejših rok. Z vsem tem diplomatični prepis nikakor nima le rekonstruktivne, mimetične funkcije, daleč od tega, ampak ima v procesu analize besedila predvsem spoznavno funkcijo. Z analitičnim razbiranjem se torej diplomatični prepis spušča vsaj deloma v genezo zapisa, pogosto kar v genezo nastanka besedila. Diplomatično prepisovanje je nepogrešljiva metoda na več področjih literarne vede, zlasti v t. i. genetični kritiki in v historično-kritičnih izdajah. Temu nasprotno je kritični prepis predvsem kritična rekonstrukcija (ne reprodukcija!) besedila, dosledno izvedena po jasnih načelih. Kritični prepis je običajno namenjen dejanskemu branju besedila. Med načela, po katerih avtor kritičnega prepisa posega v tekst, običajno sodijo razvezava kratic, sodobno pisanje besed skupaj - narazen, raba velike začetnice, bolj ali manj aktualizirana stava ločil in druge pravopisne konvencije. Glede na namen izdaje bo pri starejših besedilih avtor prepisa morda želel bodisi ohraniti bodisi omiliti rabo starinskih oblikovno-skladenjskih posebnosti, arhaizmov ali narečnih prvin. Pri tem si bo glede na posebnosti vira samega izoblikoval načela, ki jih bo nato v prepisu konsistentno udejanjil. V vsakem primeru je kritični prepis bolj ali manj posredovano, rekonstruirano, interpretirano besedilo, za določeno stopnjo oddaljeno od svoje prvotne oblike - vendar v skladu s sprejetimi prepisovalnimi načeli vselej rigorozno in zvesto podano besedilo. Kritični prepis lahko vsebuje tudi posamezne prvine fonetičnega prepisa, ko skušamo s prepisom predvsem obnoviti (historično, narečno) glasovno podobo teksta. Pravi fonetični prepis je specifično jezikoslovna metoda, ki zahteva tudi zapis v fonetični pisavi. Kakor diplomatični in kritični tudi fonetični prepis zahteva eksplikacijo prepisovalnih načel in ustrezen komentar. Urednik znanstvene izdaje v vsakem primeru stoji kot srednik med preteklostjo, avtorjem, delom na eni strani in sodobnostjo, izdajo ter bralcem na drugi strani. Lahko se bolj nagne »na to ali ono stran enačbe«, v vsakem primeru pa mora svojo odločitev reflektirati tako v luči »preteklosti« kakor »sedanjosti« (Greetham 1997: 6). V kompleksni problematiki, ki stoji za enim ali drugim pristopom in za njunimi mnogoterimi izpeljavami, se zdi zlasti koristno naslednje temeljno razlikovanje, ki ga je v teorijo ekdotike uvedel G. Thomas Tanselle. V vsakem besedilnem viru je mogoče razlikovati med (slovstvenim, literarnim) dokumentom in (slovstvenim, literarnim) delom. Besedila dokumenta ne moremo spreminjati, ker je z določenim dokumentom dano enkrat za vselej; dokument lahko le reproduciramo. Če pa urednik vnaša v prepis spremembe, ne more več reči, da nam podaja tekst določenega dokumenta, ampak posega onkraj dokumenta v nekaj, kar meni, da je nekoč določen avtor hotel vzpostaviti kot slovstveno ali literarno delo (Tanselle 1992: 57-58; Tanselle 1997: 17). Kritična izdaja, točneje, kritični prepis je torej sklop reflektiranih, pretehtanih urednikovih posegov v tekst literarnega dela. Urednik jih mora pretehtati glede na celotnost literarnega dela, kar pomeni, da morajo biti organski, vselej pa uvajajo v besedilo dela tudi določeno stopnjo interpretacije. Metodološka zasnova izdaj eZISS Edicije, ki smo jih pripravljali v knjižnici eZISS, so že od prve izdaje - Slomškovih Treh pridig o jeziku - upoštevale širši metodološki razpon. Ta je obsegal obe metodi, tako diplomatično kakor kritično. Pomembna in zavestna novost izdaj eZISS je, da so tudi za novoveška, celo moderna besedila slovenske književnosti vpeljale koncept sobivanja več metod v isti izdaji, koncept več perspektiv na isto besedilo, ki se je bil uveljavil v znanstvenokritični izdaji srednjeveških Brižinskih spomenikov (1992, 1993, 2004). Izhajali smo iz ideje, ki jo je ob Slomškovih pridigah prvi izrazil Jože Faganel, da je neki vir, ki je zanimiv za več humanističnih ved, denimo za jezikoslovje, literarno ali občo zgodovino, teologijo itn., smiselno »prezentirati na tak način, da omogoča študij za vsako od možnih raziskovalnih disciplin« (Faganel 2007, prva izdaja 2004). S pripravo naslednjih izdaj je postajalo bolj in bolj jasno, da je vsak temeljito raziskan vir smiselno predstaviti v izdaji na več načinov: s faksimilom rokopisa ali prvotiska, rokopise vsekakor z diplomatičnim in kritičnim prepisom, po potrebi s prevodom ali s fonetičnim prepisom, s prikazom morebitnih variantnih mest, ne nazadnje pa tudi z zvočnim posnetkom govorjenega besedila. V vsakem od teh prikazov nudi tekst določene, specifične informacije. Pomensko je torej mogoče neko besedilo izčrpno predstaviti le, če ga obdelamo z več metodami in posredujemo v več perspektivah. Ker je elektronski medij kakor ustvarjen za takšne kompleksne predstavitve besedil, se je ta široki, metodološko fasetirani koncept uveljavil na razne načine -skladno s specifiko tega ali onega besedila - v vseh izdajah eZISS. Kronološko skoraj sočasno z izdajo Treh pridig o jeziku (2004) je nastala prva izdaja Korespondence Žige Zoisa (Vidmar 2007), ki je ob faksimilu ponudila epistolarno gradivo v kritičnem prepisu in prevodu v slovenščino. Zoisova in Kopitarjeva pisma so tako prikazana z vseh možnih strani - ob urednikovih opombah in razlagah se izkažejo za vir mnogoterih kulturnozgodovinsko pomembnih informacij. Po tipu izdaje je Zoisovi korespondenci podobna izdaja Mestnih priseg (Golec 2009), kjer pa nastopa uradovalna slovenika 17. in 18. stoletja - za adekvatno predstavitev, zanimivo tako za slovenista kakor za zgodovinarja, je bilo torej potrebno poleg faksimila zagotoviti diplomatični in kritični prepis z ustreznimi študijami. Največji dosežek projekta eZISS je nedvomno razširjena in predelana izdaja Brižinskih spomenikov (BS 2007). BS so tako ekdotično kakor tehnološko najobsežnejša izdaja. Spomeniki so predstavljeni s faksimilom in z vrsto prepisov. Ker so namreč BS brali in prepisovali vse od Vostokova in Kopitarja z določenimi razlikami, ki so bile tudi predmet polemičnih diskusij, smo se odločili, da v izdajo sprejmemo vse znanstveno najbolj relevantne diplomatične in kritične prepise, da bodo dostopni kot celotno besedilo, ne le v aparatu opomb. Zasnovana je bila kot nekakšna ekspandirana editio variorum? Dodan je bil tudi prevod v poljski in italijanski jezik. Vsi ti prepisi se dajo ogledati bodisi posamič bodisi v raznih vzporednih prikazih na ravni vrstice. Ob tem je bil v prepise integriran tudi zvočni posnetek fonetične rekonstrukcije BS Tineta Logarja, izdaja pa obogatena še z zemljevidom, stranjo za šolsko rabo idr. Zdi se, da je izdaja BS tako do kraja izčrpno predstavila besedilo naših najstarejših spomenikov. Tri metodološko različne vrste prepisov, vključno s fonetičnim, so omogočile vse vrste branja in odprle v izdaji praktično vse potencialne objekte razumevanja. Zdi se, da bi tudi preostale slovenske srednjeveške spomenike kar najbolj uspešno predstavili na podoben način. Glede na vir in ustroj predstavljata popolnoma drugačen tip dve izdaji modernih besedil. V Zbranih pesmih Antona Podbevška je zelo raznovrstno pesniško gradivo ob faksimilih prepisano diplomatično in kritično, delno tudi izrecno interpre-tativno, saj je bilo v Podbevškovem lastnem izvodu pesniške zbirke z mnogimi poznejšimi posegi in pripisi komaj mogoče slediti avtorjevi intenci (Dovic 2007). Ta prepis vsekakor pomeni najbolj skrajno stopnjo kritičnega prepisa, v kateri je urednik moral nemalo interpretirati pomen rokopisnih posegov in je na to tudi opozoril. Izdaja romana S poti pa predstavlja svojevrsten ekdotični korak: Cankar je roman objavil v dveh nekoliko različnih verzijah. Naša izdaja navaja v aparatu - z deloma ročno, deloma strojno analizo razlik - več kot štiristo variantnih mest, kjer se verziji S poti razlikujeta. Urednika sta se na temelju analize teh variantnih mest odločila, da kot merodajno verzijo ponudita prvo Cankarjevo objavo S poti iz leta 1913; vendar sta izkoristila elektronsko obliko izdaje in predložila bralcu tudi drugo izdajo iz leta 1919, kakor tudi primerjavo med obema (Ogrin in Vidmar 2007). Ta izdaja je torej primer, ko se uredniška odločitev (izbira zgodnejše verzije 2 Del tiskane izdaje BS, kjer je Igor Grdina svoj diplomatični prepis v aparatu podrobno primerjal s šestimi starejšimi izdajami, bi lahko služil kot odličen (pa tudi edini) slovenski primer editio variorum. »Cumulatively, a variorum can therefore present a cultural and critical history of the transmission and reception of a text, but it does not usually try to create a new [critical] text« (Greetham 1994: 417). Zato je že tiskana izdaja BS presegla običajni koncept editio variorum s svojim kritičnim in fonetičnim prepisom. Tem bolj pa elektronska s celotnim besedilom vseh v aparatu primerjanih izdaj in prevodov BS. kot merodajne) ni izrazila v uredniškem konceptu (opustitev poznejše verzije), ampak zgolj kot mnenje urednikov; poznejša verzija kakor tudi primerjalni prikaz sta namreč enakovredno vključena v izdajo. Končno velja kot zanimivost omeniti tudi izdajo Škofjeloškega pasijona, kjer je ob faksimilih in prepisih Pasijona kakor tudi obširnega dokumentarnega gradiva v izdajo integriran tudi video posnetek uprizoritve v dveh načinih: kot preprost video in kot sinhronizirana sopostavitev videa in obeh prepisov (delo Damjana Bojadžieva, IJS). Urednik je ob tem posebej iskal sledi neohranjenega tekstnega izročila, tj. sledi starejših slovenskih pasijonskih predlog, iz katerih je p. Romuald prepisoval ali zajemal, in na ta mesta opozoril s kazalkami v komentarju (Ogrin 2009). Raznolikost virov, zvrsti besedil in tipov izdaj Od prvih idejnih zasnutkov v smeri elektronskih izdaj sredi leta 2001 je do srede leta 2009 izšlo v zbirki eZISS sedem znanstvenih izdaj. Morebitna podoba, da to ni impresiven obseg, se dopolni, če pomislimo, da je vsaka izdaja izraz temeljne raziskave primarnih virov in z njimi povezanega konteksta dobe, historičnih oseb in dopolnilnega gradiva. Projekti izdajanja elektronskih izdaj so v zahodnem svetu običajno koncipirani tako, da so fokusirani na določeno obdobje in celo znotraj obdobja na določeno zvrst ali avtorski corpus separatum ipd. Število izdaj oziroma obseg posredovanih besedil je večji, historična problematika pa je bolj specializirana, torej ožja. Pri zbirki eZISS je ravno nasprotno. Uredniki so se morali spoprijeti s skrajno različnimi tipi izdaj: srednjeveški spomeniki odpirajo vse drugačno ekdotično problematiko in zahtevajo bistveno drugačno obravnavo kakor baročna pasijonska pobožnost; slovenske prisege iz 17. stoletja postavljajo čisto druga vprašanja in naloge kakor objava Slomškovega prvotiska zgodnjega 19. stoletja itn. Viri so bili večidel rokopisi raznih dob od 10. prek 17. do 20. stoletja. V izdajah predstavljena besedila nosijo lastnosti literarnih zvrsti, ki segajo od pridige (retorska proza) in romana prek moderne poezije do pasijonskega dramskega besedila in vse do dokumentarne slovenike in svetovljanske epistolografije. Tipi znanstvenokritičnih izdaj obsegajo moderno razširjeno editio variorum (BS), določene prvine genetično-kritične izdaje je najti v izdajah Pasijona in Podbevška, Zoisova korespondenca in Mestne prisege predstavljata dve zelo različni obliki dokumentarne izdaje, Tri pridige o jeziku in S poti predstavljata klasični kritični izdaji literarnega dela, vendar s presežkom celostnega prikaza variantnih mest obeh verzij S poti itn. Takšna raznolikost konceptov, virov in zvrsti besedil je zahtevala vrsto različnih postopkov in prijemov. Pri tem je bilo za celotno knjižnico eZISS bistvenega pomena, da se je lahko oprla na že izdelano tehnologijo, podrobno prilagojeno prav za pripravo humanističnih besedil - od enostavnejših do najbolj kompleksnih. To tehnologijo je za potrebe humanistike razvil in prilagodil konzorcij Text Encoding Initiative (TEI - ). Pomembno je, da je TEI ne samo tehnologija, ampak mnogo več: je v tehnološke kategorije prenesena, inkorporirana in aplicirana velika tradicija historično-filoloških ved in njihovih metod. TEI je k raziskovanju in elektronskemu objavljanju tekstov usmerjen spoj sodobne tehnologije in filološke tradicije. Za projekt eZISS je bila vsekakor sreča, da je lahko začel svoje delo na ramenih tako velikega dosežka. Digitalni zapis izdaj eZISS Iniciativa za zapis besedil TEI je razvila priporočila za predstavitev digitalnih besedil, ki so obenem dovolj ekspresivna in odzivna na raziskovalne potrebe znanstvenikov s področja humanistike. TEI lahko opišemo kot: - prosto dostopen nabor priporočil za zapis besedil s področja humanistike, ki uporablja kot osnovni standard XML (Extensible Markup Language); - mednarodni konzorcij, katerega namen je podpora vzdrževanju in razvoju priporočil; - mednarodno združbo projektov in oseb, ki uporabljajo priporočila TEI. Priporočila TEI, s polnim imenom The TEI Guidelines for Electronic Text Encoding and Interchange (TEI 2007) definirajo in dokumentirajo označevalni jezik za predstavitev strukturnih, predstavitvenih ali konceptualnih lastnosti besedil. Priporočila so usmerjena predvsem v zapis dokumentov s področja humanistike in družboslovja, še najbolj pa v zapis primarnih virov za namene raziskav in analiz. Izražena so kot modularna in razširljiva shema XML, ki ji je pridružena podrobna dokumentacija, dostopna pa so pod odprtokodno licenco. Do sedaj je izšlo že več različic priporočil TEI, prva javna izdaja z imenom TEI P3 in osnovana še na standardu SGML je izšla že leta 1994, tej je leta 2002 sledila TEI P4 (prehod na XML in manjši popravki), konec leta 2007 pa TEI P5, ki je uvedla bistvene popravke glede na P3, upoštevajoč izkušnje, ki so se nabrale v petnajstih letih od prve uporabe priporočil, pa tudi dokončno opustitev standarda SGML in polno izkoriščanje XML. V zbirki eZISS smo za večino izdaj uporabili še TEI P4, za zadnji dve (Škofjeloški pasijon in Prisežna besedila), ki sta bili izdani po letu 2008, pa TEI P5. Priporočila TEI definirajo več sto elementov in atributov XML za označevanje raznolikih zvrsti besedil. Elementi in njihovi atributi so razvrščeni v module, od katerih vsak pokriva neko zvrst besedil ali interpretativni aparat, vsak modul pa je podrobno opisan v svojem poglavju priporočil. Shemo XML, ki jo potrebujemo za validiranje formalne pravilnosti besedil TEI, lahko naredimo prek spletnega orodja Roma (dostopno je prek domače strani TEI), kjer izberemo želene module, lahko pa shemo tudi razširimo ali spremenimo glede na svoje potrebe. Za izdaje eZISS smo uporabili sheme XML, ki - glede na konkretno izdajo -uporabljajo bogat nabor modulov TEI. Spodaj naštejemo nekaj bolj zanimivih: - core: skupni podatki Modul, ki je obvezen za vsako besedilo TEI - definira splošno uporabne elemente, kakor so na primer odstavek, prelom strani, poudarjeno, bibliografske podatke, pa tudi na primer elemente za osnovni opis gledaliških besedil, kot npr. govor, govorec, didaskalija, verz itn. - header: skupni metapodatki Modul, ki je obvezen za vsako besedilo TEI - definira strukturo kolofona TEI, tj. elementa, ki vsebuje opis besedila, na primer naslov, avtorja, opis vira, uporabo oznak itn. - textstructure: struktura besedila Tudi ta modul je obvezen, definira elemente, ki podajo zgradbo besedila, kakor so naslovnica, razdelki, dodatki idr. - linking: povezovanje, segmentacija in poravnava Modul nudi atribute za medsebojno povezovanje elementov. V izdajah eZISS ga uporabljamo za povezovanje faksimilov s prepisi in medsebojno povezovanje prepisov v vzporednih prikazih (običajno na ravni vrstice ali odstavka). - msdescription: opis rokopisov Modul vsebuje elemente za podroben opis rokopisov, na primer navedbo repozitorija, vsebinski opis, fizični opis (materialna podlaga, folacija, kolacija, zgodovina rokopisa), opis rok itn. - transcr: transkripcije primarnih virov Modul vsebuje elemente za vključitev faksimilov v besedilo, kakor tudi elemente, ki se uporabljajo pri diplomatičnih in kritičnih prepisih, denimo nadomestni vpis, dodano oziroma zbrisano, okrajšave, razvezave, nejasno idr. - textcrit: tekstna kritika V tem modulu najdemo elemente za tekstnokritični aparat, s katerim lahko na primer neposredno opišemo razlike med posameznimi verzijami ali izdajami nekega dela. Ta modul je imel pomembno vlogo v naši izdaji S poti Izidorja Cankarja. - dictionaries: slovarji Modul nudi elemente za zapis slovarskih struktur, kakor so geselski članek, iztočnica, slovnične lastnosti, definicija, prevod itn. Uporabljamo ga pri Brižinskih spomenikih, saj izdaja vsebuje slovarček, ki poda slovnične in fonetične lastnosti besedja BS, prevode v pet jezikov (mdr. starocerkveno slovanščino) in konkordance. - gaiji: dokumentacija za posebne znake Modul omogoča definicijo in uporabo posebnih znakov, ki jih ne najdemo v Unikodu. Zaradi univerzalnosti nabora znakov v Unikodu so primeri, ko ta modul potrebujemo, zelo redki, vendar pa se je izkazal za koristnega pri Brižinskih spomenikih, kjer v fonetičnem prepisu (deloma tudi v cirilici starocerkvene slovanščine) srečamo kompleksne oziroma nenavadne znake, ki jih v spletni izdaji lahko verno izpišemo z uporabo posebne pisave (pisava ZRCola Petra Weissa), lahko pa jih »približno« izpišemo tudi s pisavami, ki so skladne z Unikodom. Kakor je razbrati iz Tabele 1 (v prilogi), je poleg običajnih strukturnih elementov (razdelek, bibliograske navedbe itn.) največ prav elementov za ekdotične ali tekstnokritične eksplikacije besedila, kakor so okrajšave, razvezave, dopisani ali prečrtani deli, enote tekstnokritičnega aparata ipd. Poleg priporočil TEI smo pri izdajah eZISS uporabljali tudi druge standarde in formate. Kot je podrobneje razloženo v naslednjem razdelku, smo za pretvorbo XML-TEI v spletni prikaz uporabili skripta XSLT (transformacijski jezik nad dokumenti XML), ki so ravno tako kot standard XML konzorcija za svetovni splet W3C. Dve izdaji vsebujeta tudi multimedijske vsebine. V izdajo BS je integriran zvočni posnetek branja po fonetičnem prepisu, pri čemer je bil govor segmentiran po povedih in stavkih znotraj povedi, povezave na govorne datoteke pa enostavno pripisane posameznim povedim/stavkom pri posameznih prepisih. Škofjeloškemu pasijonu pa je pridružena video uprizoritev iz leta 1999, pri čemer je dostopna tudi sinhrona predstavitev videa in diplomatičnega oziroma kritičnega prepisa Pasijona, realizirana v jeziku SMIL (Synchronized Multimedia Integration Language), ki jo je mogoče gledati s predvajalnikom Real, pri čemer zadošča njegova brezplačna različica. Postavitev izdaj na splet Če predstavlja dokument, zapisan v XML, »dejansko« digitalno izdajo, ki naj bi bila formalno pravilna, večnamenska in odporna na tehnološke spremembe, pa ta oblika ni najbolj primerna za spletno branje izdaje; za te namene je bistveno boljši HTML, saj je to zapis, namenjen prav prikazu v spletnih brskalnikih. Pretvorba iz TEI-XML v zapis HTML je narejena za vsako edicijo posebej s pomočjo skript v jeziku XSLT. Za čim boljšo predstavitev izdaj v TEI P4 smo za vsako napisali namensko pretvorbo XSLT, katere rezultat čim bolje prikaže posebnosti izdaje v spletnem brskalniku. Pri izdajah, zapisanih skladno s TEI P5, smo za prikaz na zaslonu ubrali drugačno pot: izdajo smo z razmeroma enostavnim XSLT prevedli v poenostavljen (predstavitveno usmerjen) zapis TEI, za samo pretvorbo v HTML pa izkoristili standardna skripta XSLT, dostopna na straneh konzorcija TEI. Poleg predstavitve HTML samih besedil, smo na splet v HTML postavili tudi kolofone posameznih izdaj. Kot rečeno, vsebuje kolofon TEI metapodatke o besedilu, besedilo torej dokumentira, v ta namen pa uporablja veliko število specializiranih elementov. Poleg klasičnih bibliografskih podatkov najdemo tu tudi seznam vseh elementov, ki se uporabljajo v besedilu in njihovo pogostnost, opise posebnih znakov (BS), podroben opis rokopisa (ŠP) itn. Kolofoni TEI so s pomočjo skripte XSLT prevedeni v zapis HTML, dodatno pa prevedemo imena vseh uporabljenih elementov v slovenščino; v ta namen smo napisali datoteko TEI-XML, ki našteje vse elemente TEI in jim pripiše slovensko ustreznico. Celotna knjižnica eZISS ima na spletu svojo krovno stran tako v slovenskem kakor v angleškem jeziku, ki vsebuje predstavitev projekta, bibliografijo in kazalke na posamezne izdaje. Vsaka izdaja eZISS na spletu pa je sestavljena iz naslednjih delov: - krovna stran s kratko predstavitvijo izdaje in povezavami, v slovenskem in angleškem jeziku; - kolofon TEI, predstavljen v jeziku HTML z opisnim imenom vsake od uporabljenih oznak v slovenščini; - izdaja v HTML, primerna za pregledovanje in branje v spletnih brskalnikih; - kanonična izdaja v XML-TEI, skupaj s shemo XML in skriptami XSLT za pretvorbo v HTML; - stisnjene datoteke v formatu zip, ki omogočajo prenos izdaje (samo besedila ali pa celote s pridruženimi faksimili oziroma multimedijskimi vsebinami) na lasten računalnik, kjer lahko izdajo uporabljamo tudi brez spletne povezave. Izdaje (HTML, XML, XSLT) so dostopne pod licencami Creative Commons, kar pomeni, da jih je dovoljeno v celoti in brezplačno kopirati in tudi razširjati. Pri vseh izdajah zahtevamo priznanje avtorstva, odvisno od izdaje pa tudi deljenje pod enakimi pogoji oziroma pogoj, da se izdaje (v primeru redistribucije) ne predeluje. Dostop do spletnih strani knjižnice eZISS spremljamo s programom Google Analytics, ki nam pokaže, da naše izdaje v povprečju obišče okoli petdeset uporabnikov na dan, od tega polovica iz Slovenije. Okoli polovica vseh uporabnikov najde knjižnico oziroma posamezne izdaje prek spletnih iskalnikov (kjer sta najbolj pogosta iskalna niza »brižinski spomeniki« in »anton martin slomšek«), tretjina pa prek povezanih strani. Približno četrtina obiskovalcev uporabi knjižnico večkrat, okoli 6 % obiskovalcev (v zadnjem letu okoli tisoč) pa se na straneh zadržuje več kot deset minut. Sklep Znanstvenokritične izdaje eZISS () so začele nastajati kot poskus, kako prenesti klasične tekstnokritične principe znanstvenih izdaj v okolje elektronskega izdajanja. Poskus je lahko uspel le kot spoj treh prvin: ekdotike ali tekstne kritike, tradicije slovenskega slovstva in tehnologije elektronskega označevanja besedil. Pokazalo se je, da je nova metoda priprave znanstvenih izdaj, ki je bila s tem poskusom razvita, uspešna in plodna, da odpira priročne, sodobnemu času prilagojene in v marsičem nove poti k (starim) filološkim ciljem. Tehnologija XML-TEI je pokazala velik potencial, da temeljnim raziskavam slovenskega slovstva nudi ne le oporo in orodja, ampak v določenem smislu celo nov zagon. Pogled raziskovalcev se je od začetnih težav s tehnologijo kmalu lahko preusmeril k primarnim virom - k starim tiskom in rokopisom - s ponovno oživljenim zanimanjem za njihovo historično raziskovanje. Izdaje eZISS smo želeli kar najbolj približati uporabnikom. Zato smo skrbeli za natančen in standardiziran zapis posameznih izdaj in jih objavili pod zelo liberalnimi pogoji uporabe, s katerimi eZISS prednjači v Sloveniji kakor tudi v širšem regionalnem prostoru. V izdajah eZISS so uporabljene razne metode analize in prepisovanja besedil (diplomatični, kritični, fonetični prepis), pa tudi kombinacija prepisov in drugih medijev (faksimile, zvočni in video posnetek), da bi tako omogočili raznolike poglede in pristope k besedilu. To je bilo mogoče storiti, ne da bi »izumljali kolo«, ker smo se oprli na dosežke drugih, zlasti na prevladujoče, v svetu sprejete standarde elektronskega označevanja besedil -Unikod, XML, TEI. Vse to izdajam zagotavlja ne le odpornost na tehnološke spremembe in neodvisnost od programske opreme, marveč tudi metodološko akuratnost in, navsezadnje, pozitivno udeležbo slovenske slovstvene komponente v globaliziranih trendih digitalne izmenjave znanstvenih informacij. Izdaje eZISS združujejo klasično filološko raziskovanje besedil - njihov izvor, primarne vire, metode njihovega prepisovanja in komentiranja - z modernimi elektronskimi postopki za njihovo hranjenje, analizo in prezentacijo. Upati je, da bo takšna združitev prispevala k oživitvi širšega zanimanja za raziskovanje primarnih virov slovenskega slovstva. Literatura Dolinar, Darko, 2005: Znanstvene izdaje in literarna veda. Ogrin, Matija (ur.): Znanstvene izdaje in elektronski medij. Studia litteraria, ZRC SAZU. 155-166. Greetham, David C., 1994: Textual Scholarship. An Introduction. New York: Garland Publishing. Greetham, David C., 1997: Introduction. Scholarly Editing. A guide to Research. New York: MLA. 1-7. Tanselle, G. Thomas, 1992: A Rationale of Textual Criticism. University of Pennsylvania Press. Tanselle,G. Thomas, 1997: The Varieties of Scholarly Editing. Scholarly Editing. A guide to Research. New York: MLA. 9-32. Spletne izdaje BS 2007: Brižinski spomeniki. Monumenta frisingensia. Elektronska znanstvenokritična izdaja. Izdaja 1.0, ur. M. Ogrin, ZRC SAZU. . Dovic, Marijan (ur.), 2007: Anton Podbevšek. Zbrane pesmi. Elektronska znanstvenokritična izdaja. ZRC SAZU. . Faganel, Jože, 2007: Osnovni podatki, opredelitev značaja izbranih besedil in raziskovalni interes. Slomšek, Anton Martin: Tri pridige o jeziku. Elektronska znanstvenokritična izdaja. Izdaja 1.6. ZRC SAZU. . Golec, Boris, 2009: Mestna prisežna besedila v slovenskem jeziku do začetka 19. stoletja. Elektronska znanstvenokritična izdaja. ZRC SAZU. . Ogrin, Matija, in Vidmar, Luka (ur.), 2007: Izidor Cankar: S poti. Elektronska znanstvenokritična izdaja. ZRC SAZU. . Ogrin, Matija (ur.), 2009: Oče Romuald: Škofjeloški pasijon. Elektronska znanstvenokritična izdaja. ZRC SAZU. . Vidmar, Luka (ur.), 2007: Korespondenca Žige Zoisa. Elektronska znanstvenokritična izdaja. Izdaja 1.2, ZRC SAZU. . TEI Consortium (ur.), 2007: TEI P5: Guidelines for Electronic Text Encoding and Interchange. Version 1.4.1. Last updated on July 1st 2009. TEI Consortium. . (Dostop 19. avgusta 2009.) Priloga Modul oznaka slovensko ime slmsk podb cankar zois bs sP Prisg E core jedro abbr okrajšava 0 0 0 0 119 610 0 729 add dodano 219 0 0 0 34 77 49 379 analytic analitična raven 0 0 0 0 469 0 0 469 author avtor 0 0 0 0 614 0 0 614 bibl bibliografska enota 5 0 15 233 0 113 0 366 biblScope obseg navedbe 0 0 0 0 969 0 0 969 biblStruct strukturirana bibl.enota 0 0 0 0 625 0 0 625 choice izbira 0 0 0 0 0 647 0 647 corr uredniški popravek 6 0 0 0 187 63 0 256 date datum 3 0 2 4 582 9 3 603 del prečrtano 144 0 0 8 31 76 62 321 desc opis 0 0 0 0 0 170 47 217 divGen generiran razdelek 2 0 2 25 0 2 33 editor urednik 0 0 0 0 10 0 10 emph poudarjeno 83 198 111 1,546 222 848 88 3,096 expan razvezava 0 0 0 0 13 609 0 622 foreign tujejezično 0 0 0 491 0 0 0 491 gap vrzel 4 0 0 25 43 11 0 83 graphic slikovno gradivo 0 0 0 0 0 515 141 656 head naslov 21 275 45 157 340 391 358 1,587 hi izpostavljeno 12 1 0 130 62 559 3,622 4,386 imprint impresum 0 0 0 0 626 0 0 626 item postavka 32 129 49 3 979 1,337 126 2,655 l verz 0 1,805 40 0 0 2,703 0 4,548 label napis 0 0 1 0 15 49 4 69 lb prelom vrstice 0 0 22 0 14 608 1,124 1,768 lg kitica 0 277 2 0 0 24 0 303 list seznam 4 9 10 1 36 222 45 327 listBibl seznam bibl. enot 1 0 1 0 147 3 0 152 milestone mejnik 0 0 0 0 986 0 0 986 monogr monografska raven 0 0 0 0 625 0 0 625 name ime 0 0 1 0 1,303 14 0 1,318 note opomba 250 108 68 820 550 397 696 2,889 p odstavek 13 150 858 1,042 425 673 1,284 4,445 pb prelom strani 0 0 0 0 0 448 93 541 ptr kazalec 0 0 33 0 0 48 0 81 pubPlace kraj objave 0 0 2 0 562 1 1 566 publisher izdajatelj 2 2 3 2 8 2 2 21 q navednica 0 0 0 0 963 0 0 963 ref sklic 14 203 20 1,442 2,895 67 2 4,643 resp odgovornost 0 0 0 0 9 0 0 9 respStmt navedba odgovornosti 0 0 0 0 8 0 0 8 series podatki o seriji 0 0 0 0 54 0 0 54 sic napaka 0 0 0 0 55 38 0 93 sp govor 0 0 0 0 0 268 0 268 speaker dramski govorec 0 0 0 0 0 250 0 250 stage didaskalija 0 0 0 0 0 164 0 164 title naslov 0 0 1 0 1,153 0 0 1,154 unclear nejasno 1 0 0 0 0 1 0 2 dictionaries slovarji entry geslo 0 0 0 0 579 0 0 579 eg (P4) primer 0 0 0 0 526 0 0 526 form pravopisne oblike!! 0 0 0 0 1,164 0 0 1,164 gram podatki o skladnji 0 0 0 0 858 0 0 858 gramGrp podatki o skladnji 0 0 0 0 858 0 0 858 orth pisna oblika 0 0 0 0 579 0 0 579 pron izgovorjava 0 0 0 0 585 0 0 585 re povezano geslo 0 0 0 0 6 0 0 6 xr fraza za navzkrižno sklicevanje 0 0 0 0 235 0 0 235 tr (P4) prevodni niz 0 0 0 0 1,756 0 0 1,756 trans (P4) prevod 0 0 0 0 352 0 0 352 eZISS (P4) dodatki eZISS (samo TEI P4) line vrstica faksimila 1,533 0 0 0 5,700 0 0 7,233 page stran faksimila 41 0 0 247 235 0 0 523 figures slike cell celica 0 0 0 0 353 614 3,592 4,559 figDesc opis slike 0 324 17 87 30 0 0 458 figure slika 66 0 17 174 30 5 0 292 row vrstica 0 0 0 0 153 196 614 963 table tabela 0 0 0 0 2 5 38 45 gaiji posebni znaki g znak/glif 0 0 0 0 1,316 0 0 1,316 linking povezovanje ab anonimni blok 0 108 0 0 0 0 0 108 anchor sidro 0 0 0 0 0 2 0 2 xptr (P4) kazalec 0 0 0 0 278 0 0 278 xref(P4) kazalka 45 0 12 0 88 0 0 145 namesdates imena in datumi placeName krajevno ime 0 0 0 0 0 0 2 2 textcrit tekstna kritika app enota kritičnega aparata 0 0 478 0 0 10 0 488 rdg varianta 0 0 849 0 0 21 0 870 witness rokopisna verzija 0 0 2 0 0 0 0 2 textstructure struktura besedia back priloge 1 0 1 1 0 1 1 5 body telo besedila 1 1 1 1 1 1 1 7 byline podpisani 3 1 1 5 0 11 1 22 closer sklepne vrstice 0 0 0 0 0 12 0 12 dateline vrstica z datumom 1 8 1 0 1 5 3 19 div razdelek 18 253 47 106 337 342 302 1,405 docAuthor avtor dokumenta 4 4 7 5 26 19 1 66 docImprint impresum dokumenta 1 1 1 1 5 1 1 11 docTitle naslov dokumenta 1 1 1 1 1 1 1 7 front uvodni razdelek 1 1 1 1 1 1 1 7 opener uvodne vrstice 0 0 0 0 0 18 0 18 salute pozdrav 0 0 0 0 0 13 0 13 signed podpis 1 10 2 0 1 14 36 text besedilo 1 1 1 1 1 1 1 7 titlePage naslovnica 1 1 1 1 1 1 1 7 titlePart del naslova 2 2 2 2 3 2 2 15 transcr transkripcije facsimile faksimile 0 0 0 0 0 4 1 5 handShifl sprememba roke 0 0 0 0 0 8 0 8 subst nadomestni vpis 0 0 0 0 0 37 11 48 supplied vstavil urednik 0 0 0 0 0 1 1 2 surface površina 0 0 0 0 0 170 47 217 witList (P4) seznam verzij rokopisa 0 0 1 0 0 0 0 1 E 2,537 3,873 2,729 6,562 31,794 13,527 12,385 73,407 Tabela 1: Uporaba oznak TEI v izdajah eZISS daje sinoptični pregled nad vsemi uporabljenimi oznakami v besedilih izdaj glede na modul TEI, v katerem so definirane, njihovim slovenjenjem in pogostnostjo v posameznih izdajah in skupno.