Jezik in slovstvo, letnik 66 (2021), št. 4
Marko Juvan UDK 821.163.6.09:81‘322“1968“
ZRC SAZU
Inštitut za slovensko literaturo in literarne vede
Univerza v Ljubljani, Filozofska fakulteta
Mojca Šorli
ZRC SAZU
Inštitut za slovensko literaturo in literarne vede
Univerza v Ljubljani, Filozofska fakulteta
Andrejka Žejn
ZRC SAZU
Inštitut za slovensko literaturo in literarne vede
INTERPRETIRANJE LITERATURE
V ZMANJŠANEM MERILU:
»ODDALJENO BRANJE«
KORPUSA »DOLGEGA LETA 1968«
Članek obravnava vlogo interpretacije v digitalnohumanističnem pristopu k literaturi, posebej v
korpusni analizi. Pokaže, kakšen je v literarni vedi interpretativni pomen računalniških statistično-
preštevnih analiz pojavnic, oznak in metaoznak v majhnem korpusu literarnih besedil, zajetem
iz določenega časovnega obdobja. Na primeru korpusa izvirnih literarnih besedil, natisnjenih med
mednarodnim študentskim gibanjem »dolgega leta 1968« v periodiki pretežno študentske generacije
(Tribuna in Problemi), kvantitativna analiza oz. »oddaljeno branje« raziskuje uveljavljanje
modernizma, spreminjanje zvrstnega repertoarja in literarnega jezika, besedilne sledi revolucionarnega
ozračja in vlogo žensk v literarnem sistemu.1
Ključne besede: digitalna humanistika, literarni korpus, oddaljeno branje, korpusna analiza, slovenska
literatura, študentsko gibanje, 1960–1975
1 Digitalna humanistika in interpretacija literature
»Digitalna humanistika« (DH) je izraz, ki je očaral naše tisočletje, potem ko je
odmevni zbornik A Companion to Digital Humanities (Schreibman idr. 2004) z
njim zamenjal bolj tehnični termin »humanistično računalništvo« (humanities
computing).2 To je bilo sprva obrobno področje, ki se je kot mostišče med »dvema
1 Članek je rezultat projekta Maj 68 v literaturi in teoriji: zadnja sezona modernizma v Franciji, Slo-
veniji in svetu (J6-9384), ki ga financira ARRS.
2 Že leto pozneje izraz posloveni Matija Ogrin v uvodu k zborniku o znanstvenih izdajah (Ogrin 2005:
12–15).
56 Marko Juvan, Mojca Šorli, Andrejka Žejn
kulturama« (Snow 2013)3 trudilo za priznanje v humanističnem mainstreamu
vse od petdesetih let 20. stoletja. Pod posodobljeno blagovno znamko »digitalna
humanistika« je v našem tisočletju končno doživelo kanonizacijo in ekspanzijo.4
V financiranju znanosti, zagledanem v nove tehnologije in meddisciplinarnost kot
vrednoti sami na sebi, je DH danes uvrščena med indikatorje t. i. raziskovalne
odličnosti in družbene aplikativnosti. Vodilnega toka humanistike in njegovih
elitnih ustanov DH sicer v glavnem še ni osvojila, a trka na njihova vrata kot nova,
neoliberalnemu duhu časa primerna znanstvena paradigma (prim. Allington idr.
2016; Schreibman idr. 2004: xxvi; Siemens idr. 2007: 17; Terras idr. 2013: 166,
175–176). »Analogna« humanistika, če ji tako rečemo, do mlajše digitalne sestre
ostaja zadržana in kritična. Med drugim ji očita teoretsko podhranjenost, opiranje
na zastarela pojmovanja teksta, naivni realizem ter trivialnost, nezadostnost ali celo
zgrešenost računalniških rezultatov, na prvi pogled neovrgljivih.5 Kljub pomislekom
se DH v obliki socialnega omrežja, ki daje vtis demokratičnega sodelovanja, od
devetdesetih let 20. stoletja nezadržno širi, v veliki meri prek digitalnih medijev.
Tudi računalniško slabo pismenim humanističnim strokovnjakom so njene metode
in orodja približali osebni računalniki, dostopni arhivi digitaliziranih tekstov ter
prijazni programi za hrambo in obdelavo podatkov.
Zdi se, da je jezikoslovje po svojem predmetu raziskovanja in strukturalni metodi
najbližje formalizmu računalniških jezikov. Morda se je zaradi te homologije
humanistično računalništvo najprej zasidralo v analizi jezika in tekstov. Računalniških
orodij, ki so s svojimi kapacitetami pomnjenja in obdelave nepreglednih količin
podatkov presegli omejitve posameznikovega uma, so se nato oprijemale še
druge humanistične stroke, med prvimi literarna veda. Na začetku se je po zgledu
jezikoslovja ukvarjala s stilno in semantično-tematsko analizo, izpeljano iz
najpogostejših besed in konkordanc (prim. Scherber 1977). Veda o književnosti
sicer ima (tudi pri nas) tradicijo preštevnih metod, denimo v verzologiji (Pretnar
1997), teoriji žanrov, stilistiki in študijah avtorstva (prim. Dović 2004; Hladnik
1993, 1995; Perenič 2010). Toda pred dobo DH literarna veda zvečine še ni segala
po algoritmih in zahtevnejši statistiki, kar je temeljni metodološki pogoj v današnji
računalniški stilistiki (prim. Allison idr. 2013; Rybicki idr. 2016), računalniškem
prepoznavanju žanrov in drugih raziskavah »kvantitativnega formalizma« (Allison
idr. 2011). Odkar se literarna stroka prepušča čarom DH, vedno raje uporablja
računalniška orodja, zlasti pri elektronskih znanstvenokritičnih izdajah (gl. Ogrin
2005), spletnih knjižnicah, prepoznavanju avtorstva, raziskavi žanrov ali stilov
(gl. Žejn 2021), v zadnjem času tudi georeferenciranju literarnozgodovinskih
podatkov (gl. Juvan in Dokler 2015).
3 Snow razpravlja o prepadu med »kulturama« matematično-naravoslovnih znanosti in družboslovno-
-humanističnih ved, kot se odražata v izobrazbi, družbenem napredku in ugledu.
4 O zgodovini humanističnega računalništva in digitalne humanistike po svetu gl. Jannidis idr. 2017;
Schreibman idr. 2004; Siemens 2016; Siemens in Schreibman 2007; Terras idr. 2013. O DH na Slo-
venskem gl. Hladnik 2012.
5 Podobna kritika prihaja tudi iz insajderskih vrst, gl. npr. Da 2019.
Interpretiranje literature v zmanjšanem merilu: »Oddaljeno branje« korpusa ... 57
Bržčas največji premik, ki ga je v literarni stroki izzvala DH, so spodbudili korpusi,
sestavljeni iz tisočev, celo sto tisočev besedilnih enot (prim. Hoover idr. 2014).
Graditev obsežnih digitalnih repozitorijev, strukturiranih in označenih po enotnih
merilih, so omogočili množična digitalizacija tiskane dediščine, njena dosegljivost
na internetu, pa tudi razvoj standardov za računalniško označevanje besedil (Hoover
idr. 2014: 2; Terras idr. 2013: 133–135).
Besedilni korpusi so zahtevali bistveno spremembo literarnovedne metode, njeno
zbližanje z družboslovno in računsko znanstveno domeno.6 Gre za premik od t. i.
branja od blizu k branju na daljavo. Bližnje branje (angl. close reading) je metonimija
za natančno interpretacijo posamične besedne umetnine (najpogosteje izbrane iz
kanona), oddaljeno branje pa je metafora za analizo arhiva,7 tj. množice tekstov,
v kateri nas ne zanimata ne pomen ne struktura enega samega besedila, temveč
distribucija oziroma pogostnost določene lastnosti, strukture ali elementa v izbrani
besedilni množici. Izraz distant reading je v teorijo svetovne literature vpeljal Franco
Moretti (2011). Z njim je poimenoval metodo posploševanja podatkov, ki jih dobimo
iz druge roke, iz metabesedil izvedencev, ki so preučili relevantna dela v jezikih svoje
filološke specializacije. Branje na daljavo je po Morettiju nujen pogoj za kakršno
koli sintezo o svetovnem literarnem pojavu, prepoznavnem nad ali pod ravnijo
besedila (denimo za posplošitev o medliterarnosti posamičnega žanra, forme). Samo
tako se namreč svetovnozgodovinska sinteza izogne prehitrim sklepom, izpeljanim
iz zoženega kanona vodilnih književnosti sveta. Z ustanoviteljskim delovanjem v
Literarnem laboratoriju Univerze Stanford je Moretti zaslužen tudi za prenos izraza
»oddaljenega branja« iz tradicionalne humanistike v digitalno (Moretti 2018). Tu
se nanaša na računalniško podprto analizo besedilnih korpusov; pot si utira med
sorodnimi termini, na primer »makroanalizo« (Jockers 2013) ali »algoritemskim
kritištvom« (Ramsay 2011).
Prehod od branja z bližine (mikroanalize) k oddaljenemu branju (makroanalizi)
predpostavlja spremembo merila (prim. Clarke in Wittenberg 2017). Po analogiji
s kartografijo nas večje merilo približa posamičnemu, manjše merilo, ki prikaže
razsežnejše ozemlje, pa splošnemu. Pomanjšava merila je ne le količinska sprememba,
temveč tudi kakovostna. Z razširitvijo se pogledu odprejo povezave, strukture in
lastnosti, ki jih posnetek od blizu, narejen v velikem merilu, ne zazna. Z oddaljenim
računalniškim pogledom je mogoče iz »velikega podatkovja« (big data) formulirati
posplošitve, ki se po svoji nomotetičnosti približajo naravoslovnim zakonom. Takšen
argument ima za metaopazovalca znanstvenih domen (Rosenbloom 2013) večjo
dokazno moč kot humanistična interpretacija. Slednja je odvisna od tega, kako
prepričljiva je v partikularnem kontekstu za skupnost ostalih interpretov.
6 O strukturi znanosti, ki se deli na štiri »velike domene« (fizično, življenjsko, družbeno in računsko;
physical, life, social, computing), ki imajo sebi primerne, a različno »močne« metode in stopajo v
razna razmerja, med njimi zlasti interaktivna, gl. Rosenbloom 2013.
7 Za opozicijo kanon/arhiv gl. Moretti 2018.
58 Marko Juvan, Mojca Šorli, Andrejka Žejn
Pri prehodu od preučevanja posameznih književnosti k svetovnemu literarnemu
sistemu kot sovisni celoti odpovedo humanistične metode, ki jih lahko uporablja um
posameznika. Isto velja za analizo enojezičnega besedilnega korpusa. »Analogna«
literarna veda se je pri preučevanju besedil utemeljevala na metodi interpretacije.8
V nasprotju z interpretacijo, ki zaradi omejitev spoznavne perspektive razmerje
med delom in celoto neizogibno presoja nedoločno in subjektivno, korpusnemu
pristopu posamično besedilo ne pomeni nič, če ni postavljeno v merljiva razmerja
do besedilne množice, kakršne človeški um ne more niti spominsko obvladati. Prav
masovni podatki besedilnega korpusa so predmet oddaljenega branja, možnega samo
z uporabo računalniške statistike, algoritmov in strojnega učenja.
Interpretacija, katere cilj je razumevanje drugega, je v humanističnih znanostih
izvorno mišljena kot intersubjektivno razmerje. Intersubjektivnost se prenese tudi
v razmerje med soobstoječimi interpretacijami, ki so pravzaprav izjave različnih
spoznavajočih subjektov o istem tekstu. V nasprotju s trdo znanostjo, ki napreduje
prek matematičnih, logičnih in/ali empirično-eksperimentalnih ovržb nezadostnih
razlag, se humanistika zaradi intersubjektivnosti razvija prek soočanja množice
interpretacij. Te so podvržene vsakokratni preizkušnji argumentacijske prepričljivosti
in kontekstualne relevantnosti svoje spoznavne perspektive.
V DH se v razmerje med subjekti vplete računalniški medij. V spoznavni proces
poseže z algoritmom, ki so ga informatiki predhodno izšolali na drugih besedilih.
Literarni strokovnjak nad spoznavnim intervalom, ki je v domeni stroja, nima
nadzora, čeprav lahko spreminja nastavitve in vhodne podatke. Statistična analiza
korpusa je resda strojna, a spoznavni proces ostaja okvirjen z metodo interpretacije
(prim. Rommel 2004). Interpretacija prototipskih besedil je eno od izhodišč za
hipoteze računalniške raziskave. Interpretacija, ki spominja na Barthesovo sledenje
prepletu kodov v toku pripovedi, je raztresena v tok označevanja digitaliziranih
enot v metajeziku računalniškega kodiranja. Oznake za kodiranje tekstov, npr. TEI,
predpostavljajo teorijo besedila, ki so jo razvili interpretativni pristopi.9 Nekaterih
oznak se računalniški program še ni naučil samodejno dodeljevati tekstu (npr.
naratološki pojmi, retorične figure, modalnost), zato jih mora v korpus po svojem
razumevanju vnašati človek. Tudi pri nenadzorovanem strojnem kategoriziranju
– tu ni vnaprej kodiranih podatkov in jih s t. i. rojenjem (clustering) sortira
računalniški program – se na koncu spet vključi spoznavni subjekt. Računalniško
proizvedene rezultate, tabele in grafe je končno treba interpretirati, se pravi
razumeti njihov smisel v referenčnih okvirih literarne vede. To je tudi cilj sledečih
analiz.
8 Interpretacija kot proces intersubjektivnega razumevanja izjavo drugega prevaja v metakoncepte.
Tako spoznavni subjekt prek metabesedilnega modeliranja oblikovno-pomenske zgradbe interpreti-
ranega teksta izpiše, kako razume »del in celoto«, kakšen je zanj smisel besedila na ozadju nadredne
enote (npr. avtorskega opusa, žanra, obdobja, filozofije, nezavednega).
9 Po mnenju Johna Cummingsa (v: Siemens idr. 2008: 458–460) se opira na razmeroma stare predsta-
ve novega kritištva in strukturalizma.
Interpretiranje literature v zmanjšanem merilu: »Oddaljeno branje« korpusa ... 59
2 Dolgo leto 1968, transformacije družbe in literature: hipoteze
Sodelavke in sodelavci raziskovalnega projekta o modernistično-avantgardistični
literaturi »dolgega leta 1968« (tj. obdobja svetovnega študentskega gibanja med
ok. 1965 in 1975) smo si zastavili vprašanje, kako lahko na novo interpretiramo
literarnozgodovinske probleme z računalniško podprto lingvistično-statistično
analizo korpusa literarnih besedil, objavljenih v tedanji študentski periodiki (prim.
Juvan idr. 2018).10 Na izhodiščih novejše strokovne literature o obravnavanem
obdobju in z nedigitalnimi metodami humanistike, predvsem s strukturalno-
semiotičnim in sistemskim pristopom, smo postavili hipotezo, da je bilo študentsko
gibanje, marsikje povezano z delavskim, po svojem značaju svetovna revolucija.
Kot takšno naj bi težilo k radikalni transformaciji družbe na vseh področjih, od
ekonomskega in političnega do jezikovnega, kulturnega, literarnega ali erotičnega.
Bližina revolucije je po naših domnevah prek neoavantgard prenovila tudi
modernizem, čeprav se je ta prej že institucionaliziral in akademiziral. Z analizo
bibliografskih metapodatkov in besedilnega korpusa smo želeli preveriti, ali in v
kolikšni meri so se v »dolgem letu 1968« na literarnem polju zgodile naslednje
transformacije:
a) Študentke in študenti se kot nov politični subjekt uveljavijo v javni sferi:
Ali tedanja študentska generacija prevladuje tudi kot proizvajalec literarnih
besedil v obravnavani periodiki? Ali so mladi nosilci prenove modernizma?
b) Emancipiranje žensk: Je maj ‘68 kot »totalna revolucija« omajal patriarhalno
strukturo slovenskega literarnega polja? Kolikšen je delež avtoric? Kakšno
je vrednotenje žensk?
c) Prenova zvrstnega repertoarja: Sta se glede na tedanje teorije o
revolucionarnosti teksta prenovila značaj literarnih zvrsti in njihov repertoar?
Je poezija, ki tvori jedro slovenskega literarnega kanona, obdržala vodilno
vlogo?
d) Modernizem se prek neoavantgard radikalizira: Ali v analizirani slovenski
periodiki, ki velja za osrednje gibalo modernizacije v tistem času,
modernizem v literaturi res prevladuje? Je zmeren ali radikalen?
e) Uveljavljanje vizualnega koda v tisku: Če šestdeseta leta zaznamuje začetek
prevlade vizualnih medijev nad tiskom, bi se to moralo v korpusu nakazati
z okrepljenim pomenom vizualnega v strukturi tekstov.
f) Dekanonizacija knjižnega jezika: Šestdeseta leta so kot obdobje
»splošnega sekularizma« (During 2021) v modernih književnostih načele
primat knjižnega jezika, utemeljenega na narodnem kanonu. Je s tem
v literarnih besedilih prišlo do porasta prvin tujih jezikov in neknjižne
slovenščine?
10 Projekt Maj 68 v literaturi in teoriji: zadnja sezona modernizma v Franciji, Sloveniji in svetu (2018–
2022) je predstavljen na spletni strani https://maj68.zrc-sazu.si/.
60 Marko Juvan, Mojca Šorli, Andrejka Žejn
3 Priprava korpusa
Besedila za korpus smo pridobili iz javno dostopne digitalizirane periodike, in sicer
Tribune in Problemov v Digitalni knjižnici Slovenije (dLib.si). Ta izbira je bila sicer
pragmatična (za digitalizacijo bi sami potrebovali dodatna sredstva in čas), a tudi
vsebinska. Ta dva časopisa sta namreč tesno vpeta v študentsko gibanje dolgega
leta 1968, obenem pa sta bila odprta teoretskim in literarnoumetniškim inovacijam.
Izbrali smo letnike 1968–1972, ko je bilo gibanje na vrhuncu, in za primerjavo dodali
leto 1964, ko je oblast ukinila revijo Perspektive, predhodnico kritične teorije in
modernistične literature Problemov.
Ob pomoči zunanjih sodelavcev, študentk in študentov smo v Excelovih tabelah
pripravili anotirano bibliografijo vseh izvirnih in prevedenih teoretskih ter literarnih
besedil. Tabelarni popis poleg standardnih bibliografskih informacij vsebuje
še biografske in analitične metapodatke, kot so rojstne letnice, nacionalnost ter
družbeni spol avtorjev in avtoric, zvrst besedila, stopnja modernizma in vizualnosti
ter odstopanje od slovenskega knjižnega jezika. Za korpus so bila nato iz celotne
bibliografije izbrana samo izvirna literarna besedila slovenskih avtorjev. Vsako
od 874 izbranih besedil smo po optični črkovni prepoznavi (OCR) s popravki
pretvorili v format .docx. Korpus je bil avtomatsko lematiziran in oblikoskladenjsko
označen,11 pri označevanju po smernicah TEI so bile upoštevane prilagoditve
CLARIN.SI TEI (https://github.com/clarinsi/TEI-schema). Vsaki besedilni enoti
smo dodali metapodatke, prenesene iz Excelovih tabel. Sodelavec Tomaž Erjavec
je ožji korpus iz letnikov 1964, 1968 in 1972 pod oznako Maj68 1.0 (https://www.
clarin.si/repository/xmlui/handle/11356/1430) postavil v repozitorij Clarin.si,
za analize pa je dostopen prek spletnega konkordančnika NoSketch Engine (http://
www.clarin.si/noske/). V sodelovanju z Andrejem Pančurjem smo besedila korpusa
naložili v SIDIH, zbirko digitalne humanistike pod okriljem DARIAH (The Digital
Research Infrastructure for the Arts and Humanities).
4 Analiza metapodatkov iz anotirane bibliografije
V prvi fazi raziskave smo preverili interpretativno vrednost preštevanja bibliografskih
metapodatkov o 874 slovenskih literarnih besedilih korpusa Maj68. Ti podatki so
bibliografski in interpretativno-analitični. Prvi so pridobljeni iz primarnih virov,
naloženih na dLibu, in iz biografskih virov (npr. Slovenska biografija), drugi pa so
nastali kot moderirana kvalitativna ocena, odvisna od interpretacij posameznega
besedila: vnašalci podatkov so se ravnali po enotnih kriterijih določanja oznak, vnosi
pa so bili preverjeni v projektni skupini. Izkazalo se je, da je na podlagi preštevanja
bibliografskih metapodatkov mogoče razmeroma zanesljivo interpretativno preveriti
hipoteze od a) do f).
11 Podrobneje gl. https://clarin.si/repository/xmlui/handle/11356/1430.
Interpretiranje literature v zmanjšanem merilu: »Oddaljeno branje« korpusa ... 61
4. 1 Generacijska in družbenospolna struktura pišočih
45 % avtoric in avtorjev literarnih prispevkov v obeh revijah je bilo rojenih v
štiridesetih letih 20. stoletja, 11 % pa v petdesetih letih. Močna je generacija,
rojena 1930–39 (17 %), k njej sodijo tudi rojeni 1920–29 (5 %). Sklepamo, da gre
predvsem za sodelavce Problemov iz perspektivovske generacije. V letu 1968 je
bila najštevilčnejša generacija (1940–49) študentska, stara med 19 in 28 let; k njej
sodi še dekada 1950–59 (samo en avtor je rojen po 1954), tedaj stara med 16 in 18
let (zadnji razredi gimnazije in bruci). Tribuna je generacijsko homogena, saj je kar
75 % pišočih rojenih 1940–49, Probleme pa si razvidno delita dve generaciji: rojenih
1940–49 je 41 %, tistih 1930–39 in 1920–29 pa skupaj 39 %. V Problemih-Literatura
se tehtnica prevesi k mladim: 48 % tekstov so napisali rojeni 1940–49, 32 % pa
rojeni 1950–54; le 19 % pripada generacijama med 1920 in 1939. Najmočnejša
med pišočimi v obe reviji je torej »baby boom« študentska generacija, rojena v
letih 1946–48 (skupno 23 %). Preštevni podatki torej potrjujejo domnevo, da se
je študentska generacija uveljavila v javnosti, a to gotovo velja le za analizirani
periodični publikaciji. Za posplošitev bi bilo treba analizirati ves tisk tega obdobja.
V analizirani periodiki po številu objavljenih besedil prevladujejo avtorji (81 %),
žensk je le 7 %, za preostanek (12 %) pa podatka ni. Podzastopanost avtoric je
osupljiva. Razmerje med spoloma se v letih pred dogodki maja ‘68 in po njih ni
znatno spremenilo. Leta 1964 je bilo v Problemih in Tribuni avtorstvo žensko v
8 % (ob kar 29 % neugotovljenih avtorstev), leta 1972 pa je avtoric malenkost
več, 10 % (podatek manjka le za 1 % vnosov). Potrjuje se stališče, da je bilo leto
‘68 tudi na Slovenskem pretežno »moška zadeva« (Balžalorsky Antić 2021: 317).
Po metapodatkih sodeč, študentska revolucija v nasprotju s pričakovanji na poljih
kulture in literature (kolikor sta zastopana v analiziranih publikacijah) ni omajala
izrazito patriarhalne strukture slovenske družbe.
4.2 Zvrstni repertoar
Daleč največji delež glede na število objavljenih besedil ima poezija (68 %), sledita
proza (21 %) ter vizualna in konkretna poezija (7 %). Dramatika je tudi za revijalni
tisk slabo zastopana (ok. 1 %). Dram je celo manj od nove avantgardne zvrsti, tj.
hibridov med strukturalistično teorijo in literaturo (2 %). Delež besedil v zvrsteh,
ki so značilno neoavantgardne (vizualna poezija, hibridi), je zaznaven, čeprav je v
manjšini (skupaj ok. 10 %).12
V letu 1964 je bilo natisnjenih 242 literarnih besedil, razmerje med številoma
proznih (114) in pesniških (124) je razmeroma izenačeno, je pa pesniških besedil
več (51 %); dramskih je pričakovano le za vzorec (2 %). V letih študentskega
12 Slika zastopanosti zvrsti se seveda spremeni, če namesto števila besedil upoštevamo število pojav-
nic v korpusu: s tega vidika predstavlja poezija 13,56 % korpusa, proza 66,09 %, dramatika 18,56 %
ter hibrid 1,77 %.
62 Marko Juvan, Mojca Šorli, Andrejka Žejn
gibanja (1968, 1972) se je zvrstna struktura drastično spremenila, le pri dramatiki
delež ostaja tradicionalno nizek (1 %). Pri 630 tekstih je šokanten upad števila
proznih besedil (68) v primerjavi s pesniškimi (471). Proznih besedil je le malo več
od nove zvrsti, tj. vizualne in konkretne poezije (64). Če to eksperimentalno zvrst
zaradi njenega poimenovanja prištejemo k poeziji, se njena prevlada še poveča. Že
tako je delež poezije kar 75 %. Pojavita se, v skromnem obsegu (skupaj 3 %), še
dve novi hibridni zvrsti, ki mešata poezijo in prozo oziroma literaturo in teorijo.
Iz tega lahko zgolj za naš korpus hipotetično sklepamo, da obdobje, ki je težilo k
radikalni transformaciji obstoječega, tradicionalnega prvenstva poezije med zvrstmi
slovenskega literarnega kanona vsaj po številu besedil ni prizadelo. Morda se je za
leta študentskega gibanja, nabita z voljo in afekti, usmerjena v prelomne trenutke
sodobnosti in osvobajanje posameznika, zdela primernejša (lirska) poezija od
ekstenzivnejše in objektivnejše proze.
Zvrstni repertoar starejše, »perspektivovske« generacije (rojene 1920–40) se po
uvajanju novih zvrsti razlikuje od tistega pri mlajši, »tribunaški« generaciji (rojeni
1941–54). Samo za mlade je značilna eksperimentalna zvrst hibridov (skupaj 5 %),
tudi delež vizualne in konkretne poezije med njihovimi objavami je precej večji od
prejšnje generacije (9 % proti 3 %). Neoavantgardne zvrsti pri mladih skupaj štejejo
14 %, pri starejših pa 6 %. Očitno so po številu besedil glavni nosilci neoavantgardnih
zvrsti v našem korpusu mladi, torej generacija, vpeta v študentsko gibanje.
Upoštevajoč dejstvo, da ima znano žensko avtorstvo le 62 besedil, moško pa več kot
desetkrat toliko (707), ne preseneča, da je zvrstni repertoar moških bolj diferenciran.
Zanimivo je, da avtorice kažejo večjo naklonjenost prozi kakor avtorji (njen delež
je 28 % pri ženskah in 15 % pri moških). Delež enot neoavantgardne vizualne in
konkretne poezije je pri ženskah 11 %, pri moških pa 6 %. To kljub neizenačenemu
vzorcu nakazuje, da so avtorice, zastopane v našem korpusu, po zvrstnem repertoarju
nekoliko bolj nagnjene k eksperimentu od moških.
4.3 Modernizem
Z ugotovitvijo o razmeroma šibki zastopanosti izrazito neoavantgardnih zvrsti (ok.
10 %) se skladajo ocene izrazitosti modernizma v posameznih tekstih. Ker odločitev
o tem, kateri literarnoumetniški smeri pripada besedilo, zahteva interpretativno
branje od blizu in zamudno preverjanje kriterijev za uvrščanje, smo pri presoji
modernizma v korpusu sklenili kompromis med branjem od blizu in daleč. Oblikovali
smo kontrolni seznam modernističnih lastnosti (sintaktičnih in semantičnih), ki so
ugotovljive tako rekoč na prvi pogled.13 Po teh merilih v korpusu prevladuje zmerni
modernizem, prepoznaven kot srednja stopnja izrazitosti (47 %). Sledijo teksti, v
katerih je stopnja opaznosti modernizma visoka (22 %) ali nizka (22 %). Besedil, v
13 To so opustitev interpunkcije, svobodni verz, nestandardna členitev, opaznost vizualnega koda ter
specifična tema in forma naslova. Za vsak izpolnjeni kriterij smo besedilu pripisali točko, vsota točk
pa je dala oceno njegove modernističnosti (>3 = visoka stopnja modernizma).
Interpretiranje literature v zmanjšanem merilu: »Oddaljeno branje« korpusa ... 63
katerih modernizma ni bilo opaziti, je le 10 %. Modernizem, čeprav ne radikalen,
torej zaznamuje literaturo v Tribuni in Problemih. Kar 90 % vseh besedil je bilo
ocenjenih kot nizko-, srednje- in visokomodernističnih.
Visoko stopnjo izrazitosti modernizma smo prisodili 14 % literarnih besedil
generacije, rojene 1920–40, in 27 % besedil generacije, rojene 1941–54. Pri obeh
generacijah prevladuje srednja stopnja modernizma (49 % pri starejših in 56 % pri
mlajših). Pričakovano je ocenjena izrazitost modernizma večja v mlajši generaciji
kakor v starejši.
4.4 Vizualnost
Vizualni kod dinamizira tradicionalni videz tiska v 22 % besedil, kar se ujema z
vrednostmi za visoko stopnjo izrazitosti modernizma. V 39 besedilih (dobri 4 %
enot celotnega korpusa) je vizualnost osamosvojena – gre za konkretistična dela,
ki odstopajo od konvencij jezikovnega teksta. Visoka je stopnja vizualnosti v 8 %
besedil, kar se približa vrednosti za delež vizualne in konkretne poezije v zvrstnem
repertoarju (7 %). Vizualni eksperiment torej tekstov v obeh periodičnih publikacijah
ni prevladujoče zaznamoval, je pa v njih že opazen, tako da obe publikaciji tudi
v literaturi odstopata od tradicionalne puščobnosti prejšnjega periodičnega tiska.
4.5 Odkloni od slovenskega knjižnega jezika
Proces dekanonizacije in sekularizacije jezika književnosti, ki se kaže prek vdorov
tujih jezikov in zvrsti neknjižne slovenščine, smo ocenjevali z analitičnimi oznakami
v tabelarni bibliografiji. Ročno označevanje elementov neknjižne slovenščine v
samem korpusu še poteka, tako da bo zanimivo primerjati interpretativno ocenjene
vrednosti iz bibliografije z računalniško preštetimi označenimi pojavnicami.
Elementi tujih jezikov so pri bralnem preletu besedil redko opaženi. Kar v 93 %
besedil jih ni bilo zaznati. Med njimi so razmeroma številčnejša, a po odstotku
zanemarljiva besedila z zaznano prisotnostjo angleščine (27) in srbohrvaščine (8).
Kadar so tujejezične prvine že prodrle v knjižni jezik, po oceni prevladuje nizka
stopnja njihove izrazitosti (5 %).
Leta 1964 so se elementi tujih jezikov pojavljali le na nizki stopnji in še to v 3 %
vseh besedil. V času študentskega gibanja tujejezični elementi nastopijo že tudi na
srednji in visoki stopnji izrazitosti (oboje po 1 %). Povsem brez zaznanih tujejezičnih
elementov je v obdobju študentskega gibanja 92 % besedil.
Po analitičnih metapodatkih so odkloni od standardnega/knjižnega jezika v
korpusu prav tako redki. Kar 90 % tekstov je brez opaženih primesi neknjižnih
zvrsti slovenščine. Še največ je splošnega pogovornega jezika (9 %), elementi
64 Marko Juvan, Mojca Šorli, Andrejka Žejn
mladostniškega slenga so bili pri hitrem branju prepoznavni v zgolj 5 tekstih.
Odpiranje nestandardni slovenščini je količinsko torej še skromnejše od odpiranja
tujim jezikom (13,6 %). Medtem ko v letu 1964 neknjižne jezikovne zvrsti v literaturi
obeh publikacij skoraj ne puščajo sledi (brez teh primesi je 94 % besedil), se njihova
opaznost v času študentskega gibanja vsaj nekoliko poveča: jezik literature se v
našem korpusu prične odpirati splošnemu pogovornemu jeziku, saj elemente tega
zaznamo v 10 % analiziranih enot, torej še enkrat toliko kot v letu 1964. A knjižni
jezik v literaturi revolucionarnega časa še ni detroniziran.
Tudi podatke o tujejezičnih elementih in prisotnosti neknjižne slovenščine bo
mogoče zanesljiveje presojati in primerjati glede na podatke, ki jih bomo izluščili po
označevanju prvin tujih jezikov in neknjižne slovenščine v korpusu. Kvantitativna
analiza metapodatkov, predstavljena v tem delu prispevka, je privedla do rezultatov, s
katerimi je bilo hipoteze raziskave mogoče preveriti na gradivu korpusa Maj68. Zbrani
in prešteti metapodatki iz bibliografije imajo torej vlogo podpore literarnozgodovinski
in literarnosociološki interpretaciji korpusa. Toda ti rezultati, čeprav računalniško
preštevni, so že sami odvisni od predhodnih interpretacij posamičnih besedil.
Vsakemu besedilu je bilo treba pri pripravi anotirane bibliografije na podlagi
(hitrega) branja najprej izbrati primerne metaoznake za določitev njegove zvrsti,
modernizma in decentriranja knjižne slovenščine. Tu smo torej še na prehodu
med analogno in digitalno humanistiko, med branjem od blizu in oddaljenim
branjem. Morali smo narediti korak naprej, da bi ugotovili, kaj k interpretaciji
literature iz let študentskega gibanja lahko prispeva digitalna paradigma s korpusno
analizo.
5 Korpusna analiza besedil
Korpusna analiza literarnih besedil metodološko izhaja iz korpusnega jezikoslovja.
McEnery in Wilson (2005: 1) postavljata začetek korpusne lingvistike v petdeseta
leta 20. stoletja, in čeprav je v šestdesetih in sedemdesetih letih ta pristop naletel na
precejšnje neodobravanje, je pozneje postal eno obsežnejših področij jezikoslovnih
raziskav, tako da ima tudi na Slovenskem že daljšo tradicijo. Slovensko korpusno
jezikoslovje je usmerjeno predvsem v leksikografijo in opis ožje jezikoslovnih
značilnosti (prim. Balažic Bulc in Gorjanc 2015), pa tudi v semantiko, pragmatiko
(prim. Verdonik 2020; Šorli 2020), prevodoslovje (prim. Vintar 2017: 7) in
analizo diskurza (prim. Fišer in Kalin Golob 2019; Gorjanc in Fišer 2020).
V tovrstnih raziskavah so se oblikovali koncepti izdelave korpusa in orodja za
ustrezno označevanje besedil v korpusu, pa tudi podlage za korpusne analize
literature.
Naj poudarimo, da rezultatov deskriptivnega pristopa, predstavljenega v nadaljevanju,
ni mogoče posplošiti na celotno literarno produkcijo obravnavanega obdobja, saj je
naš korpus razmeroma majhen. Analize specializiranega literarnega korpusa Maj68, v
katerem so količinska razmerja med zvrstmi besedil neuravnotežena, tako po številu
besedil kot njihovem obsegu, so bile izvedene s spletnim orodjem noSketchEngine
Interpretiranje literature v zmanjšanem merilu: »Oddaljeno branje« korpusa ... 65
(https://nlp.fi.muni.cz/trac/noske) in LancsBox.14 S tema prosto dostopnima
orodjema smo opravili preliminarne leksiko-semantične in korpusnostilistične
analize (najpogostejše besede, ključne besede, kolokacije), ki bi lahko nakazovale
prevladujoče tematike in vrednotenjske pomene izbranih leksikalnih enot.
5.1 Besedni seznami in pogostnostna razmerja v korpusu
Z izdelavo besednih seznamov, posebej najpogostejših in ključnih besed, dobimo
vertikalni vpogled v neko zbirko besedil. Z leksiko-semantičnimi analizami na
podlagi izbranih seznamov smo ugotavljali, v kakšnih kategorialnih in pomenskih
razmerjih ter kontekstih se pojavljajo leme literarnega korpusa Maj68.
Najprej smo se posvetili razmerjem deležev treh polnopomenskih besednih vrst
med tremi literarnimi zvrstmi: poezijo, prozo in dramatiko. V korpusu je za poezijo
v primerjavi s prozo in dramo značilna izrazito nadpovprečna raba samostalnikov
(140,5 %);15 v prozi in dramatiki je relativni delež samostalnikov zelo blizu povprečne
rabe v celotnem korpusu (z odstopanji za 2 % navzdol in navzgor). Zelo podobno
velja za pridevnik: nadpovprečna raba v poeziji (za 26 %) ter manjše odstopanje
od povprečja navzdol pri prozi (za 2,6 %) in nekoliko večje pri drami (15,3 %).
Nasprotno pa je delež glagola v poeziji nekoliko pod korpusnim povprečjem (za
11 %), medtem ko je v prozi in dramatiki le nekoliko nad povprečjem (za 2,5 oz.
2,7 %). Izrazitejša odstopanja poezije glede na rabo samostalnikov, pridevnikov
in glagolov v primerjavi z drugima zvrstema v korpusu kažejo na večjo statičnost
in manjšo dogajalnost ter bolj samostalniški slog. Večjo prisotnost pridevnikov
v poeziji glede na preostali zvrsti bi lahko navezali na izrazitejše niansiranje
besedilnega sveta z lastnostmi, ki mu jih prisoja subjekt besedila. Kvantitativna
distribucija besednih vrst vodi k interpretaciji, da se opaženi prevladi modernizma
navkljub ohranjajo nekatere konvencionalne razlike med tremi literarnimi zvrstmi
(subjektivnost – objektivnost, opisnost – pripovednost).16
Zaznavne so besednovrstne razlike med teksti po spolu: podpovprečna je raba
samostalnika pri avtoricah (80,9 %) v primerjavi s povprečno rabo pri moških
avtorjih. V našem korpusu so količinska razmerja besedil sicer premajhna, da bi
ob tem rezultatu lahko tvegali dokončne ugotovitve, a pomenljivo je, da se rezultat
ujema z ugotovitvijo iz analize metapodatkov, po kateri avtorice v korpusu Maj68
v primerjavi z avtorji izraziteje preferirajo prozo.
14 Obe orodji omogočata standardne funkcije iskanja: po lemah, besednih oblikah in besednih zvezah
ter v prvem tudi z jezikom CQL.
15 Rezultati so predstavljeni glede na relativni delež konkretnih pojavnic v celotnem korpusu. 100 %
predstavlja povprečni delež na ravni celotnega korpusa, odstopanja višje ali nižje pomenijo odsto-
panja od povprečja v eno ali drugo smer.
16 To domnevo bi bilo zanimivo preveriti v primerjavi z večjim referenčnim korpusom.
66 Marko Juvan, Mojca Šorli, Andrejka Žejn
5.2 Polnopomenske besede v poeziji – ključ do vsebin?
Nekateri pristopi oddaljenega branja, zlasti preučevanje avtorjevega »nezavednega«
stila, temeljijo na statistiki nepolnopomenskih besed, tu pa se bomo na primeru
najpogostejših polnopomenskih besed poezije iz korpusa Maj68 skušali približati
njeni vsebinski plati. Besedni oblak17 (Slika 1) prikazuje lematizirane pojavnice,
ki združujejo vse oblike dane besede. Pogostnostna razmerja ponazarja velikost
izpisane besede.
Slika 1: Besedni oblak 200 najpogostejših polnopomenskih besed v poeziji korpusa Maj68.
Najpogostejše besede s slikovito predstavitvijo kar vabijo k interpretaciji, saj
besedni oblak deluje kot konkretistično besedilo, medbesedilno sestavljeno iz
citatov najpogostejših besed v korpusu. Analogni humanist, ki ga ta računalniški
izdelek spomni na Kosovelove lepljenke, kar refleksno začne interpretirati. Iz
prvih petih najpogostejših polnopomenskih besed – biti (560), dan (311), imeti
(279), drug (244) in človek (243) – denimo sklepa, da glede na opozicijo »biti
– imeti«, aktualno v tistem obdobju, poezija kaže večjo naklonjenost glagolu
eksistence pred glagolom posesti. Inferiranje se tu ne zaustavi: ali ni večje število
»biti« od »imeti« dokaz nasprotovanja kapitalizmu? Vendar pa metoda korpusne
analize interpreta kmalu postavi na realna tla, saj se izkaže, da zgolj seznam
najpogostejših besed ne zadošča za vsebinske interpretacije. Upoštevati je treba
njihov širši kontekst, ki se pokaže s statistično metodo ključnih besed in z analizo
kolokacij.
17 Seznami najpogostejših polnopomenskih besed v podkorpusu poezija so bili izdelani v noSketchEn-
gine in vizualizirani v prosto dostopnem spletnem orodju WORD ART (https://wordart.com/).
Interpretiranje literature v zmanjšanem merilu: »Oddaljeno branje« korpusa ... 67
5.3 Ključne besede in sledi političnega konteksta
Ključna beseda je v korpusni lingvistiki beseda, ki se v besedilih pojavlja nesorazmerno
pogosto glede na neki drug korpus. Izbrano analitično orodje primerja frekvenčni
seznam referenčnega korpusa18 s seznamom korpusa, ki ga obravnavamo. Tako
dobimo seznam ključnih besed, od katerega pričakujemo vpogled v glavne teme
našega korpusa, čeprav so v njem zaradi literarnosti tematike manj razvidne kot
denimo v korpusih terminoloških besedil.
Spodnji seznam, zamišljen kot izhodišče raziskave prevladujočih tematik korpusa
Maj68, prikazuje njegove ključne besede v razmerju do leposlovnega podkorpusa
referenčnega korpusa Gigafida v2.0. Tabela 1 prikazuje prvih 20 ključnih besed, tj.
lem, med katerimi izstopajo zaimki (osebni, kazalni in svojilni). Zlasti povedna je
ključnost osebnih in kazalnih zaimkov v prvi in drugi osebi (jaz, ti, tvoj, ta, tu).19
Ta kaže na visoko stopnjo dialoškosti, morda zaradi premega govora, a bi bilo
treba to še raziskati. Visoko na seznamu je človek, v dejanskih kontekstih pogosto
uresničen tudi v množinski obliki ljudje. Lastna imena na seznamu so deloma
vezana na didaskalije, opozarjajo pa tudi na posebnost tega korpusa, ki bi zahtevala
dodatno preučitev.
Stat Freq Freq_ref Score
ti 4257 142475 1.200
ne 7975 376798 1.100
ves 4463 207714 1.100
jaz 7547 403925 1.100
že 2725 131253 1.100
človek 1543 64014 1.100
Dimitrij 431 340 1.100
tu 767 20462 1.100
tvoj 805 22886 1.100
brez 1009 36658 1.000
ta 8437 469722 1.000
naš 794 25303 1.000
samo 1664 76983 1.000
vesti 353 1204 1.000
18 To je lahko katerikoli izbrani korpus, običajno pa gre za večji, reprezentativni korpus, v našem pri-
meru Gigafida v2.0 (1990−2018), www.gigafida.net.
19 Vključuje tudi vikalne oblike (vi, vam itd.).
68 Marko Juvan, Mojca Šorli, Andrejka Žejn
Andrej 350 1173 1.000
osredek 296 1 1.000
Milena 290 186 1.000
kaj 2567 134246 1.000
preveliko 267 3 1.000
zdaj 1478 71534 1.000
Tabela 1: Ključne besede po noSketchEngine.
Ker gre za korpus literarnih besedil, ustvarjenih v politično burnem zgodovinskem
obdobju, nas preseneča, da med ključnimi ni besed revolucija, upor, oblast, svoboda
in protest. Da bi izluščili kaj o političnosti literature iz korpusa Maj68, smo analizirali
njihovo relativno pogostnost in kolokacije. Vse navedene besede so glede na majhen
obseg korpusa relativno pogoste, vendar značilno manj razpršene. Oblast (85)
denimo potrjuje predpostavko o politični motiviranosti, a je nesorazmerno pogosta v
drami Dolina neštetih radosti. Revolucija (s kolokatorji kulturna, identiteta, forma,
revolucija) ima 84 zadetkov, upor (upor, pristati) 23 v 11 besedilih, protest le 3 v dveh
besedilih in svoboda (smrt, živeti), sicer najenakomerneje zastopana, 82 zadetkov:
Med najpogostejšimi kolokatorji svobode se znajde tudi svoboda, tj. jedro samo;
gre za ponavljanje, ki za neliterarna besedila ni značilno:
Interpretiranje literature v zmanjšanem merilu: »Oddaljeno branje« korpusa ... 69
Majhnost korpusa ovira interpretacijo, ki stremi k univerzalnim zaključkom, a
omogoča obvladljivo vzvratno navezavo korpusnih ugotovitev na metapodatke.
Tako denimo ugotovimo, da se revolucija pojavi največkrat v prozi, a je relativno
najpogostejša v hibridu, mladostniškem slengu, v Problemih, in sicer pri Rastku
Močniku. Oblast je glede na metaoznake relativno najpogostejša v dramatiki,
splošnem pogovornem jeziku, v Tribuni in pri Marku Švabiću; upor je relativno
najpogostejši v hibridu, nato v poeziji, in sicer v knjižni slovenščini in v Problemih,
daleč najbolj pri Močniku; svoboda nastopa relativno najpogosteje v dramatiki,
splošnem pogovornem jeziku, v Tribuni in pri Žarku Petanu. Vse iskane besede se
pojavljajo relativno najpogosteje prav v letu 1968.
Po drugi strani seznam ključnih besed zajema besede človek, dan, noč, moči, zemlja,
telo, črn, gledati, glas, bel, čas, noga, pot, beseda, nebo, cesta, tovariš, luč, piti,
zelen, okno, praviti, pentlja, iti, kamen, ostati, živeti, stvar, prostor, hip, obraz,
ljudstvo, veter, reka, senca, vojščak, šef, ogenj, žena, smrt, prazen, roka, veteran,
kri, lev. Če vzamemo za vzorec prvih 100 ključnih besed, v njem razločimo dve
skupini: a) besede, ki konotirajo (mehko) poetičnost, npr. noč, veter, senca, in b)
besede, ki zelo posredno, z ostrino nakazujejo politični boj in željo po svobodi,
npr. tovariš, ljudstvo, vojščak, smrt, kri. Prvo pomensko skupino lahko potrdimo s
konkordancami oz. konteksti:
Toda skupina b) se izkaže za manj utemeljeno. Besede vojščak, šef, veteran se
namreč pojavljajo zlasti kot lastna imena, običajno v le enem literarnem delu, zato
jih v resnici ni mogoče zares obravnavati kot ključne.
70 Marko Juvan, Mojca Šorli, Andrejka Žejn
5.4 Medbesedna povezovalnost in kolokacije: k interpretaciji razlik med
zvrstmi in družbenima spoloma
Kolokacija navadno zajema pogoste in statistično pomembne sopojavitve besed, ne
glede na obstoj specifičnih pomenskih razmerij med njimi. Na primeru besede dan,
najpogostejšega samostalnika v poeziji, bomo vzeli pod drobnogled najprej njegove
najbolj tipične20 prve leve pridevniškobesedne kolokatorje po literarnih zvrsteh.21
Za leve kolokatorje besede dan se pokaže, da se v poeziji poleg najpogostejšega
zaimka vsak, ki se najpogosteje pojavi v vseh treh zvrsteh (vrednost logDice za
poezijo 10,497; za prozo 10,131 in dramo 9,975), pojavljajo zlasti vrstilni števniki,
ki označujejo zaporedje: najpogosteje sedmi, ki je na drugem mestu22 po tipičnosti
kolokacije za poezijo, nato so znotraj petnajstih najbolj tipičnih še (navedeni
zaporedno po seznamu) šesti, prvi, četrti, tretji, osmi, peti, deseti. Manj raznolike
so pridevniške besede za trajanje (trije – na 7. mestu, nekaj – na 18. mestu), dokaj
pogosta je nedoločnost (nek in nekaj – na 3. in 4. mestu po tipičnosti kolokacije).
Šele v spodnjem delu seznama pridevniških besed k samostalniku dan se pojavita
lastnostna pridevnika črn (na 19. mestu) in bel (na 28. mestu). Na mestih med njima
se zvrstijo pridevniki, ki s samostalnikom dan običajno tvorijo stalne besedne zveze
ali frazeme, na primer rojsten, gospodov, deževen. Nasprotno v prozi časovna razmerja
med dnevi opredeljujejo zlasti prejšnji (na 3. mestu po tipičnosti), naslednji (5.
mesto), prvi (11. mesto), današnji (12. mesto), nižje še nov (22. mesto) in zadnji (26.
mesto). Trajanje označujejo pridevniške besede med 4. in 13. mestom po tipičnosti
kolokacij: cel, ves, nekaj ali trije. Med lastnostnimi pridevniki po frekventnosti (na 7.
in 9. mestu) nekoliko izstopata dober in lep, ki sta po večini del stalne besedne zveze
(dober dan ali lepega dne). Nižje, od 14. mesta dalje so na seznamu v prozi rojsten,
jesenski, bel, deževen, deloven, gospodov, soden, sleheren, vroč itd. Iz teh razlik
med literarnimi zvrstmi je v korpusu prepoznavna konkretnejša časovna umeščenost
dogajanja v proznih besedilih v primerjavi s poezijo. V dramskih besedilih, kjer
je ravno tako pričakovana določnejša časovna umeščenost in opredelitev trajanja,
je večja podobnost s prozo. Izrazitejša raba vrstilnih števnikov v poeziji bi lahko
bila posledica sloga oz. rabe pesniških figur stopnjevanja in ponavljanja (pozornost
zbuja tudi pojavljanje pravljičnih števil sedem in tri). Prav raba pesniških figur kot
elementa sloga bi lahko bila tudi vzrok za nadpovprečno pojavnost besede dan v
poeziji glede na celotni korpus.
Kolokativnost v širokem pomenu medbesedne povezovalnosti, ki vključuje tudi
semantično bližino in nekatere vidike pragmatičnega pomena, smo izbrali tudi za
izhodišče preliminarne raziskave družbenih pomenov in vloge žensk, kakor se kažejo
20 Pri izračunu trdnosti povezav ni bila upoštevana absolutna frekvenca, ampak statistično merilo log-
Dice.
21 Dan je visoko tudi na seznamu najpogostejših besed v prozi (med polnopomenskimi besedami na
21. mestu) in dramatiki (na 18. mestu).
22 Med tipičnimi kolokatorji prevladujejo pridevniške besede, na sezamu pa se pojavijo tudi druge
besedne vrste, pa tudi nekaj ločil (skupno je na primer med prvimi 30 najbolj tipičnimi kolokatorji
pri poeziji in prozi 16 % »nepridevniških« levih kolokatorjev in pri dramatiki 23 %).
Interpretiranje literature v zmanjšanem merilu: »Oddaljeno branje« korpusa ... 71
v korpusu. Izdelali smo seznam 10 najpogostejših kolokatorjev za lemi »moški« in
»ženska«, v razponu 5 levo in 5 desno od jedra, oba po pogostnostnem statističnem
merilu (01 – Frequency, LancsBox).
Pod temi iskalnimi pogoji je seznam desetih kolokatorjev presenetljivo prekriven.
Obe lemi namreč kolocirata oz. se povezujeta z istimi besedami, in sicer biti, on,
jaz, imeti, ves, ženska. Sprememba v statistični meri (v našem primeru logDice
namesto Frequency) privede do večje diferenciranosti že med prvimi 10 kolokatorji,
kot vidimo v tabelah 2 in 3 (razpon kolokacij 1 levo in 1 desno od jedra). Seznama
kažeta najtesnejše in zato tudi najbolj nedvoumne pomenske povezave z lemama
ženska in moški.
ID Položaj Kolokator LogDice Pogostost kol. Pogostost korp.
1 L nek 8.22126 10 669
2 L čudovit 8.02558 4 74
3 L mlad 7.84012 5 286
4 R ki 7.79160 37 5043
5 L grd 7.75207 3 27
6 L lep 7.70998 6 510
7 L zame 7.37429 4 361
8 L edin 7.360 3 169
9 L star 7.336 5 585
10 L moški 7.334 3 180
Tabela 2: Kolokatorji za lemo ženska v korpusu Maj68.
ID Položaj Kolokator LogDice Pogostost kol. Pogostost korp.
1 L mlad 7,730 3 286
2 L visok 7,642 3 315
3 L star 7,426 4 585
4 M dva 7,345 4 629
5 R ženska 7,307 3 444
6 L drug 6,336 5 1851
7 R ki 6,110 11 5043
8 L mlad 7,730 3 286
9 L visok 7,642 3 315
Tabela 3: Kolokatorji za lemo moški v korpusu Maj68.
72 Marko Juvan, Mojca Šorli, Andrejka Žejn
Skupno seznamom prvih 10 kolokatorjev, ne glede na vrsto statističnega merila z
izjemo frekvenčnega, je pri lemi ženska izstopanje besed, povezanih z vrednotenjem
videza in starosti ženske (lepa, mlada, grda, stara, čudovita, telo, imeti itd.):
Na videz analogno se tudi med kolokatorji za moški pojavljajo pridevniki, ki
označujejo videz in telo (mlad, visok, star, močen). Pri raziskavi kontekstov rabe
pa je mogoče ugotoviti, da gre večinoma za pripis lastnosti, ki nima izrazitega
vrednotenjskega namena v smislu družbenih pričakovanj:
Kljub nekaterim podobnostim je med nizi kolokatorjev za ženska in moški razvidno
razhajanje. Lema ženska ima v različnih statističnih merah in v povprečju prepoznanih
več (trdnih) kolokatorjev kakor moški, kot je razvidno iz kolokacijske mreže za
obe lemi spodaj.
Slika 2: Kolokacijska mreža po LancsBox.
To statistično dejstvo se sklada z ugotovitvijo o podzastopanosti žensk kot avtoric
besedil v korpusu, podpira pa tudi opažanje semantično-pragmatične analize, da se
v korpusu Maj68 o ženskah govori izrazito stereotipno (gl. Sliko 2).
Interpretiranje literature v zmanjšanem merilu: »Oddaljeno branje« korpusa ... 73
6 Sklep
Običajno je korpusna analiza orodje, ki podpira interpretacijo literature, in tako jo v
glavnem razumemo tudi mi. S preštevanjem bibliografsko-analitičnih metapodatkov
o korpusu Maj68 smo ugotovili nadpovprečno avtorsko zastopanost mlade generacije,
podzastopanost žensk, prevlado poezije, dominantnost zmernega modernizma,
pojavljanje novih eksperimentalnih zvrsti in vizualnosti ter začetek dekanonizacije
knjižnega jezika. Naše interpretacije, podprte s preštevnimi metapodatki, pa bo pred
posplošitvijo na celotno obdobje treba preveriti na širših primerjalnih korpusih.
Obenem korpusni pristop kot metodo oddaljenega branja, ki s hkratnim vpogledom
v množico besedil pokaže tudi nepredvidljive vzorce, s pridom uporabljamo tudi
pri preizpraševanju ustaljenih pojmovanj in snovanju novih interpretacij. Kieran
O‘Halloran (v Hoover idr. 2014: 146) denimo ugotavlja, da je mogoče strategijo
korpusne analize – tj. prepoznavanje skladenjskih, leksikalnih, semantičnih in
besedilnih vzorcev, med katere sodijo kolokacije in frazeološke enote – uporabiti
za mobilizacijo (nove) interpretacije.
Naše prve ugotovitve o povezavah med takšnimi vzorci in družbenim pomenom
v korpusu Maj68 se opirajo na sezname najpogostejših in ključnih besed ter na
raziskovanje njihovega ožjega besedilnega okolja. Če je po eni strani smisel
takšne analize, da podpremo interpretacijo pomena, ki izhaja iz intuicije o
smislu nenavadnosti ali pomembnosti besedilnih segmentov, je po drugi strani
še pomembnejše odkrivanje kolokatorjev (pa tudi drugih vzorcev), ki bi jih bilo z
branjem od blizu nemogoče predvideti, a lahko pripomorejo k »mobilizaciji« pomena.
Interpretacija je nepogrešljiva še posebej pri analizi vrednotenjskega pomena. Naša
analiza konkordanc in besedilne rabe lem ženska in moški pokaže, kako majhen in
pretežno moški korpus govori o ženskah in obratno. Preliminarne raziskave obetajo,
da bo korpus Maj68 po nadgradnji omogočil zanesljivejše interpretacije družbenih
pomenov v literarnih besedilih in izsleditev reprezentacij političnega konteksta, na
katerega so se besedila odzvala in vanj posegla.
Na primeru primerjalne analize levih pridevniških kolokatorjev besede dan v
korpusu Maj68 se je izkazalo, da je beseda v prozi in dramatiki povezana s časovno
umeščenostjo dogajanja, v poeziji pa s slogom. Sodeč po pogostosti samostalnika,
pridevnika in glagola v korpusu, so literarne zvrsti tudi v dobi svojih radikalnih
modernističnih transformacij ohranile nekatere tradicionalne razlikovalne poteze,
npr. razliko med opisnostjo in dogajalnostjo.
74 Marko Juvan, Mojca Šorli, Andrejka Žejn
Literatura
Allington, Daniel, Brouillete, Sarah, in Golumbia, David, 2016: Neoliberal Tools (and
Archives): A Political History of Digital Humanities. Los Angeles Review of Books. 1. maj
2016. . (Dostop 11. 11. 2021.)
Allison, Sarah, Gemma, Marissa, Heuser, Ryan, Moretti, Franco, Tevel, Amir, Yamboliev, Irena,
2013: Style at the Scale of the Sentence. Pamphlets of the Stanford Literary Lab 5. Stanford,
Calif: Stanford University Press. . (Dostop 11. 11. 2021.)
Allison, Sarah, Heuser, Ryan, Jockers, Matthew Lee, Moretti, Franco, Witmore, Michael,
2011: Quantitative Formalism: An Experiment. Pamphlets of the Stanford Literary Lab 1.
Stanford, Calif: Stanford University Press.
Balažic Bulc, Tatjana, Gorjanc, Vojko, 2015: The position of connectors in Slovene and
Croatian student academic writing: a corpus-base approach. Starc, Sonja, Jones, Carys,
Maiorani, Arianna (ur.): Meaning making in text: multimodal and multilingual functional
perspectives. Basingstoke; New York: Palgrave Macmillan. 51–71.
Balžalorsky Antić, Varja, 2021: Maj ‘68 in vznik écriture féminine: Francoski center in
slovenska periferija. Marko Juvan (ur.): Med majem ’68 in novembrom ’89. Ljubljana:
ZRC SAZU, Založba ZRC. 317–336. . (Dostop
11. 11. 2021.)
Clarke, Michael Tavel, in Wittenberg, David, 2017: Introduction. Michael Tavel Clarke
in David Wittenberg (ur.): Scale in Literature and Culture. Cham: Springer International
Publishing. . (Dostop 11. 11. 2021.)
Da, Nan Z., 2019: The Computational Case against Computational Literary Studies. Critical
Inquiry 45/3. 601–39. . (Dostop 11. 11. 2021.)
Dović, Marijan, 2004: Sistemske in empirične obravnave literature. Ljubljana: Založba
ZRC, ZRC SAZU.
During, Simon, 2021: 1968: Splošnemu sekularizmu naproti. Prev. Andrej Zavrl. Marko
Juvan (ur.): Med majem ’68 in novembrom ’89. Ljubljana: ZRC SAZU, Založba ZRC. 33–46.
. (Dostop 11. 11. 2021.)
Fišer, Darja, in Kalin Golob, Monika, 2019: Corporate communication on Twitter in Slovenia:
a corpus analysis. Prispevki za novejšo zgodovino = Contributions to the contemporary
history = Contributions á l‘histoire contemporaine = Beiträge zur Zeitgeschichte 59/1. 46−69.
Gorjanc, Vojko, Fišer, Darja, 2018: Twitter in razmerja moči: diskurzna analiza kampanj
ob referendumu za izenačitev zakonskih zvez v Sloveniji. Slavistična revija 66/4. 473–495.
Hladnik, Miran, 1993: Preštevna določila slovenske povesti. Slavistična revija 41/1. 65–75.
Hladnik, Miran, 1995: Količinske in empirične raziskave literature. Slavistična revija 43/3.
319–340.
Hladnik, Miran, 2012. Digitalna humanistika na Slovenskem. Air beletrina. December
2012. . (Dostop
11. 11. 2021.)
Hoover, David L., Culpeper, Jonathan, in O’Halloran, Kieran, 2014: Digital literary studies:
corpus approaches to poetry, prose, and drama. New York: Routledge.
Interpretiranje literature v zmanjšanem merilu: »Oddaljeno branje« korpusa ... 75
Jannidis, Fotis, Kohle, Hubertus, in Rehbein, Malte (ur.), 2017: Digital Humanities: eine
Einführung. Stuttgart: J. B. Metzler Verlag.
Jockers, Matthew Lee, 2013: Macroanalysis: digital methods and literary history. Urbana:
University of Illinois Press.
Juvan, Marko, Dokler, Joahim, 2015: Towards a GIS analysis of literary cultures: the making
of the Slovenian ethnoscape through literature. International Journal of Humanities and Arts
Computing 9/2. 196−218.
Juvan, Marko, Habjan, Jernej, idr., 2018: Maj 68 v literaturi in teoriji: Zadnja sezona
modernizma v Franciji, Sloveniji in svetu. Splet. . (Dostop
11. 11. 2021.)
McEnery, Tom, in Wilson, Andrew, 2005: Corpus Linguistics. An introduction. Edinburgh:
Edinburgh University Press.
Moretti, Franco, 2011: Grafi, zemljevidi, drevesa in drugi spisi o svetovni literaturi. Izbor,
prevod, spremna beseda Jernej Habjan. Ljubljana: Studia humanitatis.
Moretti, Franco, 2018: Canon/Archive: Studies in quantitative formalism from the Stanford
literary lab. New York: N+1 Foundation.
Ogrin, Matija (ur.), 2005: Znanstvene izdaje in elektronski medij: razprave. Ljubljana:
Založba ZRC, ZRC SAZU.
Perenič, Urška, 2010: Empirično-sistemsko raziskovanje literature: konceptualne podlage,
teoretski modeli in uporabni primeri. Ljubljana: Zveza društev Slavistično društvo Slovenije.
Pretnar, Tone, 1997: Iz zgodovine slovenskega verznega oblikovanja. Ljubljana: Znanstveni
inštitut Filozofske fakultete.
Ramsay, Stephen, 2011: Reading machines: toward an algorithmic criticism. Urbana:
University of Illinois Press.
Rommel, Thomas, 2004: Literary Studies. Schreibman, Susan, Siemens, Raymond George,
Unsworth, John (ur.): A Companion to Digital Humanities. Malden, MA: Blackwell Pub. 88–96.
Rosenbloom, Paul, 2013: Toward a Conceptual Framework for the Digital Humanities.
Terras, Melissa M., Julianne Nyhan, in Edward Vanhoutte (ur.): Defining digital humanities:
a reader. Farnham, Surrey, England: Burlington, VT: Ashgate Publishing Limited; Ashgate
Publishing Company. 219–233.
Rybicki, Jan, Eder, Maciej, in Hoover, David L., 2016: Computational stylistics and text
analysis. Crompton, Constance, Siemens, Ray, in Lane, Richard J. (ur.): Doing digital
humanities. London & New York: Routledge. 123–144.
Scherber, Peter, 1977. Slovar Prešernovega pesniškega jezika. Maribor: Obzorja.
Schreibman, Susan, Siemens, Raymond George, Unsworth, John (ur.), 2004: A Companion
to Digital Humanities. Malden, MA: Blackwell Pub.
Siemens, Ray, 2016: Preface: communities of practice, the methodological commons, and
digital self-determination in the humanities. Constance Crompton, Siemens, Ray, in Lane,
Richard J. (ur.): Doing Digital Humanities: Practice, Training, Research. London & New
York: Routledge. xxi–xxxiii.
Siemens, Raymond George, in Susan Schreibman (ur.), 2007: A companion to digital literary
studies. Malden, MA: Blackwell Pub.