Jezik in slovstvo, letnik 69 (2024), št. 3 Katarina Meglič DOI: 10.4312/HNBP5974 Zgornje Duplje 1.22 Matevž Treven Idrija SLOVENŠČINA KOT VEZ MED GOVORCI IN UMETNO INTELIGENCO: INTERVJU Z DR. SIMONOM KREKOM Dr. Simon Krek je eden glavnih akterjev na področju digitalnega opremljanja slo- venščine in jezikovnega razvoja v okviru tehnoloških novosti. Bil je koordinator projektov Sporazumevanje v slovenskem jeziku in Razvoj slovenščine v digital- nem okolju, znotraj katerih se je nadaljevala in nadgrajevala digitalna opremlje- nost slovenščine v obliki zbirk besedil ali korpusov (prim. Gigafida), baz podat- kov (prim. Sloleks) in jezikovnih tehnologij (prim. prevajalnik, razpoznavalnik govora). Naslednji korak v njegovem delu je razvoj velikih jezikovnih modelov, ki vključuje povečanje nabora besedil za strojno obdelavo in posledično izdelavo tehnologij, ki omogočajo boljšo povezavo človeškega govora in umetne inteligen- ce. Je vodja Centra za jezikovne vire in tehnologije pod okriljem Univerze v Lju- bljani in raziskovalec na Institutu »Jožef Stefan«. Pogovarjali smo se o nekaterih dilemah ob trku jezikoslovja in sodobne tehnologije, o vplivu tehnoloških spre- memb na jezikovno kompetenco, o nadgradnji tehnologij in o problemih govorcev slovenščine, s katerimi se soočamo trenutno, pa tudi o prihodnosti slovenščine skozi prizmo digitalnega razvoja. Preden ste se usmerili v delo s slovenščino, ste študirali angleščino in filozofi- jo. Kako ste se odločili za raziskovanje slovenščine in za razvijanje jezikovnih tehnologij in orodij? Zunanje okoliščine so k temu kar precej pripomogle. Za diplomo na angleščini sem namreč delal poskus, kako bi izgledal nov angleško-slovenski slovar … Če pa grem še malo dlje nazaj: na Državni založbi Slovenije (DZS) so snovali serijo JiS_2024_3-FINAL.indd 269 16. 09. 2024 08:36:54 270 Intervju filmski romani in v Slovenijo je prihajal Spielbergov Jurski park. Zaradi dolgotraj- nih dogovarjanj o avtorskih pravicah je ostalo samo še tri tedne do projekcije. Miha Kovač, takratni glavni urednik na DZS, je iskal nekoga, ki bi v manj kot treh tednih prevedel roman Jurski park Michaela Crichtona. To je nekako prišlo do mene, sprejel sem nalogo in noč in dan prevajal. Skupaj s še dvema pomagačema nam je to dejansko uspelo. Vmes je Kovač izvedel, da pripravljam koncept angle- ško-slovenskega slovarja, sam pa je iskal nekoga, ki bi na založbi delal nov angle- ško-slovenski slovar. Tako sem prišel na DZS. To je bilo leta 1994. Bilo je super. Ekipa je bila velika, skupaj s terminologi, fonetiki, slovenisti okrog 120 ljudi. Ko smo bili nekje na polovici, je postajalo očitno, da se založba usmerja v prodajo različnih stvari in da jih založništvo kot tako niti ne zanima več. Poleg tega je bil to čas korpusov, začetkov korpusnega jezikoslovja, ki se je z angleščino začelo že v 80. letih. Leta 1987 je bil izdan slovar COBUILD, ki je bil osnovan na podlagi tega, iz česar je kasneje nastal korpus Bank of English. Potem so v 90. zgradili British National Corpus (BNC), hkrati je nastajal češki nacionalni korpus. Postalo je jasno, da imamo precej podatkov za angleščino, nimamo pa dovolj sodobnih podatkov za slovenščino. Tako se je znotraj angleško-slovenskega slovarja začel podprojekt, katerega rezultat je bil korpus FIDA, ki sta ga v glavnem financirala DZS in Amebis. Od tod tudi ime FIDA: Filozofska (fakulteta), Institut (Jožef Ste- fan), DZS in Amebis. Sam sem ta projekt vodil in kmalu se je izkazalo, da si bo glede besedilnih korpusov marsikaj treba na novo izmisliti. Hkrati je založba spre- minjala svojo naravo, zato sem se, ko se je leta 2004 angleško-slovenski slovar zaključeval, prestavil z DZS v akademsko sfero. Od tu naprej so se stvari nekako logično razvijale. Najprej smo delali novo različico korpusa, iz FIDE je 2006 nas- tal korpus FidaPLUS, potem je leta 2008 prišel nov velik projekt Sporazumevanje v slovenskem jeziku, ki se je zaključil 2013 – in tako sem prišel v slovenistične vode. Vmes je bilo treba napisati še doktorat – izvorno niti nisem imel teh načrtov, a se je izkazalo, da je za delovanje v akademskem svetu to pač treba narediti. Dok- torat sem pisal v času, ko je potekal projekt Sporazumevanje v slovenskem jeziku. Na katero temo ste pisali doktorat? Mentor je bil Marko Stabej? Naslov je Pridobivanje jezikovnih podatkov iz besedilnih korpusov za namen iz- delave enojezičnih slovarjev in slovnic in se nanaša na organizacijo leksikograf- skih podatkov na podlagi korpusov. Šlo je za strojno označevanje korpusov in ekstrakcijo podatkov na podlagi tega. Na kakšen način, v kakšni meri se pri raziskovanju jezika lahko opremo na korpuse? Kako verodostojni so? Kje so njihove omejitve? Kje vidite možnosti za izboljšave? Splošen odgovor je: empirično jezikoslovje. Poleg merjenja možganskih valov pri govoru je zame to bolj ali manj edino smiselno. Pomeni, da imate kot razisko- valec na voljo neke realne entitete, dele česarkoli že. To je mogoče prenesti na katerokoli znanost. Če denimo preučujete drevesa, je najbrž dobro, da pogledate JiS_2024_3-FINAL.indd 270 16. 09. 2024 08:36:54 271Intervju od blizu, kako drevo izgleda. Tako je tudi z jezikom. Korpusi so samo zbirke tega, kar jezik je. Imamo pa milijon različnih korpusov. Ne obstaja samo en korpus kot tak. Danes je seveda največji korpus internet. Temu se pridružuje še ena zanimiva stvar: strojno generiranje jezika, ki se je z velikimi jezikovnimi modeli pridru- žilo korpusom. Pri korpusih predpostavljamo, da je zadaj nek človeški akter ali proizvajalec vsebine. Stroj sicer včasih proizvaja nesmiselne, večinoma pa zelo smiselne dele jezika, stavke, izjave. Skratka, korpusno jezikoslovje je zame v bi- stvu jezikoslovje kot tako. Lahko seveda tudi proučujete različna stanja jezika v času, kar raziskujejo diahroni jezikoslovci, ampak še vedno se tudi oni opirajo na realne manifestacije jezika. Korpusi so to, kar je bilo kadarkoli zapisano. Od neke točke naprej oziroma nazaj pa zapisa nimamo in od tam naprej so v resnici samo ugibanja. Kako je izgledala indoevropščina, v resnici nihče ne ve. O sodobnem jezikoslovju: kako razumete razmerje med terminoma knjižni jezik in standardni jezik? To je samo opora za to, da lahko razmišljamo o dveh konceptih. Lahko bi imeli samo en izraz. Meni se je zdelo smiselno, da se uzavesti razlika, ker imamo neko tradicijo standardizacije, ki je po mojem mnenju naletela na svojo mejo. Gre za procese, s ka- terimi se ukvarja in jih proučuje sociolingvistika. Ponavadi je v izhodišču nek domi- nanten dialekt ali njegova varianta, iz česar se nato izvede standardizacijski proces, ki zajame večji ali manjši delež govorečih. Slovenci smo imeli v 19. stoletju – ali pa še prej, predvsem pa v 19. stoletju –, kar zahtevno situacijo, ker je večina tisto, kar je bilo zapisano, samo pisala, ne pa govorila. Od tod tudi izraz knjižni jezik, ker je bil zapisan. Menim, da na koncu 20. stoletja, predvsem pa na začetku 21. ta koncept ni več ustrezen. Treba je nekako povedati, da smo prišli do točke, ko je mogoče govoriti o tem, da ne gre več samo za zapisan standard, ki ga nihče ne govori, am- pak ga dejansko uporabljamo tudi za govorno komuniciranje. Ni prisoten samo na RTV, ampak tudi to, kar sedaj govorim, je prilično standardna slovenščina. Koncept standardnega jezika je uporaben v povezavi z internetom in vsemi tehnologijami, ki so se temu pridružile. Imamo jezikovni standard, pri katerem lahko stroju rečemo: tole je nekaj, kar bo večina govorcev razumela in kar bo večina pričakovala. Imamo torej nek koncept tega, čemur rečemo standardna slovenščina, ki ni samo knjižna v smislu tega, kar je bilo treba vzpostaviti sredi 19. stoletja. Zato je to nepotrebna razlika, ki pa je hkrati uporabna za omenjeno razlikovanje. Se vam zdi, da je pri normiranju pomembno, na podlagi česa je normirana tista najbolj standardna različica jezika? Če bi naredili vzporednico knjižne- mu jeziku: ali je pomembno, katera besedila so v korpusu, da se dobi celostno podobo in neko srčiko tega standarda? Treba je razumeti, da je izraz »so v korpusu« nekoliko problematičen, ker je kor- pusov veliko. V katerem korpusu? Če govorimo o korpusu standardnega jezika, potem seveda mora biti v njem standardni jezik. Če je to korpus spletnega jezika, v katerem imamo vse twitterje, facebooke itd., je to drug žanr, druga jezikovna zvrst, JiS_2024_3-FINAL.indd 271 16. 09. 2024 08:36:54 272 Intervju ki jo je treba obvladovati tako strojno kot teoretično. Zato rabimo različne korpuse, med drugim tudi korpus standardne slovenščine. Moramo razumeti, kaj za nas v tem trenutku sploh pomeni standardna slovenščina, in ali je korpus standardne slo- venščine enak kot korpus knjižne slovenščine. S svojega stališča lahko to razumem na merljiv način, ki nam pove, kdaj smo še znotraj in kdaj že izven standarda. To se da izmeriti. Povsem mogoče je, da se standard tudi premika v času, vendar empi- rično osnovo za to, da lahko rečemo, kaj je standard, nujno rabimo. Če me vprašate, kaj je knjižna slovenščina … Ne vem, če bi znal narediti korpus knjižne slovenšči- ne. Mogoče bi bil to korpus najboljših piscev ali pa najboljših govorcev, pri čemer bi moral nekdo povedati, kdo to so in kako daleč pri tem gremo: ali Jančar še spada v to, Andrej Skubic pa ne več? To je dilema in vprašanje, ki je zame nepotrebno. Kako gledate na problematiko neprisotnosti slovenščine pri Applu, Netflixu? Kaj bi rekli mladim, ki pravijo, da se na ta način učijo tujega jezika? Odgovor je zelo preprost. Bolj ali manj vse, kar se uporablja v Sloveniji, bi moralo biti dostopno tudi v slovenščini, vključno z Applovimi napravami in Netflixom. Gre za vprašanje politične moči in organizacije. V bistvu se strinjam z vsem, kar pravi Lenart J. Kučić, ki se na Ministrstvu za kulturo sedaj ukvarja s tem. Mogoče se je treba zadeve lotiti z lobiranjem z drugimi manjšimi jeziki; če imate hrvaški vmesnik v Applu ... Treba je iskati zaveznike, vključno z Evropsko komisijo, ki ima precejšnjo moč, kar se tiče lobiranja. Gre za politično zadevo, ki jo je treba tudi reševati politično. Kako digitalizacija vpliva na razvoj komunikacijske kompetence pri mladih? Neposrednega odgovora na to nimam, ker je vsako stvar najprej treba znati izme- riti. Če sklepamo po zadnjih rezultatih raziskave PISA, je bralna pismenost precej upadla. To verjetno nekaj pomeni, če imamo primerjave za 30, 50 let nazaj. Očitno se je nekaj zgodilo. Če mladi, ki jih merijo, uspejo manj sprocesirati in manj ra- zumeti zapisano besedilo kot njihovi vrstniki po svetu ali pa njihovi predhodniki izpred petih, desetih let, pomeni, da je treba nekaj narediti v zvezi s tem. V tem smislu niso koristne evforične akcije in tudi ne medijsko napihnjene ugotovitve. Po mojem mnenju je raziskava PISA relevantna, ker je precej stroga in primerna. Na kakšen način bi se to lahko reševalo? Ker sedaj so na voljo aplikacije kot npr. ChatGPT, mladi s pomočjo tega že pišejo tudi seminarske naloge. Ja, to je povezano in hkrati tudi nepovezano. Za primer: ali kdo od vaju zna jahati? Ne. Kvečjemu poskusila sva, znava pa ne. Jahanje konja je bilo pred sto leti povsem običajna spretnost. Ni bilo človeka vajine starosti, ki ne bi znal jahati, ker je bilo to treba znati. V tem smislu smo izgubili mar- sikakšno spretnost, ki je prej obstajala, pridobili smo pa tudi veliko novih možnosti. JiS_2024_3-FINAL.indd 272 16. 09. 2024 08:36:54 273Intervju Na primer to, da pridemo iz kraja A v kraj B, ki je oddaljen 50 kilometrov, v pol ure z avtomobilom. V tem smislu je ChatGPT samo novo orodje, ki dela nekaj, kar prej ni bilo na voljo. Tako kot vsaka nova tehnološka rešitev. Realno in bolj smiselno je vprašanje, ali to povzroča učinke, ki so splošno negativni? Eden od teh je, da ljudje ne razumejo več, kaj berejo, ali pa, da so zmožni brati samo štiri minute, potem pa jim koncentracija upade. Razni katastrofični scenariji meni niso preveč pri srcu. Gre bolj za to, da razumemo, kaj se dogaja, in na drugi strani popravimo učinke, ki so negativni. Ko prihajamo v nov svet velikih modelov in ChatGPT-ja, je treba skrbeti, da bomo razumeli, kaj je generiral stroj in kaj človek. Primer je akt Evropske unije o umetni inteligenci, ki skuša te stvari urejati. Naj otroci, dijaki in ostali uporabljajo ChatGPT, ampak naj bo jasno, kaj je napisal ChatGPT in kaj dijak sam. Ne da se to skriva. Če se vrnem na vprašanje o vplivu digitalizacije: enoznačnega odgovora v smislu negativno ali pozitivno ni. Je oboje. Ponuja veliko priložnosti, hkrati pa ima negativne učinke, kot vsaka stvar. Tudi z avtom se lahko zaletiš. V kakšno smer naj gre slovenščina v prihodnosti? Kaj še potrebuje od priroč- nikov, jezikovnih orodij ipd.? Predvsem potrebuje smiselno upravljanje. To je največji problem, ker je jezik, gle- de na to da še vedno precej komuniciramo v človeškem jeziku, pomembna stvar v družbi. Tukaj smo deloma uspešni in deloma neuspešni. Če uporabimo SWOT analizo, pri kateri z različnih vidikov ovrednotimo potencialne nevarnosti, pri- ložnosti itd. in s tem bolje razumemo, kaj bi bilo treba narediti, kaj manjka, je za jezike, kot je naš, tipična nevarnost ta, da imamo tako malo govorcev. Če na drugi strani govorimo o nemščini ali španščini, gre za popolnoma drugačne razmere. V tem smislu je treba pogledati, kaj se dogaja z jeziki, ki so primerljivi s slovenščino, kot recimo danščina (5 milijonov govorcev) ali pa češčina (10 milijonov). Že za poljščino veljajo povsem drugačne razmere, saj jo govori približno 40 milijonov govorcev. V tem smislu je treba upravljati jezik tak, kot ga imamo, z realnim številom govorcev. Nekatere stvari je treba bolj podpreti, vanje več vložiti, ker ne pridejo same od sebe, druge vendarle pridejo tudi same od sebe. Malteščina ali pa makedonščina sta denimo v še slabšem položaju kot slovenščina. Kaj se zgodi v takem primeru? Velika podjetja podprejo npr. razpoznavo govora, strojno prevaja- nje, sintezo govora ipd. naprej za tiste, ki so komercialno zanimivi, ostale pa zane- marijo, med drugim tudi slovenščino. To je treba pri upravljanju jezika upoštevati – kar se nekako v zadnjih letih tudi dogaja – da se vlaga v odprte vire. Če dam konkreten primer: znotraj projekta Razvoj slovenščine v digitalnem okolju, ki je potekal med letoma 2020 in 2023, smo zbrali tisoč ur govora. Transkripcija in av- dio posnetek sta odprto dostopna, kar pomeni, da ju lahko vzame kdorkoli, recimo Siemens, Mercedes, Tesla, in iz tega naredi razpoznavalnik govora za slovenščino in ga vgradi v avto. To je mogoče, ker je nekdo zasnoval projekt, pri katerem je bilo treba na koncu objaviti popolnoma odprte vire, ki jih lahko uporabljajo tudi podjetja. Tega zavedanja 15 let nazaj še ni bilo. Takrat se je razmišljalo »tega ne sme nihče komercialno izkoriščati«, vmes pa je postalo jasno, da bo odprte vire vendarle treba omogočiti tudi za podjetja, saj so se ta sicer odločala v smislu: »Ok, JiS_2024_3-FINAL.indd 273 16. 09. 2024 08:36:54 274 Intervju vir je nekomercialen, ne moremo ga uporabiti, torej ne bomo vključili slovenšči- ne.« Preprosto. To pomeni upravljanje z jezikom. To lahko zagotovo rečemo sedaj, ne vemo pa, kaj bo čez pet let, ker se tehnologije hitro razvijajo. Ali bo takrat po- membno imeti tisoč ur transkribiranega govora ali ne? Kdo ve. Kakšna je podpora države za tako delo? Država ima problem s tem, da je slovenščina razpršena med štiri ministrstva. Služba za slovenski jezik deluje pod Ministrstvom za kulturo in vsaka stvar v zvezi s slo- venščino gre avtomatično tja. Hkrati pa so infrastrukturne in raziskovalne zadeve, ki sem jih omenjal prej, pod Ministrstvom za visoko šolstvo, znanost in inovacije. Šolski del ostaja pod Ministrstvom za vzgojo in izobraževanje, Ministrstvo za digi- talno preobrazbo pa pokriva jezikovnotehnološki del, umetno inteligenco itd. Vse je odvisno od tega, ali se bodo inštitucije uspele med seboj zmeniti ali ne – lahko vsak razmišlja po svoje in tudi vlaga po svoje in ni konsistentnega razvoja. Se pa to do neke mere uspešno rešuje z Resolucijo o nacionalnem programu za jezikovno politiko, ki vsebuje tudi tehnološki del. V tem smislu podpora je, ampak je odvisna od tega, ali se bodo omenjeni štirje akterji med seboj uskladili. Na drugi strani so tu še akademske inštitucije kot Univerza v Ljubljani in Inštitut za slovenski jezik, kjer se moramo tudi znati med seboj zmeniti v dobro vseh govorcev in govork. Pri inštitucijah lahko pogledamo tudi Filozofsko fakulteto in študij slovenšči- ne, slovenistiko. Kakšno je vaše mnenje o trenutnem nivoju študija? Kaj bi bilo potrebno spremeniti, dodati, odvzeti, mogoče spremeniti fokus glede na to, kar ste do sedaj povedali? Študija slovenistike trenutno niti ne poznam dobro, ker nisem neposredno udele- žen v njem, ampak moj odgovor je verjetno očiten. Pričakoval bi, da je bistveno več digitalnih vsebin znotraj študija, ker bi slovenisti na koncu morali biti popol- noma digitalno usposobljeni, glede na to da živimo v digitalnem svetu. Vprašanje je, koliko je taka usposobljenost res dosežena. Mislim, da ni. Kaj pa vaši naslednji projekti? S čim se trenutno ukvarjate? Kaj, kar vam je še posebej ljubo? Septembra letos smo začeli z novim raziskovalno-inovacijskim projektom, ki bo tra- jal tri leta. V projektu imamo pet podjetij in bomo delali slovenski ChatGPT oziroma velike jezikovne modele za slovenščino. Vzeli bomo odprto dostopni Facebookov oziroma Metin model Llama 2 in zbrali vse obstoječe podatke v slovenščini, do katerih bomo lahko prišli. Trenutno imamo v vseh korpusih, ki so na voljo, približno 10 milijard besed. Rabimo jih najmanj štirikrat, petkrat toliko in nismo popolnoma prepričani, če sploh obstajajo. Celoten NUK, digitalna knjižnica, transkribiranje ce- lotnega arhiva RTV, vse, kar je na Arnesu in tako naprej. Bomo videli, do kod bomo prišli. Potem bo morda treba dodati še kaj od južnoslovanskih jezikov. Primer so Švedi, ki so se tega lotili takoj in naredili svoj model GPT-SW3. Sami niso mogli JiS_2024_3-FINAL.indd 274 16. 09. 2024 08:36:54 275Intervju nabrati dovolj švedskih tekstov in so morali vključiti še norveščino, danščino, islan- dščino in angleščino plus računalniško kodo, da so prišli do 300 milijard besed. Iz tega so potem učili model, ki pa sam na sebi ne pomeni dosti, ker je treba imeti še podatkovne množice, iz katerih se konkretna aplikacija uči za konkretno nalogo, recimo za konverzacijo. V OpenAI so za ChatGPT najprej naredili model, potem so zbrali ogromno, milijone in milijone dialogov, v katerih so ljudi spraševali, oni so odgovarjali. Potem se je aplikacija učila odgovarjati na podoben način in tako so prišli do ChatGPT-ja. Zato se tudi imenuje ChatGPT. Znotraj projekta PoVeJMo (prilagoditev velikih jezikovnih modelov za slovenščino) bo izdelana aplikacija za področje digitalne humanistike, s katero bo recimo mogoče generirati tekste za opis artefaktov v muzeju. Drugi primer je medicina in govorne tehnologije, razpoznava govora. Denimo, dialog med pacientom in zdravnikom je mogoče sproti transkribi- rati in hkrati prepoznati določene elemente v tekstu, kot so recimo zdravila, bolezni itd. To se poveže z bazo znanja, zato da lahko umetna inteligenca malo bolj pametno razmišlja o tem, o čemer sta se zdravnik in pacient pogovarjala. Tretji primer je in- dustrijski, upravljanje skladišč z govorom. Četrti pa je računalniška koda, kar niti ni toliko povezano s slovenščino. To bomo delali tri leta. Hkrati prijavljamo še druge projekte. Vse pa se sedaj vrti okrog jezikovnih modelov in podobnih aplikacij. Kor- pusi, kot smo jih poznali, so na nek način pasé. Glede umetne inteligence pri medicini: ali je kakšen problem glede varovanja osebnih podatkov? Velik. To se rešuje z anonimizacijo in psevdoanonimizacijo, kar pomeni, da imen ne skrivamo, ampak jih zamenjamo in konkretne osebe postanejo razni Janezi Novaki. Potem načeloma ni več mogoče prepoznati, za koga je dejansko šlo. V ta namen se tudi sprejemajo različni akti, med drugim Zakon o varovanju osebnih podatkov. Nekatera okolja morajo biti zaprta. Prav to je problem, zaradi katerega moramo imeti jezikovne tehnologije sami, da nam podatkov ne bo treba pošiljati na neke strežnike v Severno Ameriko. Kar pa je konec koncev velik izziv. Koliko je možnosti, da pride neko podjetje in na podlagi dostopnih tehnologij in baz podatkov razvije rešitev, ki jo za take vrste situacijo tudi ponudi? Upam, da ta možnost vedno obstaja. Ključno sporočilo je – čim več. Ni rešitev v tem, da se vse zapira. Če obstaja samo en ponudnik, je to monopolistična situacija, ki se jo da izkoristiti na sto različnih načinov. Nekaj časa že govorimo o jezikovni suverenosti. Če pri jeziku nimamo digitalne komponente, ki jo lahko sami obvla- dujemo, potem smo odvisni od drugih. Saj v marsičem smo odvisni od drugih, nafte na primer nimamo. Ampak jezik je specifično naš. Jezik je bil v bistvu to, na podlagi česar smo se Slovenci sploh lahko združil na tak način, kot smo sedaj združeni. Bil je velik faktor pri tem. JiS_2024_3-FINAL.indd 275 16. 09. 2024 08:36:54 276 Intervju Seveda, zato je še toliko bolj pomembno, da smo glede tega suvereni. To, o čemer govorimo zdaj, je predvsem tehnološka suverenost, da imamo na voljo vse, kar imajo drugi. Prvi del te infrastrukture je bila v bistvu Biblija, če gledamo nazaj. Nemška Biblija, slovenska Biblija, vse ostale Biblije. Tako se je začelo. Potem je bila precejšnja časovna luknja, ko so drugi jeziki dobivali slovarje, literaturo itd. Mi smo bili v tem smislu podhranjeni. V 19. stoletju se je tudi za Slovence začela graditi jezikovna infrastruktura in ko je postalo jasno, da se oblikujejo nacionalne države, da je jezik tipično treba opisati v slovnici, v slovarju, smo se pri sloven- ščini s slovarjem ubadali precej predolgo. Slovensko-nemški slovar na koncu 19. stoletja je bil tako rekoč ves obstoječi slovarski opis. Potem je trajalo do leta 1990, da smo dobili celoten enojezični slovar. Logično bi bilo, da bi ga dobili recimo 1920. Je pa seveda tudi res, da so Švedi ravno končali svoj slovar po 120 letih (smeh). Situacije so različne, ampak bistvo je to, da jezik rabi infrastrukturo, ki pa se zelo spreminja v času. Sedaj bo definitivno na udaru digitalna infrastruktura. To je verjetno povezano tudi s tem, kako se moč prerazporeja v družbi. Če ste prej omenili Biblijo, se to lahko poveže s tem, katere so bile takrat inštitucije družbene moči. V 19. stoletju se je družba izrazito spremenila in na nek način omogočila drugačno upravljanje z jezikom. Tudi zdaj smo v obdobju, ko smo zaradi hitrih in intenzivnih tehnoloških sprememb priča preobratu družbene moči in intenzivnemu spraševanju, kaj je najbolj pomembno, kar se jezika tiče. Konec koncev tudi to, kaj ima največji vpliv. Ja, drži. So vzporednice, seveda. Če pogledamo zgodovinsko: večnacionalna država Avstro-Ogrska, stara Avstrija, ni bila najbolj prijazna do vzpostavljanja nacionalnih jezikov. Boljša situacija je bila potem kljub vsemu v stari Jugoslaviji in socialistič- ni Jugoslaviji, ni pa bila idealna. Od leta 1991 smo v tako rekoč idealni poziciji v primerjavi s prej, ker je Evropska unija eksplicitno večjezična. Močno podpira vse uradne jezike in daje slovenščini in malim jezikom, kot so latvijščina, litvanščina itd. veliko moč, ki je prej ni bilo. Kar se je zgodilo novega, pa je najbolj povezano z nastankom Googla in s tem, da imamo izrazito močne akterje v Severni Ameriki. Pred sto leti nas ni brigalo, kaj se tam dogaja v smislu jezika, sedaj pa nam marsikaj določajo algoritmi. Ta del se je spremenil in vsakič je treba ravnati v skladu s tem, kar bo ljudem prineslo čim manj težav. Predvsem pa ne živeti v preteklosti. Če se vrnem nazaj na dilemo knjižno in standardno. Ukvarjati se z dilemami, ki so stare 30, 40, 50 let, ni smiselno, ker je dovolj težav, ki izhajajo iz zdajšnje situacije. Glede vprašanja standardnega in knjižnega jezika je moje sporočilo predvsem to: standar- dna slovenščina se ukvarja s problemi, ki so zdaj relevantni za govorce in govorke. Ljudje, profesorji, kdorkoli že ... marsikdaj razmišljajo o jeziku kot o entiteti, ki je ločena od govorcev in govork. Kot da obstaja izven nas kot neoprijemljiv duh. Jezik je v resnici samo to, kar delamo mi sedaj, ko govorimo, razmišljamo, sanjamo in tako naprej. Je v nas. Spoznanja, da nimamo Apple vmesnika, da ni razpoznavalni- ka, da nimamo tega, onega, tretjega, tudi slovarja pred 100 leti ... da nimamo nekega dela jezika, ki bi ga morali imeti zato, da bi lahko opravljali vse, kar hočemo, so realne in prave težave govork in govorcev slovenščine. JiS_2024_3-FINAL.indd 276 16. 09. 2024 08:36:54