i» i ^RAZPRAVE 4fr?¿Á lea Špela Arhar Holdt, Trojina, zavod za uporabno slovenistikoin Univerza v Ljubljani, Filozofska fakulteta Polona Gantar, Univerza v Ljubljani, Filozofska fakulteta Simon Krek, Institut Jožef Stefan in Univerza v Ljubljani, Center za jezikovne vire in tehnologije v učilnice s sodobno slovenščino: rezultati projekta SPORAZUMEVANJE V SLOVENSKEM JEZIKU (ssj) Med rezultati projekta SSJ so trije inovativni jezikovni viri za slovenščino: (1) Leksikalna baza kot izhodišče za pripravo novih slovarskih opisov, (2) Slogovni priročnik odgovarja na tipične pravopisne zadrege, (3) Pedagoški slovnični portal na enostaven način razlaga slovnične pojave, s katerimi imajo učenci in dijaki pri pisanju največ težav. 1 Uvod Obdobje od začetka tisočletja do danes je bilo in ostaja tehnološko izjemno intenzivno, pri čemer je bil razvoj informacijsko-komunikacijskih tehnologij vedno v prvih vrstah tega procesa. V tem času smo lahko spremljali neslu-ten razvoj računalništva, interneta, kasneje mobilne telefonije in mobilnega interneta. Svet se je v določenem trenutku zavedel, da stoji na pragu nečesa, kar je dobilo ime »informacijska družba«, v kateri se mnoge dejavnosti, pri katerih smo nekaj stoletij uporabljali pretežno tiskani medij, torej papir, radikalno selijo v digitalno okolje. Skupaj s svetovnim spletom to omogoča povsem nove dimenzije komunikacije in dostopa do informacij. V zadnjem času je kot konica tega razvoja izpostavljeno področje umetne inteligence in glede na trenutno stanje lahko predvidevamo, da bodo naloge, pri katerih si je bilo do sedaj nemogoče predstavljati, da jih opravlja računalnik, sčasoma postale rutinske za prihodnje umetnointeligenčne sisteme. Ob tem postaja izjemno kritično tudi vprašanje opremljenosti jezikov za prehod v (umetnointeligenčno) digitalno dobo. Nekateri avtorji opozarjajo (npr. Kornai 2013), da tega prehoda ne bodo zmogli jeziki, ki bodo predaleč zaostali za možnostmi, ki jih bodo ponujali jezikovnotehnološko bolje opremljeni jeziki. Tudi izobraževanje ni ostalo izven teh dogajanj. Uvajanje IKT v vse segmente izobraževanja je bilo eden od prepoznavnejših trendov v tem obdobju. Hkrati s tem so se razvijale tudi različne pedagoške in didaktične metode, ki so izkoriščale nove tehnološke možnosti, od obrnjenih učilnic (ang. flipped classroom) do množičnih odprtih spletnih tečajev (ang. massive open online course, MOOC). Toda ob tem se vedno znova pojavlja vprašanje, ali bodo govorke in govorci slovenščine sploh lahko sodelovali v teh novih Spela Arhar Holdt, Polona Gantar, Simon Krek V UCILNICE S SODOBNO 19 SLOVENŠČINO: REZULTATI PROJEKTA SPORAZUMEVANJE V SLOVENSKEM JEZIKU (SSJ) izobraževalnih trendih, če bo slovenščina kot tehnološko razmeroma slabo opremljen jezik (prim. Krek 2012a) zaostajala za drugimi jeziki pri prehodu v digitalno okolje. Deloma je to nevarnost omilil projekt, ki ga opisujemo v nadaljevanju. 2 Predstavitev projekta Projekt Sporazumevanje v slovenskem jeziku1 je bil petletni projekt (20082013), namenjen pripravi novih jezikovnih virov za slovenščino. Projekt sta financirala Evropska unija iz Evropskega socialnega sklada ter Ministrstvo za šolstvo in šport.2 Središčna projektna aktivnost je bila izdelava novih besedilnih korpusov za slovenščino, med katerimi so ključnega pomena pisni referenčni korpus Gigafida z uravnoteženim podkorpusom Kres (Logar Berginc idr. 2012), korpus govorjene slovenščine GOS (Verdonik in Zwitter Vitez 2012) in korpus šolskih besedil Šolar (Rozman idr. 2012). V povezavi s pripravo korpusov je potekala tudi izboljšava avtomatskega označevanja slovenskih besedil na oblikoskladenjski in skladenjski ravni (Grčar idr. 2012; Dobrovoljc idr. 2012), pa tudi razvoj novega, uporabniško prijaznega korpusnega vmesnika (Arhar Holdt idr. 2012). Na podlagi novih korpusnih podatkov so bili pripravljeni trije vsebinsko in oblikovno inovativni jezikovni viri za slovenščino. Leksikalna baza za slovenščino je izhodišče za pripravo na sodobni slovenščini temelječih slovarskih opisov, strukturiranih v obliki, ki jo je mogoče uporabiti tudi za jezikovno-tehnološke namene. Slogovni priročnik s kombinacijo napredne obdelave jezikovnih podatkovnih baz in odgovorov strokovnjaka odgovarja na tipične pravopisne, pravorečne, slovnične in slogovne zadrege jezikovnih uporabnikov. Pedagoški slovnični portalna enostaven način razlaga slovnične pojave, s katerimi imajo učenci in dijaki pri šolskem pisanju največ težav, obenem pa uči uporabe sodobnih jezikovnih virov. V nadaljevanju po vrsti predstavljamo naštete tri portale, pri čemer se deloma opiramo na besedilo, ki je navedeno na projektni spletni strani http://www.slovenscina.eu. 1 Spletna stran: http://www.s1ovenscina.eu. 2 Financiranje je potekalo v okviru Operativnega programa razvoja človeških virov za obdobje 2007-2013 (razvojna prioriteta: razvoj človeških virov in vseživljenjskega učenja; prednostna usmeritev: izboljšanje kakovosti in učinkovitosti sistemov izobraževanja in usposabljanja 2007-2013). 3 Poleg Leksikalne baze je bil v tem sklopu pripravljen tudi leksikon besednih oblik Sloleks (Dobrovoljc idr. 2015), ki je dostopen na povezavi: http://www. slovenscina.eu/sloleks. 4 Algemeen Nederlands Woordenboek: http://anw. inl.nl/show?page=search1. 5 Wielki stownik jezyka polskiego; demo različica: http://www.wsjp.pl/. 3 Leksikalna baza za slovenščino V delu projekta Sporazumevanje v slovenskem jeziku, ki je zajemal pripravo podatkovnih baz,3 je bila izdelana tudi Leksikalna baza za slovenščino (LBS), katere namen je bil oblikovati izhodišča za celovit leksikografski opis sodobne slovenščine in hkrati zagotoviti jezikovne podatke v obliki, ki bo služila računalniški obdelavi jezika in razvoju sodobnih jezikovnotehnološ-kih aplikacij za slovenščino. Tako zasnovan opis naj bi bilo mogoče integrirati v druge leksikalne vire za slovenščino ter ga uporabiti kot izhodišče za izdelavo drugih za slovenščino potrebnih leksikalnih in slovničnih opisov, kot so denimo slovar sodobnega slovenskega jezika (Gorjanc idr. 2015), ko-lokacijski slovar slovenskega jezika (Krek idr. 2016), vezljivostni leksikon slovenskih glagolov ipd. Leksikalna baza je bila zasnovana na študiji sorodnih projektov evropskih jezikov (prim. Nizozemski splošni slovar,4 Veliki slovar poljskega jezika5 in 20 SLOVENŠČINA V ŠOLI, 2016 XIX. letnik, številka 3-4 6 Obseg je bil določen na podlagi presoje, da slovarska obdelava 2.500 Lem lahko zagotovi zadostno količino različnih LeksikaLnih in Leksikografskih problemov, na podlagi katerih bi biLo mogoče določiti vrste LeksikaLno-gramatičnih podatkov in način njihove notranje organizacije, ki bi učinkovito deLovaLa tudi na obsežnejšem izboru. 7 Pri vkLjučevanju sLovničnih podatkov smo se izogi -baLi uporabi krajšav, s čimer smo se žeLeLi izogniti morebitnim napačnim interpretacijam (prim. Rozman 2010), hkrati pa smo žeLeLi razbremeniti uporabnike s seznanjanjem sLovarskega metajezika, saj ta zunaj sLovarja nima informativne vrednosti. Neokrajšane opise omogoča tudi eLektronski medij, za katerega je biLa LBS zasnovana, saj prostorske omejitve, ki so značiLne za tiskani sLovar, zanj ne obstajajo. druge; Gantar 2015), ki temeljijo na spoznanjih sodobne pomenosLovne teorije (Fillmore idr. 2003; Hanks 2013), inovacijah na področju e-Leksikografije (Granger in Paquot 2010) in uporabniških raziskavah (Lew 2015a, 2015b). Dobre prakse sorodnih projektov smo v procesu izdelave LeksikaLne baze prilagodili specifikam slovenščine in upoštevali možnosti prenosa inovativ-nih slovarskih praks, zlasti na področju pomenskega opisa in oblikovanja slovarskih razlag, v slovensko okolje. Celostni LeksikaLni opis, ki ga prinaša LBS, izhaja primarno iz kontekstuaLne rabe jezika in sporočanjskih okoliščin ter temelji izključno na realni podobi sodobne slovenščine. Izbor besed v LeksikaLni bazi temelji na geslovniku 5.000 najpogostejših besed v korpusih FidaPLUS in Gigafida, upoštevali pa smo tudi izbor besed iz osnovno- in srednješolskih učbenikov, da bi se čim bolj približali realnim problemom šolarjev in dijakov, saj je bil eden od primarnih ciljev LBS izdelati model jezikovnega opisa, ki bi zlasti šolarjem in učencem slovenščine kot tujega jezika ponudil podatke o pomenu besed, njihovem tipičnem okolju, posebnostih rabe, stalnih zvezah in frazeoLogiji. Ob zaključku projektne aktivnosti je LBS obsegala 2.500 iztočnic6 oziroma 10.946 LeksikaLnih enot, tj. pomenov, podpomenov, stalnih zvez in frazeoLoš-kih enot, poleg tega pa še približno 50.000 koLokacij oz. tipičnih besednih sopojavitev, ki nimajo samostojnega pomena, kažejo pa tipično in naravno rabo besed oz. njihovih pomenov v skladenjskem in besedilnem okolju, ter več kot 7.000 stavčnih vzorcev in več kot 150.000 korpusnih zgledov, ki potrjujejo v LeksikaLni bazi opisane LeksikaLne podatke. Kot prikazuje SLika 1, je sLovarska baza organizirana kot mreža medsebojno povezanih LeksikaLno-gramatičnih podatkov na šestih hierarhičnih nivojih. Na prvem nivoju je izpostavLjena iztočnica v osnovni obLiki skupaj s podatkom o besedni vrsti.7 Na zadnjem nivoju so obravnavane frazeoLoške enote, ki predstavLjajo samostojni razdeLek geseLskega čLanka in so z iztočnico povezane zgoLj tehnično. Zanje veLja, da so pomensko neprozorne in za razLiko od drugih večbesednih enot ekspresivne oz. metaforične. Na pomenskem nivoju, ki je hierarhično najvišji gLede na druge podatke, so zabeLeženi pomeni, ki jih obravnavamo kot samostojne LeksikaLne enote. Pomenski opis je sestavLjen iz treh medsebojno povezanih informacij: pomenskega indikatorja, ki je kratek, največkrat enobesedni sinonim, pomenske sheme, ki predstavLja izhodišče za izdeLavo stavčne razLage, ter iz oznake. Teh je Lahko več vrst, v osnovi pa smo LočiLi sLovnične, področne in komunikacijske. Večbesedne enote, ki nimajo metaforičnega pomena, med katere sodijo staLne besedne zveze in področno specifični izrazi, kot npr. pametni telefon, topla greda, jedilna čokolada ipd., smo obravnavaLi bodisi kot samostojne razdeLke gesLa, tj. od pomena neodvisno, aLi pa smo jih beLežiLi znotraj posameznega pomena iztočnice. V tem primeru staLne zveze izkazujejo pomensko povezavo s katerim od registriranih pomenov iztočnice, npr. bazičen - ,osnovni; temeLjni': bazična znanost. Na skLadenjskem nivoju smo beLežiLi tri tipe podatkov: pri gLagoLskih iztočnicah smo navajaLi stavčne vzorce, v katerih se gLagoLi pojavLjajo, sLedijo t. i. skLadenjske zveze kot tipični, zLasti predLožni besedni nizi, ki jih v jeziku uporabLjamo kot skLadenjsko in obLikosLovno spremenLjivo ceLoto, npr. pod Spela Arhar Holdt, Polona Gantar, Simon Krek V UČILNICE S SODOBNO 21 SLOVENŠČINO: REZULTATI PROJEKTA SPORAZUMEVANJE V SLOVENSKEM JEZIKU (SSJ) okriljem česa, v zameno za koga/kaj ipd., navadno pa ne potrebujejo pomenskega opisa. Tretji podatek - skladenjske strukture - prikazuje življenje besede v danem pomenu znotraj njene besednozvezne skladnje, kar je ključno za avtomatsko pridobivanje kolokacijskih podatkov iz korpusa. Na kolokacijskem nivoju smo beležili kolokatorje, tj. besede, ki se v določenem pomenu tipično povezujejo z besedo, ki je obravnavana kot iztočnica. Take povezave - kolokacije - so v slovarski bazi beležene glede na že omenjene skladenjske strukture. Samostojni nivo je bil namenjen beleženju korpusnih zgledov, ki potrjujejo vse registrirane podatke v slovarski bazi. ^iSlika 1: Zgradba Leksikalne baze za slovenščino 1. LEMA • iztočnica • besedna vrsta grmeti glagol Ml. POMEN • indikator i oddajati glasen zvok 2 glasno govoriti t.i o nevihti ■ pomenska kadar grmi, se sliši g/a sen čeCLOVEKE grmi, govori zelo glasno shema doneč zvok, navadno ko dežuje In odločno, navadno, če se jezi ali aH se približuje nevihta če se s kom aii s čim ne strinja • oznaka samo v 3. osebi II [. SKLADNJA IV. KOLOKACIJE • sklad, zveza • struktura grmeti in se bliskati Glag - Inf-GLAG prisi - GLAG [začeti] grmeti [zunaj, močno] grmi Bili so ravno v restavraciji, koje začelo grmeti. ■ kdo grmi ■ kdo grmi s česa ■ kdo grmi nad kom/čim [glasno] grmeti grmeti z [odra] Grmel je z govorniškega odra, dokler mikrofon ni nenadoma umolknil. • stalna zveza VI. FRAZEOLOGIJA • fraz. enota • indikator če malega travna grmi, sla ne se kmet več ne boji. pregovor Največ pozornosti smo pri izdelavi LBS namenili dejstvu, da pomenskega opisa ni mogoče strogo ločiti od skladenjskega okolja besede. Tu smo sprejeli za slovenščino največ novih leksikografskih rešitev. Oddaljili smo se od jezikovnosistemskega koncepta, ki definira besedni pomen na podlagi prepoznavanja kategorialnih slovničnih in pomenskih sestavin pomena (Vidovič Muha 2000) in išče niz zadostnih ali potrebnih pogojev za njegovo realizacijo. Izhajali smo namreč iz spoznanja, da se pomeni besed oblikujejo v konkretni sporočanjski situaciji in so odvisni od vsakokratnega konteksta, iz česar sledi, da se govorci pomenov besed učimo iz kontekstov, v katerih jih tipično slišimo oz. uporabljamo. Na podlagi tega smo sporočanjs-ko izhodišče uporabili pri vseh tistih pomenskih opisih, pri katerih je opis interakcije med udeleženci ključen za razbiranje pomena, zlasti torej pri pomenski razlagi glagolov, frazeoloških enot ter pri razlagi metaforičnih pomenov in posebnosti rabe (vrednotenje, stil, register, okoliščine). Na ta način so podatki o pomenih besed, njihovem tipičnem besedilnem okolju, posebnostih rabe, stalnih zvezah in frazeologiji v LBS ubesedeni na način, ki ga uporabnik pozna iz vsakodnevne komunikacije. Z vidika potencialnih uporabnikov so splošnemu in šolskemu uporabniku namenjeni predvsem pomenski opisi besed v obliki kratkih pomenskih indikatorjev, ki tvorijo pomenske menije za lažjo navigacijo po večpomenskem geslu, ter pomenske sheme, ki vsebujejo stavčne razlage. Koloka- 22 SLOVENŠČINA V ŠOLI, 2016 XIX. letnik, številka 3-4 cije in korpusni zgledi prikazujejo besede v njihovem realnem in najbolj tipičnem besedilnem okolju, zato predstavljajo neposredno informacijo o življenjskem okolju besed, ki je zlasti pomembna za učenje slovenščine kot tujega jezika. Jezikoslovec bo sposoben prepoznati temeljne vezljivostne vzorce v stavčno oblikovanih razlagah in jih povezati z različnimi možnimi skladenjskimi realizacijami, ki jih govorci slovenščine najpogosteje uporabljamo v pisni komunikaciji. Primarno jezikovnim tehnologom pa so na voljo kodirane skladenjske strukture in stavčni vzorci za vsak registrirani pomen besede, kar je predpogoj za izboljšanje avtomatskega označevanja slovenskih besedil na oblikoskladenjski, skladenjski in pomenski ravni ter za razvoj jezikovnotehnoloških aplikacij za slovenščino. Slika 2 prikazuje del slovarskega gesla za iztočnico globalen v LBS. ^iSlika 2: Del gesla8 za iztočnico globalen v LBS globalen pridevnik 1 svetovni 1.1 o okoljskih spremembah 1.2 splošno veljaven 2 ki zadeva celoto 1 svetovni globalni PROCESI zlasti EKONOMSKI in KOMUNIKACIJSKI potekajo po vsem svetu PRIDEVNIKo + SAMOSTALNIK» globalna [ekonomija, konkurenčnost, komunikacija] globalni [kapitalizem, trg, problem] * Angleški jezik postaja jez ik globalne komunikacije. • Epidemija virusa HlVin bolezni aids dosega globalne razsežnosti in je vzelo dinamičnem porastu, ♦ globalna vas če človek poimenuje svet globalna vas, ga vidi kot majhno okolje, v katerem je med seboj vse povezano in soodvisno 1.1 o okoljskih spremembah ekologija globalne PODNEBNE SPREMEMBE vplivajo na celotni zemeljski planet ♦ gfoba In o segreva nje/ogreva nje globalno segrevanje je postopno zviševanje povprečne temperature v Zemljinem ozračju in oceanih 1.2 splošno veljaven; razširjen če postanejo neke DEJAVNOSTI ali LASTNOSTI globalne, jih upošteva vedno več ljudi po svetu POMOŽNI GLAGOL + PRIDEVNIK* [postajati, postatij globalen • Merila, kakšna ženska je lepa, postajajo vse bolj globalna. 2 ki zadeva celoto; celostni globalni PROCESse nanaša na pojav v celoti * S pomočjo plakata postanejo učencem misli bolj jasne in končno odkrijejo globalni pomen besedila. ♦ globalna spremenljivka računalništvo ♦ globalno potrdilo o lastništvu bančništvo 8 Razvoj različnih leksikalnih, zlasti elektronskih virov, zahteva tudi prilagoditev izrazja: v prispevku uporabljamo izraz geslo kot sinonim za geselski članek (prim. Gantar 2015). Za razliko od izraza slovarski članek, ki implicira zgolj geslo v slovarju, imamo v našem primeru v mislih tudi opise v slovarskih bazah in drugih neslovarskih leksikalnih virih. 9 Leksikalno bazo je v stisnjeni datoteki mogoče prenesti s spletne strani projekta: http://www.slo-venscina.eu/spletni-slovar/prenos. Ob koncu projekta smo podatke iz LBS prikazali v demo verziji Spletnega slovarja slovenskega jezika: http://www.slovenscina.eu/spletni-slovar, celotna slovarska baza, vključno z definicijo zgradbe (DTD; Document type Definition), pa je v formatu XML jezikovni skupnosti na voljo pod licenco Creative Commons Priznanje avtorstva-Nekomercialno-Deljenje pod enakimi pogoji 2.5 Slovenija.9 4 Slogovni priročnik Slogovni priročnik je spletni portal, ki pomaga reševati tipične pravopisne, slovnične in slogovne težave govorcev slovenščine. Namen portala je zago- Špela Arhar Holdt, Polona Gantar, Simon Krek V UČILNICE S SODOBNO SLOVENŠČINO: REZULTATI PROJEKTA SPORAZUMEVANJE V SLOVENSKEM JEZIKU (SSJ) 23 toviti, da vsak uporabnik spleta - tudi brez specialističnega jezikoslovnega znanja - lahko pridobi informacije o jezikovni zadregi, pred katero se je znašel v takšni ali drugačni konkretni jezikovni situaciji (Krek 2012b). Slogovni priročnik je brezplačno dostopen na naslovu slogovni.slovenscina.eu, kjer je zasnovo in delovanje portala mogoče preizkusiti na 15 demonstracijskih zgledih. Portal ponuja iskalno okence, v katerega uporabnik vtipka svoje jezikovno vprašanje. Odgovori so podani v obliki sestavkov, ki so oblikovno razdeljeni v tri rubrike (Slika 3). ^iSlika 3: Sestavek, ki predstavlja sklanjanje imena Klemen - Rubrika Kratko in jedrnato podaja grafični prikaz distribucije jezikovnih variant, kot se izkazujejo v referenčnem korpusu, npr. primerjava pogostosti oblike Klemna v primerjavi z obliko Klemena. 24 SLOVENŠČINA V ŠOLI, 2016 XIX. letnik, številka 3-4 - Rubrika Na dolgo in široko ponuja daljšo razlago za tiste uporabnike, ki jih zanimajo jezikovna pravila oz. zakaj v primerih, povezanih z njihovim vprašanjem, prihaja do normativnih zadreg. Razlaga je napisana v poljudnem jeziku, vsi uporabljeni strokovni izrazi pa so pojasnjeni v dvižnih menijih. - Rubrika Za navdušence poveže uporabnike z jezikoslovnimi viri, ki obravnavajo izbrano tematiko. Zbirko jezikoslovnih virov sestavljajo digitalizirana strokovna besedila, ki so bila prvotno objavljena v monografijah, strokovnih revijah ali dnevnem časopisju. Priprava Slogovnega priročnika je potekala v več sklopih. Na programerski oz. jezikovnotehnološki strani je bil pomemben korak usmerjen v razvoj sistema, ki avtomatsko črpa jezikovne informacije iz besedilnega korpusa in leksikona besednih oblik in jih prikaže uporabniku na pregleden način. Ta sistem omogoča dinamično prikazovanje podatkov, ki se lahko nenehno prilagaja novemu stanju v jeziku. Ko se posodobi in poveča besedilni korpus, se statistični podatki iz korpusa prelijejo v leksikon besednih oblik, na portalu pa so ti podatki uporabljeni za vizualizacijo brez potrebe po poseganju v sistem (Krek 2012b). Ta sistem je uporabljen pri izdelavi grafov v rubriki Kratko in jedrnato. Programersko zahtevnejši korak je bil tudi razvoj sistema za iskanje in prikaz ustreznega odgovora, ki omogoča, da uporabnik svoje vprašanje lahko vnese v različnih oblikah, tudi brez uporabe jezikoslovne terminologije. Vzporedno so potekale jezikoslovne aktivnosti, od katerih je najpomembnejša analiza tipičnih jezikovnih vprašanj govorcev in govork slovenščine. S spletnim pajkanjem smo zbrali vprašanja, ki so jih uporabniki glede jezikovne rabe zastavili na različnih spletnih forumih in v spletnih jezikovnih svetovalnicah. Rezultat je približno 700 vprašanj, ki smo jih analizirali in hierarhično uredili po jezikovnih ravninah v kategorije: pravopis, pravo-rečje, oblikoslovje, besedotvorje, besedišče, skladnja, besedilo in razno. Nastala ontologija predstavlja kazalo Slogovnega priročnika, po katerem lahko uporabnik torej s klikanjem najde vsebino, ki ga zanima (primer s Slike 2 spada denimo v Oblikoslovje > Samostalniki> Sklanjanje: Moške sklanjatve > Samostalniki z neobstojnim samoglasnikom > Sklanjanje moških samostalnikov z neobstojnim samoglasnikom: slovenska lastna imena). Zadnja projektna aktivnost, ki jo je treba omeniti, pa je bila priprava petnajstih predstavitvenih gesel, za katera so bile opravljene specializirane kvantitativne in kvalitativne korpusne analize in diahroni ter sinhroni pregled s problemom povezanih jezikovnih pravil. Značilno za Slogovni priročnik, kot tudi za druge vire Sporazumevanja v slovenskem jeziku, je sopostavljanje podatkov o realni jezikovni rabi in trenutno obstoječih jezikovnih pravilih. Ta pogled, ki pred pojavom besedilnih korpusov ni bil mogoč, ni dragocen le za jezikovne uporabnike, ki dobijo možnost na enem mestu videti, kako se določeno jezikovno pravilo udejanja v jezikovni praksi, ampak tudi za jezikoslovce. Izredno dobro namreč nakazuje težavna mesta oz. nerešene naloge tako za normativistiko, slova-ropisje in slovničarstvo kot tudi za pripravljavce učnih gradiv za pouk slovenščine (Arhar Holdt idr. 2013). Špela Arhar Holdt, Polona Gantar, Simon Krek V UČILNICE S SODOBNO SLOVENŠČINO: REZULTATI PROJEKTA SPORAZUMEVANJE V SLOVENSKEM JEZIKU (SSJ) 25 5 Pedagoški slovnični portal Eden od ciljev projekta Sporazumevanje v slovenskem jeziku je bil empirično ugotoviti, na katerih mestih imajo učenci in dijaki pri pisanju v slovenščini probleme, in jim ponuditi razlago in rešitev teh problemov v zanje zanimivi in razumljivi obliki. Rezultat je Pedagoški slovnični portal, ki je prosto dostopen na spletnem naslovu slovnica.slovenscina.eu. Kot velja za portal Slogovni priročnik, je tudi Pedagoški slovnični portal pripravljen kot pilotni projekt. V trenutni različici obsega 18 slovničnih poglavij10 in 6 poglavij, ki na kratko in poenostavljeno predstavljajo prosto dostopne jezikovne vire za slovenščino. V skladu s sodobnimi didaktičnimi trendi in splošnim tehnološkim razvojem družbe smo poglavja na portalu pripravili v digitalni obliki, kar omogoča interaktivnost in povezljivost, npr. vključitev posnetkov govora iz korpusa GOS v razlago slovničnih vsebin. Na vsebinski ravni portal določa predvsem dejstvo, da so poglavja v celoti pripravljena na osnovi podatkov iz besedilnih korpusov. Pri pripravi poglavij so bili uporabljeni korpusi Šolar (Rozman idr. 2012), Gigafida (Logar Berginc idr. 2012) in GOS (Verdonik in Zwitter Vitez 2011), kot je na primeru priprave poglavja o menjavi glagolov moči in morati natančneje razloženo v Kosem idr. (2012: 108-122). PEDAGOŠKI SLOVNIČNI PORTAL TEME PO PODROČJIH SI PRVIČ NA STRANI? ^Slika 4: Vstopna stran Pedagoškega slovničnega portala 10 Nekaj primerov poglavij: Ko smo že pri otrocih, z otroki je križ: Sklanjanje besede otrok; Kdo zna rešiti ta problem: Nedoločnik in kratki nedoločnik; S škafcem in krpo gre lažje kot z metlo: Raba predloga z/s; S stricem Sašem sva tekla za avtobusom: Preglas; Če Eva ne more po jabolko, mora pa Adam: Glagola moči in morati. Glavni namen portala je omogočiti učinkovitejšo izrabo časa, ki ga imajo učitelji za izboljševanje pisne kompetence šolajoče se populacije. Vsako od poglavij se osredotoča na posamezen (povsem konkreten) jezikovni problem. Obenem vsako poglavje predstavlja zaključeno celoto, za razumevanje katere ni potrebno poznavanje drugih slovničnih vsebin. Velika pozornost je 26 SLOVENŠČINA V ŠOLI, 2016 XIX. letnik, številka 3-4 11 Ciljni uporabniki portala so učenci zadnje triade OŠ in dijaki raznovrstnih SŠ. Razlage so na osnovni ravni usmerjene k osnovnošolskim uporabnikom, pri čemer so za dijake skozi celotno poglavje na klik na voljo tudi zahtevnejše dodatne vsebine. Vaje trenutno niso razvrščene po zahtevnosti - zahtevnost primarno določa obravnavani jezikovni problem. Na osnovi testiranj v razredu bi bilo mogoče v nadaljevanju določiti, za katero stopnjo šolanja so določene vsebine najbolj primerne, pa tudi ugotoviti parametre za označevanje zahtevnosti jezikovnih zgledov in vaj. 12 http://viri.trojina.si namenjena razumljivosti razlage: jezik razlage je preprost, vsi zahtevnejši pojmi so dodatno razloženi, razlaga je opremljena z mnemotehnikami in vizualnimi elementi, kot so denimo besedni oblaki. Na koncu vsakega poglavja so na voljo slovnične vaje, ki so - ponovno - pripravljene izključno na osnovi avtentičnega jezikovnega gradiva. Pri vsakem od obravnavanih slovničnih problemov so na voljo vaje s po 150 do 200 primeri, ki se prikazujejo v naključnih sklopih po 10, odgovori se samodejno popravijo in ovrednotijo na način, da lahko učenec spremlja svoj napredek. Vsebine so torej zasnovane tako, da jih je mogoče uporabljati tako pri pouku kot tudi samostojno.11 S tem je omogočena individualizacija v razvoju pisne zmožnosti učencev: namesto da vsi učenci rešujejo nabor raznovrstnih slovničnih nalog, je mogoče učenca usmeriti neposredno k poglavju, ki se osredotoča na njegov dejanski jezikovni problem. Dejstvo, da jezikovne vaje temeljijo na realnem in ne izmišljenem jeziku, pri čemer so pogosto zasnovane na primerih iz šolske produkcije (npr. esejev), podpira prenos teoretičnega znanja (tj. o določenem jezikovnem pravilu) v prakso pisanja, saj se poviša možnost, da bodo učenci podobne jezikovne strukture, kot jih srečajo v vajah, tudi sami tvorili pri pisanju. Kot težavo tega pristopa je mogoče omeniti predvsem časovno zahtevnost priprave tovrstnega gradiva, saj je iz množice primerov treba izbrati tiste, ki so obenem tudi didaktično ustrezni. Primeri morajo biti mdr. dovolj kratki, da s kompleksno strukturo ne odvrnejo pozornosti učenca od obravnavanega jezikovnega problema, pa obenem ne pomensko presplošni oz. prazni; razen z obravnavanega vidika ne smejo biti jezikovno problematični; prav tako ne smejo biti sporni z vsebinskega vidika (npr. vsebovati prepoznavna lastna imena ali za šolski kontekst potencialno kočljive vsebine). Pri pripravi portala smo upoštevali vse naštete pogoje in pri tem minimalno posegali v izvorna besedila: primere smo po potrebi skrajšali, ne pa tudi drugače spreminjali. Z adaptacijo primerljivih leksikografskih postopkov (Kosem idr. 2011) smo opravili tudi prve korake na poti k avtomatizaciji izbire ustreznih primerov za jezikovnodidaktične namene, kar se je izkazalo kot dobrodošel in obetaven doprinos k obstoječi metodologiji. Pedagoški slovnični portal je zasnovan z namenom, da učence in dijake poleg slovničnih pravil uči, kateri jezikovni viri so za slovenščino na voljo ter kdaj in kako jih uporabiti - predvsem, kako pridobiti in interpretirati podatke, ki so v posameznem viru na voljo, manj pozornosti je posvečene razlagi sestave posameznega vira. Ker se jezikovni viri za slovenščino hitro posodabljajo in spreminjajo, Pedagoški slovnični portal pa je ostal v obliki kot ob izteku financiranja, so nekatera od poglavij s predstavitvenimi posnetki virov v času pisanja tega prispevka že zastarela. Obenem so bila poglavja v vmesnem času v določenih pogledih vsebinsko in oblikovno presežena z izobraževalnim gradivom, pripravljenim v sklopu projekta Portal jezikovnih virov.2 V nadaljevanju razvoja bo torej treba poskrbeti, da se poglavja s posnetki ustrezno posodobijo in še natančneje usmerijo k vsebinam, ki so za učence in dijake v praksi problematične. Pedagoški slovnični portal je inovativen ne samo v slovenskem prostoru, ampak tudi širše. Med najbolj izpostavljenimi novostmi so: prioretizacija učnih vsebin glede na empirične podatke o prisotnosti jezikovnih napak v Špela Arhar Holdt, Polona Gantar, Simon Krek V UČILNICE S SODOBNO SLOVENŠČINO: REZULTATI PROJEKTA SPORAZUMEVANJE V SLOVENSKEM JEZIKU (SSJ) 27 celotni populaciji; osnovanost razlag iz posamezne jezikovne napake, ne iz slovničnega sistema; uporaba izključno avtentičnega jezikovnega gradiva; vključitev velike količine specifičnih vaj za avtomatizacijo transfera znanja; upoštevanje različnih jezikovnih zvrsti, npr. pisni in govorjeni jezik, standardna13 in nestandardna slovenščina (Arhar Holdt idr. 2016). Z vsemi naštetimi novostmi se seveda odpira vprašanje, ali so slovenske učilnice pripravljene na spremembe v odnosu do jezikovne rabe, ki jih prinaša korpusni pristop (o teh več v Krek in Arhar Holdt 2010). Prvi odzivi učiteljev na predstavljeni rezultat so pozitivni. Od 168 učiteljev, ki so se udeležili jezikovnotehnološ-kega izpopolnjevanja v letu 2014,14 jih je 88 % ocenilo portal kot relevanten, 73 % pa kot uporaben vir za svoje delo. Med glavnimi težavami je pilotna narava portala, konceptualne rešitve pa bo v prihodnjem koraku treba eval-virati tudi pri dejanski rabi v razredu. 6 Sklep V prispevku smo opisali rezultate projekta Sporazumevanje v slovenskem jeziku, ki vključujejo jezikovne vire (pisne, govorne korpuse), baze podatkov (slovenski oblikoslovni leksikon Sloleks, Leksikalna baza za slovenščino), jezikovnotehnološke aplikacije (oblikoskladenjski označevalnik, skladenjski razčlenjevalnik) in inovativne spletne priročniške portale. Podrobneje smo opisali predvsem Leksikalno bazo kot izhodišče za pripravo slovarskih opisov, Slogovni priročnik, ki odgovarja na tipične jezikovne zadrege, in Pedagoški slovnični portal, ki na enostaven način razlaga slovnične pojave, s katerimi imajo učenci in dijaki pri šolskem pisanju največ težav. Namen projekta je bil omogočiti, da bodo govorke in govorci slovenščine lahko sodelovali v novih izobraževalnih trendih, česar ni mogoče doseči brez dobre (jezikovno)tehnološke opremljenosti slovenskega jezika. Kot je razvidno iz prispevka, je kot glavno pomanjkljivost predstavljenih portalov mogoče izpostaviti njihovo vsebinsko nedokončanost, zaradi katere so trenutno manj uporabni za konkretno delo v razredu. Ključen korak za naprej ostajajo tudi uporabniške evalvacije (tako učiteljev kot učencev), ki bodo omogočile poenotenje terminologije in nadaljnje vsebinsko ter oblikovno nadgrajevanje. Kot pravo vrednost predstavljenih rezultatov je torej treba razumeti nove postopke pridobivanja, organizacije in vizua-lizacije jezikovnih podatkov, ki korenito spreminjajo jezikoslovno delo in omogočajo pogled na jezikovno rabo, ki v preteklosti ni bil mogoč. Nova metodologija odpira možnosti za hiter razvoj raznovrstnih, uporabniškim potrebam prilagojenih izdelkov, dokončno oblikovanje katerih pa mora potekati v tesnem sodelovanju z zainteresiranimi uporabniškimi skupinami. V tem smislu je za učitelje slovenščine pomembno predvsem, da se imajo s pomočjo pripravljenih treh portalov možnost seznaniti z določenimi od teh novih možnosti in se v nadaljevanju vključiti v proces kot strokovni evalva-torji in razvijalci novih vsebin. 13 Za natančnejše pojasnilo glede rabe izrazov standardna in nestandardna slovenščina v primerjavi s knjižno zvrstjo gl. Krek 2015 in Krek, Gorjanc in Popič 2015. 14 http://ucitelji.sdjt.si/ 28 v | SLOVENŠČINA V ŠOLI, 2016 XIX. letnik, številka 3-4 ^ POVZETEK Rezultati projekta Sporazumevanje v slovenskem jeziku vključujejo obsežne besedilne korpuse s pisnimi in transkribiranimi govorjenimi besedili, ki so bili zgrajeni z namenom, da bi ugotovili, kako v resnici pišemo in govorimo v sodobni slovenščini. Poleg tega so bile izdelane baze podatkov, ki vsebujejo informacije o slovenski leksiki. To sta predvsem Leksikalna bazas pomenskimi, skladenjskimi, kolokacijskimi in drugimi podatki ter slovenski oblikoslovni leksikon Sloleks, ki vsebuje pregibne oblike za več kot 100.000 slovenskih besed. Razvite so bile tudi nekatere temeljne računalniške tehnologije in baze za potrebe strojne obdelave slovenskega jezika. V prispevku opisujemo predvsem inovativne spletne priročniške portale, na katerih so na uporabniško prijazen način predstavljeni odgovori na tipične pravopisne zadrege ter razlage slovničnih pojavov, s katerimi imajo učenci in dijaki pri šolskem pisanju največ težav. Ključne besede: slovenščina, bralna pismenost, jezikovni viri, jezikovne tehnologije, inovativna učna okolja ^Viri in literatura • Arhar Holdt, Špela, Kosem, Iztok in Logar, Nataša, 2012: Izdelava korpusa Gi-gafida in njegovega spletnega vmesnika. Erjavec, Tomaž in Žganec Gros, Jerneja (ur.): Zbornik Osme konference Jezikovne tehnologije. Ljubljana: Institut Jožef Stefan. 16-21. • Arhar Holdt, Špela, Dobrovoljc, Kaja in Popič, Damjan, 2013: Reprezentacija standardnega in nestandardnega v virih SSJ. Žele, Andreja (ur.): Družbena funkcijskost jezika: vidiki, merila, opredelitve. Ljubljana: Znanstvena založba Filozofske fakultete. 19-27. • Arhar Holdt, Špela, Kosem, Iztok in Gantar, Polona, 2016: Corpus-Based Resources for L1 Teaching: The Case of Slovene. Marcus-Quinn, Ann in Hourigan, Triona (ur): Handbook on Digital Learning for K-12 Schools. Springer, v tisku. • Dobrovoljc, Kaja, Krek, Simon in Rupnik, Jan, 2012: Skladenjski razčlenjevalnik za slovenščino. Erjavec, Tomaž in Žganec Gros, Jerneja (ur.): Zbornik Osme konference Jezikovne tehnologije. Ljubljana: Institut Jožef Stefan. 42-47. • Dobrovoljc, Kaja, Krek, Simon in Erjavec, Tomaž, 2015: Leksikon besednih oblik Sloleks in smernice njegovega razvoja. Gorjanc, Vojko, Gantar, Polona, Kosem, Iztok in Krek, Simon (ur.): Slovar sodobne slovenščine: problemi in rešitve. Ljubljana: Znanstvena založba Filozofske fakultete. 80-105. • Fillmore, Charles, J., Johnson, Christopher, R. in Petruck, Miriam, R. L., 2003: Background to Framenet. International Journal of Lexicography 16/3. 235-250. • Gantar, Polona, 2015: Leksikografski opis slovenščine v digitalnem okolju. Ljubljana: Znanstvena založba Filozofske fakultete UL. http://www.ff.uni-lj.si/Por-tals/0/Dokumenti/ZnanstvenaZalozba/e-knjige/Leksikografski.pdf. • Gorjanc, Vojko, Gantar, Polona, Kosem, Iztok in Krek, Simon (ur.), 2015: Slovar sodobne slovenščine: problemi in rešitve. Ljubljana: Znanstvena založba Filozofske fakultete. Špela Arhar Holdt, Polona Gantar, Simon Krek V UČILNICE S SODOBNO SLOVENŠČINO: REZULTATI PROJEKTA SPORAZUMEVANJE V SLOVENSKEM JEZIKU (SSJ) 29 • Granger, Sylviane in Paquot, Magali (ur.), 2010: eLexicography in the 21st century: New challenges, new applications. Proceedings of ELEX2009. Cahiers du CENTAL. Louvain-la-Neuve: Presses universitaires de Louvain. • Grčar, Miha, Krek, Simon in Dobrovoljc, Kaja, 2012: Obeliks: statistični obliko-skladenjski označevalnik in lematizator za slovenski jezik. Erjavec, Tomaž in Žganec Gros, Jerneja (ur.): Zbornik Osme konference Jezikovne tehnologije. Ljubljana: Institut Jožef Stefan. 89-94. • Hanks, Patrick, 2013: Lexical Analysis: Norms and Exploitations. Cambridge: MIT Press. • Kornai, Andras, 2013: Digital Language Death. PLoS ONE 8(10): e77056. doi:10.137l/journal.pone.0077056. • Kosem, Iztok, Husak, Milos in McCarthy, Diana, 2011: GDEX for Slovene. Kosem, Iztok in Kosem, Karmen (ur.). Electronic lexicography in the 21st century: new applications for new users : proceedings of eLex 2011, 10-12 November 2011, Bled, Slovenia. Ljubljana: Trojina, Institute for Applied Slovene Studies. 150-159. • Kosem, Iztok, Stritar Kučuk, Mojca, Može, Sara, Zwitter Vitez, Ana, Arhar Holdt, Špela in Rozman, Tadeja, 2012: Analiza jezikovnih težav učencev: korpusni pristop. Ljubljana: Trojina, zavod za uporabno slovenistiko. • Krek, Simon in Arhar Holdt, Špela, 2010: Slovenski besedilni korpusi: kako v razred?. Sodobna pedagogika 61/1. 224-241. • Krek, Simon, 2012a: Slovenski jezik v digitalni dobi. The Slovene language in the digital age, [White paper]. Heidelberg: Springer. • Krek, Simon, 2012b: Spletni portal Slogovni priročnik. Krakar Vogel, Boža (ur.): Slavistika v regijah - Koper. Ljubljana: Zveza društev Slavistično društvo Slovenije: Znanstvena založba Filozofske Fakultete. 225-231. • Krek, Simon, 2015: Standardni in knjižni jezik - drugi poskus. Smolej, Mojca (ur.): Obdobja 34: Slovnica in slovar - aktualni jezikovni opis (1. del). Ljubljana: Znanstvena založba Filozofske Fakultete. 401-407. • Krek, Simon, Gorjanc, Vojko, Popič, Damjan, 2015: Med ideologijo knjižnega in standardnega jezika. Gorjanc, Vojko, Gantar, Polona, Kosem, Iztok in Krek, Simon (ur.), 2015: Slovar sodobne slovenščine: problemi in rešitve. Ljubljana: Znanstvena založba Filozofske fakultete. 32-48. • Krek, Simon, Gantar, Polona, Kosem, Iztok, Gorjanc, Vojko in Laskowski, Cyprian, 2016: Baza kolokacijskega slovarja slovenskega jezika. Zbornik konference Jezikovne tehnologije in digitalna humanistika. V tisku. • Lew, Robert, 2015a: Dictionaries and their users'. Hanks, Patrick in De Sch-ryver, Gilles-Maurice (ur.): International Handbook of Modern Lexis and Lexicography. Berlin/Heidelberg: Springer. 1-9. • Lew, Robert, 2015b: Research into the use of online dictionaries. International Journal of Lexicography 28/2. 232-253. • Logar Berginc, Nataša, Grčar, Miha, Brakus, Marko, Erjavec, Tomaž, Arhar Holdt, Špela in Krek, Simon, 2012: Korpusi slovenskega jezika Gigafida, KRES, ccGigafida in ccKRES: gradnja, vsebina, uporaba. Ljubljana: Trojina, zavod za uporabno slovenistiko; Fakulteta za družbene vede. • Rozman, Tadeja, Krapš Vodopivec, Irena, Stritar Kučuk, Mojca in Kosem, Iztok, 2012: Empirični pogled na pouk slovenskega jezika. Ljubljana: Trojina, zavod za uporabno slovenistiko. • Rozman, Tadeja, 2010: Vloga enojezičnega razlagalnega slovarja slovenščine pri razvoju jezikovne zmožnosti. Doktorska disertacija. Ljubljana: Filozofska fakulteta UL. • Verdonik, Darinka in Zwitter Vitez, Ana, 2011: Slovenski govorni korpus Gos. Ljubljana: Trojina, zavod za uporabno slovenistiko. • Vidovič Muha, Ada, 2000: Slovensko leksikalno pomenoslovje - Govorica slovarja. Ljubljana: Znanstveni inštitut Filozofske fakultete.