Oblikoslovno označevanje in besediloslovna analiza Aleksandra Bizjak IZVLEČEK: V prispevku avtorica predstavlja uporabo oblikoslovnega označevalnika za besediloslovno raziskavo, kije bil izdelan na Inštitutu za slovenski jezik ZRC SAZU. Z oblikoslovnim označevalnikom je mogoče hitro in zanesljivo odkrivati in izpisovati oblikoslovne vzorce, nanizane v linearnem poteku besedila, ki bi jim težko sledili z ročnim označevanjem, in tako analizirati veliko besedil. ABSTRACT: The author presents the use of a morphological tagger developed at the Institute of the Slovene language at SRC SASA, in textual research. The application enables fast and reliable detection and display of grammatical patterns which occur over the course of a text. Such patterns would be rather difficult to identify by tagging texts manually and thus it would hardly be possible to analyse large quantities of texts. Uvod Pričujoča razprava obsega dva dela. Najprej so v prvem razdelku predstavljena teoretična izhodišča za besediloslovno analizo. V glavnih potezah bomo poskušali začrtati nove metodološke usmeritve pri analizi besedil. Iz tega kratkega pregleda bo razvidno, daje za opis besedilnega pomena treba opisati oblikoskladenjske vzorce. Ročno beleženje oblikoskladenjskih značilnosti v besedilu je zelo zamuden postopek že za večji niz stavkov, zato bomo v drugem razdelku opisali, kako lahko s pomočjo oblikoslovno označenega korpusa izpišemo oblikoslovne vzorce in rezultate predstavimo grafično. 1. Teoretična izhodišča za besediloslovno analizo Jezikoslovci si pri odgovoru na vprašanje, kaj je pomen, niso edini. Tisti, ki zagovarjajo ožje pojmovanje pomena, pravijo, da mora teorija pomena »omogočati sistematičen opis besednih in stavčnih pomenov ter razmerij med njimi« (Golden Aleksandra Bizjak: Oblikoslovno označevanje in besediloslovna analiza 1997, 207). Gre torej za opis pomena jezikovnih znakov, ki pripadajo jezikovnemu sistemu, kar postavlja preučevanje besedilnega pomena zunaj pomenoslovja. Tisti, ki pomen pojmujejo širše, vidijo notranjo povezavo med pomenom in sporazumevanjem, zato jih zanima tisti pomen jezikovnega znaka, ki ga opredeljuje jezikovna raba. Ne zanima jih torej stavek kot enota sistema, ampak stavek kot enota, ki se uresniči v besedilu. Čeprav je besedilu tako odmerjena večja teoretična pozornost, pa vprašanje, kako sistematično preučevati besedilne pomene, še zdaleč ni rešeno. Preučevanje jezikovnega pomena v konkretnih okoliščinah rabe se začne šele v 60. letih s pragmatično teorijo govornih dejanj. In čeprav ta teorija zaobjame tudi nekatere zunajjezikovne dejavnike, ki vplivajo na pomen izrekov, zaradi omejenosti na stavčno ravnino ne daje možnosti za raziskovanje različnih oblik sporočanja. Govorci namreč v različnih sporazumevalnih okoliščinah ne tvorijo povedi, ampak besedila. Zato je za vpeljavo pojma besedilo v jezikoslovje odločilna predvsem analiza diskurza, kije z raziskovalnim zanimanjem za jezikovne pojave na nadpovedni ravni prispevala k oblikovanju koncepta besedila. V razvoju pomenoslovja po letu 1970 je poleg analize diskurza nedvomno odigrala pomembno vlogo tudi sistemsko-funkcijska teorija jezika. Ker Hallidayeva funkcijska teorija jezika odmerja besedilu večjo teoretično pozornost, je izbrana za teoretično izhodišče besediloslovne analize. V nadaljevanju si bomo pogledali Hallidayeve teoretične trditve o besedilu kot pomenski enoti. 1.1 Besedilo in Hallidayeva sistemsko-funkcijska teorija jezika Pri obravnavi vprašanja pomena v Hallidayevi teoriji jezika je treba postaviti v izhodišče dejstvo, da gre za sistemsko-funkcijsko teorijo jezika, ki poudarja, da jezik ni samo abstrakten sistem znakov, ampak daje njegova osnovna funkcija sporazumevalna. Po Hallidayu je vsaka jezikovna dejavnost vpeta v družbeno-kul-turni kontekst. Razmerje med kontekstom na eni strani in jezikom na drugi strani je prikazano na sliki 1. Slika 1: Razmerje med jezikom in kontekstom (po Cloran 1994, 64) vpetost jesika sistem (potencial) KULTURA*- primer SITUACUA v kontekst jezik SISTEM * ^ BESEDILO Opomba: levo - desno =uposarničenje zgoraj - spodaj = uresničitev Aleksandra Bizjak: Oblikoslovno označevanje in besediloslovna analiza Iz Hallidayeve opredelitve dinamičnega razmerja med kontekstom in jezikom izhaja spoznanje, da je jezik skupek vseh pomenskih izbir, ki so govorcu na voljo v določenem kulturnem kontekstu. Od tudi Hallidayeva oznaka, da je jezik »pomenski potencial« (angl. 'meaning potential') (Halliday 1978, 39). Pri sporazumevanju, to je v konkretnem situacijskem kontekstu, pa govorec iz mreže jezikovnih pomenov izbere samo nekatere pomene. Proces in rezultat pomenskega izbora v določenem situacijskem kontekstu je besedilo. Tako je v Hallidayevem modelu jezikovne dejavnosti največja enota besedilo in ne poved. Besedilo kot jezikoslovna enota je v štiriravninskem sistemu, ki ga Halliday predlaga za opis jezika, uvrščeno na semantično ravnino, kakor je prikazano na sliki 2. Slika 2: Jezikoslovne ravnine in jezikoslovne enote (po Cloran 1994 priredila A. B.) RAVNINE JEZ K O SLOV NEG A OPISA ENOTA 1. KONTEKST Področj e, ton in način diskurza ? \ 2. SEMANTIKA Predstevna, rnedo s ebna in b e sedilna rnetafunkdj a b es edil o 3. SLOVNICA stavek \ _____ko diianj e__ 4. Glasoslovje Vsak posamezen stavek v besedilu je v specifičnem pomenskem razmerju z nekaj stavki ali vsemi stavki v besedilu. Ta specifična pomenska razmerja v besedilu dajejo besedilu pomensko enotnost, in zato Halliday opredeli besedilo kot semantično enoto (Halliday 1977). Opisati besedilo kot semantično enoto torej pomeni opisati pomensko zgradbo besedila. Pri analizi besedil ne smemo namreč pozabiti, da smo na ravnini besedila, ki v sistemski teoriji jezika ni slovnična, ampak pomenska enota. Tako kakor druge jezikovne enote ima tudi besedilo strukturo, in to pomensko strukturo. Hasanova predlaga, da je najmanjša strukturna enota pomena, v kateri se še izraža žanrska struktura besedila, sporočilo in da so osnovne pomenske prvine, ki sestavljajo sporočilo: entiteta, dogodek in okoliščine (1991, 81, po Cloran 1994, 250). Pri pomenskem opisu besedila se bomo naslonili na razprave R. Hasan o se-mantiki sporočilnih enot ( 1991 ) in monografijo C. Cloran o retoričnih enotah ( 1994) ter Aleksandra Bizjak: Oblikoslovno označevanje in besediloslovna analiza oblikovali semantično mrežo, v kateri je poudarjeno razmerje med entiteto in dogodkom na eni strani ter osebkom in povedkom na drugi strani. Za tak opis pa moramo poleg semantične ravnine upoštevati slovnično ravnino, saj so besedilni pomeni dosegljivi le kot ubesedeni pomeni, torej kot oblikoskladenjski vzorci ali s Hallidayevimi besedami: »Slovnična izbira je uresničitev semantične« (Halliday 1973, 93). Zato je prvi korak besediloslovne analize opis oblikoskladenjskih značilnosti besedila. V razdelku 2 bomo opisali, kako smo si pri nadrobni jezikoslovni analizi pomagali z uporabo računalniškega orodja. 2. Opis oblikoskladenjskih značilnosti osebkovih entitet in povedkovih dogodkov Da bi ponazorili, kako zapleteno je beleženje besedilnih pomenov, smo izbrali odlomek iz televizijske pridige iz Murske Sobote, kije bila predvajana 1. marca 1998. Ročno beleženje oblikoskladenjskih značilnosti osebkovih entitet in povedkovih dogodkov je zelo zamuden postopek že za večji niz stavkov, kar ponazarja spodnji primer iz pridige, v katerem so oblikoskladenjske značilnosti osebkov in povedkov zabeležene v oglatih oklepajih. Primer 1: Odlomek besedila, stavki 1-6 1. Drage sestre in bratje, pred dnevi sem slišal na radiu misel napovedovalca: entiteta = [glagolsko morfemsko določilo, 1. oseba ednine, moški spol] dogodek = [glagolska oblika preteklik] 2. »Utrujeni smo od pustnih noči.« entiteta = [glagolsko morf. določilo, 1. oseba množine, moški spol] dogodek = [glagolska oblika sedanjik] 3. In tisti dan sem že bil na čelu zaznamovan z znamenjem smrti, entiteta = [glagolsko morf. določilo, 1. oseba ednine, moški spol] dogodek = [glagolska oblika preteklik] v 4. Cas je, entiteta = [glagolsko morf. določilo, 3. oseba ednine, srednji spol] dogodek = [glagolska oblika sedanj ik] 5. da se zaustavimo entiteta = [glagolsko morf. določilo, 1. oseba množine, moški spol] dogodek = [glagolska oblika sedanjik] 6. in premislimo. entiteta = [glagolsko morf. določilo, 1. oseba množine, moški spol] dogodek = [glagolska oblika sedanjik] Aleksandra Bizjak: Oblikoslovno označevanje in besediloslovna analiza Ker postopek ročnega vnašanja oblikoskladenjskih značilnosti ni primeren za analizo večjega števila besedil, smo se odločili, da bomo besedilo oblikoslovno označili. 2.1 Oblikoslovno označevanje Tako kot imamo v jezikoslovju različne ravnine, na katerih preučujemo jezikovne enote, je tudi v korpusnem jezikoslovju mogoče označevanje na različnih ravninah: glasoslovno označevanje (angl. 'phonological annotation'), oblikoslovno označevanje (angl. 'grammatical annotation' ali 'part-of-speech tagging'), skladenjsko označevanje (angl. 'syntactical annotation'), semantično označevanje (angl. 'semantic annotation') in pragmatično označevanje (angl. 'pragmatic annotation') (O'Donnell 1999, 74). Najbolj razširjena oblika korpusnega označevanja (angl. 'corpus annotation') je oblikoslovno označevanje. Zanj potrebujemo, tako kot za vsako korpusno označevanje, posebno programsko opremo in nabor oznak. Kakor na večini drugih področij kvantitativnega jezikoslovja so bili prvi oblikoslovni označevalniki narejeni za angleški jezik. Označevalnik za slovenščino je začel nastajati 1996 na Inštitutu za slovenski jezik ZRC SAZU in je bil prvič predstavljen v Članku O strojno podprtem oblikoslovnem označevanju slovenskega besedila (Jakopin in Bizjak 1997). Oblikoslovno označeni korpusi se ponavadi uporabljajo za leksikografske, oblikoslovne in skladenjske raziskave posameznih jezikovnih značilnosti. Da je oblikoslovno označeni korpus mogoče uporabiti tudi za besediloslovne raziskave, je pokazal Biber (1998). Prešteval je pogostnost posameznih glagolskih oblik za čas in način v znanstvenih člankih ter ugotovil, da se deli besedila, to so uvod, metode, rezultati in obravnava, precej razlikujejo glede na dobljene razultate. Kako se glagolske oblike nizajo v besedilu, je prikazal z diagramom, iz katerega je jasno vidno, da meje med deli besedila niso ostro začrtane, ampak zajemajo konec ene enote in začetek nove enote (Biber 1998, 122-130). Biber je s to raziskavo potrdil, da oblikoslovno označeni korpusi omogočajo samodejno beleženje jezikoslovnih značilnosti, nanizanih v linearnem poteku besedila in ustvarjajočih besedilne vzorce, ki bi jim težko sledili z ročnim označevanjem. V nadaljevanju tega razdelka bomo na kratkem odlomku pridige pokazali, kako smo z uporabo urejevalnika EVA iz oblikoslovno označenega besedila dobili izpisek niza glagolskih oblik, pri čemer z nizom mislimo na zaporedje glagolskih oblik, kakor si sledijo v linearnem poteku besedila. Izhodišče za analizo je torej oblikoslovno označeno besedilo. Za ponazoritev je izbran odlomek iz pridižnega besedila, kije prikazan na sliki 3. V oblikoslovno označenem besedilu ima vsaka beseda pripisano pravilno, od sobesedila odvisno oblikoskladenjsko oznako. Nabor oznak je podrobneje opisan v članku O strojno podprtem oblikoslovnem označevanju slovenskega besedila (Jakopin in Bizjak 1997). Tu pa si bomo pogledali samo oznake za glagolske oblike, ki so temelj za raziskovanje referencialnosti in časovnosti, na katerih gradimo opis Aleksandra Bizjak: Oblikoslovno označevanje in besediloslovna analiza Slika 3: Odlomek oblikoslovno označenega besedila MiBrsg« nstr« in* brotj«, pr#ä iSnnvi wm,^, Bliš&l na r#tfiu PŽpi Sipi Vpr 5»pi ES Sapa ePLM &L*c ES SaeS Altai n*pasvBdo%Mitc«: »ÉA*«ruJBnï *Mû„ <öd puitnSPi rus£i.«MI «iïh„ s*c^ «m o^pi opbp m. pipe sips '.'pr tisti dan. sc«.. 2b blï__ na £*lu samaïaûvan 2_. znaten js* 9BrtS»B iM4 bpa-r e HiâM es ijH.Bî té $«âf mm nCflfl», Jc^.r do. a»„ iflystsvlwDi lmw près i sli an uSaJ vwnlar v Saci SPcc Vps 6*p Bm> ^pr Gap C Ifcr ES tlvijtrtj» ni__v*«__r-öiinart^*« atfMM, ni____ IsriG, SscS QZPcc ZTbeI HZ Pseï C DSPeje STbeI PC Pseï HE žalostna, hot s*_ ai_ to___pâgasta dozdeva v. sojcsa,... Uvajanju ftutl ypa ŠMfs |p«#$ |K*oi « Se» £$ ISMiwnwS ■JfintJli teden .st».Eermwovola pust in. pcpclnlcs,» »Življenje PLic^i £#c4 SPUed Slad 5«t!i ^ Sïai Stôi p*_ ni„,.,„ il »p part ni____ipwh» pipvimi^i*« ■A'ivUjhP^jNp 4*«- aplat vpr DZfkLC C Sfecd Vpr KPcc € Sic! Saci DPcc Sac4 rtâpût&sti aad äBöjii.« BIn_ v_ postu se, kristjani bolj üa g! C6 ttwaf Vpr €9 SpbS IN» î*ai P odaotuao za pepe Inden, in. a icer pa v so» hote, povsca G*p E4 Sfce4 Vpr Mpf ft ft x*uG*t*ie„ Najt* ts>___wdnwrwl eiii^rwwtjaj dntvi prafwa.iia R vpr ZKsci ©Pep 5»p3 SacE Sapi Sže£ »Kakor s»., slišali v. današnje* prctranca evangeliju, Jc______ ypa ËPLap âL«p ES P*â5 PHMeS SmS fiPU* Kriatu». hi.. Je bil „ pri tvrwftit v ^©röunu napolnjen I Vac i EVP. €PBCß GL8ae ES S*e£ ES ]Z#c5 @Hmc1 ES âWa-tiu^Ouhaii, sbsÜel v_ pasiÊÉva.a ^ui&Av*.* aß^äö,,. rt* jaâam* S Vus S ' «Ue C* Biel ZWml Ce ©ce zjtMflr entitet in dogodkov v drugem koraku analize. Oznake so v preglednici 1 razvrščene tako, kakor si sledijo v besedilu, le daje os branja navpična in ne vodoravna kakor v besedilu. Preglednica 1 : Razlaga glagolskih oznak na sliki 3 GPLae (sem) GLme (slišal) GNmpl (utrujeni) Gpap (smo) GPBae (sem) GLBme (bil) GNme 1 (zaznamovan) Gpce (je) Gap (zaustavimo) Gap (premislimo) GZPce (ni) GZPce (ni) Gce (dozdeva) GPLcd (sta) glagol, pomožni, ob opisnem deležniku na -1, prva oseba, ednina glagol, opisni deležnik na -1, moški spol, ednina glagol, trpni deležnik na -n, moški spol, množina, prvi sklon glagol, pomožni, prva oseba, množina glagol, pomožni, ob opisnem deležniku na -1 (biti), prva oseba, ednina glagol, pomožni, ob opisnem deležniku na -1 (biti), moški spol, ednina glagol, trpni deležnik na -n, moški spol, ednina, prvi sklon glagol, pomožni, tretja oseba, ednina glagol, povedni sedanjik, prva oseba, množina glagol, povedni sedanjik, prva oseba, množina glagol, nikalna oblika, pomožni, tretja oseba, ednina glagol, nikalna oblika, pomožni, tretja oseba, ednina glagol, povedni sedanjik, tretja oseba, ednina glagol, pomožni, ob opisnem deležniku na -1, tretja oseba, dvojina Aleksandra Bizjak: Oblikoslovno označevanje in besediloslovna analiza GZPce (ni) glagol, nikalna oblika, pomožni, tretja oseba, ednina GZPce (ni) glagol, nikalna oblika, pomožni, tretja oseba, ednina Gpce (je) glagol, pomožni, tretja oseba, ednina Gap (odločamo) glagol, povedni sedanjik, prva oseba, množina GPcp (so) glagol, pomožni, tretja oseba, množina GPLap (smo) glagol, pomožni, ob opisnem deležniku na -1, prva oseba, množina GLmp (slišali) glagol, opisni deležnik na -1, moški spol, množina GPLce (je) glagol, pomožni, ob opisnem deležniku na -1, tretja oseba, ednina GPBce (je) glagol, pomožni, ob opisnem deležniku na -1 (biti), tretja oseba, ednina GLBme (bil) glagol, pomožni, ob opisnem deležniku na -1 (biti), moški spol, ednina GNme 1 (napolnj en) glagol, trpni deležnik na -n, moški spol, ednina, prvi sklon GLme (odšel) glagol, opisni deležnik na -1, moški spol, ednina Oblikoslovno oznako sestavljajo: kratica za besedno vrsto, kije pisana z velikimi tiskanimi črkami in vedno na prvem mestu, sledijo kratice, pisane z velikimi tiskanimi črkami, ki označujejo besednovrstne skupine, in kratice za oblikoslovne značilnosti, ki so pisane z malimi tiskanimi črkami ali števkami. Glagolske oznake so bile za nalogo dopolnjene tako, daje pri sestavljenih glagolih pomožnemu glagolu (oznaka GP) dodana kratica L (torej GPL), ko glagolu sledi pretekli deležnik, in kratica B (GPB), ko glagolu sledi pretekli deležnik biti. Te spremembe so bile uvedene zato, da smo poenostavili računalniško obdelavo in delo z makroprogrami v urejevalniku EVA. Z urejevalnikom Eva smo najprej razdelili besedilo na povedi, ker je členjenje besedila na povedi v Evi samodejen postopek. Odlomek oblikoslovno označenega besedila, razdeljen na povedi, je prikazan na sliki 4. Razdelitev na povedi je bila v pomoč pri nadaljnji računalniški obdelavi, saj smo želeli ohraniti linearno zaporedje glagolskih oblik v besedilu, kakor kaže slika 5, na kateri je besedilo zapisano v navpični smeri, v vodoravni pa imamo razporejene oznake, lekseme in številke povedi. Z makroprogrami smo nato iz navpičnega linearnega seznama celotnega besedila izbrali glagolske in samostalniške oblike in ohranili zaporedje povedi v besedilni razporeditvi ter tako dobili tudi stavčno zaporedje. Urejevalnik Eva namreč še nima izdelanega postopka za samodejno razčlenjevanje besedila na stavke. Seznami, kakršen je na sliki 6, so bili oblikovani z urejevalnikom Eva za celotno besedilo. V vodoravni smeri imamo razvrščene števke, ki označujejo mesto stavka v besedilu, sledijo glagolski oblike in njihove oblikoskladenjske oznake ter v primeru, ko je v stavku ubesedeni osebek, tudi samostalniške oblike in njihove oblikoskladenjske oznake. S tem je narejen prvi korak analize, to je opis obliko-skladenjskih značilnosti entitet in dogodkov v besedilih. Opis ima obliko seznama, Aleksandra Bizjak: Oblikoslovno označevanje in besediloslovna analiza Slika 4: Odlomek oblikoslovno označenega besedila, razdeljen na povedi , i sestre in. bratje, or«d aemvi »ea slišal «* radiu »i»el napovedovale*: »»utrujam mo.. od puatRiii not i. mm $i->aJ>ipl Stpl Vpr Sapi £6 Sap« SPLae Sitae fS SacS MH Sae? BMapi SP«p CS Pip? SžpS « .2**1«. tisti se«..., *e Bil,,.. n» feiu ea?nj|»ovan s_ arnaaefijea sarti ,a ♦« £Kae4 Sae* 6Pttae C ût-Oae ta SseS ûHaei C» Sseé SžeS * •3»ajS*s>.. je, da »e.. araustaviao in, prealsiise.« Ï3««£a«l BPce vpo Gap Cap vpr Cap s ,4>ajSAJ vendar v, življenju ni___va*. . tako rožnato.g Vpr ES SaeS GZPce ?Tsei (S PseJ « .5-«îuci ni., vsa . UKs trm, tiKo žalostne. Hot se. »t. te..... pogosta öszaev« v. noje«..... živijtnju.a $3*«Ê eZPce ÎTsel 82 ?*el M Pseî Vpo Gap čGaeS «se! B Ste CS Z8Vae*eS 8*e§ » .£•■#11 nul i t »den st*.,,, r*rna*ov*l* pust in... pepeinica«* ib-a^Laeai Mea «H.ea U.M S#ei vpr Stat * vi J*n j* pn, ni___ur pust 1". ni,„_ m*» pepatnica.» S?-afMl Vpr SSPce Č Spel Vpr OZPce t Stal a .S»a£ivijsnjt ja splet napetosti »ed oboji«.* ÎS *ajSs«i 6Pce Sae4 S*e8 fié ZT««6 m ,9'mln v, postu ste. kristjani öolj odîotaao x« papalnieo. In sicer pavaca hote, pevst* zavestna. k«Jti to..... »o... dnevi o£iSêsv*nj«, tSnevi prenove* tS-*Vpr ES SaeS Sap Sapl fl Sap 14 Sžb4 Vpr Vpr fi fl A 8 Vpr Waal SPtp Sapi SaaS Sapi 8iaJ « .l8-,aK»Xor s»o„.,, slišali u, danasnjea prjbranaa evangeliju, J«..„ Kriatus, hi., Jr . ftil... pri krstu v„ Jordanu napolnjen s. Svatla.Ouhea, misel v. pustavo.« îi8'«rVPO 6Pi.ap ocap ES PmS PN«*3 SmS ß*>u« ÎVaeî JW SPBC« 6tB«8 ES S*«5 ES ««5 ÖM**l £6 ÏV««6 «.«# £4 5Ï«4 « .ll-»Puftč«v«,a :ii'«s*«i « v katerem so glagolske oblike navedene v navpičnem linearnem zaporedju zaradi računalniške obdelave podatkov. Tak prikaz opisa bralcu ne da predstave o kontinuiteti, premikih in prepletih entitet in dogodkov, ki prispevajo k pomenskemu valovanju besedila, zato bomo opise entitet in dogodkov pretvorili v številčna zaporedja, ki so osnova za grafični prikaz pomenov, premočrtno snujočih se v besedilu. 2.2 Grafični prikaz osebkovih entitet in povedkovih dogodkov Najprej smo z makroprogrami urejevalnika Eva glagolske oblikoskladenjske oznake glede na kategoriji osebe in števila pretvorili v številčne oznake po naslednjem ključu: a) 1. oseba ednine dobi številčno oznako 1 ; b) 1. oseba dvojine dobi številčno oznako 2; c) 1. oseba množine dobi številčno oznako 3; d) 2. oseba ednine dobi številčno oznako 4; e) 2. oseba dvojine dobi številčno oznako 5; f) 2. oseba množine dobi številčno oznako 6; g) 3. oseba ednine dobi številčno oznako 7; h) 3. oseba dvojine dobi številčno oznako 8; i) 3. oseba množine dobi številčno oznako 9. Pretvorbo glagolskega zaporedja oblikoskladenjskih oznak glede na kategoriji osebe in števila v številčno zaporedje prikazuje primer 2. Primer 2: Pretvorba kategorije osebe in števila v številčno oznako v odlomku besedila 1 sem-GPLae —1 2-smo-GPap —> 3 3-sem-GPBae —> 1 4-je-GPce-čas-Sžel —► 7 5-zaustavimo-Gap —* 3 Aleksandra Bizjak: Oblikoslovno označevanje in besediloslovna analiza PžpldrageT A-pogosto-5 S me5 evangeliju-10 Sžplsestrel Gce-do3deva-5 GPLceje-10 VprinT IVmel Kristus 10 Smpl bratjel ZS Vaese5-mojem.-.5 ZVR-ki-10 E6piedl S seSživljenju -5 GPBceje-10 Srnpöunevil PLme4irnirtuli-6 GLBme-bil-10 GFLaeseml Sme4 te den-6 E5-pn-10 GLme-slisal-l GPLcd-sta-6 SmeS-krstu-lO E5na-1 GLmd -samamDvala-6 E5v-10 Sme5radiuT Smel-pust-6 IZ mej Joudanu-10 Sže4-misell VprinT GNme 1 -napolnjen-10 S me 2 ■ napove do val: a • 1 S že 1-pepelrùca-6 E6V10 GNmp 1 -utRijerri.-1 S sel žirije nje-7 IVmeöS vetimDunom-10 GPap-smo-1 Vprpa-7 GLme-odšel-10 E2odl GZPce -ni-7 E4vl0 Pžp2pu.5tni]iT Csamo-7 SaE4-puščavoT0 Sžp2nociT Smelpust-7 Vpr-in-2 Vprin-7 ZKme4-tisti-2 GZPce-ni-7 Sme4dan-2 Csamo-7 GPBaesem-2 Sžel-pepelnica-7 Č-i-2 S se 1 življenje -8 GLBmefeil-2 GPce-je-8 E5na-2 Sme4splet« Sse.5-oelu-2 Sže2napetosti-8 GNme 1 -2aEnartiDvan-2 E6-med-8 E6^-2 ZTseö-ob ojim-8 3 se6-mämenjem-2 Vprin-9 Sže2smrti-2 E5v9 Smel čaj-3 Sme5-posta-9 G Pse je-3 Gmp-se-9 Vpoda-3 S mp 1 knstjani-9 Gmp-se-3 A bolj-9 Gap zaustavimo -3 Gapodlocamo-9 Vprin-3 E4-2a-9 Gap -premislimo -3 Sže4pepelnico9 C-saj-4 Vprin-9 Vpr'verdar4 Vprsicer9 E5v4 A -povsem-9 Sse5življer[ju-4 A hote9 GZRe-ni-4 A-povsem-9 ZTselvse-4 A-2avestno-9 AZ-tako4 Vprkajti-9 Psel-iožnato-4 ZKsel -to-9 Čtudi-5 GFtp-so-9 GZFte-ni-5 Smpl-dnevi-9 ZTsel-vse-5 S se2-ociscevanja9 AZ-talm-5 Smpl dnevi-9 Psel črno-5 Sže2jaenove-9 AZ-tako-5 VpokakorlO Pse 1 -žalostno -5 GPLap-smo-10 Slika 5: Odlomek oblikoslovno Vpokot-5 GLmp-slišali-10 označenega besedila, razdeljen Gmp-se-5 ZOae3-rtri.-5 E5-W0 Pme5 lianas nje m-10 na povedi in prikazan v navpič- ZKselto-5 PN ire 5 prefc ranem-10 ni linearni razporeditvi Aleksandra Bizjak: Oblikoslovno označevanje in besediloslovna analiza 6-premislimo-Gap —> 3 7-niGZPce 7 8-ni-GZPce 1 9-dozdeva-Gce —► 7 I OstaGPLcdpust-Sme 1-pepelnica-Sžel —> 8 11-ni-GZPce-življenje-Ssel —► 7 12-ni-GZPce->7 13-je-GPce-življenje-Ssel —> 1 14-odločamo-Gap-kristjani-Smpl —> 3 15-so-GPcp —► 9 16-smo-GPLap —► 3 17-je-GPLce-Kristus-IVmel —► 7 18-je-GPBce-»7 Ker se osebkove entitete in povedkovi dogodki zapisujejo v stavčne enote sočasno, smo se odločili, da bomo osebkove entitete zapisali v graf točkovno, časovno usmeritev povedkovih dogodkov pa prikazali z barvnim poljem po naslednjem ključu: a) preteklik dobi številčno oznako 10, ki predstavlja modro barvo; Slika 6: Glagolski niz odlomka besedila 1-sem-GPLae 2-smo-GPap 3-sem-GPBae 4-je-GPce-čas-Sžel 5-zaustavimo-G ap 6-premislimo-Gap 7-ni-GZPce 8-ni-GZPce 9 -dozdeva -G ce 10 ■ sta- GPLc d-pust-Srne 1 -p ep dni ca-Sž e 1 II -ni -GZP ce-ži vlj enj e- S se 1 12-ni-GZPce 13 -j e-GP c e-ži vlj enj e-S s e 1 14-odločamo-Gap-kristjarji-Smp 1 15-so-GPcp 16-smo-GPLap 17 -j e-GPL ce-Kristus- IVrn e 1 18-je-GPB ce Aleksandra Bizjak: Oblikoslovno označevanje in besediloslovna analiza b) sedanjik dobi številčno oznako 10T0, ki predstavlja zeleno barvo; c) prihodnjik dobi številčno oznako 10T0T0, ki predstavlja rumeno barvo. Pretvorbo glagolskega zaporedja oblikoskladenjskih oznak glede na kategorijo časa v številčno zaporedje prikazuje primer 3. Primer 3: Pretvorba kategorije časa v številčno oznako v odlomku besedila lsem-GPLae —► 10 2-smo-GPap —► 10*10 3-sem-GPBae ^10 4-je-GPce 10-10 5-zaustavimo-Gap —> 10*10 6-premislimo-Gap —► 10*10 7-ni-GZPce 10*10 8niGZPce 10*10 9-dozdeva-Gce —► 10*10 10-sta-GPLcd- 10 11-ni-GZPce-> 10*10 12-ni-GZPce-> 10*10 13*je*GPce-> 10*10 14-odločamo-Gap —► 10*10 15soGPcp-> 10*10 16smoGPLap —► 10 17*je*GPLce-* 10 18jeGPBce-> 10 Številčna zaporedja za kategorijo osebe, števila in časa smo vnesli v program MsExcel in oblikovali graf, v katerem točke od 1 do 9 na vodoravni osi predstavljajo kategorijo osebe in števila, točke na navpični osi zaporedne številke stavkov v besedilu in barvni stolpci kategorijo časa. Graf, kije bil izdelan na osnovi podatkov o osebkovih entitetah in povedkovih dogodkih v odlomku besedila (stavki 1-18), je prikazan na sliki 7 in je opremljen s pojasnili za branje. 1. Drage sestre in bratje, pred dnevi sem slišal na radiu misel napovedovalca: 2. »Utrujeni smo od pustnih noči.« 3. In tisti dan sem že bil na čelu zaznamovan z znamenjem smrti. 4. Cas je, 5. da se zaustavimo 6. in premislimo. 7. Saj vendar v življenju ni vse tako rožnato. 8. Tudi ni vse tako črno, tako žalostno, 9. kot se mi to pogosto dozdeva v mojem življenju. 10. Minuli teden sta zaznamovala pust in pepelnica. 11. Življenje pa ni samo pust Aleksandra Bizjak: Oblikoslovno označevanje in besediloslovna analiza to do ravna os = ltalegpiga osebe in t števila. -j» - 1=1. oseba ednine ** 2 = 1. oseba dvojine ? - 3 = 1. oseba množine 4=2. oseba ednine - 5=2. oseba dvojine 1Û - 6=2. oseba množine - 7=3. oseba ednine 13 " 8=3. oseba dvojine - 9=3. oseba množine 0123456789 -c_t_» « « »_s_i_t- selen L aoœtb = odekženec rdeči jorib = citat sivi s: arib = neoseba teamc ma&àd xoadb = tiansœndenca (Bog, Jesas, Sveti .Duh) M mm foaxvRB poly e = cas po*»adkdfwga modjo polje = psetekiik sseleno polie = sedanjik Za lažje razumevanje grafa je pred njim izpisano besedilo. Enote od 1 do 9 na vodoravni osi označujejo kategorijo osebe in števila. Enote na navpični osi predstavljajo zaporedno številko stavka v besedilu. Kadar v besedilu nimamo na začetku vrstice oznake za številko stavka, to pomeni, da se stavek nadaljuje (glej 17. stavek na sliki 7) ali da gre za neglagolske stavke in polstavčne tvorbe. Osebkove entitete so v grafu predstavljene kot barvne točke v obliki romba in povedkovi dogodki kot barvna polja. V prvem stavku, ki je na navpični osi označen z zaporedno številko 1, je entiteta v smeri vodoravne osi oddaljena za eno enoto, kar pomeni, da je nano-snik govorec (1. oseba ednine), barvno polje pa je modro, kar nam sporoča, da je dogodek prvega stavka usmerjen v preteklost. Tudi nanosnik tretjega stavka je govorec in dogodek usmerjen v preteklost. V petem, šestem in štirinajstem stavku je entiteta v smeri vodoravne osi oddaljena za tri enote, kar pomeni, daje nanosnik govorec in poslušalci (1. oseba množine), barvno polje pa je zeleno, torej so dogodki usmerjeni v sedanjost. Prvoosebni in drugoosebni glagoli ednine, dvojine in množine označujejo v besedilu udeležence govornega dogodka in imajo nanosnik v situacij skem kontekstu konkretnega govornega dogodka, zato so na grafu vedno označeni z zelenim rombom. 12. in ni samo pepelnica. 13. Življenje je splet napetosti med obojim. 14. In v postu se kristjani bolj odločamo za pepelnico, in sicer povsem hote, povsem zavestno, 15. kajti to so dnevi očiščevanja, dnevi prenove. 16. Kakor smo slišali v današnjem prebranem evangeliju, 17. je Kristus, 18. kije bil pri krstu v Jordanu napolnjen s Svetim Duhom, odšel v puščavo. Slika 7: Razlaga grafa za odlomek besedila, stavki 1-18 Aleksandra Bizjak: Oblikoslovno označevanje in besediloslovna analiza Navedena literatura Biber, Douglas, Conrad, Susan, Reppen, Randi, 1998, Corpus linguistics: Investigating language structure and use, Cambridge University Press, Cambridge. Razpon od 1. do 6. enote na vodoravni osi je razpon netretje glagolske osebe in na tem območju grafa se gibljejo zeleni rombi, ki predstavljajo pomensko skupino, imenovano udeleženci govornega dogodka. Razpon tretje glagolske osebe je od 7. do 9. enote na vodoravni osi in na tem območju so razvrščene entitete četrtega, sedmega, osmega, devetega, desetega, enajstega, dvanajstega, trinajstega in petnajstega stavka, ki imajo nanosnika -človeško in so dogodkovno vse usmerjene v sedanjost (polje zelene barve), razen osmega stavka, kije usmerjen v preteklost (polje modre barve). V sedemnajstem stavku je v besedilo uvedena nova entiteta, ki se nanaša na nadnaravno bitje in je označena z modrim rombom. Posebej je treba omeniti še drugi stavek, ki je označen z rdečim rombom. Rdeči romb se od drugih barvnih rombov razlikuje, ker sporoča, da gre v besedilu za dobesedno navajanje. Citiranje uvaja besedilo drugega govornega dogodka in tako vpeljuje entiteto in dogodek drugega časa in prostora. Specifična kombinacija entitete in dogodka tvori enoto, kije na ravni pomena višja od entitete in dogodka ter se imenuje retorična enota. Rdeči romb tako označuje enoto kompozicijske ravnine. Da bi pojasnili, kako so v grafu upodobljene osebkove entitete z barvnimi točkami in povedkovi dogodki z barvnimi polji in kako je zabeleženo njihovo gibanje, ali drugače povedano, kako je treba brati graf, smo v tem razdelku podrobno opisali entitete in dogodke za posamezne stavke odlomka pridižnega besedila. Vendar namen grafa ni branje stavka za stavkom. Prav grafična upodobitev s svojo statičnostjo naj bi nam pomagala, da tisto, kar ostaja v ubeseditvenem procesu neopazno in prikrito, pusti sled, pride na površje ter nam da predstavo o kontinuiteti in premikih v pomenskem valovanju besedila. Sklepne ugotovitve Graf je torej nekakšen slikovni model, ki beleži gibanje entitet in dogodkov in je tako izhodišče za opis strukturnih vzorcev, nastajajočih s kontinuiteto, premiki in prepleti entitet in dogodkov v besedilu. Z računalniškimi postopki, opisanimi v tem razdelku, lahko oblikujemo grafe za cel korpus besedil in jih uporabljamo kot slikovne modele za opazovanje strukturnih vzorcev, kijih ustvarja zaporedje entitet in dogodkov ter tako določamo pomensko-strukturno zgradbo besedil. Prav grafična upodobitev s svojo statičnostjo naj bi nam pomagala, da tisto, kar ostaja v ubeseditvenem procesu neopazno in prikrito, pusti sled, pride na površje ter nam da predstavo o kontinuiteti in premikih v pomenskem valovanju besedila. Aleksandra Bizjak: Oblikoslovno označevanje in besediloslovna analiza Cloran, Carmel 1994, Rhetorical Units and Decontextualization: An Enquiry into some Relations of Context, Meaning and Grammar, Department of English Studies, University of Nottingham (Monographs in Systemic Linguistics, 6), Nottingham. Golden, Marija, 1997,0jeziku in jezikoslovju, Filozofska fakulteta, Oddelek za splošno in primerjalno jezikoslovje, Ljubljana. Halliday, Michael A. K., 1973, Explorations in the Functions of Language. Edward Arnold, London. Halliday, Michael A. K., 1977, Text as semantic choice in social contexts, v: T. Van Dijk in J. Petofi (ur.), Grammars and Descriptions. Berlin, de Gruyter, 176-225. Halliday, Michael A. K., 1978, Language as Social Semiotic, The Social Interpretation of Language and Meaning, Edward Arnold, London. Hasan, Ruqaiya, 1991, Questions as a mode of learning in everyday talk. Language Education: Interaction and Development, Ur. T. McCausland, Launceston, University of Tasmania, 70-119. Jakopin, Primož, Bizjak, Aleksandra, 1997, O strojno podprtem oblikoslovnem označevanju slovenskega besedila, Slavistična revija 45/3-4, 513-532. O'Donnell, Matthew, 1999, The Use of Annoteted Corpora for New Testament Discourse Analysis: A Survey of Current Practice and Future Prospects, Discourse Analysis and the New Testament, Approaches and Results, Journal for the Study of the New Testament, Supplement Series 170, Studies in New Testament Greek 4, Ur. S. E. Porter in J. T. Reed. Sheffield Academic Press, Sheffield, 71-117. Morphological Tagging and Textual Analysis Summary In order to describe textual meanings the author employs the systemic-functional linguistic theory. A semantic network emphasizing the relation between the entity and the event on the one hand and the subject and the predicate on the other is presented. A sermon from Murska Sobota which was broadcast on March 1st 1998 on TV Slovenia serves as an exemplification for this process. The basic structure for the presentation of entities and events is the notation of morpho-syntactic patterns which occur in a linear text string. In the notation process the linguistic features of a text, which would be rather difficult to identify by tagging texts manually, the morphological taggerfor Slovene, developed at the Institute of the Slovene language at SRC SASA, is of great help. Every string of morpho-syntactic tags is converted into a graphical presentation. The graph functions as a sort of a map, describing the movements of entities and events, and as such it becomes the starting point for the description of the semantic construction of a given text. It is exactly the graphical presentation that enables the identification of semantic shifts, which are hidden and perceived only intuitively by Aleksandra Bizjak: Oblikoslovno označevanje in besediloslovna analiza Aleksandra Bizjak, Inštitut za slovenski jezik Frana Ramovša ZRC SAZU, Novi trg 2, 1000 Ljubljana E-pošta: aleksandra.bizjak@zrc-sazu.si the listener/reader, and provides the access to this information for further linguistic research.