UDK 81'342.2 Damir Horga Filozofski fakultet, Sveučilište u Zagrebu Vesna Požgaj Hadži Odsjek za slavistiku, Filozofski fakultet, Sveučilište u Ljubljani (DIS)FLUENTNOST I PROIZVODNJA GOVORA Govornik nastoji proizvesti idealan govor koji je vješto planiran, gramatički korektan, fluentno izveden i komunikacijski primjeren. Medutim, zbog svoje biološke prirode i fizioloških karakteristika te komunikacijskih uvjeta u kojima čovjek proizvodi govor, njegov je govor opterecen disfluentnostima koje su znak poteškoca u govornoj proizvodnji. Složenost procesa govorne proizvodnje i (dis)fluentnosti objašnjavaju se različitim modelima govorne proizvodnje i istražuju na primjeru javnoga (formalni govor) i komercijalnoga (neformalni govor) radijskog govora. Ključne riječi: modeli govorne proizvodnje, kategorije (dis)fluentnosti, formalni i neformalni govor, radijski govor The speaker's goal is to produce ideal speech, which is skillfully planned, grammatically correct, fluently executed, and communicatively appropriate. However, due to his/her biological nature and physiological features and communication conditions in which people produce speech, this speech can become dysfluent, thus indicating speech production difficulties. The complexity of speech production and (dys)fluency is explained by various models of speech production and the research looks at public (formal speech) and commercial (informal speech) radio speech. Keywords: speech production models, categories of (dys)fluency, formal and informal speech, radio speech 1 Proces govorne proizvodnje Temeljno je odredenje govora da je govor komunikacija. Zbog najrazličitijih unu-trašnjih i izvanjskih razloga, motiva i poticaja čovjek ima potrebu proizvesti i pre-nijeti obavijesti sugovorniku. Dakle, govornik je obavijesni procesor koji proizvodi obavijesti, procesira ih i prenosi sugovorniku. Dakako, on je istodobno i primatelj obavijesti. Da bi prenio obavijest, govornik mora raspolagati nekim sustavom znako-va i medijem pomocu kojeg ce to ostvariti. Najprirodniji je sustav znakova prirodni jezik, a najprirodniji medij govor. Proizvodnja govora, od komunikacijske namjere do govornog zvuka, može se razložiti na nekoliko razina kroz koje prolazi obavijest oblikujuci se na svakoj od razina sukladno s njihovim funkcionalnim zakonitosti- Mehanizmi govorne proizvodnje objašnjavaju se različitim modelima koji pro-matraju govornu proizvodnju kao hijerarhijski organiziran proces preoblikovanja tijekom kojeg obavijest prelazi s jedne razine na drugu mijenjajuci kodove i/ili mate- rijalni oblik signala karakterističan za pojedinu razinu. Jaeger (2005) u svom Modelu reprezentacijskih i procesorskih komponenata govornu proizvodnju promatra kao sustav izgraden na dvjema razinama: govornik mora imati izgradene programe govorne proizvodnje s jedne strane i s druge strane mora postojati mogučnost efikasne realizacije tih programa. Svaka od tih dviju razina može se raščlaniti na niz hijerar-hijski organiziranih podrazina. Prva se razina naziva reprezentacijskom - u njoj je u dugoročnoj memoriji pohranjeno cjelokupno znanje o svijetu na temelju kojeg če govornik formirati obavijesnu/sadržajnu/konceptualnu razinu svog govornog izriča-ja, kao i znanja o jezično-govornim mehanizmima koja ce mu omogučiti da jezično oblikuje i govorno izvede željenu obavijest. Druga je razina procesorska - u njoj su pohranjeni mehanizmi pomocu kojih govornik aktivira, odabire, priziva i ugraduje elemente iz dugoročne memorije u aktualni izričaj dajuči mu jezično-govorni oblik koji izričaj zahtijeva. Riječ je zapravo o programskim paketima koji se nakon što su obavili svoju funkciju gase i čekaju pripravni za novo uključivanje. Široko prihvačeni model govorne proizvodnje jest Leveltov (1995) hijerarhijski i modularni model (Garret 1976; Levelt 1995; Levelt et al. 1999), najčešče poznat kao Modularni model proizvodnje govora, koji promatra proizvodnju govora kroz tri razine (Slika 1). Na konceptualnoj razini govornik u dva koraka planira obavi-jesni sadržaj svog izričaja. Makroplaniranjem on osmišljava svoju komunikacijsku namjeru i glavne karakteristike koje mora zadovoljiti obavijest da bi bila sukladna s principima komunikacijske kooperativnosti (Griče 1975) i da bi se ostvarili planirani govorni činovi (Searl 1969). U sljedečem koraku, u mikroplaniranju, govornik oda-bire i strukturira konkretni informacijski sadržaj. Konačan je rezultat rada koncep-tualizatora obavijest oblikovana algoritmom svojstvenim toj razini kao predverbalni plan koji nije jezično oblikovan, ali je dostupan jeziku te omogučuje da se na sljede-čoj razini obavijest, možemo reci misao, jezično oblikuje. Formulator predverbalnu obavijest oblikuje primjenjujuči jezični kod odredenoga prirodnog jezika opet u dva koraka: najprije gradeči njezinu gramatičku strukturu što uključuje odabir jezičnih jedinica koje če adekvatno prenijeti koncepte obavijesti (semantika), odabrat če one oblike leksičkih jedinica koji če uspostaviti nužne odnose medu njima (morfologija) uključujuči i redoslijed odabranih jedinica (sintaksa). U mentalnom leksikonu po-hranjene su leksičke jedinice, leme sa svojim potencijalnim morfološkim oblicima i sintaktičkim valencijama. Takvim gramatičkim kodiranjem izgradena je površinska struktura jezičnog izričaja koja se pohranjuje u gramatičkom meduspremniku. Time je omogučeno fonološkom procesoru da površinskoj strukturi pridruži fonološke se-gmentalne i prozodijske jedinice, što je drugi korak koji radi formulator. Završni je rezultat jezičnog kodiranja fonetski plan. On je ulazni podatak za artikulator čiji je zadatak da fonetski plan neuralnim naredbama govornim organima pretvori u govorne pokrete i govorni zvuk kao konačan rezultat proizvodnje govora. Govorna proizvodnja kontrolira se nizom automatiziranih ili svjesnih povratnih sprega (od obavijesne do komunikacijske PS, v. sliku 1) kojima govornik provjerava je li proces realizacije govorne obavijesti u skladu s inicijalnom zamisli koncptuali-zatora, odnosno kontrolira svoju proizvodnju i ispravlja pogreške. Povratne sprege mogu se klasificirati prema različitim kriterijima. Prema funkcionalnom kriteriju dijele se na: direktivne, korektivne i adaptativne. Direktivna povratna sprega ili Slika 1: Model govorne proizvodnje (Horga 2008: 160; prilagodeno prema Pos -tma 2000). zatvorena petlja na neki je način sprega unaprijed (feed forward) koja se odvija paralelno s govornim pokretom. Govornik na temelju povratnih informacija o teku-cem stanju pokreta može predvidjeti odstupanja od željenog cilja i odmah korigirati pokret prije nego je napravljena pogreška koja bi zahtijevala potpuno reprogramiranje i ponavljanje pokreta. Ta je povratna sprega veoma brza (tek nekoliko desetaka milisekundi). Korektivnom povratnom spregom registriraju se realizirane pogreške koje zahtijevaju reprogramiranje i ispravljanje. Te su pogreške karakteristične za obavijesnu i jezičnu razinu govorne proizvodnje. Konačno, adaptativnom povrat-nom spregom kontrolira se usvajanje jezičnih i motoričkih govornih vještina; njome se govor podešava opcim uvjetima u komunikacijskom kanalu ili naglim promjena-ma uvjeta u njemu. Borden i Harris (1980) povratne sprege u govornoj proizvodnji dijele na intrinzičke ili unutarnje, tj. one prije govornog pokreta, responsivne kojima se kontrolira izvedba pokreta i temelje se prije svega na proprioceptivnim kanali-ma te izvanjske kojima se kontrolira neposredno izveden motorički pokret. Skarič (1991) navodi unutarnju povratnu spregu na razini središnjega živčanog sustava, ekstraauditivnu ili propriocepcijsku, auditivnu i izvanjsku ili društvenu povratnu spregu. Kratko cemo opisati dvanaest vrsta povratnih sprega navedenih u modelu govorne proizvodnje (Slika 1). 1. Obavijesna povratna sprega. Govornik provjerava je li obavijest oblikovana u preverbalnom obliku upravo ono što je bila njegova namjera, je li obojenost obavijesti adekvatna njegovim stavovima, emocijama i je li komunikacijski primjerena s obzirom na sugovornika i cjelokupnu govornu situaciju uključu-juci uvjete u komunikacijskom kanalu. 2. Leksička povratna sprega. Govornik kontrolira je li izbor lema iz mentalnog leksikona adekvatan konceptualnoj strukturi preverbalne obavijesti. 3. Morfološka povratna sprega. Govornik provjerava jesu li adekvatno otvore-ni i popunjeni morfološki prozori te jesu li u skladu sa sintaktičkom struk-turom. 4. Sintaktička povratna sprega. Govornik provjerava jesu li adekvatno otvoreni i popunjeni sintaktički prozori. 5. Fonemska povratna sprega. Govornik kontrolira adekvatnost odabira i redo-slijeda fonemskog sastava riječi. 6. Prozodijska povratna sprega. Govornik kontrolira adekvatnost ostvarivanja prozodijskih komponenata tona, intenziteta i trajanja. 7. Fonetsko-vremenska povratna sprega. Fonetski isplanirani izričaj pripre-mljen je u medumemoriji i njegovi elementi čekaju na ugradnju u vremenski linearni izričaj. Na toj se razini kontrolira redoslijed ugradivanja pojedinih elemenata i njihove vremenske dimenzije. 8. Motoričko-programska povratna sprega. Govornik kontrolira izbor adekva-tnoga motoričkog programa koji ce fonemski plan realizirati. Najvjerojatnije se vec na toj razini ugraduju asimilacijska pravila i diskretne jedinice jezične razine dobivaju karakteristike parametrijskih govornih jedinica. 9. Eferentna povratna sprega. Govornik kontrolira adekvatnost motoričkih na-redbi. 10. Tjelesno-osjetilna povratna sprega. Različiti senzorički modaliteti (taktilni, kinestetski, vibrotaktilni, toplinski, somastetski) putem direktivnih povratnih sprega kontroliraju preciznost pokreta i njegovu adekvatnost. 11. Slušna povratna sprega. Realiziran govor u govornom zvuku govornik sluša i kontrolira njegovu adekvatnost. 12. Povratna sprega komunikacijskog učinka. Govornik promatra komunikacijski učinak svog govora i na temelju verbalnih ili neverbalnih reakcija sugo-vornika kontrolira i ako je potrebno, popravlja svoj izričaj. Na temelju funkcioniranja povratnih sprega govornik može korigirati svoje po-greške, i to: a) ili u času kada su one učinjene na razini planiranja i prije izvedbe, pa su to sakrivena ispravljanja i moguce ih je registirati, b) ili introspekcijskom analizom samoga govornika, c) ili različitim oblicima disfluentnosti koje mogu biti znak angažiranosti govornika na ispravljanju pogrešaka. Ako je pogreška napravljena u izvedbi, onda su i ona i ispravljanje otkriveno i moguce ih je i zabilježiti i registirati. Mnogostrukost povratnih sprega omogucuje i osigurava efikasnost govorne komunikacije i ako je potrebno, ispravljanje i preciziranje govorne obavijesti. Takav je pristup modeliranju govorne proizvodnje modularan jer su svaka razina i pojedini procesori na svakoj razini zamišljeni kao moduli, gdje svaki modul ima svoj procesorski zadatak i relativno je samostalan u odnosu na druge module. Druge vrste modela govorne proizvodnje zasnivaju se na teorijama aktivacijskog širenja, gdje se proizvodnja govora prikazuje kao umreženi sustav jedinica različitih razina koje se uključuju u proizvodnju govora ovisno o stupnju njihove aktivacije (Stemberger 1985; Dell 1986). Mreža je zamišljena kao niz razina na kojima su jedinice pojedine razine predstavljene kao čvorovi povezani asocijativnim vezama s drugim jedinicama iste razine i ona jedinica koja je maksimalno aktivirana širi svoju aktivaciju na sljedecu razinu (Slika 2). Da bi mehanizam širenja aktivacije učinkovito funkcionirao, mora biti uskladen tako da pravodobno aktivira potrebnu jedinicu i da inhibira druge jedinice te da pravodobno prenese aktivaciju na sljedecu jedinicu i inhibira aktivaciju realizirane jedinice. Pogreške u govornoj proizvodnji tumače se neakdekvatnom aktivacijom potrebnih jedinica i neadekavatnom inhibicijom realiziranih jedinica. kosa Slika 2: Stembergerov interaktivni aktivacijski model (Erdeljac 2009: 192). I aktivacijski model na neki je način hijerarhijski i uključuje nekoliko razina aktivacije. Ako je u izričaj potrebno ugraditi leksem kosa, on se na toj jezičnoj razini mora aktivirati, i to intenzivnije od drugih leksema koji su s njim povezani različitim asocijacijskim vezama, bilo semantičkim bilo jezičnim. Tako ce kosa biti aktivirana intenzivnije od drugih mogucih kandidata: kože, dlaka, kosti, nosa. Nakon toga valja se spustiti na razinu fonemskog izbora i adekvatnim intenzitetom i redoslije-dom aktivirati foneme /k/, /o/, /s/ i /a/. U ovom modelu moguce je zamisliti još jednu razinu razlikovnih obilježja koja konstituira pojedine foneme, pa tako za fonem /k/ valja aktivirati obilježje kompaktan, bezvučan, prekidan i sl. Neadekvatna aktivacija na pojedinoj razini može dovesti do pogreške. Ako se to dogodi na leksičkoj razini, govornik ce umjesto kosa reci dlaka, na fonološkoj ce razini umjesto kosa, reci rosa, a na razini obilježja reci ce gosa. Dakako, pogreška na jednoj razini povlači za so-bom i pogreške na sljedecim razinama te ima utjecaja na konačni rezultat govorne proizvodnje. 2 Govorna (dis)fluentnost Govornik nastoji proizvesti idealan govor. Medutim, buduci da čovjek zbog svoje biološke, psihološke i društvene odredenosti nije idealan, on ne može biti ni idealan govornik. Jedna od manifestacija te činjenice jesu disfluentnosti u govoru. Disfluentnosti su prekidi glatkog govora koji ništa ne pridonose obavijesnom sadržaju izričaja u odnosu na njegovu planiranu informativnost. One medutim nose drugačiju vrstu informacije. Naime, one ukazuju na poteškoce koje govornik ima u govornoj proizvodnji, pa se iz njih mogu iščitavati informacije o govornoj vještini govornika ili o njegovu trenutačnom intelektualnom ili emocionalnom statusu. Buduci da je proizvodnja govora vremenski kontinuiran proces (Horga 2008), može se pretpostaviti da govornik rasporeduje vrijeme tako da se izmje-njuju vremenski odsječci u kojima on planira konceptualnu (obavijesnu), jezičnu i izgovornu strukturu željenog iskaza s odsječcima realizacije planiranoga. Stoga je oblikovanje obavijesti zapravo proces njezina kontinuiranog gradenja. Kao što smo vidjeli na slici 1, govornik nizom povratnih sprega kontinuirano nadzire svoju proizvodnju i ispravlja eventualne pogreške koje su u tako složenom procesu lako moguce (Horga 2008). Prema tome, poteškoce se mogu pojaviti tijekom jednog i drugog procesa. Kako govornik mora efikasno rasporediti svoju pažnju i kontro-lu izmedu planiranja i izvedbe, poteškoce mogu nastati i zbog neuskladenosti tih dviju komponenata. Fluentnost je gladak govor osloboden nepotrebnih prekida. Filmore (1979) navodi četiri karakteristike fluentnosti. Prva se odnosi na fluentnog govornika - to je osoba koja može dugo govoriti s malo stanki i zastajkivanja. Druga se karakteristika odnosi na fluentni govor - on je koherentan, argumentativan i semantički bogat. Kao trecu karakteristiku navodi mogucnost govornika da govori u velikom rasponu konteksta i tema te kao četvrtu da je njegov govor kreativan i imaginativan. Manifestno i opisno Škarič (1984: 15) je odredio fluentnost na ovaj način: «neki govornici mogu glatko, bez zastajkivanja, pogrešaka i popravljanja izvoditi govorne vratolomije dugih izri-čaja složene jezične i izgovorne strukture, dok se drugi spotiču vec pri izgovaranju jednostavnih kratkih govornih nizova». Sa stajališta govorne proizvodnje fluentnost možemo definirati s obzirom na dvije osnovne vrste modela kojima se govorna proizvodnja tumači. S modularnog stajališta fluentni se govor definira kao govor prirodnog tempa bez oklijevanja, za- stajkivanja, ponavljanja, ispravljanja, poštapalica te punih i praznih stanki procesiranja, primjeren informacijskom i komunikacijskom opterecenju izričaja, što sve pretpostavlja učinkovito i uskladeno funkcioniranje svih razina govorne proizvodnje. Prema modelu aktivacijskog širenja fluentni govor pretpostavlja pravovremenu i intenzitetski adekvatnu aktivaciju aktualnih i buducih jedinica govorne proizvodnje; isto tako pravovremenu i adekvatnu deaktivaciju upotrijebljenih jedinica te inhibiciju nepotrebnih jedinica govorne proizvodnje. Proučavanja govorne (dis)fluentnosti za lingvistiku su zanimljiva zbog nekoliko razloga. Ona ukazuju na razlike izmedu korektno oblikovanih izričaja u skladu s pra-vilima nekog jezičnog sustava koje bi proizveo idealan govornik i stvarno proizvedenih izričaja u živoj govornoj komunikaciji. Kroz to se otkrivaju mehanizmi govorne proizvodnje i organizacija jezičnih, pa i drugih kognitivnih znanja u mentalnom sklopu govornika. Ona su takoder zanimljiva jer otkrivaju mentalno, intelektualno i emocionalno stanje govornika i mogu biti regulatori razgovornog tijeka. Konačno proučavanje disfluentnosti zanimljivo je i sa stajališta govorne komunikacije s računalom i strojnog prevodenja govora jer se postavlja pitanje kako računalo interpretira nesavršen govor opterecen disfluentnostima. Osvrnimo se na neka od dosadašnjih istraživanja govorne (dis)fluentnosti. Ona se krecu u traženju odgovora na dva pitanja. Jedno je pitanje jesu li disfluentnosti samo znakovi poteškoca neidealnog govornika u jezičnoj proizvodnji ili one nose i druge obavijesti. Drugo je pitanje uvjeta u kojima se govornici razlikuju po stupnju disfluentnosti svoga govora. Što se učestalosti odnosno broja disfluentnosti tiče, Fox Tree (1995) navodi da je ona, ako se izuzmu prazne stanke, 6 riječi na 100 riječi. Horga (1994) je ustanovio da se u govoru u elektroničkim medijima (formalnom - prvi program HTV i neformalnom - lokalni radijski program) disfluentnosti pojavljuju svakih 8 sekundi u formalnom, odnosno svakih 7 sekundi u neformalnom mediju. Različita su istraživanja pokazala da je učestalost disfluentnosti veca kada je informacijsko opterecenje izričaja složenije. Tako ce se disfluentnosti češce pojavljivati u du-ljim izričajima i na početku izričaja (Oviatt 1995, Shriberg 1996) ili na početku diskursnog odlomka (Horga 1996). Pod isti se nazivnik mogu staviti i podaci da govornici kada govore o raznolikim temama koje omogucuju različit varijabilitet u formuliranju izričaja, ostvaruju različitu učestalost nefomenatiziranih segme-nata. Najveca je onda kada govore o humanističkim temama, manja kada govore o društvenim, a najmanja kada je riječ o prirodoznastvenim temama. (Schachter et al. 1994). Jedna je od funkcija disfluentnosti regulacija komunikacijskog procesa koja može pomoci sugovornicima bolje uskladiti komunikacijski proces. Ona takoder ukazuje na želju govornika da zadrži riječ i/ili potiče slušatelja da pomogne govorniku u izgradnji izričaja ako je ovaj zastao. Disfluentnosti mogu ukazivati na stupanj sigurnosti govornika u odgovoru na pitanje. Istraživanja su pokazala da i medij u kojem se odvija govor može utjecati na učestalost disfluentnosti, pa tako govornici u tele-fonskom razgovoru rade više disfluentnosti nego u razgovoru oči u oči. Broj disfluentnosti povečava se takoder ako govornici nemaju mogucnosti gestikuliranja. Oviatt (1995) je pokazala da je učestalost disfluentnosti u razgovoru veca nego u monološ- kom govoru (5.50 do 8.83 na 100 riječi u razgovoru u odnosu na 3.60 u monološkom govoru). Taj se broj smanjuje ako se govornik obrača stroju, npr. računalu; tada je naime broj disfluentnosti svega 0.78 do 1.87 na 100 riječi. Prisnost izmedu sugovornika takoder može biti čimbenik koji utječe na učestalost disfluentnosti. Razgovor s nepoznatom osobom opterečen je stanovitim stupnjem anksioznosti, pa to može biti razlog večeg broja disfluentnosti (Mahl 1987). S druge strane u razgovoru s poznatom osobom može se pojaviti veči broj disfluentnosti koje imaju funkciju reguliranja komunikacijskog procesa. Istraživanje Bortfelda et al. (2001) nije potvrdilo te postavke. Nadalje, večina istraživanja pokazala je da stariji ispitanici proizvode više disfluentnosti nego mladi osobito zbog prizivanja riječi iako je sintaktička struktura njihovih izričaja složenija nego u mladih govornika. Što se spolne razlike tiče, Schiberg (1996) je pokazala da muškarci upotrebljavaju više nefonematiziranih segmenata nego žene iako se u učestalosti drugih vrsta disfluentnosti ne razlikuju. Bortfel et al. (2001) opet nisu potvrdili tu razliku. Oomen i Postma (2001) promatrali su na koji se način u proizvodnji govora po-našaju govornici kada su pod vremenskim pritiskom i kada moraju ubrzati tempo govora. Ispitivanje je pokazalo da se u tom slučaju povečava broj pogrešaka na razini formulatora, što je u skladu s opčim principom da se uz povečanje brzine smanjuje točnost i pravilnost na raznim razinama govorne proizvodnje. Takoder se povečava broj ispravljanja pogrešaka, kao i broj ponavljanja, dok broj punih stanki ostaje približno jednak. No, zanimljivo je da je i ispravljanje pogrešaka brže, i to što se tiče vremena i što se tiče broja slogova nakon kojeg se pogreška ispravlja, pa to ukazuje na sposobnost «monitora» da još u predartikulacijskoj fazi govorne proizvodnje ot-krije pogrešku. Na korpusu engleskog jezika Clark i Fox Tree (2002) promatrali su uporabu punih stanki (nefonematiziranih segmenata) uh i um. Prihvačajuči stajalište da govornici oblikuju informacije simultano kroz dva kanala - jedan glavni, primarni koji se odnosi na temu diskursa i drugi kolateralni, sekundarni koji se odnosi na samu izvedbu, njezinu vremensku organizaciju, oklijevanja, pogreške, preoblikovanja, iskazivanje namjere govoriti i sl. U tu skupinu kolateralnih znakova spadaju i uh i um (u britanskoj ortografiji za razliku od američke obično pisani er i um) koji se najčešče povezuju s problemima planiranja u govornoj proizvodnji. Na temelju analize fonoloških, morfoloških, sintaktičkih i pragmatičkih karakteristika uporabe ovih segmenata autori zaključuju da su oni čestice i da se mogu interpretirati kao svaka druga leksička jedinica u jeziku. Nadalje, zaključuju da govornici proizvode uh i um kao i druge riječi kojima komentiraju svoju govornu izvedbu, tako da uh znači da ono što slijedi bit če kratko, manje odlaganje, a kad upotrijebe um znači da slijedi dulje odlaganje nečega što je važnije. Brennan i Schober (2001) postavili su pitanje na koji se način slušatelji nose s disfluentnim govorom jer on kontinuirano pred slušatelja postavlja probleme razu-mijevanja obavijesti koju nosi. U nekoliko eksperimenata u kojima se promatrala brzina i točnost odgovora slušatelja na disfluentan i fluentan govor pokazali su da su reakcije bile bolje (brže, točnije) na disfluentan govor. To su protumačili sposobnošču slušatelja da u fonetskom obliku disfluentnosti anticipiraju ono što slijedi u govornom nizu. Horga i Požgaj Hadži (2005) promatrali su na koji način slušatelji iz spontanog govora izvlače relevantne obavijesti, odbacuju disfluentnosti i pretvaraju ga u svojoj percepciji u jezično korektan oblik. Na današnjem stupnju razvoja govorne tehnologije pitanje prepoznavanja čitanog teksta relativno je dobro riješeno. Medutim, prepoznavanje spontanog govora mnogo je problematičnije, pa je to goruca tema automatskog prepoznavanja govora bilo da se radi o telefonskim uslugama, transkribiranju televizijskih emisija ili sastanaka i sl. Jedan od razloga teškoca jesu disfluentnosti kojima se prekida prirodni rečenični niz, pa se tako npr. kod prekida riječi stvaraju jedinice koje sliče riječima, ali nisu predstavljene u sustavu koji prepoznaje govor. Tako je broj pogrešno prepoznatih riječi za diktirani govor 5%, za televizijske vijesti 15% a za sastanke 40%. Stouten et al. (2006) su u procesor za prepoznavanje spontanog govora ugradili podatke o pojavljivanju punih stanki, ponavljanju riječi i ponovnom započinjanju rečenica kao elemenata disfluentnosti iz govornih korpusa za engleski i holandski jezik i dobili stanovito poboljšanje u automatskom prepoznavanju govora. 3 Istraživanje fluentnosti u radijskom govoru 3.1 Cilj, hipoteza i metoda U ovom je istraživanju postavljeno pitanje razlikuje li se fluentnost govora u javnim i komercijalnim medijima s obzirom na činjencu da su različitog stupnja formalnosti, odnosno spontanosti. Pretpostavlja se da ce stupanj formalnosti/ležernosti emisija djelovati na stupanj kontrole govorne proizvodnje, a time i na učestalost, trajanje i strukturu disfluetnosti. Analiziran je govor 5 govornika (4 muškarca i 1 žena) u svakom od medija (uku-pno 10 govornika) iz razgovornih emisija (intervjua) Prvog programa Radio Zagreba kao ispitanika koje predstavljaju javni medij i Studentskog radija kao predstavnika komercijalnih medija. Analiziran je govor samo gostiju emisija, a ne voditelja. Govorni su uzorak činile po 2 minute govora svakoga ispitanika, odnosno po 10 minuta govora za svaki medij. Na Prvom su programu teme emisija bile: izbori, održavanje cesta, književnost, a na Studentskom radiju: placanje studija, skup o bioetici, izbori za studentski zbor, direktna demokracija, izbor studija. Govorni uzorak Prvog programa radio Zagreba nazvan je formalnim, a uzorak Studentskog radija neformalnim. Govorni je uzorak transkribiran tako da je dvoje fonetičara označilo ona mjesta koja su procijenili kao disfluentnosti. Transkribiranje je učinjeno u programu za akustičku analizu govora, što je omogucilo višestruko preslušavanje onih mjesta u govoru za koja procjenjivači nisu mogli odmah odrediti radi li se o disfluentnosti ili ne. Izdvojene su ove disfluentnosti: • nefonematizirani segment (Pa tako i ove godine smo hm napravili velike investicije...) • prazna stanka (... na toj razini || je trebalo...) • poštapalica (... došla ovaj na jedan razgovor i ovaj nakon toga zaista dobila posao. ) • duljenje glasnika: početnog, medijalnog ili završnog (... najkasnije do predaje: svake izborne liste: Državnom izbornompovjerenstvu...) • ponavljanje (i nisu, nisupreviše nisu previšeprigovarali...) • pogrešan glasnik (... najčešce se n to namirenje vrši.) • pogrešna riječ (.. dakle ja bi prvo imala išla uzet knjige... • pogrešna sintagma (Zato mi nije teško prilagoditi se. Selili smo || Krenula sam u prvi razred. ) . • složene disfluentnosti (...školu nisam baš volila ali ovaj hm jako sam volila ležat u krevetu i čitat. ) • izdah • udah. Pomocu transkribiranoga teksta u programu CoolEditu mjerili smo trajanje fluen-tnih i disfluentnih dijelova govora, što prikazuje Slika 3. Slika 3: Primjer mjerenja trajanja disfluentnosti. Legenda: f - fluentni dio izričaja, df - duljenje glasnika, hm - puna stanka, grg - greška, po - poštapa-lica, pon - ponavljanje, s - stanka, grs - greška sintagme. Nakon toga izračunata je osnovna statistika, a značajnosti razlika izmedu pojedinih mjera provjerene su t-testom i Hi-kvadrat testom. 4 Rezultati i rasprava 4.1 Broj disfluetnosti Fluentnost u ova dva medija usporedena je na nekoliko razina: broj, trajanje i struktura (dis)fluentnosti. Najprije je usporeden broj disfluentnih i fluentnih odsje-čaka u formalnom i neformalnom govornom uzorku. Rezultati su prikazani na grafikonu 1. neformalni tafmalili Grafikon 1: Broj disfluentnih i fluentnih odsječaka u formalnom i neformalnom govornom uzorku. Buduci da su oba govorna uzorka, formalni i neformalni, jednako trajala (10 minuta) moguce ih je usporediti s obzirom na učestalost prekidanja govora različitim oblicima disfluentnosti. Ova je analiza pokazala da je ukupan broj odsječaka (fluentnih i disfluentnih) u neformalnom uzorku statistički značajno (x2 = 0,00) veci (60,55% naprama 39,45%) nego u formalnom, tj. fluentni se odsječci češce prekidaju različitim oblicima disfluentnosti. Toj razlici osobito pridonosi veci broj kombiniranih disfluentnosti u neformalnom govoru (21,21% naprama 5,69%), a nešto manji broj fluentnih dijelova (22,63% naprama 18,13%) i drugih oblika disfluentnosti (16,71% naprama 15,64%). 4.2 Trajanje fluentnih i (lislluetnih dijelova uzoraka Na grafikonu 2 prikazan je postotak trajanja fluentnih i disfluentnih dijelova govornih uzoraka. U neformalnom uzorku od ukupnog vremena govornici su trošili 26% vremena na disfluentne dijelove govora dok su fluentni dijelovi činili 74% vremena. U formalnom uzorku taj je omjer bio 11,5% naprama 88,5%. I ovdje se vidi da je od ukupnog duljeg trajanja disfluentnih dijelova govora u neformalnom uzorku i njihova struktura različita, tj. da u neformalnom uzorku kombinirane disfluentnosti opet zauzimaju značajno veci postotak vremena 16,06% naprama 3,49% u odnosu na formalni uzorak, dok je razlika u jednostavnim disfluentnostima znatno manja i iznosi 9,94% naprama 7,97%. Grafikon 2: Postotak trajanja fluentnih i disfluentnih dijelova govora u formalnom i neformalnom uzorku. Razlika je izmedu formalnog i neformalnog uzorka ne samo u tome koliko se vremena troši na fluentne i disfluentne dijelove govora nego i u prosječnom trajanju pojedinih dijelova. Rezultati su prikazani na grafikonu 3. Tako u formalnom uzorku fluentni dijelovi prosječno traju 3718 ms, a u neformalnom svega 1919 ms. I t-test je pokazao da je ta razlika statistički značajna (p = 0,00). Medutim, prosječno trajanje nefluentnih dijelova, kako jednostavnih tako i složenih, ne razlikuje se prema rezultatima t-testa statistički značajno (p = 0,34 za jednostavne i p = 0,51 za kombinirane disfluentnosti), iako je ono nešto dulje u formalnom govoru 352 ms naprama 388 ms za jednostavne i 444 ms naprama 468 ms u odnosu na neformalni govor (Tablica 1). Drugim riječima govornici u formalnom uzorku učinkovitije ko-riste vrijeme u kojem zastajkuju i nakon toga uspijevaju procesirati dulje segmente fluentnog govora. 4000 3500 3000 2SOO 2000 1SM 1000 500 g risf&rmalrii formalni Grafikon 3: Prosječno trajanje fluentnih i nefluentnih dijelova govora u formal-nom i neformalnom uzorku. flu disflu disflu-komb neformalni 1919 352 444 formalni 3718 388 468 p 0,00 0,34 0,51 Tablica 1: Prosječno trajanje fluentnih i nefluentnih dijelova govora u formalnom i neformalnom uzorku i rezultati t-testa (p). 4.3 Struktura disfluentnosti promatranih uzoraka Struktura disfluentnosti u promatranim uzorcima prikazana je u tablici 2. Dva se uzorka statistički značajno razlikuju na razini p<0,00. Toj razlici najviše prido-nosi relativno češca uporaba praznih stanki i poštapalica u neformalnom uzorku nego u formalnom, kao i nešto češca uporaba nefonematiziranog segmenta i gla-sovnog duljenja te pogrešnog izbora riječi i sintagmi u formalnom uzorku nego u neformalnom. Pogrešan izbor riječi i sintagmi u formalnom uzorku upravo je izraz vece kontrole govorne proizvodnje i traženja preciznoga izraza na konceptualnoj razini. NEFORMALNI FORMALNI broj postotak broj postotak nefonematizirani segment 112 35,11% 76 42,22% prazna stanka 93 29,15% 30 16,67% poštapalica 31 9,72% 5 2,78% duljenje glasnika 43 13,48% 30 16,67% ponavljanje 24 7,52% 14 7,78% pogreška glasnika 4 1,25% 4 2,22% pogreška riječi 6 1,88% 9 5,00% pogreška sintagme 5 1,57% 8 4,44% izdah 1 0,31% 2 1,11% udah 0 0,00% 2 1,11% Tablica 2: Struktura disfluentnosti promatranih uzoraka. Promatrana je i razlika u strukturi duljenja glasovnih segmenata (grafikon 4 i tablica 3) te je ustanovljeno da i tu postoji statistički značajna razlika (p<0,00). Iako govornici u oba uzorka češce dulje finalni nego inicijalni glasnik, govornici u neformalnom uzorku to čine u omjeru 93,02% naprama 6,98%, a govornici u formalnom uzorku u omjeru 60,00% naprama 36,7% . Medijalni se glasnik dulji vrlo rijetko, i to samo u formalnom uzorku u postotku od 3,33%. 100% 80% 60% 40% 20% 0% 93,02% eo,oo% 36.67% Epočclno ■ s rediirtje D iS vri no 6.96% 3,33% neformsini formalni Grafikon 4: Struktura duljenja glasovnih segmenata u formalnom i neformalnom uzorku. NEFORMALNI FORMALNI broj postotak broj postotak završno 40 93,02% 18 60,00% središnje 0 0,00% 1 3,33% početno 3 6,98% 11 36,67% ukupno 43 100,00% 30 100,00% Tablica 3: Struktura duljenja glasovnih segmenata u formalnom i neformalnom uzorku. Kao što vidimo iz tablice 3, od ukupno 73 duljenja glasnika u oba uzorka disflu-entnost se više dulji u neformalnom stilu (43 duljenja ili 58,90%) nego u formalnom stilu (30 duljenja ili 41,10%). 5. Zaključak Može se zaključiti da se formalni i neformalni radijski medij razlikuju ne samo po broju disfluentnosti i trajanju fluentnih i disfluentnih dijelova, vec i po strukturi disfluentnosti. U javnom (formalnom) mediju od govornika se, zbog njegove vece profesionalnosti, očekuje veci stupanj pripremljenosti u smislu poznavanja materije o kojoj govori, kao i vjerojatnost da je o toj temi vec govorio u raznim prigodama. S druge strane, zbog karaktera samog medija, takoder se očekuje veci stupanj kontrole govora, a time i njegove formalnosti. Sve to vodi prema manjem broju disfluentnosti u govoru javnog medija. Obrnuta je situacija u neformalnom govoru komercijalnog radija, gdje se može očekivati manji stupanj profesionalne vrsnosti govornika i blaže zahtjeve samog medija. Mjere (dis)fluentnosti koje su primijenjene u ovom istraži- vanju potvrdile su da postoje značajne razlike izmedu govora u dvama promatranim radijskim programima. Može se pretpostaviti da su one uzrokovane različitim za-htjevima za formalnošcu govora u tim dvama radijskim medijima, a time i različitim stupnjem njegove kontroliranosti. Zato se difluentnosti u neformalnom govoru pojav-ljuju češce nego u formalnom. Disfluentni prekidi govora pokazuju koliko je proces njegove proizvodnje složen. Valja uzeti u obzir i činjenicu da su to samo izvanjski, površinski prekidi govora i da osim njih nedvojbeno postoje sakrivena unutrašnja lutanja, traženja i nalaženja rješenja koja govornik uspijeva riješiti prije nego izvede i realizira odredeni pogrešno planirani izričaj. Daljnja ce se istraživanja razvojem tehnike mozgovnog oslikavanja usmjeravati prema što podrobnijem otkrivanju neurolingvističkih mehanizama koji su u podlozi disfluentnosti i govornih pogrešaka u proizvodnji govora. Medutim, ostaje otvoren prostor i za bihevioralna istraživanja disfluentnosti i njihova odnosa s proizvodnjom govora u različitim kontekstualnim uvjetima i s obzirom na različite karakteristike govornika. Izvori i literatura Gloria J. Borden i Kathrin S. Harris, 1980: Speech science premier. London: Williams &Wilkins. Heather Bortfeld et al., 2001: Disfluency rates in conversation: Effects of age, relationship, topic, role, and gender. Language and speech 44/2. 123-147. Susan E. Bernnani i Michael F. Schoeber , 2001: How listeners compensate for disflu-encies in spontaneous speech. Journal of memory and language 44. 274-296. Herbert H. Clark i Jean E. Fox Tree, 2002: Usinh uh and um in spontaneous speaking. Cognition 84/1. 73-111. Garry S. Dell , 1986: A spreading activation theory of retrival in sentence production. Psychological review 93. 383-321. Vlasta Erdeljac, 2009: Mentalni leksikon: modeli i činjenice. Zagreb: Ibis. Charles J. Fillmore, 1979: On fluency. Charles J. Filmoore: Individual differences in language ability and language behavior. New York: Academic Press Inc. 85-102. Jean E. Fox Tree , 1995: The effects of fals starts and repetitions on the processing of subsequent words in spontaneous speech. Journal of memory and language 34. 709-738. Merrill F. Garret, 1976: Syntactic processes in sentence production. New approches to language mechanisms. Ur. R. J. Wales, W. Edward. Amsterdam: North Holland. 231-256. Herbert Paul Grice, 1975. Logic and conversation. Sintax and semantics 3. Ur. P. Cole, J. L. Morgan. New York: Seminar Press. 113-128. Damir Horga , 1994: Tečnost govora u elektroničkim medijima. Govor 12/2. 15-22. --, 1996: Obrada fonetskih obavijesti. Zagreb: Hrvatsko filološko društvo. --, 2008. Repetitions in interrupted speech production. Beszedkutatas 2008: Sokszinu Beszedtudomany. Ur. M. Gosy. Budapest: MTA Nyelvtudomanyi Intezete. Damir Horga i Vesna Požgaj Hadži 2005. Slušateljeva redakcija govornika. Seman-tika prirodnog jezika i metajezik semantike. Ur. J. Granic. Zagreb; Split: HDPL. 301-310. Jeri J. Jaeger , 2005: Kids' slips: What young children's slips of the tongue reveal about language development. Mahwah; New York: Lawrenc Erlbaum Associates Publishers. Williem J. M. Levelt, 1995: Speaking: from intention to articulation. Cambridge; Massachusetts; London: MIT Press. Williem J. M. Levelt et al., 1999: A theory of lexical access and speech production. Behavioral and brain science 22. 1-75. George F. Mahl, 1987: Exploration in nonverbal and vocal behavior. Hillsdale; New York: Lawrence Erlbaum Associates. Claudy C. E Oomen i Albert Postma , 2001: Effects of time pressure on mechanisms of speech production and self-monitoring. Journal of psycholinguistic research 30/2. 163-183. Sharon Oviatt, 1995: Predicting spoken disfluencies during human computer interaction. Computer speech and language 9. 19-35. Albert Postma , 2000: Detection of errors during speech production: review of speech monitoring models. Cognition 77. 97-131. Stanley Schachter et al., 1994: The vocabularies of acadenia. Psychological science 5. 37-41. John. R. Searle, 1969: Speech acts. London: Cambridge University Press. Elizabeth Shriberg, 1996: Disfluencies in Switchboard. International conference on spoken language processing (OCSLP '96). Addendum, 11-14. Philadelphia, PA, 3 -6 October. Joseph P. Stemberger, 1985. An interactive activation model of language production. Progress in the psychology of language. Ur. A. W. Ellis. London: Erlbaum. 143-186. Frederic Stouten et al., 2006: Coping with disfluencies in spontaneous speech reco-gnitio: Acoustic detection and linguistic context manipulation. Speech communication 48. 1590-1606. Ivo Škarič, 1984. Mjerenje govora. Izbor i priprema kandidata za novinare, spikere i voditelje. Ur. M. Meštrovic. Zagreb: Televizija Zagreb. 12-30. --, 1991. Fonetika hrvatskoga književnog jezika. Povijesni pregled, glasovi i oblici hrvatskoga književnog jezika. Ur. R. Katičic. Zagreb: HAZU, Globus, Nakladni zavod. Summary Speech production, from communicative intent to speech sound, is a hierarchically organized process of transformation in which information moves from one level to the next, switching codes and/or material form of signal, which is specific to a certain degree. The complexity of speech production is explained by various models: Jaeger's (2005) Model of Representational and Processor Components, Levelt's (1989) Modular Model and Stemberg's (1985) Interactive Activation Model. Twelve types of feedback in speech production model are described: informative, lexical, morphological, syntactic, phonemic, prosodic, phonetic-temporal, motor-programming, efferent, bodily-sensory, auditory, and communicative effect feedback. Using these types of feedback, the speaker continually monitors his/her speech production and corrects the potential errors, which are likely to occur in such a complex process. When not all levels of speech production work efficiently and in harmony, interruptions in speech, i.e. dysfluencies, occur. They can indicate difficulties that the nonideal speaker has in speech production, but they can also provide other information. Following a review of (dys)fluency studies by various authors, we presentthe results of our research of fluency in radio speech. Based on a 10-minute sample of 10 speakers from talk shows (5 in public media shows and 5 in commercial media shows), we analyze types of dysfluencies and their distribution and look at how the type of show affects the occurrence of dysfluency. (Dys)fluency is contrasted onseveral levels: the number and length of dysfluent and fluent segments in formal and informal speech and the structure of dysfluency in the observed samples (unfilled pauses, non-phonemic segment, lengthening of sounds, repetition, correction, bywords, etc.). The results show that formal and informal radio media differ not only in the number of dysfluencies and the length of fluent and dysfluent segments, but also in the structure of dysfluency. Dysfluency is less present in public speech media because of the character of the media, greater speech control and better preparedness, and it is more present in informal speech. The results also point to the complexity of speech production and call for further (dys)fluency research.