UNIVERZA V LJUBLJANI Fakulteta za elektrotehniko Melita Hajdinjak VODENJE DIALOGA MED ČLOVEKOM IN RAČUNALNIKOM V NARAVNEM JEZIKU Magistrsko delo Mentor: prof. dr. France Mihelič Ljubljana, 2004 Ključne besede: sistemi za dialog, sistemi za podajanje informacij, podatkovna zbirka, pomenska analiza, semantični okvir, eksperiment Čarovnik iz Oza, modul za tvorjenje naravnega jezika, enosmerna cevovodna struktura, Griceove maksime, Shnei-dermanova zlata pravila oblikovanja sistemov, modul za vodenje dialoga, tehnike modeliranja dialoga, tehnika končnih avtomatov, tehnika polnjenja predalčkov, tehnika množice domen, tehnika usmerjanja k cilju, tehnika razumskih agentov, konverzacijska teorija iger, konverzacijske igre, konverzacijske poteze, rekurzivne mreže prehodov, predstavitev znanja, modalna logika, intuicionistična logika, modalni operatorji, Krip-kejevi modeli, evalvacija modula za vodenje dialoga, ogrodje PARADISE, multipla linearna regresija i Zahvala Prva zahvala gre najboljšemu mentorju sploh, prof. dr. Francetu Miheliču, ki me je toplo sprejel v raziskovalno skupino Laboratorija za umetno zaznavanje, sisteme in kibernetiko, bdel nad mojim delom, se čudil neizgovorljivim izrazom in me kljub vsemu podpiral pri vseh mojih odločitvah. Hvala tudi vodji laboratorija, prof. dr. Nikoli Pavešiču, za številne prijazne in spodbudne besede, nenazadnje pa tudi za njegovo neustrašljivost in razigranost pri športnem udejstvovanju laboratorijske ekipe. Zahvalila bi se še doc. dr. Andreju Bauerju, katerega dragoceni nasveti in opazke so bili pri pisanju tega dela nepogrešljivi. Prav posebna hvala 'sosedu' Janezu, ki je 'oživljal' mene in moj računalnik, ko naju je (enega zaradi izčrpanosti, drugega zaradi moje neumnosti) napadel virus. V času podiplomskega študija in raziskovalnega dela mi je poleg Janeza bil v izjemno podporo tudi Boštjan, ki je znatno prispeval k prijetnemu delovnemu vzdušju. Hvala Boštjan! Hvala tudi Simonu, nepogrešljivemu in edinemu pravemu 'električistu', ki mi je kljub obtoževanju, da živim samo od zraka in ljubezni (ali pa ravno zaradi tega), vselej rad priskočil na pomoč. Tisočkrat hvala tudi Ankici, katere prihoda sem se vselej razveselila, pa ne (samo) zaradi daril in mehiških kosil, temveč (tudi) zaradi njene dobrosrčnosti in pozitivne energije. (P)osebna zahvala pa gre mojemu Borisu ter Urški, Nevi, Simoni in bratu Dušanu, ki so (tako ali drugače) izkazali izjemen posluh, razumevanje in potrpežljivost, ne le za vse težave, s katerimi sem se srečevala, ampak tudi za moje prve (pol)maratonske podvige. Nenazadnje sem zahvalo dolžna tudi svojim staršem, ki so mi ves čas stali ob strani in me vzpodbujali pri delu. iii Povzetek Vsebina magistrskega dela temelji na razvoju modula za vodenje dialoga in na predstavitvi znanja v dvojezičnem sistemu za podajanje vremenskih informacij, ki ga razvijamo raziskovalci Laboratorija za umetno zaznavanje, sisteme in kibernetiko Fakultete za Elektrotehniko v Ljubljani ter raziskovalci Oddelka za računalništvo in informatiko Filozofske fakultete na Reki. Podali bomo pregled zgodovine nastanka in razvoja te najbolj razširjene oblike govornih vmesnikov, namreč sistemov za podajanje informacij, pri čemer uporabo govora upravičimo z njegovo naravnostjo, učinkovitostjo in fleksibilnostjo. Vir znanja nastajajočega sistema za podajanje informacij o vremenu in vremenskih napovedih predstavljajo spletne strani Hidrometeorološkega zavoda Agencije Republike Slovenije za okolje. Del podatkov, ki je na teh spletnih straneh podan v tekstovni obliki, s pomensko analizo pretvorimo v bolj pregledno tabelarno obliko. Zaradi časovno odvisne strukture teh vremenskih informacij, tabelarno obliko kasneje pretvorimo v množico svetov in v njih veljavnih izjav. Takšna predstavitev znanja, ki jo poimenujemo dialog mlPC Kripkejev model, omogoča sistemu, da uporabnika usmerja k izbiri relevantnih, dosegljivih delčkov informacij. Preden se lotimo gradnje modula za vodenje dialoga, ki je osrednji del vsakega sistema za dialog, s pomočjo eksperimenta Čarovnik iz Oza pridobimo zbirko podatkov, ki odraža jezik dialogov človek - računalnik. Po pregledu uveljavljenih tehnik modeliranja dialoga se odločimo za tehniko usmerjanja k cilju, ki jo delno formaliziramo s pomočjo konverzacijske teorije iger, podatke pa pridobivamo s polnjenjem predalčkov. V tem modelu je dialog sestavljen iz konverzacijskih iger in konverzacijskih potez, ki predstavljajo različne strategije in so udejanjene kot rekurzivne mreže prehodov. Da bi dosegli čim večjo kooperativnost in čim večjo neodvisnost od domene, množico konverzacijskih iger in potez, ki se pojavljajo v literaturi, ustrezno razširimo. Po dograditvi modula za vodenje dialoga, v namen evalvacije, ponovno izvedemo eksperiment Čarovnik iz Oza. Na tako pridobljenih podatkih uporabimo potencialno splošno metodologijo evalvacije sistemov za dialog, namreč ogrodje PARADISE, ki omogoča izpeljavo ocene učinkovitosti sistema kot uteženo linearno kombinacijo od domene odvisnih parametrov uspešnosti naloge in cen dialoga. Pri evalvaciji podatkov iz obeh eksperimentov Čarovnik iz Oza pridemo do zaključka, da lahko učinkovitost modula za vodenje dialoga opazno izboljšamo, če zagotovimo čim večjo fleksibilnost sistema pri iskanju dosegljivih, relevantnih podatkov. To fleksibilnost sicer v precejšnji meri že zagotovlja dialog mlPC Kripkejev model znanja, zaradi velikega vpliva na zadovoljstvo uporabnikov pa na koncu predlagamo še nekatere izboljšave. v Abstract The content of this thesis is based on the construction of the dialogue manager and the development of the knowledge representation in a bilingual spoken dialogue system for weather-information retrieval, which represents a joint project of the Laboratory of Artificial Perception, Systems, and Cybernetics of the Faculty of Electrical Engineering in Ljubljana and the Department of Information Science of the Faculty of Philosophy in Reka. We give a brief overview of the evolution of the most widely used type of speech interfaces, i.e. information-providing dialogue systems. The use of speech is justified by its naturalness, effectiveness, and flexibility. The knowledge source of the developing dialogue system for weather-information retrieval are the web pages of the Environmental Agency of the Republic of Slovenia. The textual part of this data is transformed into table data structure to ensure greater readability. Due to time-dependency of the data structure this data is further transformed into several sets of valid statements, each corresponding to one of the possible worlds. This knowledge representation, i.e. dialogue mlPC Kripke model, enables the system to direct the user to select relevant, available data. Before constructing the dialogue manager, which is the central module of any dialogue system, we conduct the Wizard-of-Oz experiment to collect dialogues that reflect the language of human-computer communication. Considering the most accepted dialogue-modeling techniques we decide to implement the goal-directed technique, which is partly formalized by using conversational game theory. The data, on the other hand, is acquired using the slot-filling approach. In this model, the dialogues consists of exchanges, called conversational games, which are analyzed as conversational moves and implemented as recursive transition networks. To achieve better cooperativity and a greater portability we expand the set of conversational games and conversational moves that have been used before. After completing the construction of the dialogue manager we once more conduct the Wizard-of-Oz experiment. A potential general methodology for evaluating spoken dialogue systems, i.e. the PARADISE framework, is used to derive a combined performance metric as a weighted linear combination of a task-based success measure and dialogue costs. The evaluation of data collected during the Wizard-of-Oz experiments leads to the conclusion that user satisfaction can be remarkably improved by assuring the system to be as flexible as possible in directing the user to select relevant, available data. Although, this flexibility is in no small measure supported by the non-traditional dialogue mlPC Kripke model, some additional improvements of this model are proposed. vii Kazalo Zahvala iii Povzetek v Abstract vii 1 Uvod 1 1.1 Motivacija.................................. 2 1.2 Sistemi za dialog.............................. 3 1.3 Zgodovina sistemov za podajanje informacij ............... 4 1.4 Razvoj dvojezičnega sistema za podajanje informacij o vremenu .... 5 2 Zbirka vremenskih podatkov 7 2.1 Vir podatkov ................................ 8 2.2 Zajemanje spletnih podatkov........................ 8 2.3 Pomenska analiza.............................. 12 2.4 Zbirka podatkovnih tabel.......................... 15 3 Eksperiment Čarovnik iz Oza 18 3.1 Zakaj eksperiment Čarovnik iz Oza.................... 19 3.2 Sistem Čarovnik iz Oza........................... 20 3.3 Prvi eksperiment Čarovnik iz Oza..................... 24 3.4 Drugi eksperiment Čarovnik iz Oza.................... 28 4 Oblikovanje in razvoj sistemov za dialog 31 4.1 Kdaj je sistem za dialog uporaben..................... 32 4.2 Vodila pri oblikovanju sistemov za dialog................. 33 4.3 Tehnike modeliranja dialoga........................ 35 5 Modeliranje dialoga z uporabo konverzacijske teorije iger 40 5.1 Konverzacijska teorija iger......................... 41 5.2 Modeliranje dialoga v sistemu za podajanje informacij o vremenu ... 44 6 Predstavitev znanja v sistemu za dialog 52 6.1 Modalna logika............................... 53 6.2 Intuicionistična modalna logika ...................... 58 6.3 Predstavitev vremenskih podatkov .................... 62 7 Evalvacija modula za vodenje dialoga 76 7.1 Ogrodje PARADISE............................ 77 7.2 Rezultati evalvacije dialogov iz prvega eksperimenta Čarovnik iz Oza . 80 7.3 Rezultati evalvacije dialogov iz drugega eksperimenta Čarovnik iz Oza . 84 8 Zaključek 87 8.1 Razširitev predstavitve znanja....................... 88 8.2 Nadaljnje delo................................ 90 Viri in literatura 92 Terminološki slovar 101 x Slike 1.1 Zgradba sistema za dialog......................... 4 1.2 Dvojezični sistem za podajanje informacij o vremenu.......... 6 2.1 Naraščanje števila različnih besed v zbirki Vremenska napoved in obeti za Slovenijo................................. 9 2.2 Naraščanje števila različnih besed v zbirki Vremenska napoved za gorski svet...................................... 9 2.3 Naraščanje števila različnih besed v zbirki Napoved za letalstvo..... 10 2.4 Naraščanje števila različnih besed v zbirki Napoved vodostajev..... 10 2.5 Naraščanje števila različnih besed v zbirki Snežne razmere....... 10 2.6 Model pomenskih analizatorjev vremenskih podatkov.......... 13 2.7 Primer podatkovne tabele, zgrajene s pomočjo analizatorja Vremenska napoved in obeti za Slovenijo........................ 16 2.8 Grafični vmesnik do zbirke podatkovnih tabel.............. 16 3.1 Grafični vmesnik sistema Čarovnik iz Oza - primer delovnega okna 1 . 22 3.2 Grafični vmesnik sistema Čarovnik iz Oza - primer delovnega okna 2 . 22 4.1 Preprost primer dialoga, modeliranega s končnim avtomatom...... 36 4.2 BDI model.................................. 38 5.1 Primer zemljevida, uporabljenega v spontanih, govorjenih dialogih človek - človek................................... 42 5.2 Konverzacijske igre, udejanjene v modulu za vodenje dialoga v sistemu za podajanje informacij o vremenu .................... 47 6.1 Hassejev diagram relacije biti manj specifičen med krajevnimi delčki informacij, ki se navezujejo na Slovenijo................... 65 xi 6.2 Hassejev diagram relacije biti manj specifičen med krajevnimi delčki informacij, ki se navezujejo na ostalo Evropo................ 65 6.3 Hassejev diagram relacije biti manj specifičen med časovnimi delčki informacij. Zaradi majhnega števila možnih dosegljivih časovnih trenutkov, so vzpostavljene vse povezave, zaradi česar relacija biti manj specifičen v tem primeru izgubi pomen, ki izvira iz imena.............. 66 6.4 Hassejev diagram relacije biti manj specifičen med podatkovnimi delčki informacij.................................. 66 7.1 Model učinkovitosti sistema za dialog, ki ga zajema ogrodje PARADISE 78 7.2 Primer kontingenčne tabele dialoga.................... 81 8.1 Hassejev diagram relacije biti manj specifičen (povezave črne barve) in relacije sosednosti (povezave sive barve) med krajevnimi delčki informacij, ki se navezujejo na Slovenijo...................... 88 8.2 Hassejev diagram relacije biti manj specifičen (povezave črne barve) in relacije sosednosti (povezave sive barve) med krajevnimi delčki informacij, ki se navezujejo na ostalo Evropo................... 89 8.3 Hassejev diagram relacije biti manj specifičen (povezave črne barve) in relacije sosednosti (povezave sive barve) med podatkovnimi delčki informacij ..................................... 89 xii Tabele 2.1 Primeri vnosov v slovar Vremenska napoved in obeti za Slovenijo .... 11 2.2 Rezultati testiranja pomenskega analizatorja Vremenska napoved in obeti za Slovenijo................................. 14 3.1 Primer tvorjenja povedi z modulom za tvorjenje naravnega jezika ... 23 3.2 Del vprašalnika, s katerim so udeleženci eksperimenta ocenjevali sistem Čarovnik iz Oza............................... 25 3.3 Povprečne ocene sistema Čarovnik iz Oza................. 25 3.4 Primer dialoga med uporabnikom in sistemom Čarovnik iz Oza..... 26 3.5 Zgradba SSSQ zbirke spontanega govora.................. 27 3.6 Rezultati analize dialogov, pridobljenih v prvem eksperimentu Čarovnik iz Oza.................................... 28 3.7 Povprečne ocene v drugem eksperimentu Čarovnik iz Oza........ 29 3.8 Zgradba SSSQ2 zbirke spontanega govora................. 29 3.9 Rezultati analize dialogov, pridobljenih v drugem eksperimentu Čarovnik iz Oza.................................... 30 5.1 Primer dialoga med uporabnikom (U) in sistemom za dialog (S) .... 48 6.1 Interpretacija modulnega operatorja 0 pri dani interpretaciji D..... 56 6.2 Pomen relacije R pri različnih interpretacijah izjave DA........ 57 7.1 Srednje vrednosti parametrov v prvem fWOZlj in v drugem (WOZ2J eksperimentu Čarovnik iz Oza....................... 82 7.2 Korelacijski koeficienti parametrov v prvem eksperimentu........ 83 7.3 Korelacijski koeficienti parametrov v drugem eksperimentu ....... 84 xiii Uvod 1.1 Motivacija 1.2 Sistemi za dialog 1.3 Zgodovina sistemov za podajanje informacij 1.4 Razvoj dvojezičnega sistema za podajanje informacij o vremenu V uvodnem poglavju bomo podali glavne motive razvoja govornih vmesnikov in opisali njihovo zgradbo. Nadaljevanje poglavja, kakor tudi celotnega magistrskega dela, bo namenjeno predvsem sistemom za podajanje informacij. Podali bomo pregled zgodovine nastanka in razvoja takšnih sistemov ter opisali dvojezični sistem za podajanje vremenskih informacij, ki ga razvijamo raziskovalci Laboratorija za umetno zaznavanje, sisteme in kibernetiko Fakultete za Elektrotehniko v Ljubljani ter raziskovalci Oddelka za računalništvo in informatiko Filozofske fakultete na Reki. Vsebina magistrskega dela temelji na razvoju modula za vodenje dialoga in na predstavitvi znanja v tem dvojezičnem sistemu za podajanje informacij. 1 1. Uvod 2 1.1 Motivacija Že pred nekaj desetletji se je med ljudmi pojavila želja, da bi s stroji komunicirali z govorom. Znanstvena fantastika daje številčen vir takšnih govornih vmesnikov, ki sega od izjemno inteligentnega in zelo komunikativnega računalnika HAL v Stanley Kubrickovem filmu 2001: A Space Odyssey (1968) do govorečega avta K.LT.T., ki je v nanizanki Knight Rider (1982-1986) Davidu Hasselhoffu pomagal pri boju proti zločinu. Po drugi strani pa komunikacija s stroji že dolgo predstavlja izziv tudi raziskovalcem na področju umetne inteligence. To zanimanje izvira iz znamenitega članka o testu računalniške inteligence [Turing-1950], ki gaje leta 1950 objavil Alan Turing. Ta test, kije trenutno znan pod imenom Turingov test, je v bistvu igra, v kateri se sodnik in dva agenta pogovarjata o poljubno izbrani temi, na podlagi katere mora sodnik presoditi, kateri izmed agentov je človek in kateri je računalnik. Osnovna ideja Turingovega testa je, da je vsak računalniški program, ki se ga po njegovem obnašanju med dialogom da zamenjati za človeka, inteligenten. Zanimiva je Turingova napoved, da bo večina računalnikov leta 2000 sposobna ta test uspešno prestati. Eden izmed prvih računalniških programov, ki je uspešno prestal Turingov test, je računalniški terapevt ELIZA [Weizenbaum-1966], ki gaje razvil Joseph Weizenbaum v sredini šestdesetih let. Primer dialoga med pacientko in ELIZO je podan spodaj: Pacientka: Moški so vsi enaki. ELIZA: V kakšnem smislu? Pacientka: Vedno nas prosijo za kaj. ELIZA: Ali se spomnite kakšnega primera? Pacientka: Moj fant me je pripravil do tega, da sem prišla sem. ELIZA: Nadaljujte. Pacientka: Mogoče bi se lahko naučila shajati z mamo. ELIZA: Povejte mi kaj več o svoji družini. Ta dialog na prvi pogled zgleda precej impresiven, čeprav je program presenetljivo enostaven. Vse Elizine konverzacijske sposobnosti so shranjene v urejeni zbirki ključnih besed, katere vhodi so na primer: beseda stopnja vzorec izhod mama 10 ?X "Povejte mi kaj več o svoji družini." so 3 ?X so ?Y "Kaj pa, če ne bi bili ?Y." Torej, vsaka beseda je povezana s stopnjo (maksimalna vrednost je 10), z vhodnim vzorcem in primernim izhodom. Celoten algoritem ELIZE lahko opišemo takole: . V vhodni povedi poišči ključne besede, katerih vzorci v zbirki ključnih besed se ujemajo z vzorci na vhodu. . Če je takšnih besed več, izberi besedo z največjo stopnjo. . S pomočjo definicije izhoda tvori odziv. 1. Uvod 3 . Če v zbirki ni ustreznih ključnih besed, povej "povejte mi več", "hm, nadaljujte" ali podobno. Zaradi preprostosti tega algoritma Elizi ne uspe preslepiti dovolj skeptičnih ljudi. Nekateri odzivi namreč niso smiselni, čez nekaj časa pa postane tudi jasno, da sistem ne sledi zgodovini in razvoju dialoga, saj nima prav nobenega znanja niti o poteku dialoga niti o jeziku samem. Uporaba govornih vmesnikov v znanstveni fantastiki pa ne izvira le iz želje, da bi se stroji obnašali kot ljudje, da bi bili inteligentni, ampak je globje zasidrana. Govor je naraven - govoriti se naučimo še preden znamo brati in pisati. Govor je tudi učinkovit - večina ljudi je sposobnih govoriti petkrat hitreje kot tipkati in verjetno celo desetkrat hitreje kot pisati. Še več, govor je fleksibilen - med komunikacijo se nam ni treba ničesar dotikati in ne opazovati. To so le nekateri razlogi, zakaj uporaba govornih vmesnikov prispeva k izboljšanju kvalitete življenja. 1.2 Sistemi za dialog Sistem za dialog ali govorni vmesnik imenujemo računalniški sistem, ki uporabniku omogoča, da z govorom dostopa do določenih aplikacij. Poznamo več vrst sistemov za dialog, najbolj razširjeni pa so sistemi za podajanje informacij, sistemi za govorno upravljanje naprav, sistemi za interaktivne govorne odzive in sistemi za reševanje problemov. Slikovit pregled najpogostejših sistemov za dialog je podan v [Krahmer-2001]. Različne vrste sistemov za dialog so povezane z različnimi tehničnimi ovirami (npr. velikost slovarja in perpleksnost učnega besedila) in kar je bolj pomembno, zahtevajo uporabo različnih strategij vodenja dialoga. Sistem za dialog je ponavadi modularno zgrajen, pri čemer je izhod iz prejšnjega modula vhod v naslednji modul. Osnovni moduli takega sistema (slika 1.1) so: Modul za razpoznavanje govora Vhod v modul za razpoznavanje govora je govorni signal uporabnika, njegova naloga pa je določiti zaporedje besed, ki jih je uporabnik izgovoril. V prvi fazi lahko to pomeni določiti mrežo hipotez o besedah, iz katere modul za razpoznavanje govora šele s pomočjo pomenske analize posameznih zaporedij, ki jo opravlja modul za razumevanje naravnega jezika, izloči zaporedje besed, ki se zdi najverjetnejše. Modul za razumevanje naravnega jezika Vhod v modul za razumevanje naravnega jezika je zaporedje besed, izhod pa njegova pomenska predstavitev. Pri razumevanju je lahko v veliko pomoč tudi informacija o poteku dialoga, ki jo dobimo iz modula za vodenje dialoga. Modul za vodenje dialoga Modul za vodenje dialoga je zagotovo osrednji modul vsakega sistema za dialog, ki vodi in uravnava interakcijo med uporabnikom in aplikacijo. Vhod v modul je pomenska predstavitev, ki strukturirano podaja vsebino uporabnikove izjave. Ker ima neposreden dostop do aplikacije, lahko modul za vodenje dialoga na podlagi vhodne pomenske 1. Uvod 4 Slika 1.1: Zgradba sistema za dialog predstavitve na primer spreminja stanje aplikacije (v primeru govornega upravljanja neke naprave) ali pa iz podatkovne zbirke vrača določene informacije (v primeru podajanja informacij). Modul za tvorjenje naravnega jezika Vhod v modul za tvorjenje naravnega jezika je pomenska predstavitev, ki jo tvori modul za vodenje dialoga, njegova naloga pa je, da jo pretvori v naravni jezik. Modul za tvorjenje govora Naloga modula za tvorjenje govora je, da odziv sistema, podan v naravnem jeziku, pretvori v govor. Ker je uporabnik z govorjenim izhodom v neposrednem stiku, ta močno vpliva na uporabnikovo oceno učinkovitosti sistema. V nadaljevanju se bomo osredotočili na sisteme za podajanje informacij, t.j. govorne vmesnike za dostop do podatkovnih zbirk. 1.3 Zgodovina sistemov za podajanje informacij Prototipi sistemov za podajanje informacij so se pojavili že v poznih šestdesetih in zgodnjih sedemdesetih letih. Najbolj znan sistem iz tega obdobja je LUNAR [Woods-1972], ki podaja informacije o kemijskih analizah kamnov z Lune. Ker so bili LUNAR in drugi zgodnji sistemi za podajanje informacij zgrajeni za specifično podatkovno zbirko, jih ni bilo mogoče na preprost način prirediti za druge podatkovne zbirke. Se več sistemov 1. Uvod 5 za podajanje informacij se je pojavilo v poznih sedemdesetih letih. Omenimo samo sistem Rendezvous [Codd-1974], ki je uporabnika vodil pri zastavljanju vprašanj, in sistem Ladder [Hendrix-1978], namenjen obsežnim podatkovnim zbirkam. Eden izmed najbolj znanih sistemov iz zgodnjih osemdesetih let je v prologu udejanjen sistem Chat-80 [Warren-1982]. V sredini osemdesetih let pa so postali sistemi za podajanje informacij zelo priljubljeno raziskovalno področje. Posledica tega je bilo veliko število udejanjenih sistemov, pri čemer je bil večji del raziskav namenjen prenosljivosti. Tako se je na primer sistem Ask [Thompson-1983], ki je dostopal do več zunanjih podatkovnih zbirk, od uporabnika učil nove besede in nove koncepte na različnih točkah interakcije, sistem Janus [Resnik-1989] pa je dostopal do različnih aplikacij (podatkovne zbirke, ekspertni sistemi, grafične naprave, ipd.). Kljub nekaterim izjemnim lastnostim številnih sistemov za podajanje informacij, ki so bili razviti v sredini osemdesetih let, si ti niso uspeli pridobiti pričakovanega hitrega in širokega javnega priznanja. Čeprav je za nekatere sisteme veljalo, da so bili komercialno uspešni, so sistemi za podajanje informacij še dandanes prej eksotična kot pa standardna izbira dostopa do podatkovne zbirke. To je delno posledica tako razvoja učinkovitih alternativ h govornim vmesnikom, kot je grafični vmesnik, kot preslabe zanesljivosti razumevanja naravnega govora. Že v poznih osemdesetih, predvsem pa v devetdesetih letih, je število objavljenih člankov o sistemih za dialog drastično upadlo. Kljub temu so raziskovalci sisteme za dialog še naprej izboljševali, vključevali so napredke in nova spoznanja na področju obdelave naravnega govora ter raziskovali prednosti vključitve dveh modalnosti, t.j. govora in grafike. Postalo je jasno, da prihodnost govornih vmesnikov temelji na potrebi po dostopu do informacij preko telefona, na potrebi po uporabi govora, ko so roke ali oči kako drugače zaposlene, ter kot pomoč invalidnim osebam. Sodobnejši sistemi za podajanje informacij preko telefona so tako bili zgrajeni za različne domene, npr. za podajanje informacij o restavracijah [Jurafsky-1994], o gledališčih [Hoeven-1995], o potovanjih z železnico [Allen-1995, Sturm-1999], o letalskih prevozih [Ipšič-1999, Stallard-2000], o vremenskih napovedih [Zue-2000] in prispeli elektronski pošti [Walker-2000]. Cilj sodobnejših sistemov za dialog je strategije interakcije čimbolj približati naravnim strategijam, t.j. strategijam komunikacije človek - človek. To pomeni, da se je po eni strani potrebno omejiti le na najpogosteje zaznane naravne strategije, po drugi strani pa je potrebno razvijati in uporabljati najnovejše oz. najučinkovitejše tehnologije na področju obdelave govornega signala in razumevanja naravnega jezika. 1.4 Razvoj dvojezičnega sistema za podajanje informacij o vremenu Raziskovalci Laboratorija za umetno zaznavanje, sisteme in kibernetiko Fakultete za Elektrotehniko v Ljubljani ter raziskovalci Oddelka za računalništvo in informatiko Filozofske fakultete na Reki smo si zastavili cilj razviti sistem [Žibert-2003], ki bo preko telefona v slovenskem in v hrvaškem jeziku podajal informacije o vremenu in 1. Uvod 6 vremenskih napovedih. Eden izmed razlogov za to odločitev je veliko število turističnih izmenjav med obema državama, drugi pa čedalje manjši delež prebivalcev obeh držav, ki govorijo in razumejo oba jezika. Načrtovana zgradba sistema je prikazana na sliki 1.2. Sistem naj bi bil sposoben odgovarjati na vprašanja o vremenu in vremenski napovedi (splošna vremenska napoved, biovremenska napoved, temperatura, smer in hitrost vetra, zračni tlak, vidljivost, višina in vrsta snega, vzhod in zahod sonca, ipd.) za različne kraje in pokrajine v Sloveniji in na Hrvaškem ter za večja mesta ostalih evropskih držav. TVof|en|e hrvaškega lezlka Tvorjenje slovenskega lezlka ~] Razumevanje hrvaškega Jezika Razumevanle slovenskega Jezika :Y_________, ,________y_________, ,_________y________, ,________y Tvorjenje hrvaškega govora Tvorjenje slovenskega govora ~] Razpoznavanje hrvaškega govora Razpoznavanje slovenskega govora Slika 1.2: Dvojezični sistem za podajanje informacij o vremenu Ker naj bi sistem omogočal hkratno komunikacijo v obeh jezikih, t.j. v slovenskem in v hrvaškem jeziku, bo uporabnikova izjava najprej potovala v modul za identifikacijo jezika, ki bo ugotovil, v katerem jeziku uporabnik govori. V skladu s to ugotovitvijo bo nato izjava posredovana v ustrezno zaporedje modulov za razpoznavanje govora [Martinčič-2003] in razumevanje naravnega jezika, pri čemer bosta oba modula za razumevanje naravnega jezika pri pretvorbi izjave v njeno pomensko predstavitev upoštevala tudi trenutno stanje dialoga. Modul za vodenje dialoga bo (če bo potrebno), neodvisno od jezika, v zbirki vremenskih podatkov poiskal ustrezne podatke in jih, primerno strukturirane, poslal ustreznemu modulu za tvorjenje naravnega jezika. Ta bo to pomensko predstavitev odziva pretvoril v ustrezen (slovenski ali hrvaški) naravni jezik, ki bo nato še sintetiziran [Vesnicer-2003], t.j. umetno pretvorjen v govor, in posredovan uporabniku preko telefonske linije. V magistrskem delu se bomo poleg modula za vodenje dialoga osredotočili tudi na zbirko vremenskih podatkov, ki predstavlja takorekoč celotno znanje našega sistema. Vir slovenskega dela podatkovne zbirke so spletne strani Hidrometeorološkega zavoda Agencije Republike Slovenije za okolje 1, vir hrvaškega dela pa spletne strani Državnega hidrometeorološkega zavoda Republike Hrvaške 2. 1 Hidrometeorološki zavod Agencije Republike Slovenije za okolje, http://www.arso.gov.si/podro~cja/vreme_in_podnebje/ 2Državni hidrometeorološki zavod Republike Hrvaške, http://www.tel.hr/dhmz/ Zbirka vremenskih podatkov 2.1 Vir podatkov 2.2 Zajemanje spletnih podatkov 2.3 Pomenska analiza 2.4 Zbirka podatkovnih tabel Opisali bomo nastanek zbirke podatkovnih tabel, ki predstavlja znanje nastajajočega sistema za podajanje informacij o vremenu in vremenskih napovedih. Pri tem se bomo omejili na slovenski del podatkov. Podatke o vremenu in vremenski napovedi zajemamo s spletnih strani Hidrometeorološkega zavoda Agencije Republike Slovenije za okolje. Del podatkov je na teh spletnih straneh podan v tabelarni, del pa v tekstovni obliki. Ker želimo, da bo sistem sposoben jedrnato odgovarjati na uporabnikova vprašanja, je potrebno tudi tekstovno podan vir informacij predstaviti čimbolj strukturirano in pregledno. V ta namen smo zgradili pomenske analizatorje besedil, ki tekstovno podane informacije pretvorijo v tabelarno strukturo. Pri izdelavi pomenskih analizatorjev smo si pomagali z zbirko spletnih podatkov, pridobljeno s skoraj enoletnim zajemanjem vremenskih podatkov s spletnih strani Hidrometeorološkega zavoda Agencije Republike Slovenije za okolje. 7 2. Zbirka vremenskih podatkov 8 2.1 Vir podatkov Po zgledu podobnih sistemov kot je Jupiter [Zue-2000], bodo vir podatkov našega dvojezičnega sistema za podajanje vremenskih informacij spletne strani Hidrometeorološkega zavoda Agencije Republike Slovenije za okolje ter spletne strani Državnega hidrometeorološkega zavoda Republike Hrvaške. V magistrskem delu se bomo omejili le na slovenski vir podatkov. Del vremenskih podatkov je na svetovnem spletu podan v tabelarni, del pa v tekstovni obliki. Tipičen primer tekstovno podane vremenske napovedi za Slovenijo izgleda takole: Napoved za Slovenijo Danes bo sončno, burja na Primorskem bo ponehala. Najvišje dnevne temperature bodo od 20 do 26, na Primorskem do 29 stopinj C. Tudi jutri bo sončno, popoldne bo predvsem na zahodu spremenljive oblačnosti več. Proti večeru ter ponoči lahko nastanejo posamezne nevihte. Najnižje jutranje temperature bodo od 8 do 15, najvišje dnevne od 22 do 29 stopinj C. Obeti V nedeljo bo sprva še delno do spremenljivo oblačno, občasno so še možne manjše krajevne padavine, popoldne pa se bo postopno zjasnilo. V ponedeljek bo spet sončno in še topleje. Takšni tekstovno podani podatki pogosto vsebujejo veliko podrobnejše informacije, kot pa uporabnika zanimajo. Če želimo, da bo sistem za podajanje informacij sposoben ponuditi le zahtevano informacijo in uporabnika ne bo dolgočasil z dolgimi monologi, mora takšno besedilo razumeti. S pojmom razumeti ne mislimo, da bo računalnik razmišljal tako, kot razmišlja človek. Mislimo le, da bo informacije pravilno uporabljal in se pravilno odzival. V ta namen smo po zgledu [Pepelnjak-1996a, Pepelnjak-1996b] zgradili pomenske analizatorje, ki vremenske napovedi analizirajo in jih zapišejo v za računalnik bolj pregledni in berljivi tabelarni strukturi [Hajdinjak-2002a]. Pri izdelavi pomenskih analizatorjev za tematsko omejena področja Vremenska napoved in obeti za Slovenijo, Vremenska napoved za gorski svet, Napoved za letalstvo, Napoved vodostajev in Snežne razmere smo si pomagali z zbirko spletnih podatkov, ki smo jo pridobili s skoraj enoletnim zajemanjem vremenskih podatkov s spletnih strani Hidrometeorološkega zavoda Agencije Republike Slovenije za okolje. 2.2 Zajemanje spletnih podatkov Zajemanje vremenskih podatkov s spletnih strani Hidrometeorološkega zavoda Agencije Republike Slovenije za okolje je potekalo od sredine julija leta 2002 do sredine junija leta 2003. 2. Zbirka vremenskih podatkov 9 Pet HTML datotek, za katere smo se odločili izdelati pomenske analizatorje, smo zajemali večkrat na dan (glede na pogostost osveževanja podatkov na spletnih straneh). Te datoteke smo obdelovali s programom, zapisanim v skriptnem jeziku PERL, ki je iz njih odstranil vse posebnosti HTML formata. Tako smo dobili tekstovne datoteke, iz katerih smo izluščili vse besede, jih prešteli in uredili po abecednem vrstnem redu. To nam je omogočilo spremljati naraščanje števila vseh različnih besed na tematsko omejenih področjih Vremenska napoved in obeti za Slovenijo (slika 2.1), Vremenska napoved za gorski svet (slika 2.2), Napoved za letalstvo (slika 2.3), Napoved vodostajev (slika 2.4) in Snežne razmere (slika 2.5). Vremenska napoved in obeti za Slovenijo 900 800 700 600 500 400 300 200 100 0 *> *tf % '% '% '% % % % % % % ¦ % ^ W V V V v v v ^? ^> ^? ^tf i? t? ^tf i? t? datum Slika 2.2: Naraščanje števila različnih besed v zbirki Vremenska napoved za gorski svet Število vseh besed v posameznih podatkovnih zbirkah je z razliko od števila različnih besed po pričakovanju naraščalo približno linearno. Krivulje, ki prikazujejo naraščanje števila različnih besed v posameznih podatkovnih zbirkah, so si, z izjemo krivulje za Snežne razmere, sicer vse zelo podobne, vendar daleč od linearnosti. Po nekaj mesecih zajemanja podatkov so se namreč vse začele opazno umirjati, kar je še najbolj izrazito 2. Zbirka vremenskih podatkov 10 Napoved za letalstvo V V V % % % V V V V V V % % % % % % X X X X X X datum Slika 2.3: Naraščanje števila različnih besed v zbirki Napoved za letalstvo Napoved vodostajev 350 ^ V V \ \ \ \x W V V V V V V ^. ^fe, Op ¦¦? -t ¦¦? -J ¦¦? -t datum Slika 2.4: Naraščanje števila različnih besed v zbirki Napoved vodostajev Snežne razmere •& ¦>> ¦& Ç ¦>. ¦*>- 4- %r ¦>, ^ ^ -ä> ^ ^, V ^ ¦* ^ ^ ^ ¦%* i,**, ^^ T1 ^j ^iP ^ip ^ ^P^f^tp^ip^i datum Slika 2.5: Naraščanje števila različnih besed v zbirki Snežne razmere 2. Zbirka vremenskih podatkov 11 pri krivulji za Napoved vodostajev. Če bi z zajemanjem vremenskih podatkov še nadaljevali, bi umirjanje naraščanja teh krivulj zelo verjetno postalo še bolj izrazito, saj bi podatkovne zbirke vsebovale dovolj vremenskih podatkov iz vseh letnih časov. Beseda Kategorija Tip jutri jutri rei dan sredo sreda dan teden jutro zjutraj del dneva Prekmurju prekmurje pokrajina države Slovenija pokrajina hribih hribi lege severovzhodu severovzhod stran neba dežuje dež vreme burjo burja veter toplejše topleje temperatura ponehale bodo ponehale stanje občutno precej lastnost -5 -5 število do do rei izraz zapihala pihati keyword C celzija keyword zaradi X ignore kakšna X ignore Tabela 2.1: Primeri vnosov v slovar Vremenska napoved in obeti za Slovenijo Za vsako izmed petih podatkovnih zbirk smo izdelali slovar besed, v katerem smo vsaki besedi iz zbirke (ne glede na spol, sklon in število) priredili njeno semantično kategorijo in semantični tip. Besedam z istim pomenom smo priredili isto semantično kategorijo, tej pa smo priredili še enega izmed naslednjih semantičnih tipov: -W časovni semantični tipi (rel_dan, dan_teden ali del_dneva), -W krajevni semantični tipi (pokrajina, lege, stran_neba, voda ali predel), -W semantični tipi s ključno informacijo (vreme, veter, temperatura, pretok, pojavi, turbulenca ali oblaki), -W dopolnilni semantični tipi (stanje, lastnost ali število), -W relativni izraz (reMzraz), -W ključna beseda (keyword) ali -W nepomembna informacija (ignore). 2. Zbirka vremenskih podatkov 12 V posameznih slovarjih je med 300 in 1000 vnosov. Primeri vnosov v slovar Vremenska napoved in obeti za Slovenijo so podani v tabeli 2.1. Semantični tip keyword poleg semantičnih tipov s ključno informacijo najbolj zanesljivo določa pomen stavka, medtem ko semantični tip ignore združuje tiste kategorije, ki za samo razumevanje besedila niso ključnega pomena in jih lahko že na nivoju slovarja besed izločimo. 2.3 Pomenska analiza Sistem za dialog JUPITER [Zue-2000], po katerem se zgledujemo, uporablja za razumevanje naravnega govora in besedila sistem TINA [Seneff-1992], ki povedi preoblikuje v jezikovno transparentne semantične okvirje. JUPITER uporablja sistem TINA v dva različna namena - za pomensko analizo uporabnikovih zahtev ter za pomensko analizo vremenskih napovedi. TINA pomensko analizira povedi, sestavne dele vremenske napovedi, tako da posamezni povedi priredi zaporedni indeks in ustrezne semantične kategorije oz. semantične okvirje. Podatkovno zbirko sistema JUPITER tako sestavljajo semantičnim kategorijam prirejeni seznami indeksov povedi. Na nivoju gradnje podatkovne zbirke se s tem pomenska analiza zaključi. Šele ko uporabnik sistemu Jupiter zastavi vprašanje, se znova vključi Tina, ki s pomočjo ustreznih povedi in njim prirejenih semantičnih kategorij oblikuje ustrezen odziv. Mi smo se odločili za precej drugačen pristop. Že na nivoju gradnje podatkovne zbirke vremenske podatke pomensko analiziramo [Hajdinjak-2002b] in jih zapišemo v tabelarni obliki, s čimer sistemu omogočimo dostop do podatkov brez interakcije s kakšnim podsistemom. Pri tem si pomagamo s pomenskimi analizatorji, katerih model je prikazan na sliki 2.6. Trenutno smo udejanili štiri pomenske analizatorje, in sicer analizatorje za tematsko omejena področja Vremenska napoved in obeti za Slovenijo, Vremenska napoved za gorski svet, Napoved za letalstvo ter Napoved vodostajev. Nedokončan je ostal še pomenski analizator za Snežne razmere. Vhod v analizatorje vremenskih podatkov je seznam besedilnih delov, t.j. delov povedi, ki so ločeni s pikami ali z vejicami. Del vhodnega seznama je tako lahko po eni strani samo stavčni člen, po drugi strani pa tudi priredno zložena poved. Naš namen je bil posameznemu besedilnemu delu določiti pomen, t.j. vrsto informacije, na katero se ta nanaša. Pri analizi podatkov Vremenska napoved in obeti za Slovenijo se na primer izkaže, da lahko besedilne dele pomensko razdelimo na vreme, veter in temperaturo. Pomen posameznih besedilnih delov pomenski analizator določi s pomočjo vnaprej definiranih predlog (vsakemu pomenu je prirejena ena predloga), t.j. točkovanih seznamov semantičnih kategorij in tipov. Točke kategorij in tipov, ki predloge sestavljajo, smo določili eksperimentalno. Podoben pristop je bil uporabljen pri pomenski analizi stavkov v sistemu za podajanje informacij o letalskih poletih [Pepelnjak-1996a, Pepelnjak-1996b]. Vrednost posamezne predloge pri analizi vhodnega besedilnega dela predstavlja seštevek točk, prirejenih semantičnim kategorijam in tipom posameznih besed danega besedilnega dela. V skladu z možnim 2. Zbirka vremenskih podatkov 13 Predobdelava besedila V torek bo na Primorskem delno jasno in suho, drugod spremenljivo oblačno. Seznam besedilnih delov 1. V torek bo na Primorskem delno jasno in suho, 2. drugod spremenljivo oblačno. Seznam izhodnih predlog KRAJI: primorska ČAS: torek podnevi VREME: delno jasno, suho KRAJI: dolenjska, gorenjska, koroška, notranjska, štajerska, prekmurje ČAS: torek podnevi VREME: spremenljivo oblačno Prirejanje -> semantičnih kategorij in tipov Obdelava -> semantičnih kategorij in tipov 1. [torek] [primorska] [delno] [jasno] [in] [suho] 2. [drugod] [spremenljivo] [oblačno] Dopolnjevanje izhodnih ^ predlog Generiranje izhodnih predlog Ujemanje besedilnih delov s predlogami 1. VREME: 50 točk 2. VREME: 50 točk Dodatno razcepljanje besedilnih delov 1. KRAJI: primorska ČAS: torek podnevi VREME: delno jasno, suho 2. KRAJI: drugod ČAS: VREME: spremenljivo oblačno Slika 2.6: Model pomenskih analizatorjev vremenskih podatkov pomenom besedilnih delov, ki sestavljajo besedila iz zbirke Vremenska napoved in obeti za Slovenijo, smo definirali tri osnovne predloge, namreč VREME, VETER in TEMPERATURA. Če največje število točk, ki ga besedilni del dobi glede na vnaprej definirane predloge, ne doseže določenega praga, ga analizator pripiše dodatni predlogi NEPOMEMBNA INFORMACIJA, kije skupna vsem pomenskim analizatorjem. Ker se v pridobljenih zbirkah vremenskih podatkov nekateri besedilni deli nanašajo na dva različna pomena, prvotno pripisovanje pomenov ni dovolj dobro. S pikami in vejicami ločeni deli besedila namreč ne zagotavljajo pomenskega ločevanja priredno zloženih povedi. Edini priredni veznik, ki se je pojavil v naših zbirkah vremenskih podatkov, in pred katerim v povedi ni vejice, je veznik in. Priredno zložene povedi, v katerih veznik in nastopa, zato na mestu tega veznika še enkrat razcepimo in preverimo, ali sta pomena obeh tako nastalih delov res različna. Če ugotovimo, da sta pomena različna, in se nobeden izmed njiju ne nanaša na pomen NEPOMEMBNA INFORMACIJA, ju ločimo. Semantični analizator vremenskih napovedi izvede analizo v šestih korakih: 1. korak : PRIREJANJE SEMANTIČNIH KATEGORIJ IN TIPOV besedilnim delom iz vhodnega seznama. To prirejanje poteka na osnovi slovarjev besed, v katerih smo vsaki besedi priredili semantično kategorijo in semantični tip. 2. korak : OBDELAVA SEMANTIČNIH KATEGORIJ IN TIPOV. Analizator nekatera zaporedja semantičnih kategorij in tipov združi, nekatera pa preoblikuje. Obdelava vključuje predvsem semantični tip rei_izraz, ki vpliva na pomen konteksta. 2. Zbirka vremenskih podatkov 14 3. korak : Ujemanje besedilnih delov s predlogami oz. določanje pomena posameznih besedilnih delov poteka na osnovi vnaprej definiranih predlog, ki vsebujejo točkovane sezname semantičnih kategorij in tipov. 4. korak : Dodatno razcepljanje besedilnih delov. Na mestu veznika in analizator dodatno razcepi tiste besedilne dele, za katere ugotovi, da vsebujejo dva različna pomena. 5. korak : Generiranje izhodnih predlog, t.j. seznamov časovnih in krajevnih ter za pomen stavka ključnih informacij. V primeru Vremenska napoved in obeti za Slovenijo smo v skladu z možnimi pomeni besedilnih delov definirali tri različne izhodne predloge, za vsakega od možnih osnovnih pomenov besedilnega dela ( VREME, VETER in TEMPERA TURA) po eno. Velikokrat pa vhodni besedilni del ne nosi vseh potrebnih informacij - največkrat manjkata oz. nista popolni časovna in/ali krajevna informacija. Posledica tega so nepopolne izhodne predloge. 6. korak : Dopolnjevanje izhodnih predlog. V zadnjem koraku analizator nepopolne izhodne predloge dopolni. Manjkajoče informacije poišče v izhodnih predlogah prejšnjih besedilnih delov. Rezultat pomenskega analizatorja je seznam izhodnih predlog. Vsaka izmed izhodnih predlog vsebuje časovno informacijo, ki je natanko določena z dnem in delom dneva, in krajevno informacijo, ki je natanko določena s pokrajino, lego ali stranjo neba. Izhodne predloge besedilnih delov s pomenom VREME vsebujejo še opis vremena, izhodne predloge besedilnih delov s pomenom VETER še opis vetra, izhodne predloge besedilnih delov s pomenom TEMPERATURA še opis temperature, itd. Besedilnim delom, katerih pomen je NEPOMEMBNA INFORMACIJA, analizator izhodne predloge ne priredi. Primer analize je prikazan na sliki 2.6. Analizator tematsko omejenega področja Vremenska napoved in obeti za Slovenijo smo testirali na 32 vremenskih napovedih, ki niso bile del podatkovne zbirke, na osnovi katere smo analizator gradili. Po predobdelavi testnih napovedi smo dobili 340 besedilnih delov, katerih seznam je bil vhod v analizator. Analizator je popolnoma pravilno pomensko razčlenil 332 besedilnih delov, kar znaša 97,65%. V 4. koraku je dodatno razcepil štiri besedilne dele, katerih nadaljno razčlenjevanje je bilo prav tako popolnoma uspešno. Rezultati so prikazani v tabeli 2.2. Število besedilnih delov Odstotki uspešno delno uspešno neuspešno 332 1 7 97,65 % 0,29 % 2,06 % skupaj 340 Tabela 2.2: Rezultati testiranja pomenskega analizatorja Vremenska napoved in obeti za Slovenijo 2. Zbirka vremenskih podatkov 15 Pomanjkljivost analizatorja, ki smo jo pri testiranju odkrili, se odraža v neuspešno razčlenjenem stavku V torek in sredo se bo nadaljevalo nestanovitno vreme s popoldanskimi plohami in nevihtami. Analizator je ta besedilni del analiziral kot: KRAJI: - CAS: torek podnevi, sreda podnevi, danes popoldne VREME: nestanovitno, plohe, nevihte Popolnoma pravilno pa bi bilo določiti dve izhodni predlogi, namreč: KRAJI: - CAS: torek podnevi, sreda podnevi VREME: nestanovitno KRAJI: - CAS: torek popoldne, sreda popoldne VREME: plohe, nevihte Analizator torej ni popolnoma pravilno izluščil niti časovne niti ključne informacije, ki se v danem stavku oz. besedilnem delu prepletata. Vse zgrajene analizatorje nameravamo še testirati in odpravljati ugotovljene pomanjkljivosti. 2.4 Zbirka podatkovnih tabel Prvi del zbirke MS Access-ovih podatkovnih tabel je sestavljen iz vremenskih podatkov, ki so na spletnih straneh že podani v tabelarni obliki, zato jih od tam le prepišemo v tabele z enako podatkovno strukturo. Takih tabel je osem: Vreme po Sloveniji, Podatki z avtomatskih meteoroloških postaj, Vreme po Evropi, Višina snežne odeje, Podatki z lavinskih postaj, Poročilo o stopnji požarne ogroženosti naravnega okolja, Stanje voda in Napoved za slovensko Primorje. Drugi del zbirke MS access-ovih podatkovnih tabel je sestavljen iz štirih tabel, dobljenih s pomensko analizo naslednjih besedil: 2. Zbirka vremenskih podatkov 16 Vremenska napoved in obeti za Slovenijo, Vremenska napoved za gorski svet, Napoved za letalstvo in Napoved vodostajev. Predlog : Ta B@P Rl predloga dan del dneva pokrajine lege strani neba vreme veter temperatura - vreme danes podnevi Slovenija oblačno H vreme danes podnevi zahod,notranjost rahle padavine vreme danes podnevi notranjost sneg vreme danes podnevi primorska dež veter danes podnevi primorska zmerna do močna burja veter danes podnevi notranjost severovzhodni veter temperatura danes podnevi Slovenija od -2 do 4 temperatura danes podnevi primorska okoli 6 vreme jutri podnevi Slovenija padavine bodo ponehale veter jutri podnevi primorska zmerna bura temperatura jutri zjutraj Slovenija najnižje od -4 do D _ temperatura jutri zjutraj qore,hribi do-7 temperatura jutri zjutraj primorska okoli 2 temperatura jutri podnevi Slovenija najvišje malo nad D temperatura jutri podnevi primorska do S vreme sobota podnevi Slovenija pooblačitve vreme sobota podnevi notranjost,zahod padavine vreme sobota podnevi nižine rahel dež vreme sobota zvečer Slovenija padavine vreme nedelja podnevi Slovenija oblačno,občasno rahel dež Record: H | i [~~ 21 M | | oF 2 .u J -tf Slika 2.7: Primer podatkovne tabele, zgrajene s pomočjo analizatorja Vremenska napoved in obeti za Slovenijo LE. PodatkovnaBaza JJJJ..y.Ua-.l.m.l.WJ.IBi!!!T!HBiHBB!l!m predloga dan del dneva pokrajine A vreme sreda zvečer vreme sreda popoldne Slovenija vreme sreda ponoči vreme sreda zvečer vreme sreda ponoči vreme sreda zvečer vreme četrtek podnevi notranjsh = vreme sreda podnevi notranjsh vreme četrtek podnevi vreme sreda podnevi temperatura jutri podnevi primorsk. temperatura jutri podnevi Slovenija temperatura jutri zjutraj Slovenija vreme jutri podnevi Slovenija — veter danes ponoči Slovenija vreme Hflnes nnnnči slnveniifl < ¦ > OK Prekini Obnovi bazo ~B Danes je : Četrtek Slika 2.8: Grafični vmesnik do zbirke podatkovnih tabel 2. Zbirka vremenskih podatkov 17 Struktura izhodnih predlog omogoča, da so podatki v teh tabelah časovno, krajevno in pomensko ločeni. Primer take tabele je na sliki 2.7, na sliki 2.8 pa je grafični vmesnik za dostop do zbirke vseh podatkovnih tabel, preko katerega lahko zbirko osvežimo. Ker je večina podatkovnih tabel na spletnih straneh spremenljive velikosti (števili krajev in podanih informacij se iz dneva v dan spreminjata), napovedi pa so razmeroma jedrnate in skope, za našo zbirko podatkovnih tabel ob danem trenutku velja naslednje: -W vsebuje podatke o majhni podmnožici vseh pokrajin, mest in krajev v Sloveniji in Evropi, -W ne vsebuje enakih vrst informacij za vse pokrajine, mesta in kraje ter -W struktura informacij je časovno odvisna. Taka struktura znanja sistem zelo omejuje pri želji, da bi uporabnika med dialogom vodil in mu pomagal ter porodi potrebo po ponujanju relevantnih, dosegljivih podatkov. Eksperiment Čarovnik iz Oza 3.1 Zakaj eksperiment Čarovnik iz Oza 3.2 Sistem Čarovnik iz Oza 3.3 Prvi eksperiment Čarovnik iz Oza 3.4 Drugi eksperiment Čarovnik iz Oza Opisali bomo eksperiment Čarovnik iz Oza, s katerim lahko s pomočjo človeka (čarovnika) simuliramo delovanje še nedokončanega sistema, in podali razloge za uporabo eksperimenta pri razvoju sistemov za dialog. Pri razvoju sistema za podajanje informacij o vremenu smo ta eksperiment uporabili dvakrat. Pri izvajanju prvega eksperimenta smo uporabili sistem Čarovnik iz Oza, katerega sestavni deli so bili: grafični vmesnik, zbirka tabel vremenskih podatkov, modul za tvorjenje naravnega jezika in modul za tvorjenje slovenskega govora. V drugem eksperimentu smo v sistem vključili še modul za vodenje dialoga, tako da je naloga čarovnika ostala le nadomestiti delovanje modula za razpoznavanje govora in modula za razumevanje naravnega jezika. Rezultat obeh eksperimentov sta zbirki spontanega slovenskega govora SSSQ in SSSQ2, sestavljeni iz dialogov, ki odražajo jezik komunikacije človek - računalnik. 18 3. Eksperiment Čarovnik iz Oza 19 3.1 Zakaj eksperiment Čarovnik iz Oza Številni raziskovalci menijo, da naj bi dialogi človek - računalnik v čim večji meri sledili dialogom človek - človek. Toda dialogi človek - računalnik in dialogi človek -človek se razlikujejo v tolikšni meri, da podatki iz slednjih hitro postanejo neustrezen in nezanesljiv vir informacij za nekatere pomembne vidike oblikovanja sistemov za dialog kot sta na primer način in kompleksnost interakcije. Fraser in Gilbert [Fraser-1991] ugotavljata, da čeprav se je bolje zanašati na analizo dialogov človek - človek kot pa le na intuicijo, dejstvo, da se dialogi človek - človek in dialogi človek - računalnik razlikujejo, ostane in presenetljivo bi bilo, če bi oboji sledili enakim pravilom. Smith in Gordon [Smith-1997] zato trdita, da analiza dialogov človek - človek sicer predstavlja dobro osnovo za določitev nalog sistema in slovarja besed, ki naj jih sistem razume, ni pa preprosto ugotoviti, kateri vidiki te analize bodo ustrezali dialogom človek -računalnik. Zanimiva je njuna ugotovitev, da so raziskovalci ujeti v začaran krog -za konstrukcijo sistema za dialog po eni strani potrebujejo značilnosti dialogov človek - računalnik, po drugi strani pa je, dokler sistem ne obstaja, nemogoče vedeti, kako bodo dialogi potekali. Trenutno najboljša alternativa za zbiranje podatkov, ki odraža jezik dialogov človek -računalnik, je tako imenovan eksperiment Čarovnik iz Oza. Ime tehnike se nanaša na moža za zaveso v knjigi in filmu Čarovnik iz Oza. V teh eksperimentih so uporabniki prepričani, da se pogovarjajo z računalnikom, kar pa ni res. V resnici za računalnikom sedi človek (čarovnik), ki simulira delovanje sistema za dialog. V nekaterih primerih [Whittaker-1989, Eskenazi-1999] čarovnik simulira celoten sistem, v drugih [Dahlbäck-1993, Kim-1997] pa le del sistema. Ugotovljeno je bilo [Whittaker-1989, Fraser-1991, Dahlbäck-1993], da podatki, pridobljeni z eksperimentom Čarovnik iz Oza, bolj natančno odražajo jezik komunikacije človek - računalnik kot dialogi človek -človek. Glavni razlog za to je prilagajanje udeležencev dialoga jezikovnim sposobnostim sogovornika. Tehnika eksperiment Čarovnik iz Oza pa ima tudi nekatere slabosti: 1. Konstrukcija kvalitetnega sistema za simulacijo in učenje čarovnikov je zahtevna naloga. Dahlbäck, Jönsson in Ahrenberg [Dahlbäck-1993] to utemeljujejo z dejstvom, da smo ljudje fleksibilni, računalniki pa konsistentni; da ljudje počasi tipkamo, računalniki pa se odzivajo hitro; da računalniki nikoli ne delajo majhnih napak (tipkarske napake), ljudje pa jih delamo pogosto. Torej če želimo, da bodo uporabniki ves čas dialoga ostali v prepričanju, da se pogovarjajo z računalnikom, čarovnik ne sme le sedeti za računalnikom in tipkati svoje odgovore, ki so nato umetno pretvorjeni v govor. Vmesnik, pred katerim sedi, mora čarovniku pomagati pri njegovem delu, tako da čimbolj zmanjša potrebo po tipkanju in čimbolj poveča konsistentnost njegovih odzivov. 2. Udeleženci eksperimenta igrajo le vloge resničnih uporabnikov, zato med dialogom le stežka pokažejo svoje potrebe, motivacije, izhode in ovire. To težavo lahko do neke mere odpravimo s pomočjo uvedbe vnaprej določenih scenarijev ali situacij. Ker jih ponavadi zastavijo raziskovalci sami, to ni najbolj idealen način 3. Eksperiment Čarovnik iz Oza 20 ugotavljanja nalog, ki naj jih bo sistem sposoben opraviti. 3. Pojavljajo se tudi etična vprašanja. To težavo lahko delno zmanjšamo, če udeležencem eksperimenta na koncu povemo, kaj smo počeli, zakaj smo tako ravnali in nenazadnje, da bomo podatke nemudoma uničili, če sami tako želijo. Eksperimentalni del razvoja sistema za dialog običajno poteka v treh korakih. V prvem koraku opravimo analizo dejanskih dialogov človek - človek. Na osnovi te analize konstruiramo enega ali celo več sistemov Čarovnik iz Oza, ki služijo kot ogrodje za izvedbo istoimenskega eksperimenta. Zadnji korak je izboljševanje in dopolnjevanje sistema za dialog s pomočjo podatkov dejanskih uporabnikov. Pri razvoju sistema za podajanje informacij o vremenu, ki je predmet tega dela, smo prva dva koraka že naredili. Najprej smo vzpostavili osebno komunikacijo s Hidrometeorološkim zavodom Agencije Republike Slovenije za okolje, ki nudi telefonske pogovore z dežurnim prognostikom, na podlagi katerih so nam znali povedati, kaj dejanske uporabnike sploh zanima in kako po teh podatkih poizvedujejo. Te informacije so nam bile vodilo pri oblikovanju prvega sistema Čarovnik iz Oza [Hajdinjak-2003a, Hajdinjak-2003b]. Kasneje, ko smo modul za vodenje dialoga že razvili, smo, z namenom vrednotenja delovanja tega modula, eksperiment še enkrat ponovili. 3.2 Sistem Čarovnik iz Oza Sistem Čarovnik iz Oza, ki preko telefona podaja informacije o vremenu in vremenski napovedi [Hajdinjak-2003a], s katerim smo izvajali eksperimente Čarovnik iz Oza, je bil modularno zasnovan, vsi moduli pa so bili povezani z grafičnim vmesnikom, za katerim je sedel človek (čarovnik) in simuliral del sistema za dialog. Sistem smo udejanjili na osebnem računalniku z vgrajeno ISDN DIVA Server BPJ-2M PCI kartico, s katero smo komunicirali preko posebnega računalniškega programa, ki je omogočal vzpostavljanje in prevzemanje telefonskih pogovorov, poslušanje in snemanje pogovorov, kodiranje in dekodiranje ISDN formata zvočnih datotek, pošiljanje wave datotek po telefonski liniji, ipd. V zgodnjih fazah razvoja sistema za dialog je primerneje, če avtomatičnega razumevanja govora ne vključimo v sistem, saj v tem primeru ne bomo omejeni z naglasi, spolom in starostjo uporabnikov. V literaturi najdemo dva načina simuliranja razumevanja govora - napake razumevanja govora lahko sistematsko vključimo v besedilo, na katerega se čarovnik odziva [Pirker-1999], ali pa simuliramo takorekoč popolno razumevanje govora [Dahlbäck-1993, Kim-1997, Eskenazi-1999]. Za slednji način smo se odločili tudi mi, čeprav se zavedamo, da so napake razumevanja govora izjemno pomemben vidik uporabnikove interakcije s sistemom. Za ta pristop smo se odločili, ker je napake razumevanja govora, še posebej pa napake razpoznavanja govora, zelo težko ustrezno simulirati. Naš čarovnik je zato poslušal uporabnika, brez da bi ga pri tem kakorkoli omejevali. Sistem Čarovnik iz Oza sestavljajo: 3. Eksperiment Čarovnik iz Oza 21 -W platforma za ISDN telefonijo, -W zbirka podatkovnih tabel (poglavje 2), do katerih dostopa čarovnik, -W grafični vmesnik, ki čarovniku omogoča vodenje dialoga, -W modul za tvorjenje naravnega jezika in -W modul za tvorjenje slovenskega govora. Eksperiment je potekal tako, da je čarovnik sedel za grafičnim vmesnikom, poslušal izjave uporabnika, v skladu s katerimi je po lastni presoji izbiral odzive na grafičnem vmesniku in s tem po potrebi dostopal do vremenske zbirke podatkovnih tabel. Odzivi so potovali v modul za tvorjenje naravnega jezika, katerega izhod (naravno besedilo) je potoval v modul za tvorjenje slovenskega govora, tega pa je sistem po telefonski liniji poslal do uporabnika. Grafični vmesnik, ki čarovniku omogoča vodenje dialoga, smo želeli oblikovati tako, da bi bili odzivi čarovnika po hitrosti in konsistentnosti čimbolj podobni odzivom računalnika. Zato smo ta grafični vmesnik zasnovali kot uporabniku (čarovniku) prijazno spletno aplikacijo, ki vsebuje -W spletne obrazce, -W aktivne slike, -W slikovna polja, -W spustne sezname, ~~+ ... in omogoča -W izbiro krajev s pomočjo aktivnih zemljevidov, -W predvajanje vnaprej pripravljenih zvočnih datotek, -W uporabo bližnjic, ~~+ ... Za obdelavo spletnih obrazcev uporabljamo programe, zapisane v skriptnem jeziku CGI, ki jih čarovnik izvaja s pritiski tipk na miški oz. tipkovnici. Primer delovnih oken je prikazan na slikah 3.1 in 3.2. Cilj modula za tvorjenje naravnega jezika je računalniško predstavitev podatkov pretvoriti v naravno besedilo. Dandanes je večina modulov za tvorjenje naravnega jezika zelo podobno zgrajenih - proces tvorjenja naravnega jezika je pri večini razdeljen na 3. Eksperiment Čarovnik iz Oza 22 Izbira tematsko omejenega področja Aktivni zemljevid < Spletni obrazec za < najnižjo/najvišjo temperaturo Slika 3.1: Grafični vmesnik sistema Čarovnik iz Oza - primer delovnega okna 1 Izbira časovne in krajevne informacije Odziv sistema vreme 9f^ 0 temperatura H D infer w r^ Izbira vrste podatka -vreme, temperatura, veter, sneg Slikovna polja za vprašanja ¦ ali je sončno/oblačno, ali dežuje/sneži Slika 3.2: Grafični vmesnik sistema Garovnik iz Oza - primer delovnega okna 2 24 031 781421 3. Eksperiment Čarovnik iz Oza 23 več zaporednih podmodulov, kjer se podatki pretakajo le v eni smeri, t.j. iz predhodnega podmodula v naslednji podmodul. Ta način povezave podmodulov je Reiter (1994) poimenoval enosmerna cevovodna struktura. Številni raziskovalci so nasprotovali deljenju procesa tvorjenja naravnega jezika na več podmodulov [Appelt-1985], drugi [Danlos-1984] so sprejeli podmodule, a so trdili, da bi struktura povezovanja podmodulov morala omogočati tudi vzvratni pretok podatkov. Čeprav so dvomi in utemeljitve teh raziskovalcev razumljivi, je argument, s katerim je Marr [Marr-1976] utemeljil deljenje procesa tvorjenja naravnega jezika na podmodule, gledano z inženirskega stališča, veliko močnejši. Argumentiral je, da podmoduli omogočajo učinkovitejšo in bolj strukturirano zgradbo ter so, zaradi podobnosti zgradbi človeških možganov, smiselni. Tudi psiho-lingvistične raziskave [Levelt-1989] jasno kažejo, da so visoko modularizirani človeški možgani verjetno nekoliko kompleksnejši od enosmerne cevovodne strukture, vendar ta razlika najverjetneje ni tako zelo velika. Ti argumenti so nas pripeljali do zaključka, da smo proces tvorjenja naravnega jezika v sistemu Čarovnik iz Oza razdelili na naslednje podmodule: 1. Podmodul za določanje vsebine spremeni čarovnikove zahteve v strukturirano predstavitev atomarnih komunikacijskih ciljev, kijih lahko dosežemo s tvorjenjem ene same povedi. 2. Podmodul za oblikovanje povedi spremeni strukturirano predstavitev atomarnih komunikacijskih ciljev, ki je izhod iz podmodula za določanje vsebine, v abstraktno slovnično predstavitev povedi, sestavljeno iz besed in nekaterih slovničnih povezav. 3. Podmodul za slovnične popravke dokonča proces tvorjenja naravnega jezika, s tem da abstraktno slovnično predstavitev povedi, ki je izhod iz podmodula za oblikovanje povedi, s pomočjo znanja o slovenskem jeziku preoblikuje v slovnično pravilne povedi. Primer tvorjenja povedi V Ljubljani ta trenutek -jasno, temperatura zraka je -9 stopinj Celzija je prikazan v tabeli 3.1. Podmodul za določanje vsebine (kraj:Ljubljana, čas:trenutno, vreme:jasno) (temperatura:-9) Podmodul za oblikovanje povedi ^Ljubljana: :trenutno: - jasno) (temperatura zraka :biti: -9 stopinj celzija) Podmodul za slovnične popravke V Ljubljani ta trenutek - jasno, temperatura zraka je -9 stopinj celzija. Tabela 3.1: Primer tvorjenja povedi z modulom za tvorjenje naravnega jezika Modul za tvorjenje slovenskega govora [Gros-1997a, Gros-1997b], ki je bil vključen v sistem Čarovnik iz Oza, je bil zgrajen v Laboratoriju za umetno zaznavanje, sisteme in kibernetiko. 3. Eksperiment Čarovnik iz Oza 24 3.3 Prvi eksperiment Čarovnik iz Oza Naloga čarovnika v prvem eksperimentu Čarovnik iz Oza je bila igrati vlogo modulov za razpoznavanje govora in razumevanje naravnega jezika, s pomočjo grafičnega vmesnika pa tudi vlogo modula za vodenje dialoga. Za ta eksperiment smo se odločili v prvi fazi razvoja sistema za podajanje informacij o vremenu, da bi pridobili podatke, na osnovi katerih bi potem gradili omenjene module, ki jih je čarovnik v eksperimentu nadomeščal. V eksperimentu je sodelovalo 76 uporabnikov, in sicer 38 žensk in 38 moških. Pri izbiri smo pazili, da bi uporabniki predstavljali čimbolj reprezentativen vzorec (spol, starost, izobrazba, narečje, telefonska linija, okolje telefonskega pogovora). Povprečna starost uporabnikov je bila 34 let, povprečna izobrazba pa srednja šola. Zastopanih je bilo vseh osem osnovnih slovenskih narečij, pazili pa smo tudi na vrste telefonskih linij (analogna, ISDN, GSM) in na okolja (tiho okolje, šolski hodnik, ulica, prostor z več ljudmi, menza, vklopljen radio/TV-sprejemnik, ipd.), v katerih so se uporabniki v času telefonskega pogovora s sistemom Čarovnik iz Oza nahajali. Pred začetkom eksperimenta smo udeležencem povedali, da se bodo pogovarjali z računalnikom, t.j. s sistemom za podajanje informacij o vremenu, in jim dali ustna navodila o splošni funkcionalnosti sistema. Ker smo želeli po eni strani pridobiti čimveč posnetkov, po drugi strani pa, kljub igranju vloge dejanskih uporabnikov, zagotoviti čimbolj realne in raznolike dialoge, smo vsakemu izmed udeležencev dodelili dve nalogi. Prva naloga je bila pridobiti določeno informacijo, druga pa je zajemala določen scenarij oz. situacijo, ki naj bi si jo udeleženec poskušal zamisliti. Primera takšnih nalog sta: 1. Poskušajte ugotoviti, ali v Ljubljani sije sonce. 2. Ob koncu tedna bi radi šli v hribe. Kaj vas zanima? in 1. Poskušajte ugotoviti, kakšne temperature lahko pričakujemo jutri. 2. Načrtujete izlet s kolesom. Kaj vas zanima? Udeležencem smo omogočili tudi lastno izbiro vprašanj - povedali smo jim, da lahko po opravljenih nalogah dialog s sistemom nadaljujejo. Po pogovoru s sistemom Čarovnik iz Oza smo uporabnike prosili, da izpolnijo vprašalnik, katerega prvi del je vseboval vprašanja o spolu, starosti, izobrazbi, zaposlitvi, narečju, vrsti telefonske linije in okolju, v katerem so se v času dialoga s sistemom nahajali. Drugi del vprašalnika se je nanašal na dialog s sistemom in je, poleg vprašanja, ali so dobili odgovor na prvo nalogo, zajemal različne vidike njihove interakcije s sistemom (tabela 3.2). Vprašanja, s pomočjo katerih so udeleženci ocenjevali sistem Čarovnik iz Oza, smo povzeli po [Walker-1997, Kamm-1999, Litman-2002], sprašujejo pa po učinku modula za tvorjenje govora, učinku modula za razpoznavanje govora, težavnosti pridobivanja informacij, hitrosti interakcije, izkušenosti uporabnikov, ustreznosti odzivov sistema, pričakovanem obnašanju sistema in načrtovani rabi sistema v prihodnosti. Odgovori so bili podani z lestvico od 1 (nikakor se ne strinjam) do 5 (popolnoma se strinjam). 3. Eksperiment Čarovnik iz Oza 25 1. Ali ste sistem brez težav razumeli? 2. Ali vas je sistem razumel? 3. Ali ste brez težav prišli do odgovora na vaša vprašanja? 4. Ali je bila hitrost interakcije s sistemom primerna? 5. Ali ste na vsakem koraku dialoga vedeli, kaj morate povedati? 6. Ali se je sistem na vaše izjave odzival hitro (brez pojasnilnih vprašanj)? 7. Ali se je sistem obnašal tako, kot ste med dialogom od njega pričakovali? 8. Glede na vašo izkušnjo s sistemom za podajanje informacij o vremenu, ali boste (ko bo to mogoče) poklicali sistem, če vas bo zanimalo vreme? Tabela 3.2: Del vprašalnika, s katerim so udeleženci eksperimenta ocenjevali sistem Čarovnik iz Oza Povprečne ocene uporabnikov so podane v tabeli 3.3. Najslabše je bila ocenjena hitrost interakcije s sistemom, in sicer 3.94, kar pa niti ni tako slabo, če vemo, da je bil povprečen čas čakanja na odziv sistema 5.57 sekund. Večji del tega časa je porabil čarovnik, da je posredoval izbran odziv. Vse ostale ocene, od katerih se večina vsaj delno nanaša na učinek čarovnika, ležijo med 3.99 in 4.51. Povprečne ocene Tvorjenje govora 4.42 Razpoznavanje govora 4.51 Pridobivanje informacij 4.27 Hitrost interakcije 3.94 Izkušenost uporabnikov 4.40 Ustreznost odzivov 4.23 Pričakovano obnašanje 4.31 Raba v prihodnosti 3.99 Tabela 3.3: Povprečne ocene sistema Čarovnik iz Oza V eksperimentu smo opazili nekaj zanimivosti. Prva je ta, da je večina uporabnikov svoja vprašanja oblikovala zelo podobno, ponavadi Zanima me ..., Rad/Rada bi vedel/vedela ..., Mi lahko (prosim) poveste ..., Ali mi lahko poveste ..., ipd. Druga zanimivost je prilagajanje uporabnikovega vedenja na pričakovane jezikovne sposobnosti 3. Eksperiment Čarovnik iz Oza 26 sistema. V našem eksperimentu smo ugotovili, da je bilo prvo vprašanje, ki so ga uporabniki zastavili, ponavadi veliko daljše in veliko manj jedrnato kot vprašanja, ki so sledila. Primeri dolgih in nejedrnatih začetnih vprašanj so na primer: . Jaz moram danes na Primorsko, pa me je malo strah burje. Zdaj me pa zanima, kje začenja pihati, a na vetrišču ali šele s Svete gore navzdol proti Gorici. . Glejte. Trenutno se peljem z Jesenic proti Ljubljani. Razmere na cesti so obupne. Vseskozi piha močan veter s smeri vzhoda. Zdaj me pa zanima, kakšen veter piha v Ljubljani. Se pravi, moč pa smer, od kod piha. . Danes bi radi prišli v Ljubljano na izlet. Malo bi se sprehajali, pa na ljubljanski grad bi šli radi. Pa nas zanima, če je v Ljubljani kaj sonca, če je lep razgled z gradu. V primerih, ko je sistem uporabnike prosil, naj vprašanje ponovijo, pa je njihov govor postal bolj artikuliran, počasnejši in/ali glasnejši. Že [Zoltan-1991] je prišel do podobnih ugotovitev, namreč da jezikovne sposobnosti sistema za dialog opazno vplivajo na vedenje uporabnikov. Cohen in Oviatt (1995) pa trdita, da bodo uporabniki svoje besedišče zelo verjetno prilagodili sistemovemu, če bodo v njem zaznali omejitve. SISTEM: Dober dan. Pogovarjate se s sistemom za podajanje informacij o vremenu. Kakšno je vaše vprašanje? UPORABNIK: Mi lahko prosim poveste, kakšna bo danes vidljivost na Štajerskem? SISTEM: Počakajte trenutek, prosim ... [čarovnik izbira svoj odziv] Na Štajerskem bo danes podnevi vidljivost nad 10 km. Imate še kakšno vprašanje? UPORABNIK: A bo kaj snežilo? SISTEM: Kateri kraj vas zanima? UPORABNIK: Štajerska. SISTEM: Počakajte trenutek, prosim ... [čarovnik izbira svoj odziv] Ne, na Štajerskem danes podnevi - razjasnitve. Imate še kakšno vprašanje? UPORABNIK: Kakšno pa bo vreme v prihodnjih dneh na Poljskem? SISTEM: Imam podatke za danes. UPORABNIK: Torej, kako bo danes na Poljskem? SISTEM: Počakajte trenutek, prosim ... [čarovnik izbira svoj odziv] V Varšavi na Poljskem je oblačno, temperatura zraka je -6 stopinj celzija. Imate še kakšno vprašanje? UPORABNIK: A je kaj snega na Poljskem? SISTEM: Te informacije ne ponujam. Imate morda kakšno drugo vprašanje? UPORABNIK: Ne, najlepša hvala. Nasvidenje. SISTEM: Hvala lepa za sodelovanje. Nasvidenje. Tabela 3.4: Primer dialoga med uporabnikom in sistemom Čarovnik iz Oza 3. Eksperiment Čarovnik iz Oza 27 Tretja zanimivost, ki smo jo opazili v prvem eksperimentu Čarovnik iz Oza, so smeh, šale in duhovite opazke, ki so jih nekateri uporabniki delali na račun sistema, medtem ko je čarovnik posredoval svoj odziv. Primeri takih opazk so: -W Kakšen glas ... Grozno ... -W Išče po računalniku ... -W Razmišlja ... Takšne reakcije in stranske opazke so najbrž bolj verjetne v testiranjih sistemov za dialog kot pa v komercialnih sistemih, saj v takih testiranjih uporabniki ponavadi igrajo le vloge dejanskih uporabnikov, niso pod časovnimi omejitvami in ne odgovarjajo za stroške telefonskega pogovora. Primer dialoga med uporabnikom in sistemom Čarovnik iz Oza je podan v tabeli 3.4. Zbirka spontanega govora, ki smo jo pridobili v prvem eksperimentu Čarovnik iz Oza, smo poimenovali SSSQ [Hajdinjak-2003b]. Kratica SSSQ se nanaša na angleško besedno zvezo Slovenian Spontaneous Speech Queries. Zbirko smo označili z orodjem Transcriber [Barras-2001], pri čemer smo poleg oznak besed uporabili še posebne oznake za narečne besede, premore in negovorne zvoke (vdih, izdih, vzdihljaj, tlesk, smeh, pih, kašelj in različne zvoke, ki nastajajo pri obotavljanju oz. razmišljanju). Zgradba te zbirke spontanega govora je prikazana v tabeli 3.5. Sestavljena je iz 76 dialogov, ki vsebujejo 662 izjav uporabnikov. Skupna dolžina dialogov znaša 103.02 minute, dolžina človeškega govora pa 41.18 minut. število dialogov 76 število izjav uporabnikov 662 število različnih besed 920 število vseh besed 5442 dolžina vseh dialogov 103.02 min dolžina človeškega govora 41.18 min Tabela 3.5: Zgradba SSSQ zbirke spontanega govora Dialoge, pridobljene z eksperimentom Čarovnik iz Oza, ki odražajo strukturo dialogov človek - računalnik, smo podrobneje analizirali in ugotovili, da je povprečna dolžina pogovora bila 81.33 sekund, povprečni čas trajanja uporabnikovega govora pa 32.51 sekund. Ta razlika je precej velika zaradi nekoliko daljšega (5.57 sekund v povprečju) odzivnega časa sistema, t.j. časa, ki gaje čarovnik porabil, daje sistemu sporočil, kako naj se na uporabnikovo izjavo odzove. Povprečno število izjav uporabnikov v dialogih je bilo 8.71, povprečno število besed v izjavah uporabnikov pa 7.96. V tabeli 3.6 so poleg povprečnih vrednosti podane tudi mediane posameznih parametrov. V poglavju 7 so podani rezultati izračuna dodatnih parametrov, ki jih uporabljamo za evalvacijo sistema Čarovnik iz Oza in modula za vodenje dialoga. 3. Eksperiment Čarovnik iz Oza 28 povprečje mediana število izjav na dialog 8.71 8.00 število besed na izjavo 7.96 7.00 dolžina dialoga 81.33 s 68.22 s dolžina človeškega govora 32.51 s 28.80 s Tabela 3.6: Rezultati analize dialogov, pridobljenih v prvem eksperimentu Čarovnik iz Oza 3.4 Drugi eksperiment Čarovnik iz Oza Ko smo razvili modul za vodenje dialoga (poglavje 5) in ga vgradili v sistem, smo eksperiment Čarovnik iz Oza ponovili. Cilj in namen drugega eksperimenta je bil pridobiti podatke, ki bi poleg podatkov iz prvega eksperimenta tvorili osnovo za evalvacijo modula za vodenje dialoga. Naloga čarovnika v drugem eksperimentu Čarovnik iz Oza je, v primerjavi s prvim eksperimentom, bila igrati vlogo modulov za razpoznavanje govora in razumevanje naravnega jezika, ne pa tudi vloge modula za vodenje dialoga. V tem eksperimentu je čarovnik sedel pred vmesnikom modula za vodenje dialoga in preko tipkovnice vnašal pomensko predstavitev uporabnikove izjave, ki bo v končnem sistemu izhod iz modula za razumevanje naravnega jezika. Vse nadaljnje delo (vodenje dialoga, iskanje podatkov, tvorjenje naravnega jezika, tvorjenje govora) je opravljal sistem. V eksperimentu je sodelovalo 68 uporabnikov, 29 žensk in 39 moških, katerih povprečna starost je bila 32 let. Čeprav je 17 izmed njih že sodelovalo v prvem eksperimentu Čarovnik iz Oza in so zato bili malo bolj izkušeni od ostalih, med vedenjem obeh skupin nismo opazili nobene razlike. Uporabnike (tudi tiste, ki so že sodelovali v prvem eksperimentu) smo, tako kot v prvem eksperimentu, prepričali, da se bodo pogovarjali z računalnikom, t.j. s sistemom za podajanje informacij o vremenu, in jim dali ustna navodila o splošni funkcionalnosti sistema. Vsakemu izmed udeležencev smo dodelili dve nalogi, podobno kot v prvem eksperimentu, od katerih je bila prva pridobiti določeno informacijo, druga pa scenarij oz. situacija, ki naj bi si jo udeleženec poskušal zamisliti. Po končanem pogovoru s sistemom smo uporabnike prosili, da izpolnijo enak vprašalnik kot v prvem eksperimentu. Del vprašalnika, ki zajema vprašanja, nanašajoča se na ocenjevanje sistema, je podan v tabeli 3.2. Povprečne ocene udeležencev drugega eksperimenta Čarovnik iz Oza so podane v tabeli 3.7. Te ocene so nekoliko slabše od prvih, najslabše pa so bili ocenjeni: preprostost pridobivanja informacij, hitrost interakcije sistema, ustreznost odzivov sistema in raba v prihodnosti. Zbirko spontanega govora, ki smo jo pridobili v drugem eksperimentu Čarovnik iz Oza, smo iz podobnega razloga kot v prvem eksperimentu poimenovali SSSQ2 in jo označili v skladu z oznakami zbirke SSSQ. Zgradba SSSQ2 zbirke spontanega govora je prikazana 3. Eksperiment Čarovnik iz Oza 29 Povprečne ocene Tvorjenje govora 4.29 Razpoznavanje govora 4.29 Pridobivanje informacij 3.74 Hitrost interakcije 3.76 Izkušenost uporabnikov 4.28 Ustreznost odzivov 3.76 Pričakovano obnašanje 4.04 Raba v prihodnosti 3.78 Tabela 3.7: Povprečne ocene v drugem eksperimentu Čarovnik iz Oza v tabeli 3.8. Sestavljena je iz 68 dialogov, ki vsebujejo 885 izjav uporabnikov. Skupna dolžina dialogov znaša 148.92 minut, dolžina človeškega govora pa 50.51 minut. Skupno število različnih besed (zajete so tudi govorne različice) v obeh zbirkah spontanega govora (SSSQ, SSSQ2) je 1229. število dialogov 68 število izjav uporabnikov 885 število novih besed 309 število različnih besed 716 število vseh besed 5403 dolžina vseh dialogov 148.92 min dolžina človeškega govora 50.51 min Tabela 3.8: Zgradba SSSQ2 zbirke spontanega govora Dialoge, pridobljene z drugim eksperimentom Čarovnik iz Oza, smo podrobneje analizirali in ugotovili, daje bila povprečna dolžina pogovora 117.57 sekund, povprečni čas trajanja uporabnikovega govora pa 39.87 sekund. Ta razlika je spet precej velika, in sicer zaradi nekoliko daljšega (6.61 sekund v povprečju) odzivnega časa sistema, t.j. čas, ki ga je čarovnik porabil, da je modulu za vodenje dialoga posredoval pomensko predstavitev uporabnikove izjave. Povprečno število izjav uporabnikov v dialogih je bilo 11.64, povprečno število besed v izjavah uporabnikov pa 6.33. V tabeli 3.9 so poleg povprečnih vrednosti podane tudi mediane posameznih parametrov. Vidimo (tabeli 3.6 in 3.9), da so drugi eksperiment zaznamovali predvsem daljši dialogi, in sicer tako po številu izjav kot tudi po časovnem trajanju. To je v glavnem posledica v drugem eksperimentu izvajane strategije vodenja dialoga (poglavje 5), ki se od strategije čarovnika v prvem eksperimentu razlikuje predvsem po prošnjah sistema za potrditev posredovanih informacij. Te potrditve, zavrnitve oz. popravki so zaradi svoje jedrnatosti tudi glavni razlog v povprečju krajših izjav, saj so velikokrat sestavljeni le iz ene ali dveh besed. Zanimivo je, da so udeleženci drugega eksperimenta slabše ocenili prav vse vidike svoje 3. Eksperiment Čarovnik iz Oza 30 povprečje mediana število izjav na dialog 11.64 11.00 število besed na izjavo 6.33 6.00 dolžina dialoga 117.57 s 108.42 s dolžina človeškega govora 39.87 s 37.78 s Tabela 3.9: Rezultati analize dialogov, pridobljenih v drugem eksperimentu Čarovnik iz Oza interakcije s sistemom, tudi učinek modulov za tvorjenje in razpoznavanje govora, ki sta v obeh eksperimentih ostala enaka. Glede na to, da so tako storili tudi tisti, ki so sodelovali v obeh eksperimentih Čarovnik iz Oza, razloga ne moremo pripisati večji kritičnosti udeležencev. Zelo verjetno pa so slabše ocene posledica manjšega zadovoljstva z nekaterimi posameznimi vidiki učinkovitosti sistema. Najbolj opazna razlika je v ocenah težavnosti pridobivanja informacij (4.27 oz. 3.74) in ustreznosti odzivov sistema (4.23 oz. 3.76), pri čemer je treba poudariti, da so bile slabše ocene nekaterih vidikov učinkovitosti sistema vsekakor pričakovane, saj bi v nasprotnem primeru modul za vodenje dialoga v drugem eksperimentu bolje opravljal svojo nalogo kot človeški operater v prvem eksperimentu. Da bi vsaj delno odpravili etično vprašljivost eksperimentov Čarovnik iz Oza, smo po obeh eksperimentih udeležencem povedali, kaj smo počeli, zakaj smo tako ravnali, in jih vprašali za dovoljenje uporabe pridobljenih podatkov v raziskovalne namene. Prav vsi so pokazali razumevanje in odobravanje teh eksperimentov, dovolili pa so nam tudi uporabo posnetkov in drugih podatkov, ki smo jih v eksperimentih pridobili. // Oblikovanje in razvoj sistemov za dialog 4.1 Kdaj je sistem za dialog uporaben 4.2 Vodila pri oblikovanju sistemov za dialog 4.3 Tehnike modeliranja dialoga Opredelili bomo pojem uporabnosti govornih vmesnikov, ki zaobsega učljivost, učinkovitost, zapomnljivost, napake in zadovoljstvo uporabnikov. Opisali bomo Griceove maksime naravne komunikacije in našteli Shneidermanovih 8 zlatih pravil oblikovanja sistemov, ki pogosto služijo kot vodilo pri oblikovanju sistemov za dialog. Pregledali bomo tudi trenutno uveljavljene tehnike modeliranja dialoga ter podali njihove dobre in slabe lastnosti. 31 4. Oblikovanje in razvoj sistemov za dialog 32 4.1 Kdaj je sistem za dialog uporaben Ena izmed najpomembnejših lastnosti sistemov za dialog je uporabnost. To je širok pojem, ki ima na področju sistemov za dialog več različnih definicij. Nielsen (1993) je na primer zapisal, da je uporabnost sistema večdimenzionalen pojem, ki zaobsega učljivost, učinkovitost, zapomnljivost, napake in zadovoljstvo ter opisuje načine, kako jih merimo. V nadaljevanju bomo opisali, kakšen je pomen teh pojmov v primeru govornih vmesnikov. Govorni vmesnik naj bo učljiv, kar pomeni, da bi se ga naj dalo brez težav naučiti uporabljati. To je pri govornih vmesnikih vsekakor lažje doseči kot pri ostalih sistemih, saj temelji na naravnem načinu komunikacije - na govoru. Zaradi omejitev pri razpoznavanju govora pa je število različnih vhodov v tak sistem omejeno, posledica česar je, da se morajo uporabniki naučiti, kaj lahko v določenem kontekstu povedo in kaj ne. Najenostavnejši način določanja stopnje učljivosti je merjenje povprečnega časa, ki ga novi uporabniki porabijo, dokler ne dosežejo določene stopnje izkušenosti. Naslednji pojem je učinkovitost govornega vmesnika, ki je definiran kot stopnja storilnosti sistema pri interakciji z izkušenimi uporabniki, kot imenujemo uporabnike, ki so si nabrali s sistemom določeno količino izkušenj. Eden izmed načinov, kako meriti učinkovitost govornega vmesnika, je določiti značilne naloge in meriti čas, ki ga izkušeni uporabniki porabijo, da te naloge izpolnijo. Pojem zapomnijivosti je pomemben predvsem za uporabnike, ki govorni vmesnik uporabljajo le občasno. Stopnjo zapomnljivosti lahko merimo s spominskim testom, kjer uporabnike po končani interakciji s sistemom prosimo, naj razložijo, kako bi se sistem odzival na določene govorne ukaze, in/ali povedo, kateri govorni ukazi so potrebni za izvedbo določene akcije. Drug način merjenja stopnje zapomnljivosti je merjenje časa interakcije s sistemom, ki ga uporabniki potrebujejo za izvedbo določene naloge. Četrta dimenzija pojma uporabnosti je povezana z napakami. V splošnem bi naj uporabniki sistema delali čim manj napak, čeprav je v primeru govornih vmesnikov veliko bolj verjetno, da bo večino napak naredil sistem. Število in pogostost napak, ki jih delajo uporabniki in sistem, ugotovimo tako, da jih preštejemo. Zadnja dimenzija je subjektivni pojem zadovoljstva, ki pove, ali uporabniki dani govorni vmesnik radi uporabljajo. Obstaja več načinov merjenja zadovoljstva, najpogostejši pa je način z vprašalniki, kijih uporabniki po interakciji s sistemom izpolnijo. Alternativa so merjenja psiho-fizičnih lastnosti uporabnikov, kot sta srčni utrip in krvni tlak. Ta merjenja so sicer bolj objektivna in zanesljiva, vendar so nepriljubljena, ker ponavadi vodijo do nesproščenosti uporabnikov. Swerts in Krahmer (2000) pa sta predlagala merjenje zadovoljstva s pomočjo govornega signala uporabnikov; če interakcija ni tekoča, uporabniki namreč težijo k spremembam govora: k boljši artikulaciji, glasnejšemu in/ali počasnejšemu govoru, ipd. 4. Oblikovanje in razvoj sistemov za dialog_______________________33 4.2 Vodila pri oblikovanju sistemov za dialog Če želimo razvijati sisteme za podajanje informacij, ki bodo ustrezali zahtevam uporabnikov, moramo najprej ugotoviti, kako naj se ti obnašajo. V ta namen si oglejmo osnovni princip in štiri maksime naravne komunikacije, ki jih je Griče (1975) oblikoval kot vodilo sodelujoče komunikacije med ljudmi. Osnovni princip, ki ga naj ne bi kršil nobeden udeleženec dialoga, je princip sodelovanja: Prispevek k dialogu naj ustreza pričakovanjem v trenutnem stanju dialoga. Njegove maksime pa karakteriziraju sodelujoč odgovor, t.j. odgovor, ki je pravilen, uporaben in ni dvoumen. 1. Maksima kvalitete zahteva, da naj bodo vsi prispevki k dialogu veljavni. Izjave in podatki udeležencev dialoga morajo biti resnični in ne pretirani. Kaplan (1982) je maksimo kvalitete priredil sistemom za podajanje informacij. Odzivi, ki jih daje takšen sistem, naj uporabnika ne bi zapeljali, in če lahko jedrnat odgovor uporabnika pripelje do napačnih zaključkov, bi naj sistem z dodatnimi informacijami to preprečil. 2. Maksima kvantitete pravi, da naj bodo vsi prispevki k dialogu ravno prav informativni, da ne smejo biti niti preskopi niti preveč nabiti s podrobnostmi. 3. Maksima odnosa pravi, da naj se udeleženec dialoga odziva v skladu s cilji in namerami sogovornika. 4. Maksima načina pravi, da naj se udeleženec dialoga izogiba dvoumnostim, da naj bo jedrnat. Za sistem za podajanje informacij to pomeni, da naj bodo njegove izjave zasnovane v obliki, ki jo bo uporabnik brez težav razumel. Sistem naj daje čimbolj jedrnate izjave, ne da bi kršil katero izmed ostalih maksim. Ker je naš namen razviti sistem za dialog, ki bo sodeloval z uporabnikom, nam bodo te maksime služile kot vodilo pri oblikovanju sistema. Številni raziskovalci, ki se ukvarjajo z uporabnostjo sistemov, so predstavili delno prekrivajoča se vodila za oblikovanje vseh vrst sistemov (npr. Normanovi 4 principi dobre konstrukcije [Norman-1988], Nielsenovih 11 hevristik uporabnosti [Nielsen-1993] in Shneidermanovih 8 zlatih pravil [Shneiderman-1986]), nekateri pa so ta vodila priredili govornim vmesnikom ali zasnovali nova vodila [Hapeshi-1993, Leiser-1993, Lea-1994, Cosky-1995, Gardner-1999, Karat-1999]. Mnoge hevristike in vodila lahko razumemo kot pomoč uporabniku pri snovanju pojmovnega modela sistema. Uporabnikov pojmovni model, ki ga ta ponavadi gradi s pomočjo izkušenj, zajema mišljenje oz. predpostavke uporabnika o delovanju sistema in omogoča miselno simulacijo delovanja sistema. Dober pojmovni model bo uporabniku omogočal napoved posledic svojih dejanj. Tudi razvijalci imajo ponavadi oblikovan pojmovni model sistema, pri čemer se v idealnem primeru modela uporabnika in razvijalcev ujemata. Ker pa uporabnik in razvijalci ponavadi ne sodelujejo neposredno (vmesni člen je sistem), ta ideal ni nikoli dosežen. 4. Oblikovanje in razvoj sistemov za dialog 34 Krahmer (2001) zato trdi, da mora pri gradnji dobrega pojmovnega modela sistem uporabniku pomagati. To je še posebej težko pri govornih vmesnikih, kjer uporabniki sistema ne vidijo. Gradnjo dobrega pojmovnega modela v govornih vmesnikih bi zagotovo olajšali, če bi vzporedno z govorno komunikacijo vzpostavili tudi grafično komunikacijo, kjer bi sistem na zaslonu, pred katerim bi sedel uporabnik, prikazoval trenutno dogajanje. Okoliščine pa so tiste, ki take multimodalne komunikacije pogosto ne dovoljujejo. V nadaljevanju bomo opisali verjetno najširše sprejeta vodila pri oblikovanju sistemov, namreč Shneidermanovih 8 zlatih pravil oblikovanja sistemov [Shneiderman-1986], in jih, kjer bo to potrebno, s pomočjo literature dopolnili do vodil za govorne vmesnike. 1. Težiti h konsistentnosti: Konsistentnost je temelj uporabnosti sistema. Uporabnik si lažje zgradi dober pojmovni model sistema in njegova dejanja lažje napove, če so odzivi sistema konsistentni. Kljub temu pa je včasih, ko želimo uporabnika na kaj opozoriti ali pritegniti njegovo pozornost, bolje uporabiti nekonsistentne in nestandardne odzive. 2. Rednim uporabnikom omogočiti bližnjice: Med izkušenostjo uporabnikov sistema so ponavadi zelo velike razlike. Novi, neizkušeni uporabniki ponavadi potrebujejo pomoč, izkušeni uporabniki pa bi svoj cilj radi dosegli čim enostavneje in čim hitreje, zato je treba takšne razlike omogočiti. V govornih vmesnikih to dosežemo z dialogom mešanih iniciativ. 3. Ponuditi informativno podporo: Uporabniki naj vedo, katero dejanje so sprožili in kakšen rezultat so dosegli. To je še posebej pomembno pri govornih vmesnikih, ker uporabnik sistema ne vidi in ker zaradi omejitev razpoznavanja govora obstaja možnost, da sistem uporabnika ni pravilno razumel. Odzivi sistema naj bodo zato razumljivo jedrnati, enostavni in konsistentni, vsebujejo pa naj tudi nadaljevalno vprašanje ali navodilo kako nadaljevati [Lea-1994]. 4. Dialog naj bo zaprt: Zaporedje dejanj naj bo urejeno po skupinah z začetkom, sredino in koncem, s čimer interakcijo strukturiramo in tako omogočimo, da se uporabnik hitreje uči in si zgradi boljši pojmovni model sistema. V primeru govornih vmesnikov je uporabniku treba ponuditi pomoč, da se v dialogu znajde [Lea-1994]. Omogočiti je treba prekinitev in osvežitev predhodnega stanja dialoga [Leiser-1993] ter preskoke [Lea-1994]. 5. Preprečevati napake in omogočiti preprosto ravnanje z njimi: Število napak v veliki meri določa uporabnost sistema, kar je še posebej pomembno pri govornih vmesnikih. Ko se napaka pojavi, naj krivdo prevzame sistem, ki naj uporabniku omogoči, da napako popravi, brez da bi moral vse še enkrat ponoviti [Lea-1994]. 6. Omogočiti enostaven preobrat dejanj: Uporabnik naj se zaveda, da bo morebitne napake brez težav popravil, kar bo zmanjšalo njegovo zaskrbljenost med interakcijo s sistemom. 7. Podpreti notranji nadzor: Uporabniki ponavadi ne marajo kontrole sistema, zato naj bodo pobudniki dejanj. Izjema so situacije, ko pride do napak, saj je v tem primeru ugodneje, če pobudo, ki vodi do rešitve, prevzame sistem. 4. Oblikovanje in razvoj sistemov za dialog 35 8. Zmanjšati kratkočasovna spominska bremena: To pravilo temelji na omejitvah kratkočasovnega spomina pri človeku, pravi pa, daje zaporedja dejanj in ključnih besed, ki si jih mora uporabniki zapomniti, potrebno minimizirati. To vodi do zanimivega paradoksa pri naravnih govornih vmesnikih. Po eni strani si uporabniku takega vmesnika ni treba zapomniti načina interakcije, po drugi strani pa ga omejitve razpoznavanja govora prisilijo, da uporablja omejen slovar besed, ki jih sistem pozna. Množice pravil oz. vodil kot so Shneidermanova zlata pravila, so uporabne iz dveh razlogov. Uporabljamo jih lahko že pri razvoju sistema ali pa šele pri hevristični eval-vaciji sistema [Nielsen-1993], ki jo ponavadi izvaja manjša skupina strokovnjakov, ki na osnovi danih pravil ovrednoti njegovo uporabnost. Take množice vodil pa imajo ponavadi slabosti. Osnovna težava je, da je večino vodil lažje oblikovati kot izvesti. V primeru Shneidermanovih zlatih pravil so nekatera pravila že na prvi pogled osnovna, druga (npr. 6 in 7) pa se zdijo manj osnovna. Krahmer (2001) si celo zastavlja vprašanje, zakaj je pravilo 8 sploh potrebno. Zakaj se to pravilo ne glasi zagotoviti dober pojmovni model [Norman-1988] ali zagotoviti pomoč in navodila [Nielsen-1993]. Tudi to sta pomembni pravili, specifični za govorne vmesnike, ki pa ne spadata med osem zlatih pravil. 4.3 Tehnike modeliranja dialoga Potek dialoga med uporabnikom in sistemom uravnava modul za vodenje dialoga. Ideal mnogih raziskovalcev je strategija vodenja dialoga, ki bi omogočala uporabniku, da se s sistemom pogovarja tako kot s človekom, in znotraj katere bi tako uporabnik kot sistem imela možnost prevzeti iniciativo, ko bi to želela. Tako strategijo pa je težko doseči iz najmanj dveh razlogov; ker predvideva, da bi naj uporabnik imel možnost povedati takorekoč karkoli kadarkoli, kar predstavlja veliko težavo za razumevanje govora, in ker bi moral sistem ves čas slediti iniciativi in se glede na njo fleksibilno odzivati. Vsak modul za vodenje dialoga skupaj s strategijo in tehniko modeliranja dialoga predstavlja nekakšen model dialoga. Tehnika, s katero je strategija vodenja dialoga udejanjena, pa mora zadoščati vsaj eni zahtevi, namreč računski obvladljivosti. Opisali bomo naslednje temeljne tehnike modeliranja dialoga: -W tehnika končnih avtomatov, -W tehnika polnjenja predalčkov, -W tehnika množice domen, -W tehnika usmerjanja k cilju in -W tehnika razumskih agentov. Najpreprostejša tehnika modeliranja dialoga temelji na končnih avtomatih, dialog pa je definiran kot pot med začetnim in končnim stanjem avtomata. Ker je število stanj 4. Oblikovanje in razvoj sistemov za dialog 36 in število prehodov med stanji v takšnih avtomatih končno in vnaprej določeno, lahko z njimi modeliramo samo preproste dialoge, ki so povsem odvisni od domene, t.j. od komunikacijskega področja. Vzrok je v tem, da ta tehnika ne omogoča sistematičnega ločevanja med nalogo in strategijo vodenja dialoga. Prav zaradi tega je, če želimo model dialoga prenesti na drugo domeno, končni avtomat potrebno ponovno zgraditi. Nadaljnja slabost je hitra eksplozija stanj in prehodov med njimi. Prednosti tehnike končnih avtomatov pa so zagotovo: preprostost, razumljivost in časovna učinkovitost računalniškega algoritma [Larson-1992]. Na sliki 4.1 je prikazan primer modela dialoga za ugotavljanje želenega televizijskega programa, ki temelji na tehniki končnih avtomatov. Dialog se začne v začetnem stanju Začetek, od koder se takoj premakne v naslednje stanje (takšen prehod v končnem avtomatu ponavadi imenujemo e-prehod). V tem stanju sistem uporabnika vpraša, kateri televizijski program bi rad gledal. Nadaljevanje dialoga je odvisno od števila hipotez izgovorjenega televizijskega programa, ki jih vrne modul za razpoznavanje govora. Če modul za razpoznavanje ne vrne nobene hipoteze (npr. v primeru, ko uporabnik ni odgovoril na vprašanje), sistem vprašanje ponovi. Če vrne eno samo hipotezo (npr. SLOl), je cilj dialoga dosežen, zato se premakne v končne stanje avtomata Konec. Če pa modul za razpoznavanje govora vrne več hipotez izgovorjenega televizijskega programa (npr. SLOl, SL02), sistem uporabnika vpraša, ali želi gledati enega izmed teh programov (npr. Ali želite gledati SLOl?). V primeru, ko razpoznavalnik govora vrne Da, je cilj dialoga dosežen, v nasprotnem primeru pa sistem vprašanje ponovi. Začetek 0 možnosti Ne Kateri program želite gledati?J^r >1 možnost 1 možnost Ali želite gledati ? Slika 4.1: Preprost primer dialoga, modeliranega s končnim avtomatom Zaradi slabosti in omejitev dialogov, modeliranih s končnimi avtomati, so se pojavile nove tehnike modeliranja dialoga. Tehnika polnjenja predalčkov in tehnika množice domen še vedno temeljita na končnih avtomatih, a dialog modelirata na višjem, sploš-nejšem nivoju. Nekatere tehnike poskušajo končne avtomate obogatiti, npr. z verjetnostnim sklepanjem [Krahmer-2001], ostale tehnike, kot sta tehnika usmerjanja k cilju in tehnika razumskih agentov, pa gledajo na dialog z drugačne perspektive in se osredotočajo na cilje in namere uporabnika. 4. Oblikovanje in razvoj sistemov za dialog 37 Tehnika polnjenja predalčkov [Goddeau-1996] rešuje številne težave dialogov, modeliranih s tehniko končnih avtomatov, in predstavlja ta čas najobičajnejši način modeliranja dialogov v govornih vmesnikih. Vhod v modul za dialog je v tem primeru pomenska predstavitev uporabnikove izjave, ki je podana s predalčki in njihovimi elementi. Napolniti predalčke pomeni pridobiti ustrezne tipe podatkov, ki bodo omogočili dostop do podatkovne zbirke ali izvršitev kake druge akcije. Prednost te tehnike v primerjavi s tehniko končnih avtomatov je boljša prenosljivost na druge domene, kar je omogočeno z ločitvijo naloge in strategije vodenja dialoga; naloga je napolniti predalčke, strategija pa predstavlja način, kako to naredimo. Slabost tehnike polnjenja predalčkov, ki se je sicer izkazala za zelo uporabno v sistemih za podajanje informacij, pa je, da sprememba strategije vodenja dialoga zahteva oblikovanje nove množice pravil. Tipični primeri sistemov, kjer je tehnika polnjenja predalčkov zelo ustrezna, so sistemi za podajanje informacij o železniških povezavah [Sturm-1999] in sistemi za podajanje informacij o letalskih prevozih [Ipšič-1999, Stallard-2000]. Ti dostopajo do voznega reda, ko od uporabnika pridobijo za to potrebne podatke (vstopna in izstopna postaja, čas in datum potovanja). Primer pomenske predstavitve uporabnikove izjave Ali leti v torek, 15. junija, kakšno letalo v London? je: vstopna postaja - izstopna postaja London datum potovanja 15/6/2004 čas potovanja 00:00>24:00 Naslednja tehnika modeliranja dialoga je tehnika množice domen [Xu-2000], ki omogoča preklapljanje med različnimi domenami oz. komunikacijskimi področji (npr. rezervacije hotelov in najemi avtomobilov), modeliranimi s tehniko polnjenja predalčkov. Prednosti in slabosti so podobne kot pri tehniki polnjenja predalčkov, s pomembno razliko, da tehnika množice domen že zajema več različnih domen. Prva od tehnik nestrukturiranega modeliranja dialoga je tehnika usmerjanja k cilju [Allen-1995], ki je z razliko od prej omenjenih tehnik primerna predvsem za sisteme za reševanje problemov, v katerih uporabnik in sistem sodelujeta pri reševanju problema oz. doseganju določenega cilja. Tu se uporablja teorija govornih dejanj [Searle-1969], ki trdi, daje izjave uporabnika potrebno obravnavati kot dejanja (npr. vprašanje, zahteva, obvestilo), ki jih je mogoče opredeliti s pomočjo potrebnih in zadostnih pogojev za izvedbo. Te pogoje in njihove posledice lahko definiramo s pomočjo prepričanj, želja in namer poslušalcev in govorcev. Na sliki 4.2 je prikazan BDI model [Bratman-1988], ki podaja zvezo med izjavami na eni ter prepričanji, željami in namerami uporabnika na drugi strani. Model predpostavlja, da sistem na osnovi predpostavk o trenutnih prepričanjih in željah uporabnika določi komunikacijske namere, ki predstavljajo temelj konstrukcije načrta govornih dejanj, za katerega verjame, da bo pripeljal do cilja. Sistem začne načrt izvajati tako, da sproži začetno dejanje. Izvajanje govornih dejanj, še bolj pa reakcije uporabnika, ponavadi vodijo do novega stanja sveta, t.j. do novih predpostavk o prepričanjih in željah uporabnika. V skladu z njimi, če je potrebno, sistem načrt govornih dejanj spremeni. Prednost te tehnike je nizka odvisnost od domene in dialog, ki je podoben človekovemu, 4. Oblikovanje in razvoj sistemov za dialog 38 slabost pa je poleg v splošnem časovno zahtevnega računalniškega algoritma tudi dejstvo, da pojma prepričanje in želja nista natančno formalizirana. To pomeni, da ne obstajajo neodvisni razumski principi, ki bi pojasnjevali obnašanje sistema. Sklepanje Dojemanje Prepričanja Želje Namere -* Dejanje Slika 4.2: BDI model Obnašanje človeka med dialogom vsekakor najbolje modelira tehnika razumskih agentov [Smith-1998], ki s pomočjo logične formalizacije prepričanj, želja in namer tehniko usmerjanja k cilju izboljša. Sadek (1994), ki je eden izmed glavnih zagovornikov uporabe te tehnike modeliranja dialoga v govornih vmesnikih, je uvedel vrsto sprememb in razširitev osnovne tehnike razumskih agentov, predstavljene v [Cohen-1990]. Formalizacijo prepričanj, želja in namer, ki zaobsega tudi množico aksiomov, imenujemo razumska enota. Razumska enota temelji na dveh razumskih principih: -W agent izbira dejanja v skladu s svojim namerami in -W agentova namera po nekem dejanju vsebuje namero uresničitve predpogojev tega dejanja. V namene formalizacije z B(i,p) označimo prepričanje i-tega agenta v resničnost izjave p, G(i,p) pa naj pomeni, daje p želja i-tega agenta. Prepričanja lahko formaliziramo z logiko NKD45 [Montague-1960], ki zaobsega naslednje aksiome sklepanja: (N) če p vedno velja, potem velja tudi B(i,p) (K) B(i,p)AB(i,p=>q)=>B(i,q) (D) B(i,p)^-B(i-p) (4) B(i,p)^B(i,B(i,p)) (5) -B(i,p)^B(i,-B(i,p)) Aksiom (N) trdi, da agent verjame vse, kar vedno velja, aksiom (K) pravi, da so prepričanja zaprta za implikacijo, aksiom (D) pa, da so prepričanja konsistentna (če je agent i prepričan v resničnost izjave p, potem ne more verjeti tudi p). Aksioma (4) in (5) opisujeta pozitivno oz. negativno introspekcijo (če je agent i prepričan v resničnost izjave p, potem verjame v svoje prepričanje o resničnosti izjave p; če agent i ni prepričan v resničnost izjave p, potem verjame, da sam ni prepričan v resničnost p). 4. Oblikovanje in razvoj sistemov za dialog 39 Podobno lahko formaliziramo tudi želje: (K) G(i,p)AG(i,p=>q)=>G(i,q) (D) G(t,p)^-G(t,-p) Povezava med prepričanji in željami je v [Cohen-1990] podana z dvema omejitvama; z razumno omejitvijo -B(i,p) =>-G(i,p), ki trdi, da si agent ne more želeti nekaj, za kar verjame, da ni res, in s pričakovano omejitvijo implikacije G(i,p) A B(i,p =>- q) =>- G(i, q), ki trdi, da so tudi pričakovane posledice ciljev cilji agenta. Čeprav so vsa podana pravila sklepanja preprosta in intuitivna, pa se ta, če želimo dovoliti, da agent obstoječo željo tudi opusti, hitro zakomplicirajo. Modul za vodenje dialoga kot razumski agent uravnava dialog tako, da na osnovi pomenske predstavitve uporabnikove izjave in pravil sklepanja prihaja do predpostavk o prepričanjih in željah uporabnika. Prednost te tehnike, poleg boljšega modeliranja človekovega obnašanja med dialogom, je, da je teorija od domene in jezika takorekoč neodvisna. Ko želimo govorni vmesnik prirediti za novo domeno, je potrebno le ak-siomatizirati znanje te domene. Slabost pa je v kompleksnosti in moči uporabljene logike, ki logiko 1. reda kombinira z epistemično logiko (za sklepanja o prepričanjih), s časovno logiko (za sklepanja glede časa) in z dinamično logiko (za sklepanja o dejanjih). Nadaljna slabost je časovno zahteven računalniški postopek osveževanja množice prepričanj in želja ter dejstvo, daje formalizacija relevantnega znanja domene v splošnem težka naloga. Za primer vzemimo izjavo uporabnika, ki jo sistem razume kot vprašanje Ali velja p (npr. Ali je na sporedu večernega televizijskega programa SL02 detektivka?). Sistem izpelje sklep, da je želja uporabnika izvedeti, ali velja p, in da uporabnik trenutno ni prepričan v resničnost nobene izmed obeh možnosti (p ali -ip). Po principu sodelovanja sistem to namero prevzame in na osnovi prvega razukega principa se odloči uporabnika obvestiti o tem, katera izmed možnosti p in ->p velja. Na osnovi drugega razumskega principa sistem ugotovi, za katero od obeh žnosti so predpogoji izpolnjeni. Če sistem (ne pa tudi uporabnik) verjame, da velja p, to pomeni, da so izpolnjeni predpogoji prvega dejanja. Sistem to dejanje izbere in o tem obvesti modul za tvorjenje naravnega jezika (Da, na SL02 bo danes zvečer detektivka.) ter osveži svoje znanje. Ena izmed posledic tega dejanja je prepričanje uporabnika, da velja p. Tehnike modeliranja dialoga, ki smo jih navedli, kljub svojim pomanjkljivostim pokrivajo večino možnih aplikacij dialoga med človekom in računalnikom (uporabni dialogi), ne pa tudi celotnega obsega naravne človeške komunikacije. Modeliranje dialoga z uporabo konverzacijske teorije iger 5.1 Konverzacijska teorija iger 5.2 Modeliranje dialoga v sistemu za podajanje informacij o vremenu Za modeliranja dialoga v sistemu za podajanje informacij o vremenu smo se odločili uporabiti tehniko usmerjanja k cilju, delno formalizirano s pomočjo konverzacijske teorije iger, pri čemer podatke pridobivamo s polnjenjem predalčkov. V takem modelu je dialog sestavljen iz konverzacijskih iger in konverzacijskih potez, ki predstavljajo različne strategije in so udejanjene kot rekurzivne mreže prehodov. Da bi dosegli čim večjo kooperativnost in čim večjo neodvisnost od domene, smo množico konverzacijskih iger in potez, ki se pojavljajo v literaturi, ustrezno razširili. 40 5. Modeliranje dialoga z uporabo konverzacijske teorije iger 41 5.1 Konverzacijska teorija iger Pri modeliranju dialoga v sistemu za podajanje informacij o vremenu smo uporabili konverzacijska teorijo iger, ki izhaja iz množice raziskav [Power-1979, Houghton-1987, Kowtko-1992, Allen-1997, Poesio-1997, Stolcke-2000], kjer so dialogi sestavljeni iz iger, kijih načrtujejo razumski agenti. Namen [Power-1979] in [Houghton-1987] je bil izdelati teorijo, ki bo opisovala, kako cilji sogovornika vplivajo na potek dialoga. Na osnovi teh ugotovitev sta Kowtko in Isard (1992) dialoge strukturirala na dva funkcijska nivoja: -W konverzacijske igre in -W konverzacijske poteze. Konverzacijske igre povezujemo z željami oz. konverzacijskimi cilji, kot je na primer cilj pridobiti določeno informacijo, in so sestavljene iz zaporedja izjav, ki se začno z iniciativo in končajo, ko je cilj igre dosežen ali igra prekinjena. Sestavne dele kon-verzacijskih iger imenujemo konverzacijske poteze. To so izjave, deli izjav ali množice izjav, ki izražajo isto namero kot je na primer potrditev ali preverjanje. Konverzacijske igre lahko poljubno gnezdimo eno v drugi, če le cilj notranje konverzacijske igre služi izpolnitvi cilja zunanje igre. Najbolj znana uporaba konverzacijske teorije iger je kodiranje obsežne (15 ur) zbirke spontanih, k cilju usmerjenih, govorjenih dialogov človek - človek [Carletta-1996a], kjer je dodan še en funkcijski nivo, namreč nivo dogovorov, t.j. delov dialoga, ki predstavljajo večje korake pri doseganju končnega cilja. Naloga enega izmed udeležencev teh dialogov je bila podvojiti zemljevid, ki ga je dobil drugi udeleženec. Primer takega zemljevida je na sliki 5.1. Dolžina in oblika dogovorov v teh dialogih je bila v veliki meri odvisna od zemljevida, ki so ga udeleženci dobili in na podlagi katerega so si nalogo razdelili na obvladljive kose. Tipičen primer dogovora je del dialoga, v katerem udeleženec, ki zemljevid podvaja, uspe narisati nek njegov odsek. Študija zbirke teh dialogov je pokazala, da v konverzacijskih igrah vprašanjem v veliki večini sledijo odgovori, izjavam pa odobritve ali zavrnitve. Na osnovi te študije avtorji razlikujejo tri osnovne tipe konverzacijskih potez: -W začetne poteze, -W odzivne poteze in -W poteze pripravljenosti. Začetne poteze se pojavljajo na začetku igre, so iniciatorji. Odzivne poteze se pojavljajo znotraj iger in so namenjene izpolnitvi pričakovanj oz. cilja, poteze pripravljenosti pa se pojavljajo potem, ko se igra zaključi, in pripravljajo dialog na začetek nove igre. Zbirka govorjenih dialogov [Carletta-1996a] je zakodirana z množico 12 kategorij konverzacijskih potez; z začetnimi potezami . Instruct (navodilo), 5. Modeliranje dialoga z uporabo konverzacijske teorije iger 42 Qotfter: Ij^ClLk JOtdCl fciRiA V Sec<¦<> I" WSdij *** ^ — ~- -¦ "^^FjNfSH / / y \ Sf-v.o!\ baff. jf ' ^ 7*\ I STAHT / .... <+Cr'bjni j!*Hle-nsnf + + Č: Slika 5.1: Primer zemljevida, uporabljenega v spontanih, govorjenih dialogih človek - človek . Explain (razlaga), . Check (preverjanje posredovane informacije), . Align (preverjanje pozornosti ali strinjanja sogovornika), . Query-yn (vprašanje, na katero je mogoče odgovoriti z da ali ne) in Query-w (vprašanje, ki ne spada v nobeno drugo kategorijo), 5. Modeliranje dialoga z uporabo konverzacijske teorije iger 43 z odzivnimi potezami . Acknowledge (razumevanje in sprejemanje prejšnje poteze), . Reply-y (odziv z da na Query-yn potezo), . Reply-n (odziv z ne na Query-yn potezo), . Reply-W (odziv na katerokoli potezo, ki ne pomeni le da ali ne) in . Clarify (odziv na katerokoli vprašanje, ki vsebuje več informacij kot vprašanje zahteva), ter s potezo pripravljenosti . Ready (zaključek trenutne in priprava na začetek nove igre). Ideja pojmovanja konverzacijskih iger in potez se je pri modeliranju dialoga izkazala za zelo uporabno, in sicer tako z opisnega [Power-1979, Houghton-1987, Kowtko-1992, Carletta-1996a] kakor tudi z algoritemskega [Lewin-2000] vidika. Konverzacijska teorija iger se tako predvsem ukvarja z modeliranjem dialogov človek - človek in dialogov človek - računalnik. Uporaba te teorije za modeliranje dialoga v sistemih, kjer konverzacijske poteze osvežujejo, dopolnjujejo in urejajo množico prepričanj in želja, je bila predlagana v projektu TRINDI (Task Oriented Instructional Dialogue) [Larsson-2000, Lewin-2000]. Za modeliranje dialoga v sistemu AUTOROUTE DEMONSTRATOR, ki je bil razvit v tem projektu, je bilo udejanjenih pet različnih konverzacijskih iger: . query game, ki jo iniciira ena od potez povpraševanja, qw ali qw-r, in ji sledi odziv rw, ki sproži potezo sprejemanja ack takoj ali pa šele po zaporedju prošnje za potrditev enfin odziva na njo, ryes, rno ali rmod, . information-giving game, ki je sestavljena le iz poteze podajanja informacije inf in poteze sprejemanja tega odgovora ack, . pardon game, kije sestavljena iz sogovorniku nerazumljive izjave unrec in prošnje za ponovitev pdm, . interruption game, kije sestavljena iz poteze podajanja nepomembne informacije unimp in igre information-giving game, ter . hello game, ki je sestavljena iz dveh pozdravnih potez hello. Naštete konverzacijske igre so formalizirane kot rekurzivne mreže prehodov, t.j. kot diagrami oz. načrti, sestavljeni iz prehodov, ki predstavljajo konverzacijske poteze, te pa ustrezajo dejanjem. Rekurzivne mreže prehodov so bolj kompleksne od končnih avtomatov, saj lahko eno mrežo poljubno gnezdimo v drugi, če cilj konverzacijske igre, ki je predstavljena z notranjo mrežo, služi izpolnitvi cilja igre, ki je predstavljena z zunanjo mrežo. 5. Modeliranje dialoga z uporabo konverzacijske teorije iger 44 5.2 Modeliranje dialoga v sistemu za podajanje informacij o vremenu Eden izmed ciljev pri razvoju sistema za podajanje informacij o vremenu je bil razviti modul za vodenje dialoga, ki bi bil od jezika neodvisen in čim enostavneje prenosljiv na druge domene podajanja informacij. Pretehtali smo učinkovitost uveljavljenih tehnik modeliranja dialoga in po temeljitem razmisleku prišli do zaključka - dialog modelirati s tehniko usmerjanja k cilju, pri čemer smo v namen strukturiranja uporabili kon-verzacijsko teorijo iger, t.j. konverzacijske igre in poteze. Podatke, potrebne za dostop do podatkovne zbirke, pridobivamo s polnjenjem predalčkov. Kot temelj definicije ustreznih konverzacijskih iger in potez so nam služili podatki iz prvega eksperimenta Čarovnik iz Oza (poglavje 3) ter sistem kodiranja govorjenih dialogov človek - človek [Carletta-1996a], ki smo ga opisali v prejšnjem podpoglavju. Tudi mi, podobno kot [Carletta-1996a], ločimo tri osnovne tipe konverzacijskih potez: -W začetne poteze se ponavadi pojavljajo na začetku konverzacijskih iger in v dialog uvajajo nove namere; -W odzivne poteze se pojavljajo znotraj konverzacijskih iger in služijo izpolnitvi pričakovanj in želja, ki se v dialogu pojavijo; -W poteze pripravljenosti se pojavijo potem, ko je bila neka konverzacijska igra zaključena, in dialog pripravijo na začetek nove igre. Množici konverzacijskih iger in konverzacijskih potez, ki so bile udejanjene v projektu TRINDI [Larsson-2000], smo precej razširili, da bi zagotovili večjo prenosljivost sistema na druge domene. Definirali smo 14 kategorij začetnih in 10 kategorij odzivnih potez ter poteze pripravljenosti READY, ki naznanjajo konec prejšnje igre in dialog pripravljajo na začetek nove konverzacijske igre. Kategorije začetnih konverzacijskih potez, ki smo jih udejanjili v modulu za vodenje dialoga v sistemu za podajanje informacij o vremenu, so: . Greet Pozdravi (npr. Dober dan. ali Nasvidenje.). . Indecipherable Izjave uporabnika, ki jih sistem ne razpozna ali ne razume. . Pardon Izjave, s katerimi uporabnik ali sistem prosita sogovornika, naj ponovi prejšnjo izjavo (npr. Prosim? ali Ali lahko ponovite vprašanje, prosim?). . Help Izjave, s katerimi uporabnik prosi za pomoč, ko se v dialogu ne znajde oz. ne ve, kako nadaljevati (npr. Kaj pa znaš?). 5. Modeliranje dialoga z uporabo konverzacijske teorije iger 45 Timeout Zaobsega tiste odzive uporabnika, ko sistem v vnaprej določenem času ne zazna govora. . Interrupt Izjave, s katerimi uporabnik prekine tekočo konverzacijsko igro (npr. iVe, to me pa ne zanima.). . Align Izjave, s katerimi uporabnik preveri, ali se njegova prepričanja ujemajo s prepričanji sistema. . Check Izjave, s katerimi sistem prosi za potrditev informacij, za katere sicer že verjame, da držijo, vendar v to ni povsem prepričan. Te poteze pokrivajo sklepanje na podlagi zgodovine dialoga (npr. Ali sprašujete za ta trenutek? ali Ali sprašujete za ponedeljek o vremenu?). . End Izjave, s katerimi uporabnik zaključi dialog (npr. Ne, nimam več vprašanj, ali Hvala, to bi bilo vse.). . Query-YN Vprašanja, na katera je mogoče odgovoriti z da ali z ne in ne sodijo v kategorijo Check ali Align potez (npr. Ali bo deževalo? ali Potem me pa zanima, če je burja v Novi Gorici.). . QUERY-WR Vprašanja po določenih informacijah ali pojasnilih. V to kategorijo sodijo tudi vsa vprašanja, ki ne spadajo v nobeno od ostalih kategorij (npr. Mi lahko poveste, kakšno bo v naslednjih dneh v hribih vreme? ali Kateri kraj oziroma katera pokrajina vas zanima?). . QUERY-WI Izjave, s katerimi uporabnik prosi sistem, da mu našteje vse vrste podatkov za določen kraj in določen časovni trenutek, do katerih trenutno dostopa (npr. Zanima me, kakšne informacije imate o razmerah na smučišču Vogel.). . QUERY-WL Izjave, s katerimi uporabnik prosi sistem, da mu našteje vse pokrajine in kraje v nekem območju, za katere lahko ponudi določeno vrsto podatka ob določenem časovnem trenutku (npr. Zanima me, za katere kraje v Sloveniji imate podatke o višini snega.). . QUERY-WT Izjave, s katerimi uporabnik prosi sistem, da mu našteje vse časovne trenutke, za katere lahko ponudi določeno vrsto podatka za določeno pokrajino ali kraj (npr. Zanima me, za koliko naprej lahko napoveste vreme.). 5. Modeliranje dialoga z uporabo konverzacijske teorije iger 46 V skladu s kategorijami začetnih konverzacijskih potez smo udejanjili naslednje kategorije odzivnih potez: . Acknowledge Odzivi, s katerimi uporabnik ali sistem minimalno pokažeta, da sta potezo, na katero se odzivata, slišala in razumela (npr. A ne? ali Hvala.). . Reply-help Odzivi sistema na Help potezo (npr. Sedaj me lahko vprašate še kaj v zvezi z mojim odgovorom ali pa mi zastavite novo vprašanje, če ga imate, ali Odgovarjati znam na vprašanja o vremenu, vetru, temperaturi in zračnem tlaku za različne kraje v Sloveniji in Evropi, o času vzhoda in zahoda sonca, o snežnih razmerah, o splošni vremenski napovedi, o biovremenski napovedi, o napovedi za letalstvo ter hidrološki napovedi za Slovenijo, o napovedi za slovensko primorje ... in mogoče še o čem.). . Reply-timeout Odzivi sistema na TIMEOUT potezo (npr. Ali imate še kakšno vprašanje? ali Niste mi povedali vseh potrebnih podatkov ali pa jih nisem razumel. Ce vas zanima kaj drugega, vprašajte, sicer pa prosim odgovorite na naslednje vprašanje: Ali sprašujete za jutri čez dan?). . Reply-y Odzivi z da na vprašanja, na katera je mogoče odgovoriti z da ali z ne (QUERY-YN, Check, Align), ki pomenijo potrditev (npr. Da. ali Ja, za ta trenutek ... če piha ali ne piha.). . Reply-N Odzivi z ne na vprašanja, na katera je mogoče odgovoriti z da ali z ne (QUERY-YN, Check), ki pomenijo zanikanje (npr. Ne.). . Reply-mod Odzivi s popravkom na vprašanja, na katera je mogoče odgovoriti z da ali z ne (Query-yn, Check, Align) (npr. Ne, sprašujem za Kope, Pohorje, ali Ne, za prejšnji teden.). . Reply-wr Odzivi na QUERY-WR poteze (npr. V Sloveniji jutri čez dan - najvišje dnevne temperature bodo od 2 do 5 stopinj Celzija. Imate še kakšno vprašanje? ali Kranjska Gora.). . Reply-wi Odzivi sistema na QUERY-WI poteze (npr. Za ta trenutek na Voglu vam lahko ponudim podatke o vremenu, temperaturi zraka, višini novozapadlega snega, skupni višini snega in hitrosti vetra. Ali vas kakšna od teh informacij zanima?). . Reply-wl Odzivi sistema na QUERY-WL poteze (npr. Podatke o skupni višini snega za Slovenijo za ta trenutek imam za Vojsko, za Rateče, za Vernerico, za Krvavec, za 5. Modeliranje dialoga z uporabo konverzacijske teorije iger 47 Kanin, za Kredarico, za Predel in za Vogel. Torej, ali vas sedaj zanima kakšen od teh krajev?). Reply-wt Odzivi sistema na Query-WT poteze (npr. Podatke o temperaturi zraka za Slovenijo imam za danes čez dan, za jutri zjutraj in za jutri čez dan. Želite, da vam podam informacijo za kakšnega od naštetih časovnih trenutkov?). 0 Oree, ^Q Oree, ^0 ^~^IndecipheraMer~> PanlOI) Slut ___^ 0 Parico ^0 /^, Help w/^A Reply-help<^f~~\ Acknowledge /^\ r~~~\ Timeout w /-^Reply-timeout /^\ Acknowledge Indecipherable game Help game Timeout game Interruption game Align game Check game Endgame Query-yn game Query-wrgame Query-wigame Query-wl game Query-wtgame Ready game 00Reply-timeout00 Acknowledge/""^ Check w/"~\ Reply-mod T~\ Acknowledge/""^ Reply-n^, End O Greeting game Reply-y Query-yn w/~\ Reply-mod^T^^ Acknowledge/~~^ Reply-n^, Query-WI^/~A Reply-wr /""^Acknowledge/ r /^A Reply-wr /""^Acknowledge/"~A Query-wi /""\ Reply-wi w/"~A Acknowledge /""\ Query-wl /""\ Reply-wl /""^Acknowledge/""> ^UMy"wt fc f^^i RePty-wt w, f~"'\ Acknowledge /""/ Ready ^/"^ Slika 5.2: Konverzacijske igre, udejanjene v modulu za vodenje dialoga v sistemu za podajanje informacij o vremenu Na osnovi teh konverzacijskih potez smo definirali 15 konverzacijskih iger, za vsako od 14 začetnih potez in potezo pripravljenosti po eno, namreč: GREETING GAME, INDECIPHERABLE game, Pardon game, Help game, Timeout game, Interruption 5. Modeliranje dialoga z uporabo konverzacijske teorije iger 48 game, Align game, Check game, End game, Query-yn game, Query-wr game, query-wi game, query-wl game, query-wt game in ready game. Te igre so sestavljene iz konverzacijskih potez, udejanjene pa so kot rekurzivne mreže prehodov (slika 5.2), ki dovoljujejo poljubna gnezdenja, če le cilj notranje igre služi izpolnitvi cilja zunanje igre. SI: Pozdravljeni. Pogovarjate se s sistemom za podajanje informacij o vremenu. Kakšno je vaše vprašanje? Ul: Zanima me, kakšno vreme bo jutri v Sloveniji. S2: V Sloveniji jutri čez dan - padavine bodo ponehale, delno razjasnitve. Želite vedeti še kaj? U2: Ja. Zanima me še vreme v gorah. S3: Ali sprašujete za jutri čez dan? U3: Kako? S4-' Niste mi povedali vseh potrebnih podatkov ali pa jih nisem razumel. Če vas zanima kaj drugega, vprašajte, sicer pa prosim odgovorite na naslednje vprašanje. Ali sprašujete za jutri čez dan? U4-' Ne, zanima me vreme za ta trenutek. S5: 0 vremenu v gorah ta trenutek žal nimam podatkov. Imam pa podatke o vremenu ta trenutek na Kredarici, na Voglu, na Kaninu, na Krvavcu in v Predelu. Potem lahko izbirate med podatki o vremenu v gorah za danes čez dan in jutri čez dan. Izbirate lahko tudi med podatki o vremenski napovedi v gorah ta trenutek. U5: Povejte mi prosim za Vogel. S6: Ali sprašujete za ta trenutek o vremenu? U6: Ja. S7: Na Voglu ta trenutek - megla. Vam lahko še kako pomagam? U7: Ja. Povejte mi, kakšna je temperatura zraka in kakšna je višina snega na Voglu. S8: Na Voglu ta trenutek - skupna višina snega je 180 centimetrov, temperatura zraka je -7 stopinj Celzija. Imate še kakšno vprašanje? U8: Ja. Kaj vse mi lahko poveste o trenutnem vremenskem stanju v Ljubljani? S9: Za ta trenutek v Ljubljani vam lahko ponudim 9 vrst informacij kot na primer podatek o vremenu, vlažnosti zraka, temperaturi zraka, hitrosti vetra, smeri vetra, vrednosti zračnega tlaka, indeksu požarne ogroženosti, vrsti požarne ogroženosti in tako naprej. Ali vas kakšna od teh informacij zanima? U9: Ne. To bi bilo vse. S10: Hvala lepa za sodelovanje. Nasvidenje. Tabela 5.1: Primer dialoga med uporabnikom (U) in sistemom za dialog (S) Lastnost, ki izrazito vpliva na uporabnost in posledično tudi na uspešnost sistemov za dialog, je sposobnost obvladovanja raznolikih konverzacijskih strategij. Ta vsebujejo osnovna obnašanja kot so preverjanja in potrditve, prevzemanje iniciative, nuditi ustrezno pomoč uporabniku, ponovitev zadnje izjave, prekinitev dialoga in ponovna vzpostavitev konteksta. Predstavljen modul za vodenje dialoga, ki je del sistema za 5. Modeliranje dialoga z uporabo konverzacijske teorije iger 49 podajanje informacij o vremenu, podpira vse omenjene konverzacijske strategije, te pa so udejanjene kot konverzacijske igre. Zue in sodelavci [Zue-2000] trdijo, da je eden od odločilnih vidikov uporabnosti sistemov za dialog sposobnost uporabnika informirati o obsegu znanja, ki ga sistem ima. Uporabnik preprosto mora imeti možnost vprašati in celo biti usmerjen k izbiri relevantnih, dosegljivih podatkov, ko sistem ni sposoben odgovoriti na njegovo vprašanje. Le tako bo namreč sposoben zgraditi dober pojmovni model sistema. V našem modulu za vodenje dialoga to potrebo delno zadovoljimo z udejanjenjem konverzacijskih iger Query-wi game, Query-wl game in Query-wt game, ki poleg tega dodatno strukturirajo dialog. Po drugi strani pa usmerjanje uporabnika k izbiri relevantnih, dosegljivih podatkov v veliki meri podpira tudi predstavitev časovno odvisne strukture znanja sistema, predstavljene v poglavju 6. Nepogrešljive pri vzpostavljanju konteksta so konverzacijske igre CHECK GAME, ki se nanašajo na zgodovino dialoga. V teh igrah sistem uporabnika prosi, naj potrdi predpostavke, do katerih je prišel na podlagi prejšnjih konverzacijskih dejanj. Vhod v modul za vodenje dialoga je pomenska predstavitev uporabnikove izjave, ki je sestavljena iz imena konverzacijske poteze in elementov ustreznih predalčkov. Tipi predalčkov so zelo odvisni od domene oz. sestave podatkovne zbirke, do katerih dostopamo. V primeru domene vremenskih podatkov smo definirali tri tipe predalčkov, namreč kraj, čas in podatek, pri čemer je množica predalčkov, ki jih sistem mora zapolniti, preden se lahko odzove, odvisna od pomena uporabnikove izjave oz. od tipa konverzacijske poteze, ki jo uporabnik naredi. Pri izjavah, ki ustrezajo potezam QUERY-YN in Query-WR, je potrebno zapolniti vse tri predalčke, pri izjavah, ki ustrezajo potezam Query-wi, le predalčka kraj in čas, pri Query-wl le predalčka čas in podatek, če se želimo omejiti na določeno območje, pa tudi kraj, pri Query-WT pa le kraj in podatek. Pri potezi Align, razen zapolnitve vsaj enega predalčka, ni omejitev, saj se uporabnik sam odloča, kaj želi preveriti. Ko pa se uporabnik s potezo REPLY-WR odziva na vprašanje Query-WR, ki mu gaje zastavil sistem, so število in tipi potrebnih predalčkov odvisni od vprašanja. Vse ostale možne poteze uporabnika ne zahtevajo zapolnitve nobenega predalčka. Primer dialoga med uporabnikom in sistemom je v tabeli 5.1 podan v naravnem jeziku, spodaj pa je ta dialog preveden v pomenske predstavitve izjav, ki so vhod v modul za vodenje dialoga, s katerim uporabnik komunicira preko grafičnega vmesnika. Greeting game SI: (Greet) Dober dan. Pogovarjate se s sistemom za podajanje informacij o vremenu. Kakšno je vaše vprašanje ? QUERY-WR GAME Ul: Query-WR kraj: Slovenija čas: jutri podnevi podatek: vreme S2: (Reply-wr) V Sloveniji jutri čez dan - padavine bodo ponehale, delno razjasnitve. Želite vedeti še kaj? 5. Modeliranje dialoga z uporabo konverzacijske teorije iger 50 Ready game U2: Ready QUERY-WR GAME U2: QUERY-WR kraj: gore čas: - podatek: vreme Check game S3: (Check) Ali sprašujete za jutri čez dan? Help game U3: Help S4: (Reply-help) Niste mi povedali vseh potrebnih podatkov ali pa jih nisem razumel. Ce vas zanima kaj drugega, vprašajte, sicer pa prosim odgovorite na naslednje vprašanje. Ali sprašujete za jutri čez dan? U4: Reply-mod čas: trenutno S5: (Reply-WR) O vremenu v gorah ta trenutek žal nimam podatkov. Imam pa podatke o vremenu ta trenutek na Kredarici, na Voglu, na Kaninu, na Krvavcu in v Predelu. Potem lahko izbirate med podatki o vremenu v gorah za danes čez dan in jutri čez dan. Izbirate lahko tudi med podatki o vremenski napovedi v gorah ta trenutek. QUERY-WR GAME U5: QUERY-WR kraj: Vogel čas: -podatek: -Check game S6: (Check) Ali sprašujete za ta trenutek o vremenu? U6: Reply-y S7: (Reply-WR) Na Voglu ta trenutek - megla. Vam lahko še kako pomagam? Ready game U7: Ready QUERY-WR GAME U7: QUERY-WR kraj: Vogel čas: trenutno podatek: temperatura, skupna višina snega S8: (REPLY-WR) Na Voglu ta trenutek - skupna višina snega je 180 centimetrov, temperatura zraka je -7 stopinj Celzija. Imate še kakšno vprašanje? Ready game _______U8: Ready QUERY-WI GAME U8: QUERY-WI 5. Modeliranje dialoga z uporabo konverzacijske teorije iger 51 kraj: Ljubljana čas: trenutno S9: (Reply-Wi) Za ta trenutek v Ljubljani vam lahko ponudim 9 vrst informacij kot na primer podatek o vremenu, vlažnosti zraka, temperaturi zraka, hitrosti vetra, smeri vetra, vrednosti zračnega tlaka, indeksu požarne ogroženosti, vrsti požarne ogroženosti in tako naprej. Ali vas kakšna od teh informacij zanima? End game _______U9: End Greeting game SIO: (Greet) Hvala lepa za sodelovanje. Nasvidenje. Ta primer dialoga ponazarja udejanjenje številnih konverzacijskih strategij: dve igri Greeting game, ki se začneta na pobudo izjav SI in SIO; štiri igre Query-wr GAME, ki se začno na pobudo izjav Ul, U2, U5 in U7; dve igri CHECK GAME, ki se začneta na pobudo izjav S3 in S6; HELP GAME se začne na pobudo izjave U3; QUERY-WI GAME se začne pobudo izjave U8; End GAME se začne na pobudo izjave U9; tri igre Ready game pa uvajajo začetki izjav U2, U7 in U8 ter dialog pripravljajo na začetek nove igre. Odzivna konverzacijska poteza REPLY-WR, pripisana izjavi S5, kaže, na kakšen način sistem uporabnika usmerja k izbiri relevantnih, dosegljivih podatkov, ko ne najde točnega odgovora na uporabnikovo vprašanje. V naslednjem poglavju 6 bomo opisali predstavitev znanja, ki takšno usmerjanje k izbiri relevantnih, dosegljivih podatkov omogoča. Predstavitev znanja v sistemu za dialog 6.1 Modalna logika 6.2 IntuicionistiČna modalna logika 6.3 Predstavitev vremenskih podatkov Podali bomo motivacijo za uporabo modalne logike ter definirali Kripkejeve modele osnovne modalne logike, ki poleg običajnih izjavnih veznikov vsebujejo še modalna operatorja škatla in diamant. Iz klasičnih modalnih logik bomo prešli na intuicionistične logike oz. na intuicionistične modalne logike, ki ne vsebujejo Aristotelovega zakona o izključeni tretji možnosti (A V -A). Intuicionistično modalno logiko bomo uporabili za predstavitev znanja v sistemu za podajanje informacij o vremenu, za kar smo se odločili predvsem zaradi časovno odvisne strukture vira vremenskih podatkov. Uvedli bomo dva nova modalna operatorja, imenovana spodnji in zgornji diamant, ter razred dialog mlPC Kripkejevih modelov. Takšna predstavitev znanja sistemu omogoča, da se na uporabnikova vprašanja odziva z usmerjanjem k izbiri relevantnih, dosegljivih podatkov, pri čemer relevantnost temelji na relaciji biti manj specifičen, definirani med posameznimi delčki informacij (kraji, časovni trenutki in vrste podatkov). 52 6. Predstavitev znanja v sistemu za dialog 53 6.1 Modalna logika Ljudje v vsakdanjem življenju razlikujemo več oblik resnic, kot na primer biti nujno res, vedeti, da je res, verjeti, da je res in biti res v prihodnosti. Izjava Janez Drnovšek je predsednik Republike Slovenije. je trenutno sicer resnična, vendar se bo to v prihodnosti spremenilo. Še bolj nazoren primer je izjava Sončni sistem sestavlja devet planetov. Čeprav smo še pred kratkim v resničnost te izjave bili precej prepričani, se je to občutno spremenilo, ko so astronomi odkrili telo, imenovano Sedna, ki bi lahko bil deseti planet našega osončja. Tudi če se to ne bi zgodilo, ta izjava, zaradi omejitev sodobne znanosti, ne bi bila nujno resnična. Po drugi strani pa izjava Kvadratni koren iz 25 je 5. ni samo resnična, ampak tudi nujno resnična in resnična v prihodnosti. Vseeno pa resničnost te izjave nekaterim ljudem (npr. majhnim otrokom) ni znana, drugi (npr. tisti, ki imajo zmotno znanje) pa v njeno resničnost ne verjamejo. Ker se v umetni inteligenci pogosto pojavljajo sistemi več agentov, od katerih ima lahko vsak agent drugačno znanje o svetu (okolju) in o znanju drugih agentov, brez modalne logike [Huth-2000] o znanju agentov takorekoč ne bi mogli sklepati. Modalna logika poleg klasičnih izjavnih veznikov uporablja modalne operatorje (enomestne iz-javne veznike), s pomočjo katerih je sposobna izraziti eno ali več oblik resnice. Cilj je zato pri dani obliki resnice razviti logiko, ki bo ta koncept sposobna izražati in formalizirati. To storimo tako, da določimo lastnosti, ki naj jih ta logika ima, in primere sklepanja, ki naj jih bo sposobna izražati. Modalna logika je torej razširitev klasične logike z novimi, modalnimi operatorji. Ključna oseba pri snovanju modalne logike je bil C.I. Lewis, idejo uporabljati modalno logiko za sklepanje o znanju pa je uvedel Jaakko Hintikka [Hintikka-1975]. Najbolj znana modalna operatorja sta D in 0, ki ju v osnovni modalni logiki beremo škatla in diamant. Ko modalno logiko uporabimo za izražanje različnih oblik resnic, omenjena modalna operatorja imenujemo dani resnici primerno, npr. nujno in mogoče, ali v primeru izražanja znanja agenta, agent ve in agent ne izključuje veljavnosti. Na eni strani imamo dano logiko, na drugi pa primere oz. modele te logike. V modelih veljajo vsa pravila sklepanja, ki definirajo logiko, kar imenujemo pravilnost. Če pa je vsaka enačba, ki ji zadoščajo vsi modeli dane logike, v logiki dokazljiva oz. sledi kot logična posledica, pravimo, da je logika polna. Včasih je dokazljiva že vsaka enačba, ki ji zadošča neka podmnožica modelov. V tem primeru pravimo, da je logika polna za 6. Predstavitev znanja v sistemu za dialog 54 dano podmnožico modelov. Poseben primer polnosti pa predstavlja (če seveda obstaja) tako imenovani univerzalni model U, v katerem je dana enačba veljavna natanko tedaj, ko je v logiki dokazljiva. Definicija 1 Modeli M. osnovne modalne logike so določeni z: 1. množico W, katere elemente imenujemo svetovi, 2. relacijo R na množici W, ki jo imenujemo relacija dosegljivosti, wRv pa beremo kot svet v je dosegljiv iz sveta w, 3. funkcijo V : W —> V(izjavne spremenljivke), ki jo imenujemo funkcija pripisovanja veljavnosti, pri čemer p G V(w) pomeni, da ima izjavna spremenljivka p v svetu w resnično vrednost. V čast Saula Kripkeja, ki je 50-ih in 60-ih letih prejšnjega stoletja močno zaznamoval modalno logiko, takšne modele ponavadi imenujemo Kripkejevi modeli ali Kripkejeve semantike možnih svetov [Perry-www]. Dana izjava je lahko v nekem svetu resnična, v drugem pa neresnična. Resničnost izjave, ki vsebuje samo klasične logične veznike (A, V, -i, =>- in <=?¦), je v klasični modalni logiki določena lokalno in neodvisno od ostalih svet. Ko pa izjava vsebuje katerega izmed modalnih operatorjev (npr.D ali 0), je njena resničnost v posameznem svetu odločilno odvisna od ostalih možnih svetov. Veljavnost izjav v svetovih Kripkejevih modelov M. = (W, R, V) opišimo z relacijo \\-y. Definicija 2 Naj bo M. = (W, R, V) model osnovne modalne logike, w G W, T ml običajni konstanti resnica in laž, p izjavna spremenljivka, A in B pa izjavi. Relacija \\~v (w \\~v A beremo kot v svetu w E W velja A) je najmanjša relacija med svetovi in izjavami, ki zadošča naslednjim pogojem: 1. w \\~v T 2. wFyl 3. W \\-y p čee p G V(w) 4- w \\-v -A čee wYv A 5. w \\-v A AB čee w \\-y A in w \\-y B 6. w \\-v Ay B čee w \\-y A ali w \\-y B 7. w\\-v A=> B čee iz w \\-y A sledi W \\~y B 8. w\\-v A&B čee w \\-y A natanko tedaj, ko w \\-y B 9. w \\-v DA čee \/v eW: (iz wRv sledi v \\-v A) 10. w U-v 0A čee 3v G W: (wRv in v \\-v A) Prva dva pogoja pravita, da T vedno velja, _L pa nikoli. Iz naslednjega pogoja sledi, da je V(w) množica vseh izjavnih spremenljivk, ki so v svetu w veljavne. Pogoji, ki se nanašajo na nemodalne izjavne veznike (-, A, V, =^> in <=?-), zrcalijo klasično 6. Predstavitev znanja v sistemu za dialog 55 razumevanje teh veznikov v danem svetu. Neobičajna sta le pogoja za D in O- Prvi od njiju pravi, da je izjava DA v svetu w resnična, če je izjava A resnična v vsakem svetu, ki je z relacijo R dosegljiv iz sveta w. Drugi pa pravi, da je izjava ()A v svetu w resnična, če obstaja kakšen svet, z relacijo R dosegljiv iz sveta w, kjer je izjava A resnična. Zanimivo je, da kljub veljavnosti T v vsakem svetu, <>T ni nujno res. Velja namreč w \\~v OT čee w je v relaciji R z vsaj enim svetom. Tudi D_L ni nujno neveljavna, čeprav _L ni veljavna v nobenem svetu. Velja namreč w \\~v Q-L čee w ni v relaciji R z nobenim svetom. Naj ekvivalenca A = B velja natanko tedaj, ko v poljubnem svetu poljubnega modela veljata ali obe ali pa nobena izmed izjav A in B. Primeri ekvivalence sta de Morganovi pravili za D in 0, -DA = O-A, -0A = d-a, ter pravili za konjunkcijo in disjunkcijo teh modalnih operatorjev, D(AAB) = DA A DB, 0(AVB) = 0AV0B. Omenimo še, da je DT ekvivalentno T, DT = T, ne pa tudi <0>T, in da je 0-L ekvivalentno _L, 0-L = -L, ne pa tudi D_L. Definicija 3 Pravimo, da je izjava A osnovne modalne logike veljavna, če je veljavna v vsakem svetu vsakega modela, in izjava A je veljavna v modelu M. = (W,R,V), če je veljavna v vsakem svetu w G W. Očitno veljavne so na primer izjave: -DA <& <)-A -<>A <& D-A D(AAB)^DAADB 0(AVB)^0AV0B DT^T 6. Predstavitev znanja v sistemu za dialog 56 0±^± V modalni logiki zelo pomembna pa je veljavna izjava K: D(A^> B) ADA^DB, ki je dobila ime po Saulu Kripkeju. Za dokaz veljavnosti izjave K je treba pokazati, da za poljuben svet w poljubnega modela M. = (W, R, V) modalne logike velja w \\~v U{A => B) ADA => DB. Po definiciji 2 je dovolj pokazati, da iz w \\-v D(A ^ B) ADA sledi w \\~v DB. Predpostavimo torej, da velja w lhy D(A =>- B) A DA. To je natanko tedaj, ko w \\-v D(A =>- B) in w \\-v DA oz. \/v E W : (iz wRv sledi v \\-v (A =>- B) in v \\-v A). Sledi v \\-v B in zato w \\-v DB. Vrnimo se sedaj k formalizaciji različnih oblik resnice. Tabela 6.1 pri dani interpretaciji operatorja D podaja ustrezno interpretacijo modalnega operatorja 0, ki je v klasični modalni logiki ekvivalenten -iD-i. Še več, v klasični modalni logiki lahko lastnosti 0 izpeljemo iz lastnosti D in o-a-o: DA = -O-A 0A = -D-A Množice veljavnih izjav, pripadajočih različnim interpretacijam modalnega operatorja D, se med sabo razlikujejo, saj formalizirajo različne oblike resnice. Izjave, ki so veljavne v osnovni modalni logiki (npr. K), so sicer veljavne tudi v vseh drugih modalnih logikah, ki izvirajo iz različnih interpretacij modalnega operatorja D. Na nivoju Kripkejevih modelov pa vsaki interpretaciji pripada ustrezna interpretacija relacije dosegljivosti R, ki je v nekaterih primerih po potrebi lahko npr. tudi refleksivna ali tranzitivna. DA 0A nujno velja A mogoče velja A vedno bo veljalo A nekoč bo veljalo A zapovedano je A dovoljeno je A agent verjame A A je v skladu z agentovim mišljenjem agent ve, da velja A agent ne izključuje veljavnosti A A velja po vsaki izvedbi programa P A velja po neki izvedbi programa P Tabela 6.1: Interpretacija modalnega operatorja 0 pri dani interpretaciji D Za primer vzemimo interpretacijo DA kot nujno velja A. Pogoj w \\-v DA čee \/v E W : (iz wRv sledi v \\-v A) iz definicije 2 pravi, da je A nujno veljavna v svetu w natanko tedaj, ko je A veljavna v vseh svetovih v, s katerimi je w v relaciji R. Kakšna pa je ta relacija? Intuitivno pravimo, da nujno velja A, če velja A v vseh možnih svetovih. Svet v, za katerega 6. Predstavitev znanja v sistemu za dialog 57 velja wRv, lahko zato interpretiramo kot svet, ki je, glede na znanje sveta w, mogoč oz. dosegljiv. Interpretaciji DA kot agent ve, da velja A, ustreza interpretacija wRv, ki pravi, da bi v lahko bil dejanski svet glede na znanje agenta v svetu w. Z drugimi besedami, če je dejanski svet ravno w, potem agent, ki ni vseveden, ne more izključiti možnosti, da je ta svet pravzaprav v. Pomen relacije R dosegljivosti med svetovi pri različnih interpretacijah DA je prikazan v tabeli 6.2. DA wRv nujno velja A vedno bo veljalo A zapovedano je A agent verjame A agent ve, da velja A A velja po vsaki izvedbi programa P v je možen svet, glede na informacije v w v je v prihodnosti glede na svet w v je dopusten glede na informacije v w v bi lahko bil dejanski svet glede na mišljenje agenta v w v bi lahko bil dejanski svet glede na znanje agenta v w v je možno stanje po izvedbi programa P y w Tabela 6.2: Pomen relacije R pri različnih interpretacijah izjave \HA Lastnosti relacije dosegljivosti R (npr. refleksivnost, simetričnost ali tranzitivnost) so povezane z zakoni dane modalne logike: . Če je i? refleksivna, velja T : DA => A. To dokažemo tako, da za poljuben model osnovne modalne logike M. = (W, R, V) pokažemo M. Ihy DA =>- A, kar pomeni, da za vsak w E W velja w Ihy DA =>- A. Naj bo torej w poljuben in naj velja w Ihy DA. Ker je wRw, iz definicije 2 takoj sledi w Ihy A. Torej res velja w Ih DA =^> A. . Ce je R simetrična, velja B : A => D()A. Potrebno je pokazati, da za poljuben svet w poljubnega modela M. = (W, R, V) velja w Ihy A =^> D(>A Naj velja w Ihy A, in naj bo v E W takšen, da je wRv. Zaradi simetričnosti je vRw. Za vsak v z lastnostjo wRv torej obstaja svet (to je kar w), s katerim je v v relaciji i? in v katerem velja A. Sledi w Ihy D()A. . Če je R tranzitivna, velja 4 : DA => DDA. Potrebno je pokazati, da v poljubnem modelu M. = (W, R, V) velja M. Ihy DA =^> DDA. Naj how EW. Pokažimo torej, da velja w Ihy DA => DDA. Iz w Ihy DA po definiciji 2 za vsak v z lastnostjo wRv in vsak u z lastnostjo vRu sledi u Ih A. Torej res w Ihy DDA. Zapišimo sedaj formalno definicijo modalne logike z modalnima operatorjema D in O- 6. Predstavitev znanja v sistemu za dialog 58 Definicija 4 Modalna logika L je podmnožica izjav, sestavljenih iz konstant _L in T, iz izjavnih spremenljivk, klasičnih veznikov A, V,,=>- in •L>• ter modalnih operatorjev D in (), z naslednjimi lastnostmi: 1. L vsebuje vse izjave, ki jih izpelje klasična izjavna logika. 2. Velja zakon K. D(A^> B) ADA^ DB. 3. Če je A E L, potem je tudi DA e L. 4- L je zaprta za zamenjave delov izjav. Primer modalne logike je logika KT4, v literaturi pogosto imenovana tudi S4. Modeli te modalne logike so natanko Kripkejevi modeli M. = (W,R,V), kjer je relacija R refleksivna (zakon T) in tranzitivna (zakon 4). Za to logiko se izkaže, da velja naslednji izrek. Izrek 1 V modalni logiki KT4 je poljuben niz modalnih operatorjev in negacij ekvivalenten enemu izmed naslednjih nizov: —, D, 0, D(), ()D, D0Q, ()D(), -, -D, -<0>, -do, -<>?, -non m -ono. Dokaz. Z indukcijo na dolžino niza. 6.2 Intuicionistična modalna logika V klasični logiki (tudi modalni) je po Aristotelovem zakonu o izključeni tretji možnosti poljubna izjava A ali resnična ali neresnična. V vsakem modelu velja A\/A. Hitro pa pridemo do zaključka, da vsebina tega zakona omejuje naše razmišljanje. Kot primer vzemimo izjavo V decimalnem zapisu števila tt obstaja zaporedje sedmih sedmič. Trenutno ne poznamo nobene metode, s pomočjo katere bi se lahko prepričali v resničnost ali neresničnost te izjave. Lahko se celo zgodi, da ne bo nikoli nihče ugotovil, ali je ta izjava resnična, čeprav nas klasična logika prisili, da sprejmemo nujnost ene izmed možnosti - resničnost ali neresničnost. Klasično logiko brez Aristotelovega zakona o izključeni tretji možnosti A V ->A, a z zakonom o nasprotovanju ->A A A =^> B, imenujemo intuicionistična logika, bsega pa principe logičnega sklenja, ki jih je leta 1907 začel uporabljati L.E.J. Brouwer, ko je razvijal svojo intuicionistično matematiko [Troelstra-www]. Brouwer je opazil, da je bil Aristotelov zakon o izključeni tretji možnosti oblikovan na podlagi končnih situacij, nato pa neupravičeno razširjen na neskončne. Principi, ki jih je začel uporabljati Brouwer, so podvrženi tudi ruski rekurzivni analizi in konstruktivni analizi E. 6. Predstavitev znanja v sistemu za dialog 59 Bishopa in njegovih naslednikov, zato lahko na intuicionistično logiko gledamo kot na temelje konstruktivne matematike. V intuicionistični logiki lahko z gotovostjo trdimo, da objekt z določeno lastnostjo obstaja šele, ko poznamo učinkovito metodo konstrukcije oz. iskanja takega objekta. Znamenita izjava še bolj znamenitega intuicionista Arenda Heytinga pa pravi, da razložiti formulo ne pomeni podati pogoje resničnosti, ampak pogoje dokazljivosti. To se odraža v intuicionistični razlagi izjavnih veznikov -i in V, ki se od razlage klasične logike razlikuje. Izjavi A in -i->A zaradi izključitve onjenega Aristotelovega zakona nista ekvivalentni, interpret-- izjave A V B pa je veliko močnejša. Vzemimo npr. agenta, ki se znajde na razpotju labirinta in ve, da vodi do izhoda iz labirinta samo ena pot. Naj izjava A pomeni, da vodi do cilja pot 1, izjava B pa, da vodi do cilja pot 2. V klasični logiki izjava A V B pove samo, da do izhoda iz labirinta vodi ena izmed obeh poti, kar agentu pri iskanju izhoda ne pomaga. Drugače pa je v intuicionistični logiki, kjer izjava A \/B pove tudi, katera izmed obeh poti vodi do cilja. Definicija 5 Intuicionistični izjavni račun (IPC) je podteorija intuicionistične logike, ki jo dobimo, ko jezik intuicionistične logike zožimo le na izjave, sestavljene iz izjavnih spremenljivk po,p1,..., konstant T in _L ter izjavnih veznikov A, V in =K V IPC izjavo -iA definiramo kot A =>- _L; izjavo A <=?- B pa kot (A =>- B) A(B =>- A). Osnovna sodba tuicionističnega izjavnega računa je logična posledica. To je relacija h med končno množico hipotez {A1, ...,An} in sklepom B: {A1,...,An}hB. Običajno pišemo A1, ...,An h B, namesto {} h B pa kar ¦ h B. Relacija h je podana induktivno z naslednjimi pravili sklepanja, pri čemer so A,B in C poljubne izjave, T pa poljubna končna množica izjav: Al. Sklep iz hipoteze A2. Resnica rTT A3. Laž rhi Wa A4- Konjunkcija rhA rhß rhiAß rhiAß Th aab rhA Th B A5. Disjunkcija ThA ThB ThAvB T, Ah C T,B\-C rhAvb rhAvb rhc 6. Predstavitev znanja v sistemu za dialog 60 A6. Implikacija r,ihß rhA^ß rhi Th A^ B tTb Pravila iz definicije 5 beremo kot veljavne sklepe. Pravilo Al pravi, da so hipoteze vedno veljavne izjave, pravilo A2 pa, da vedno velja tudi resnica T. Pravilo A3 pravi, da poljubna izjava sledi kot logična posledica, če le velja laž _L. Prvo pravilo za konjunkcijo A4 pa npr. pomeni, da iz T h A in T h B sledi T \- A A B. Omenimo še, da bi klasični izjavni račun dobili, če bi v definiciji 5 dodali naslednje pravilo sklepanja: Al. Izključena tretja možnost r,ihß r,ih-ß Ljudje svoje znanje gradimo s pomočjo delčkov informacij, ki jih pridobivamo iz različnih zunanjih virov. Znanje zato ni objektivno, proces pridobivanja znanja pa ni končen. Ker svoje znanje gradimo na osnovi več različnih virov, si podatki, ki jih pridobivamo, lahko tudi nasprotujejo (iz enega vira lahko dobimo A, iz drugega pa ->A). Nasprotujoča si podatka A in ->A lahko v intuicionistični modalni logiki predstmo kot ()A in (}-A, kar pomeni, - dopuščamo obe možnosti. Vzemimo sedaj model M. = (W, R, V) modalne logike KT4, kjer je relacija R refleksivna in tranzitivna. Modele intuicionistične modalne logike, kjer D in 0 beremo kot nujno in mogoče, dobimo tako, da v M. = (W, R, V) dodamo relacijo < delne urejenosti (refleksivna, antisimetrična in tranzitivna) svetov, kije s pogojem 0* povezana z obstoječo relacijo R, za funkcijo pripisovanja veljavnosti V pa zahtevamo lastnost monotonosti, t.j. iz w < v mora slediti V(w) Ç V (v). Definicija 6 Intuicionistični Kripkejevi modeli modalne logike KT4 so modeli M. = (W,<,R,V) modalne logike KT4 z dodatno relacijo < delne urejenosti množice svetov W (w,w',v,v' G W), 0*. wRv in v < v' sledi 3w' G W : (w'Rv' in w < w'), in s pogojem o monotonosti funkcje V. V teh modelih definiramo relacijo lhy kot najmanjšo relacijo med svetovi in izjavami, katere pogoji se od pogojev iz definicije 2 razlikujejo le po interpretaciji izjavnih veznikov , =^; D in (). Za w,v,u G W, izjavno spremenljivko p ter izjavi A in B mora veljati: 1*. wlhyT 2*. wYv± 3*. w \\-v P čee p G V(w) 4*. w \\-v -A čee \/veW:(izw B čee \/v E W : (w < v =>- (iz v IhV A sledi v IhV B)) w IhV DA čee \/v E W: (w < v =^\/u E W: (iz vRu sledi u IhV A)) w IhV 0^4 cee \/v E W: (iz w < v sledi 3u E W: (vRu in u IhV A)) Izjavne spremenljivke intuicionistične modalne logike lahko pojmujemo kot monotone resnice - ko je v nekem svetu izjavna spremenljivka resnična, je resnična tudi v vseh, iz tega sveta z relacijo < dosegljivih svetovih. Naslednja lema pa pravi, da so tudi ostale izjave monotone resnice. Lema 1 (Lema o monotonosti) V intuicionističnem Kripkejevem modelu M. = (W,<,R,V) modalne logike KT4 velja iz w IhV A sledi \/v E W : (w < v sledi v IhV A). Dokaz. Z indukcijo po strukturi izjave. Pogoj 0* v definiciji 6 podaja zvezo med obema relacijama na množici svetov W, ki temelji na naslednjem razmisleku. Dejstvo, da je v dosegljiv iz sveta w (wRv), je razumno obravnavati kot neke vrste osnovno resnico. Če je sedaj svet v' > v, bi moral biti tudi v' dosegljiv iz w, toda medtem smo lahko zbrali že več podatkov o svetu w in je ta lahko prešel v novi svet w' > w. Če definicije izjavnih veznikov =>, D in 0 ne bi ustrezno spremenili, ne bi imeli nobenega zagotovila, da bodo izjave oblike A=> B, DA in 0^4 res zadoščale lemi o monotonosti. Sprememba definicije veznika - pa je posledica intuicionizma. Intuicionistični Kripkejevi modeli modalne logike KT4 pripadajo natanko modalnemu intuicionističnemu izjavnemu računu CS4 [Simpson-1994, Alechina-2001], ki ga dobimo, če IPC razširimo z modalnima operatorjema D in O- Definicija 7 Modalni intuicionistični izjavni račun CS4 je razširitev jezika IPC (definicija 5) z enomestnima modalnima operatorjema D m O- Logična posledica je najmanjša relacija \~cs4, ki poleg pravil A1-A6 za IPC zadošča še naslednjim pravilom: BI. Nujno B2. Implikacija in nujno B3. Logične resnice so znane r hCS4 ua r hCS4 ua r hCS4 a r hCS4 uuA r hCS4 u(A => b) r hCS4 da r hCS4 üb • hCS4 A ¦ hCS4 UA 6. Predstavitev znanja v sistemu za dialog 62 B4. Mogoče r hCS4 A r hCS4 0QA r hCS4 OA r hCS4 OA B5. Implikacija, nujno in mogoče T\-CS4D{A^B) ThCS4QA r hCS4 OB Aksiom BI pravi, da znanje ni zmotno in da se svojega znanja zavedamo. Naslednji aksiom, t.j. aksiom B2, podaja zvezo med implikacijo in D; če nujno velja A =>- B in A, potem nujno velja B. Aksiom B3 pravi, da nujno velja vse, kar je logično dokazljivo brez hipotez. Aksiom B4 med drugim pravi, da so resnice mogoče. Zadnji aksiom pa podaja zvezo med implikacijo, D in O- Izrek 2 Modalni intuicionistični izjavni račun CS4 (definicija 7) je za intuicionistične Kripkejeve modele (definicija 6) poln, t.j. T hCS4 A čee T \\-V A. Dokaz. Desno implikacijo (pravilnost semantike) dokažemo z indukcijo na strukturo dokaza formule A iz konteksta T. Pokažemo, da so v intuicionističnih Kripkejevih modelih modalne logike KT4 vsi aksiomi veljavni, pravila sklepanja pa ohranjajo veljavnost formul. Z intuicionističnim delom ni težav, zato dokažimo samo veljavnost aksiomov B1-B5. Veljavnost prvega dela aksioma BI je posledica refleksivnosti relacij R in <, veljavnost drugega dela pa tranzitivnosti relacije R, refleksivnosti relacije < ter zveze med obema relacijama Kripkejevih modelov. Zaradi refleksivnosti < sta veljavna aksioma B2 in B5. Aksiom B3 sledi iz dejstva, da veljavnost formule v vseh modelih pomeni veljavnost formule v vseh svetovih v vseh modelih. Veljavnost prvega dela aksioma B4 je posledica refleksivnosti R, veljavnost drugega dela pa je posledica refleksivnosti < in tranzitivnosti R. Dokaz leve implikacije (polnost semantike) je podan v [Alechina-2001]. Konec dokaza. 6.3 Predstavitev vremenskih podatkov Čeprav so se razvijalci sistemov za dialog pri predstavitvi znanja osredotočili predvsem na tradicionalne logične podatkovne modele kot so hierarhični, mrežni in relacijski, smo se pri razvoju sistema za podajanje informacij o vremenu vprašali, kakšna predstavitev znanja bi bila s stališča sposobnosti usmerjanja k izbiri relavantnih, dosegljivih podatkov najustreznejša. To vprašanje postane smiselno, ko imamo na eni strani opravka s podatkovno zbirko, katere struktura je časovno odvisna in nepredvidljiva (poglavje 2), na drugi strani pa s številnimi pomanjkljivostmi tradicionalnih podatkovnih modelov [Elmasri-2004]. 6. Predstavitev znanja v sistemu za dialog 63 S takšno podatkovno zbirko so imeli opravka tudi razvijalci sistema Jupiter [Zue-2000], ki so vremenske podatke sicer shranili v obliki tradicionalnega relacijskega podatkovnega modela, vendar so dodali še konstantno tabelo geografskih podatkov. Ta dodatna tabela res omogoča odgovore na vprašanja oblike Katere kraje v Karibik poznaš? ne pa tudi na vprašanja, ki se nanašajo na časovno odvisno strukturo podatkov, kot na primer Za katere kraje v Karibik poznaš trenutno temperaturo ? Sistem za dialog je vsekakor veliko zmogljivejši pri usmerjanju uporabnika k izbiri relevantnih, dosegljivih podatkov, če relacije med posameznimi podatki niso fiksno določene. Veliko primerneje je te relacije po vsakem osveževanju podatkovne zbirke (v skladu s trenutno dosegljivimi podatki) ponovno vzpostaviti. Časovno dinamično predstavitev, ki bo zajemala tudi relacije med posameznimi podatki, dosežemo z uporabo teorije intuicionistične modalne logike. Modalna logika je bila sicer že uporabljena pri vzpostavitvi logičnega podatkovnega modela v primeru razpolaganja z več dokumenti [Nie-1989, Sebastiani-1998] ter za izražanje prepričanj in ciljev v komunikaciji med več razumskimi agenti [Sadek-1994, Smith-1998], vendar imajo ti logični modeli z našo predstavitvijo znanja zelo malo skupnega. Prednosti predstavljenega podatkovnega modela so predvsem: -W preprosta pretvorba podatkov, -W jasne in logične relacije med posameznimi podatki, -W preprosto ravnanje z nepopolnimi podatki, -W preprosto povpraševanje oz. iskanje relevantnih, dosegljivih podatkov. Imejmo torej modul za vodenje dialoga, ki ima opravka z n različnimi predalčki. V primeru našega sistema za podajanje informacij o vremenu je n = 3, tipi predalčkov pa so kraj, čas in podatek. Za množico izjavnih spremenljivk vzemimo unijo množic Pi,..., Pn, kjer je Pi množica vseh možnih elementov i-tega predalčka. Zbirko vremenskih podatkov pretvorimo v množico svetov W = W1 U W2. Prvo podmnožico svetov W1 dobimo tako, da vsaki izjavni spremenljivki pij priredimo svet W1ij G W1, v katerem je Pij, ki jo imenujemo vodilna atomarna izjava, veljavna. Drugo podmnožico svetov W2 pa dobimo tako, da v svetove izW1 dodamo veljavnost vsaj ene dodatne izjavne spremenljivke, t.j. omejitev, pri čemer se noben par atomarnih izjav (vodilna atomarna izjava in omejitve) ne nanaša na isti predalček. Te atomarne izjave ne obravnavamo tako kot ostale izjave, saj kljub temu, da natanko določajo zakone danega sveta, ne vsebujejo informacije o dosegljivosti oz. relevantnosti posameznih delčkov informacij. Atomarne izjave se navezujejo na sestavne dele uporabnikovega vprašanja, ostale izjave, ki so sestavljene iz 6. Predstavitev znanja v sistemu za dialog 64 izjavnih spremenljivk pij, . konstant _L in T, . klasičnih izjavnih veznikov A, V, in =>- ter . modalnih operatorjev spodnji diamant y in zgornji diamant A, pa dosegljivost in relevantnost vremenskih informacij opisujejo tako, da je sistem sposoben uporabnika usmerjati k izbiri informacij, ki se glede na vprašanje zdijo smiselne. Vpeljane modalne operatorje interpretiramo takole: ¦ V A pomeni, da je A dosegljivo in relevantno, vendar manj specifično; . AA pomeni, da je A dosegljivo in relevantno, vendar bolj specifično. Na množici svetov W definiramo refleksivno in tranzitivno relacijo dosegljivosti R, kjer . wRv pomeni, da je svet v bolj specifičen oz. dosegljiv iz sveta w, t.j. množici atomarnih izjav svetov w in v se razlikujeta le v vodilni atomarni izjavi, pri čemer je vodilna izjava sveta v bolj specifična od vodilne atomarne izjave sveta w, in relacijo delne urejenosti (refleksivna, antisimetrična, tranzitivna) <, kjer . w < v pomeni, da je množica atomarnih izjav sveta w podmnožica množice atomarnih izjav sveta v. Relacija R temelji na vnaprej definirani refleksivni in tranzitivni relaciji biti manj specifičen, ki povezuje manj specifične oz. bolj splošne delčke informacij, navezujoče se na isti predalček, z bolj specifičnimi. Usmerjene Hassejeve diagrame teh relacij, kjer vozlišča ustrezajo posameznim delčkom informacij, usmerjene povezave pa vzpostavljenim relacijam, prikazujejo slike 6.1, 6.2, 6.3 in 6.4. Relacija R tedaj povezuje svetova, katerih množici atomarnih izjav se razlikujeta le v vodilni atomarni izjavi, ti pa sta v relaciji biti manj specifičen. Sledi definicija razreda Kripkejevih modelov, ki mu takšna predstavitev znanja zadošča. Definicija 8 Dialog mlPC Kripkejevi modeli so strukture M. = (W,<,R,\\-), kjer je (W, <) neprazna, delno urejena množica svetov, R je refleksivna in tranzitivna relacija na W, ki za w,w',v,v' G W zadošča 0**. iz wRv in v < v' sledi 3w' G W : (w'Rv' in w < w'), iz w < v in vRv' sledi 3w' G W : (wRw' in w' < v1), iz w < v in wRv' sledi 3w' G W : (vRw' in v' < w'), 6. Predstavitev znanja v sistemu za dialog 65 Slika 6.1: Hassejev diagram relacije biti manj specifičen med krajevnimi delčki informacij, ki se navezujejo na Slovenijo Slika 6.2: Hassejev diagram relacije biti manj specifičen med krajevnimi delčki informacij, ki se navezujejo na ostalo Evropo 6. Predstavitev znanja v sistemu za dialog 66 Idan2 ponoči dan2 dopoldne preteklost i j ¦ i . ¦ ¦ ¦ — "te mesec naslednie letcr^^i^' naslednji mesec sobota podnevi delja podnevi Slika 6.3: Hassejev diagram relacije biti manj specifičen med časovnimi delčki informacij. Zaradi majhnega števila možnih dosegljivih časovnih trenutkov, so vzpostavljene vse povezave. zaradi česar relacija biti manj specifičen v tem primeru izgubi pomen, ki izvira iz imena. min visina novega snega max višina novega snega min visina snega max visina snega i t,b t,: ;.]: rirOb skupna višina snega hitrost vetra Itemperatura snega Jsrner vetra temperatura zraka t ¦* vrsrn snem i ! r-. sunki vetra iopis ogroženosti stanje tlaka o J indeks ogroženosti i ¦ Q i ^stopnja ogroženosti l vlaga "podatek morje " podatek temperatura " sonce " snežne razmere podatek veter mračni tlak požarna ogroženost L.,... ,;,,-. . :irn..ia I.I-I..I.. iiiif.1. -" r j,,... |..|3_... | , .j-| .neugodne razmere i ugodne razmere opozorilo oblaki jadralne razmere Slika 6.4: Hassejev diagram relacije biti manj specifičen med podatkovnimi delčki informacij 6. Predstavitev znanja v sistemu za dialog 67 iz v < w in v'Rw sledi 3w' G W: (w'Rv in w' < v'), Ih pa je dvomestna relacija med svetovi in izjavami (w \\- A beremo kot izjava A je v svetu w veljavna), da za poljubni izjavi A in B, izjavno spremenljivko p, ter svetova w in v velja: i ** wlhT »** wY _L O** w \\- p in w < v slea 4**. w Ih -A čee 5**. w Ih A AB cee fi** w Ih AV B cee h** w\\- A^B cee ožž w Ih x/A cee 9**. w\\- AA cee v Ih p (monotonost izjavnih spremenljivk) \/veW:(izw w sledi v Y B. Zaradi tranzitivnosti relacije - za v' > w' velja v' > w in zato v' ih B. Sledi w' II-B. . A je B A C. Tedaj w Ih B A C pomeni, da w Ih i? in w Ih C. Po indukcijski predpostavki velja w' Ih B in w' Ih C, torej w' \\- B A C. . A je B V C. Tedaj w Ih i? V C pomeni, da velja w Ih i? ali w Ih C. Če velja w Ih L>, po indukcijski predpostavki sledi w' Ih B in zato tudi it/ Ih B V C. Za w \\- C podobno. . A je B =>- C. Tedaj w Ih L> =>- C pomeni, da za vse v > w, iz v \\- B sledi v Ih C. Naj bo v' > w'. Zaradi tranzitivnosti < sledi w < v', zaradi w Ih B =>- C pa iz t/ Ih B sledi t/ Ih C. Torej res w1 h B ^ C. . A je XjB. Tedaj w Ih \jB pomeni, da obstaja v G W, da je vRw in w Ih ß. Pravilo 0** v definiciji 8 zaradi wi?w in w < w' pravi, da obstaja svet v', da velja v < v' in v'Rw'. Po indukcijski predpostavki sledi i/ Ih L>, torej w' Ih yß. . A je Aß. Tedaj w Ih AB pomeni, da obstaja v E W, da je wRv in v Ih L>. Pravilo 0** v definiciji 8 zaradi wife in w < w' pravi, da obstaja svet v', da velja v < v' in w'Rv'. Po indukcijski predpostavki sledi i/ Ih L>, torej w' Ih Aß. Konec dokaza. Zaradi leme o monotonosti lahko o svetovih Kripkejevih modelov razmišljamo kot o možnih stopnjah znanja; svet, ki je v delno urejeni množici (W, <) uvrščen višje, predstavlja razširitev našega znanja. Ko se pomikamo po delni urejenosti navzgor, se naše znanje kopiči - ničesar ne pozabimo, vemo kvečjemu več. Predpostavljajmo sedaj, da smo v svetu v. Dejstvo, da je ta svet dosegljiv iz sveta w lahko spet obravnavamo kot neke vrste osnovno resnico. Zaradi tega bi moral iz w biti dosegljiv tudi vsak svet v' > v, vendar je smiselno pričakovati, da smo medtem o svetu w zbrali že več podatkov, zaradi česar je w prešel v svet w' > w. Takšen razmislek nas pripelje do prvega dela pravila 0** iz definicije 8. Ostale dele tega pravila pojasnimo na podoben način. Primer 1 Oglejmo si primere svetov v predstavitvi vremenskih podatkov. Predpostavimo, da vir znanja sistema vsebuje podatke o trenutni temperaturi v Ljubljani, o temperaturi v Ljubljani danes zvečer ter o pričakovani jutrišnji dnevni temperaturi v Sloveniji. Naj bo Ljubljana svet z vodilno atomarno izjavo Ljubljana, Slovenija pa svet z vodilno atomarno izjavo Slovenija, oba brez dodatnih omejitev. Ker je izjavna spremenljivka Slovenija v relaciji biti manj specifičen z izjavno spremenljivko Ljubljana (slika 6.1), svet Ljubljana vsebuje naslednje izjave: Ljubljana temperatura =^> trenutno (15) trenutno =^> temperatura (15) 6. Predstavitev znanja v sistemu za dialog 69 temperatura =>- danes zvečer (10) danes zvečer =>- temperatura (10) V5''0''em'?a(temperatura => jutri podnevi) (od 13 do 11) V5'0"emj'a(jutri podnevi => temperatura) (od 13 do 11) Svet Slovenija pa vsebuje izjave: Slovenija temperatura =>- jutri podnevi (od 13 do 11) jutri podnevi =>- temperatura (od 13 do 11) Ai;uW-?ana(temperatura => trenutno) (15) Ai;uW-?ana(trenutno => temperatura) (15) Ai;uW-?ana(temperatura => danes zvečer) (10) Ai;uW-?ana(danes zvečer => temperatura) (10) Pri tem smo modalnima operatorjema \j in A dodali indeks atomarnih izjav (\jslovenva oz. /\Liubliana)} ki pove, na kateri relevanten svet se izjava nanaša, dejansko informacijo (npr. opis temperature) pa smo zapisali v oklepajih na koncu izjave. Naslednji izrek pravi, da dialog mlPC Kripkejevi modeli (definicija 8) zadoščajo vsem pravilom sklepanja IPC (definicija 5) ter navaja dodatna pravila sklepanja, ki zajemajo spodnji ali zgornji diamant. Tako dobljene sklepe, sestavljene le iz ene izjavne spremenljivke in enomestnih izjavnih veznikov, imenujemo končne izjave in jih iz nadaljnjih sklepov izločimo. Izrek 3 Dialog mlPC Kripkejevi modeli zadoščajo vsem pravilom sklepanja intuicio-nističnega izjavnega računa IPC, t.j. za poljubno množico izjav T in nekončno izjavo A iz T h A sledi T Ih A. Za svetova w in v, nekončni izjavi A in B, ter kontekst Y v dialog mlPC Kripkejevih modelih veljajo tudi naslednja pravila sklepanja: BI. Spodnji diamant rh A rhyyi 6. Predstavitev znanja v sistemu za dialog 70 B2. Zgornji diamant rhi Th AAA YhAA r h AA B3. Konjunkcija in spodnji/zgornji diamant rhy(iA5) Yh A(AAB) rhyAAy^ T h AAA AB B4- Disjunkcija in spodnji/zgornji diamant rhyAVy^ YhAAwAB rhy(Avß) rhA(ivß) B5. Konjunkcija, implikacija in spodnji/zgornji diamant rhy(ÄA(Ä^ß)) r h A(A A (A => B)) rhyß rhAB Pravila sklepanja iz izreka 3 z dvojno črto beremo kot veljavne sklepe v obe smeri. Na primer, drugi del pravila BI pravi, da iz Y h y y A sledi Y h \jA in obratno. Dokaz. Z indukcijo na strukturo izpeljave A iz konteksta T. Pokažemo, da so vsi aksiomi veljavni, pravila sklepanja pa veljavnost ohranjajo. Z intuicionističnim delom ni težav, zato dokažimo le veljavnost pravil, ki vsebujejo katerega izmed modalnih operatorjev. Naj v svetu w velja množica izjav Y. BI. Predpostavimo w Ih A. Zaradi refleksivnosti R (wRw) velja w Ih y A. Za drugi del predpostavimo w Ih y y A. Obstaja torej svet w'Rw, v katerem velja \jA in zato obstaja še en svet vRw', da velja v Ih A. Zaradi tranzitivnosti relacije dosegljivosti (vRw) tedaj sledi w Ih y A Obratni sklep je posledica prvega dela pravila BI. B2. Predpostavimo w Ih A Zaradi refleksivnosti R (wRw) velja w Ih AA Za drugi del spet predpostavimo w Ih AAA Obstaja torej svet w', da je wRw' in w' Ih AA Tedaj obstaja tudi svet v, da je w'Rv in v Ih A Zaradi tranzitivnosti relacije dosegljivosti (wRv) in veljavnosti v Ih A sledi w Ih AA Obratni sklep je posledica prvega dela pravila B2. B3. Predpostavimo w Ih y(A A B). To pomeni, da 3v : (wi?w in v Ih A A B). Torej i> Ih A in v Ih L>, iz česar sledi w Ih yA A \jB. Za zgornji diamant podobno. B4. Predpostavimo w Ih \jA V yL>. To pomeni, da 3v : (wi?w in v Ih A) ali 3i/ : (v'Rw in i/ Ih B). V obeh primerih velja w Ih y(A V ß). Za obratni sklep predpostavimo w Ih \/(A V ß), kar pomeni, da 3v : (wi?w in v Ih A V B). Sledi i> Ih A ali v Ih ß, torej res w Ih yA V \jB. Za zgornji diamant podobno. 6. Predstavitev znanja v sistemu za dialog 71 B5. Predpostavimo w Ih X/(A A (A =>- B)). To pomeni, da 3v : (vRw in v \\- A in v lh A =^> L>). Zaradi refleksivnosti < sledi v Ih -S in zato w Ih yL>. Za drugi del predpostavimo w Ih A (A A (A =>- L>)). To pomeni, da 3w : (wife in v Ih A in v Ih A =^> L>). Zaradi refleksivnosti < spet sledi v Ih B in zato w Ih AB. Konec dokaza. Na primerih si oglejmo, kako se modul za vodenje dialoga obnaša, ko uporabnik naredi poteze tipa Query-yn, Query-wr, Query-wi, Query-wl ali Query-wt (poglavje 5), t.j. poteze, katerih namen je pridobiti določeno vremensko informacijo. Obnašanje sistema v primeru potez tipa Query-yn, Query-wr in Query-wt ponazarja primer 2 - sistem se premakne v svet z atomarnima izjavama zahtevanega kraja in vrste podatka ali pa v svet z atomarnima izjavama zahtevanega časovnega trenutka in kraja. Pri potezah tipa QUERY-WI (primer 3) se sistem premakne v svet z atomarnima izjavama zahtevanega kraja in časovnega trenutka, pri potezah tipa QUERY-WL (primer 4) pa v svet z atomarnima izjavama zahtevane vrste vremenskega podatka in časovnega trenutka. Primer 2 V mislih imejmo primer 1 in predpostavimo, da uporabnika zanima jutrišnja temperatura v Ljubljani. Sistem lahko (ko nima zahtevane informacije) uporabnika usmerja k izbiri dosegljivih, relevantnih podatkov tako, da ponudi relevantne kraje ali relevantne časovne trenutke, za katere je sposoben podati zahtevano informacijo. Relevantne kraje izbere tako, da se iz sveta Ljubljana premakne v svet, katerega dodatna omejitev je temperatura. Svetova Ljubljana in Slovenija iz primera 1 tako preideta v svetova Ljubljana-temperatura in Slovenija-temperatura, ki ju dobimo tako, da množici prvotnih izjav dopolnimo z omejitvijo temperatura in uporabimo pravila sklepanja iz izreka 3. Pri tem je Ljubljana < Ljubljana-temperatura in Slovenija < Slovenija-temperatura. V svetu Ljubljana-temperatura so veljavne naslednje izjave: Ljubljana, temperatura temperatura =^> trenutno (15) trenutno =^> temperatura (15) temperatura =^> danes zvečer (10) danes zvečer =^> temperatura (10) vSlovenija-temperatura(tempeTSitmSi ^ -utvi p0(Jnevi) (od 13 do 11) vsiovenija-temperatura(-utri ponevi => temperatura) (od 13 do 11) Naslednje končne izjave dobimo s pomočjo pravil sklepanja iz izreka 3. trenutno (15) 6. Predstavitev znanja v sistemu za dialog 72 danes zvečer (10) ^Slovenija-temperatura-utr[ pOCJnevi (od 13 do 17) Dane izjave nazorno kažejo, da ima sistem podatke o trenutni temperaturi v Ljubljani in o temperaturi v Ljubljani danes zvečer, dosegljiv pa je tudi podatek o jutrišnji temperaturi v Sloveniji, kar je zagotovo relevantno, saj sta izjavni spremenljivki oz. vodilni atomarni izjavi Slovenija in Ljubljana v relaciji biti manj specifičen (slika 6.1). Relevantne časovne trenutke pa sistem najde tako, da se premakne v svet jutri podnevi-Ljubljana, katerega vodilna atomarna izjava je jutri podnevi, dodatna omejitev pa Ljubljana. Svetovi jutri podnevi, trenutno in danes zvečer tedaj preidejo v svetove jutri podnevi-Ljubljana, trenutno-Ljubljana in danes zvečer-Ljubljana. Pri tem je jutri podnevi < jutri podnevi-Ljubljana, trenutno < trenutno-Ljubljana in danes zvečer < danes zvečer-Ljubljana, v svetu jutri podnevi-Ljubljana pa veljajo naslednje izjave: jutri podnevi, Ljubljana temperatura =/- Slovenija (od 13 do 11) Slovenija =/- temperatura (od 13 do 11) A*renuftl°-iJuWJona(temperatura => Ljubljana) (15) ^trenutno-Ljubljana^uhl^n^ ^ temperatura) (15) vtrenutno-L3ubljana^emperatmai ^ Ljubljana) (15) v«ren«too-L;«6/;ana(Ljubljana ^ temperatura) (15) /^danes zvečer-Ljubljana ^empeTditnm ^ Ljubljana) (10) /^danes zvečer-Ljubljana^^^ ^ temperatura) (10) vdanes zvečer-Ljubljana^emperatmSi ^ Ljubljana) (10) vdanes zvečer-Ljubljana^^^ ^ temperatura) (10) Naslednje končne izjave dobimo s pomočjo pravil sklepanja iz izreka 3. A«ren«too-L;«6/;anatemperatura ^ ^trenutno-LjubljanatempeTditnm ^ Adanes OTe&r-Lj«60anatemperatura ^Qj vdanes OTe&r-Lj«60anatemperatura ^Qj 6. Predstavitev znanja v sistemu za dialog 73 Vidimo, da so podatki o trenutni temperaturi v Ljubljani in o temperaturi v Ljubljani danes zvečer relevantni, saj sta izjavni spremenljivki jutri podnevi in trenutno ter izjavni spremenljivki jutri podnevi in danes zvečer v obojesmerni relaciji biti manj specifičen (slika 6.3). Primer 3 Predpostavimo, da uporabnika zanimajo vse dosegljive vrste podatkov za Mursko Soboto fQUERY-Wl poteza). Sistem najde odgovor na to vprašanje v svetu Murska Sobota-trenutno, katerega atomarni izjavi sta Murska Sobota (vodilna atomar-na izjava) in trenutno. Vse izjave tega sveta dobimo tako, da vzamemo svet Murska Sobota in mu dodamo omejitev trenutno ter uporabimo pravila sklepanja iz izreka 3. Primeri izjav sveta Murska Sobota-trenutno so: Murska Sobota, trenutno vreme =/- trenutno (pretežno jasno) trenutno =/- vreme (pretežno jasno) temperatura zraka =/- trenutno (6) trenutno =/- temperatura zraka (6) hitrost vetra =/- trenutno (1) trenutno =/- hitrost vetra (1) smer vetra =/- trenutno (severozahodni veter) trenutno =/- smer vetra (severozahodni veter) ^siovemja-trenutno^maiX temperatura zraka => trenutno) (9) ySiovenija-trenutno(^iemx^no _^_ max temperatura zraka) (9) ySiovenija-trenutno^^ temperatura zraka => trenutno) (-4) ySiovenija-trenutno(^iemx^no _^_ mjn temperatura zraka) (-4) Naslednje končne izjave dobimo s pomočjo pravil sklepanja iz izreka 3. vreme (pretežno jasno) temperatura zraka (6) hitrost vetra (1) smer vetra (severozahodni veter) 6. Predstavitev znanja v sistemu za dialog 74 ySiovenija-trenutnomKX temperatura zraka (9) ^siovemja-trenutnomin temperatura zraka (-4) Izjave pravijo, da ima sistem podatke o vremenu, temperaturi zraka, hitrosti vetra in smeri vetra v Murski Soboti, pozna pa tudi trenutno najvišjo in najnižjo temperaturo zraka v Sloveniji. Primer 4 Predpostavimo, da uporabnika zanimajo vsi kraji, za katere sistem dostopa do podatkov o vremenu jutri popoldan ('QUERY-WL poteza). Odgovor na to vprašanje sistem najde v svetu vreme-jutri popoldan, katerega atomarni izjavi sta vreme (vodilna atomarna izjava) in jutri popoldan. Vse izjave tega sveta dobimo tako, da vzamemo svet vreme in mu dodamo omejitev jutri popoldan ter spet uporabimo pravila sklepanja iz izreka 3. Primeri izjav sveta vreme-jutri popoldan so: vreme, jutri popoldan jutri popoldan =>- morje (pretežno jasno) morje =>- jutri popoldan (pretežno jasno) jutri popoldan =>- gore (krajevne plohe) gore =>- jutri popoldan (krajevne plohe) jutri popoldan =>- sever (posamezne plohe) sever =>- jutri popoldan (posamezne plohe) jutri popoldan =>- zahod (delno jasno, občasno bolj oblačno) zahod =>- jutri popoldan (delno jasno, občasno bolj oblačno) ^NE-dezuje-jutripopoidanQu^rj popoldan =>- morje) (pretežno jasno) ANE_dežuje-jutripoPoidan(morje ^ jutri p0poldan) (pretežno jasno) Avidijivost-jutri popoldanQutri p0poldan => Štajerska) (do 10 km) Avidijivost-jutripopoidan(gtajerska ^ jutri p0poldan) (do 10 km) Naslednje končne izjave dobimo s pomočjo pravil sklepanja iz izreka 3. morje (pretežno jasno) gore (krajevne plohe) 6. Predstavitev znanja v sistemu za dialog 75 sever (posamezne plohe) zahod (delno jasno, občasno bolj oblačno) ANE-dežuje-jutri popoldanmorje (pretežno jasno) Avidljivost-jutripopoldangtajerska ßQ w kmJ Dobljene izjave pravijo, da sistem razpolaga s podatki o vremenu jutri popoldan za slovensko obalo, za gore ter za severni in zahodni del Slovenije. Poleg tega ve še, da ob slovenski obali jutri popoldan ne be deževalo, in zna povedati, kakšna bo takrat vidljivost na Štajerskem (vreme in NE_dežuje oz. vidljivost sta v relaciji biti manj specifičen (slika 6.4)). Omenimo še, kdaj svet w vsebuje izjavo ->A in kako se sistem v tem primeru odziva. Izjava -1A pomeni, da izjava A ne velja v obenem svetu v, ki je z relacijo < dosegljiv iz svet w. Takšni svetovi v > w vsebujejo vse atomarne izjave sveta w in vsaj eno dodatno omejitev. Izjava A zato v svetu w velja, če za nobeno izbiro dodatnih omejitev vir znanja ne vsebuje informacije A. Recimo, da svet Ljubljana z edino atomarno izjavo Ljubljana vsebuje izjavo -ivreme. To pomeni, da sistem nima podatka o vremenu za nobeno izbiro časovnega enutka, kar sistem ve, še preden se premakne v svet Ljubljana-vreme, da bi uporabniku ponudil vreme v dosegljivih časovnih trenutkih. Svet Ljubljana-vreme v tem primeru vsebuje atomarno izjavo vreme in neatomarno izjavo -ivreme (ekvivalentna vreme =>- _L), iz česar po aksiomu A6 iz definicije 5 izpeljemo l- _L. i Evalvacija modula za vodenje dialoga 7.1 Ogrodje PARADISE 7.2 Rezultati evalvacije dialogov iz prvega eksperimenta Čarovnik iz Oza 7.3 Rezultati evalvacije dialogov iz drugega eksperimenta Čarovnik iz Oza Opisali bomo potencialno splošno metodologijo evalvacije sistemov za dialog, namreč ogrodje PARADISE (PARAdigm for Dialogue System Evaluation), ki omogoča izpeljavo ocene učinkovitosti sistema kot uteženo linearno kombinacijo od domene odvisnih 'parametrov uspešnosti naloge in cen dialoga. Ogrodje PARADISE bomo uporabili za evalvacijo sistemov iz obeh eksperimentov Čarovnik iz Oza in prišli do zaključka, da lahko učinkovitost modula za vodenje dialoga opazno izboljšamo, če zagotovimo čim večjo fleksibilnost sistema pri iskanju dosegljivih, relevantnih podatkov. To fleksibilnost sicer v precejšnji meri zagotovlja že dialog mlPC Kripkejev model znanja, zaradi velikega vpliva na zadovoljstvo uporabnikov pa jo bomo v poglavju 8 poskušali še izboljšati. 76 7. EVALVACIJA MODULA ZA VODENJE DIALOGA 77 7.1 Ogrodje PARADISE Z razvojem sistemov za dialog se pojavljajo tudi potrebe po evalvaciji in primerjavi teh sistemov. V zadnjih dveh desetletjih so bili zato predlagani številni objektivni parametri dialoga [Price-1992, Danieli-1995, Smith-1997], . število izjav, . čas dialoga, . povprečni čas odziva uporabnika, . povprečni čas odziva sistema, . delež izjav, sestavljenih iz več kot ene besede, . povprečna dolžina izjav, sestavljenih iz več kot ene besede, kijih lahko določimo brez mnenja človeka, in parametri, ki temeljijo na mnenju človeka, namreč subjektivni parametri dialoga [Shriberg-1992, Danieli-1995, Boyce-1996], . delež izjav, s katerimi sistem popravlja napake, . delež kontekstno primernih izjav sistema, . hevristična evalvacija stopnje sodelovanja sistema na podlagi Griceovih maksim [Grice-1975], opisanih v podpoglavju 4.2, . delež pravilnih in delno pravilnih odgovorov, . delež primernih in neprimernih izjav, s katerimi sistem usmerja uporabnika, . zadovoljstvo uporabnika. Izkaže pa se, da kombinacija različnih parametrov evalvacije dialoga lahko pripelje do težav. V [Danieli-1995] podana primerjava dveh sistemov za podajanje informacij o železniških povezavah na primer kaže, da lahko en sistem sicer omogoča več uspešno zaključenih dialogov in povzroča manj neustreznih in popravnih izjav, dialogi z drugim sistemom pa so zato lahko za polovico krajši. V tem primeru ni bilo mogoče ugotoviti, kateri od sistemov je bolj uporaben. Z namenom omogočiti primerjavo sistemov z različnimi domenami, kjer je pomembno vedeti, v kolikšni meri posamezni parametri vplivajo na učinkovitost in kako strategija vodenja dialoga vpliva na zadovoljstvo uporabnikov, je bilo leta 1997 kot potencialna splošna metodologija evalvacije sistemov za dialog predlagano ogrodje PARADISE (PARAdigm for Dialogue System Evaluation) [Walker-1997]. Ogrodje PARADISE omogoča izpeljavo ocene učinkovitosti sistema kot uteženo linearno kombinacijo od domene odvisnih parametrov uspešnosti naloge in cen dialoga, zajema pa model učinkovitosti sistema (slika 7.1), ki za osnovni cilj postavlja maksimizirati zadovoljstvo uporabnikov [Shriberg-1992]. 7. EVALVACIJA MODULA ZA VODENJE DIALOGA 78 Maksimizirati zadovoljstvo uporabnikov Maksimizirati uspešnost naloge ^_________ Minimizirati cene dialoga Parametri učinkovitosti Parametri kvalitete Slika 7.1: Model učinkovitosti sistema za dialog, ki ga zajema ogrodje PARADISE Cene dialoga lahko razdelimo na dva tipa: parametri učinkovitosti in parametri kvalitete. Parametri učinkovitosti dialoga (npr. število izjav, ki jih uporabnik potrebuje, da izpolni svojo namero, ali čas dialoga) merijo, kako učinkovito sistem uporabniku pomaga pri doseganju njegove namere. Parametri kvalitete dialoga (npr. kolikokrat mora uporabnik ponoviti svojo izjavo, da ga sistem razume, ali kakšen je čas čakanja na odziv sistema) pa zajemajo ostale vidike, ki lahko na zadovoljstvo uporabnika prav-tako močno vplivajo. Če želimo sistem za dialog evalvirati z ogrodjem PARADISE, moramo podatke zbrati v eksperimentu, v katerem bodo uporabniki ocenili svoje zadovoljstvo, t.j. podali stopnjo strinjanja z izjavami o obnašanju oz. učinkovitosti sistema. Ostale parametre modela (parametri uspešnosti naloge, cene dialoga) pa je treba določati samodejno ali jih ročno označiti. Model učinkovitosti sistema, ki ga zajema ogrodje PARADISE, trdi, da lahko funkcijo učinkovitosti sistema določimo s pomočjo multiple linearne regresije (MLR) z zadovoljstvom uporabnikov kot neodvisno spremenljivko ter parametri uspešnosti naloge, parametri učinkovitosti dialoga in parametri kvalitete dialoga kot neodvisnimi spremenljivkami: Učinkovitost = (a * Af(n)) n Wi * M{ct) Pri tem je a utež Kappa koeficienta k [Carletta-1996b], ki ga izračunamo iz kontin-genčne tabele uspešnosti razumevanja uporabnikovih govorjenih izjav (podpoglavje 7.2), Wi so uteži cen q, N pa je funkcija normalizacije, N{x) = X — Xq a, x0 kjer sta xö in aX0 srednja vrednost in standardni odklon spremenljivke xo v učni množici. Srednja vrednost s funkcijo normalizacije N preslikanih parametrov učne množice je 0, standardni odklon pa 1. Tako se znebimo težav, ki se pojavijo, če primerjamo vrednosti parametrov, ki se raztezajo na različnih intervalih in/ali so njihove vrednosti različno razpršene. Z normalizacijo parametrov k in q dosežemo relevantnost prispevkov 7. EVALVACIJA MODULA ZA VODENJE DIALOGA 79 uteži preslikanih parametrov Af{n) in M {ci) k učinkovitosti sistema za dialog. Vrednosti funkcije učinkovitosti sistema lahko uporabimo za napovedovanje zadovoljstva uporabnikov, pri čemer za učno množico vrednosti odvisne spremenljivke uporabimo vrednosti zadovoljstva uporabnikov, pridobljene v ustreznem eksperimentu. Rezultat multiple linearne regresije na učni množici parametrov, ki praviloma tvorijo predoločen sistem, je množica uteži, ki pomenijo relativni prispevek teh parametrov k učinkovitosti sistema. MLR temelji na metodi najmanjših kvadratov, saj minimizira vsoto kvadratov razlik med v eksperimentu pridobljenimi vrednostmi in napovedanimi vrednostmi zadovoljstva uporabnikov. Torej Af{US)=Af{US) + e, kjer je M {US) normalizirana pridobljena, M {US) pa napovedana normalizirana vrednost zadovoljstva uporabnikov. Napako, t.j. razliko med obema vrednostma, smo označili z e. Nenormalizirano vrednost zadovoljstva uporabnikov lahko tedaj ocenimo kot_____ ____ ___ US = M{US)aUSo + U S0 + taUSo = US + taUSo, kjer sta U So in aus0 srednja vrednost in standardna deviacija vrednosti zadovoljstva uporabnikov v učni množici MLR modela učinkovitosti sistema. Kako dobro US napoveduje US, lahko vidimo s pomočjo razmerja absolutnih vrednosti njune razlike in pridobljene vrednosti zadovoljstva US danega uporabnika, (TTQ tTq\ \US-US\ q(US,US) = —m-. Naslednje razmerje pa kaže, da ocena normalizirane vrednosti zadovoljstva uporabnika ni tako dobra kot ocena nenormalizirane vrednosti, če je le US > ^f^: (\r(TTQ\ kthTqw W{us)-mTs)\ \us-ušE-^s)aUSo\ q{J\f{US),J\f{US)) _ \M(us)\ _ \us-us0\ _ \US\ a(USUS) \us-us\ \us-M(us)aUSo-us0\ \US-US0\ q{ ' ; \us\ ----------pš\---------- ' U| Oceno nenormalizirane vrednosti zadovoljstva uporabnika US, ki je v večini primerov veliko boljša od ocene normalizirane vrednosti Af{US), dobimo takole: US = N{US)aUSo + U SQ Ne samo, da v literaturi [Walker-1997, Walker-1998, Kamm-1999, Litman-2002] temu ni posvečena pozornost, ampak tudi ni omenjeno, da je treba vrednosti zadovoljstva uporabnikov v učni množici, preden začnemo z izpeljavo takšnega MLR modela učinkovitosti, normalizirati, če želimo preprečiti prevelike napake ocen. Uporaba te metode pri reševanju predoločenega sistema pa zahteva izpolnitev vrste pogojev [Johnson-2002]. Najbolj očitna zahteva je, da mora obstajati približno linearna zveza med odvisno spremenljivko na eni in neodvisnimi spremenljivkami na drugi 7. EVALVACIJA MODULA ZA VODENJE DIALOGA 80 strani. Naslednja zahteva ne dovoljuje visoke koreliranosti neodvisnih spremenljivk (po absolutni vrednosti okrog 0.5), kar lahko preverimo z izračunom korelacij med spremenljivkami. Odvečne neodvisne spremenljivke je zato potrebno odstraniti iz predoločenega sistema. Pokazati pa se da tudi, da neodvisne spremenljivke, ki so z odvisno spremenljivko v zelo nizki korelaciji (po absolutni vrednosti pod 0.1), povečajo varianco napovedi, zaradi česar lahko napako napovedi zmanjšamo, če takšne spremenljivke iz sistema odstranimo. Potem ko smo zgradili modul za vodenje dialoga v sistemu za podajanje informacij o vremenu, smo želeli ovrednotiti njegovo učinkovitost oz. videti, kako ga sprejemajo uporabniki. V ta namen smo vzeli podatke iz obeh eksperimentov Čarovnik iz Oza (poglavje 3), jih ovrednotili z ogrodjem PARADISE in rezultate med sabo primerjali. 7.2 Rezultati evalvacije dialogov iz prvega eksperimenta Čarovnik iz Oza Sistem Čarovnik iz Oza, ki smo ga uporabili v prvem eksperimentu Čarovnik iz Oza (podpoglavje 3.3), bomo evalvirali z ogrodjem PARADISE in rezultate primerjali z rezultati evalvacije podatkov iz drugega eksperimenta (podpoglavje 3.4). Edino razliko sistemov, uporabljenih v teh eksperimentih, predstavlja način vodenja dialoga. Prvič je to nalogo s pomočjo grafičnega vmesnika opravljal čarovnik, drugič pa modul za vodenje dialoga, opisan v poglavju 5. V obeh eksperimentih so uporabniki ocenili svoje zadovoljstvo tako, da so podali stopnjo strinjanja z izjavami o obnašanju oz. učinkovitosti sistema (tabela 3.2). Splošno zadovoljstvo uporabnika smo dobili tako, da smo vse točke te ankete sešteli. Vrednosti teh parametrov, ki jih bomo uporabljali kot vrednosti odvisne spremenljivke v MLR modelu učinkovitosti sistema, zato ležijo med 8 in 40. Del parametrov uspešnosti naloge, parametrov učinkovitosti dialoga in parametrov kvalitete dialoga, ki v MLR modelu učinkovitosti predstavljajo neodvisne spremenljivke, smo določili samodejno, del pa smo ročno označili. V prvem eksperimentu smo tako določili parametra uspešnosti naloge . Kappa koeficient (k) in . izpolnitev naloge (Comp), mnenje uporabnika o izpolnitvi prve naloge, ki smo mu jo v eksperimentu zastavili, parameter učinkovitosti dialoga . povprečni čas dialoga (MET), povprečni čas trajanja dialoga brez vštetega trajanja odzivov sistema, in parametre kvalitete dialoga 7. EVALVACIJA MODULA ZA VODENJE DIALOGA 81 . povprečni čas čakanja na odziv (MRT), povprečni čas, ki ga sistem porabi, preden se odzove, . delež nepodanih informacij (NPR), delež začetnih potez uporabnika, na katere sistem ne poda relevantnega odgovora, . delež zavrnitev (RR), delež izjav sistema, s katerimi uporabnika prosi, naj ponovi zadnjo izjavo, t.j. Pardon potez, . delež nuđenja pomoči (HMR), delež izjav sistema, s katerimi uporabniku pomaga nadaljevati dialog, t.j. Reply-help in Reply-timeout potez, . delež negativnih odgovorov (NDR), delež potez, s katerimi sistem sporoča, da nima zahtevanega podatka in pri tem uporabnika ne usmerja k izbiri relevantnih, dosegljivih podatkov, . delež izbire relevantnih podatkov (RDR), delež potez sistema, ki uporabnika usmerjajo k izbiri relevantnih, dosegljivih podatkov, in . delež neprimernih iniciativ (UIR), delež začetnih potez uporabnika, katerih vsebina ne ustreza domeni sistema. Kappa koeficient (k) izračunamo s pomočjo kontingenčne tabele, ki podaja ujemanje med vsebino zahtev uporabnika (ključ) in dojemanjem te s strani sistema (odgovor). Primer kontingenčne tabele prikazuje slika 7.2. KUUC kraj čas podatek ODGOVOR Krvavec Primorje otele Rogla trenutno 1 vikend sobote. 1 denes temp. 1 viš. 1 temp. smer snega morje vetra kraj Krvavec 2 Primorje 1 obala 1 Eogk 1 cas trenutno 3 viliend 0 soboti 1 0 danes 1 D podatek temp 2 snega temp 1 1 1 15 2 111 3 2 0 0 2 111 Slika 7.2: Primer kontingenčne tabele dialoga Vsako ujemanje ključa z odgovorom poveča število v ustrezni diagonalni celici kontingenčne tabele za 1. Zunajdiagonalne celice pripadajo neujemanjem, ki znotraj tekoče konverzacijske igre niso bila odpravljena. Začasni nesporazumi, ki jih sogovornika znotraj tekoče konverzacijske igre odpravita, se namreč odražajo v cenah dialoga. Kappa koeficient, ki meri ujemanje opisov različnih označevalcev, izračunamo kot 7. EVALVACIJA MODULA ZA VODENJE DIALOGA 82 = P(A) - P(E) K- 1-P(E) ' kjer P(A) = En = 1M(M) izraza ujemanje ključa in odgovora v kontingenčni tabeli M z vsoto vseh števil enako T, ki opisuje dialog z n konverzacijskimi igrami, n P(E) = Bi)2 i=1 pa je verjetnost pričakovanega ujemanja dveh različnih označevalcev, ki dane kategorije tabele izbirata z enako verjetnostjo, pri čemer je U vsota števil z-tega stolpca tabele. Če je P (A) enako verjetnosti pričakovanega ujemanja P(E), je k = 0, pri popolnem ujemanju (P(A) = 1), pa je k = 1. Srednje vrednosti vseh parametrov dialogov, pridobljenih v obeh eksperimentih Čarovnik iz Oza, so podane v tabeli 7.1. WOZ1 WOZ2 Kappa koeficient (k) 0.94 0.98 izpolnitev naloge (Comp) 0.97 0.96 povprečni čas dialoga (MET) 15.41 s 22.03 s povprečni čas čakanja na odziv (MRT) 5.57 s 6.61 s delež nepodanih informacij (NPR) 0.31 0.28 delež zavrnitev (RR) 0.01 0.03 delež nuđenja pomoči (HMR) 0.01 0.06 delež negativnih odgovorov (NDR) 0.08 0.07 delež izbire relevantnih podatkov (RDR) 0.06 0.20 delež neprimernih iniciativ (UIR) 0.13 0.04 delež neiniciativnih potez (NIR) - 0.50 delež preverjanj (CR) - 0.20 zadovoljstvo uporabnika (US) 34.08 31.96 Tabela 7.1: Srednje vrednosti parametrov v prvem (WOZ1J in v drugem fWOZ2y) eksperimentu Čarovnik iz Oza Zanimivo je, da se cene kvalitete dialoga delež nepodanih informacij, delež negativnih odgovorov in delež izbire relevantnih podatkov v literaturi ne pojavljajo. Razlog je verjetno ta, da imajo razvijalci sistemov za dialog redko na razpolago podatkovno zbirko, katere struktura bi bila tako zelo časovno odvisna in skopa kot je naša. Izračun korelacijskih koeficientov posameznih parametrov (tabela 7.2) pokaže, da je iz MLR modela učinkovitosti sistema zaradi zelo nizke korelacije (-0.01) z odvisno 7. EVALVACIJA MODULA ZA VODENJE DIALOGA 83 spremenljivko zadovoljstvo uporabnika (US) potrebno odstraniti delež izbire relevantnih podatkov (RDR). Razen tega je zaradi visoke korelacije (0.47 oz. 0.48) s parametrom delež nepodanih informacij (NPR) potrebno odstraniti tudi delež negativnih odgovorov (NDR) in delež neprimernih iniciativ (UIR). Pri tem omenimo, da sta mejni vrednosti 90% intervala zaupanja za korelacijski koeficient 0.1 (meja izločanja zaradi prenizke korelacije) enaki 0.08 in 0.13, mejni vrednosti 90% intervala zaupanja za korelacijski koeficient 0.5 (meja izločanja zaradi previsoke korelacije) pa 0.39 in 0.67. K Comp MET MRT NPR RR HMR NDR RDR UIR US K 1.0 Comp 0.0 1.0 MET -0.2 0.2 1.0 MRT -0.2 0.0 0.3 1.0 NPR 0.1 -0.2 -0.3 -0.1 1.0 RR -0.1 -0.2 -0.1 0.3 0.3 1.0 HMR 0.1 -0.1 0.3 -0.0 0.1 -0.0 1.0 NDR -0.1 -0.1 -0.1 0.1 0.5 0.2 0.1 1.0 RDR 0.1 -0.0 0.0 -0.1 0.1 0.0 0.1 -0.2 1.0 UIR 0.3 -0.1 -0.1 -0.3 0.5 0.1 0.4 -0.1 -0.1 1.0 US 0.1 0.3 0.1 -0.1 -0.3 -0.3 -0.4 1.0 Tabela 7.2: Korelacijski koeficienti parametrov v prvem eksperimentu Pri izpeljavi funkcije učinkovitosti sistema z metodo multiple linearne regresije smo ugotovili, da na zadovoljstvo uporabnikov najbolj vplivajo izpolnitev naloge (Comp), povprečni čas čakanja na odziv (MRT), delež nepodanih informacij (NPR), delež zavrnitev (RR) in delež nuđenja pomoči (HMR): N\US) = 0.21J\f(C(mip)-0.13J\f(MRT)-0.24J\f(NPR)-0.11J\f(RR)-0.35J\f(HMR) Napovedane ocene Af(US) preslikamo nazaj na prvotno skalo. Dejanske vrednosti zadovoljstva uporabnikov v prvem eksperimentu Čarovnik iz Oza so bližje tem preslikanim ocenam kot pa normalizirane vrednosti ugotovljenega zadovoljstva uporabnikov nepreslikanim ocenam. Razmerje dolžin razlike vektorja pridobljenih vrednosti U Si in vektorja preslikanih napovedanih vrednosti U Si ter dolžine prvega, Q(USi,USi) = \USi-USi\ WTTQ II \\U Ol 2 je bilo 0.12. Razmerje dolžin vektorjev U Si in U Si je bilo 0.99, kot med njima pa je meril 6.92°. Za primerjavo povejmo, daje bilo razmerje dolžin Q(Af(USi),Af(USi)) enako 6.85, razmerje dolžin obeh vektorjev 0.57, kot med njima pa je meril 55.56°. 7. EVALVACIJA MODULA ZA VODENJE DIALOGA 84 7.3 Rezultati evalvacije dialogov iz drugega eksperimenta Čarovnik iz Oza V drugem eksperimentu Čarovnik iz Oza smo definirali dva dodatna parametra kvalitete dialoga, namreč • delež neiniciativnih potez (NIR), delež potez uporabnika, ki ne spadajo med začetne poteze, in • delež preverjanj (CR), delež Check potez sistema. Srednje vrednosti vseh parametrov dialogov, pridobljenih v drugem eksperimentu Čarovnik iz Oza, so, skupaj z vrednostmi iz prvega eksperimenta, podane v tabeli 7.1. Izračun korelacijskih koeficientov posameznih parametrov (tabela 7.3) pokaže, da je iz MLR modela učinkovitosti sistema zaradi zelo nizke korelacije (-0.05 oz. 0.07) z odvisno spremenljivko zadovoljstvo uporabnika (US) potrebno odstraniti delež zavrnitev (RR) in delež negativnih odgovorov (NDR). Razen tega je zaradi visoke korelacije (0.69) s parametrom povprečni čas dialoga (MET) potrebno odstraniti delež neiniciativnih potez (NIR), zaradi visoke korelacije (0.90 oz. 0.86) s parametrom delež preverjanj (CR) pa še delež nuđenja pomoči (HMR) in delež izbire relevantnih podatkov (RDR). Spet omenimo, da sta mejni vrednosti 90% intervala zaupanja za korelacijski koeficient 0.1 (meja izločanja zaradi prenizke korelacije) enaki 0.08 in 0.14, mejni vrednosti 90% intervala zaupanja za korelacijski koeficient 0.5 (meja izločanja zaradi previsoke korelacije) pa 0.38 in 0.68. K Comp MET MRT NIR NPR RR HMR CR NDR RDR UIR us K 1.0 Comp 0.0 1.0 MET -0.4 -0.3 1.0 MRT -0.2 -0.0 0.4 1.0 NIR -0.2 -0.2 0.7 -0.2 1.0 NPR 0.1 -0.2 -0.1 0.1 -0.3 1.0 RR -0.1 -0.3 0.3 0.1 0.3 0.0 1.0 HMR 0.1 0.1 -0.0 -0.1 0.0 0.3 -0.0 1.0 CR -0.0 0.1 0.1 -0.1 0.2 0.2 -0.1 0.9 1.0 NDR 0.2 0.1 -0.2 0.1 -0.4 0.6 -0.1 -0.1 -0.2 1.0 RDR 0.1 0.0 -0.0 -0.1 0.0 0.3 -0.1 0.9 0.9 -0.1 1.0 UIR -0.4 -0.1 0.3 0.3 0.1 0.2 0.2 -0.0 0.0 -0.0 -0.1 1.0 US 0.3 0.2 -0.3 -0.2 -0.2 -0.3 -0.2 1.0 Tabela 7.3: Korelacijski koeficienti parametrov v drugem eksperimentu Pri izpeljavi funkcije učinkovitosti sistema z metodo multiple linearne regresije smo ugotovili, da so na zadovoljstvo uporabnikov v drugem eksperimentu Čarovnik iz Oza 7. EVALVACIJA MODULA ZA VODENJE DIALOGA 85 najbolj vplivali Kappa koeficient (k), izpolnitev naloge (Comp), povprečni čas dialoga (MET), delež nepodanih informacij (NPR) in delež preverjanj (CR): N(US) = 0.2(N(k) + 0.13N(Comp) - O.tfN(MET) - O.lN(NPR) - 0.25N(CR) Napovedane vrednosti preslikamo nazaj na prvotno skalo. Razmerje dolžin Q(US2, US2) je bilo 0.13, razmerje dolžin vektorjev IJS2 in IJS2 pa 0.99. Kot med njima je meril 7.70°. Podobno kot prej, za primerjavo povejmo, da je bilo razmerje Q(N(US2),Nf(US2)) enako 6.53, razmerje dolžin obeh vektorjev 0.48, kot med njima pa je meril 61.00°. V evalvaciji sistemov za branje elektronske pošte [Walker-1998] je bilo ugotovljeno, da izpolnitev naloge močneje vpliva na zadovoljstvo uporabnika kot pa Kappa koeficient. Razlog, ki ga navajajo, je ta, da naj bi uporabniki velikokrat drugače dojemali delovanje sistema, kot ga podaja Kappa koeficient. V naših eksperimentih je bil Kappa koeficient takorekoč odvisen le od čarovnika, ki je nadomeščal razumevanje govora, parameter izpolnitev naloge pa se je nanašal le na prvo nalogo, ki smo jo uporabniku zastavili, kar je najverjetneje razlog, zakaj sami nismo prišli do podobnega zaključka. Po eni strani sta bila v naših eksperimentih Kappa koeficient in izpolnitev naloge nekorelirana (0.00 v prvem in 0.05 v drugem eksperimentu), po drugi strani pa je v drugem eksperimentu Kappa koeficient celo močneje vplival na zadovoljstvo uporabnikov. Parametri, ki so pomembno vplivali na učinkovitost sistema, pri tem pa niso bili podvrženi čarovniku, so delež nepodanih informacij in delež nuđenja pomoči v prvem ter delež nepodanih informacij in delež preverjanj v drugem eksperimentu. Vrednost parametra delež nuđenja pomoči je odvisna od tega, kako se uporabnik v dialogu obnaša, to pa je spet odvisno od stopnje prijaznosti in sodelovanja, ki jo sistem pri vodenju dialoga nudi. Vsekakor, edini cilj sistema za dialog ne sme biti le uspešen zaključek naloge, ampak tudi sposobnost prevzeti iniciativo in nuditi pomoč, ko jo uporabnik potrebuje. Ker nekateri novi uporabniki sistema, ki se niso sposobni hitro prilagajati, pri vodenju dialoga pogosto potrebujejo pomoč, vpliva parametra delež nuđenja pomoči na učinkovitost sistema ni mogoče odpraviti. Tudi vpliva parametra delež preverjanj ni mogoče odpraviti, saj razumevanje govora ponavadi predstavlja najtežavnejši del, če ne celo oviro do učinkovitosti sistema za dialog. Vidimo, da lahko zadovoljstvo uporabnikov pomembno povečamo le z zmanjšanjem vpliva parametra delež nepodanih informacij, t.j. deleža začetnih potez uporabnika, na katere sistem ne poda relevantnega odgovora. Zmanjšanje vrednosti tega parametra lahko dosežemo tako, da sistemu ne dovolimo odziva, preden se ni zares prepričal, da ne dostopa do nobenega relevantnega podatka. Sistem naj torej uporabnika čimbolj fleksibilno usmerja k izbiri dosegljivih, relevantnih podatkov. Čeprav fleksibilnost sistema za podajanje informacij o vremenu v veliki meri podpira v poglavju 6 opisan dialog mlPC Kripkejev model znanja, ki je bil uporabljen v drugem eksperimentu Čarovnik iz Oza, bomo v poglavju 8 to predstavitev znanja poskušali še nekoliko izboljšati. Na koncu smo želeli videti tudi, kakšen je vpliv posameznih parametrov na določene vidike učinkovitosti sistemov iz obeh eksperimentov Čarovnik iz Oza. V ta namen točke vprašalnikov (tabela 3.2), v katerih so uporabniki ocenjevali obnašanje in učinkovitost 7. EVALVACIJA MODULA ZA VODENJE DIALOGA 86 sistemov, nismo sešteli, ampak vsako izmed njih vzeli za odvisno spremenljivko in ji določili MLR model. Ker je bil naš cilj v prvi vrsti evalvirati modul za vodenje dialoga, smo se pri tem osredotočili na pridobivanje informacij (Ali ste brez težav prišli do odgovora na vaša vprašanja?), ustreznost odzivov (Ali se je sistem na vaše izjave odzival hitro (brez pojasnilnih vprašanj)?) in pričakovano obnašanje (Ali se je sistem obnašal tako, kot ste med dialogom od njega pričakovali?). Ugotovili smo, da so na pridobivanje informacij najbolj vplivali Kappa koeficient, povprečni čas dialoga, delež nepodanih informacij, delež zavrnitev in delež preverjanj; na ustreznost odzivov so najbolj vplivali Kappa koeficient, povprečni čas dialoga in delež preverjanj; na pričakovano obnašanje pa Kappa koeficient, izpolnitev naloge, delež nepodanih informacij in delež preverjanj. Ti rezultati naše sklepe vsekakor potrjujejo. 8 Zaključek 8.1 Razširitev predstavitve znanja 8.2 Nadaljnje delo Zaključki, do katerih smo prišli na podlagi rezultatov obeh eksperimentov Čarovnik iz Oza, vodijo do razmišljanja o morebitnih izboljšavah predstavitve znanja, predstavljene v poglavju 6. V skladu s tem bomo predlagali manjšo spremembo modela, kije trenutno udejanjen v sistemu za podajanje informacij o vremenu. Magistrsko delo bomo zaključili z opisom nadaljnjega dela. Predstavili bomo zastavljene cilje in ideje na poti do dokončne izgradnje dvojezičnega sistema za podajanje informacij o vremenu. 87 8. Zaključek 88 8.1 Razširitev predstavitve znanja Oba eksperimenta Čarovnik iz Oza sta pokazala, daje predstavitev znanja v sistemu za dialog izrednega pomena. Čeprav smo v drugem eksperimentu že uporabili predstavitev znanja (poglavje 6), ki temelji na intuicionistični modalni logiki in v veliki meri omogoča ponujanje relevantnih, dosegljivih podatkov, je za izboljšanje zadovoljstva uporabnikov takorekoč nujno razmišljati o morebitnih dodatnih razširitvah oz. izboljšavah. Slabost prvega podatkovnega modela predstavlja tranzitivnost relacije dosegljivosti R, definirane med svetovi dialog mlPC Kripkejevih modelov (definicija 8), oz. tranzitivnost relacije biti manj specifičen, definirane med delčki informacij (slike 6.1, 6.2, 6.3 in 6.4). Če bi namreč z relacijo biti manj specifičen povezali dva bližnja kraja, ki ležita v različnih pokrajinah (npr. Postojna in Ajdovščina), bi zaradi tranzitivnosti lahko dobili odvečne, nerelevantne povezave (npr. da je Notranjska manj specifična od Ajdovščine, kar bi pomenilo, da kraj Ajdovščina leži na Notranjskem). To težavo odstranimo z uvedbo nove relacije med delčki informacij, imenovane relacija sosednosti N, ki delčka informacij p in q (pNq) povezuje natanko tedaj, ko je q na podlagi svoje bližine (bodisi krajevne bodisi podatkovne) delčku p soseden oz. relevanten. Na slikah 8.1, 8.2 in 8.3 so prikazani Hassejevi diagrami obeh relacij. S črnimi povezavami je podana relacija biti manj specifičen, s sivimi pa je med delčki informacij definirana relacija sosednosti A/". Na množici časovnih trenutkov je relacija sosednosti prazna, saj že relacija biti maN specifičen povezuje vse možne časovne trenutke (slika 6.3). Slika 8.1: Hassejev diagram relacije biti manj specifičen (povezave črne barve) in relacije sosednosti (povezave sive barve) med krajevnimi delčki informacij, ki se navezujejo na Slovenijo 8. Zaključek 89 'Monošter N" X \ ^R"" \ \ /^"Barcelona ""Benetke^T'v'fenovo \ \ // ^Lizbona '»München .' J jI Pariz \/J \ j / ß Francija-^ °\„I / /V" /-°r-....... Vi /7 JT Avstni*^ /Ni y^ J y Nemčije-U Zenevar / / ZlirichJV Celovec Dublin Slika 8.2: Hassejev diagram relacije biti manj specifičen (povezave črne barve) in relacije sosednosti (povezave sive barve) med krajevnimi delčki informacij, ki se navezujejo na ostalo Evropo novega snega max višina novega snega min višina snega max višina snega višina novega snega skupna višina snega .\ \ lsosednje pokiajine hitrost velia smer vetra kdvigama /termika »turbulenca -lf\'\ / A.- -1 ^Jj^T-" 4 prekrivanj linverzi|a -K-_ JCJR \ \ 1 / / y'' zaledenitve 5»_ _ W* ipLl|dVI is ogroženosti ineugodr Ine razmere tldkčf Jji I I o r I-" 4 indeks ogroženosti \ i ugodi Ine razmere .stopnia ogroženosti vlaga vreme podatek morje podatek temperatura \\ .oblaki napoved . . I, podatek veter zračni tlak P^ama ogroženost opozorilo oblaki marame razmere biovreme cvetni prah hidrološka napoved nevarnost plazov |JV indeks Slika 8.3: Hassejev diagram relacije biti manj specifičen (povezave črne barve) in relacije sosednosti (povezave sive barve) med podatkovnimi delčki informacij Relacija sosednosti je sicer pomembna predvsem pri podatkovnem rudarjenju prostorskih informacij [Ester-2001], kjer so lastnosti danega prostorskega objekta pogosto pod vplivom sosednjih objektov. 8. Zaključek 90 Na podlagi relacije sosednosti N lahko definiramo modalni operator sosed N, kjer . NA pomeni, da je A dosegljivo in relevantno, vendar sosedno. V definicijo dialog mlPC Kripkejevih modelov, katerim bo zadoščala predstavitev znanja, ki bo zajemala tudi modalni operator N in relacijo Af, dodamo naslednje pravilo: 10**. whNA čee 3v G W : {wNv in v Ih A) Za svetova w in v, nekončni izjavi A in B, ter kontekst T v tako razširjenih dialog mlPC Kripkejevih modelih velja tudi naslednje pravilo sklepanja: B6. Konjunkcija, implikacija in sosed Th N(AA(A^B)) Th NB Razširitev predstavitve znanja s pomočjo modalnega operatorja sosed je le ena od idej, ki se porodijo. Druga ideja bi bila spremeniti definicijo relacije dosegljivosti oz. relacije biti manj specifičen (npr. opustiti lastnost tranzitivnosti) in se tako izogniti najbolj izraziti omejitvi dialog mlPC Kripkejevih modelov. 8.2 Nadaljnje delo Dvojezični sistem za podajanje informacij o vremenu (slika 1.2) [Žibert-2003], ki je predmet tega magistrskega dela, je trenutno še v fazi razvoja. Poleg vira vremenskih informacij in modula za vodenje dialoga, katerih razvoj je v tem delu podrobneje opisan, je veliko dela narejenega tudi na področju razpoznavanja slovenskega in hrvaškega govora, omejenega na tematsko področje vremenskih informacij [Martinčič-2003]. Modul za tvorjenje slovenskega jezika, kije bil že uporabljen v eksperimentih Čarovnik iz Oza, je takorekoč dograjen. Dograjen je tudi modul za tvorjenje slovenskega govora [Vesnicer-2003], posebej primeren prav za komunikacijsko področje vremenskih informacij. Razvoj modulov za tvorjenje hrvaškega jezika in hrvaškega govora bo potekal po vodilih razvoja modulov za slovenski jezik oz. slovenski govor. Trenutno razvijamo tudi modul za razumevanje naravnega slovenskega jezika, ki je omejen na komunikacijsko področje vremenskih informacij. Pri tem se zgledujemo po [Wutiwiwatchai-2003], postopek pa združuje izločanje pomenskih podvzorcev, ki napolnijo predalčke, ter ravrščanje teh s pomočjo nevronskih mrež. Učno množico predstavlja zbirka spontanih dialogov SSSQ in del zbirke SSSQ2 (poglavje 3), katerih vsebina zrcali komunikacijo človek - računalnik. Izhod iz modula za razumevanje naravnega slovenskega jezika bo poleg v določeni meri napolnjenih predalčkov še kon-verzacijska poteza. Razvoj modula za razumevanje hrvaškega jezika bo sledil vodilom razvoja modula za razumevanje slovenskega jezika. 8. Zaključek 91 Največ pozornosti smo v magistrskem delu posvetili vodenju dialoga in s tem povezani predstavitvi znanja sistema. Tako modul za vodenje dialoga kakor tudi predstavitev znanja sta od jezika neodvisna in zato predstavljata osrednji podsistem dvojezičnega sistema za podajanje informacij o vremenu. Nekatere ideje glede razširitve udejanjene predstavitve znanja (poglavje 6) smo predstavili v prejšnjem razdelku. Zanimivo pa bi bilo poiskati (če seveda obstaja) različico intuicionističnega modalnega izjavnega računa, ki bi bila za razred dialog mlPC Kripkejevih modelov (definicija 8) ali kakšne njegove razširitve polna. V modulu za vodenje dialoga smo poleg že znanih konverzacijskih iger [Larsson-2000] definirali in udejanili dodatne igre in poteze, za katere trdimo, da povečajo prenosljivost modula na druge domene. Eden izmed ciljev je zato modul za vodenje dialoga dejansko prirediti za druge domene in na podlagi rezultatov takšnih prirejanj oblikovati množico konverzacijskih iger in potez, ki bi se izkazale za dovolj reprezentativne in bi prenosljivost sistema kar najbolje povečale. Viri in literatura [Alechina-2001] [Allen-1995] [Allen-1997] [Appelt-1985] [Barras-2001] [Boyce-1996] [Bratman-1988] [Carletta-1996a] [Carletta-1996b] N. Alechina, M. Mendier, V. de Paiva in E. Ritter. Categorical and Kripke Semantics for Constructive Modal Logics. V Proceedings Computer Science Logic, Pariz, Francija. 2001. J. F. Allen, L. K. Schubert, G. Ferguson, P. Heeman, C.-H. Hwang, T. Kato, M. Light, N. G. Martin, B. W. Miller, M. Poesio in D. R. Traum. The TRAINS Project: A case study in building a conversational planning agent. Journal of Experimental and Theoretical AI. Zv. 7, str. 7-48. 1995. J. F. Allen in M. Core. Draft of DAMSL: Dialog Act Markup in Several Layers. Multiparty Discourse Group at the Discourse Research Initiative Meeting, Schloss Dagstuhl, Nemčija. Dosegljivo na http://www.cs.rochester.edu/research/cisd/resources/damsl/Revi-sedManual/RevisedManual.html. D. Appelt. Planning English Referring Expressions. Cambridge University Press, New York. 1985. C. Barras, E. Geoffrois, Z. Wu in M. Liberman. Transcriber: use of a tool for assisting speech corpora production. Speech Communication: Special issue on Speech Annotation and Corpus Tools. Zv. 33(1-2), str. 5-22. 2001. A. L. Boyce in A. L. Gorin. User Interface Issues for Natural Spoken Dialogue Systems. V Proceedings of the 1996 International Symposium on Spoken Dialogue, Philadelphia, ZDA. str. 65-68. 1996. M. Bratman, D. Israel in M. Pollack. Plans and Resource-bounded Practical Reasoning. Computational Intelligence. Zv. 4, str. 349-355. 1988. J. Cadetta, A. Isard, S. Isard, J. Kowtko, G. Doherty-Sneddon in A. Anderson. HCRC Dialogue Structure Coding Manual. Research paper 82, Human Communication Research Centre, University of Edinburgh, Edinburgh, Velika Britanija. 1996. J. C. Cadetta. Assessing the Reliability of Subjective Codings. Computational Linguistics. Zv. 22(2), str. 249-254. 1996. 92 VIRI IN LITERATURA 93 [Codd-1974] [Cohen-1990] [Cohen-1995] [Cosky-1995] [Dahlbäck-1993] [Danieli-1995] [Danlos-1984] [Elmasri-2004] [Eskenazi-1999] [Ester-2001] [Fraser-1991] [Gardner-1999] E. F. Codd. Seven Steps to RENDEZVOUS with the Casual User. V Data Base Management. Uredila J. Kimbie in K. Koffeman. North-Holland Publishers, Amsterdam. 1974. P. Cohen in H. Levesque. Rational Interaction as the Basis for Communication. str. 221-255. V Intentions in Communication. Uredili P. Cohen, J. Morgan in M. Pollack. MIT Press, Cambridge. 1990. P. R. Cohen in S. L. Oviatt. The Role of Voice Input for Human-Machine Communication. V Proceedings of the National Academy of Sciences, ZDA. Zv. 92(22), str. 9921-9927. 1995. M. Cosky. Talking to Machines Today and Tomorrow: Designing for the User. AT&T Technical Journal, str. 81-90. 1995. N. Dahlbäck, A. Jönsson in L. Ahrenberg. Wizard of Oz studies: why and how. V Proceedings of the international workshop on Intelligent user interfaces, Orlando, ZDA. str. 193-200. 1993. M. Danieli in E. Gerbino. Metrics for Evaluating Dialogue Strategies in a Spoken Language System. V Proceedings of the 1995 AAAI Spring Symposium on Empirical Methods in Discourse Interpretation and Generation, Stanford, ZDA. str. 34-39. 1995. L. Danlos. Conceptual and Linguistic Decisions in Generation. V Proceedings of the 22nd Meeting of the Association for Computational Linguistics and the 10th International Conference on Computational Linguistics, Kyoto, Japonska, str. 501-504. 1984. R. Elmasri in S. B. Navathe. Fundamentals of Database Systems, Fourth Edition. Pearson Education, Inc., Boston. 2004. M. Eskenazi, A. Rudnicky, K. Gregory, P. Constantinides, R. Bren-nan, C. Bennett in J. Allen. Data Collection and Processing in the Carnegie Mellon Communicator. V Proceedings of the 6th European Conference on Speech Communication and Technology, Budimpešta, Madžarska. Zv. 6, str. 2695-2698. 1999. M. Ester, H.-P. Kriegel in J. Sander. Geographic Data Mining and Knowledge Discovery, Research Monographs in GIS. str. 160-187. V Algorithms and Applications for Spatial Data Mining. Uredila H. J. Miller in J. Han. Taylor and Francis, London. 2001. N. M. Fraser in G. N. Gilbert. Simulating Speech Systems. Computer Speech and Language. Zv. 5(1), str. 81-99. 1991. C. Gardner-Bonneau. Guidelines for Speech-enabled IVR Application Design, str. 147-162. V Human Factors and Voice Interactive Systems. Uredil D. Gardner-Bonneau. Kluwer Academic Publishers, Boston. 1999. VIRI IN LITERATURA 94 [Goddeau-1996] D. Goddeau, H. Meng, J. Polifroni, S. Seneff in S. Busayapongchai. A Form-Based Dialogue Manager for Spoken Language Applications. V Proceedings of the International Conference on Spoken Language Processing, Philadelphia, ZDA. str. 701-704. 1996. [Grice-1975] H. Grice. Logic and Conversation. V Syntax and Semantics, Zv. 3, Speech Acts. str. 41-58. Uredila P. Cole in J. Morgan. Academic Press, New York. 1975. [Gros-1997a] J. Gros. Samodejno tvorjenje govora iz besedil. Doktorska diserta- cija. Fakulteta za elektrotehniko, Univerza v Ljubljani. Ljubljana. 1997. [Gros-1997b] J. Gros, N. Pavešić in F. Mihelič. Text-to-Speech synthesis: a com- plete system for the Slovenian language. Journal of Computing and Information Technology (CIT). Zv. 5(1), str. 11-19. 1997. [Hajdinjak-2002a] M. Hajdinjak in F. Mihelič. Podatkovna baza nastajajočega sistema za podajanje vremenskih napovedi. V Zbornik 11. mednarodne Elektrotehniške in računalniške konference ERK 2002, Portorož, Slovenija. Zv. B, str. 299-302. 2002. [Hajdinjak-2002b] M. Hajdinjak in F. Mihelič. Semantična analiza vremenskih napovedi. V Zbornik B 5. mednarodne multikonference Informacijska družba IS'2002, Ljubljana, Slovenija, str. 10-13. 2002. [Hajdinjak-2003a] M. Hajdinjak in F. Mihelič. The wizard of Oz system for weather information retrieval. V Lecture notes in computer science, Lecture notes in artificial intelligence, 2807, Text, speech and dialogue : 6th International Conference, TSD 2003, Ceské Budejovice, Češka. str. 400-405. Uredila V. Matoušek in P. Mautner. Springer, Berlin. 2003. [Hajdinjak-2003b] M. Hajdinjak in F. Mihelič. Wizard of Oz experiments. V Proceedings of the IEEE Region 8 EUROCON 2003 : computer as a tool, Ljubljana, Slovenija. Zv. 2, str. 112-116. 2003. [Hapeshi-1993] K. Hapeshi. Design Guidelines for Using Speech in Interactive Multimedia Systems, str. 177-188. V Interactive Speech Technology: Human Factors Issues in the Application of Speech Input/Output to Computers. Uredila C. Barber in J. Noyes. Taylor & Francis, London. 1993. [Hendrix-1978] G. Hendrix, E. Sacerdoti, D. Sagalowicz in J. Slocum. Developing a Natural Language Interface to Complex Data. ACM Transactions on Database Systems. Zv. 3(2), str. 105 - 147. 1978. [Hintikka-1975] J. Hintikka. The Intentions of Intentionality and Other New Models for Modalities. D. Reidel Publishing Company, Dordrecht. 1975. VIRI IN LITERATURA 95 [Hoeven-1995] [Houghton-1987] [Huth-2000] [Ipšić-1999] [Johnson-2002] [Jurafsky-1994] [Kamm-1999] [Kaplan-1982] [Karat-1999] [Kim-1997] [Kowtko-1992] G. van der Hoeven, J. Andernach, S. van der Bürgt, G. J. Kruijff, A. Nijholt, J. Schaake in F. de Jong. SCHISMA: A natural language accessible theatre information and booking system. V Proceedings of the 1st International Workshop on Applications of Natural Language to Data Bases, Versailles, Francija, str. 271-285. 1995. G. Houghton in S. D. Isard. Why to speak, what to say and how to say it: Modelling language production in discourse, str. 249-267. V Modelling Cognition. Uredil P. Morris. John Wiley and Sons, London. 1987. M. Huth in M. Ryan. Modal logics and agents, str. 261-315. V Logic in Computer Science, Modelling and reasoning about systems. Uredila M. Huth in M. Ryan. Cambridge University Press, Cambridge. 2000. I. Ipšić, F. Mihelič, S. Dobrišek, J. Gros in N. Pavešić. A Slovenian Spoken Dialog System for Air Flight Inquires. V Proceedings of the 6th European Conference on Speech Communication and Technology, Budimpešta, Madžarska, str. 2659-2662. 1999. R. A. Johnson in D. W. Wichern. Applied multivariate statistical analysis. Prentice-Hall, Upper Saddle River (NJ). 2002. D. Jurafsky, C. Wooters, G. Tajchman, J. Segal, A. Stolčke, E. Fos-ler in N. Morgan. The Berkeley Restaurant Project. V Proceedings of the International Conference on Spoken Language Processing, Yokohama, Japonska, str. 2139-2142. 1994. C. Kamm, M. Walker in D. Litman. Evaluating Spoken Language Systems. V Proceedings of the American Voice Input/Output Society, San Jose, ZDA. 1999. S. J. Kaplan. Cooperative Responses from a Portable Natural Language Query System. Artificial Intelligence. Zv. 19(2), str. 165-187. 1982. J. Karat, J. Lai, C. Danis in C. Wolf. Speech User Interface Evolution. str. 1-35. V Human Factors and Voice Interactive Systems. Uredil D. Gardner-Bonneau. Kluwer Academic Publishers, Boston. 1999. W. Kim in M.-W. Koo. A Korean Speech Corpus for Train Ticket Reservation Aid system Based on Speech Recognition. V Proceedings of the 5th European Conference on Speech Communication and Technology, Rodos, Grčija. Zv. 4, str. 1723-1726. 1997. J. Kowtko in S. Isard. Conversational Games Within Dialogue. Research paper 31, Human Communication Research Centre, University of Edinburgh, Edinburgh, Velika Britanija. 1992. VIRI IN LITERATURA 96 [Krahmer-2001] [Larson-1992] [Larsson-2000] [Lea-1994] [Leiser-1993] [Levelt-1989] [Lewin-2000] [Litman-2002] [Marr-1976] [Martinčić-2003] [Montague-1960] [Nie-1989] [Nielsen-1993] [Norman-1988] E. J. Krahmer. The Science and Art of Voice Interfaces. Philips Research Report, Philips, Eindhoven, Nizozemska. 2001. J. Larson. Interactive Software: Tools for Building Interactive Userinterfaces. Prentice Hall, New Jersey. 1992. S. Larsson in D. Traum. Information state and dialogue management in the TRINDI Dialogue Move Engine Toolkit. Natural Language Engineering. Zv. 6, str. 323-340. 2000. W. Lea. Developing Usable Voice Interfaces. Journal of the American Voice Input/Output Society. Zv. 16, str. 1-48. 1994. R. Leiser. Driver-vehicle Interface: Dialogue Design for Voice Input. str. 275-293. V Driving Future Vehicles. Uredila A. Parkes in S. Franzen. Taylor & Francis, Washington. 1993. W. Levelt. Speaking: From Intention to Articulation. MIT Press, Cambridge. 1989. I. Lewin. A formal model of Conversational Game Theory. V Göta-log: Proceedings of the 4th Workshop on the Semantics and Pragmatics of Dialogue, Goteborg, Švedska. 2000. D. J. Litman in P. Shimei. Designing and Evaluating an Adaptive Spoken Dialogue System. User Modeling and User-Adapted Interaction. Zv. 12, str. 111-137. 2002. D. Marr. Early Processing of Visual Information. Philosophical Transactions of the Royal Society. Zv. B275, str. 483-524. 1976. S. Martinčić-Ipšić, J. Zibert, I. Ipšić, F. Mihelič in N. Pavešić. Bilingual speech recognition for a weather information retrieval dialogue system. V Lecture notes in computer science, Lecture notes in artificial intelligence, 2807, Text, speech and dialogue : 6th International Conference, TSD 2003, Ceské Budëjovice, Češka. str. 380-387. Uredila V. Matoušek in P. Mautner. Springer, Berlin. 2003. R. Montague. Logical Necessity, Physical Necessity, Ethics and Quantifiers. Inguiry. Zv. 4, str. 259-269. 1960. J. Y. Nie. An Information Retrieval model based on Modal Logic. Information Processing & Management. Zv. 25(5), str. 477-491. 1989. J. Nielsen. Usability Engineering. Morgan Kaufmann, San Diego. 1993. D. Norman. The Psychology of Everyday Things. Basic Books, New York. 1988. VIRI IN LITERATURA 97 [Pepelnjak-1996a] K. Pepelnjak. Pomenska analiza stavkov v sistemu za razumevanje tekočega govora. Magistrsko delo. Fakulteta za elektrotehniko, Univerza v Ljubljani. Ljubljana. 1996. [Pepelnjak-1996b] K. Pepelnjak, F. Mihelič in N. Pavešić. Semantic decomposition of sentences in the system supporting flight services. Journal of Computing and Information Technology. Zv. 4(1), str. 17-24. 1996. [Perry-www] [Pirker-1999] [Poesio-1997] [Power-1979] [Price-1992] [Reiter-1994] [Resnik-1989] [Sadek-1994] [Searle-1969] J. Perry. Semantics, Possible-Worlds. http:7 edu/~john/PHILPAPERS/posswld.pdf. /www-csli. Stanford. H. Pirker, G. Loderer in H. Trost. Thus Spoke the User to the Wizard. V Proceedings of the 6th European Conference on Speech Communication and Technology, Budimpešta, Madžarska. Zv. 3, str. 1171-1174. 1999. M. Poesio in D. R. Traum. Conversational actions and discourse situations. Computational Intelligence. Zv. 13(3), str. 309-349. 1997. R. Power. The organisation of purposeful dialogues. Linguistics. Zv. 17, str. 107-152. 1979. P. Price, L. Hirschman, E. Shriberg in E. Wade. Subject-based Evaluation Measures for Interactive Spoken Language Systems. V Proceedings of the DARPA Speech and NL Workshop, Harriman, ZDA. str. 34-39. 1992. E. Reiter. Has a Consensus NL Generation Architecture Appeared, and is it Psycholinguistically Plausible?. V Proceedings of the 7th International Workshop on Natural Language Generation, Kenneb-unkport, ZDA. str. 163-170. 1994. P. Resnik. Access to Multiple Underlying Systems in JANUS. BBN Report 7142, Bolt Beranek and Newman Inc., Cambridge, Massachusetts. 1989. D. Sadek. Toward a Theory of Belief Reconstruction: Application to Communication. Speech Communication. Zv. 15, str. 251-263. 1994. J. Searle. Speech Acts. Cambridge University Press, Cambridge. 1969. [Sebastiani-1998] F. Sebastiani. On the role of logic in information retrieval. Information Processing & Management. Zv. 34(1), str. 1-18. 1998. [Seneff-1992] S. Seneff. TINA: A Natural Languages System for Spoken Lan- guage Applications. Computational Linguistics. Zv. 18(1), str. 61-86. 1992. VIRI IN LITERATURA 98 [Simpson-1994] [Smith-1997] [Smith-1998] [Stallard-2000] [Shneiderman-1986] B. Shneiderman. Designing the User Interface: Strategies for Effective Human-Computer Interaction, 3rd Edition. Addison Wesley, Massachusetts. 1986. [Shriberg-1992] E. Shriberg, E. Wade in P. Price. Human-M achine Problem Solving Using Spoken Language Systems (SLS): Factors Affecting Performance and User Satisfaction. V Proceedings of the DARPA Speech and NL Workshop, Harriman, ZDA. str. 49-54. 1992. A. K. Simpson. The Proof Theory and Semantics of Intuitionistic Modal Logic. Doktorska disertacija. Oddelek za računalništvo, Univerza v Edinburghu. Edinburgh. 1994. R. W. Smith in S. A. Gordon. Effects of Variable Initiative on Linguistic Behavior in Human- Computer Spoken Natural Language Dialogue. Computational Linguistics. Zv. 23(1), str. 141-168. 1997. I. Smith, P. Cohen, J. Bradshaw, M. Greaves in H. Holmback. Designing conversation policies using joint intention theory. V Proceedings of the 3rd International Conference on Multi Agent Systems, Pariz, Francija, str. 269-276. 1998. D. Stallard. Talk'n'Trav el: A Conversational System for Air Travel Planning. V Proceedings of the Association for Computational Linguistics 6th Applied Natural Language Processing Conference, Seattle, ZDA. str. 68-75. 2000. A. Stolčke, N. Coccaro, R. Bates, P. Taylor, C. Van Ess-Dykema, K. Ries, E. Shriberg, D. Jurafsky, R. Martin in M. Meteer. Dialogue Act Modelling for Automatic Tagging and Recognition of Conversational Speech. Computational Linguistics. Zv. 26(3), str. 339-373. 2000. J. Sturm, E. den Os in L. Boves. Dialogue management in the Dutch ARISE train timetable information system. V Proceedings of the 6th European Conference on Speech Communication and Technology, Budimpešta, Madžarska, str. 1419-1422. 1999. M. Swerts in E. Krahmer. On the Use of Prosody for On-line Evaluation of Spoken Dialogue Systems. V Proceedings of the 2nd International Conference on Language Resources and Evaluation, Atene, Grčija. Zv. 3, str. 1571-1578. 2000. [Thompson-1983] B. H. Thompson in F. B. Thompson. Introducing ASK, A Simple Knowledgeable system. V Proceedings of the 1st Conference on Applied Natural Language Processing, Santa Monica, ZDA. str. 17-24. 1983. [Stolcke-2000] [Sturm-1999] [Swerts-2000] [Troelstra-www] A. S. Troelstra. History of constructivism in the 20th century. Dosegljivo na http://citeseer.nj.nec.com/96765.html. VIRI IN LITERATURA 99 [Turing-1950] [Vesnicer-2003] [Walker-1997] [Walker-1998] [Walker-2000] [Warren-1982] A. M. Turing. Computing machinery and intelligence. Mind. Zv. 59, str. 433 - 460. 1950. B. Vesnicer. Umetno tvorjenje govora z uporabo prikritih Markovovih modelov. Magistrsko delo. Fakulteta za elektrotehniko, Univerza v Ljubljani. Ljubljana. 2003. M. A. Walker, D. Litman, C. A. Kamm in A. Abella. PARADISE: A General Framework for Evaluating Spoken Dialogue Agents. V Proceedings of the 35th Annual Meeting of the Association of Computational Linguistics, Madrid, Španija, str. 271-280. 1997. M. A. Walker, D. J. Litman, C. A. Kamm in A. Abella. Evaluating Spoken Dialogue Agents with PARADISE: Two Case Studies. Computer Speech and Language. Zv. 12(3), str. 317-347. 1998. M. A. Walker. An Application of Reinforcement Learning to Dialogue Strategy Selection in a Spoken Dialogue System for Email. Journal of Artificial Intelligence Research. Zv. 12, str. 387-416. 2000. D. Warren in F. Pereira. An Efficient Easily Adaptable System for Interpreting Natural Language Queries. Computational Linguistics. Zv. 8(3-4), str. 110-122. 1982. [Weizenbaum-1966] J. Weizenbaum. ELIZA. Communications of the ACM. Zv. 9, str. 36-45. 1950. [Whittaker-1989] [Woods-1972] S. Whittaker in P. Stenton. User Studies and the Design of Natural Language Systems. V Proceedings of the 4th Conference of the European Chapter of the Association for Computational Linguistics, Manchester, Anglija, str. 116-123. 1989. W. A. Woods, R. M. Kaplan in B. N. Webber. The Lunar sciences Natural Language Information System: Final Report. BBN Report 2378, Bolt Beranek and Newman Inc., Cambridge, Massachusetts. 1972. [Wutiwiwatchai-2003] C. Wutiwiwatchai in S. Furui. Combination of Finite State Automata and Neural Network for Spoken Language Understanding. V Proceedings of the 8th European Conference on Speech Communication and Technology, Ženeva, Švica. str. 2761-2764. 2003. [Xu-2000] [Zoltan-1991] W. Xu in A. Rudnicky. Task-based Dialog Management Using an Agenda. V Proceedings of the ANLP/NAACL Workshop on Conversational Systems, Seattle, ZDA. str. 42-47. 2000. E. Zoltan-Ford. How to Get People to Say and Type What Computers Can Understand. Journal of Man-Machine Studies. Zv. 34, str. 527-547. 1991. VIRI IN LITERATURA 100 [Zue-2000] V. Zue, S. Seneff, J. Glass, J. Polifroni, C. Pao, T. J. Hazen in L. Hetherington. JUPITER: A Telephone Based Conversational Interface for Weather Information. IEEE Transactions on Speech and Audio Processing. Zv. 8(1), str. 85-96. 2000. [Žibert-2003] J. Žibert, S. Martinčić-Ipšić, M. Hajdinjak, I. Ipšić in F. Mihe- lič. Development of a Bilingual Spoken Dialog System for Weather Information Retrieval. V Proceedings of the 8th European Conference on Speech Communication and Technology, Ženeva, Švica. str. 1917-1920. 2003. Terminološki slovar V magistrskem delu smo uporabili precej novih terminov. Za boljše razumevanje in lažji pregled podajmo slovar slovenskih in ustreznih angleških izrazov. atomar na izjava cene dialoga delež izbire relevantnih podatkov delež negativnih odgovorov delež neiniciativnih potez delež nepodanih informacij delež neprimernih iniciativ delež nuđenja pomoči delež preverjanj delež zavrnitev dialog mlPC Kripkejev model dogovor eksperiment Čarovnik iz Oza enosmerna cevovodna struktura funkcija učinkovitosti sistema intuicionistična logika izpolnitev naloge končna izjava konverzacijske igre konverzacijske poteze konverzacijska teorija iger Kripkejev model Kripkejeva semantika možnih svetov atomic statement dialogue costs relevant-data ratio no-data ratio non-initiating ratio non-provided-information ratio unsuitable-initiative ratio help-messages ratio check ratio rejection ratio dialogue mlPC Kripke model transaction Wizard-of-Oz experiment one-way pipeline architecture performance function intuitionistic logic task completion final statement conversational games conversational moves conversational game theory Kripke model Kripke possible-worlds semantics 101 modalna logika modalni operator modul za vodenje dialoga mogoče velja multipla linearna regresija nujno velja objektivni parametri dialoga odzivne poteze ogrodje PARADISE omejitev operator diamant operator sosed operator spodnji diamant operator škatla operator zgornji diamant parametri kvalitete parametri učinkovitosti parametri uspešnosti naloge podmodul za določanje vsebine podmodul za oblikovanje stavkov podmodul za slovnične popravke pojmovni model poteze pripravljenosti povprečni čas čakanja na odziv povprečni čas dialoga princip sodelovanja rekurzivna mreža prehodov relacija biti manj specifičen relacija dosegljivosti relacija sosednosti modal logic modality dialogue manager possibly true multivariate linear regression necessarily true objective dialogue metrics response moves PARADISE framework limitation diamond operator neighbor operator diamond down operator box operator diamond up operator qualitative measures efficiency measures task success measure content determination submodule sentence planning submodule surface generation submodule conceptual model ready moves mean system response time mean elapsed time cooperativity principle recursive transition network being-less-specific relation accessibility relation neighborhood relation 102 razumevanje naravnega jezika razumska enota semantični okvir sistem za govorno upravljanje naprav sistem za interaktivne govorne odzive sistem za podajanje informacij sistem za reševanje problemov sodelujoč odgovor subjektivni parametri dialoga tehnika končnih avtomatov tehnika množice domen tehnika polnjenja predalčkov tehnika razumskih agentov tehnika usmerjanja k cilju teorija govornih dejanj tvorjenje naravnega jezika vodilna atomarna izjava začetne poteze zadovoljstvo uporabnika natural language understanding rational unit semantic frame command-and-control voice application interactive voice response system information-providing dialogue system problem-solving dialogue system cooperative answer subjective dialogue metrics finite-state technique sets-of-contexts technique slot-filling technique rational-conversational-agents technique goal-directed technique speech act theory natural language generation main atomic statement initiating moves user satisfaction 103 Izjava Podpisana Melita Hajdinjak izjavljam, da sem avtorica magistrskega dela z naslovom Vodenje dialoga med človekom in računalnikom v naravnem jeziku. Melita Hajdinjak