Oznaka poročila: ARRS-RPROG-ZP-2014/59 Es^j^S ZAKLJUČNO POROČILO O REZULTATIH RAZISKOVALNEGA PROGRAMA A. PODATKI O RAZISKOVALNEM PROGRAMU 1.Osnovni podatki o raziskovalnem programu Šifra programa P2-0069 Naslov programa Napredne metode interakcij v telekomunikacijah Vodja programa 6821 Zdravko Kačič Obseg raziskovalnih ur 22100 Cenovni razred B Trajanje programa 01.2009 - 12.2013 Izvajalci raziskovalnega programa (javne raziskovalne organizacije - JRO in/ali RO s koncesijo) 796 Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko Raziskovalno področje po šifrantu ARRS 2 TEHNIKA 2.08 Telekomunikacije Družbenoekonomski cilj 04. Prevoz, telekomunikacije in druga infrastruktura Raziskovalno področje po šifrantu FOS 2 Tehniške in tehnološke vede 2.02 Elektrotehnika, elektronika in informacijski inženiring B. REZULTATI IN DOSEŽKI RAZISKOVALNEGA PROGRAMA 2.Povzetek raziskovalnega programa1 SLO Raziskovalni program vključuje dva programska sklopa (multimodalni vmesniki in zagotavljanje pravilnosti sistemov) in zajema teoretične, razvojne in aplikativne raziskave na področju telekomunikacijskih sistemov in storitev. Na področju multimodalnih vmesnikov so raziskave osredotočene na razvoj novih načinov verbalne in neverbalne komunikacije, ob upoštevanju ciljnih aplikativnih domen podpornih življenjskih okolij in inteligentnih okolij. Na področju sistemov govornih tehnologij, ki omogočajo verbalno komunikacijo, so raziskave usmerjene v razvoj novih postopkov predprocesiranja govornega signala, posebej segmentacije akustičnega signala v različne kategorije, kot so govor/negovor, govor/glasba, segmentacija po spolu govorca in segmentacija po pasovni širini prenosnega kanala. Rezultati tovrstnih raziskav omogočajo izvedbo sistemov razpoznavanja govora v realnih okoljih, kjer se ob govornem signalu pojavljajo tudi drugi akustični signali. Na področju akustičnega modeliranja so raziskave usmerjene v definiranje postopkov, ki bodo na osnovi informacije o govornem signalu (razpoznavanje vizemov) omogočili izvedbo multimodalnih vmesnikov, ki bodo omogočali uporabniku prijazno komunikacijo z vgrajenimi virtualnimi agenti, sposobnimi verbalne in neverbalne komunikacije. Na področju jezikovnega modeliranja so raziskave usmerjene v definiranje postopkov, ki bodo omogočili uspešnejše razpoznavanje tekočega in spontanega slovenskega govora, predvsem z uporabo faktoriziranih jezikovnih modelov z obliko-skladenjskimi informacijami, in jezikovnih modelov z razredi. Prav tako raziskave na tem področju vključujejo razvoj postopkov avtomatskega prevajanja besedil, ki upoštevajo značilnosti govorno orientiranega prevajanja ob uporabi statističnih jezikovnih modelov in faktoriziranih jezikovnih modelov. Cilj omenjenih raziskav je razvoj sistema avtomatskega razpoznavanja tekočega in spontanega govora z velikim slovarjem besed za slovenski jezik. Uporaba razvitih postopkov segmentacije govora, akustičnega modeliranja in uporaba faktoriziranih jezikovnih modelov omogoča doseganje pomembnega povečanja uspešnosti razpoznavanja govora za testno ciljno aplikacijsko domeno Broadcast News. Raziskave vključujejo tudi načrtovanje in izgradnjo novih jezikovnih virov ter analizo govornega diskurza. V okviru programskega sklopa zagotavljanja pravilnosti sistemov so raziskave izvajane na področju formalne specifikacije in verifikacije sodobnih sistemov. Raziskave vključujejo razvoj sistematičnega pristopa k formalni specifikaciji poštenih vhodno/izhodnih avtomatov s TLA+ ter razvoj splošnih modulov za pouporabo pri verifikaciji različnih sistemov, predstavljenih s temi avtomati, s TLA+ in orodjem TLC za preverjanje modelov. Vključujejo tudi raziskave uporabe formalnih metod za ugotavljanje učinkovitosti. V okviru raziskav poteka razvoj integriranega razvojnega okolja SpinRCP za formalno verifikacijo sistemov z orodjem Spin. ANG The research program encompasses two research areas (multimodal interfaces and the system correctness ensurance) and covers basic and applied research in the field of telecommunications systems and services. In the field of multimodal interfaces the research is focused on development of new methods of verbal and non-verbal communication, taking into account the target application domains of supportive living environments and intelligent ambience. In the field of speech technology systems that enable verbal communication, the research encompasses development of new algorithms for speech preprocessing, particularly segmentation of acoustic signal into different categories, such as speech/non speech, speech/music, segmentation by speaker gender, and bandwidth segmentation. The results of this research enable development of speech recognition systems, which can work in real environments, where the speech signal appears along with other acoustic signals. In the field of acoustic modelling studies are focused on definition of algorithms that will, based on speech signal features (viseme recognition), enable implementation of multimodal interfaces, which will allow user-friendly communication with embedded virtual agents, capable of verbal and non-verbal communication. In the field of language modelling, the research aims to define new algorithms that will enable more accurate continuous and spontaneous Slovenian speech recognition, in particular by using factored language models with morpho-syntactic information, and language models with classes. Also, research in this area includes the development of algorithms for automatic text translation, taking into account the characteristics of voice-centred translation using statistical language models, and factored language models. The aim of this research is to develop a large vocabulary continuous and spontaneous speech recognition system for Slovenian language. Use of the developed algorithms for speech segmentation, acoustic modelling, and factored language models, enables significant increase of speech recognition accuracy for a selected Broadcast News target application-domain. Research also includes the design and construction of new linguistic resources and analysis of spoken discourse. Within the research area of system correctness ensurance the research is performed in the field of formal specification and verification of modern systems. Research includes development of a systematic approach to the formal specification of the fair I/O automata with TLA+ and the development of general modules for use in verification of various systems, represented by these machines, the TLA+ and by the TLC tool for model checking. The research includes also studies on the use of formal methods for efficiency determination as well as development of an integrated development environment SpinRCP for formal verification of systems with a Spin tool. 3.Poročilo o realizaciji predloženega programa dela na raziskovalnem programu2 SLO Raziskovalno delo raziskovalnega programa je bilo izvajano v okviru dveh programskih sklopov: multimodalna komunikacija in zagotavljanje pravilnosti sistemov. V okviru multimodalne komunikacije je bilo delo osredotočeno na razvoj algoritmov avtomatskega razpoznavanja tekočega in spontanega govora z velikim slovarjem besed, novih pristopov jezikovnega modeliranja in uporabe govornih tehnologij na področju multimodalnih komunikacijskih vmesnikov, ki so danes pogosto prisotni v svetu telekomunikacijskih storitev. Na področju predprocesiranja govora je bil razvit algoritem za zaznavanje aktivnosti govora (algoritem VAD), ki temelji na Gaussovih modelih porazdelitve verjetnosti (modelih GMM). Modeli GMM so bili naučeni na značilkah, ki smo jih določili iz frekvenčnega spektra, spremenjenega z vpeljavo nelinearne funkcije v frekvenčni spekter. Z vpeljavo nelinearne funkcije v frekvenčni spekter govornega signala smo poudarili prisotnost vokalov, dvoglasnikov in polglasnikov v frekvenčnem spektru, z njo pa smo tudi zmanjšali uspešnost zaznavanja konzonantov. Problem slabšega zaznavanja konzonantov v govornem signalu smo odpravili z vpeljavo kriterija podaljška in kriterija predhodnega nastopa. Vključitev obeh kriterijev na konec osnovne odločitve VAD je doprinesla tako k boljši uspešnosti določanja mej začetka in konca govornega segmenta kot tudi k boljšemu avtomatskemu razpoznavanju govora. V sistemih za razpoznavanje tekočega govora z velikim slovarjem besed k večji uspešnosti razpoznavanja govora veliko prispeva sistem za segmentacijo in klasifikacijo govora oz. akustičnega signala. Zasnovali smo sistem za akustično segmentacijo in klasifikacijo s podporo za tri vrste segmentacije: segmentacija govor/negovor, segmentacija po spolu govorca in segmentacija po pasovni širini kanala. Sam sistem je prilagojen tako, da lahko deluje sprotno (on-line) in je kot tak primeren za uporabo v realnih okoljih. V povezavi z razpoznavalnikom tekočega govora sistem omogoča procesiranje samo govornih delov, kar pohitri razpoznavanje in izboljša uspešnost. Segmentacija po spolu govorca se izvede samo na govornem delu akustičnega signala in omogoča uporabo ločenih akustičnih modelov glede na spol. Akustični modeli za razpoznavanje, ki so adaptirani glede na spol, dodatno pripomorejo k višji uspešnosti razpoznavanja. Na področju akustičnega modeliranja smo se, glede na obravnavo sistemov z velikim slovarjem besed, osredotočili na kompleksnejše scenarije, kot so razpoznavanje spontanega oziroma tekočega govora. Predlagali smo nov pristop za učenje akustičnih modelov razpoznavalnika govora, pri katerem smo uporabili netranskribirane govorne posnetke. Na področju razpoznavanja spontanega govora smo izvedli pristope akustičnega modeliranja mašil in onomatopej, ki so pogosti v takšnem govoru. Z uporabo posebnih akustičnih modelov smo uspeli izboljšati rezultate razpoznavanja spontanega govora. Prav tako smo izvedli raziskave na področju avtomatskega razpoznavanja vizemov iz govornega signala, kar je pomembno za uspešno izvedbo pravilnega modeliranja premikov ust in ustnic pri različnih virtualnih asistentih. Vizemi tako med seboj povezujejo govorno in vidno informacijo. Da bi lahko za modeliranje akustičnih modelov vizemov uporabili obstoječe fonemske akustične modele za razpoznavanja govora, smo predlagali novo metodo transformacije akustičnih modelov. Kot rezultat smo uspeli izboljšati pravilnost delovanja, hkrati pa tudi pospešiti proces razvoja, saj se z uporabo transformacije skrajša čas učenja akustičnih modelov. Raziskovalno delo je zajemalo tudi zasnovo postopkov modeliranja slovenskega govora v sistemih avtomatskega razpoznavanja tekočega govora z velikim slovarjem besed. V okviru teh aktivnosti smo analizirali primernost uporabe faktoriziranih jezikovnih modelov, ki vsebujejo obliko-skladenjske informacije za modeliranje slovenskega jezika. Pri tem je bilo delo osredotočeno na načine določanja oziroma izbire faktorjev in na vrstni red odstranjevanja faktorjev v postopku sestopanja. Pri tem smo predpostavili, da lahko faktorje in pot sestopanja izbiramo glede na trenutno besedo, katere verjetnost ocenjujemo z jezikovnim modelom, in njen kontekst. Pri tem smo definirali algoritme za določanje poti sestopanja glede na kontekst v jezikovnem modelu, algoritme za učenje takih jezikovnih modelov in definirali sistem za razpoznavanje govora, ki je zmožen takšne jezikovne modele učinkovito uporabljati. Izvedena je bila analiza vpliva uporabe več različnih jezikovnih modelov na optimizacijo parametrov v iskalnem algoritmu razpoznavalnika z velikim slovarjem besed, predvsem na uteževanju vstavljenih besed. Pri tem smo pokazali na pomembnost ponovne optimizacije vseh parametrov razpoznavalnika pri vsaki menjavi ali dodajanju jezikovnih modelov. Na področju jezikovnega modeliranja smo obravnavali tudi problem velike razpršenosti podatkov zaradi pregibanja besed. Definirali smo jezikovne modele z razredi, pri čemer so razredi združevali besede z enakimi obliko-skladenjskimi oznakami. Tovrstne modele smo interpolirali s klasičnimi besednimi modeli in na ta način izboljšali perpleksnost jezikovnih modelov. Na področju strojnega prevajanja govorjenega jezika je bila opravljena množica eksperimentov z različnimi tipi faktoriziranega prevajanja. Komponente prevajalnika, učene na različnih korpusih, smo sestavili na osnovi optimizacije, temelječe na perpleksnosti razvojne množice prevodov. Končni sistem prevajanja smo uporabili za prevajanje novega nabora dokumentov s podnapisi. Prevode so vrednotili profesionalni prevajalci. Na osnovi klasifikacije zaznanih napak smo izvedli še eno fazo izboljšanja prevajalnika tako, da smo dodali še eno fazo post- procesiranja, v kateri smo uspeli določene napake popraviti. Ciljni prevajalnik smo primerjali z Google-ovim prevajalnikom in izkazalo se je, da sistem prevajanja, ki smo ga razvili, za jezikovni par slovenščina - srbščina, generira boljše prevode. V okviru teh raziskav smo analizirali tudi možnosti uporabe jezikovnih modelov na področju statističnega strojnega prevajanja jezika, kjer so poskusi pokazali, da lahko faktorizirani jezikovni modeli z obliko-skladenjskimi informacijami izboljšajo kvaliteto strojnega prevajanja. Aktivnosti so bile usmerjene tudi v vprašanja ustrezne evalvacije strojnih prevajalnikov. Evalvacija prevodov je stalen del razvoja strojnega prevajanja, pri čemer se v glavnem uporabljajo avtomatski postopki. Ti vedno temeljijo na referenčnem prevodu. Raziskali smo, kako zelo različni so lahko referenčni prevodi za področje podnaslavljanja ter kako lahko to vpliva na oceno - ista metrika lahko isti prevajalnik oceni kot neuporaben ali kot zelo uspešen samo na podlagi tega, da uporabimo referenčne prevode, ki so pridobljeni po različnih postopkih, vendar vedno jezikovno in pomensko povsem ustrezni. Na področju jezikovnih virov je bil narejen nadvse pomemben korak naprej s sodelovanjem pri izdelavi obsežnega, 1 mio. besed obsegajočega korpusa GOS, ki je bil v interdisciplinarnem sodelovanju s humanistiko s strani ARRS prepoznan kot izjemen raziskovalni dosežek v letu 2011. Izdelani jezikovni vir je bil postavljen v mednarodni kontekst in predstavljen v osrednji mednarodni reviji s področja jezikovnih virov, Language Resources and Evaluation Journal. Kot primer dobre prakse so bili predstavljeni korpusna zasnova in struktura, pravila transkribiranja s poudarkom na dvojnem načinu zapisovanja govora ter osrednje značilnosti korpusnega konkordančnika. Opisane so bile tudi terenske izkušnje iz zbiranja gradiva in transkribiranja ter dostopnost izvornih datotek. Prav tako je bil izdelan nov korpusni vir za učenje strojnega prevajanja podnapisov med slovenščino in srbščino. Raziskani so bili označevalci odprte propozicije, izrazi emotivnega govora in besedje, tipično za govorjeni jezik. Aktivnosti na področju diskurznoanaliznih raziskav so bile v večjem delu usmerjene na področje procesov razumevanja govora in govorjenega besedila. V tej luči smo podrobno preučevali problem konteksta. Komunikacija (tako medčloveška kot strojno posredovana ali v razmerju človek - stroj) namreč vedno poteka v kontekstu, zunaj njega ne samo da ostane dvoumna in je ne moremo ustrezno razumeti, ampak sploh ne obstaja. Kontekst je tako med drugim pomembno področje raziskav v umetni inteligenci. Del izsledkov preučevanja tega vprašanja je bil predstavljen v izvirnem znanstvenem članku, ki obravnava koncept konteksta v jezikoslovnih in diskurznih teorijah. Poudarek je bil na kritični analizi, kako različne teorije obravnavajo ta koncept. Predstavljene poglede smo združili v dve smeri, družbeno in kognitivno. Ugotovljeno je bilo, da v družbeno usmerjenih teorijah analize diskurza ne razvijejo širše, splošno sprejete teorije konteksta in se celo izogibajo sami definiciji pojma kontekst, češ da je prekompleksen. V kognitivno usmerjenih teorijah najdemo bolj obširno izdelane definicije in teorije konteksta, vendar jim očitamo vrsto pomanjkljivosti, da bi bile splošno veljavne. Zaključek je bil, da je koncept konteksta operativni pojem, ki si ga teorije definirajo (prav slednje pa marsikje manjka) v skladu s potrebami svojih raziskovalnih področij. Na področju multimodalnih vmesnikov so bile opravljene raziskave, ki izrabljajo različne metode analize signalov možganske aktivnosti uporabnika na osnovi ne-invazivnih in cenovno učinkovitih metod merjenja signalov. Opravljena je bila analiza zaznanih ritmičnih ali manj ritmičnih nihanj z namenom pridobivanja zadostne informacije za izvedbo smiselne podporne interakcije kot širitve obstoječih načinov komunikacije s strojem. Pri tem so bile opravljene raziskave novih metod digitalnega signalnega procesiranja zajetih signalov in njihove klasifikacije v razumne oblike v smeri ustvarjanja novih komunikacijskih načinov. Na področju zagotavljanja pravilnosti sistemov smo izvajali raziskave na področju formalne specifikacije in verifikacije sodobnih sistemov. Razvili smo sistematičen pristop k formalni specifikaciji poštenih vhodno/izhodnih avtomatov s TLA+, ki je fleksibilnejši od tistega, ki ga omogočajo orodja za vhodno/izhodne avtomate, ter napisali splošne module za pouporabo pri verifikaciji različnih sistemov, predstavljenih s temi avtomati, s TLA+ in orodjem TLC za preverjanje modelov. Izvedli smo raziskave uporabe formalnih metod za ugotavljanje učinkovitosti. Na primeru vrste omrežja IEEE 802.15.4 smo pokazali, da lahko tipične lastnosti glede učinkovitosti izrazimo z določeno vrsto temporalne logike in jih preverimo s formalno verifikacijo namesto s simulacijo. Rezultati so natančnejši, saj z verifikacijo preiščemo vsa možna izvajanja omrežja, s simulacijo pa ne. Seveda je verifikacijo možno izvesti samo za manjše sisteme. Za večje pa lahko namesto simulacije uporabimo statistično verifikacijo. Ugotovili smo, kako lahko modele omrežij, napisane v obliki probabilističnih časovnih avtomatov, hitro preslikamo v modele v simulacijskem ogrodju OMNeT+ + . Raziskali smo analitični model določenih omrežij IEEE 802.15.4 brez skritih postaj in na podlagi tega pričeli razvijati formule za določene metrike za omrežja s skritimi postajami. Analitični model smo implementirali v jeziku C+ + . Razvili smo verzijo 2.1.0 integriranega razvojnega okolja SpinRCP za formalno verifikacijo sistemov z orodjem Spin. S to verzijo smo prešli iz uporabe odprtokodnega razvojnega sistema Eclipse Indigo na najnovejšo verzijo Eclipse Kepler 4.3.1. V orodje smo dodali možnost generiranja in prikaza grafa končnega avtomata za vsak proces v modelu in vsak proces »never claim«, dobljen z negiranjem LTL formule, s katero opišemo želeno lastnost sistema. Za prikaz grafov si lahko uporabnik izbere deset različnih grafičnih formatov. 4.Ocena stopnje realizacije programa dela na raziskovalnem programu in zastavljenih raziskovalnih ciljev3 SLO V okviru programskega sklopa multimodalni vmesniki je bil v okviru razvoja jezikovnih tehnologij za slovenski jezik na področju razpoznavanja tekočega govora cilj raziskovalnega dela razvoj postopkov razpoznavanja govora visoko pregibnih jezikov, z namenom definiranja sistema avtomatskega razpoznavanja govora z velikim slovarjem besed za slovenski jezik. V okviru raziskav smo razvili več postopkov akustičnega in jezikovnega modeliranja govora. Dobljeni rezultati so pokazali pomembno izboljšanje uspešnosti avtomatskega razpoznavanja govora v primeru velikega slovarja. Z namenom zagotavljanja večje uspešnosti razpoznavanja govora z velikim slovarjem besed smo razvili nov postopek za zaznavanje aktivnosti govora (algoritem VAD), ki temelji na Gaussovih modelih porazdelitve verjetnosti in sistem za segmentacijo in klasifikacijo govora oz. akustičnega signala, s podporo za tri vrste segmentacije: segmentacija govor/negovor, segmentacija po spolu govorca in segmentacija po pasovni širini kanala. S tem je mogoče zagotoviti uspešno uporabo sistemov avtomatskega razpoznavanja govora tudi v primeru akustičnih signalov, ki ob govoru vključujejo tudi druge zvoke. Na področju modeliranja jezikovnih modelov in v povezavi s področjem avtomatskega govorno orientiranega prevajanja, smo kot izhodišče privzeli jezikovno gradivo podnapisov in se osredotočili na jezikovni par pregibnih jezikov (slovenščina-srbščina). V okviru tega smo razvili nove postopke jezikovnega modeliranja s statističnimi in faktoriziranimi jezikovnimi modeli. V okviru raziskav smo razvili več demonstracijskih sistemov razpoznavanja in simultanega prevajanja govora ter na Fakulteti za elektrotehniko, računalništvo in informatiko Univerze v Mariboru postavili pilotski projekt avtomatizirane govorno vodene storitve avtomatskega telefonskega operaterja ki je vključen v telekomunikacijsko omrežje. V okviru razvoja vizualno-gestikularnih vmesnikov je bil za rešitev vizualno-gestikularne komunikacije pridobljen patent s popolnim preizkusom. Raziskave na tem področju smo nadgradili z zasnovo vmesnikov, ki izrabljajo različne metode analize signalov možganske aktivnosti uporabnika. Ocenjujemo, da so bili ključni cilji programskega sklopa raziskovalnega programa doseženi, v posameznih elementih so bile v programu predvidene raziskave tudi nadgrajene. Na področju programskega sklopa zagotavljenje pravilnosti sistemov smo z razvojem novih metod za formalno ali polformalno specifikacijo in preverjanje reaktivnih sistemov, z razvojem in implementacijo učinkovitih algoritmov v lastnih orodjih za specifikacijo in preverjanje ter z razvojem in preskušanjem metodologij z uporabo obstoječih pristopov in drugje razvitih orodij prispevali k napredku pri temeljnih in aplikativnih raziskavah formalnih metod reaktivnih sistemov ter uporabi rezultatov raziskav v industriji. Cilje smo v celoti dosegli. Naša hipoteza, da so potrebne raziskave formalnih metod za sodobne sisteme, se je izkazala kot pravilna. 5.Utemeljitev morebitnih sprememb programa raziskovalnega programa oziroma sprememb, povečanja ali zmanjšanja sestave programske skupine4 Do sprememb programa raziskovalnega programa v času njegovega izvajanja ni prišlo. V sestavo programske skupine sta bila v okviru istega skupnega števila ur programa vključena dva tehniška sodelavce, ki sta opravljala dela predvsem na področju jezikovnih virov in upravljanja z infrastrukturo, ki jo pri svojem delu potrebujejo raziskovalci predvsem na področju multimodalnih vmesnikov in jezikovnih tehnologij. 6.Najpomembnejši znanstveni rezultati programske skupine5 Znanstveni dosežek 1. COBISS ID 16450838 Vir: COBISS.SI 1 Naslov SLO Akustična klasifikacija in segmentacija z uporabo modificiranega spektralnega upada in značilk na osnovi variance ANG Acoustic classification and segmentation using modified spectral roll-off and variance-based features Opis SLO V članku je predstavljen sistem za akustično klasifikacijo in segmentatcijo. Sistem je primeren za uporabo v sistemih avtomatskega razpoznavanja govora, kjer so potrebne informacija glede posameznih akustičnih segmentov. Predlagani sistem podpira tri vrste akustične segmentacije: segmentacijo govor/negovor, segmentacijo po spolu govorca in segmentacijo po pasovni širini kanala. V članku so predstavljene tudi nove značilke za boljšo in bolj robustno akustično segmentacijo. Sistem je še posebej primeren za integracijo v sistem avtomatskega razpoznavanja tekočega govora, ki uporablja značilke MFCC, saj je zahteva po dodatni procesorski zmogljivosti zaradi segmentacije minimalna. ANG This paper presents novel features and an architecture for an automatic online acoustic classification and segmentation system. The system includes speech/non-speech segmentation (with the emphasis on accurate speech/music segmentation), gender segmentation, and speech bandwidth segmentation. This automatic segmentation system can be easily integrated into an automatic continuous speech recognition system, where information about individual acoustic segments can be used for acoustic model selection and adaptation, or as additional information for rich transcription output. Acoustic model adaptation can improve the speech recognition rate and additional information in rich transcription can be useful when searching for some certain events or circumstances (male speaker talking over the phone line, etc.). For speech/non-speech segmentation we propose a new set of features, which are based on an energy variance in a narrow frequency sub-band, called EVFB (Energy Variance of Filter Bank). The proposed features also prove to be an efficient discriminator between speech and music. Segmentation cross-test results show that EVFB features prove to be more robust than MFCC features. Two new features (modified spectral roll-off and high-frequency energy variance) are also proposed for speech bandwidth classification and segmentation. The results show a good and robust performance by the automatic on-line acoustic segmentation system. All experiments and tests were performed on a radio broadcast database and a Slovenian BNSI Broadcast News database. Integration of the automatic on-line acoustic segmentation system into a continuous speech recognition system based on MFCC (melfrequency cepstral coefficients) features requires only a small additional computational cost because many of the proposed system's feature calculation procedures are common to the MFCC features calculation procedure. Objavljeno v Academic Press; Digital signal processing; 2013; Vol. 23, iss. 2; str. 659674; Impact Factor: 1.918;Srednja vrednost revije / Medium Category Impact Factor: 1.38; A': 1; WoS: IQ; Avtorji / Authors: Kos Marko, Kačič Zdravko, Vlaj Damjan Tipologija 1.01 Izvirni znanstveni članek 2. COBISS ID 16824598 Vir: COBISS.SI Naslov SLO Razpoznavanje govora v interakciji z robotom v šumnem okolju ANG Speech recognition for interaction with a robot in noisy environment Opis SLO Eden večjih problemov razpoznavanja govora pri robotih je šum. V članku smo predlagali dve metodi za povečanje robustnosti razpoznavanja govora v šumnem okolju. Pokazali smo, da lahko z dobro izbranimi utežmi jezikovnega modela v procesu odločanja povečamo natančnost razpoznavanja. Druga predlagana metoda je adaptacija jezikovnega modela na domeno. Obe predlagani metodi smo eksperimentalno preizkusili in pokazali izboljšanje uspešnosti razpoznavanja za 2%. ANG One of the main problems with speech recognition for robots is noise. In this paper we propose two methods to enhance the robustness of continuous speech recognition in noisy environment. We show that the accuracy of recognition can be improved by better weighting the language model in the decision process. The second proposed method is based on language model adaptation. The experiments showed that both proposed techniques improve speech recognition accuracy by approximately 2% . Objavljeno v Wydawnictwo Czasopism i Ksi^azek Technicznych "Sigma"; Przegl^ad Elektrotechniczny; 2013; R. 89, nr. 5; str. 162-166; Avtorji / Authors: Sepesy Maučec Mirjam, Kačič Zdravko, Žgank Andrej Tipologija 1.01 Izvirni znanstveni članek 3. COBISS ID 17578262 Vir: COBISS.SI Naslov SLO Razpoznavanje vizemov na osnovi transformiranih akustičnih modelov ANG Viseme recognition system based on transformed acoustic models Opis SLO Razpoznavanje vizemov iz govora se uporablja za delovanje različnih vrst avatarjev oz. virtualnih asistentov. V prispevku smo predlagali novo metodo tvorjenja akustičnih modelov za razpoznavanja vizemov iz govora, kjer osnovo predstavljajo prednaučeni fonemski akustični modeli, ki jih ustrezno transformiramo v vizeme. Predlagana metoda transformacije je v celoti jezikovno neodvisna. Rezultat razpoznavanja govora je niz vizemov in ustreznih časovnih oznak. Predlagana metoda je statistično pomembno izboljšala rezultate razpoznavanja vizemov iz govora. ANG Viseme recognition from speech is one of the methods needed to operate a talking head system, which can be used in various areas, such as mobile services and applications, gaming, the entertainment industry, and so on. This paper proposes a novel method for generating acoustic models for viseme recognition from speech. The viseme acoustic models were generated using transformations from trained phoneme acoustic models. The proposed transformation method is language-independent; only the available speech resources are needed. The viseme sequence with corresponding time information was produced as a result of recognition using context-dependent acoustic models. The evaluation of the proposed acoustic models transformation method was carried out on a test scenario with phonetically balanced words, in which the results were compared to the baseline viseme recognition system. The improvement in viseme accuracy was statistically significant when using the proposed method for transforming acoustic models. Objavljeno v Technologija; Elektronika ir elektrotechnika; 2013; No. 9; str. 93-96; Impact Factor: 0.411;Srednja vrednost revije / Medium Category Impact Factor: 1.38; WoS: IQ; Avtorji / Authors: Žgank Andrej, Kačič Zdravko Tipologija 1.01 Izvirni znanstveni članek 4. COBISS ID 17523222 Vir: COBISS.SI Naslov SLO Preverjanje modelov z uporabo orodij Spin in SpinRCP ANG Model checking using Spin and SpinRCP Opis SLO Spin je eno izmed vodilnih verifikacijskih orodij za preverjanje modelov porazdeljenih sistemov. Uporablja se za širok spekter aplikacij, pri katerih lahko sisteme predstavimo kot asinhrono izvajajoče se procese. V članku podajamo kratek pregled osnovnih pojmov o preverjanju modelov, preverjalniku modelov Spin, njegovem vhodnem jeziku Promela in razpoložljivih grafičnih uporabniških vmesnikih za Spin. Da bi uporabnikom orodja Spin ponudili integrirano razvojno okolje za Spin, smo razvili SpinRCP. Predstavljamo njegovo strukturo in prikažemo nekatere izmed njegovih značilnosti na primeru standardnega algoritma za izbiro vodje v enosmernem obroču. ANG Spin is one of the leading verification tools for the model checking of distributed systems. It is used over a broad spectrum of applications where systems can be represented as asynchronously running processes. This paper provides an overview of the concepts of model checking, the Spin model checker together with its input language Promela, and of the available graphical user interfaces to Spin. In order to offer Spin users an integrated development environment for Spin, we have developed a SpinRCP. We introduce its structure and demonstrate some of its features by considering a standard algorithm for leader election in a unidirectional ring. Objavljeno v Strokovno društvo za mikroelektroniko, elektronske sestavne dele in materiale; Informacije MIDEM; 2013; Letn. 43, št. 4; str. 235-250; Impact Factor: 0.277;Srednja vrednost revije / Medium Category Impact Factor: 1.38; WoS: IQ, PM; Avtorji / Authors: Brezočnik Zmago, Vlaovič Boštjan, Vreže Aleksander Tipologija 1.01 Izvirni znanstveni članek 5. COBISS ID 14398230 Vir: COBISS.SI Naslov SLO Samoprilagodljiv algoritem diferencialne evolucije z redukcijo velikosti populacije in tremi strategijami ANG Self-adaptive differential evolution algorithm using population size reduction and three strategies Opis SLO Številni problemi, ki izvirajo iz realnega sveta, so zelo kompleksni. Za njihovo reševanje potrebujemo algoritme, ki znajo poiskati globalni optimum, ne glede na posebnosti problema. V tem članku predstavljamo samoprilagodljiv algoritem diferencialne evolucije, poimenovali smo ga jDEscop, za reševanje obsežnih optimizacijskih problemov z zveznimi spremenljivkami. Predlagani algoritem uporablja tri strategije in mehanizem za zmanjševanje populacije. Opravili smo primerjavo našega algoritma s tremi znanimi algoritmi iz literature. Izvedli smo neparametrične statistične teste, ki so pokazali, da je predlagani algoritem v večini primerov signifikantno boljši od ostalih treh. ANG Many real-world optimization problems are largescale in nature. In order to solve these problems, an optimization algorithm is required that is able to apply a global search regardless of the problems' particularities. This paper proposes a self-adaptive differential evolution algorithm, called jDElscop, for solving large-scale optimization problems with continuous variables. The proposed algorithm employs three strategies and a population size reduction mechanism. The performance of the jDElscop algorithm is evaluated on a set of benchmark problems provided for the Special Issue on the Scalability of Evolutionary Algorithms and other Metaheuristics for Large Scale Continuous Optimization Problems. Nonparametric statistical procedures were performed for multiple comparisons between the proposed algorithm and three well known algorithms from literature. The results show that the jDElscop algorithm can deal with large-scale continuous optimization effectively. It also behaves significantly better than other three algorithms used in the comparison, in most cases. Objavljeno v Springer; Soft computing; 2011; Vol. 15, no. 11; str. 2157-2174; Impact Factor: 1.880;Srednja vrednost revije / Medium Category Impact Factor: 1.507; A': 1; WoS: EP, EV; Avtorji / Authors: Brest Janez, Sepesy Maučec Mirjam Tipologija 1.01 Izvirni znanstveni članek 7.Najpomembnejši družbeno-ekonomski rezultati programske skupine6 Družbeno-ekonomski dosežek 1. COBISS ID 16775958 Vir: COBISS.SI Naslov SLO Postopek in naprava za gestikularno-vizualno komunikacijo ANG Method and apparatus for gestural-visual communication Opis SLO Rešitev po izumu omogoča uporabniku, da z rokama kot krmilnim organom pri komuniciranju izvaja intuitivne geste v vidnem polju slikovnih senzorjev v istem področju, kot v vsakodnevnem življenju pri opazovanju z očmi in se krmilni organ v takšni legi prikazuje kot lokator na stereoskopskih podatkovnih očalih. V neobremenjujoči komunikaciji s strojem se zlijeta fizičen prostor okoli uporabnika in osebno navidezno delovno okolje. Položaj krmilnega organa in njegova krmilna gesta se razpoznata v video procesorju. Video generator na mestu, ki ustreza položaju krmilnega organa, generira lokator, potem ko je nadzorna procesorska naprava položaju krmilnega organa priredila položaj lokatorja v aktivnem področju osebnega navideznega delovnega okolja. Na osnovi razpoznane krmilne geste krmilnega organa izvede nadzorna procesorska naprava akcijo nad izbranim objektom. Uporabnik lahko proži aplikacije tudi s pomočjo govorjenih ukazov. ANG The solution according to the given invention allows the user to use his/her arms (control body) to conduct communication using intuitive gestures performed within the field of image sensors in the same visual area as seen by the user's eyes in everyday life. The position of the control body is mapped to the position of a locator shown on the stereoscopic data glasses. In seamless communication with the machine the physical space around the user and virtual working environment shown on the data glasses become blended. Position of the control body and the performed gesture are recognized by the video processor. The video generator generates locator on the position within the active personal working environment that corresponds to the position of the control body, after the control processing device has mapped the location of the control body to the location of the locator in the active personal virtual working environment. Based on the recognized gesture performed by the control body, the control processing device conducts the action on the selected object. The user can also activate the application by using the spoken commands. Šifra F.32 Mednarodni patent Objavljeno v Urad Republike Slovenije za intelektualno lastnino; 2013; A'': 1;A': 1; Avtorji / Authors: Kačič Zdravko, Kramberger Iztok Tipologija 2.24 Patent 2. COBISS ID 16846341 Vir: vpis v poročilo Naslov SLO Član uredniškega odbora revije International journal of speech technology ANG Member of editorial board of International journal of speech technology Opis SLO Član uredniškega odbora revije International journal of speech technology, ki objavlja prispevke s področja razvoja in uporabe sistemov govornih tehnologij. ANG Member of editorial board of International journal of speech technology that publishes articles in the field of speech technology development and applications. Šifra C.06 Članstvo v uredniškem odboru Objavljeno v COBISS Tipologija 4.00 Sekundarno avtorstvo 3. COBISS ID 259350016 Vir: COBISS.SI 1 Naslov SLO Slovenski govorni korpus Gos ANG Slovenian Speech Corpus GOS Opis SLO Znanstvena monografija predstavlja snovanje, gradnjo in možnosti uporabe prvega referenčnega govornega korpusa slovenskega jezika - GOS. Korpus GOS vključuje avtentične posnetke govorjene slovenščine, zajete v najpogostejših govornih situacijah: vsakdanji zasebni in uradni pogovori, medijski govor, pouk v šolah, predavanja ipd. Posnetki so transkribirani, segmentirani in brezplačno dostopni prek uporabniku prijaznega vmesnika na strani www.korpusgos.net. Monografija Slovenski govorni korpus Gos je uporabna za raziskovalce govora in jezikovnih tehnologij, snovalce jezikovnih priročnikov, poklicne govorce in učitelje slovenščine kot maternega ali tujega jezika. ANG The monograph The corpus of spoken Slovene GOS presents the planning, the design and the application of the first reference corpus of spoken Slovene - GOS. The corpus GOS is an electronic collection of recordings including speakers from all over Slovenia in their most common speech situations. Taking account of the principal goals of the presented source, the authors describe the process of planning the corpus GOS, the corpus materials and the transcription system based on the pronounced and on the standardized level. The user friendly interface (www.korpusgos.net) allows to search for different words, dialects, speakers' profiles and speech situations, in order to promote a better understanding of different demographic and genre layers of Slovene as mother tongue or foreign language. Šifra C.02 Uredništvo nacionalne monografije Objavljeno v Trojina, zavod za uporabno slovenistiko; 2011; 110 str.; A'': 1;A': 1; Avtorji / Authors: Verdonik Darinka, Zwitter Vitez Ana Tipologija 2.01 Znanstvena monografija 4. COBISS ID 17408278 Vir: COBISS.SI Naslov SLO Izboljšano statistično strojno prevajanje z uporabo dodatnih jezikovnih modelov ANG Improving statistical machine translation with additional language models Opis SLO V članku smo predlagali ponovno vrednotenje seznama N najboljših prevodov, ki jih generira statistični prevajalnik, z uporabo dodatnih jezikovnih modelov splošne domene. Kot izhodišče smo uporabili faktorizirano statistično strojno prevajanje med dvema visoko pregibnima jezikoma, slovenščino in srbščino. Kot faktorje smo uporabili lingvistične oznake. Vsako od N najbolj verjetnih hipotez smo ponovno vrednotili z izbranim jezikovnim modelom, ki v fazi generiranja hipotez ni bil uporabljen. Izvedli smo eksperimente v domeni prevajanja podnapisov. Rezultate smo vrednotili z uveljavljenima avtomatskima metrikama BLEU in TER. Na osnovi aproksimirane randomizacije so se rezultati izkazali kot statistično signifikantni. Predstavljen pristop je uporaben za poljuben jezikovni par. ANG This paper proposes N-best list rescoring in order to improve the translations produced by the statistical machine translation system. Phrase-based statistical machine translation is used as a baseline. We have focused on translation between two morphologically rich languages and have extended phrase-based translation into factored translation. The factored translation system is able to produce N-best linguistically annotated translations for each input sentence. We propose to re-rank them based on scores produced by additional language models of general domain. Experiments were performed on a Serbian - Slovenian language pair. The results were evaluated in terms of two standard metrics, BLEU and TER scores. Tests of statistical significance based on approximate randomization were performed for both metrics. The improvements in terms of both metrics were statistically significant. This approach is applicable to any pair of languages, especially to languages with rich morphologies. Šifra B.03 Referat na mednarodni znanstveni konferenci Objavljeno v Fundacja Uniwersytetu im. A. Mickiewicza; Human language technologies as a challenge for computer science and linguistics; 2013; Str. 137-141; Avtorji / Authors: Sepesy Maučec Mirjam, Donaj Gregor, Kačič Zdravko Tipologija 1.08 Objavljeni znanstveni prispevek na konferenci 5. COBISS ID 17411606 Vir: COBISS.SI Naslov SLO Pametno brezžično upravljanje naprav ANG Smart wireless device management Opis SLO Izvedena je bila raziskava različnih komunikacijskih tehnologij in protokolov za namenom zagotavljanja enovitega in celovitega upravljanja enot v okolju pametnega doma na osnovi brezžične komunikacije med hišnimi napravami. V sklopu projekta je bil izveden demonstracijski sistem v modularni izvedbi s preprosto in enoumno uporabo po principu »namesti in uporabljaj«. ANG A survey of various communication technologies and protocols was performed for the purpose of uniform and complete control of units within the smart home environment on the basis of wireless communication between home appliances. In scope of this project a demonstration system was developed on the modular basis using simple and unambiguous use on the principle of »Plug and Play«. Šifra F.05 Sposobnost za začetek novega tehnološkega razvoja Objavljeno v UM FERI; 2013; loč. pag.; Avtorji / Authors: Kramberger Iztok, Kos Marko Tipologija 2.13 Elaborat, predštudija, študija 8.Drugi pomembni rezultati programske skupine7 - Andrej Žgank, recenzent: mednarodna znanstvena konferenca Interspeech 2013 - Andrej Žgank, recenzent: revija Northern European journal of language technologies - Andrej Žgank, član upravnega odbora evropske akcije COST IC 1003 Qualinet - Sodelovanje s podjetjem Telekom Slovenije, d.d., izobraževanje mladega raziskovalca iz gospodarstva (razpis TIA) Tomaža Lovrenčiča - Damjan Vlaj, Computer speech & language. (pisec recenzij 2012, 2013). - Damjan Vlaj, Computers & electrical engineering. (pisec recenzij 2012, 2013, 2014). - Mirjam Sepesy Maučec, IET generation, transmission & distribution. (pisec recenzij 2013) - Mirjam Sepesy Maučec, Information sciences. (pisec recenzij 2013) - Darinka Verdonik, Slovenščina 2.0. (član uredniškega odbora 2012-). ISSN 2335-2736. - Zmago Brezočnik, član izdajateljskega sveta revije Elektrotehniški vestnik. - Zmago Brezočnik, član programskega odbora in recenzent konference 12th International Conference on Telecommunication ConTEL 2013, Zagreb. - Tatjana Kapus, članica programskega odbora in recenzentka - Software Engineering 2013 in Software Engineering Advances 2013. - Boštjan Vlaovič, Aleksander Vreže: član programskega odbora dogodkov Viable Telecommnunications (VITEL). - Boštjan Vlaovič, Aleksander Vreže: član organizacijskega odbora 29. Delavnice VITEL - Boštjan Vlaovič, član programskega odbora in recenzent konference ICIN. - Boštjan Vlaovič, vodja razvojnega projekta za podjetje RC ITK d.o.o., št. pogodbe RC IKT -FERI - 2011/2012, Aneks št. 1, naloga št 06 - »Protokol SIP - 2013«. - Iztok Kramberger, recenzent: Automatika. ISSN 0005-1144. - Iztok Kramberger, recenzent: Computer methods and programs in biomedicine. Elsevier. ISSN 0169-2607. - Iztok Kramberger, recenzent: Optical engineering. ISSN 0091-3286. - Iztok Kramberger, podpredsednik Odbora za znanost in tehnologijo pri Obrtno-podjetniški zbornici Slovenije. - Iztok Kramberger, vodja projekta SDGS za ESA po pogodbi ESTEC 4000106501/12/NL/KM 9.Pomen raziskovalnih rezultatov programske skupine8 9.1.Pomen za razvoj znanosti9 SLO Izvedene raziskave na področju predprocesiranja govora, akustičnega in jezikovnega modeliranja govora so prispevale k razvoju znanosti predvsem na področju razvoja tehnologij za pregibne jezike, kamor sodi tudi slovenski jezik, saj so pokazale, da so za doseganje podobnih uspešnosti, kot jih je mogoče doseči z obstoječo tehnologijo za angleški jezik, potrebni novi pristopi. Z razvitimi novimi postopki smo uspeli za sistem razpoznavanja govora z velikim slovarjem besed doseči pomembna izboljšanja uspešnosti. Novi postopki so bili razviti za slovenski jezik, vendar so uporabni tudi za druge pregibne jezike. S tega stališča je izvedeno raziskovalno delo pomembno za razvoj tega znanstvenega področja. Z ustrezno ugledno mednarodno objavo je referenčni korpus Gos dobil ustrezno potrditev kot primer dobre prakse na področju govornih korpusov in predstavlja pomemben standard za nadaljnje delo na tem področju. Pregled koncepta konteksta v jezikoslovnih in diskurznih teorijah prinaša na enem mestu zbrane in kritično analizirane pretekle in aktualne opredelitve do tega koncepta v jezikoslovnih in diskurznih teorijah v mednarodnem prostoru. Predstavlja odlično izhodišče za vsakršno nadaljnje delo v zvezi z vprašanji vloge in obravnave konteksta v luči medčloveške ali strojno posredovane govorne komunikacije oz. komunikacije človek - stroj, zlasti tudi v luči procesov razumevanja govora in diskurza. Rezultati na področju TLA+ prispevajo k temu, da bo TLA+, ko bodo bolje razvita orodja za verifikacijo z njo, postal praktično uporaben formalizem za zelo različne sisteme. Rezultati na področju uporabe formalnih metod za ugotavljanje učinkovitosti kažejo, da je to lahko vsaj za manjše sisteme dobra alternativa klasičnim metodam. Integrirano razvojnega okolje SpinRCP bo zaradi svojih funkcionalnosti in prijaznega uporabniškega vmesnika raziskovalcem in uporabnikom orodja Spin v svetu znatno poenostavilo proces urejanja modelov v Promeli, izvajanje simulacije in samega preverjanja modelov. ANG The research conducted in the field of speech preprocessing, acoustic modelling of speech and language modelling have contributed to the science in development of technologies for group of inflected languages, to which also Slovenian language belongs. It was shown that to achieve similar recognition performance with existing technology as it can be achieved for the English language, new approaches are required. The new algorithms developed within the research program in the field of speech preprocessing and large vocabulary speech recognition enabled significant improvements in speech recognition accuracy. The new algorithms have been developed for Slovenian language, but can be also used for other inflected languages. From this point of view the research work performed has an important impact in this research field. The work on the reference speech corpus of Slovene GOS was published in a reputable international journal. This way it was confirmed as a model of good practice in speech corpora compilation and represents an important standard for further work in this field. A paper on the concept of context represents an overview and critical analysis of the comprehensions of this concept in linguistic and discourse theories in the international scope. It represents an excellent starting point for further work on the role of the context in human-to-human, machine mediated human-to-human or human-to-machine communication, especially from the point of view of comprehension processes in speech and discourse. The results in the area of TLA+ will help it become a practical formalism applicable to a wide range of systems, when the computer-aided verification tools for it are better developed. The results in the area of the use of formal methods for performance evaluation demonstrate that the latter can be a good alternative to the classical methods at least for smaller systems. Due to its functionalities and friendly user interface the integrated development environment SpinRCP will ease the researchers and Spin users the process of editing Promela models, running the simulation and the model checking itself. 9.2.Pomen za razvoj Slovenije10 SLO Nove smernice razvoja na področju telekomunikacijskih storitev dajejo jezikovnim tehnologijam v okviru podpornih življenjskih okolij in inteligentnih okolij novo dimenzijo, saj predstavljajo eno ključnih komunikacijskih modalnosti. Ker bodo takšna okolja v prihodnosti posegla v bivalno okolje skoraj vsakega posameznika je možnost uporabe maternega jezika za ohranjanje nacionalne identitete zelo pomembna. Zagotavljanje možnosti komunikacije v takšnih okoljih v slovenskem jeziku je pomembno za razvoj Slovenije. Raziskave izvedene na področju govornih tehnologij so z razvojem novih postopkov predprocesiranja, akustičnega in jezikovnega modeliranja ter sistemov razpoznavanja govora z velikim slovarjem besed, kjer smo dosegli pomembno izboljšanje uspešnosti razpoznavanja tekočega slovenskega govora, pomemben prispevek na tem področju za razvoj Slovenije. Mednarodna objava o korpusu Gos je pomembno prispevala k prepoznavnosti slovenske znanosti na področju jezikovnih tehnologij in korpusnega jezikoslovja. Prispevek o vprašanjih konteksta v jezikoslovnih in diskurznih teorijah prinaša v slovenski prostor nova in zelo aktualna vedenja o vprašanju, ki je sicer v slovenskem jezikoslovju in z njim povezanem prostoru izredno redko obravnavano in zelo slabo pokrito, ne samo s strani domačih avtorjev, ampak tudi kar se tiče prevodov in prisotnosti mednarodnih publikacij na to temo. Z raziskavami na področju uporabe formalnih metod za ugotavljanje učinkovitosti sistemov prispevamo k temu, da smo v Sloveniji v stiku z najnovejšimi trendi raziskav na področju formalne verifikacije. Hkrati s tem se izobražuje tudi strokovni kader, ki bo pridobljeno znanje lahko uporabil za prenos v slovensko industrijo. ANG New development directions in the field of telecommunications services give language technologies in the context of supportive living environments and intelligent environments a new dimension, as they represent one of the key communication modalities. Given that elements of such an environment will in the future in some way influence the living environment of almost every individual, the possibility of using the mother tongue has an important role in preserving the national identity. It is important to assure the possibility of using Slovenian language in such communication environments. Research conducted in the area of speech technologies resulted in development of new algorithms for speech preprocessing, acoustic and language modelling and large vocabulary speech recognition systems. Here, significant improvement in the performance of the Slovenian continuous speech recognition system represents an important contribution in this area for development of Slovenia. An international publication on the GOS corpus contributed significantly to the recognition of the Slovene science in the field of language technologies and corpus linguistics in the world. A paper on the question of context in linguistic and discourse theories represents new and very current knowledge on the issue which is rarely considered in the Slovene linguistics and connected fields of research. The topic of context is rarely discussed and poorly represented not merely by domestic authors, but also by translated publications. Our research in the area of application of formal methods for performance evaluation of systems helps Slovenian research community to follow the latest trends in the field of formal verification. At the same time, the professional staff, who will be able to use this knowledge for the transfer to the Slovenian industry, is being educated. 10.Zaključena mentorstva članov programske skupine pri vzgoji kadrov v obdobju 1.1.2009-31.12.201311 10.1. Diplome12 vrsta usposabljanja število diplom bolonjski program - I. stopnja 43 bolonjski program - II. stopnja 9 univerzitetni (stari) program 90 10.2. Magisterij znanosti in doktorat znanosti13 Šifra raziskovalca Ime in priimek Mag. Dr. MR 27566 Marko Kos O ® 0 27896 Matej Grašič O ® 0 30387 Aleš Zelenik O ® □ 0 Aleš Štricelj o ® □ 30951 Tim Kovše ® O 0 Legenda: Mag. - Znanstveni magisterij Dr. - Doktorat znanosti MR - mladi raziskovalec ll.Pretok mladih raziskovalcev - zaposlitev po zaključenem usposabljanju14 Šifra raziskovalca Ime in priimek Mag. Dr. Zaposlitev 27896 Matej Grašič o ® C - Gospodarstvo 27566 Marko Kos o ® A - raziskovalni zavodi 30951 Tim Kovše ® O E - Tujina Legenda zaposlitev: A - visokošolski in javni raziskovalni zavodi B - gospodarstvo C - javna uprava D - družbene dejavnosti E - tujina F - drugo 12.Vključenost raziskovalcev iz podjetij in gostovanje raziskovalcev, podoktorandov ter študentov iz tujine, daljše od enega meseca, v obdobju 1.1.2009-31.12.2013 Šifra raziskovalca Ime in priimek Sodelovanje v programski skupini Število mesecev Legenda sodelovanja v programski skupini: A - raziskovalec/strokovnjak iz podjetja B - uveljavljeni raziskovalec iz tujine C - študent - doktorand iz tujine D - podoktorand iz tujine 13.Vključevanje v raziskovalne programe Evropske unije in v druge mednarodne raziskovalne in razvojne programe ter drugo mednarodno sodelovanje v obdobju 1.1.2009-31.12.2013 z vsebinsko obrazložitvijo porabe dodeljenih sredstev iz naslova dodatnega letnega sofinanciranja mednarodnega sodelovanja na podlagi pozivov za EU vpetost.15 SLO An online service for SUbtitling by MAchine Translation (SUMAT), Competitiveness and Innovation Framework Programme ICT Policy Support Programme (ICT PSP) (20012014), vodja: Zdravko Kačič CrossModal Analysis of Verbal and Nonverbal Communication, projekt COST 2102, vodja: Matej Rojc European Network on Quality of Experience in Multimedia Systems and Services QUALINET, projekt COST IC 1003, vodja: Andrej Žgank Dodatna sredstva za sodelovanje v zgoraj naštetih projektih niso bila dodeljena. 14.Vključenost v projekte za uporabnike, ki v so obdobju trajanja raziskovalnega programa (1. 1. 2009 - 31. 12. 2013), potekali izven financiranja ARRS16 SLO - Storitev interaktivnega posredovanja informacij za uporabnikes posebnimi potrebami (SIPINA); projekt iz razpisa e-vsebine financer: MIZŠ; (20122013); Vodja: Zdravko Kačič - Protokol SIP 2012; naročnik: RC IKT d.o.o. (Razvojni center za informacijske in komunikacijske tehnologije); industrijski projekt, vodja: Boštjan Vlaovič - Software Defined Ground Station (SDGS); naročnik: Evropska vesoljska agencija (ESA); vodja: Iztok Kramberger - Preizkušanje ALC programskega modula; naročnik: RC MASPOS d.o.o.; industrijski projekt, vodja: Iztok Kramberger - Preizkušanje programskega modula za krmiljenje sond; naročnik RC MASPOS d.o.o.; industrijski projekt, vodja: Iztok Kramberger - Protokoli 2013; naročnik RC IKT d.o.o. (Razvojni center za informacijske in komunikacijske tehnologije); industrijski projekt, vodja: Iztok Kramberger - Spletni konkordančnik za nacionalni govorni korpus slovenščine; financer MVZT, EU (e-vsebine), vodja: Darinka Verdonik - 01SIPFERI2010: Razvojna pogodba na protokolu SIP za produkte SI3000, financer podjetje Iskratel d.o.o., Kranj, industrijski projekt; vodja: Boštjan Vlaovič - Projekt nadgradnje sistema ASR, Iskratel, 06FERIASR2007, industrijski projekt, vodja: Zdravko Kačič - Razvoj spletnih aplikacij z govornim krmiljenjem in sintezo govora, Panevropa, d.o.o., industrijski projekt; vodja: Zdravko Kačič - Razvoj Internih standardov in vzorčne govorne baze, Amebis, d.o.o., industrijski projekt, vodja: Zdravko Kačič - Vgrajena programska oprema za naglavni elektronski očesni sledilnik z vgrajenim digitalnim pospeškometrom, ASTRON d.o.o., industrijski projekt; vodja: Iztok Kramberger - Programska oprema nadzornega sistema aparatov za testiranje sproščanja farmacevtskih učinkovin, Merel d.o.o., industrijski projekt; vodja: Iztok Kramberger - Razvojna pogodba na protokolu SIP za produkte SI3000, 01SIPFERI2009, Iskratel d.o.o., Kranj, industrijski projekt; vodja: Boštjan Vlaovič RC IKT - FERI - 2011/2012, Aneks št. 2, naloga št 8: Protokol SIP 2013; naročnik: RC IKT d.o.o. (Razvojni center za informacijske in komunikacijske tehnologije); vodja: Boštjan Vlaovič 15.Ocena tehnološke zrelosti rezultatov programa in možnosti za njihovo implementacijo v praksi (točka ni namenjena raziskovalnim programom s področij humanističnih ved)17 SLO Doseženi rezultati na področju razvoja sistemov avtomatskega razpoznavanja govora za omejene slovarje besed in avtomatske sinteze govora že omogočajo gradnjo avtomatiziranih telekomunikacijskih storitev za izbrane ciljne aplikacijske domene. V tem okviru je bila izvedena v okviru projekta SIPINA storitev SIPINA EBRALNIK, ki deluje v realnem okolju in realnem času ter omogoča osebam s posebnimi potrebami dostop do spletnih informacij preko govornih tehnologij (sistema sinteze in razpoznavanja slovenskega govora). Rezultati raziskovalnega dela programske skupine so bili neposredno uporabljeni pri izvedbi sistema. Prav tako so bili doseženi rezultati raziskovalnega programa uporabljeni pri razvoju komercialnega sistema avtomatskega razpoznavanja govora za podjetje Iskratel, d.o.o. ter v nadaljevanju industrijskega projekta razvoja avtomatizirane govorne storitve autoattendant. Člani programske skupine so sodelovali v projektu SUMAT, katerega cilj je zgraditi komercialno storitev avtomatskega prevajanja podnapisov, ki bo na voljo uporabnikom. V okviru projekta so zgradili sistem avtomatskega prevajanja podnapisov za jezikovni par slovenščina/srbščina. Celotni sistem SUMAT omogoča prevajanje podnapisov za 14 jezikovnih parov in bo uporabnikom na voljo preko spletne strani. Doseženi rezultati programa omogočajo izvedbo storitev in sistemov, ki vključujejo govorno komunikacijo v slovenskem jeziku za izbrano ciljno aplikacijsko domeno. Pri tem uporaba teh tehnologij predstavlja visoko dodano vrednost predvsem na področju konvergence IKT -združevanja področij telekomunikacijskih storitev, digitalne televizije in procesiranja vsebin v okviru podpornih življenjskih okolij, inteligentnih okolij in interneta stvari. V okviru programskega sklopa zagotavljanja pravilnosti sistemov je bila na osnovi doseženih rezultatov raziskovalnega programa izvedena nadgradnja vtičnika za programsko orodje Spin, ki omogoča obravnavo kompleksnejših sistemov. Dosežen rezultat je uporaben v praksi, če se v podjetjih odločijo za uporabo orodja Spin pri snovanju svojih sistemov. 16.Ocenite, ali bi doseženi rezultati v okviru programa lahko vodili do ustanovitve spin-off podjetja, kolikšen finančni vložek bi zahteval ta korak ter kakšno infrastrukturo in opremo bi potrebovali možnost ustanovitve spin-off podjetja DA NE potrebni finančni vložek 120.000,00 ocena potrebne infrastrukture in opreme18 Dosežki na področju multimodalnih vmesnikov omogočajo uporabo rezultatov predvsem v kontekstu procesiranja vsebin v sodobnih konvergenčnih rešitvah komunikacijskih sistemov (telekomunikacijske storitve, digitalna televizija, podporna življenjska okolja), kjer dosegajo visoke dodane vrednosti. Pri komercializaciji rezultatov imajo pri razvoju sistemov za avtomatsko razpoznavanje in sintezo govora pomembno vlogo potrebni jezikovni viri, katerih cene se za komercialne namene gibljejo od 10.000 do 30.000 EUR. Za izvedbo zahtevnejših sistemov avtomatske sinteze in razpoznavanja slovenskega govora, so potrebni tako pisni, kot tudi govorjeni jezikovni viri. Ocena stroškov jezikovnih virov je 55.000 EUR. Zasnove sodobnih rešitev na področju procesiranja vsebin in podpornih ter inteligentnih življenjskih okolij gredo v smer oblačno zasnovanih rešitev. Ocenjena vrednost osnovne zasnove potrebne infrastrukturne opreme je 60.000 EUR (zmogljivejši strežniki). 17.Izjemni dosežek v 201319 17.1. Izjemni znanstveni dosežek 17.2. Izjemni družbeno-ekonomski dosežek C. IZJAVE Podpisani izjavljam/o, da: • so vsi podatki, ki jih navajamo v poročilu, resnični in točni • se strinjamo z obdelavo podatkov v skladu z zakonodajo o varstvu osebnih podatkov za potrebe ocenjevanja in obdelavo teh podatkov za evidence ARRS • so vsi podatki v obrazcu v elektronski obliki identični podatkom v obrazcu v papirnati obliki • so z vsebino poročila seznanjeni in se strinjajo vsi izvajalci raziskovalnega programa Podpisi: zastopnik oz. pooblaščena oseba JRO in/ali RO s koncesijo: in Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko Zdravko Kačič ŽIG Kraj in datum: Maribor |14.4.2014 Oznaka prijave: ARRS-RPROG-ZP-2014/59 1 Napišite povzetek raziskovalnega programa v slovenskem jeziku (največ 3.000 znakov vključno s presledki -približno pol strani, velikost pisave 11) in angleškem jeziku (največ 3.000 znakov vključno s presledki - približno pol strani, velikost pisave 11). Nazaj 2 Napišite kratko vsebinsko poročilo, v katerem predstavite raziskovalno hipotezo in opis raziskovanja. Navedite ključne ugotovitve, znanstvena spoznanja, rezultate in učinke raziskovalnega programa in njihovo uporabo ter sodelovanje s tujimi partnerji. Največ 12.000 znakov vključno s presledki (približno dve strani, velikosti pisave 11). Nazaj 3 Realizacija raziskovalne hipoteze. Največ 3.000 znakov vključno s presledki (približno pol strani, velikosti pisave 11). Nazaj 4 V primeru bistvenih odstopanj in sprememb od predvidenega programa dela raziskovalnega programa, kot je bil zapisan v predlogu raziskovalnega programa oziroma v primeru sprememb, povečanja ali zmanjšanja sestave programske skupine v zadnjem letu izvajanja raziskovalnega programa, napišite obrazložitev. V primeru, da sprememb ni bilo, to navedite. Največ 6.000 znakov vključno s presledki (približno ena stran, velikosti pisave 11). Nazaj 5 Navedite znanstvene dosežke (največ pet), ki so nastali v okviru tega programa. Raziskovalni dosežek iz obdobja izvajanja programa (do oddaje zaključnega poročila) vpišete tako, da izpolnite COBISS kodo dosežka - sistem nato sam izpolni naslov objave, naziv, IF in srednjo vrednost revije, naziv FOS področja ter podatek, ali je dosežek uvrščen v A'' ali A'. Nazaj 6 Navedite družbeno-ekonomske dosežke (največ pet), ki so nastali v okviru tega programa. Družbeno-ekonomski dosežek iz obdobja izvajanja programa (do oddaje zaključnega poročila) vpišete tako, da izpolnite COBISS kodo dosežka - sistem nato sam izpolni naslov objave, naziv, IF in srednjo vrednost revije, naziv FOS področja ter podatek, ali je dosežek uvrščen v A'' ali A'. Družbeno-ekonomski dosežek je po svoji strukturi drugačen kot znanstveni dosežek. Povzetek znanstvenega dosežka je praviloma povzetek bibliografske enote (članka, knjige), v kateri je dosežek objavljen. Povzetek družbeno-ekonomskega dosežka praviloma ni povzetek bibliografske enote, ki ta dosežek dokumentira, ker je dosežek sklop več rezultatov raziskovanja, ki je lahko dokumentiran v različnih bibliografskih enotah. COBISS ID zato ni enoznačen, izjemoma pa ga lahko tudi ni (npr. prehod mlajših sodelavcev v gospodarstvo na pomembnih raziskovalnih nalogah, ali ustanovitev podjetja kot rezultat programa ... - v obeh primerih ni COBISS ID). Nazaj 7 Navedite rezultate raziskovalnega programa iz obdobja izvajanja programa (do oddaje zaključnega poročila) v primeru, da katerega od rezultatov ni mogoče navesti v točkah 6 in 7 (npr. ker se ga v sistemu COBISS ne vodi). Največ 2.000 znakov vključno s presledki (približno 1/3 strani, velikost pisave 11). Nazaj 8 Pomen raziskovalnih rezultatov za razvoj znanosti in za razvoj Slovenije bo objavljen na spletni strani: http://sicris.izum.si/ za posamezen program, ki je predmet poročanja. Nazaj 9 Največ 4.000 znakov vključno s presledki. Nazaj 10 Največ 4.000 znakov vključno s presledki. Nazaj 11 Upoštevajo se le tiste diplome, magisteriji znanosti in doktorati znanosti (zaključene/i v obdobju 1. 1. 2009 - 31. 12. 2013), pri katerih so kot mentorji sodelovali člani programske skupine. Nazaj 12 Vpišite število opravljenih diplom v času trajanja raziskovalnega programa glede na vrsto usposabljanja. Nazaj 13 Vpišite šifro raziskovalca in/ali ime in priimek osebe, ki je v času trajanja raziskovalnega programa pridobila naziv magister znanosti in/ali doktor znanosti ter označite doseženo izobrazbo. V primeru, da se je oseba usposabljala po programu Mladi raziskovalci, označite MR. Nazaj 14 Za mlade raziskovalce, ki ste jih navedli v tabeli 11.2. točke (usposabljanje so uspešno zaključili v obdobju od 1. 1. 2009 do 31. 12. 2013), ustrezno označite, kje so se zaposlili po zaključenem usposabljanju. Nazaj 15 Navedite naslove projektov in ime člana programske skupine, ki je bil vodja/koordinator navedenega projekta. Točko izpolnijo tudi izvajalci raziskovalnega programa, prejemniki sredstev iz naslova dodatnega letnega sofinanciranja raziskovalnega programa zaradi mednarodnega sodelovanja (sodelovanja v projektih okvirnih programov Evropske unije). Izvajalec, ki je na podlagi pogodbe prejel sredstva iz navedenega naslova, vsebinsko opiše porabo prejetih sredstev za financiranje stroškov blaga in storitev ter amortizacije, nastalih pri izvajanju tega raziskovalnega programa. V primeru, da so bili v okviru raziskovalnega programa prejemniki sredstev različni izvajalci, vsak pripravi vsebinsko poročilo za svoj delež pogodbenih sredstev. Vodja raziskovalnega programa poskrbi, da je vsebinsko poročilo, ločeno za vsakega izvajalca, vključeno v navedeno točko poročila. Največ 6.000 znakov vključno s presledki (približno ena stran, velikosti pisave 11). Nazaj 16 Navedite naslove projektov, ki ne sodijo v okvir financiranja ARRS (npr: industrijski projekti, projekti za druge naročnike, državno upravo, občine idr.) in ime člana programske skupine, ki je bil vodja/koordinator navedenega projekta. Največ 3.000 znakov vključno s presledki (približno pol strani, velikosti pisave 11). Nazaj 17 Opišite možnosti za uporabo rezultatov v praksi. Opišite izdelke oziroma tehnologijo in potencialne trge oziroma tržne niše, v katere sodijo. Ocenite dodano vrednost izdelkov, katerih osnova je znanje, razvito v okviru programa oziroma dodano vrednost na zaposlenega, če jo je mogoče oceniti (npr. v primerih, ko je rezultat izboljšava obstoječih tehnologij oziroma izdelkov). Največ 3.000 znakov vključno s presledki (približno pol strani, velikosti pisave 11). Nazaj 18 Največ 1.000 znakov vključno s presledki (približno 1/6 strani, velikost pisave 11) Nazaj 19 Navedite en izjemni znanstveni dosežek in/ali en izjemni družbeno-ekonomski dosežek raziskovalnega programa v letu 2013 (največ 1000 znakov, vključno s presledki, velikost pisave 11). Za dosežek pripravite diapozitiv, ki vsebuje sliko ali drugo slikovno gradivo v zvezi z izjemnim dosežkom (velikost pisave najmanj 16, približno pol strani) in opis izjemnega dosežka (velikost pisave 12, približno pol strani). Diapozitiv/-a priložite kot priponko/-i k temu poročilu. Vzorec diapozitiva je objavljen na spletni strani ARRS http://www.arrs.gov.si/sl/gradivo/, predstavitve dosežkov za pretekla leta pa so objavljena na spletni strani http://www.arrs.gov.si/sl/analize/dosez/. Nazaj Obrazec: ARRS-RPROG-ZP/2014 v1.00a 1C-85-5C-D7-B1-8E-87-2F-4C-22-B9-20-BC-2E-D8-40-CC-84-DE-93