Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 Oznaka poročila: ARRS_ZV_RPROG_ZP_2008/547 ZAKLJUČNO POROČILO O REZULTATIH RAZISKOVALNEGA PROGRAMA V OBDOBJU 2004-2008 A. PODATKI O RAZISKOVALNEM PROGRAMU 1. Osnovni podatki o raziskovalnem programu Šifra programa P2-0209 Naslov programa Umetna inteligenca in inteligentni sistemi Vodja programa 2275 Ivan Bratko Obseg raziskovalnih ur 51.000 Cenovni razred C Trajanje programa 01.2004 - 12.2008 Izvajalke programa (raziskovalne organizacije in/ali koncesionarji) 106 Institut "Jožef Stefan" 1539 Univerza v Ljubljani, Fakulteta za računalništvo in informatiko B. REZULTATI IN DOSEŽKI RAZISKOVALNEGA PROGRAMA 2. Poročilo o realizaciji programa raziskovalnega programa1 Programska skupina ni le v celoti dosegla, temveč v mnogih ozirih bistveno presegla cilje programa. Opravljeno delo zaradi ogromnega obsega povzemamo v točkah, v kakršnih je bil definiran projekt; znotraj vsake naštevamo posamezne konkretne rezultate in ponekod dodamo izbranimi reference iz kategorije člankov A1. 1) Strojno učenje in odkrivanje zakonitosti v podatkih; strojno učenje v biomedicinski informatiki a) Razvoj novega pristopa k strojnemu učenju, ki temelji na argumentiranih primerih (Možina in sod. 2006). Učinkovitost tega pristopa k učenju smo demonstrirali na vrsti zahtevnih aplikativnih domen, kot so diagnostika infekcij, sestavljanje pravnih predpisov, odobravanje posojil, zajemanje ekspertnega znanja za komentiranje šahovskih partij. b) Novi pristopi k učenju iz tekstovnih podatkov na podlagi kompresije (A. Bratko in sod., 2006). Na tej osnovi temelji tudi nova metoda odkrivanja neželene pošte, nagrajena v obsežni evalvaciji in osvojenem prvem mestu na konferenci Text REtrieval Conference (2005) v organizaciji ameriške standardizacijske organizacije National Institute of Standards and Technology (NIST). c) Razvoj metode GenePath (Zupan in sod., 2003) za avtomatsko rekonstrukcijo genetskih mrež na podlagi podatkov o mutantih. Metoda je bila uporabljena pri raziskovanju genskih mrež amebe D. Discoideum (v sodelovanju z Baylor College of Medicine, Houston, Teksas, ZDA) (Van Driessche in sod., 2005; Juvan in sod. 2005). Razvita je bila tudi metoda za predlaganje dodatnih genetskih eksperimentov z mutanti. d) Analiza strukture genskih regulatornih regij z metodami umetne inteligence, in sicer obdelava genomov S. cerevisae in D. discoideum (Katoh in sod., 2006). Sistem je Program P2-0209 Stran 1 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 vključen v centralni repozitorij podatkov o amebi D. discoideum (www. dictybase.org); e) Razvoj novih metod ocenjevanja atributov (Šikonja in Kononenko 2003; Robnik, 2007) in odkrivanja interakcij med njimi, uporabljenih pri različnih aplikacijah v medicini (Jakulin in sod., 2003) ter metoda za ocenjevanje značilnosti odkritih interakcij. V računsko zelo zahtevni aplikaciji je bil uporabljen superračunalnik MareNostrum v Barceloni obsežno (ang. genome-wide) interakcijsko analizo in odkrivanje modelov genov povezanih z nastankom avtoimunskih bolezni. f) Razvoj metod in orodij za inteligentno dvo- in večdimenzionalno vizualizacijo podatkov, VizRank (Leban in sod., 2006; Demšar in sod., 2007). Ta orodja so bila uporabljena v številnih aplikacijah v praktičnih problemih s področja medicine (določanje vrst tumorjev na podlagi izražanja genov, diagnosticiranje različnih bolezni; Curk in sod., 2005; Leban in sod., 2005; Mramor in sod., 2007) in industrijske proizvodnje (Acroni, Trimo). g) Nadaljevanje razvoja odprtokodnega sistema za strojno učenje in odkrivanje zakonitosti v podatkih Orange. Orange se je uveljavil pri raznih skupinah uporabnikov: (1) služi kot osnovna programska platforma za ta program in druge projekte ter delo skupine, (2) kot orodje za poučevanje na številnih izobraževalnih ustanovah po vsem svetu (sodelavci skupine so pri tem neposredno svetovali ustanovam v Sloveniji, Hrvaški, Italiji, Franciji, ZDA, Japonski, Kubi itd.), (3) farmacevtska industrija (Lek, Astra-Zeneco, Glaxo-Smith-Kline) in druga podjetja (Trimo, Acroni, ...), (4) mnoge raziskovalne inštitucije po vsem svetu, npr. v genetskih raziskavah; h) Teoretična obravnava metod za statistično primerjavo uspešnosti klasifikatorjev (Demšar, 2006). Razvita metoda postaja standardna metoda za primerjavo klasifikatorjev v člankih in konferenčnih prispevkih, ki uvajajo nove metode klasifikacije; i) Razvoj metode za vizualizacijo linearnih klasifikatorjev (naivni Bayes, logistična regresija, linearni podporni vektorji). Metoda nudi podporo področnim ekspertom pri razumevanju razvitih modelov, njihovem primerjanju in razlagi odločitev. Vizualizacija ima velik pomen pri poučevanju teh metod. 2) Metode kvalitativnega sklepanja; programiranje z omejitvami in kombinatorična optimizacija a) Nadaljnji razvoj algoritma za kvalitativno strojno učenje QUIN (vizualizacija, ocenjevanje zanesljivosti, boljša implementacija). b) Razvoj nove metode za strojno učenje, imenovane Q2, ki temelji na pretvorbah med kvalitativnimi in kvantitativnimi predstavitvami. Metoda povezuje algoritme QUIN, QCGrid in Qfilter (Šuc in Bratko, 2003; Šuc in sod., 2004). c) Nov algoritem za določanje kvalitativnih in kvantitativnih parcialnih odvodov Pade, kar omogoča nov pristop k učenje kvalitativnih modelov z raznimi metodami strojnega učenja. d) Nov algoritem za simbolično regresijsko modeliranje z upoštevanjem omejitev Edgar. e) Nov pristop k učenju kvalitativnih modelov iz numeričnih podatkov QING. f) Tehnika dinamičnega določanja globine preiskovanja pri iskanju poti, ki – za ceno predprocesiranja – med iskanjem porabi manj časa in daje boljše rezultate od najboljših drugih metod (Bulitko in sod., 2008). Algoritmi, razviti v okviru točk a-c, so bili uporabljeni v evropskih projektih CLOCKWORK, XPERO in XMEDIA ter pri reševanju več industrijskih problemov in v ekologiji (Žabkar in sod., 2006). Pristopa d in e sta trenutno zanimiva le teoretično. 3) Agentni sistemi in semantični splet a) Reševanje problema učenja strategije igre brez vnaprejšnega poznavanja pravil iz opazovanja večagentega sistema z novim algoritmom MASDA; uspešna uporaba v domenah RoboCup in 3vs2 Keepaway. b) Nova različica prvega splošno dostopnega komercialnega sintetizatorja slovenskega Program P2-0209 Stran 2 od 18 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 govora Govorec; modeliranje naglasov v slovenščini; aplikacija MMC RTV Govorec za branje dnevnih novice slepim in slabovidnim. c) Razvoj metodologije za generiranje semantičnih tabel in ontologij iz tabel v zapisu HTML (Pivk in sod., 2007). d) Raziskave ontologij; algoritem za izračun semantične razdalje na podlagi iskanja najkrajših poti v WordNet; aplikacija v prevajanju med slovenščino in angleščino, avtomatsko razlikovanje med dvoumnimi besedami v slovenščini. e) Skupina metod za analizo gibanja oseb za potrebe ambientalne inteligence. Namenjene so predvsem prepoznavanju neobičajnega obnašanja, ki je lahko npr. znak zdravstvenih težav, in se uporabljajo v projektih CONFIDENCE, PDR in CIVaBiS. Ambientalna inteligenca je relativno novo raziskovalno področje, ki si prizadeva vpeljati inteligentne metode v bivalno okolje, ne da bi z njimi obremenjevala uporabnika. 4) Evolucijsko računanje in preiskovalni algoritmi a) Izpopolnjeni evolucijski algoritem za večkriterijsko optimiranje DEMO, ki temelji na algoritmu diferencialne evolucije. Na to se navezuje vrsta zahtevnih aplikacij: optimizacija procesnih parametrov pri ulivanju jekla (Acroni Jesenice, finska jeklarna Ruukki Steel), optimiranje krojnih slik v tekstilni proizvodnji (Fister in sod., 2008), analiza bioloških sistemov z EPR spektroskopijo in njena uporaba v preiskavah tkiv (Kavalenka in sod., 2005; Štrancar in sod., 2005); b) Nova razlaga patološkega vedenja preiskovalnih algoritmov, pri katerem globlje preiskovanje da slabše rezultate od plitvejšega, ter razlaga uspešnosti algoritma minimaks (Luštrek in sod., 2006). Oboje je bilo podkrepljeno s teoretičnimi in eksperimentalnimi rezultati. c) Odkritje, da za razliko od splošno sprejetih “optimističnih” hevristik v algoritmih prioritetnega preiskovanja (kot je A*) v verzijah teh algoritmov v realnem času (kot sta RTA* in LRTA*) veliko bolje delujejo prav nasprotno “pesimistične” hevristike. d) Metoda za avtomatsko ekstrakcijo hevrističnih funkcij iz tabeliranih baz pozicij v zahtevnih igrah, kot je šah (Sadikov in Bratko, 2006). Kot je razvidno iz naštetega, skupina uspešno razvija nove bazične metode in jih sproti prenaša v domačo in tujo raziskovalno in industrijsko prakso. Odmevnost razvitih metod kažejo številni objavljeni članki, med katerimi naj posebej omenimo članke v najprestižnejših revijah s področja bioinformatike in genetike (Nature Genetics, Bioinformatics). Člani skupine so izdali več knjig pri uglednih tujih založbah, so člani uredništev najuglednejših svetovnih revij in aktivno sodelujejo v odborih vseh pomembnejših konferenc s svojega področja. Skupina ima po metodologiji ARRS (SICRIS, z upoštevanjem deleža soavtorjev članov skupine) 2895 točk v COBISS kategorijah člankov 1.01, 1.02 in 1.03, od tega 1282 točk iz člankov v najvišji SICRIS kategoriji A1. Skupna vrednost publikacij skupine v sistemu SICRIS je 4808 točk (že z upoštevanjem 20% omejitve glede točk kategorije Z2 za tehniko). Pomembna je tudi družbena relevantnost skupine v slovenskem kontekstu. Poleg sodelovanja s številnimi podjetji in državnimi ustanovami (Zavarovalnica Triglav, Telekom Slovenije, DURS, Ministrstvo za javno upravo, Mestna občina Ljubljana, Bolnišnica Slovenj Gradec, Prevent, Amebis, TVM, RTV Slovenija, Acroni, Trimo, Lek, Mura, INEA, ...) je pomemben tudi razvoj metod, povezanih s slovenskim jezikom (sistem Govorec, modeliranje naglasov ipd.), s katerimi skupina prispeva k ohranjanju slovenske samobitnosti, kulture in jezika. Skupina ima značilno izobraževalno poslanstvo. Svoje znanje prenaša na nove generacije raziskovalcev v okviru do- in podiplomskega študija (za statistiko glej glavni del vloge). Poleg tega z različnimi obštudijskimi aktivnostmi, kot je organizacija tekmovanj iz programiranja robotov za študente in poletne šole robotike za srednješolce, popularizira področje umetne inteligence, računalništva in tehnično-naravoslovnih ved na splošno. Skupina je bila zelo uspešna pri pridobivanju projektov v okviru ARRS in MVZT, še posebej pa smo ponosni na veliko število evropskih projektov (CLOCKWORK, ASPIC, X-MEDIA, XPERO, STEROLTALK, ALVIS, WINDECT, We-Go, AgentLink III, APOMAT, IntelliDAM, CONFIDENCE). Skupina se lahko pohvali s številnimi sodelovanji z raziskovalnimi skupinami Program P2-0209 Stran 3 od 18 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 po vsem svetu, tako s področja umetne inteligence kot z drugih področij. V okviru bilateralnih projektov mednarodnega znanstvenega sodelovanja ARRS smo sodelovali oz. sodelujemo s skupinami iz Italije, Francije, Grčije, Portugalske, Španije in ZDA. Skupina in njeni člani so prejeli vrsto domačih in tujih nagrad. Skupina je bila razglašena za najboljšo programsko skupino s področja tehnike v letu 2006. Njen vodja Ivan Bratko je leta 2007 prejel Zoisovo nagrado za svoje vrhunske znanstvene in razvojne dosežke. Dorian Šuc in Aleks Jakulin sta v letih 2002 in 2005 dobila nagradi ECCAI za najboljši evropski doktorat s področja umetne inteligence, Andrej Bratko pa prvo nagrado na konferenci TREC za nov, učinkovit sistem odkrivanja neželene pošte. 3. Ocena stopnje realizacije zastavljenih raziskovalnih ciljev2 Predvideni program dela je bil v celoti izpolnjen. 4. Utemeljitev morebitnih sprememb programa raziskovalnega programa3 5. Najpomembnejši znanstveni rezultati programske skupine4 Znanstveni rezultat 1. Naslov SLO Uporaba abduktivnega sklepanja pri določanju epistaze v funkcijski genomiki ANG Application of abductive reasoning in determination of epistasis in functional genomics Opis SLO Epistaza je eno temeljnih orodij na področju biologije in raziskav genetskih mrež. V Nature Genetics smo prvi objavili ugotovitev, da je moč iz transkripcijskih profilov mutantov sklepati na relacije med geni z avtomatizacijo abduktivnega sklepanja v umetni inteligenci. Članek je bil ob objavi pospremljen s člankom Universal Epistasis Analysis avtorja Tima Hughesa (Nature Genetics) in preglednim člankom Network analysis -Profiling epistasis avtorja Orli Bahcalla (Nature Reviews Genetics). ANG Epistasis analysis is biologist’s principal tool for reconstruction of genetic networks from experimental data. Normally applied to qualitative phenotypes, we have proved that epistasis can be inferred from global transcriptional phenotypes by automated abductive reasoning in Artificial Intelligence. Our work demonstrates that microarray data can provide a uniform, quantitative tool for large-scale genetic network analysis. The paper was featured in reviews by Tim Hughes (in Nature Genetics) and Orli Bahcall (in Nature Reviews Genetics). Objavljeno v Van Driessche N, Demsar J, Booth EO, Hill P, Juvan P, Zupan B, Kuspa A and Shaulsky G. Epistasis analysis with global transcriptional phenotypes. Nature Genetics 37(5): 471-477, 2005. (IF=25.8, X=1/124). Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 4712532 2. Naslov SLO Vizualno programiranje in vizualizacija podatkov z aplikacijami v bioinformatiki ANG Visual programming and data visualization with applications in bioinformatics Opis SLO Na FRI razvijamo odprtokodno programsko okolje Orange (www.ailab.si/orange) za odkrivanje znanj iz podatkov, ki je eno najobsežnejših te vrste v svetu. Okolje vsebuje tudi specializirane module za bioinformatiko, ki biologom in genetikom omogočajo enostavno grafično sestavljanje kompleksnejših postopkov za obdelavo podatkov iz osnovnih Orange-ovih gradnikov. ANG We are developing an open-source data mining framework called Orange (www.ailab.si/orange), which is probably the most comprehensive application of its kind with an interface to popular programming language Python. Together with our international collaborators, Orange was extended Program P2-0209 Stran 4 od 18 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 to provide modules for data analysis in biology and functional genomics. The system enables users who are not programmers to manage microarray and genomic data flow and to customize their analysis by combining common data analysis tools to fit their needs. Objavljeno v Curk T, Demsar J, Xu Q, Leban G, Petrovic U, Bratko I, Shaulsky G, Zupan B. Microarray data mining with visual programming. Bioinformatics 21(3): 396-398, 2005 (IF=6.0, X=1/83) Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 4563284 3. Naslov SLO ANG Aplikacija umetne inteligence pri odkrivanju genetskih mrež Application of Artificial Intelligence to gene network discovery Opis SLO ANG V sodelovanju z raziskovalci na Baylor College of Medicine, Houston, razvijamo sistem GenePath (www.genepath.org), ki lahko iz podatkov o mutantih sklepa o genetskih mrežah. GenePath temelji na formalizaciji sklepanja v genetiki, metodah umetne inteligence in pristopih za razlago odkritega znanja. Revija Science je v številki 302(5647), 2003, podala kratek opis GenePath-a ter ga uvrstila v svoj seznam spletnih aplikacij (Science, NetWatch, Best of the Web). Izboljšave GenePatha smo kasneje objavili še v revijah Artificial Intelligence in Medicine in Nucleic Acid Research. In collaboration with Baylor College of Medicine, Houston, we have developed methods which can infer gene networks from experimental data on mutants (GenePath system, www.genepath.org), using AI techniques and abductive reasoning. The method also proposes experiments which can refine the discovered network. GenePath was reviewed in Science 302(5647), 2003, and enlisted in its NetWatch, Best of the Web directory. Subsequent improvements of the method have been published in Artificial Intelligence in Medicine (2003) in Nucleic Acid Research (2005). Objavljeno v Zupan B, Demšar J, Bratko I, Juvan P, Halter JA, Kuspa A, Shaulsky G. GenePath: a system for automated construction of genetic networks from mutant data. Bioinformatics 19(3): 383-389, 2003 (IF=6.7, X=1/83) Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 3415124 4. Naslov SLO ANG Analiza preiskovalnega algoritma minimaks Analysis of the minimax search algorithm Opis SLO ANG Na algoritmu minimaks temeljijo domala vsi programi za igranje iger. Praksa kaže, da so odločitve, ki jih daje na podlagi globljega preiskovanja, boljše od tistih, ki jih daje na podlagi plitvejšega. Nasprotno pa so prve raziskave dale presenetljiv rezultat, da naj bi veljalo ravno obratno – ta pojav so poimenovali patologija minimaksa. Za patologijo se je pojavilo več razlag, a nobena zares zadovoljiva. Zasnovali smo model preiskovanja, v katerem smo položaje vrednotili z realnimi števili. Za ta model smo pokazali, da pri zelo širokem naboru parametrov ni patološki. Almost all game-playing programs are based on the minimax algorithm. In practice, decisions based on deeper minimax search are better than those based on shallower search. Surprisingly, the first attempts at analysing this phenomenon showed the opposite: shallower search outperform deeper one. This phenomenon was termed the minimax pathology. Several explanations for the pathology have been proposed, but none of them was general. We developed a minimax model in which position values are real-valued. This model turned out not to be pathological for a wide range of parameter settings. Objavljeno v Luštrek M, Gams M, Bratko I. Is real-valued minimax pathological? Artificial Intelligence 170: 620-642, 2006. (IF=2.3, X=12/85) Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 19805735 5. Naslov SLO ANG Argumentirano strojno učenje Argument based machine learning Razvili smo nov pristop k strojnem učenju, ki kombinira klasično strojno učenje in argumentacijo. Pristop se je izkazal za izredno uporabnega na več področjih. Na področju prava smo uporabili metodo argumentiranega Program P2-0209 Stran 5 od 18 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 Opis SLO strojnega učenja za napovedovanje socialne pomoči (objavljeno v Artificial Intelligence and Law), na področju medicine smo z metodo izboljšali model za prognozo bakterijskih okužb, in na področju iger smo metodo uspešno uporabili za avtomatsko zajemanje znanja. ANG Argument-based machine learning (ABML) is an extension of machine learning with some concepts from the field of argumentation. ABML allows domain experts to articulate their background knowledge in a convenient way. It was successfully applied to several completely different domains: in a legal application we modeled the social security benefits (published in Artificial intelligence and law journal, 2005), in a medical application we improved a model for bacterial infections, and in game playing it was used for automated knowledge acquisition. Objavljeno v Možina M, Žabkar J, Bratko I. Argument Based Machine Learning. Artificial Intelligence 171(10/15): 922-937, 2007. (IF=2.3, X=12/85). Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 6240084 6. Najpomembnejši družbeno-ekonomsko relevantni rezultati programske skupine5 Družbeno-ekonomsko relevantni rezultat 1. Naslov SLO Razvoj sistema Orange ANG Development of the system Orange Opis SLO Sistem Orange za strojno učenje (www.ailab.si/orange) je ena največjih odprtokodnih aplikacij v jeziku Python. Orange je popularen pri nas kot po svetu, med uporabniki (akademska okolja, razvojni oddelki podjetij, biomedicinski sektor) kot tudi med razvijalci novih postopkov za analizo podatkov). Sistem je v uporabi v številnih ustanovah po svetu, prispeva k razvoju visokošolskega izobraževanja (G.01), se med drugim uporablja v industriji (n. pr., Trimo, Lek) (G.02.03) in medicini (G.08). V l. 2008 je bilo v svetu instaliranih 10.000 kopij sistema Orange. ANG Our open source framework for data mining Orange (www.ailab.si/orange), has become one of the most comprehensive open source applications in Phyton. Orange is increasingly popular worldwide. There were 10.000 new copies of Orange installed in 2008. It is used in industry (e.g., Trimo, Lek) to lower production costs and in medical institutions (e.g., Ljubljana University Clinics) to increase the quality of decision making in medicine and health protection. Šifra F.06 Razvoj novega izdelka Objavljeno v Najbolj popolna objava sistema Orange je http://www.ailab.si/Orange/. Metoda inteligentne vizualizacije v Orangu je objavljena v: LEBAN, Gregor, ZUPAN, Blaž, VIDMAR, Gaj, BRATKO, Ivan. VizRank : data visualization guided by machine learning. Data mining and knowledge discovery, 2006, vol. 13, no. 2, str. [119]-136. [COBISS.SI-ID 5427284] JCR IF: 2.295, SE (11/85), computer science, artificial intelligence, x: 1.251, SE (9/87), computer science, information systems, x: 1.2 Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 5427284 2. Naslov SLO Pridobitev, vodenje in sodelovanje v številnih aplikativno usmerjenih raziskovalnih projektih ANG Acquisition, coordination and participation in a number of application-oriented reserach projects Opis SLO Pridobitev in vodstvo številnih aplikativno usmerjenih raziskovalnih projektov oz. programov ter pridobitev in koordinacija slovenskega sodelovanja v evropskih projektih. Med temi so: CLOCKWORK, ASPIC, X-MEDIA, XPERO, STEROLTALK, CONFIDENCE, We-Go, ALVIS, v skupni vrednosti deleža slovenskih partnerjev preko 1.5 milijona EUR. Aplikativni rezultati teh projektov se nanašajo na: upravljanje z znanjem (ang. knowledge management, projekti CLOCKWORK, ASPIC, X-MEDIA, ALVIS), biomedicine (STEROLTALK), e-uprave (We-Go) in problematike starajočega prebivalstva (CONFIDENCE). Members of the project team have acquired and are participating in a Program P2-0209 Stran 6 od 18 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 ANG number of European projects, that include CLOCKWORK, ASPIC, X-MEDIA, XPERO, STEROLTALK, CONFIDENCE, We-Go, ALVIS, in the total amount of the Slovenian share exceeding 1.5 million EUR. Applied results of these research projects concern knowledge management (projects CLOCKWORK, ASPIC, X-MEDIA, ALVIS), biomedicine (STEROLTALK), e-government (We-Go), and address the issue of the aging demographics (CONFIDENCE). Šifra F.04 Dvig tehnološke ravni Objavljeno v Glej spletne strani navedenih projektov O projektu XPERO: BRATKO, Ivan. An assessment of machine learning methods for robotic discovery. CIT. J. Comput. Inf. Technol., Dec. 2008, vol. 16, no. 4, str. 247-254, ilustr. [COBISS.SI-ID 6909268] Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 6909268 3. Naslov SLO ANG Razvoj sistema Govorec Development of the system Govorec ("speaker") Opis SLO ANG Sistem Govorec (http://govorec.amebis.si) za sintezo neomejenega slovenskega govora sestavlja več modulov: analiza besedila, nastavljanje prozodičnih parametrov in generiranje govornega signala. Sistem je zasnovan na obsežnih označenih tekstovnih in govornih korpusih ter je rezultat dolgoletnega sodelovanja Odseka za inteligentne sisteme na Institutu "Jožef Stefan" in podjetja Amebis d.o.o. Govorec med drugimi uporabljajo člani Zveze društev slepih in slabovidnih Slovenije. Sistem je bil nagrajen s prvo nagrado Sklada za nagrajevanja inovacij iz področja življenja in dela invalidov. The system Govorec (http://govorec.amebis.si) for text-to-speech synthesis of unlimited Slovene text consists of: text analysis, prosody generation and speech generation. The system is designed on comprehensive tagged text and speech corpora and is the result of long-lasting collaboration between Department of Intelligent Systems (Jožef Stefan Institute) and the company Amebis. Govorec is used in many applications, including Slovenian Association of Blind and Partially Sighted. The system won the first prize for innovation in the field of life improvements for people with disabilities. Šifra F.06 Razvoj novega izdelka Objavljeno v http://govorec.amebis.si Publikacija o sintezi naglasa: TUŠAR, Tea, BRATKO, Andrej, GAMS, Matjaž, ŠEF, Tomaž. Comparison between humans and machines on the task of accentuation of Slovene words. Zbornik 8. mednarodne multikonference Informacijska družba IS 2005, 11. do 17. oktober 2005, 2005, str. 353-356. [COBISS.SI-ID 19381799] Tipologija 2.21 Programska oprema COBISS.SI-ID 19381799 4. Naslov SLO ANG Sistem za filtriranje neželene elektronske pošte A system for filtering spam e-mail Opis SLO Naš sistem je dosegel prvo mesto na na najpomembnejšem mednarodnem tekmovanju za filtriranje neželene elektronske pošte (ang. spam) na konferenci 14th Text REtrieval Conference, TREC 2005. Osnovni namen konference je priprava referenčnih podatkovnih zbirk za standardizirano evaluacijo metod na področju iskalnih tehnologij in procesiranja besedil. Delo je dokumentirano v referatu avtorjev: Bratko A, Filipič B. Spam filtering using character-level markov models: Experiments for the TREC 2005 Spam Track. Proc. 14th Text REtrieval Conference, TREC 2005, NIST, Gaithersburg, MD. Our system was awarded the first prize at the most important international competition in spam e-mail filtering, 14th Text REtrieval Conference, TREC 2005, co-sponsored by the NIST and the U.S. Department of Defense. Its purpose is to establish the infrastructure necessary for large-scale evaluation Program P2-0209 Stran 7 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 ANG of text retrieval methodologies. The contribution is documented in the conference proceedings: Bratko A, Filipič B. Spam Filtering using Character-level Markov Models: Experiments for the TREC 2005 Spam Track. In Proc. TREC 2005, NIST, Gaithersburg, MD, USA. Šifra Objavljeno v Bratko A, Cormack GV, Filipič B, Lynam TR, Zupan B. Spam filtering using statistical data compression models. J. mach. learn. res. 7: 2673-2698, 2006. (IF=2.3, X=4/50). Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 20405287 5. Naslov SLO Prispevki raziskovalne skupine k storitvam e-uprave ANG Contributions to e-government services Opis SLO Sodelovanje pri uvedbi inteligentnega sistema za davčno svetovanje VIDA, vgradnja sistema govorec v portal Ministrstva za javno upravo (MJU), povečanje učinkovitosti e-uprave v okviru mednarodnega projekta We-Go -Povečevanje učinkovitosti e-vlad držav Zahodnega Balkana (FP6-2005-IST-6), 2006-2008. Skupina je preko teh in drugih aplikacij prispevala k uvajanju storitev informacijske družbe in pripomogla k temu, da je Slovenija v treh letih napredovala s 17. na 2. mesto v Evropi glede kvalitete storitev informacijske družbe. ANG Our group contributed to system VIDA - virtual intelligent tax adviser. We also included the Govorec system into the web portal of the Ministry of Public Administration, and participated in the international project We-Go -Increasing efficiency of e-government in Western Balkan countries (FP6-2005-IST-6), 2006-2008. Through these and several other projects we introduced new services in Slovenian information society, and thus helped Slovenia to advance in the quality of public information services from 17th to second place in Europe as reported in one EU public administration study. Šifra F.06 Razvoj novega izdelka Objavljeno v http://vida.durs.si/tax_slovenia/htdocs/html/ GAMS, Matjaž. Projektna dokumentacija in evalvacija sistemov Vida za DURS : pogodba 1612-06-000166. Ljubljana: Institut Jožef Stefan, 2007. 15 str., graf. prikazi. [COBISS.SI-ID 21007655] Tipologija 2.21 Programska oprema COBISS.SI-ID 21007655 7. Pomen raziskovalnih rezultatov programske skupine6 7.1. Pomen za razvoj znanosti7 SLO Ta raziskovalni program je dal raziskovalne prispevke k aktualnim problemom s področja umetne inteligence, ki so pomembni zaradi vpliva in široke uporabnosti te hitro razvijajoče se vede računalništva. Zato ocenjujemo, da bodo rezultati programa pomembno prispevali k razvoju obravnavanih področij umetne inteligence, razvoju praktično uporabnih programskih orodij in potrditvi uporabnosti novih znanstvenih dognanj na praktičnih področjih. Tako je več rezultatov tega programa pomembnih za razvoj področja strojnega učenja v umetni inteligenci, tako v smislu novih pristopov in algoritmov (npr. argumentirano učenje, kvalitativno učenje, učenje Q2, metode inteligentne vizualizacije informacij), kot tudi učinkovitih orodij za praktično uporabo (kot je sistem Orange). Nekatere aplikativno usmerjene raziskave iz strojnega učenja tega programa prispevajo tudi k razvoju drugih znanosti, konkretno npr. na področju genetskih raziskav. Z metodami, razvitimi v okviru tega programa, je mogoče avtomatsko konstruirati nove znanstvene teorije iz eksperimentalnih podatkov (npr. iz rezultatov genetskih eksperimentov). Nekateri znanstveni rezultati tega programa so pomembni tudi za napredek področja preiskovalnih metod v umetni inteligenci. Sem sodi analiza “patologije” pri preiskovalnih algoritmih, pa tudi v tem programu odkriti paradoks, da so v preiskovanju v “realnem času” uspešnejše pesimistične hevristike, za razliko od dosedanjih spoznanj o prednostih optimističnih hevristik v preiskovalnih algoritmih nasploh. Vprašanje, kaj je inteligenca in kako do nje pride, je eno ključnih in vse do danes neodgovorjenih vprašanj, s katerim se ukvarja znanost in filozofija. Nekateri rezultati te Program P2-0209 Stran 8 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 programske skupine prispevajo tudi k odgovoru na to vprašanje, med drugim tudi k oblikovanju filozofskih stališč o vprašanju (ne)možnosti avtomatizacije raziskovanja, posebej avtomatskega postavljanja novih znanstvenih hipotez. Naši rezultati nakazujejo, da je odgovor pozitiven. Razvoj metod v tem raziskovalnem programu ni pomemben samo za napredek računalniških znanosti. Pristopi umetne inteligence, kot so strojno učenje, odkrivanje znanj iz podatkov, zapis in uporaba domenskega znanja, kvalitativno modeliranje in snovanje inteligentnih sistemov, postajajo oz. so že postali ključni del infrastrukture ostalih znanstvenih disciplin, tako naravoslovnih kot družboslovnih. Primeri tovrstnih in nedavnih interdisciplinarnih dosežkov so v funkcionalni genomiki (uporaba hevrističnih postopkov preiskovanja) in moderni pristopi v klinični diagnostiki (napovedni modeli na osnovi izraženosti genov). ANG_____________________________________________________________________________________________________________ This research programme made contributions to several problems of current interest in the area of Artificial Intelligence. These contributions are important because of the impact and high applicability of this area of Computer Science. In our assessment, the results of this programme will significantly contribute to the development of the addressed topics of AI, development of practical programming tools, and confirmation of the applicability in practice of the scientific innovations. A number of results of this program are important for the development of machine learning in AI, both in terms of new approaches and algorithms (e.g. argument-based machine learning, qualitative learning, Q2 learning, methods of intelligent information visualisation), and powerful application tools (such as Orange system). Some of the application-oriented research of this program also contributes to other sciences, concretely for example to genetic research. Methods developed in this programme enable automatic construction of new scientific theories from experimental data (for example from observations from genetic experiments). Some scientific results of this programme are also significant for the progress in the theory of search methods in AI. This includes the analysis of “pathology” in search algorithms, as well as the paradox discovered in this programme, that in “real-time search” pessimistic heuristics are more successful, in contrast to the previously known benefits of optimistic heuristics in search algorithms in general. The question of what intelligence is and how it comes about is a key and yet unanswered question of science and philosophy. Some results of this programme also contribute to this question, and are, among others, relevant to the philosophical question of (im)possibility of automation of research, in particular of automatically constructing new scientific hypotheses. Our results indicate a positive answer to this question. The development of new methods in this programme is not only important for the progress in computer science. Approaches of AI, like machine learning, knowledge discovery in data, representation and use of domain knowledge, qualitative modelling and design of intelligent systems, are becoming, or have become, key part of the infrastructure of other sciences. Examples of recent such advances are in functional genomics (application of heuristic search methods) and modern approaches to clinical diagnosis (prediction models based on gene expression). 7.2. Pomen za razvoj Slovenije5 SLO Ugotovitve našega raziskovalnega dela skušamo v čimvečji meri prenesti tudi v naše okolje. Nekaj takšnih primerov v zadnjih letih: kontrola kvalitete izdelave panelnih plošč v podjetju Trimo, napovedovanje izgleda oblačil na podlagi fizikalnih in mehanskih lastnosti tkanin v podjetju Mura (v sodelovanju s Tekstilnim oddelkom Univ. v Mariboru), sistem za sintezo slovenskega govora GOVOREC, napovedovanje pretoka slovenskih rek. Sistem GOVOREC omogoča računalniško sintezo govora slovenskih besedil. Verjetno najpomembnejša korist tega sistema je pomoč hendikepiranim ljudem v vsakdanjem življenju. Z metodami kvalitativnega modeliranja smo izdelali napovedni model gladine reke Savinje. Ker gre za hudourniško reko, so spremembe gladine zelo hitre. Model lahko služi kot zgodnje svarilo pred poplavami. Poleg raziskovalnega dela skupina skrbi tudi za dodiplomsko in podiplomsko pedagoško delo v okviru Univerze v Ljubljani in deloma tudi Univerze v Mariboru, Univerze v Novi Gorici in Mednarodne podiplomske šole Jožefa Štefana. Knjiga vodje programske skupine Prolog Programming for Artificial Intelligence, prevedena v vrsto jezikov, je v svetu najpogosteje uporabljan učbenik za programski jezik prolog. V okviru programske skupine razvijamo odprtokodno programsko okolje Orange (www.ailab.si/orange) za odkrivanje znanj iz podatkov, ki je eno najobsežnejših te vrste v svetu. Okolje odlikuje vmesnik za vizualno programiranje, ki tudi neračunalničarjem (npr. biologom in genetikom) omogoča enostavno grafično sestavljanje kompleksnejših postopkov za Program P2-0209 Stran 9 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 obdelavo podatkov iz osnovnih, v Orange-u implementiranih gradnikov. V sodelovanju z biologi in genetiki smo v Orange-u razvili tudi module za obdelavo podatkov s področij bioinformatike in funkcijske genomike. Najodmevnejši rezultat tega dela, objavljen v Nature Genetics, je ugotovitev, da je moč iz transkripcijskih profilov mutantov sklepati na relacije med geni (Van Driessche et al., Epistasis analysis with global transcriptional phenotypes, Nature Genetics 37(5): 471-477, 2005). V zadnjih petih letih so si člani programske skupine prislužili kar dve prestižni nagradi (D. Šuc in A. Jakulin) za najboljši evropski doktorat s področja umetne inteligence, ki ga podeljuje ECCAI, the European Coordinating Committee for Artificial Intelligence. ANG_____________________________________________________________________________________________________________ We strive to apply the findings of our research in practice as much as possible. Some examples in recent years: quality control in light construction sandwich panel production at Trimo, predicting the appearance of clothing on the basis of physical and mechanical properties of textiles at Mura (in collaboration with Textile Department at University of Maribor), the system for speech synthesis for Slovenian language GOVOREC, predicting the danger of flooding by Slovenian rivers. System GOVOREC enables computer speech synthesis of Slovenian texts. Most likelz, its biggest contribution is helping handicapped people in their everyday life. With the use of qualitative modelling we constructed a predictive model for the level of Savinja river. Since Savinja is a torrentous river its level can rapidly change. Our model can serve as an early warning system against flooding. Apart from scientific work, the members of the group teach various courses (mostly AI and programming) at the University of Ljubljana and to a lesser extent at the University of Maribor, University of Nova Gorica and the Jožef Stefan International Postgraduate School. The textbook Prolog Programming for Artificial Intelligence by Ivan Bratko, the head of the group, has been translated into a number of languages, and is the most widely used textbook on prolog programming language in the world. We are continuously developing an open-source machine learning suite Orange (www.ailab.si/orange), among the largest of its kind in the world. The suite boasts a graphical user interface that enables visual programming which in turn enables even non-programmers (like experts from other fields, e.g. biologists or geneticists) to create complex procedures from Orange’s numerous basic building blocks. In collaboration with biologists and geneticists we developed Orange modules for processing and analysis of bioinformatics and functional genomics data. The most high-profile result of this work is the finding that it is possible to reason about relations between genes on the basis of transcriptional profiles of mutants (Van Driessche et al., Epistasis analysis with global transcriptional phenotypes, Nature Genetics 37(5): 471-477, 2005). In the last five years the members of the group have earned two prestigious awards for the best European doctoral dissertation in artificial intelligence awarded by ECCAI, the European Coordinating Committee for Artificial Intelligence. 8. Zaključena mentorstva članov programske skupine pri vzgoji kadrov9 Vrsta izobraževanja Število mentorstev Od tega mladih raziskovalcev - magisteriji 13 2 - doktorati 25 14 - specializacije Skupaj: 38 16 9. Zaposlitev vzgojenih kadrov po usposabljanju Organizacija zaposlitve Število Število Število Program P2-0209 Stran 10 od 18 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 doktorjev magistrov specializantov - univerze in javni raziskovalni zavodi 13 5 - gospodarstvo 7 5 - javna uprava - drugo 2 Skupaj: 20 12 0 10. Opravljeno uredniško delo, delo na informacijskih bazah, zbirkah in korpusih v obdobju10 Ime oz. naslov publikacije, podatkovne informacijske baze, korpusa, zbirke z virom (ID, spletna stran) Število * 1. revija Informatica 208 2. revija Informatica Medica Slovenica 30 3. revija IEEE Transactions on Information Technology in Biomedicine 40 4. Urejanje v odborih mednarodnih konferenc: - IJCAI, International Joint Conference on Artificial Intelligence, - AAAI, National Conference on Artificial Intelligence, - ICML, International Conference on Machine Learning - ECML/PKDD, European Conference on Machine Learning and European Conference on Principles and Practice of Knowledge Discovery in Databases, - CEC, IEEE Congress on Evolutionary Computation, - GECCO, Genetic and Evolutionary Computation Conference, - PPSN, International Conference on Parallel Problem Solving from Nature. 150+ 5. Zbornik Proceedings of the 7-11th International Multiconference Information Society IS, 2004-2008 600+ 6. Zbornik Bioinformatika 2005 (slovensko srečanje bioinformatikov) 30 7. Urejanje v vrsti odborov mednarodnih revij: - AI journal, - Journal of Machine Learning Research, - Machine Learning journal, - Intelligent Data Analysis journal, - Applied Intelligence journal, - AI Communications journal, - Knowledge and Information Systems journal, - IJICA, International Journal of Innovative Computing and Applications, - IJCIR, The International Journal of Computational Intelligence Research, - IADIS, International Journal on Computer Science and Information Systems, - Stability and Control: Theory and Applications, - Journal of Computing and Information Technology, - Open AI journal, ter v domači reviji: Quark 70+ 8. Zborniki Proceedings of the International Conference on Bioinspired Optimization Methods and their Applications - BIOMA, v letih 2004, 2006 in 2008 30 9. Zbornik Proceedings of Measuring Energy Fields: International Scientific Conference 34 10. Zbornik Intelligent Data Analysis in Medicine, Stanford 2004 40 Program P2-0209 Stran 11 od 18 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 *Število urejenih prispevkov (člankov) /število sodelavcev na zbirki oz. bazi /povečanje obsega oz. število vnosov v zbirko oz. bazo v obdobju 11. Vključenost raziskovalcev iz podjetij in gostovanje raziskovalcev, podoktorandov ter študentov iz tujine, daljše od enega meseca Sodelovanje v programski skupini Število - raziskovalci-razvijalci iz podjetij 7 - uveljavljeni raziskovalci iz tujine - podoktorandi iz tujine - študenti, doktorandi iz tujine 6 Skupaj: 13 12. Vključevanje v raziskovalne programe Evropske unije in v druge mednarodne raziskovalne in razvojne programe ter drugo mednarodno sodelovanje v obravnavanem obdobju11_________________________________________________________________________________ - ASPIC - Argumentation Service Platform with Integrated Components (IST-002307). FP6 IST Programme project, European Commission, 2004-2007, - X-MEDIA - Large Scale Knowledge Sharing and Reuse Across Media (FP6-26978). FP6 IST Programme project, European Commission, 2006-2010, - XPERO - Learning by Experimentation (IST-29427). FP6 IST Programme project, European Commission, 2006-2009, - STEROLTALK - Functional genomics of complex regulatory networks from yeast to human: cross talk of sterol homeostasis and drug metabolism (FP6-2003-LIFESCIHEALTH-I 512096). 6th EU Framework Programme, 2005-2008, - CONFIDENCE - Ubiquitous Care System to Support Independent Living (FP7-ICT-214986), sistem za stalno skrb, ki omogoča neodvisno življenje, 2008-2011, - Zanesljivo in razumljivo strojno učenje z aplikacijami v medicinski diagnostiki in bioinformatiki. Bilateralni projekt z Univerzo v Ioannini, Grčija, 2005-2007, - Strojno učenje verjetnosti z aplikacijami v spletnih portalih in medicinski diagnostiki (BI-PT/06-07-004). Bilateralni projekt z Univerzo v Portu, Portugalska, 2006-2008, - Metode umetne inteligence za odkrivanje znanj v funkcijski genomiki (BI-IT/05-08-011). Bilateralni projekt z Universita degli studi di Pavia, Italija, 2006-2009, - Odkrivanje znanj in vizualizacija tekstovnih podatkov (PROTEUS 07-08). Bilateralni projekt z institutom “Institut de recherche en informatique et systemes aleatoires - IRISA, Université de Rennes 1” Univerze v Renu, Francija, 2007-2008, - Metode umetne inteligence za odkrivanje znanj v funkcijski genomiki. Bilateralni projekt z Baylor College of Medicine, Houstona, ZDA, 2005-2006, - ALVIS - Superpeer Semantic Search Engine (IST-1-002068-STP), 2004-2006, - WINDECT - Wireless Local Area Network with Integration of Professional Quality DECT Telephony (IST-1-506746-STP), 2004-2006, - We-Go - Enhancing Western Balkan eGovernment Expertise (FP6-2005-IST-6), 2006-2008, - AgentLink III - A Coordination Network for Agent-Based Computing (IST-1-002006-CA), 2004-2005, - APOMAT - Automatic Process Optimization in Materials Technology (COST 526), 2001-2005, - Numerical Optimization of Continuous Casting of Steel (BI-FI/04-05-009), bilateralni projekt z University of Oulu, Finska, 2004-2006, - Nove metode za avtomatsko identifikacijo na osnovi inteligentnih naprav in agentov -IntelliDAM (BI-RO/0809/0015), 2008-2009. 13. Vključenost v projekte za uporabnike, ki potekajo izven financiranja ARRS12 Skupina je vključena v naslednje aplikativne in razvojne projekte z vrsto uspešnih slovenskih podjetij: D Zavarovalnica Triglav, d.d.: sodelovanje z Laboratorijem za informatiko, ULJ, FRI pri uporabi metod odkrivanja znanja iz podatkov (ang. data mining) v sistemu za odkrivanje goljufij Admiral, izdelanim za omenjeno zavarovalnico, D Telekom Slovenije, d.d.: o pregled stanja in funkcionalno-tehnična zasnova celovite platforme Telekoma Slovenije za storitev s področja inteligentnih hiš, Program P2-0209 Stran 12 od 18 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 o sofinanciranje raziskave inteligentnega doma, D Davčna uprava Republike Slovenije (DURS): svetovanje in pomoč pri izvedbi javnega naročila za postavitev in uvedbo informacijskega sistema davčnega pomočnika "Vida," D Ministrstvo za javno upravo (MJU) in SRC.SI, d.o.o.: izvedba prototipa aplikacije sinteze govora Govorec, D Mestna občina Ljubljana: avtomatsko govorno posredovanje informacij občanom preko telefona, D Bolnišnica Slovenj Gradec in Prevent, d.d.: sofinanciranje projekta “Integrirane večpredstavne mobilne aplikacije v bolnišnicah,” D LEK, d.d.: o implementacija sistema za inteligentno proizvodnjo tablet na osnovi dinamičnega spreminjanja parametrov proizvodnje (PAT), o razvoj bioinformatičnih orodij za funkcijsko genomiko, odkrivanje genskih mrež in odkrivanje značilno zastopanih skupin genov (ang. GSEA - gene set enrichment analysis), D ICE, d.o.o.: razvoj tehnologij za predčasno odkrivanje odpovedi naročniškega razmerja v telekomunikaciji. D Amebis, d.o.o. : o razpoznavanje (verifikacija) govorcev v forenzične namene, o sistem Govorec za sintezo slovenskega govora, o sodelovanje pri izgradnji govornih korpusov in morfoloških slovarjev, o avtomatsko govorno posredovanje informacij, D Trimo Trebnje, d.d., projekt qSPAI za kontrolo kvalitete v proizvodnji gradbenih plošč (qSPAI - EUREKA 3540), D Vzdrževanje nadzornih sistemov Stražar za nadzor nad vstopanjem in sistemov Kronos za registracijo prisotnosti na delu (Cinkarna Celje d.d., Dolenjski muzej, DURS Ljubljana, Fotona d.d., Izletnik Celje d.d., Saturnus Avtooprema d.d., Slovenijales d.d., Študentska org. Univerze v Lj., Tektilna tovarna Okroglica d.d., Velana d.d., Slovenijales d.d.), D ARS, d.o.o.: prenos znanja in tehnologije sistemov za nadzor nad vstopanjem, D TVM, d.d.: sodobno računalniško krmiljenje sistemov v avtobusih, D Prevent, d.d.: izvedba študije o kartičnih tehnologijah za osebno identifikacijo in sofinanciranje projekta 6OP WINDECT, D RTV Slovenija: dobrodelni projekt “RTV MMC Govorec,” za branje teleteksta RTV Slovenije za slepe in slabovidne. D INEA, d.o.o., razvoj optimizacijskih algoritmov v projektih energetske učinkovitosti za operaterje elektroenergetskega omrežja in industrijske odjemalce 14. Dolgoročna sodelovanja z uporabniki, sodelovanje v povezavah gospodarskih in drugih organizacij (grozdi, mreže, platforme), sodelovanje članov programske skupine v pomembnih gospodarskih in državnih telesih (upravni odbori, svetovalna telesa, fundacije, itd.)________________________________________________________________________________________ D Slovenska sodišča, tožilstvo: Izvedenska mnenja in arbitražne ekspertize s področja prepoznavanja govorcev, avtentičnosti posnetkov itd.; do sedaj identificiranih že preko 100 govorcev, kar je vplivalo na skrajševanje sodnih zaostankov in izboljšanje kvalitete sojenja. D Dolgoletno sodelovanje s podjetji: Netica d.o.o. (Ljubljana) pri aplikacijah podatkovnega rudarjenja, Inetis d.o.o. (Celje) pri inteligentni analizi podatkov, AZ NET d.o.o. (Mengeš) pri aplikacijah iz medicinske informatike, ADD d.o.o (Ljubljana) pri vrednotenju sistemov za podporo pri odločanju, Terminal One (Avstralija/Monako) pri analizi trgov športnih stav. D Dolgoletno sodelovanje s podjetji: Amebis d.o.o. (Kamnik), Špica International d.o.o. (Ljubljana), kjer je med zaposlenimi v podjetjih nekaj sodelavcev, ki so prešli v gospodarstvo iz skupine, nekateri sodelavci skupine pa so tudi sodelavci teh podjetij. D Sodelavci skupine sodelujejo v vrsti nacionalnih svetov, n. pr., v svetu za informacijsko družbo, znanost in tehnologijo, ter tudi v odboru parlamenta za visoko šolstvo, znanost in tehnologije. Sodelovali smo tudi pri pisanju več nacionalnih strategij razvoja, n. pr., informacijske družbe, ki je bila izhodišče za vpeljavo vrste novih storitev. Z objavo (re)analiz, n. pr., Šanghajske študije ali vplivov znanja na blagostanje države, so sodelavci do zdaj v Sloveniji strokovno podprto pokazali kvaliteto slovenskega visokega šolstva in znanosti ter pomembnost za razvoj Slovenije. Z objektivno analizo demografskih gibanj smo strokovno pokazali na pomembnost demografskega vprašanja. 15. Skrb za povezavo znanja s slovenskim prostorom in za slovensko znanstveno terminologijo (Cobiss tip 1.04, 1.06, 1.07, 1.08, 1.09, 1.17, 1.18, 2.02, 2.03, 2.04, 2.05, 2.06)13 DOVGAN, Erik, FILIPIČ, Bogdan. Evolucijsko optimiranje prevoza Program P2-0209 Stran 13 od 18 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 Naslov raznovrstnega tovora s skupino vozil. Opis Predstavitev optimizacijskega algoritma za transportni problem, razvitega v okviru projekta CRP Znanje za varnost in mir 2006-2008. Objavljeno v Zbornik sedemnajste mednarodne Elektrotehniške in računalniške konference ERK 2008, Portorož. Ljubljana: IEEE Region 8, Slovenska sekcija IEEE, 2008, zv. B, str. 119-122. COBISS.SI-ID 22044711 16. Skrb za popularizacijo znanstvenega področja (Cobiss tip 1.05, 1.21, 1.22, 2.17, 2.19, 3.10, 3.11, 3.12)14 Naslov ŠILC, Jurij, FILIPIČ, Bogdan. Biološka evolucija, družabne žuželke in računalniđka optimizacija. Opis Poročilo o izvedbi 3 mednarodne konference Bioinspired Optimization Methods and their Applications BIOMA 2008 s poljudno predstavitvijo raziskovalnega področja in njegove praktične uporabnosti Objavljeno v Novice IJS, dec. 2008, št. 140, str. 17-18. COBISS.SI-ID 22281255 17. Vpetost vsebine programa v dodiplomske in podiplomske študijske programe na univerzah in samostojnih visokošolskih organizacijah v letih 2004 – 2008 1. Naslov predmeta Principi programskih jezikov in simbolično programiranje Vrsta študijskega programa univerzitetni program Naziv univerze/ fakultete Univerza v Ljubljani, Fakulteta za računalništvo in informatiko 2. Naslov predmeta Umetna inteligenca in simbolično programiranje Vrsta študijskega programa univerzitetni program Naziv univerze/ fakultete Univerza v Ljubljani, Fakulteta za računalništvo in informatiko 3. Naslov predmeta Umetna inteligenca I, Umetna inteligenca II Vrsta študijskega programa univerzitetni program Naziv univerze/ fakultete Univerza v Ljubljani, Fakulteta za računalništvo in informatiko 4. Naslov predmeta Praktikum odkrivanja znanj iz podatkov Vrsta študijskega programa univerzitetni program Naziv univerze/ fakultete Univerza v Ljubljani, Fakulteta za računalništvo in informatiko 5. Naslov predmeta Odločitveni modeli in sistemi Vrsta študijskega univerzitetni program Program P2-0209 Stran 14 od 18 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 programa Naziv univerze/ fakultete Univerza v Ljubljani, Fakulteta za računalništvo in informatiko 6. Naslov predmeta Deklarativno programiranje Vrsta študijskega programa univerzitetni program Naziv univerze/ fakultete Univerza v Ljubljani, Fakulteta za računalništvo in informatiko 7. Naslov predmeta Tehnologija znanja Vrsta študijskega programa univerzitetni program Naziv univerze/ fakultete Univerza v Ljubljani, Fakulteta za računalništvo in informatiko 18. Označite potencialne vplive oziroma učinke vaših rezultatov na navedena področja: Vpliv Ni vpliva Majhen vpliv Srednji vpliv Velik vpliv G.01 Razvoj visoko-šolskega izobraževanja G.01.01. Razvoj dodiplomskega izobraževanja r r r a G.01.02. Razvoj podiplomskega izobraževanja r r r (S G.01.03. Drugo: r r r r G.02 Gospodarski razvoj G.02.01 Razširitev ponudbe novih izdelkov/storitev na trgu r r (S r G.02.02. Širitev obstoječih trgov r r (S r G.02.03. Znižanje stroškov proizvodnje r r (S r G.02.04. Zmanjšanje porabe materialov in energije r (S r r G.02.05. Razširitev področja dejavnosti r r (S r G.02.06. Večja konkurenčna sposobnost r r (S r G.02.07. Večji delež izvoza r a r r G.02.08. Povečanje dobička r a r r G.02.09. Nova delovna mesta r r C r G.02.10. Dvig izobrazbene strukture zaposlenih r r r a G.02.11. Nov investicijski zagon c a r r G.02.12. Drugo: r r r r G.03 Tehnološki razvoj G.03.01. Tehnološka razširitev/posodobitev dejavnosti r r r (S G.03.02. Tehnološko prestrukturiranje dejavnosti r r (S r Program P2-0209 Stran 15 od 18 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 G.03.03. Uvajanje novih tehnologij C r r (S G.03.04. Drugo: r r r r G.04 Družbeni razvoj G.04.01 Dvig kvalitete življenja r r r a G.04.02. Izboljšanje vodenja in upravljanja r r r C G.04.03. Izboljšanje delovanja administracije in javne uprave r r r (S G.04.04. Razvoj socialnih dejavnosti r r (S r G.04.05. Razvoj civilne družbe r r (S r G.04.06. Drugo: r r r r G.05. Ohranjanje in razvoj nacionalne naravne in kulturne dediščine in identitete r r (S r G.06. Varovanje okolja in trajnostni razvoj r a r r G.07 Razvoj družbene infrastrukture G.07.01. Informacijsko-komunikacijska infrastruktura r r r (S G.07.02. Prometna infrastruktura <• r r r G.07.03. Energetska infrastruktura (S r r r G.07.04. Drugo: r r r r G.08. Varovanje zdravja in razvoj zdravstvenega varstva r r r (S G.09. Drugo: r r r r Komentar15 G.1 - Sodelavci so učili oz. učijo na fakultetah FRI, EF, FS, FF Univerze v Ljubljani, Poslovno- tehniški fakulteti Univerze v Novi Gorici, Mednarodni podiplomski šoli Jožefa Stefana, ter več visokih šolah kot VŠUP. G.2 - Preko projektov za gospodarstvo se vpeljuje nove storitve na trg. Primeri: Amebis Govorec govori slovensko v raznih internetnih aplikacijah. Podjetje Špica International vpeljuje inteligentni modul v sistem za kontrolo vstopa. Podjetje Lek vpeljuje inteligentne rešitve pri proizvodnji tablet. Podjetje Telekom Slovenije vpeljuje inteligentni dom. S tem se povečuje kakovost izdelkov in storitev in odpirajo nove možnosti uporabe doma in zunaj. G.3 - S prenosom inteligentnih storitev informacijske družbe v podjetja in tudi v infrastrukturo se vpeljujejo nove informacijske tehnologije. G.4 - Predvsem preko storitev informacijske družbe v javni upravi se je Slovenija povzpela na 2. mesto v Evropi po uradnih meritvah. Z vpeljavo in prilagoditvijo sistema VIDA je DURS s pomočjo sodelavcev programa prvi v Sloveniji vpeljal inteligentno svetovanje kot programsko storitev (agent, vmesnik). Število dosegov se je posamezne mesece povzpelo na nekaj 100.000. G.5 - Z razvojem slovarjev, predvsem fonetičnih, so sodelavci pomagali ustvariti del nacionalne identitete. Z Govorcem, prvim govornim programom v dobrodelni javni uporabi, smo ponudili storitev za nekaj tisoč slepih in slabovidnih slovensko govorečih v Sloveniji in po svetu. Določene aplikacije, kot govorec za RTV teletekst, so posebej prilagojene namenu. Z inteligentno analizo demografskih trendov so sodelavci prvi v Sloveniji pokazali bistveno večjo težo problema in podali izvirne, računalniško generirane predloge za nove ukrepe, ki bodo pomagali v boju proti demografski in nacionalni degradaciji naroda in jezika. G.6 - Posredno se varuje okolje, saj državljani lahko npr. podaljšajo veljavnost vozniškega dovoljenja od doma in jim ni potrebno trošiti bencina za obisk fizične lokacije. Ker je teh Program P2-0209 Stran 16 99 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 storitev nekaj 100, vsako občasno uporablja veliko ljudi, je skupen učinek velik. Podobno pri uporabi sistema VIDA ni potrebno fizično spraševati zaposlenih. G.7 - Program VIDA je eden od primerov izboljševanja infrastrukture, saj omogoča 24/7 pojasnjevanje in svetovanje občanom. V razvoju je tudi inteligentni dom Telekom, ki bo namenjen uporabi v domovih. G.8 - Aplikacije metod umetne inteligence na področju medicine imajo vseskozi osrednjo vlogo pri naših aplikativno usmerjenih raziskavah. C. IZJAVE Podpisani izjavljam/o, da: • so vsi podatki, ki jih navajamo v poročilu, resnični in točni • se strinjamo z obdelavo podatkov v skladu z zakonodajo o varstvu osebnih podatkov za potrebe ocenjevanja, za objavo 5., 6. in 7. točke na spletni strani http://sicris.izum.si/ ter obdelavo teh podatkov za evidence ARRS • so vsi podatki v obrazcu v elektronski obliki identični podatkom v obrazcu v pisni obliki Podpisi: vodja raziskovalnega programa zastopniki oz. pooblaščene osebe raziskovalnih organizacij in/ali koncesionarjev Ivan Bratko in/ali Institut "Jožef Stefan" Univerza v Ljubljani, Fakulteta za računalništvo in informatiko Kraj in datum: Ljubljana 19.4.2009 Oznaka poročila: ARRS_ZV_RPROG_ZP_2008/547 1 Napišite kratko vsebinsko poročilo, kjer boste predstavili raziskovalno hipotezo in opis raziskovanja. Navedite ključne ugotovitve, znanstvena spoznanja ter rezultate in učinke raziskovalnega programa. Največ 21.000 znakov vključno s presledki (približno tri in pol strani, velikosti pisave 11). Nazaj 2 Največ 3000 znakov vključno s presledki (približno pol strani, velikosti pisave 11). Nazaj 3 Samo v primeru bistvenih odstopanj in sprememb od predvidenega programa raziskovalnega programa, kot je bil zapisan v predlogu raziskovalnega programa. Največ 3.000 znakov vključno s presledki (približno pol strani, velikosti pisave 11). Nazaj 4 Navedite največ pet najpomembnejših znanstvenih rezultatov programske skupine, ki so nastali v času trajanja programa v okviru raziskovalnega programa, ki je predmet poročanja. Za vsak rezultat navedite naslov v slovenskem in angleškem jeziku (največ 150 znakov vključno s presledki), rezultat opišite (največ 600 znakov vključno s presledki) v slovenskem in angleškem jeziku, navedite, kje je objavljen (največ 500 znakov vključno s presledki), izberite ustrezno šifro tipa objave po Tipologiji dokumentov/del za vodenje bibliografij v sistemu COBISS ter napišite ustrezno COBISS.SI-ID številko bibliografske enote. Navedeni rezultati bodo objavljeni na spletni strani http://sicris.izum.si/. Program P2-0209 Stran 17 od 18 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 PRIMER (v slovenskem jeziku): Naslov: Regulacija delovanja beta-2 integrinskih receptorjev s katepsinom X; Opis: Cisteinske proteaze imajo pomembno vlogo pri nastanku in napredovanju raka. Zadnje študije kažejo njihovo povezanost s procesi celičnega signaliziranja in imunskega odziva. V tem znanstvenem članku smo prvi dokazali… (največ 600 znakov vključno s presledki) Objavljeno v: OBERMAJER, N., PREMZL, A., ZAVAŠNIK-BERGANT, T., TURK, B., KOS, J.. Carboxypeptidase cathepsin X mediates ß2 - integrin dependent adhesion of differentiated U-937 cells. Exp. Cell Res., 2006, 312, 2515-2527, JCR IF (2005): 4.148 Tipopologija: 1.01 - Izvirni znanstveni članek COBISS.SI-ID: 1920113 Nazaj 5 Navedite največ pet najpomembnejših družbeno-ekonomsko relevantnih rezultatov programske skupine, ki so nastali v času trajanja programa v okviru raziskovalnega programa, ki je predmet poročanja. Za vsak rezultat navedite naslov v slovenskem in angleškem jeziku (največ 150 znakov vključno s presledki), rezultat opišite (največ 600 znakov vključno s presledki) v slovenskem in angleškem jeziku, izberite ustrezen rezultat, ki je v Šifrantu raziskovalnih rezultatov in učinkov (Glej: http://www.arrs.gov.si/sl/gradivo/sifranti/sif-razisk-rezult.asp), navedite, kje je rezultat objavljen (največ 500 znakov vključno s presledki), izberite ustrezno šifro tipa objave po Tipologiji dokumentov/del za vodenje bibliografij v sistemu COBISS ter napišite ustrezno COBISS.SI-ID številko bibliografske enote. Navedeni rezultati bodo objavljeni na spletni strani http://sicris.izum.si/. Nazaj 6 Pomen raziskovalnih rezultatov za razvoj znanosti in za razvoj Slovenije bo objavljen na spletni strani: http://sicris.izum.si Nazaj 7 Največ 4.000 znakov vključno s presledki Nazaj 8 Največ 4.000 znakov vključno s presledki Nazaj 9 Za raziskovalce, ki niso habilitirani, so pa bili mentorji mladim raziskovalcem, se vpiše ustrezen podatek samo v stolpec MR Nazaj 10 Vpisuje se uredništvo revije, monografije ali zbornika v skladu s Pravilnikom o kazalcih in merilih znanstvene in strokovne uspešnosti (Uradni list RS, št. 39/2006,106/2006 in 39/2007), kar sodi tako kot mentorstvo pod sekundarno avtorstvo, in delo (na zlasti nacionalno pomembnim korpusu ali zbirki) v skladu z 3. in 9. členom istega pravilnika. Največ 1000 znakov (ime) oziroma 150 znakov (število) vključno s presledki. Nazaj 11 Navedite oziroma naštejte konkretne projekte. Največ 12.000 znakov vključno s presledki. Nazaj 12 Navedite konkretne projekte, kot na primer: industrijski projekti, projekti za druge naročnike, državno upravo, občine ipd. in ne sodijo v okvir financiranja pogodb ARRS. Največ 9.000 znakov vključno s presledki. Nazaj 13 Navedite objavo oziroma prevod (soobjavo) članov programske skupine strokovnega prispevka v slovenskem jeziku, ki se nanaša na povezavo znanja s slovenskim prostorom in za slovensko znanstveno terminologijo (Cobiss tip 1.04, 1.06, 1.07, 1.08, 1.09, 1.17, 1.18, 2.02, 2.03, 2.04, 2.05, 2.06). Napišite naslov (največ 150 znakov vključno s presledki), kratek opis (največ 600 znakov vključno s presledki), navedite, kje je objavljen/a (največ 500 znakov vključno s presledki) ter napišite ustrezno COBISS.SI-ID številko bibliografske enote. Nazaj 14 Navedite objavo oziroma prevod (soobjavo) članov programske skupine, povezano s popularizacijo znanosti (Cobiss tip 1.05, 1.21, 1.22, 2.17, 2.19, 3.10, 3.11, 3.12). Napišite naslov (največ 150 znakov vključno s presledki), kratek opis (največ 600 znakov vključno s presledki), navedite, kje je objavljen/a (največ 500 znakov vključno s presledki), ter napišite ustrezno COBISS.SI-ID številko bibliografske enote. Nazaj 15 Komentar se nanaša na 18. točko in ni obvezen. Največ 3.000 znakov vključno s presledki. Nazaj Obrazec: ARRS-ZV-RPROG-ZP/2008 v1.00a Program P2-0209 Stran 18 od 18