Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 Oznaka poročila: ARRS_ZV_RPROG_ZP_2008/1220 ZAKLJUČNO POROČILO O REZULTATIH RAZISKOVALNEGA PROGRAMA V OBDOBJU 2004-2008 A. PODATKI O RAZISKOVALNEM PROGRAMU 1. Osnovni podatki o raziskovalnem programu Šifra programa P2-0103 Naslov programa Tehnologije znanja Vodja programa 8949 Nada Lavrač Obseg raziskovalnih ur 51.000 Cenovni razred C Trajanje programa 01.2004 - 12.2008 Izvajalke programa (raziskovalne organizacije in/ali koncesionarji) 106 Institut "Jožef Stefan" 1540 Univerza v Novi Gorici B. REZULTATI IN DOSEŽKI RAZISKOVALNEGA PROGRAMA 2. Poročilo o realizaciji programa raziskovalnega programa1 Tehnologije znanja predstavljajo pomemben del tehnologij, potrebnih za razvoj informacijske in na znanju temelječe družbe. Področja raziskav tehnologij znanja (TZ) sodijo na širše področje računalništva in informacijskih tehnologij. Realizacija programa je v letih 2004-2008 dosegla cilje iz predloga programa in jih na številnih področjih znatno presegala. Najpomembnejši presežki vključujejo izjemno uspešnost pri pridobivanju sredstev iz mednarodnih projektov, uspešnost znanstvenih dosežkov in odmevnost našega dela (visoka citiranost objav, velik obisk naših spletnih portalov), veliko vpetost v dodiplomsko in podiplomsko izobraževanje ter izdaja učbenika s področja podpore odločanju, velik vpliv na varovanje kulturne dediščine, močno povezanost z uporabniki raziskav in uspešno vključenost aplikativnih raziskav v sodobne vsebine in področja aplikacij (v bioinformatiki, medicini, agronomiji in upravljanju z okoljem). V programu smo izvajali raziskave na naslednjih področjih TZ: (a) inteligentna analiza podatkov (strojno učenje, rudarjenje podatkov in odkrivanje zakonitosti v podatkovnih bazah, induktivne baze podatkov), (b) analiza večpredstavnih (tekstovnih, slikovnih, spletnih) podatkov in semantični splet, (c) jezikovne tehnologije in računalniško jezikoslovje, (d) računalniška podpora odločanja in (e) upravljanje znanja. V programu smo bili uspešni tudi v razvoju aplikacij tehnologij znanja na naslednjih področjih: (1) znanosti o okolju in upravljanja z okoljem, (2) kmetijstvo, gozdarstvo in prehrana, (3) medicina in zdravstveno varstvo, (4) biomedicina s poudarkom na bioinformatiki in sistemski biologiji, manjši del aplikativnih raziskav pa je bil namenjen tudi razvoju na področju (5) ekonomije in marketinga, mrežnih organizacij, virtualnih skupnosti, e-poslovanja in e-založništva. V nadaljevanju je podan pregled dela programske skupine, zbranega po področjih raziskav. Na področju inteligentne analize podatkov smo razvili vrsto novih metod, ki smo jih uporabili na različnih problemih znanosti o okolju in upravljanja z okoljem, na področju medicine in zdravstvenega varstva, na področju ekonomije in marketinga. Izpostavimo sledeče Program P2-0103 Stran 1 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 dosežke: • Razvili smo induktivne baze podatkov, ki poleg podatkov vsebujejo tudi vzorce (pravila, zakonitosti), ki veljajo za podatke v bazi; z induktivnim povpraševanjem iz takih baz dobimo veljavne vzorce, ki ustrezajo omejitvam, ki jih poda uporabnik. V okviru evropskega projekta IQ, ki ga koordiniramo, smo razvili več metod za analizo podatkov z omejitvami, predvsem metode za učenje dreves in pravil za napovedno razvrščanje več ciljnih spremenljivk in strukturi ranih objektov. Med poglavitne dosežke na tem področju uvrščamo razvite metode za učenje dreves za napovedno razvrščanje (DNR) s preiskovanjem v snopu, upoštevanje omejitev pri razvrščanju posamičnih podatkov v skupine z DNR, učenje modelnih dreves ter učenje ansamblov (množic) DNR za hkratno napovedovanje več ciljnih spremenljivk, učenje DNR za razvrščanje kratkih časovnih vrst, učenje pravil za napovedno razvrščanje in algoritem za polinomsko regresijo več ciljnih spremenljivk. Razvite postopke smo uporabili pri analizi podatkov v medicini (npr. podatki o embrionalnih tumorjih v sklopu evropskega projekta E.E.T. Pipeline), bioinformatiki (napovedovanje funkcij genov) in znanosti o okolju (več problemov, npr. modeliranje habitatov). • Razvili smo nove pristope za podporo odkrivanja znanstvenih zakonitosti (angl. computational scientific discovery), posebej na področju procesnega modeliranja dinamičnih sistemov z avtomatskim odkrivanjem kvantitativnih zakonitosti, izraženih v obliki enačb. Uredili smo knjigo (založnik je Springer), ki povzema najnovejše svetovne raziskave na tem področju. • Razvili smo metode za odkrivanje podskupin ter metode za analizo strukturi ranih in večrelacijskih podatkov z uporabo predznanja z aplikacijami na področju medicine, zdravstvenega varstva in bioinformatike. • Razvili smo nov algoritem za koristnostno podatkovno rudarjenje (high utility frequent itemset mining), ki je bistveno hitrejši od obstoječih algoritmov. • Algoritem za učenje Ripple-Down pravil smo bistveno pohitrili ter prilagodili za potrebe uporabe v večjezičnem lematizatorju besedil. • Algoritem za odkrivanje podskupin smo prilagodili za potrebe iskanja kontrastnih množic na dva načina: z obravnavo ciljnega razreda nasproti vsem drugim razredom (one-versus-all) in posebej nasproti vsakemu drugemu razredu (Round-Robin), ter pristopa ovrednotili na medicinski aplikaciji. • Razvili smo prototip sistema za optimizacijo števila testov pri načrtovanju mikromrež za testiranje hrane in krme na vsebnost gensko spremenjenih organizmov. • Posebej velja omeniti naslednji dosežek: s propozicionalizacijskim pristopom k analizi strukturi ranih podatkov smo na področju analize DNK mikromrež razvili metodo za razlago izraženosti genov na osnovi njihove funkcije, procesov in interakcij z uporabo predznanja v obliki ontologij. • V dveh domačih projektih smo razvijli metode za obdelavo in analizo LIDAR-skih (3D) podatkov za potrebe gozdarstva. Razvili smo nov algoritem za izračun reliefa tal pod vegetacijskim pokrovom in posledično za izračun lastnosti vegetacije (višina in sklep vegetacijskega pokrova). Praktično uporabnost metodologije smo izjemno povečali z uporabo strojnega učenja za oceno lastnosti vegetacije direktno iz relativno cenejših satelitskih posnetkov. • V sklopu dveh domačih in dveh evropskih projektov (ECOGEN in SIGMEA) smo na problemih s področja gensko spremenjenih organizmov (tako poljščin (koruza, oljna ogrščica) kot dreves) praktično uporabili postopke odkrivanja znanja iz podatkov (npr. za modeliranje opraševanja) kakor tudi postopke podpore odločanja. Na področju analize večpredstavnih podatkov, besedil in svetovnega spleta smo razvili vrsto novih metod. Gre predvsem za metode analize slabo strukturi ranih ali nestrukturiranih podatkov na osnovi odkrivanja znanja iz besedil in svetovnega spleta, semantičnega spleta, analize omrežij, vizualizacije podatkov (besedil, omrežij) in analize naravnega jezika. • Razvili smo metode in prototipne sisteme za vizualizacijo besedil, vrednotenje ontologij, gradnjo ontologij iz besedil, profiliranje uporabnikov ter gradnjo ontologije kompetenc virtualnih mrežnih organizacij. Posebej velja omeniti interaktivni sistem OntoGen za (pol) avtomatsko učenje ontologij na osnovi korpusa dokumentov in za gradnjo ontologij iz socialnih omrežij. Gradnjo ontologij smo razširili tudi na velike količine zaporednih podatkov (angl., stream mining and stream ontologies) in podprli različne poglede na iste podatke (angl., simultaneous ontologies). Razvite pristope smo testirali na izbranih aplikacijah iz evropskega IP projekta 6.OP SEKT. Razviti sistem za gradnjo ontologij smo v sodelovanju s nemškim podjetjem OntoPrise integrirali v njihov komercialni produkt za Program P2-0103 Stran 2 od 23 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 gradnjo ontologij OntoStudio. • Razvili smo metode za obravnavo slovenskega jezika pri analizi besedil v okviru semantičnega spletnega iskalnika (STREP projekt 6.OP ALVIS). • Nova področja raziskav nam omogoča tudi tesno sodelovanje z ameriškim podjetjem CyCorp, ki je v zadnjih 20 letih razvilo v svetovnem merilu največjo bazo splošnega znanja (angl. common-sense knowledge). • Razvili smo pristop za analizo časovnih grafov TimeFall in učinkovito implementacijo algoritmov za risanje grafov vključno z interaktivnim risanjem zelo velikih grafov. • Razvili smo pristop za napovedovanje strukturnih sprememb ontologije (dodajanje novega koncepta) z uporabo metod strojnega učenja. • Razvili smo pristop za uporabo velikih ontologij kot konteksta, ki omogoča učinkovito izvedbo osnovnih operacij na ontologiji. • Razvili smo sistem za vizualizacijo ontologij v kontekstu podanega ozadja (landscape). • Razvili smo pristop za analizo programske opreme (software-mining) z odkrivanjem znanja iz izvorne kode in dokumentacije na osnovi metod analize besedil in analize povezav (text mining and link analysis). • Razvili smo sistem SearchPoint za pregledovanje rezultatov iskalnika v kontekstu obstoječe ontologije ali klasifikacijske sheme. Na področju jezikovnih tehnologij smo izpopolnili računalniške metode obravnave slovenščine in drugih jezikov, izdelali več eno- in večjezičnih korpusov in slovarjev, ter nadaljevali delo na področju digitalnih knjižnic. Glavni dosežki na tem področju so bili: • Sodelovanje z ZRC-SAZU pri postavitvi digitalne knjižnice e-ZISS, ki ponuja izbrana slovenska besedila v integraciji faksimilov, prepisov in znanstvenega komentarja, mestoma tudi avdiovizualnih posnetkov; knjižnica vključuje tudi Brižinske spomenike, ki so bili izdani kot monografija. • Izdelava prototipnega semantičnega leksikona slovenskega jezika po modelu WordNet in prototipnega skladenjsko označenega korpusa slovenskega jezika SDT. • Sodelovanje pri izdaji 600M besed velikega referenčnega korpusa slovenskega jezika FidaPLUS. in 1M besed velikega oblikoslovno označenega korpusa JOS. • Izdelava 10M besed velikega angleško-slovenskega vzporednega korpusa aktov pravnega reda EU, sodelovanje z EU JRC pri izdelavi 1000M besed velikega 22-jezičnega vzporednega korpusa JRC-ACQUIS in sodelovanje pri izdelavi SEE-ERA.NET 5M besed velikega petjezičnega korpusa. • Sodelovanje s FF in Tokyo International University pri izdelavi elektronskega japonsko-slovenskega slovarja za študente japonščine in pri izdelavi 400M besed velikega japonskega korpusa jpWac. • Razvoj lematizatorja za slovenščino z uporabo metod strojnega učenja, ki je vključen tudi kot sestavni del ALVIS linije za procesiranje naravnega jezika pri iskalniku, rezultiral pa je tudi v publikaciji več člankov v odmevnih revijah (AAI, AIComm). Pri podpori odločanja je dolgoročni cilj razvoj metod in tehnik večparametrskega modeliranja, njihova realizacija v obliki predmetno usmerjene programske opreme ter povezovanje le-te s sistemi za rudarjenje podatkov. Razvili smo več metod, s katerimi smo obogatili našo osnovno metodologijo in aktivno prenašali razvite metode in orodja v prakso. • Razvili smo metodo za revizijo verjetnostnih večparametrskih modelov s pomočjo podatkov. • Implementirali smo sistem proDEX kot orodje za uporabo verjetnostnih večparametrskih modelov. Mehanizmi modeliranja negotovosti, ki jih slednji podpirajo, so bistveni pri modeliranju zapletenih odločitvenih problemov, npr. na področju upravljanja z okoljem in v kmetijstvu. Sistem proDEX smo prototipno vključili v sistem za odkrivanje znanja iz podatkov Orange. • Razvite metode in orodja smo uspešno uporabili v okviru evropskih projektov ECOGEN in SIGMEA. Oba projekta sta se ukvarjala z analizo ekoloških in ekonomskih učinkov uporabe gensko spremenjenih posevkov na okolje ter z raziskavami sožitja konvencionalnih in gensko spremenjenih poljščin. Projekt ECOGEN se je zaključil s publikacijami v odmevni reviji Pedobiologia, v katerih smo opisali naše modele za vrednotenje kakovosti prsti in rezultate analiz podatkov o vplivih agronomskih praks na biološke združbe v prsti. V okviru projekta SIGMEA smo razvili eksperimentalni računalniški program pSMAC, ki ocenjuje možnosti sožitja med konvencionalno in gensko spremenjeno koruzo na ravni posameznih polj. • Prenos metod v prakso na področju spremljanja in vrednotenja portalov življenjskih Program P2-0103 Stran 3 od 23 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 situacij (v sodelovanju s FU). Razvite metode so bile uporabljene še v sistemih za nadzor in vodenje prometa (DARS), pri izbiri podobe slovenskih kovancev (Banka Slovenije) in pri vrednotenju kvalitete izobraževalnih programov (projekt QiS). • Izšel je univerzitetni učbenik z naslovom Odločanje in modeli, v katerem smo opisali svoje dolgoletne izkušnje na področju podpore odločanja. • Izpopolnili smo računalniški program za simbolično večparametrsko odločanje DEXi. Omogočili smo izgradnjo splošnih hierarhičnih modelov in s tem razširili izrazno moč njegovih modelov. Program ima tudi izboljšane možnosti izmenjave podatkov in priprave poročil. DEXi 2.0 je brezplačno dostopen preko spleta. V tem okviru sta bila razvita tudi dva pomožna računalniška programa, DEXiEval za vrednotenje variant in DEXiTree za risanje strukture večparametrskih modelov. • Opravili smo dve praktični aplikaciji metod večparametrskega modeliranja na področjih ravnanja z odpadno električno in elektronsko opremo (v sodelovanju z Gorenjem, d.d.) in vrednotenja prostorskih rešitev pristanišča (Luka Koper). • Razvili smo metodologijo za ocenjevanje kvalitete projektov, ki bo uporabljena v projektu Healthreats. Področje upravljanje znanja obsega aktivnosti povezane s pridobivanjem, uporabo, prenosom in hranjenjem znanja. Na tem področju so naše raziskave usmerjene v razvoj novih konceptualnih in organizacijskih modelov upravljanja znanja za nove tipe organizacij (virtualna podjetja, mrežne organizacije in virtualne skupnosti) in v razvoj tehnologij za podporo upravljanja znanja. Glavni dosežki so: • Prenos metod v prakso na področju načrtovanja zdravstvene mreže Republike Slovenije (projekta MediNet in MediNet+), kjer smo baze podatkov o zdravstvenem varstvu slovenskega prebivalstva obdelali s sodobnimi metodami analize in rudarjenja podatkov ter jih nadgradili z metodami podpore odločanja, vizualizacije in geografskih informacijskih sistemov. Na tej osnovi smo Ministrstvu za zdravje predlagali konkretne izboljšave mreže zdravstvenih delavcev Slovenije. • V sklopu projekta ECOLEAD (European collaborative networked organizations leadership initiative) smo sodelovali pri razvoju generičnega referenčnega modela za mrežne organizacije. Razvita orodja smo testirali v realnih okoljih evropskih mrežnih organizacij, ki so partnerice projekta. • V sklopu projekta E4 (Extended Enterprise management in Enlarged Europe) razvijamo skupaj s partnerji celovit nabor orodij za podporo kolaborativnega upravljanja znanja. • V sklopu projekta Tool-East (Open Source Enterprise Resource Planning and Order Management System for Eastern European Tool and Die Making Workshops) smo razvili in implementirali portal z vrsto orodij za podporo kolaborativnega dela evropskih proizvajalcev orodij. • V sklopu projekta IST-World smo združili večino tehnologij, ki smo jih razvili v dosedanjem delu, v enovit spletni servis za avtomatsko zbiranje in analizo informacij o Evropskem raziskovalnem prostoru (ERA). Razvili smo tudi novo metodo za povezovanje zapisov v podatkovni bazi (record linkage) na osnovi metod strojnega učenja. • Razvili smo spletni portal Videolectures.net, ki je postal referenčni videoportal s prostim dostopom do izobraževalnih vsebin. Zaradi popularnosti portala in naše strategije ponujanja neomejenega dostopa do velikih količin kvalitetnih video izobraževalnih vsebin smo že sklenili dogovore o sodelovanju z University of Cambridge (UK), University of Oxford (UK), Carnegie Mellon University (ZDA), European association of business schools (BE) ter z vrsto evropskih raziskovalnih projektov. Realizacija ciljev programa Tehnologije znanja bistveno presega cilje iz predloga programa, kar je bilo omogočeno z dodatnimi sredstvi pridobljenimi iz evropskih virov. AD 5.10: Popolni podatki o vpetosti programa v dodiplomske in podiplomske študijske programe na univerzah in samostojnih visokošolskih organizacijah v letih 2004-2008 NASLOV PREDMETA V PROGRAMA NAZIV UNIVERZE/FAKULTETE Novi mediji in jezikovne tehnologije podiplomski Mednarodna podiplomska šola Jožefa Stefana Odkrivanje in upravljanje znanja v e- podiplomski znanosti Novi mediji in upravljanje znanja podiplomski Sistemi in tehnike za podporo odločanja podiplomski Program P2-0103 Stran 4 od 23 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 Odkrivanje znanja iz okoljskih podatkov Izbrane teme iz novih medijev in e- znanosti Standards for digital encoding Annotating language data Introduction to Human Language Technologies Jezikovne tehnologije Upravljanje znanja Metode in sistemi za podporo odločanja Poslovni informacijski sistemi Odkrivanje zakonitosti v podatkih Obdelava ekoloških podatkov z metodami strojnega učenja Obdelava ekoloških podatkov z metodami strojnega učenja Ekologija Sistemska ekologija Osnove računalništva za jezikoslovce Računalniško jezikoslovje Uvod v korpusno jezikoslovje Podatkovno rudarjenje in odkrivanje zakonitosti v podatkih Sistemi za podporo odločanja v upravi Računalniska omrežja in storitve Poslovni ekspertni sistemi Sistemi za podporo odločanju Metode umetne inteligence Podatkovno rudarjenje na spletu Decision Support and Decision Modeling Statistički modeli za dubinsku analizu podataka Environmental Data Mining Relational Data Mining Modelling Methods in Systems Ecology podiplomski podiplomski dodiplomski dodiplomski dodiplomski dodiplomski podiplomski podiplomski dodiplomski podiplomski podiplomski dodiplomski dodiplomski podiplomski dodiplomski podiplomski dodiplomski podiplomski podiplomski podiplomski dodiplomski dodiplomski podiplomski podiplomski podiplomski podiplomski podiplomski podiplomski podiplomski Univerza Karl-Franzens, Graz Univerza v Novi Gorici Univerza v Ljubljani, Filozofska fakulteta Univerza v Ljubljani, Fakulteta za družbene vede Univerza v Ljubljani, Fakulteta za upravo Univerza v Mariboru, Pedagoška fakulteta Univerza v Mariboru, Fakulteta za organizacijske vede Univerza na Primorskem, Fakulteta za matematiko, naravoslovje in informacijske tehnologije Albert- Lud wigs-Universität Freiburg Fakultet elektrotehnike i računarstva, Univerza v Zagrebu University of Trento University of Madrid Ecole Nationale Supérieure d'Agronomie et des Industries Agroalimentaires (ENSAIA), Nancy, France 3. Ocena stopnje realizacije zastavljenih raziskovalnih ciljev2 Glavni cilji programa so bili razvoj novih metod, tehnik in orodij za inteligentno analizo podatkov, jezikovne tehnologije in računalniško jezikoslovje, podporo odločanja in upravljanje znanja. Glavno področje dela so bile raziskave in razvoj metod inteligentne analize podatkov, tj., metode strojnega učenja, rudarjenja podartkov in odkrivanja zakonitosti v podatkih ter rudarjenje tekstovnih, spletnih in multimedijskih vsebin. Glavni cilji programa so bile vrhunske raziskave in razvoj aplikacij tehnologij znanja, njihov prenos v tehnološko, poslovno, upravno in družbeno okolje ter izobraževanje kadrov na področju tehnologij znanja. Programska skupina Tehnologije znanja je dosegla zadane cilje znanstvene odličnosti na področju razvoja in aplikacij tehnologij znanja, vključno z objavami v vrhunskih znanstvenih revijah. Rastoči trend števila objav v WoS in njihova visoka citiranost Program P2-0103 Stran 5 od 23 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 odražata kvaliteto znanstvenega dela programske skupine. Razvili smo tudi večje število inovativnih programskih rešitev. Prejeli smo nagrado za najboljšo programsko rešitev OntoGen na konferenci s področja svetovnega spleta (European Semantic Web Conference, 2006), našemu študentu je bila v letu 2007 za večjezični lematizator podeljena univerzitetna Prešernova nagrada. Skupina je bila tudi izjemno aktivna na pedagoškem področju ter izjemno uspešna na področju mednarodnega sodelovanja in črpanja/uporabe sredstev evropskih projektov, v sodelovanju z mednarodnimi znanstvenimi skupinami. Na tem področju smo bili najuspešnejša slovenska programska skupina, saj smo koordinirali en EU projekt, sodelovali v šestih integriranih projektih, v več mrežah odličnosti ter v vrsti STREP projektov. Ugotavljamo, da smo bistveno presegli zastavljene cilje programske skupine, da imamo stabilno finančno stanje, proaktivne sodelavce, aktivno mednarodno sodelovanje in širok nabor zanimivih raziskovalnih tematik za raziskave v naslednjem petletnem obdobju. 4. Utemeljitev morebitnih sprememb programa raziskovalnega programa3 Na programu ni bilo bistvenih sprememb, razen bistveno povečanega obsega opravljenih raziskav. 5. Najpomembnejši znanstveni rezultati programske skupine4 Znanstveni rezultat 1. Naslov SLO Nove metode, orodja in aplikacije odkrivanja podskupin v podatkih ANG New methods, tools and applications of subgroup discovery in data Opis SLO Razvili smo metode za odkrivanje podskupin v podatkih SD, CN2-SD in APRIORI-SD, ki temeljijo na algoritmih za učenje klasifikacijskih pravil in povezovalnih pravil. Glavni metodološki pomen dosežka so novi algoritmi, nove metode ocenjevanja kvalitete podskupin ter teoretska analiza in zbirka praktičnih napotkov kako te metode uporabiti v praksi. Algoritme, implementirane kot del odprtokodnega orodja za rudarjenje podatkov Orange, smo uspešno uporabili na področju marketinga, na področju biomedicine za analizo mikromrež ter na področju medicine za določanje rizičnih skupin za koronarne bolezni. ANG We have developed new methods and tools for subgroup discovery, SD, CN2-SD and APRIORI-SD, based on algorithms for learning classification and association rules. The main methodological achievement are new machine learning algorithms for discovering subgroups, new methods for evaluating the quality of subgroups and the theoretical analysis with a collection of advice for using these methods in practice. We have applied the algorithms in the area of marketing, in biomedicine for analyzing microarrays and in medicine for determining risk groups for coronary disease. Objavljeno v LAVRAČ, Nada, KAVŠEK, Branko, FLACH, Peter A., TODOROVSKI, Ljupčo. Subgroup discovery with CN2-SD. J. mach. learn. res., 2004, vol. 5, str. 153-188, JCR IF: 5.952 Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 18092839 2. Naslov SLO Nove metode, orodja in aplikacije relacijskega rudarjenja podatkov ANG New methods, tools and applications of relational data mining Opis SLO Razvili smo metodo RSD za odkrivanje zakonitosti v večrelacijskih podatkovnih bazah in jo uspešno uporabili za analizo mutagenosti molekul, analizo telekomunikacijskih podatkov in za virtualno načrtovanje za potrebe avtomobilske industrije. Metodo RSD smo dopolnili tako, da lahko uporabi predznanje v obliki ontologij (npr. ontologija genov GO) in jo uporabili za analizo mikromrež v bioinformatiki. Pomembnost dosežka za bioinformatiko Program P2-0103 Stran 6 od 23 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 ANG je novost, da lahko v postopek učenja učinkovito vključimo ogromno količino biološkega znanja, ki je javno dostopno na svetovnem spletu. We have developed relational subgroup discovery (RSD) data mining method for discovering regularities in multi-relational databases and applied this method in analyzing the mutagenicity of molecules, analyzing telecommunications data and in virtual design of automobile parts. The RSD method was extended with the ability to use domain knowledge in the form of ontologies (eg. the GO gene ontology) and used to analyze microarrays. The importance of this achievement for bioinformatics is in efficient inclusion of biological knowledge, publicly available on the Web, into automatic learning process. Objavljeno v ŽELEZNÝ, Filip, LAVRAČ, Nada. Propositionalization-based relational subgroup discovery with RSD. Mach. learn. 2006, vol. 62, no. 1-2, str. 33-63, JCR IF: 2.654. Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 19724583 3. Naslov SLO ANG Nove metode, orodja in aplikacije odkrivanja enačb in procesnega modeliranja dinamičnih sistemov New methods, tools and applications of equation discovery and process-based modelling of dynamic systems Opis SLO ANG Preboj na področju odkrivanja enačb, ki sodi v širše področje računalniške podpore znanstvenim odkritjem, je bil dosežen z omogočanjem odkrivanja algebraičnih in navadnih diferencialnih enačb z upoštevanjem domenskega znanja. Novost raziskav je tudi uvedba novega formalizma za predstavitev domenskega znanja za modeliranje dinamičnih sistemov, ki temelji na modeliranju procesov, razvoj metode za uporabo domenskega znanja ter njena uporaba za modeliranje vodnih ekosistemov. Uredili smo knjigo "Computational Discovery of Scientific Knowledge", ki nudi pregled tega raziskovalnega področja. The development of equation discovery systems is a breakthrough research achievement as our systems can discover algebraic, ordinary and partial differential equations; they can also take into account existing domain knowledge. We have introduced a formalism for representing domain knowledge for modelling dynamic systems, based on the notion of processes, developed methods for using such domain knowledge and used them to model aquatic ecosystems. We have co-edited the book "Computational Discovery of Scientific Knowledge" which represents a reference state-of-the-art survey in this area. Objavljeno v BRIDEWELL, Will, LANGLEY, Pat, TODOROVSKI, Ljupčo, DŽEROSKI, Sašo. Inductive process modeling. Mach. learn. 2007, JCR IF : 2.654. Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 21312295 4. Naslov SLO ANG Nove metode in orodja za odkrivanje znanja iz tekstovnih podatkov in semantične spletne aplikacije. New methods and tools for discovering knowledge from text data and semantic Web applications Opis SLO ANG Razvili smo nove metode odkrivanja znanja iz tekstovnih podatkov, med njimi sistem OntoGen za (pol)avtomatsko gradnjo ontologij na osnovi korpusa dokumentov, metodo za gradnjo ontologij iz socialnih omrežij, metodo za učinkovito vstavljanje primerov v ontologijo, metodo za obravnavo neoznačenih podatkov z metodami aktivnega učenja, za obravnavo konteksta pri učenju ontologij ter metodo za vizualizacijo korpusov besedil. Metode smo vključili v našo javno dostopno knjižnico programov TextGarden. Sistem OntoGen je junija 2006 prejel nagrado na konferenci 3rd European Semantic Web Conference. We have developed new methods of knowledge discovery from text: the system OntoGen for (semi)automatic ontology building from a corpus of documents, a method for building ontologies from social networks, a method of efficient insertion of examples into ontologies, a method of handling unmarked data with active learning methods, a method of dealing with context in ontology learning and a method of vizualising text corpora. The methods are included in our publicly available library of programs TextGarden. OntoGen received the best system prize at the 3rd European Program P2-0103 Stran 7 od 23 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 Semantic Web Conference. Objavljeno v GROBELNIK, Marko, MLADENIĆ, Dunja. Automated knowledge discovery in advanced knowledge management. J. knowl. manag., 2005, vol. 9, str. 132-149. Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 19498279 Naslov SLO Nove metode, orodja in aplikacije za kvalitativno večparametrsko odločitveno modeliranje. ANG New methods, tools and applications of qualitative multiparametric decision modelling Opis SLO Razvili smo metode in orodja za podporo odločanju s kvalitativnim večparametrskim modeliranjem. Osnovno metodo DEX smo razširili z možnostjo dela s pravimi hierarhijami. Izšla je knjiga Odločanje in modeli, ki opisuje naše dolgoletne izkušnje na tem področju. Razvili smo metode revizije odločitvenih modelov in jih realizirali v sistemu proDEX. Praktično uporabnost naših metod dokazujejo številne aplikacije: na področju analize učinkov uporabe gensko spremenjenih rastlin, v sistemih za nadzor prometa, pri izbiri podobe slovenskih kovancev in pri upravljanju z elektronskimi odpadki. ANG We have developed methods and tools for decision support, based on qualitative multi-parametric modeling. Our core method DEX was extended with new features such as the work with proper hierarchies. The book Decision Making and Models was published, describing many years of our experience in decision support. We developed methods for revising decision models and implemented them in the system proDEX. Our methodology was used in practice in analysis of effects of using genetically modified crops, in traffic management, for selecting the design of Slovene coins and for managing electronic waste. Objavljeno v ŽNIDARŠIČ, Martin, BOHANEC, Marko, ZUPAN, Blaž. proDEX - a DSS tool for environmental decision-making. Environ. model. softw. 2006, vol. 21, no. 10, str. 1514-1516, JCR IF: 1.992. Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 20073767 6. Najpomembnejši družbeno-ekonomsko relevantni rezultati programske skupine5 Družbeno-ekonomsko relevantni rezultat 1. Naslov SLO Koordinacija projekta in partnerstvo v 28 evropskih projektih ANG Project Coordination and partnership in 28 European 6FP and 7FP projects Opis SLO Po vključenosti v projekte EU smo najuspešnejša programska skupina v Sloveniji. Sodelovali smo v 28 projektih 6. in 7. OP. V teh projektih smo pridobili okrog 7.3 mio EUR sredstev. Izpostavimo koordinacijo STREP projekta IQ ter sodelovanje v 6 integriranih projektih in dveh mrežah odličnosti. Razvite metodološke in tehnološke rešitve imajo direkten učinek na družbeni in gospodarski razvoj Slovenije in Evrope, naše rešitve že uporabljajo British Telecom, Microsoft Research in New York Times. Bili smo pobudniki in uspešni posredniki vključitve 8 slovenskih podjetij v projekte 6. in 7. OP. ANG In terms of integration into EU projects, we are the most successful research programme in Slovenia. We have collaborated in 28 6FP and 7FP projects. Work on these projects brought us cca. 7.3 MIL EUR. We successfully coordinated STREP project IQ and collaborated in 6 integrated projects and 2 networks of excellence. Solutions from these projects have a direct effect on the social and economical development of Slovenia and Europe. Our solutions are used by British Telecom, Microsoft Research and The New York Times. We initiated and mediated the inclusion of 8 Slovene companies in EU projects. Šifra D.01 Vodenje/koordiniranje (mednarodnih in domačih) projektov Objavljeno v LAVRAČ, Nada, MLADENIĆ, Dunja, JERMOL, Mitja, DŽEROSKI, Sašo, ERJAVEC, Tomaž, BOHANEC, Marko, GROBELNIK, Marko. Svetovni splet se spreminja v semantični splet. Delo (Ljubl.), 30.03.2006, let. 58, št. 74, str. Program P2-0103 Stran 8 od 23 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 23. Tipologija 1.22 Intervju COBISS.SI-ID 19881511 2. Naslov SLO ANG Ohranjanje slovenske jezikovne kulturne dediščine Preservation of Slovene linguistic and cultural heritage Opis SLO ANG Brižinski spomeniki (BS) so temeljni dokument slovenske kulture, saj predstavljajo najstarejše slovensko besedilo. V sodelovanju z ZRC SAZU smo BS postavili na svetovni splet, skupaj z drugimi izdajami v okviru digitalne knjižnice http://nl.ijs.si/e-zrc/. e-BS so kompleksna znanstvenokritična izdaja, ki med seboj povezuje faksimile, vrsto prepisov, prevodov in komentarjev, slovar, polno bibliografijo raziskav, kot tudi integriran zvočni zapis branja BS. Ker so e-BS dostopni tudi v izvornem XML, odpirajo novo poglavje v možnostih raziskovanja in analize tega temeljnega dokumenta našega jezika. The Freising manuscripts (FM), the earliest Slovene text, is the founding document of Slovene culture. In collaboration with ZRC SAZU we published FM on the Web, with other editions of the digital library http://nl.ijs.si/e-zrc/. The eFM is a complex critical edition, which integrates facsimiles, numerous transcriptions, translations and commentaries, a dictionary, full research bibliography and audio recordings of the spoken text of the manuscripts. Since the eFM are available also in the source XML opens new possibilities for analysis and research of this basic document of our language. Šifra F.27 Prispevek k ohranjanju/varovanje naravne in kulturne dediščine Objavljeno v GRDINA, Igor, ERJAVEC, Tomaž, BOJADŽIEV, Damjan, OGRIN, Matija (ur.). Brižinski spomeniki = Monumenta Frisingensia : elektronska znanstvenokritična izdaja. Izdaja 1.0. Ljubljana: Inštitut za slovensko literaturo in literarne vede ZRC SAZU, 2007. ISBN 961-6568-33-7. http://nl.ijs.si/e-zrc/bs/ Tipologija 2.01 Znanstvena monografija COBISS.SI-ID 26702125 3. Naslov SLO ANG Dosežki na področju analize okoljskih podatkov Achievements in environmental data analysis Opis SLO ANG Izvedli smo številne aplikativne projekte na področju okoljskih znanosti in upravljanja z okoljem, pri katerih smo uporabili tehnike podatkovnega rudarjenja in podpore odločanja. Na problemu učinkov gensko spremenjenih poljščin smo razvili več modelov in programskih rešitev za podporo odločanju. Na področju gozdarstva smo uporabili strojno učenje pri izdelavi modela za napovedovanje požarnega tveganja v naravi, ki je vključena v geografski informacijski sistem Civilne zaščite Ujme. Organizirali smo dve znanstveni srečanji ECEM/EAML-2004 in uredili dve številki revije Ecological Modelling. We have conducted a number of applied projects concerned with environmental sciences and management, using techniques of data mining and decision support. On the topic of analysis of impacts of genetically modified crops we developed several decision support models and software systems. In forestry we used machine learning for development of a predictive model for estimating fire hazards, included in the system eGIS Ujme, which is used by the Civil Protection Service. We also organized two scientific events and guest-edited two special issues of the journal »Ecological Modelling«. Šifra D.01 Vodenje/koordiniranje (mednarodnih in domačih) projektov Objavljeno v DEBELJAK, Marko, DŽEROSKI, Sašo, ŽENKO, Bernard (ur.). Selected papers from the Fourth European Conference on Ecological Modelling, Ecological modelling, vol. 194, issues 1-3, Amsterdam: Elsevier, 2006. Tipologija 2.31 Zbornik recenziranih znanstvenih prispevkov na mednarodni ali tuji konferenci COBISS.SI-ID 19819047 4. Naslov SLO Model mreže zdravstvenih delavcev Slovenije Model of the network of health care workers in Slovenia Program P2-0103 Stran 9 od 23 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 ANG Opis SLO Cilj projektov Medinet in Medinet+ je bil razviti metodologijo in izdelati analize, na osnovi katerih bo lahko Ministrstvo za zdravje spremljalo in načrtovalo slovensko zdravstveno mrežo. Baze podatkov o zdravstvenem varstvu slovenskega prebivalstva smo obdelali s sodobnimi metodami analize in rudarjenja podatkov ter jih nadgradili z metodami za podporo odločanja, vizualizacije in geografskih informacijskih sistemov. Projekt prispeva neposredno k razvoju zdravstvenega varstva, posredno pa preko boljših odločitev prispeva k razvoju učinkovite družbene infrastrukture. ANG The goal of Medinet and Medinet+ projects was to develop a methodology to allow the Ministry of health to monitor and plan the health care network. We processed the databases on health care of the Slovene population using modern methods of automatic analysis and data mining, combined with methods for decision support, visualization and geographic information systems. The results of the study directly contribute to the development of the health care system, and indirectly, through improved decision making, to the development of an efficient societal infrastructure. Šifra F.15 Razvoj novega informacijskega sistema/podatkovnih baz Objavljeno v LAVRAČ, Nada, BOHANEC, Marko, PUR, Aleksander, CESTNIK, Bojan, DEBELJAK, Marko, KOBLER, Andrej. Data mining and visualization for decision support and modeling of public health-care resources. Journal of biomedical informatics, 2007, vol.40, no. 4, pp. 438-447, JCR IF : 2. Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 20957479 5. Naslov SLO Spletna portala IST-World in Videolectures.net ANG The Web portals IST-World and Videolectures.net Opis SLO Portal IST-World omogoča vpogled v delovanje raziskovalcev in raziskovalnih organizacij na podlagi integriranih podatkov o raziskovalni dejavnosti (tudi iz podatkovne baze SICRIS). Omogoča vizualizacijo področja dela in mreže sodelovanj raziskovalcev in raziskovalnih organizacij skozi čas. Portal Videolectures.net je eden največjih spletnih portalov z izobraževalnimi video vsebinami. Širokemu krogu obiskovalcev ponuja prost dostop do preko 4,000 predavanj strokovnjakov z vsega sveta, tako opravlja prenos znanja in neposredno promovira znanost. ANG The IST-World portal provides information on researchers and research organizations using integrated data about research activities (also from SICRIS database). It enables visualization of research areas and networks of cooperation of researchers and research organizations over time. The Videolectures.net portal is one of the largest Web portals with educational video contents. The portal provides a wide range of visitors with free access to over 4,000 lectures by experts from all over the world, this way performs knowledge transfer and directly promotes science. Šifra F.15 Razvoj novega informacijskega sistema/podatkovnih baz Objavljeno v JÖRG, Brigitte, JERMOL, Mitja, USZKOREIT, Hans, GROBELNIK, Marko, FERLEŽ, Jure, KIRYAKOV, Atanas. Analytical information services for the European research area. V: CUNNINGHAM, Paul (ed.), CUNNINGHAM, Miriam (ur.). Exploiting the knowledge economy : issues, applications and case studies, (Information and communication technologies and the knowledge economy, Vol. 3). Amsterdam [etc.]: IOS Press, 2006, pp. 1367-1395. Tipologija 1.16 Samostojni znanstveni sestavek ali poglavje v monografski publikaciji COBISS.SI-ID 20983335 7. Pomen raziskovalnih rezultatov programske skupine6 7.1. Pomen za razvoj znanosti2 SLO Pomen programa je v doseganju znanstvene odličnosti, sooblikovanju novih svetovnih znanstvenih trendov ter vpetosti raziskav v mednarodne znanstvene projekte. S tem smo pomembno prispevali k svetovni zakladnici znanj, k nadaljnji uveljavitvi slovenske Program P2-0103 Stran 10 od 23 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 znanosti v evropskem in svetovnem merilu, k prenosu znanstvenih dosežkov v prakso ter k podiplomskem in strokovnem izobraževanju v slovenskem in evropskem prostoru. Področja inteligentne analize strukturiranih podatkov (tabelarični, relacijski), analize večpredstavnih podatkov (teksta, slik, spleta) in semantičnega spleta doživljajo v svetu izjemen razmah predvsem zaradi dostopnosti podatkov po eni, in potreb industrije in vladnih inštitucij po obvladovanju kompleksnih situacij po drugi strani. Pomembnost tovrstnih znanj in tehnologij je še toliko večja, ker služijo kot infrastruktura drugim tehnologijam, kot so ekologija in varstvo okolja, bioinformatika, medicina, ekonomija in jezikoslovje. Odsek za tehnologije znanja na Institutu »Jožef Stefan« je že vrsto let v samem evropskem in svetovnem vrhu na področju tovrstnih analiz, kar potrjujejo vključenost v številne mednarodne projekte (28 EU projektov v letih 2004-2008, koordinacija EU projekta IQ in pretekle koordinacije EU projektov SolEuNet, ILPNet in ILPNet2), publikacije v prestižnih znanstvenih revijah (Journal of Machine Learning Research, Machine Learning Journal, ...) in na prestižnih mednarodnih konferencah (ECML, IDA, ICDM, ILP, DS, ...), organizacija delavnic, seminarjev in poletnih šol, tutorialov na mednarodnih konferencah, vključenost v uredniške odbore znanstvenih revij (MLJ, DAMI, ACM TKDD, AIM, AAI, JMLR, AI Com, IJCL, JLRE, EcoMod, EcoInf), programske odbore konferenc (ICML, ECML/PKDD, ICDM, ILP, KDD, IDA, ACL), vabljena predavanja, povabila na ugledne mednarodne znanstvene (Stanford, MIT, Tokyo Institute of Technology, ...) in komercialne institucije (Microsoft Research Cambridge, British Telecom, New York Times), organizacija in vodenje programskih odborov delavnic in konferenc (ACAI 2005, DS 2006, ESWC 2006, IDA 2007, ILP 2008). Ključno smo prispevali k razvoju novih znanstvenih področij, predvsem induktivnega logičnega programiranja, induktivnih podatkovnih baz, odkrivanja enačb in rudarjenja tekstovnih podatkov. Prispevali smo k povezavi med področji odkrivanja znanja, semantičnega spleta in analize socialnih omrežij. Na področju jezikovnih tehnologij smo znani predvsem po uporabi metod strojnega učenja nad jezikovnimi podatki in po razvoju standardiziranih metod označevanja jezikovnih podatkov. Na področju podpore odločanja sodimo pri večparametrskem odločanju v svetovni vrh. ANG_____________________________________________________________________________________________________________ Research programme aims at scientific excellence, and at setting of new research trends in connection with our EU and other international research projects. The research has significantly contributed to global treasury of knowledge, has advanced Slovene science on a European and global scale, advanced the transfer of scientific results into practice, and improved the development of postgraduate and professional education in Slovenia and Europe. The area of intelligent analysis of structured data (tabular, relational) and multimedia mining (mining texts, images and Web) and the semantic Web has witnessed exceptional growth on a global scale, mainly because of the availability of data on the one hand, and the need of industry and government institutions to master information complexity on the other. The role of knowledge technologies is also increasingly important because they serve as the infrastructure for other disciplines and technologies, e.g. ecology and preservation of the environment, bioinformatics, medicine, health care, economy and linguistics. Department of Knowledge Technologies at Jožef Stefan Institute has, for several years, been at the very top of such analysis efforts, in European and global terms, confirmed through our participation in numerous international projects (28 EU projects in 2004-08, coordination of FP6 project IQ and past EU projects SolEuNet, ILPNet, ILPNet2), papers in leading scientific publications (Journal of Machine Learning Research, Machine Learning Journal, etc.) and prestigious international conferences (ECML, IDA, ICDM, ILP, DS, etc.), organization of numerous workshops, seminars and summer schools, tutorials at international conferences, membership in editorial boards of scientific journals (MLJ, DAMI, ACM TKDD, AIM, AAI, JMLR, JAIR, AI Com, IJCL, JLRE, EcoMod, EcoInf), conference program committees (ICML, ECML/PKDD, ICDM, ILP, KDD, IDA, ACL), invited lectures, invitations to distinguished international scientific (Stanford, MIT, Tokyo Institute of Technology, ...) and commercial institutions (Microsoft Research Cambridge, British Telecom, New York Times), organization and chairing of program committees of conferences and workshops (including ACAI-05, DS-06, ESWC-06, IDA-07, ILP-08). In recent years we have made key contributions to the development of new areas of science, especially inductive logic programming, inductive databases, equation discovery and text mining. In the area of language technologies, our reputation is based on successful applications of machine learning methods to textual data and the development of standardized methods of annotating linguistic data. We also shifted from the morphological and lexical levels towards problems arising due to developing the semantic Web, notably learning and standardizing ontologies. In the area of decision support, we also play a leading role in supporting multi-parametric decision processes. 7.2. Pomen za razvoj Slovenije5 SLO Pomen raziskovalnega programa pri razvoju Slovenije je dvojen. Program P2-0103 Stran 11 od 23 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 1. Neposreden pomen in vloga programa se udejanja v osnovnih raziskavah, ki prispevajo k splošnemu napredku znanja na področju informacijskih tehnologij. Raziskovalni program zagotavlja aktivno vključevanje raziskovalcev v domače in mednarodne znanstvene tokove (npr. sodelovanje v EU projektih), kar je nujen pogoj za razvoj informacijske in na znanju temelječe družbe. Pri tem je pomembno poudariti odličnost raziskovalcev programske skupine in njihove mednarodno odmevne dosežke v mednarodnih in domačih projektih. Med njih sodi avtorstvo člankov, poglavij knjig in znanstvenih monografij, uredništvo knjig in posebnih številk znanstvenih revij ter zbornikov mednarodnih konferenc ter koordinacija evropskih projektov. 2. Drugi vloga programa je posredna in se izraža v pomenu, ki ga imajo visoko razvite informacijske tehnologije kot osnova za razvoj in podporo drugih področij znanja za trajnostni družbeno-ekonomski in kulturni razvoj. Naši rezultati so še posebej pomembni za Slovenijo na naslednjih področjih. (a) Metode za inteligentno analizo podatkov smo uporabili na vrsti praktičnih problemov s področja znanosti o okolju oz. upravljanja z okoljem, npr. modeliranje habitata gozdnih živali v Sloveniji, rasti alg v vodnih ekosistemih, itd. Prispevki se nanašajo na biokemični inženiring, medicinsko informatiko in racionalizacijo zdravstva, farmakologijo, epidemiologijo in preprečevanje poklicnih bolezni v industriji, odkrivanje rizičnih skupin pacientov in na odkrivanje povezave med genskimi informacijami in kliničnimi simptomi. (b) Prispevki programa so pomembni tudi za družbeni razvoj in razvoj storitev. Naš sistem za podporo večparametrskega odločanja smo uporabili v vrsti aplikacij na področju izobraževanja, zdravstva ter vrednotenja investicij in projektov, kar omogoča večjo transparentnost delovanja javnih zavodov in javne uprave. (c) Pomen programa za kulturni razvoj Slovenije se navezuje na dejstvo, da je kulturna identiteta Slovencev že od nekdaj tesno povezana z jezikom. Delo na področju jezikovnih tehnologij poteka v sodelovanju s komplementarnimi slovenskimi institucijami: FF, FDV, ZRC SAZU, NUK, DZS, Amebis in Alpineon. Naše delo je uporabno pri poučevanju slovenskega jezika, slovaropisju, in strojno podprtem prevajanju, v teku pa je tudi več projektov za razvoj strojnega prevajanja. (d) Pomen za tehnološki razvoj je povezan s prehodom slovenskega gospodarstva v inovacijsko družbo; strateška usmeritev uspešnih gospodarskih družb je izdelava proizvodov in storitev, pri katerih je dodana vrednost največja. Za tehnološki razvoj velja, da je vpliv metod in tehnik, ki jih razvijamo pod okriljem programa Tehnologije znanja, izrazito stimulativen. S pomočjo tehnologij za obdelavo in analizo velikih količin podatkov in semantičnega spleta prispevamo k razvoju lastnih vrhunskih informacijskih tehnologij, ki jih lahko uporabljamo za razvoj storitev z visoko dodano vrednostjo, ki so uporabne v aplikacijah za slovenske in tuje naročnike. Raziskovalni program ima močno povezovalno komponento, tako med raziskovalnimi skupinami, kot tudi z gospodarstvom. Sodelavci programa smo aktivni v prenosu znanja preko aplikativnih projektov in seminarjev organiziranih v sodelovanju s Centrom za prenos znanja na področju informacijskih tehnologij IJS. Sodelujemo v izobraževalnih aktivnostih Univerze v Ljubljani in Mariboru, Univerze v Novi Gorici in vrste tujih univerz ter pri oblikovanju in izvajanju študijskega programa Novi mediji in e-znanost na Mednarodni podiplomski šoli Jožefa Stefana. Velja omeniti tudi tedenski Solomonov seminar, ki je namenjen izboljšanju splošne ravni izobraževanja na področju informacijskih tehnologij. Pomemben korak k realizaciji izobraževanja na daljavo je tudi naše spletišče Videolectures.net na katerem je na voljo že preko 4000 videoposnetkov predavanj s cele vrste znanstvenih dogodkov. ANG The importance of the programme for this development is twofold: 1. Direct significance and role of the programme is embodied in its basic research component, which contributes to the general advancement of knowledge in the area of information technologies. The research programme ensures active inclusion of researchers into national and international scientific trends (e.g. cooperation in EU projects), which is a necessary condition of the development of the emerging knowledge-based society. The specific results include authorships of papers, book chapters and scientific monographs, editing books and special issues of scientific journals and proceedings of international conferences. 2. The second role of the programme is indirect, and expressed in the significance of advanced information technologies as the basis for the development and support for other knowledge intensive areas, ensuring sustainable socio-economic and cultural development. Our results are especially important for Slovenia in the following areas. (a) Methods of intelligent data analysis are used to solve numerous practical problems of environmental sciences and management, e.g. modelling the habitat of forest animals and the growth of algae in aquatic ecosystems. Other contributions include biochemical engineering, medical informatics and the rationalization of the Slovene healthcare system, pharmacology, epidemiology and the prevention of occupational disease in industry, discovering risk groups, and discovering connections between genetic information and clinical symptoms. (b) Our systems for multi-parametric decision support is used in a series of applications in education, healthcare and the evaluation of projects and investments, improving the transparency of activities in public services and administration. (c) The programme is also important for the cultural development of Slovenia. Program P2-0103 Stran 12 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 Work in the area of language technologies proceeds in cooperation with Slovene higher eductation and research institutions as well as companies. Our work has applications in Slovene language teaching, lexicography and machine or machine-aided translation, and also concerns digital libraries, esp. the preservation of cultural heritage. (d) The importance of our contributions to the general technological development is connected to the transition of the national economy towards an innovation-oriented and knowledge-based society with a large added value. (e) With technologies for processing and analyzing large amounts of data and exploiting the possibilities of the semantic Web we contribute to the development of our own advanced information technologies that are used in developing added-value services for Slovene and international clients. The research programme has a strong integrative component between research teams as well as with industry. Members of the programme team take active part in the transfer of knowledge through applied projects and training/seminars organized in cooperation with the JSI Centre for knowledge transfer in information technologies. We participate in educational activities of the Universities of Ljubljana, Maribor, Nova Gorica and numerous universities abroad and have contributed to the constitution and curricula development of the study programme New media and e-science at the Jozef Stefan International Postgraduate School. We also organise weekly Solomon seminar, dedicated to improving the general level of education in the area of information technologies. An important step towards the goal of providing distance learning/education is our Web portal Videolectures.net which has already made publicly available more than 4,000 video recordings of lectures from a vast range of scientific events. 8. Zaključena mentorstva članov programske skupine pri vzgoji kadrov9 Vrsta izobraževanja Število mentorstev Od tega mladih raziskovalcev - magisteriji 7 2 - doktorati 6 2 - specializacije Skupaj: 13 4 9. Zaposlitev vzgojenih kadrov po usposabljanju Organizacija zaposlitve Število doktorjev Število magistrov Število specializantov - univerze in javni raziskovalni zavodi 4 3 - gospodarstvo 1 3 - javna uprava 1 - drugo 1 Skupaj: 6 7 0 10. Opravljeno uredniško delo, delo na informacijskih bazah, zbirkah in korpusih v obdobju10 Ime oz. naslov publikacije, podatkovne informacijske baze, korpusa, zbirke z virom (ID, spletna stran) Število * 1. FIDA+ Referenčni korpus slovenskega jezika www.fidaplus.net 3 sodelavci / 600 milijonov besed 2. e-ZISS Elektronske znanstvenokritine izdaje slovenskega slovstva (nl.ijs.si/e-zrc) 1 sodelavec / 5 izdaj 3. JRC-ACQUIS Večjezični vzporedni korpus pravnih aktov EU (http://langtech.jrc.it/JRC-Acquis.html) 1 sodelavec / 22 jezikov, več kot Program P2-0103 Stran 13 od 23 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 milijarda besed 4. DŽEROSKI, Sašo (ur.), STRUYF, Jan (ur.). Proceedingsof the 5th International workshop on Knowledge discovery in inductive database (ECML/PKDD-2006), Berlin, September 2006. VI, 142 str. 1 sodelavec iz programske skupine / 12 prispevkov 5. DEBELJAK, Marko (ur.), DŽEROSKI, Sašo (ur.), ŽENKO, Bernard (ur.). Selected papers from the Fourth European Conference on Ecological Modelling, Sept. 27-Oct. 1, 2004, Bled, Slovenia, (Ecological modelling, vol. 194, issues 1-3, 2006). Amsterdam: Elsevier. 328 str. 3 sodelavci / 30 prispevkov 6. ANŽIČ, Tina (ur.), GROBELNIK, Marko (ur.), HORVAT, Boris (ur.), MLADENIĆ, Dunja (ur.), PISANSKI, Tomaž (ur.), SHAWE-TAYLOR, John (ur.), ŠKVARČ,Smilja na (ur.), ŽEROVNIK, Janez (ur.). Complex objects visualization - COV 2005: proceedings. Ljubljana: Jožef Stefan Institute; Institute of Mathematics, Physics and Mechanics; Koper: UP - PINT, 2006. 2 sodelavca iz programske skupine / 15 prispevkov 7. LAVRAČ, Nada (ur.), TODOROVSKI, Ljupčo (ur.), JANTKE, Klaus P. (ur.). Discovery science: 9th International Conference, DS 2006, Barcelona, Spain, October 7-10, 2006 : proceedings, (LNCS/LNAI, vol. 4265). Berlin: Springer, 2006. 1 sodelavec iz programske skupine / 47 prispevkov 8. DŽEROSKI, Sašo (ur.), TODOROVSKI, Ljupčo (ur.). Computational discovery of scientific knowledge : introduction, techniques, and applications in environmental and life sciences, (Lecture notes in computer science, Lecture notes in artifical intelligence, 4660), (State-of-the-art-survey). Berlin; Heidelberg: Springer, 2007. 1 sodelavec iz programske skupine/ 15 prispevkov 9. BERTHOLD, Michael R. (ur.), SHAWE-TAYLOR, John (ur.), LAVRAČ, Nada (ur.). Advances in intelligent data analysis VII : proceedings, (Lecture notes in computer science, 4723), (LNCS sublibrary, SL 3, Information systems and applications, incl. internet/web, and HCI). Berlin; Heidelberg; New York: Springer, cop. 2007. 1 sodelavec iz programske skupine/ 33 prispevkov 10. KOK, Joost N. (ur.), MLADENIĆ, Dunja (ur.). PKDD 2007, 11th European Conference on Principles and Practice of Knowledge Discovery in Databases, Warsaw, Poland, September 17-21, 2007. Knowledge discovery in databases : proceedings, (Lecture notes in computer science, Lecture notes in artificial intelligence, vol. 4702). Berlin; Heidelberg; New York: Springer, cop. 2007. 1 sodelavec iz programske skupine/ 68 prispevkov *Število urejenih prispevkov (člankov) /število sodelavcev na zbirki oz. bazi /povečanje obsega oz. število vnosov v zbirko oz. bazo v obdobju 11. Vključenost raziskovalcev iz podjetij in gostovanje raziskovalcev, podoktorandov ter študentov iz tujine, daljše od enega meseca Sodelovanje v programski skupini Število - raziskovalci-razvijalci iz podjetij - uveljavljeni raziskovalci iz tujine 2 - podoktorandi iz tujine 1 - študenti, doktorandi iz tujine 16 Skupaj: 19 12. Vključevanje v raziskovalne programe Evropske unije in v druge mednarodne raziskovalne in razvojne programe ter drugo mednarodno sodelovanje v obravnavanem obdobju11_______________________________________________________________________________ - ECOLEAD: European Collaborative Networked Organizations LEADership initiative (evropski integrirani projekt 6.OP IP-506958), prof.dr. Nada Lavrač, mag. Mitja Jermol; 1.4.2004 - Program P2-0103 Stran 14 od 23 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 31.6.2008 - SIGMEA: Sustainable Introduction of GMOs into European Agriculture (evropski strateški projekt 6.OP SSP1-2003-502981), prof.dr. Sašo Džeroski, prof. dr. Marko Bohanec; 2.5.2004 -2.11.2007 - PASCAL: Pattern Analysis, Statistical Modelling and Computational learning (evropska mreža odličnosti 6.OP IST-2002-506778), doc.dr. Dunja Mladenić; 1.12.2003 - 29.2.2008 - CEC-WYS: Central European Centre for Women and Youth in Science (evropski projekt 6.OP SAS6-CT-2004-003582, doc.dr. Dunja Mladenić; 1.3.2004 - 28.2.2007 - IST-World: Knowledge Base for RTD Competencies (SSA projekt 6. OP 015823), Marko Grobelnik, mag. Mitja Jermol; 1.4.2005 - 30.11.2007 - SEKT: Semantically Enabled Knowledge Technologies (evropski integrirani projekt 6.OP IST-2003-506826), Marko Grobelnik, doc. dr. Dunja Mladenić; 1.1.2004-31.12.2006 - ECOGEN: Soil ecological and ecoomic evaluation of genetically modified crops (5.OP QLRT-2001-01666), (prof. dr. Sašo Džeroski) 1.11.2002-31.10.2006 - ALVIS: Superpeer Semantic Search Engine (evropski strateški projekt 6.OP IST-1-002068-STP), Marko Grobelnik; 1.1.2004-31.3.2007 - CInQ; Consortium on Discovering Knowledge with Inductive Queries (projekt 5.OP IST-2000-26469), prof. dr. Sašo Džeroski; 2001-2004 - KDNet: Knowledge Discovery Network of Excellence (evropska mreža odličnosti 5.OP IST-2001-33086), dr. Dunja Mladenić; 2002-2004 - SEE-ERA.NET: Building Language Resources and Translation Models for Machine Translation focused on South Slavic and Balkan Languages, dr. Tomaz Erjavec; 2007-2008 - IQ: Inductive Queries for Minning Patterns and Models (evropski strateški projekt 6.OP FP6-0516169), prof. dr. Sašo Džeroski; 1.9.2005 - 31.8.2008 - KD-ubiq: A blue print for ubiquitous knowledge discovery systems (6.OP Coordination Action IST-4-021321-CA, doc. dr. Dunja Mladenič; 1.12.2005 - 30.11.2008 - IMAGINATION: Image-based Navigation in Multimedia Archives (6.OP FP6-034626) doc. dr. Dunja Mladenić; 1.5.2006 - 30.4.2009 - SMART: Statistical Multilingual Analysis for Retrieval and Translation, (FP6 STREP 033917), doc. dr. Dunja Mladenić, Marko Grobelnik; 1.10.2006-30.09.2009 - NeOn: Lifecycle Support for Networked Ontologies (6.OP IP-027595) Marko Grobelnik, doc. dr. Dunja Mladenić; 1.3.2006 - 28.2.2010 - SWING: Semantic Web Services Interoperability for Geospatial Decision Making (6.OP FP6-026514) Marko Grobelnik, doc. dr. Dunja Mladenić; 1.3.2006 - 28.2.2009 - TAO: Transitioning Applications to Ontologies (6.OP FP6-026460) Marko Grobelnik, doc. dr. Dunja Mladenić, 1.3.2006 - 28.2.2009 - E4: Extended Enterprise management in Enlarged Europe (6.OP FP6-027282) mag. Mitja Jermol, Marko Grobelnik, doc. dr. Dunja Mladenić, 1.1.2006-31.10.2008 - Tool-East: Open Source Enterprise Resource Planning and Order Management System for Eastern European Tool and Die Making Workshops (6.OP FP6-27807) mag. Mitja Jermol; 1.1.2006-30.6.2008 - WS DEBATE: Stimulating Policy Debate on Women and Science Issues in Central Europe (6.OP 036651) doc. dr. Dunja Mladenič; 1.10.2006- 30.9.2008 - E.E.T Pipeline: European Embryonal Tumor Pipeline (6.OP STREP 037260) prof. dr. Sašo Džeroski 1.1.2007-31.12.2009 Program P2-0103 Stran 15 od 23 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 - HEALTHREATS: Integrated Decision Support System for HEALTH THREATS and crises management (Public Health programme - PHEA - 2006203) prof. dr. Nada Lavrač; 31.5.2007-30.5.2010 - Co-Extra: GM and non-GM supply chains: their CO-Existance and Traceability (6.OP, IP-007158), prof. dr. Marko Bohanec 1.4.2007.-31.3.2009 - COIN: Collaboration and Interoperability for networked enterprises (7.OP-216256) mag. Mitja Jermol, doc. dr. Dunja Mladenić, Marko Grobelnik 1.1.2008 - 31.12.2011 - EURIDICE: European Inter-Disciplinary Research on Intelligent Cargo for Efficient, Safe and Environment-friendly Logistics (7.OP, IP-216271) mag. Mitja Jermol, Marko Grobelnik, doc. dr. Dunja Mladenić 1.2.2008 - 31.1.2011 - ACTIVE: Enabling the Knowledge Powered Enterprise (7.OP, IP-215040) Marko Grobelnik, doc. dr. Dunja Mladenić, mag. Mitja Jermol 1.3.2008 - 28.2.2011 - PASCAL2: Pattern Analysis, Statistical Modelling and Computational Learning 2 (7.OP NoE-216886) Marko Grobelnik, doc. dr. Dunja Mladenić, mag. Mitja Jermol; 1.3.2008-28.2.2013 - BISON: Bisociation Networks for Creative Information Discovery (7.OP 211892), prof.dr. Nada Lavrač 2008-2011 Drugi mednarodni projekti: - Text Analysis using Natural language Processing, financer Microsoft Research (dr. Dunja Mladenić) 2003 - 2004 - Inxight Software Inc. Consulting (naročnik za izdelavo programske opreme), (doc.dr. Tomaž Erjavec) 2004 - 2005 - MONDILEX: Conceptual Modelling of Networking of Centres for High-Quality esearch in Slavic Lexicography and Their Digital Resourses (7. OP 211938), (doc.dr. Tomaž Erjavec); 1.4.2008-31.3.2010 - Razvoj jezikovnih virov za strojno prevajanje med slovenskim in srbskim jezikom (projekt znanstveno-tehnološkega sodelovanja med Republiko Slovenijo ter Srbijo in Črno goro), (doc. dr. Tomaž Erjavec) 2004-2005 - Upravljanje znanja v medicini in zdravstvenem varstvu (projekt znanstveno-tehnološkega sodelovanja med Republiko Slovenijo ter Češko republiko), (prof. dr. Nada Lavrač) 2004-2005 - Inteligentna analiza podatkov (projekt znanstveno-tehnološkega sodelovanja med Republiko Slovenijo ter Republiko Hrvaško) (prof. dr. Nada Lavrač) 2004-2005 - Zbiranje, označevanje in analiza makedonsko/slovenskih jezikovnih virov (projekt znanstveno-tehnološkega sodelovanja med Republiko Slovenijo ter Makedonijo) (prof. dr. sašo Džeroski) 2005-2006 - Using Artificial Intelligence in Text and Web Mining, (projekt znanstveno-tehnološkega sodelovanja med Republiko Slovenijo ter Srbijo in Črno goro) (doc. dr.Dunja Mladenič) 2005-2006 - Tehnologije znanja v medicini in zdravstvenem varstvu (projekt znanstveno-tehnološkega sodelovanja med Republiko Slovenijo ter Češko republiko), (prof. dr. Nada Lavrač) 2006-2007 - Inteligentno odkrivanje podskupin (projekt znanstveno-tehnološkega sodelovanja med Republiko Slovenijo ter Republiko Hrvaško) (prof. dr. Nada Lavrač) 2006-2007 - Analiza dinamičnih omrežij z metodami analize grafov in besedila (projekt znanstveno-tehnološkega sodelovanja med Republiko Slovenijo ter Združene države Amerike) (doc. dr.Dunja Mladenič) 2006-2007 - Inteligentna analiza podatkov (projekt znanstveno-tehnološkega sodelovanja med Republiko Slovenijo ter Francijo) (prof. dr. Nada Lavrač) 2006-2007 - Vpliv odlaganja odpadkov na tla: identifikacija in klasifikacija fizikalno kemijskih in bioloških parametrov tal, ki vplivajo na prehrano rastlin (projekt znanstveno-tehnološkega sodelovanja med Republiko Slovenijo ter Francijo) (doc. dr. Marko Debeljak) 2007-2008 - Induktivne baze podatkov za genomiko in proteomiko (projekt znanstveno-tehnološkega sodelovanja med Republiko Slovenijo ter Republiko Hrvaško) (prof. dr. Sašo Džeroski) 2007-2008 - Odkrivanje znanja za ekološko modeliranje jezerskih ekosistemov (projekt znanstveno-tehnološkega sodelovanja med Republiko Slovenijo ter Makedonijo) (prof. dr. Sašo Džeroski) 2007-2008 Program P2-0103 Stran 16 od 23 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 13. Vključenost v projekte za uporabnike, ki potekajo izven financiranja ARRS12__________ - MediMap Analiza podatkov za upravljanje znanja na področju zdravstva (zavod za zdravstveno varstvo Celje), prof. dr. Nada Lavrač 2003-2004 - Metodologija zbiranja in arhiviranja slovenskih elektronskih publikacij na medmrežju (Narodna in Univerzitetna knjižnica), (doc. dr. Dunja Mladenić) 2003-2004 - Izdelava virov in sistema za simultano prevajanje slovenščina-angleščina (Amebis) doc. dr. Tomaž Erjavec 2003-2005 - Semantično GRID okolje za ekološko modeliranje (Ministrstvo za visoko šolstvo in šport), (doc. dr. Ljupčo Todorovski) 2004-2006 - VoiceTRAN: večjezični prenosni govorni komunikator za bojevnika 21. Stoletja (Ministrstvo za obrambo), doc. dr. Tomaž Erjavec 2004-2006 - Oblikovanje in analiza zbirke slovenskih digitaliziranih in elektronskih publikacij nacionalnega pomena (Narodna in univerzitetna knjižnica), dr. Dunja Mladenić 2003-2005 - MediNet: Analiza dejavnikov za postavitev mreže zdravstvenih delavcev na primarni in sekundarni ravni (Ministrstvo za zdravje), prof. dr. Nada Lavrač 2004-2005 - Napovedovalni GIS model požarne ogroženosti naravnega okolja (Ministrstvo za obrambo) 2004-2006 - MediNet+ Izdelava modela mreže zdravstvenih delavcev primarne ravni Slovenije, (Ministrstvo za zdravje) prof. dr. Nada Lavrač 2006 - Prostorsko načrtovanje, vrednotenje in odločanje (Luka Koper), prof.dr. Marko Bohanec, 2007 - Obdelava lidarskih podatkov (Ministrstvo za kmetijstvo, gozdarstvo in prehrano) prof. dr. Sašo Džeroski 2004-2007 - VIZIPIN (Iskra Zaščite), mag. Mitja Jermol, M. Grobelnik, 1.10.2007-30.9.009 - Systher - Razvoj tehnik za integracijo oz. združevanje različnih virov znanja ter za sestavljanje analitskih postopkov s komibiniranjem oz. združevanjem različnih metod z analizo podatkov, s ciljem odkrivanja znanja iz podatkov in ontologij" (Nacionalni Inštitut za biologijo), prof. dr. Nada Lavrač, Petra Kralj, 7.3.-30.9.2008 - Škodljivi dejavniki za gozd v sodobnem času: metode spremljanja, ekološko modeliranje, vpliv gospodarjenja ter načini ukrepanja (Ministrstvo za kmetijstvo, gozdarstvo in prehrano) prof. dr. Sašo Džeroski 2006-2008 - Priprava podlag za izdelavo nacionalne strategije za zagotavljanje ohranjevanja genofonda gozdnih drevesnih vrst ob uporabi gensko spremenjenih dreves v kmetijstvu (Ministrstvo za kmetijstvo, gozdarstvo in prehrano) prof. dr. Marko Debeljak 2006-2008 - Harmonizacija tehnologij za celovito sledljivost gensko spremenjenih organizmov v produkciji kmetijskih pridelkov in živil ter njihov soobstoj s konvencionalno in ekološko pridelavo (Ministrstvo za kmetijstvo, gozdarstvo in prehrano) prof. dr. Nada Lavrač, prof. dr. Marko Debeljak) 2006-2008 - MetaStoritev - Semantično sklapljanje Grid storitev (Ministrstvo za visoko šolstvo in šport) doc. dr. Dunja Mladenić 2006-2008 - Sistemi za statistični semantični splet (Ministrstvo za visoko šolstvo in šport) doc. dr. Dunja Mladenić 2006-2008 - Elektronsko besedilno središče z multimedijsko komunikacijo (Ministrstvo za visoko šolstvo in šport) doc. dr. Tomaž Erjavec 2007-2009 14. Dolgoročna sodelovanja z uporabniki, sodelovanje v povezavah gospodarskih in drugih organizacij (grozdi, mreže, platforme), sodelovanje članov programske skupine v pomembnih gospodarskih in državnih telesih (upravni odbori, svetovalna telesa, fundacije, itd.) Člani programske skupine dejavno sodelujemo z naročniki iz industrije predvsem preko raziskovalnih in aplikativnih projektov, ki tečejo na Odseku za tehnologije znanja in Centru za prenos znanj na IJS. Slovenska podjetja in organizacije, s katerimi dolgoročno sodelujemo so Iskratel, Iskra zaščite, Kolektor, Slovenska vojska, NUK, Hermes Softlab, Amebis, Thyria technologies, Xlab, Avtomobilski grozd, Orodjarski grozd, EMO orodjarna, Valji Štore, Kogast, Grozd proizvajalcev visokotehnološke opreme. Naša znanja in storitve so izredno zanimive tudi za tuja podjetja. Tako so uporabniki naših raziskovalnih rezultatov med drugim British Telecom, New York Times, Evropska Komisija, Siemens, Accenture, Xerox, UN FAO, itd. Skladno s strategijo vključevanja slovenskih podjetij v mednarodne projekte smo v evropske projekte uspešno vključili vrsto slovenskih podjetij: Avtomobilski grozd, Orodjarski grozd, EMO orodjarno, Valji Štore, Amebis, Hermes Softlab, Kogast, Grozd proizvajalcev visokotehnološke opreme. Odsek za tehnologije znanja in Center za prenos znanj na IJS sta tudi formalna člana orodjarskega grozda, grozda proizvajalcev visokotehnološke opreme, tehnološke platforme NEM ter mednarodnih organizacij kot so Eurocris in W3C. Program P2-0103 Stran 17 od Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 Prof. dr. Nada Lavrač je članica sveta Vlade RS za konkurenčnost (razvojna skupina za IKT). Prof. dr. Nada Lavrač je članica odbora mednarodnega združenja za strojno učenje (Board of the International Machine Learning Society). Dr. Igor Mozetič je predstavnik IJS v svetovalnem odboru (Advisory Committee) World Wide Web konzorcija (W3C), ki sprejema standarde za razvoj svetovnega spleta. 15. Skrb za povezavo znanja s slovenskim prostorom in za slovensko znanstveno terminologijo (Cobiss tip 1.04, 1.06, 1.07, 1.08, 1.09, 1.17, 1.18, 2.02, 2.03, 2.04, 2.05, 2.06)13 Naslov Knjiga Odločanje in modeli Opis Knjiga Odločanje in modeli obravnava metode, tehnike in računalniške programe za podporo odločanja z vidika odločitvene analize. V njej so predstavljeni osnovni pojmi analize odločanja, kakor tudi obširen nabor metod odločitvene analize, od preprostih in starejših, do kompleksnih in najnovejših. Veliko večino metod, ki se sicer v slovenskem prostoru že uporabljajo v praksi, ta knjiga prvič predstavlja v slovenskem jeziku v kontekstu širšega področja odločitvene analize. Kot taka je tudi neprecenljiv vir nove znanstvene terminologije. Objavljeno v BOHANEC, Marko. Odločanje in modeli, (Učbeniki in priročniki). Ljubljana: DMFA - založništvo, 2006. XV, 312 str., ilustr. ISBN 961-212-190-7. COBISS.SI-ID 230035968 16. Skrb za popularizacijo znanstvenega področja (Cobiss tip 1.05, 1.21, 1.22, 2.17, 2.19, 3.10, 3.11, 3.12)14 Naslov S tehnologijami znanja do večje konkurenčnosti Opis Prispevek v časniku Finance v obliki intervjuja predstavlja nekaj sodobnih metod in tehnik s področja tehnologij znanja, njihovo praktično vrednost in izpostavlja nekatere uspešno opravljene aplikacije. Predstavljen je npr. koncept virtualnih podjetij in navedenih nekaj raziskovalnih projektov, ki razvijajo tehnologije za učinkovito upravljanje takih organizacij. Objavljeno v Finance. [Tiskana izd.], april 2006, št. 69, str. 21. COBISS.SI-ID 19794215 17. Vpetost vsebine programa v dodiplomske in podiplomske študijske programe na univerzah in samostojnih visokošolskih organizacijah v letih 2004 – 2008 1. Naslov predmeta Upravljanje znanja, Metode in sistemi za podporo odločanja, Poslovni informacijski sistemi, Odkrivanje zakonitosti v podatkih, Obdelava ekoloških podatkov z metodami strojnega učenja, Ekologija, Sistemska ekologija. Vrsta študijskega programa podiplomski Naziv univerze/ fakultete Univerza v Novi Gorici 2. Naslov predmeta Novi mediji in jezikovne tehnologije, Odkrivanje in upravljanje znanja v e-znanosti, Novi mediji in upravljanje znanja, Sistemi in tehnike za podporo odločanja, Odkrivanje znanja iz okoljskih podatkov, Izbrane teme iz novih medijev in e-znanosti. Vrsta Program P2-0103 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 študijskega programa podiplomski Naziv univerze/ fakultete Mednarodna podiplomska šola Jožefa Stefana 3. Naslov predmeta Standards for digital encoding, Annotating language data, Introduction to Human Language Technologies. Vrsta študijskega programa dodiplomski Naziv univerze/ fakultete Univerza Karl-Franzens, Graz 4. Naslov predmeta Sistemi za podporo odločanja v upravi Vrsta študijskega programa podiplomski Naziv univerze/ fakultete Univerza v Ljubljani, Fakulteta za upravo 5. Naslov predmeta Poslovni ekspertni sistemi, Sistemi za podporo odločanju. Vrsta študijskega programa dodiplomski Naziv univerze/ fakultete Univerza v Mariboru, Fakulteta za organizacijske vede 6. Naslov predmeta Relational Data Mining Vrsta študijskega programa podiplomski Naziv univerze/ fakultete University of Madrid 7. Naslov predmeta Podatkovno rudarjenje na spletu...ostali predmeti na navedenih in drugih univerzah so navedeni na koncu Poročila o realizaciji programa. Vrsta študijskega programa podiplomski Naziv univerze/ fakultete Univerza na Primorskem, Fakulteta za matematiko, naravoslovje in informacijske tehnologije 18. Označite potencialne vplive oziroma učinke vaših rezultatov na navedena področja: Vpliv Ni vpliva Majhen vpliv Srednji vpliv Velik vpliv G.01 Razvoj visoko-šolskega izobraževanja G.01.01. Razvoj dodiplomskega izobraževanja r r a r G.01.02. Razvoj podiplomskega izobraževanja r r r (S G.01.03. Drugo: r r r r G.02 Gospodarski razvoj G.02.01 Razširitev ponudbe novih izdelkov/storitev na trgu r r C r Program P2-0103 Stran 19 od 23 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 G.02.02. Širitev obstoječih trgov C r (S r G.02.03. Znižanje stroškov proizvodnje C C (S r G.02.04. Zmanjšanje porabe materialov in energije C r (S r G.02.05. Razširitev področja dejavnosti C r r (S G.02.06. Večja konkurenčna sposobnost C r r a G.02.07. Večji delež izvoza C r a r G.02.08. Povečanje dobička C r (S r G.02.09. Nova delovna mesta C r r (S G.02.10. Dvig izobrazbene strukture zaposlenih C r r (S G.02.11. Nov investicijski zagon C a r r G.02.12. Drugo: C r r r G.03 Tehnološki razvoj G.03.01. Tehnološka razširitev/posodobitev dejavnosti C r (S r G.03.02. Tehnološko prestrukturiranje dejavnosti C r C r G.03.03. Uvajanje novih tehnologij C r r (S G.03.04. Drugo: C r r r G.04 Družbeni razvoj G.04.01 Dvig kvalitete življenja C r r a G.04.02. Izboljšanje vodenja in upravljanja C r r (S G.04.03. Izboljšanje delovanja administracije in javne uprave C r (S r G.04.04. Razvoj socialnih dejavnosti C a r r G.04.05. Razvoj civilne družbe C (S r r G.04.06. Drugo: C r r r G.05. Ohranjanje in razvoj nacionalne naravne in kulturne dediščine in identitete C r r (S G.06. Varovanje okolja in trajnostni razvoj C r r (S G.07 Razvoj družbene infrastrukture G.07.01. Informacijsko-komunikacijska infrastruktura C r (S r G.07.02. Prometna infrastruktura C r (S r G.07.03. Energetska infrastruktura C a r r G.07.04. Drugo: C r r r G.08. Varovanje zdravja in razvoj zdravstvenega varstva C r r (S G.09. Drugo: C r r r Program P2-0103 Stran 20 od 23 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 Komentar^ G1 - RAZVOJ VISOKOŠOLSKEGA IZOBRAŽEVANJA: Postavili smo magistrski študijski program "Novi mediji in e-znanost" na Mednarodni podiplomski šoli Jožefa Stefana (MPŠ) in vodili obnovo bolonjskih magistrskih programov "Gospodarski inženiring" na Univerzi v Novi Gorici in "Novi mediji in informacijsko-komunikacijske tehnologije" na MPŠ. Sodelovali smo pri pripravi evropskih kurikulov s področja strojnega učenja in mrežnih organizacij. G2 in G3 - GOSPODARSKI RAZVOJ in TEHNOLOŠKI RAZVOJ: Tehnologije znanja vplivajo na večino podpodročij G2 in G3, saj ponujajo metodološko infrastrukturo za iskanje, vrednotenje in analizo rešitev problemov, kot tudi za simuliranje in optimizacije proizvodnih in poslovnih sistemov. V EU projektih ECOLEAD, E4 in Tool-East (G21-G25, G42) smo razvili orodja za inteligentno upravljanje mrežnih podjetij, v projektih ECOGEN in SIGMEA (G23, G6, G8) pa analizirali učinke gensko spremenjenih rastlin z ekonomskega in okoljskega vidika. Nove rešitve uvajamo v domenah razumevanja velikih količin dokumentov za potrebe razvoja informacijske družbe. Z vključevanjem domačih podjetij v evropske raziskovalne programe bistveno povečujemo konkurenčnost slovenskega gospodarstva (G26-G29). G4, G7 in G8 - DRUŽBENI RAZVOJ, RAZVOJ DRUŽBENE INFRASTRUKTURE in VAROVANJE ZDRAVJA/ZDRAVSTVENO VARSTVO: Realizirali smo vrsto aplikacij za vrednotenje izobraževalnih programov (G41), vrednotenje upravnih e-portalov (G43) ter analizo znanosti (G43). Razvili smo model za izboljšanje pokritosti slovenskih regij z medicinskim osebjem in storitvami (MediNet in MediNet+). Sodelujemo pri projektu analize IKT infrastrukture za potrebe slovenske vojske (VIZIPIN) ter za potrebe evropske logistične mreže (EURIDICE). Rezultati imajo velik družbeno-ekonomski pomen (G4), saj služijo kot pomoč pri spremljanju in načrtovanju zdravstvene, informacijske in logistične mreže ter tako prispevajo k razvoju zdravstvenega varstva (G8), IK (G71) in prometne infrastrukture (G72). G5 - OHRANJANJE IN RAZVOJ NACIONALNE NARAVNE IN KULTURNE DEDIŠČINE IN IDENTITETE: Naše delo prispeva k temu, da slovenščina enakopravno nastopa med jeziki, ki jih je mogoče obdelovati z modernimi računalniškimi metodami, kar se uporablja pri poučevanju, proučevanju in informatizaciji slovenskega jezika. S projektoma VoiceTran I in II smo doprinesli k razvoju govornega prevajalnika, v sodelovanju z EU JRC razvili 20 jezični vzporedni korpus zakonodaje EU, v sodelovanju s FF naredili referenčni korpus slovenskega jezika FIDA(-plus), japonsko-slovenski učni slovar jaSlo ter slovenski semantični leksikon sloWNet, z ZRC pa digitalno knjižnico tekstno-kritičnih izdaj slovenskega slovstva. Vsi rezultati in programske rešitve so javno dostopni. G6 - VAROVANJE OKOLJA IN TRAJNOSTNI RAZVOJ: Raziskovalni projekti EU: SIGMEA, ECOGEN in Co-EXTRA se ukvarjajo s tematiko varovanja okolja in trajnostnega razvoja. S tem tehnologije znanja bistveno prispevajo k razumevanju kompleksnih sistemov okolja. C. IZJAVE Podpisani izjavljam/o, da: • so vsi podatki, ki jih navajamo v poročilu, resnični in točni • se strinjamo z obdelavo podatkov v skladu z zakonodajo o varstvu osebnih podatkov za potrebe ocenjevanja, za objavo 5., 6. in 7. točke na spletni strani http://sicris.izum.si/ ter obdelavo teh podatkov za evidence ARRS • so vsi podatki v obrazcu v elektronski obliki identični podatkom v obrazcu v pisni obliki Podpisi: vodja raziskovalnega programa zastopniki oz. pooblaščene osebe raziskovalnih organizacij in/ali koncesionarjev Nada Lavrač in/ali Institut "Jožef Stefan" Univerza v Novi Gorici Program P2-0103 Stran 21 od 23 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 Kraj in datum: Ljubljana, Nova Gorica 15.4.2009 Oznaka poročila: ARRS_ZV_RPROG_ZP_2008/1220 1 Napišite kratko vsebinsko poročilo, kjer boste predstavili raziskovalno hipotezo in opis raziskovanja. Navedite ključne ugotovitve, znanstvena spoznanja ter rezultate in učinke raziskovalnega programa. Največ 21.000 znakov vključno s presledki (približno tri in pol strani, velikosti pisave 11). Nazaj 2 Največ 3000 znakov vključno s presledki (približno pol strani, velikosti pisave 11). Nazaj 3 Samo v primeru bistvenih odstopanj in sprememb od predvidenega programa raziskovalnega programa, kot je bil zapisan v predlogu raziskovalnega programa. Največ 3.000 znakov vključno s presledki (približno pol strani, velikosti pisave 11). Nazaj 4 Navedite največ pet najpomembnejših znanstvenih rezultatov programske skupine, ki so nastali v času trajanja programa v okviru raziskovalnega programa, ki je predmet poročanja. Za vsak rezultat navedite naslov v slovenskem in angleškem jeziku (največ 150 znakov vključno s presledki), rezultat opišite (največ 600 znakov vključno s presledki) v slovenskem in angleškem jeziku, navedite, kje je objavljen (največ 500 znakov vključno s presledki), izberite ustrezno šifro tipa objave po Tipologiji dokumentov/del za vodenje bibliografij v sistemu COBISS ter napišite ustrezno COBISS.SI-ID številko bibliografske enote. Navedeni rezultati bodo objavljeni na spletni strani http://sicris.izum.si/. PRIMER (v slovenskem jeziku): Naslov: Regulacija delovanja beta-2 integrinskih receptorjev s katepsinom X; Opis: Cisteinske proteaze imajo pomembno vlogo pri nastanku in napredovanju raka. Zadnje študije kažejo njihovo povezanost s procesi celičnega signaliziranja in imunskega odziva. V tem znanstvenem članku smo prvi dokazali… (največ 600 znakov vključno s presledki) Objavljeno v: OBERMAJER, N., PREMZL, A., ZAVAŠNIK-BERGANT, T., TURK, B., KOS, J.. Carboxypeptidase cathepsin X mediates ß2 - integrin dependent adhesion of differentiated U-937 cells. Exp. Cell Res., 2006, 312, 2515-2527, JCR IF (2005): 4.148 Tipopologija: 1.01 - Izvirni znanstveni članek COBISS.SI-ID: 1920113 Nazaj 5 Navedite največ pet najpomembnejših družbeno-ekonomsko relevantnih rezultatov programske skupine, ki so nastali v času trajanja programa v okviru raziskovalnega programa, ki je predmet poročanja. Za vsak rezultat navedite naslov v slovenskem in angleškem jeziku (največ 150 znakov vključno s presledki), rezultat opišite (največ 600 znakov vključno s presledki) v slovenskem in angleškem jeziku, izberite ustrezen rezultat, ki je v Šifrantu raziskovalnih rezultatov in učinkov (Glej: http://www.arrs.gov.si/sl/gradivo/sifranti/sif-razisk-rezult.asp), navedite, kje je rezultat objavljen (največ 500 znakov vključno s presledki), izberite ustrezno šifro tipa objave po Tipologiji dokumentov/del za vodenje bibliografij v sistemu COBISS ter napišite ustrezno COBISS.SI-ID številko bibliografske enote. Navedeni rezultati bodo objavljeni na spletni strani http://sicris.izum.si/. Nazaj 6 Pomen raziskovalnih rezultatov za razvoj znanosti in za razvoj Slovenije bo objavljen na spletni strani: http://sicris.izum.si Nazaj 7 Največ 4.000 znakov vključno s presledki Nazaj 8 Največ 4.000 znakov vključno s presledki Nazaj 9 Za raziskovalce, ki niso habilitirani, so pa bili mentorji mladim raziskovalcem, se vpiše ustrezen podatek samo v stolpec MR Nazaj 10 Vpisuje se uredništvo revije, monografije ali zbornika v skladu s Pravilnikom o kazalcih in merilih znanstvene in strokovne uspešnosti (Uradni list RS, št. 39/2006,106/2006 in 39/2007), kar sodi tako kot mentorstvo pod sekundarno avtorstvo, in delo (na zlasti nacionalno pomembnim korpusu ali zbirki) v skladu z 3. in 9. členom istega pravilnika. Največ 1000 znakov (ime) oziroma 150 znakov (število) vključno s presledki. Nazaj 11 Navedite oziroma naštejte konkretne projekte. Največ 12.000 znakov vključno s presledki. Nazaj Program P2-0103 Stran 22 od 23 Zaključno poročilo o rezultatih raziskovalnega programa v obdobju 2004-2008 12 Navedite konkretne projekte, kot na primer: industrijski projekti, projekti za druge naročnike, državno upravo, občine ipd. in ne sodijo v okvir financiranja pogodb ARRS. Največ 9.000 znakov vključno s presledki. Nazaj 13 Navedite objavo oziroma prevod (soobjavo) članov programske skupine strokovnega prispevka v slovenskem jeziku, ki se nanaša na povezavo znanja s slovenskim prostorom in za slovensko znanstveno terminologijo (Cobiss tip 1.04, 1.06, 1.07, 1.08, 1.09, 1.17, 1.18, 2.02, 2.03, 2.04, 2.05, 2.06). Napišite naslov (največ 150 znakov vključno s presledki), kratek opis (največ 600 znakov vključno s presledki), navedite, kje je objavljen/a (največ 500 znakov vključno s presledki) ter napišite ustrezno COBISS.SI-ID številko bibliografske enote. Nazaj 14 Navedite objavo oziroma prevod (soobjavo) članov programske skupine, povezano s popularizacijo znanosti (Cobiss tip 1.05, 1.21, 1.22, 2.17, 2.19, 3.10, 3.11, 3.12). Napišite naslov (največ 150 znakov vključno s presledki), kratek opis (največ 600 znakov vključno s presledki), navedite, kje je objavljen/a (največ 500 znakov vključno s presledki), ter napišite ustrezno COBISS.SI-ID številko bibliografske enote. Nazaj 15 Komentar se nanaša na 18. točko in ni obvezen. Največ 3.000 znakov vključno s presledki. Nazaj Obrazec: ARRS-ZV-RPROG-ZP/2008 v1.00a Program P2-0103 Stran 23 od 23