ZAKLJUČNO POROČILO O REZULTATIH OPRAVLJENEGA RAZISKOVALNEGA DELA NA PROJEKTU V OKVIRU CILJNEGA RAZISKOVALNEGA PROGRAMA (CRP) »KONKURENČNOST SLOVENIJE 2006 - 2013« I. Predstavitev osnovnih podatkov raziskovalnega projekta 1. Naziv težišča v okviru CRP: „ _ o v E i Težišče 1: Konkurenčno gospodarstvo in hitrejša rast - r;s leg j a\ • - o c p l v r; [, a Tematski sklop: Informacijska družba JAV ^A; NCIJA ZA R v ' ^ ^' • ■ Tema: Strategija in pilotna uvedba uporabe IKT v zdravs^)^^}'^ H ; _________.; 2. Šifra projekta: Preioto: iL;- ^üUd i._(Qji(/0-____ V2-0221 šifra nadeva: 3. Naslov projekta 3.1. Naslov projekta v slovenskem jeziku: Ike 3.2. Naslov projekta v angleškem jeziku: 4. Ključne besede projekta 4.1. Ključne besede projekta v slovenskem jeziku: zdravstveni portali, podpora odločanju, tehnologije znanja, odkrivanje znanj iz podatkov 4.2. Ključne besede projekta v angleškem jeziku: health care portals, decision support, knowledge management, data mining 5. ^aziv nosilne raziskovalne organizacije: 0510 Univerza v Ljubljani Obrazec ARRS-RI-CRP-ZP/2008 Stran 595 od 10 5.1. Seznam sodelujočih raziskovalnih organizacij (R0): 0106 - Institut "Jožef Stefan" (Odsek za inteligentne sisteme) 0312 - Klinični center, Ljubljana (SPS Kirurška klinika, Klinični oddelek za travmatologijo)_ 6. Sofinancer/sofinanceiji: Ministrstvo za visoko šolstvo, znanost in tehnologijo 7. Šifra ter ime in priimek vodje projekta: 12536 Blaž Zupan Datum: 1. 10.2008 Podpis vodje projekta: prof. dr. Blaž Zupan Podpis in žig izvajalca: prof. dr. Andreja Kocijančič, rektorica Po pooblastilu [[J^^^^TTranc Solina, ^kan Obrazec ARRS-RI-CRP-ZP/2008 Stran 596 od 10 n. Vsebinska struktura zaključnega poročila o rezultatih raziskovalnega projekta v okviru CRP 1. Cilji projekta: 1.1. Ali so bili cilji projekta doseženi? ^ a) v celoti b) delno c) ne Če b) in c)Je potrebna utemeljitev. 1.2. Ali so se cilji projekta med raziskavo spremenili? a) da b) ne Če so se, je potrebna utemeljitev: Obrazec ARRS-RI-CRP-ZP/2008 Stran 597 od 10 2. Vsebinsko poročilo o realizaciji predloženega programa dela'; Projekt je v planu predvidel izdelavo spletnega portala za razvoj napovednih modelov, spletne lupine podporo odločanja, testno uporabo in pilotno uvedbo teh orodij na Kliničnem centru v Ljubljani, ter v zaključku predlog strategije izdelave in uvajanja razvite tehnologije v zdravstvu. V izvedbi smo sledili predlaganemu programu, plan dela pa v veliki meri razširili na razvoj podobnih portalov na področju biomedicine. Tako smo kot rezultat projekta razvili tri različne portale: 1. Portal za podporo gradnje odločitvenih modelov v okolju Google Home Page, 2. DictyExpress, portal za pregledovanje in analizo podatkov o genskih izrazih organizma £). discoideum, 3. STEROLTALK Express, portal za pregledovanje in analizo podatkov o genskih izrazih na področju raziskav genskih poti vezanih na metabolizem holesterola. Portali uporabljajo dve različni tehnologiji. Prva temelji na programskih okoljih Google, tar na zasnovi komponent, ki uporabljajo tehnologijo JavaScript in Ajax za uporabniški vmesnik, ter komimicirajo s komponentami za analizo podatkov in gradnjo napovednih modelov na strežniku. Druga dva, kasneje razvita portala pa za grafični uporabniški vmesnik uporabljata okolje Adobe Flash, ter, podobno kot pri prvem portalu, komunicirata s strežniškimi komponentami. Izkušnje pri uporabi teh tehnologij, tudi v primerjavi z uporabo klasičnih tehnologij, so: 1. Okolje Adobe Flash in pripadajoče razvojno okolje Adobe Flex omogoča hiter razvoj spletnih aplikacij, ki so izrazito interaktivne, grafično in oblikovalsko všečne, ter enostavne za uporabo. 2. Vse numerično zahtevnejše operacije in obdelavo podatkov je potrebno implementirati na strežnikih, saj je okolje Flash prepočasno za izvajanje računsko kompleksnejših operacij. 3. Tehnologije kot je Google Home Page je sicer privlačna s stališča souporabe že ostalih razvitih komponent, a je razvoj aplikacij v tem okolju bistveno težavnejši, razvite aplikacije pa grafično veliko bolj okome od teh, ki so razvite za okolje Flash. 4. V primeijavi z standardnimi starejšimi tehnologijami, kot so CGI, ASP in PHP nudijo aplikacije razvite za okolje Flash veliko več interaktivnosti, boljši in bolj odziven predvsem pa enostavnejši grafični vmesnik. 5. Za bolj kompleksne aplikacije je potrebno kombinirati bolj zahtevne razvojne sisteme (kot so Ruby on Rails, TurboGears, ipd.), znotraj teh pa v namene kombiniranja interaktivnosti in uporabnega grafičnega vmesnika uporabiti komponente razvite v okolju Flash. 6. Razviti portali morajo poleg osnovnih zahtevanih funkcij omogočati uporabniku shranjevanje stanja aplikacije, možnost izdelave poročil, ter pošiljanje sporočil s povezavo na aplikacijo in njenim trenutnim stanjem. Aplikacija naj podpira tudi shranjevanje stanja z zaznamki (angl. bookmarks) in primere uporabe, ki so _pravzaprav posebne vrste zaznamkov._ ^ Potrebno je napisati vsebinsko raziskovalno poročilo, kjer mora biti na kratko predstavljen program dela z raziskovalno hipotezo in metodološko-teoretičen opis raziskovanja pri njenem preveganju ali zavračanju vključno s pridobljenimi rezultati projekta. Obrazec ARRS-RI-CRP-ZP/2008 Stran 598 od 10 Nekaj zaslonskih posnetkov razvitih portalov podajamo spodaj. Tu naj le pripomnimo, da gre za statične slike, in da je za pravo uporabniško izkušnjo potreben obisk spletnih strani portalov. Slednje še posebej velja za oba portala, razvita za okolje Flash. a) b) C) : Model Management Models Create Upload SB®: : Model Management .....-":v............ Models Create Upload [/home/marko/Pesktop/h Broy es®' Model Management Models Create Upload Build another model SBS' No data file chooser), Create predictive models Filename: hhs.tab Cases: 112 Outcome: HHS (dober, odličen, slab] 5 input features: • age (mlad, star) - diabetes (da, ne) - neuro (da, ne] - pulmonary (da, ne} • cardiological (da, ne] choose l^rget Class: QdoberOodlicen^slab lOOVe Create predictive models Naive Bayes AUC: 0.622 CA: 0.472 Sens.: 0,457 Spec.: 0,983 Slika 1. Komponenta za upravljanje s podatki in gradnjo modela v okolju Google Home Page SL Model Management Models :; Create Upload adult-sample - logistic Harris Hip Score • data 1 Harris Hip Score - data 2 Harris Hip Score - data 3 : diabetes Janez : Hip S8iH! Predictions BS® Predictions 'ActioÖ 'Action... 'Action,.. Action... down io a d deiet« predict publicize ages star BBgi N/A diabetc O pulmonary=da N/A Slika 2. Uporaba gradnika za podporo pri odločanju v okolju Google Home Page Obrazec ARRS-RI-CRP-ZP/2008 Stran 599 od 10 "5 üiclyL*pres5 - fAajill.i Fircfox Ele gA Htn Kttory eodonaria ^nfMi Toeb ad» ddJM.iu IHI i»8: [y hl»-//**"' MI»- p'iralue threshold Enhchm«nt fc*l« Btfltoglea) simpl pk«R- Slika 3. DictyExpres, portalna rešitev za preiskovanje in analizo genomskih podatkov o amebi D. discoideum. Gre za izvirni projekt, ki je na področju bioinformatike poseben, saj omogoča popolno interaktivnost in delo s spletno aplikacijo na način, kot bi bila ta implementirana v namiznem okolju. Obrazec ARRS-RI-CRP-ZP/2008 Stran 600 od 10 Sunitalk £ii|*«M' eoo i Vptfitff } •1 '/»» OJOl <0.9l]> tJ7 J OtMlfll . _ C [ Jpdau j Namg P*vilue AvgE AtfjP Afts DeserV^ien THfttIN' 3/7 KJOSEJ.XA KAOlF'XlSO« t.OSoH 9S30*2'F>P5^ fam«iv<lir-I>Ct9»9llC>rKCl> •f «lluiirblmrotiMtlc rM«s» IT>.t ' <«ttk>lirfrloivnthctlc fr^ceil stuyrHHtie prvceis «et'ulir^ivsr'AhctiC 91M«9S »—»i—" OmMBn^ohnHiAAm^f« p-valirt Ch/^shoii 5V»iilsf»y l'SČ'nV üeb it t'-OO» " ■ T I '_; SH3M9 S,35e-: Nltl«> <.:2t-2 evl>II6 i.JOt-J SC» 1.7>g-3 NI111<2 lAle-l »»AtCCI 1,7(0-2 Cy»!Cl S.23e-2 AI'OS 1.92«-2 »eis le 4.310-2 VDIt{N«l 5.t6o-2 -2,7!o- 1.4« 9e7«.2 ES^EVEi.K SHXsrrtlln .6.31b- 1.31 I77«.l TLL.TLIXri nul I OS«.l /lolfeu-d -2.S3«. :.42»1 I OSo-l DKZgSatC lll I lEHi.PSC-: Mrniiem -S.7{«- 1J7 ItOol A0(ac9«n< lot iJmJ1«Htl4t I Update j y-- i'^-i""'«""« Li Arrant 0 1.0 t« 'yiKit-^'« ynU« ii Oieiyntheii» .er^lcrol^i m lg-;. Slika 4. STEROLTALK Express, portalna rešitev za preiskovanje in osnovno analizo podatkov s področja raziskav genov udeleženih v metabolnih poteh holesterola. Portal seje zgledoval po takrat že razvitem portalu DictyExpress in ponovno uporabil eno od komponent (GO Term Finder, v ozadju). Vse tri portale smo razvili prototipno, pri tem sodelovali z uporabniki, portale nato skupaj z uporabniki testirali na različnih primerih uporabe. Vsi trije portali so sedaj zgrajeni in v redni uporabi s strani uporabnikov, s katerimi smo sodelovali pri njihovi izgradnji. Okvir treh let je bil prekratek, da bi v tem času za vsakega od portalov že imeli v objavo sprejeto publikacijo oz. že imeli bazo zunanjih uporabnikov, ki bi na portale prišli na osnovi teh publikacij. So pa te akcije v planu (publikacija za DictyExpress je na primer že v oddaji v revijo BMC Bioinformatics\ obveščanje potencialnih uporabnikov po drugih kanalih (poštni seznami) pa v načrtu takoj po sprejetju publikacij v tisk. Obrazec ARRS-RI-CRP-ZP/2008 Stran 601 od 10 3. Izkoriščanje dobljenih rezultatov: 3.1. Kakšen je potencialni pomen^ rezultatov vašega raziskovalnega projekta za: a) odkritje novih znanstvenih spoznanj; b) izpopolnitev oziroma razširitev metodološkega instrumentarija; c) razvoj svojega temeljnega raziskovanja; ___ d) razvoj drugih temeljnih znanosti; ^ e) razvoj novih tehnologij in drugih razvojnih raziskav. 3.2. Označite s katerimi družbeno-ekonomskimi cilji (po metodologiji OECD-ja) sovpadajo rezultati vašega raziskovalnega projekta: a) razvoj kmetijstva, gozdarstva in ribolova - Vključuje RR, ki je v osnovi namenjen razvoju in podpori teh dejavnosti; b) pospeševanje industrijskega razvoja - vključuje RR, ki v osnovi podpira razvoj industrije, vključno s proizvodnjo, gradbeništvom, prodajo na debelo in drobno, restavracijami in hoteli, bančništvom, zavarovalnicami in drugimi gospodarskimi dejavnostmi; c) proizvodnja in racionalna izraba energije - vključuje RR-dejavnosti, ki so v funkciji dobave, proizvodnje, hranjenja in distribucije vseh oblik energije. V to skupino je treba vključiti tudi RR vodnih virov in nuklearne energije; d) razvoj infrastrukture - Ta skupina vključuje dve podskupini: • transport in telekomunikacije - Vključen je RR, kije usmeijen v izboljšavo in povečanje varnosti prometnih sistemov, vključno z vamos^o v prometu; • prostorsko planiranje mest in podeželja - Vključen je RR, ki se nanaša na skupno načrtovanje mest in podeželja, boljše pogoje bivanja in izboljšave v okolju; e) nadzor in skrb za okolje - Vključuje RR, kije usmeijen v ohranjevanje fizičnega okolja. Zajema onesnaževanje zraka, voda, zemlje in spodnjih slojev, onesnaženje zaradi hrupa, odlaganja trdnih odpadkov in sevanja. Razdeljen je v dve skupini: ^ f) zdravstveno varstvo (z igemo onesnaževanja) - Vključuje RR - programe, ki so usmeijeni v varstvo in izboljšanje človekovega zdravja; g) družbeni razvoj in storitve - Vključuje RR, ki se nanaša na družbene in kulturne probleme; h) splošni napredek znanja - Ta skupina zajema RR, ki prispeva k splošnemu napredku znanja in ga ne moremo pripisati določenim ciljem; i) obramba - Vključuje RR, ki se v osnovi izvaja v vojaške namene, ne glede na njegovo vsebino, ali na možnost posredne civilne uporabe. Vključuje tudi varstvo (obrambo) pred naravnimi nesrečami. 2 Označite lahko več odgovorov. Obrazec ARRS-RI-CRP-ZP/2008 Stran 602 od 10 3.3. Kateri so neposredni rezultati vašega raziskovalnega projekta glede na zgoraj označen potencialni pomen in razvojne cilje?_ Neposredni praktični rezultati pričujočega projekta so trije portali namenjeni analizam in pregledovanju podatkov na področju biomedicine, in sicer: - portal za podporo gradnje odločitvenih modelov v okolju Google Home Page, - DictyExpress, portal za pregledovanje in analizo podatkov o genskih izrazih organizma D. discoideum^ - STEROLTALK Express, portal za pregledovanje in analizo podatkov o genskih izrazih na področju raziskav genskih poti vezanih na metabolizem holesterola. Vsi navedeni portali so v fazi testiranja s strani širšega kroga uporabnikov (t.j., uporabnikov izven sodelujoče razvojne skupine). Za sodelujočo raziskovalno skupino je neposredni rezultat tudi razvito razvojno okolje in spremljajoča orodja, ki omogočajo hiter razvoj portalov. Tako je bil razvojni cikel za DictyExpress daljši od pol leta, na podlagi tam razvitega okolja in orodij pa je bil čas razvoja portala STEROLTALK Express samo en mesec. Z razvojem tovrstnih portalov nadaljujemo; trenutno je v razvoju portal za odkrivanje informativnih interakcij genov (SNP-SNP) v človeškem genomu, ki se v testoi fazi uporablja pri odkrivanju genetskih predispozicij za revmatoidni artritis. 3.4. Kakšni so lahko dolgoročni rezultati vašega raziskovalnega projekta glede na zgoraj označen potenciahii pomen in razvojne cilje?_ Predvsem na področju biomedicine so se tekom izvajanja pričujočega projekta tehnologije, namenjene izgradnji portalov, popolnoma spremenile. V projektu smo želeli uporabiti najsodobnejše tehnologije, ki uporabniku omogočajo poleg enostavne uporabe tudi interaktivno izkušnjo, kjer se vsaj del portala odziva na način, kot gaje uporabnik vajen pri namiznih aplikacijah. S prehodom na tehnologijo Flash aplikacij in povezave teh z namenskim račimskim strežnikom nam je to uspelo. Obstoječi portali v biomedicini in zdravstvu dandanes še temeljijo na starih tehnologijah (tipa CGI, ASP, PHP). Portali, razviti v tem projektu, zato pomenijo pionirsko delo, ki ga v tej fazi nagrajuje predvsem navdušenje testnih uporabnikov - ekspertov, v fazi nadaljnje uporabe pa bi se moralo to kazati v številu uporabnikov in številu podobnih aplikacij, ki se bodo zgledovale po teh, razvitih v pričujočem projektu. S stališča strokovnega dela projektne skupine pa je rezultat dela predvsem razvoj tehnologij, ki nam bo od sedaj dalje omogočal enostavni, prototipni razvoj portalov na različnih področjih biomedicine in zdravstva. Obrazec ARRS-RI-CRP-ZP/2008 Stran 603 od 10 3.5. Kje obstaja veijetnost, da bodo vaša znanstvena spoznanja deležna zaznavnega odziva? a) v domačih znanstvenih krogih; ^ b) v mednarodnih znanstvenih krogih; ^ c) pri domačih uporabnikih; ^ d) pri mednarodnih uporabnikih. 3.6. Kdo (poleg sofinanceijev) že izraža interes po vaših spoznanjih oziroma rezultatih? Uporabniki. Portal DictyExpress bo ob javni objavi tega portala koncem tega leta (čakamo na sprejetje članka v reviji BCM Bioinformatics) pričela uporabljati predvidoma večja skupina uporabnikov - raziskovalcev tega organizma. Na svetuje namreč skupaj okoli 100 laboratorijev, ki raziskujejo ta modelni organizem, DictyExpress pa edina aplikacija te vrste na svetu. STEROLTALK Express danes že uporabljajo sodelavci projekta EU (FP6) STEROLTALK. Tudi ta aplikacije je, zaradi v njej vključenih podatkov, edina te vrste in edina, ki vključuje to stopnjo interaktivnosti. 3.7. Število diplomantov, magistrov in doktoijev, ki so zaključili študij z vključenostjo v raziskovalni projekt?_ 10 diplomskih del (Borovnik Damjan, Papić Tine, Janež Miha, Cigoj Simon, Toplak Marko, Krivec Aleš, Tome Jure, Rot Gregor, Cankar Matic, Žagar Lan) - 3 doktorska dela (Curk Tomaž, Leban Gregor, Pivk Aleksander) 4. Sodelovanje z tujimi partnerji: 4.1. Navedite število in obliko formalnega raziskovalnega sodelovanja s tujimi raziskovalnimi institucijami._ Baylor College of Medicine, Department of Molecular and Human Genetics (bilateralni projekt SI-ZDA »Računski pristopi in orodja za funkcijsko genomiko in kemogenomiko amebe Dictyostelium«) Universita degli Studi di Pavia, Dipartimento di Informatica e Sistemistica (bilateralni projekt SI-IT » Metode umetne inteligence za odkrivanje znanj v funkcijski genomiki«) Obrazec ARRS-RI-CRP-ZP/2008 Stran 604 od 10 4.2. Kakšni so rezultati tovrstnega sodelovanja? Baylor College of Medicine j e bil naš glavni parter pri razvoj a portala DictyExpress, njegov Department of Molecular and Human Genetics pa tudi osrednja institucija, ki je lastnik večine podatkov o izražanju genov organizma D. discoideum. Interaktivna narava portala, enostaven grafični vmesnik ter dejstvo, da je aplikacija zgrajena na edinstvenem naboru podatkov so lahko faktorji, ki bodo v naslednjih letih vplivali na popularnost razvitega sistema. Z Univerzo v Pavii sodelujemo že vrsto let na področju snovanja sistemov za pomoč pri odločanju v zdravstvu in biomedicini. Na tej instituciji smo tekom razvoja portalov te predstavili italijanskim raziskovalcem in ob tem dobili mnogo koristnih nasvetov. Razvite tehnologije (aplikacije Flash in strežniška orodja temelječa na sistemu za odkrivanje znanj iz podatkov Orange) so bila v mesecu septembru 2008 znova predstavljena v Pavii in bodo predstavljala okostje za skupen razvoj tovrstnih sistemov. Prvi tak, ki naj bi podprl delo raziskovalcev na področju tkivnega inženirstva, je že v fazi razvoja. 5. Bibliografski rezultati^: Za vodjo projekta in ostale raziskovalce v projektni skupini priložite bibliografske izpise za obdobje zadnjih treh let iz COBISS-a) oz. za medicinske vede iz Inštituta za biomedicinsko informatiko. Na bibliografskih izpisih označite tista dela, ki so nastala v okviru pričujočega projekta. 6. Druge reference'* vodje projekta in ostalih raziskovalcev, ki izhajajo iz raziskovalnega projekta;_ okolje za podporo odkrivanja znanj iz podatkov Orange (www.ailab.si/orange') okolje za podporo analize podatkov na področju bioinformatike Orange Bioinformatics (www, ailab. si/orange/dovmloads) portal DicyExpress (www.ailab.si/DictvExpress') portal STEROLTALK Express (http://www.ailab.si/ste^ portalne tehnologije za gradnjo odločitvenih modelov in podporo odločanja v okolju Google Home Page (http://wvm.ailab.si/ghpdss) ® Bibliografijo raziskovalcev si lahko natisnete sami iz spletne strani:http:/www.izum.si/ Navedite tudi druge raziskovalne rezultate iz obdobja financiranja vašega projekta, ki niso zajeti v bibliografske izpise, zlasti pa tiste, ki se nanašajo na prenos znanja in tehnologije. Navedite tudi podatke o vseh javnih in drugih predstavitvah projekta in njegovih rezultatov vkljuCno s predstavitvami, ki so bile organizirane izključno za naročnika/naročnike projekta. Obrazec ARRS-RI-CRP-ZP/2008 Stran 605 od 10