Oznaka poročila: ARRS-RPROJ-ZP-2010-1/159 ZAKLJUČNO POROČILO O REZULTATIH RAZISKOVALNEGA PROJEKTA A. PODATKI O RAZISKOVALNEM PROJEKTU 1. Osnovni podatki o raziskovalnem projektu Šifra projekta J2-9699 Naslov projekta Računska fenomika Vodja projekta 12536 Blaž Zupan Tip projekta J Temeljni projekt Obseg raziskovalnih ur 5.400 Cenovni razred B Trajanje projekta 01.2007 - 12.2009 Nosilna raziskovalna organizacija 1539 Univerza v Ljubljani, Fakulteta za računalništvo in informatiko Raziskovalne organizacije - soizvajalke 106 Institut "Jožef Stefan" Družbeno- ekonomski cilj 13. Splošni napredek znanja - RiR financiran iz drugih virov (ne iz splošnih univerzitetnih fondov - SUF) 2. Sofinancerji1 1. Naziv Naslov 2. Naziv Naslov 3. Naziv Naslov B. REZULTATI IN DOSEŽKI RAZISKOVALNEGA PROJEKTA 3. Poročilo o realizaciji programa raziskovalnega projekta2 Osnovni cilj projekta je razvoj zbirke računskih pristopov za povezovanje visokorazsežnih fenotipov s pogoji, v katerih so bili merjeni. Rezultati projekta vključujejo razvoj novih metod za povezovanje kompleksnih opisov (npr. eksperimentalnih pogojev, strukture zdravil, zaporedij baz v promoterjih genov) s pripadajočimi genskimi fenotipi, razvoj odprtokodnih orodij za pripadajočo podatkovno analitiko, in eksperimentalni preskus in potrditev uporabnosti predlaganih pristopov ma podatkih modelnih organizmov kvasovke S. cerevisiae in socialne amebe D. dictyostelium. Natančneje rezultate našega dela predstavljeno znotraj šestih projektnih nalog (T1-T6): T1 Načrtovanje in razvoj metod iskanja zakonitosti iz podatkov za računsko fenomiko. Za iskanje zanimivih podskupin v podatkih, ki jih opredeljujejo opisne (vhodne) ter fenotipske (izhodne) spremenljivke smo razvili metode, ki temeljijo na kombinaciji razvrščanja s pomočjo metode voditeljev ter inteligentnih metodah vizualizacije rezultatov (VizRank, FreeViz). Metode smo implementirali v okviru prostokodnega sistema Orange, in jih preskusili na številnih domenah iz diagnostike in prognostike raka. Razvijali smo tehnike za odkrivanje interakcij med SNP-i in iskanje sinergičnih povezav, ki bi bile uporabne za napoved fenotipov. Glavni rezultat teh raziskav je spoznanje, da je zaradi narave podatkov (veliko več spremenljivk kot merjencev) bolje uporabiti enostavne tehnike odkrivanja interakcij in za preverjanje statistične značilnosti rezultatov uporabiti permutacijske teste. Razvili smo tehniko za zaznavanje osamelcev v transkriptomskih profilih ter v sodelovanju z Baylor College of Medicine uporabili te metode za analizo 20-ih sevov z mutiranimi ABC transporterji. Na danes največji objavljeni bazi podatkov o fenotipih dvojnih mutantov (podatkovna baze genetskih interakcij pri kvasovki Saccharomyces cerevisiae, ki vsebuje ~1500x4800 eksperimentalno določenih genetskih interakcij iz skupine C. Boone-a iz Toronta) smo opravili raziskave metod za napovedovanje epistatskih interakcij na osnovi kvantitativnih genomskih podatkov o genskih interakcijah. V bistvu gre za nadaljevanje razvoja naše metode GenePath (www.genepath.org), ki temelji na pravilih klasične genetike za določanje epistatskih interakcij ter gradi omrežje genov z njihovimi medsebojnimi interakcijami. T2 Implementacija in povezovanje metod. Tekom projekta smo v celoti prenovili odprtokodno orodje za iskanje zakonitosti iz podatkov Orange (gl. www.ailab.si/orange/downloads.asp) in vzpostavili novo okolje namenjeno bioinformatiki, imenovano Orange Bioinformatics.Slednje tako vključuje module in grafične uporabniške vmesnike za preiskovanje genskih ontologijo (Gene Ontology term enrichment), računanje obogatenosti genskih skupin (Gene Set Enrichment), preiskovanje biokemijskih poti v podatkovni bazi KEGG, dostop in prikazovanje podatkov iz baz NCBI (npr. NCBIGene in Gene Expression Omnibus), ter druge. Na novo smo postavili arhitekturo sistema Orange, ki sedaj vključuje strežnik za datoteke in z njimi povezane skripte, namenjene predobdelavi podatkov iz javnih podatkovnih baz. V drugi polovici projekta smo pričeli z implementacijo nove generacije (aktivna vloga uporabnika, grafični vmesniki) spletnih aplikacij, med katerimi je prva taka aplikacija dictyExpress (www.ailab.si/dictyExpress, ki je nedavno preko povezav na domačih straneh genov neposredno povezan z www.dictybase.org, osrednjim spletnim mestom za Dictyostelium discoideum). Podobna aplikacija, razvita za pregledovanje transkripcijskih podatkov iz eksperimentov na področju metabolizma holesterola je SteroltalkExpress (www.ailab.si/ste). Po vzoru aplikacije dictyExpress smo pred pol leta pričeli z razvoj aplikacij za obdelavo RNA- Seq podatkov. Aplikacija imenovana PIPA je danes že v redni uporabi na treh institucijah (Houston, Manchester, Cambridge), njena odlika pa sta enostavna uporaba in enostavno povezovanje z orodji za podatkovno analitiko v sistemu Orange. T3 Karakterizacija zdravil in sklepanje o relacijah med strukturo in aktivnostjo. Metodo za integracijo podatkov o genetskih interakcijah in genskem izražanju smo uporabili na lastnih podatkih iz eksperimentov z uporabo kemijske genomike, visokozmogljivostne genetike in transkriptomike. Podatki se nanašajo na deset različnih povzročiteljev motenj v celični homeostazi, z razponom od mutacij do farmakološko aktivnih majhnih molekul. V primerih, kjer smo za preverjanje uporabili obstoječe objavljene podatke, smo z ekspertnim znanjem preverjali pravilnost napovedi. Razvite metode temeljijo predvsem na tehnikah strojnega učenja in novih tehnikah odkrivanja podskupin iz heterogenih baz podatkov. T4 Analiza promoterskih zaporedij. Razvili smo metodo razvrščanja na osnovi pravil za namene odkrivanje podskupin genov s podobno strukturo regulatornih regij in podobnim profilom izražanja genov. analizirali podatke o izražanju genov nemutiranega organizma ter štirinajstih mutant, katerim so bili izbrisani posamezni geni iz zapisa DNA. Z algoritmom smo za D. dictostelium odkrili pravila, ki opisujejo in razvrščajo 3600 genov v 700 delno prekrivajočih skupin. Naši rezultati analize promotorskih zaporedij D. discoideum (skupaj s povezavo na ustrezno spletno stran) so od začetka 2008 vključeni v www.dictybase.org, ki beleži približno 60.000 ogledov mesečno. T5 Funkcijska genomika z visokorazsežnimi fenotipi. Metode, razvite in implementirane v T1 in T2 ter podatki iz T3 so bili vsi uporabljeni v raziskavah pri D. discoideum in S. cerevisiae. Eden najbolj pogosto uporabljanih visokorazsežnih fenotipov so kvantitativni podatki o hitrosti rasti v kontekstu perturbacije vseh genov v genomu. V kvasovki Saccharomyces cerevisiae to dosežemo z uporabo zbirke delecijskih mutant vseh genov. Kvasovke so zaradi dolgoletnih intenzivnih raziskav najbolje poznan evkariontski organizem na molekulski ravni, kar predstavlja prednost pri uporabi tega organizma za preučevanju vpliva različnih kemijskih substanc na evolucijsko ohranjene celične procese. Zaradi razvitih tehnik funkcijske genomike pri kvasovki S. cerevisiae je možno analizirati vpliv preiskovane kemikalije na globalni, genomski ravni, kjer preučimo vpliv na vse celične procese. Evolucijska ohranjenost osnovnih celičnih procesov nam nato omogoča ekstrapolacijo rezultatov tudi na druge organizme. Z metodo kemogenomike na kvasovki S. cerevisiae smo merili rast ~4700 delecijskih mutant posameznih neesencialnih genov, s čimer smo določili nabor prekomerno občutljivih ter prekomerno odpornih sevov. Za kvantitativno oceno hitrosti rasti smo uporabili lasten novorazvit postopek (Mattiazzi s sod. (2010) Mol Genet Genomics, v tisku), ki je natančnejši od postopkov, ki jih uporabljajo konkurenčni laboratoriji. Pridobili smo eksperimentalne kemogenomske podatke za nabor različnih substanc, ki vplivajo na homeostazo celičnih membran oziroma na lipidni metabolizem ter izgradili interno podatkovno bazo. Analiza podatkov nam je omogočila izdelavo hipotez o molekulskem mehanizmu delovanja nekaterih zdravil oziroma kemikalij (lokalni anestetiki, fenilbutirat, cink) oziroma patogeneze določenih bolezni (z lipidi posredovane bolezni, posebej diabetes tipa 2, nevrodegenerativne bolezni) v modelnem evkariontskem organizmu. Alternativni tip visokorazsežnih fenotipov, ki vedno bolj pridobiva na pomenu, prihaja s področja visokozmogljive mikroskopije. V sodelovanju s skupino prof. Seppa D. Kohlweina z Univerze v Gradcu iz Avstrije smo razvili novo metodo za zajemanje in analizo podatkov z uporabo visokozmogljive mikroskopije na genomski ravni pri kvasovki S. cerevisiae. V študiji, kjer smo demonstrirali uporabnost in moč pristopa, smo potrdili identifikacijo vseh 17 znanih genov, potrebnih za nastanek organelov peroksisomov, ter odkrili dva nova gena (Wolinski s sod. (2009) J Proteome Res 8:20). T6 Razširjanje programske opreme. Orange Bioinformatics je modul sistema Orange. Oba sta prosto dostopna (v odprti kodi) na Internetu. Vse ostale aplikacije (npr. dictyExpress, SteroltalkExpress, Pipa) so spletne aplikacije, ki lahko delujejo v večini sodobnih brskalnikov in ne potrebujejo posebne instalacija. Za vse te aplikacije smo razvili svoje spletne strani, dodali dokumentacijo, filme z primeri uporabe, ter podpiramo uporabnike ali preko forumov ali pa preko elektronske pošte. Sodelovanja s tujimi institucijami. Mnogo dela v 2008 je bilo opravljenega v sodelovanju z našimi dolgoletnimi sodelavci na Department of Molecular and Human Genetics (G. Shaulsky, A. Kuspa), Baylor College of Medicine, Houston, ZDA, Yeast Genetics and Molecular Biology Group (Sepp D. Kohlwein), University of Graz, Austrija, ter z Interdisciplinary Center for Tissue Engineering, University of Pavia (R. Bellazzi, M. Zuccotti, M. Sampaolesi), Italija. V letu 2008 smo vzpostavili sodelovanje na področju post-transkripcijskih regulatornih omrežij z Laboratory of Molecular Biology (J. Ule), Medical Research Council, Cambridge, Velika Britanija, ter na področju genetskih interakcij s Terrence Donnelly Centre for Cellular and Biomolecular Research (C. Boone), University of Torronto, Kanada. 4. Ocena stopnje realizacije zastavljenih raziskovalnih ciljev- Projekt je dosegel vse zastavljene cilje. Razvili smo vrsto novih računskih metod, te implementirali v programskih sistemih, ki so danes v redni uporabi s strani mednarodne raziskovalne skupnosti (pri tem še posebej izpostavljamo DictyExpress in Orange Bioinfomatics). Razvite tehnike smo uspešno preverili tudi v praksi, kar priča vrsta publikacij s partnerji - molekularnimi biologi - v revijah s področja funkcijske genetike in sistemske biologije. 5. Utemeljitev morebitnih sprememb programa raziskovalnega projekta4 Projekt smo izvajali v skladu s prvotno zastavljenimi cilji in nalogami. 6. Najpomembnejši znanstveni rezultati projektne skupine- Znanstveni rezultat 1 interaktivna spletna aplikacija za analitiko genskih podatkov o amebi D. 1. Naslov SLO discoideum ANG Interactive web application for analytics of gene expression data on social amoeba D. discoideum Opis SLO Razvili smo interaktivno spletno aplikacijo imenovano dictyExpress (www.ailab.si/dictyexpress), ki uporabniku na enostaven način ponuja sicer rezultate kompleksnejših analiz transktiptomskih podatkov o mutantih socialne amebe D. discoideum. Razvite metode in aplikacija so plod sodelovanja z raziskovalci iz Baylor College of Medicine. Na aplikacijo kažejo direktne povezave iz spletne strani tega organizma (www.dictybase.org) in je od oktobra 2009 v stalni uporabi s strani raziskovalcev tega organizma. ANG We have developed an interactive web application called dictyExpress (www.ailab.si/dictyexpress), which offers a complex gene expression data analytics in a easy-to-use graphical interface. The methods behind dictyExpress and the design of the application was done in collaboration with Baylor College of Medicine. dictyExpress is directly linked from D. discoideum's genome home page (www.dictybase.org) and is in frequent use by researchers worldwide since October 2009. Objavljeno v ROT, Gregor, PARIKH, Anup, CURK, Tomaž, KUSPA, Adam, SHAULSKY, Gad, ZUPAN, Blaž. DictyExpress: a dictyostelium discoideum gene expression database with an explorative data analysis web-based interface. BMC Bioinformatics, Aug. 2009, vol. 10, str. 1-18. Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 7219028 2. Naslov SLO Odkrivanje znanj iz podatkov o genskih izrazih s tehnikami tehnologije znanje ANG Knowledgde-based gene expression data mining Opis SLO Podatki o genskih izrazih so eden od osnovnih virov informacij v sistemski biologiji. Tipično vsebujejo veliko število zapisov (vsaj nekaj tisoč genov, številni poskusi), ki so mnogokrat močno šumni. Njihova integracija z ostalimi bazami podatkov in znanj v namene analize in pridobivanj novih spoznanj je zato nujna. V članku sva orisala zametke integrativne analitike na tem področju in nakazala smernice za razvoj novih metod. ANG Gene expression data sets is a typical and very rich source of information for systems biology research. Typically, they include many records (at least few thousands genes and possibly many different experiments). The data often includes much noise. Integration of this data with other data and knowledge sources, which are in systems biology in abundance, is a must for any data analytics. Paper discusses the developments in this field and outlines the directions for future research. Objavljeno v BELLAZZI, Riccardo, ZUPAN, Blaž. Towards knowledge-based gene expression data mining. Journal of biomedical informatics, 2007, vol. 40, no. 6, str. 787-802. Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 6188372 3. Naslov SLO Regulacija izražanja genov D. discoideum ANG Gene expression regulation in D. discoideum Opis SLO Razvili smo novo metodo razvrščanja profilov izražanja genov na podlagi pravil o strukturi promotorjev. Osnovana je na metodi za iskanje pravil v snopu CN2 in dreves za razvrščanje. Razširitev omogoča iskanje prekrivajočih pravil. Razvili smo hevristiko, ki bistveno omeji preiskovalni prostor. Razvito metodo smo uporabili za analizo promotorjev modelnega organizma D. discoideum, kar je bilo vključeno v referenčno bazo o organizmu (www.dictyBase.org) in objavljeno v skupni publikaciji. ANG We have developed a new rule-based clustering algorithm (RBC) that is able to infer the common promoter structure of co-expressed genes. RBC is based on the beam-search algorithm CN2 and the clustering-tree algorithm. Our extension allows the identification of overlapping groups of genes, and it implements a heuristic that drastically reduces the search space. We have applied RBC to model the promoter structure and gene expression of D. discoideum, which was included in the organism's reference database (www.dictyBase.org) and published in a joint publication. Objavljeno v FEY, P., GAUDET, P., CURK, T., ZUPAN, B., JUST, E.M., BASU. S., MERCHANT, S.N., BUSHMANOVA, Y.A., SHAULSKY, G., KIBBE, W.A., CHISHOLM. R.L.. dictyBase-a Dictyostelium bioinformatics resource update. Nucleic Acids Res., 2009, 37:D515-9 Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 6916180 4. Naslov SLO Modeliranje prepoznavanja sorodnih sevov D. discoideum ANG Modeling kin discrimination in D. discoideum Opis SLO Celično prepoznavanje sorodnih sevov določa stopnjo sodelovanja in posledično preživetje socialne amebe D. discoideum ob pomanjkanju hrane. Modelirali smo relacijo med dvema visoko polimorfnima genoma (lagB1, lagC1) in njuno vlogo pri prepoznavanju sorodnih sevov. Napovedni model smo zgradili na podlagi zapisa DNA polimorfnih mest v obeh genih in izmerjene stopnje segregacije med 29 sevi. Ugotovitve študije dajejo pomemben vpogled v evolucijo in mehanizme družbenega prepoznavanja in imunskega sistema. ANG Kin discrimination determines the cooperation and survival of social amoebas D. discoideum under starvation. We have modeled the relation between two highly polymorphic genes (lagB1 and lagC1) that play a crucial role in kin discrimination. The predictive model was built from sequence of polymorphic alleles in both genes and from strain segregation among 29 strains. The findings reveal the evolutionary origin of kin discrimination and provide an insight into the mechanisms of social recognition and immunity. Objavljeno v BENABENTOS, R., HIROSE, S., SUCGANG, R., CURK, T., KATOH, M., OSTROWSKI, E.A., STRASSMANN, J.E., QUELLER, D.C., ZUPAN, B., SHAULSKY, G., KUSPA, A.. Polymorphic members of the lag gene family mediate kin discrimination in Dictyostelium. Curr Biol, 2009, 19(7), 567-72. Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 7027796 5. Naslov SLO Nova metoda za zajemanje in analizo podatkov z uporabo visokozmogljive mikroskopije na genomski ravni pri kvasovki ANG A new method for image acquisition and data analysis using high-content microscopy on a genome-wide level in yeast Opis SLO V članku je opisana nova metoda za zajemanje in analizo podatkov z uporabo visokozmogljive mikroskopije na genomski ravni pri kvasovki S. cerevisiae, ki temelji na mikroskopiji živih celic s konfokalno mikroskopijo s samodejnim mikroskopom, kar omogoča analizo približno 1000 vzocev na dan. V študiji smo demonstrirali uporabnost in moč pristopa s potrditvijo identifikacije vseh 17 znanih genov, potrebnih za nastanek organelov peroksisomov, katerih odkrivanje s klasičnimi tehnikami je trajalo 15 let. ANG A new and improved method for image acquisition and data analysis using high-content microscopy on a genome-wide level in yeast is described in the article. The method is based on confocal microscopy using an automated microscope which enables analysis of app. 1000 samples per day. In the proof-of-concept study we confirmed the identity of all 17 known genes required for peroxisome biogenesis, which took 15 years to complete using more traditional approaches. Objavljeno v WOLINSKI, H., PETROVIČ, U., MATTIAZZI, M., PETSCHNIGG, J., HEISE, B., NATTER, K., KOHLWEIN, S. D. Imaging-based live cell yeast screen identifies novel factors involved in peroxisome assembly. Journal of proteome research, 2009, vol. 8, no. 1, str. 20-27. Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 22360871 7. Najpomembnejši družbeno-ekonomsko relevantni rezultati projektne skupine6 Družbeno-ekonomsko relevantni rezultat 1. Naslov SLO Analitični vmesnik do podatkov o ekspresiji in funkciji genov D. discoideum ANG Analytical interface to gene expression and function of D. discoideum Za raziskovalno skupnost modelnega organizma D. discoideum smo razvili Opis SLO spletni vmesnik za analizo in dostop do obsežnih podatkov o ekspresiji in funkciji genov (www.ailab.si/dictyExpress) [F.06]. Predstavlja novost glede načina dostopa do podatkov, saj poleg prikaza podatkov omogoča enostavno, interaktivno analizo izbranih genov. Dnevno ga uporablja ~15% raziskovalcev tega organizma po svetu. Vmesnik je vključen v referenčno bazo modelnega organizma (www.dictyBase.org) [F.16], ki beleži 60000 zadetkov mesečno. ANG For the D. discoideum research community, we have developed a web-based analytical interface for gene expression and function analysis (www.ailab.si/dictyExpress) [F.06]. It offers novel ways to visually interact with the data and to perform the analysis on selected genes. It is used daily by ~15% of D. discoideum researchers around the world. The interface is included in the reference database of this organism (www.dictyBase.org) [F.16], which receives 60000 hits monthly. Šifra F.06 Razvoj novega izdelka Objavljeno v ROT, G., PARIKH, A., CURK, T., KUSPA, A., SHAULSKY, G., ZUPAN, B.. dictyExpress: a Dictyostelium discoideum gene expression database with an explorative data analysis web-based interface. BMC Bioinformatics, 2009, 10:265. Tipologija 1.01 Izvirni znanstveni članek COBISS.SI-ID 7219028 2. Naslov SLO Gostujoči profesor na Universita di Pavia, Italija ANG Visiting professorship at University of Pavia, Italy Opis SLO Od septembra 2008 do junija 2009 je Blaž Zupan kot gostujoči profesor in raziskovalec deloval na Centru za tkivno inženirstvo na Univerzi v Pavii v Italiji. Tekom gostovanja je tam vzpostavil in organiziral skupino za bioinformatiko, katere cilj je razvoj informatičnih orodij za študij razvoja tkiv in zarodnih celic. V sodelovanju s prof. Riccardom Bellazzijem je tekom gostovanja izvedel vrsto tečajev s področja odkrivanja znanj in bioinformatike. ANG From September 2008 to June 2009 Blaž Zupan has been a Visiting Professor and Researcher at the Interdipartmental Center for Tissue Engineering at University of Pavia, Italy. In collaboration with Prof. Riccardo Bellazzi he has helped to set up a bioinformatics group whose role is development of informatics tools for to assist biologists in study of tissue development and development of stem cells. During the visit he has also given several courses on data mining and bioinformatics. Šifra B.05 Gostujoči profesor na inštitutu/univerzi Objavljeno v MULAS, Francesca, CURK, Tomaž, BELLAZZI, Riccardo, ZUPAN, Blaž. On quality of different annotation sources for gene expression analysis. Lect. notes comput. sci., str. 421-425. Tipologija 1.08 Objavljeni znanstveni prispevek na konferenci COBISS.SI-ID 7218516 3. Naslov SLO Obisk in raziskave na Univerzi v Toronu, Kanada ANG Visit and research at the University of Toronto, Canada Opis SLO V oktobru in novembru 2009 je član projektne skupine dr. Uroš Petrovič obiskal laboratorij prof. Igorja Štagljarja, utemeljitelja tehnike membranskega dvohibridnega sistema kvasovke, na Univerzi v Torontu v Kanadi. Namen obiska je bil seznanitev s tehniko ter z njeno uporabo identifikacija proteinskih interaktorjev Izh2 proteina, homologa adiponektinskega receptorja kvasovke. Identificiranih je bilo deset potencialnih interaktorjev Izh2. ANG In October and November 2009 Uroš Petrovič, a member of the project time, visited the laboratory if Igor Stagljar, who is the founder of the membrane yeast two-hybrid method, at the University of Toronto, ON, Canada. Te purpose of the visit was to learn the technique and apply it in the identification of protein-protein interactors of Izh2 protein, a yeast homolog of the adiponectin receptor. Ten potential interactors have been identified. Šifra B.05 Gostujoči profesor na inštitutu/univerzi Objavljeno v Letno poročilo Instituta »Jožef Stefan« za leto 2008. Tipologija 2.12 Končno poročilo o rezultatih raziskav COBISS.SI-ID 2073200 4. Naslov SLO Zaključeni doktorati mladih raziskovalcev, ki so se usposabljali v okviru projekta ANG Completion of a Ph.D. program by two young researchers, who have participated in the project Opis SLO Na projektu sta sodelovala poleg ostalih sodelovala tudi dva mlada raziskovalca, ki sta v okvriu projektnih vsebin pripravila in zagovorila svoj doktorat. To sta Tomaž Curk in Minca Mramor (menor: Blaž Zupan). Oba sta bila dejavna tudi pri prenosu pridobljenih znanj v prakso, ter pri publiranju svojih rezutatov v mednarodnih revijah. ANG Tomaž Curk and Minca Mramor (advisor: Blaž Zupan) were both young researchers that participated and much contributed to the project. They have both recently defended their Ph. D. Dissertations. Both have been very active in transfer of their knowledge in crafting practical solutions for the end users, and in publishing the results of their research in a peer-reviewed international journals. Šifra D.09 Mentorstvo doktorandom Objavljeno v MRAMOR, Minca. Gradnja napovednih modelov in odkrivanje znanja iz podatkov DNA mikromrež : [doktorska disertacija]. [Ljubljana: M. Mramor], 2010. XIV, 175 str., ilustr., tabele. Tipologija 2.08 Doktorska disertacija COBISS.SI-ID 250775808 5. Naslov SLO Podatki o izražanju genov in napovedovanje molekulski mehanizmov v celicah kvasovke ANG Gene expression data and prediction of the molecular mechanisms in yeast cells Opis SLO Predstavitev pristopa analize na genomski ravni z uporabo kvasovke Saccharomyces cerevisiae kot modelnega organizma za določitev vplivov različnih kemičnih perturbacij na evkariontske celice. ANG An approach of a genome-wide analysis using yeast Saccharomyces cerevisiae as a model organism to determine the effects of different chemical perturbations on eukaryotic cells. Šifra B.04 Vabljeno predavanje Objavljeno v PETROVIČ, U. Workshop on DNA microarray, proteomics and metabolomics: looking at inside the cells. Ispra: European Commission, Joint Research Centre, Institute for Environment and Sustainability Rural, Water and Ecosystem Research Unit, 2007, str. 18. Tipologija 1.12 Objavljeni povzetek znanstvenega prispevka na konferenci COBISS.SI-ID 20635431 8. Drugi pomembni rezultati projetne skupine7 Tekom projekta smo objavili vrsto odmevnih znanstvenih člankov s področja bioinformatike in računske fenomike. Te objave so večinoma v revijah iz vrha področnih SCI lestvic. Tako je tekom projekta nastalo deset publikacij v revijah iz sklopa 1A1, kot so npr. revije Bioinformatics, BMC Bioinformatics, Journal of Biomedical Informatics, Current Biology, in druge. 9. Pomen raziskovalnih rezultatov projektne skupine8 9.1. Pomen za razvoj znanosti9 SLO V projektu smo razvijali novo generacijo orodij za analizo podatkov iz visokozmogljivostnih eksperimentov. Glavni cilj projekta je razvoj in implementacija metod, ki zagotavljajo podporo biološko usmerjenim raziskovalcem na področjih sistemske biologije, razvoja in karakterizacije zdravil in funkcijske genomike. V primerjavi z relativno omejenim obsegom klasičnih fenotipov, nam lahko fenotipi na ravni genoma (visokorazsežni fenotipi) omogočijo preučevanje vplivov okoljskih dejavnikov na ravni celotnega organizma. V razvoju zdravil lahko s temi metodami dosti bolj zanesljivo napovedujemo in ugotavljamo stranske učinke ter povečamo verjetnost identifikacije dodatnih mehanizmov delovanja učinkovin. V funkcijski genomiki lahko visokorazsežni fenotipi omogočijo širši pogled na delovanje genov ter na njihove medsebojne interakcije. Orodja smo razvijali ob sodelovanju tujih partnerjev iz vrhunskih raziskovalnih institucij (Houston, Toronto, Pavia, Gradež). Računska orodja, razvita v projektu, trenutno uporablja velika združba raziskovalcev: na primer dictyExpress, spletna aplikacija razvita v letu 2008, je danes edina spletna aplikacija za analizo in pregledovanje transkriptomskih podatkov pri modelnem organizmu Dictyostelium discoideum. Razvoj tovrstnih tehnologij v obliki ustreznih računskih orodij za obdelavo podatkov je nujno za razvoj znanosti, kar kaže tudi mnoštvo pozitivnih odzive uporabnikov in porajajoče publikacije s partnerji vrhunskih revijah (npr. Current Biology, Genome Biology, in Nature Structural and Molecular Biology). ANG The project has developed a set of new generation data mining methods for data from high- throughput experiments. The main goal of the project was to develop useful implementation of these methods to assist researchers in the fields of systems biology, chemical and functional genomics. We were especially concerned with methods that can replace classical, morphological phenotypes, with description-rich phenotypes stemming from characterization of transcriptome. In functional genomics, rich phenotypes may provide increased resolution and generality, leading to more accurate predictions of gene function. In chemical genomics, they allow us to identify side effects of drugs, or to more reliably identify main effects and targets. We have been developing our methods together with several prominent research partners from abroad (Houston, Toronto, Pavia, Gratz). Several tools developed within this project are today used word-wide. For instance, dictyExpress, on of the main products of this project, is today the only application for web-based data analytics for D. discoideum transcriptomics. A manifestation of the success of this projects are many letters of thanks for the project we have developed, and emerging applications and subsequent publications with our collaborators in high-rated journals, such as Current Biology, Genome Biology, and Nature Structural and Molecular Biology. 9.2. Pomen za razvoj Slovenije10 SLO_ V projektu razvijamo nove tehnologije, ki omogočajo analizo in obdelavo transkriptomskih podatkov za partnerje Slovenskega konzorcija biočipov. V letu 2009 smo se (Fak. za računalništvo in informatiko UL) tudi uradno včlanili v konzorcij. Rezultati pričujočega projekta so bili večkrat predstavljeni članom konzorcija ter so bili vključeni v krajši tečaj za obdelavo podatkov z mikromrež, ki smo ga organizirali februarja 2009. Raziskovalci na projektu so sodelovali tudi pri različnih izobraževalnih programih, kjer so usposabljali uporabnike in raziskovalce na novih področjih funkcijske genomike, bioinformatike in sistemske biologije. Tako smo sodelovali pri treh različnih predmetih/modulih, Funkcijska genomika, Bioinformatika in Tehnologija DNA mikromrež, ki so vse del doktorskega študijskega programa Biomedicina. Sodelujemo v pripravi doktorskega študija iz sistemske biologije. Pripravili smo tudi predmet Bioinformatika, ki se bo izvajal na II. stopnji študija Računalništvo in informatika na Univerzi v Ljubljani. ANG Project has develop new computational tools for transcriptome analytics, whihc serve the needs of the members of Slovene Consortium of Biochips. We (Faculty of Computer and Information Science) have formally joined this consortium in 2009. Results of the project have been presented to the consurtium at several occasions, and we have also organized a short course in February 2009. Researchers involved in this project have collaborated in a number of courses held at University of Ljubljana from the areas of functional genomics, bioinformatics and systems biology. These courses are carried out at the III. level of Bologna programs of Biomedicine and Life Sciences. We are also collaborating in preparation of a coursework for the program of Systems biology. Furthermore, we were engaged in preparation of the course Bioinformatics, that will be carried out as a part of II. level of Bologna program in Computer and Information Science at the University of Ljubljana. 10. Samo za aplikativne projekte! Označite, katerega od navedenih ciljev ste si zastavili pri aplikativnem projektu, katere konkretne rezultate ste dosegli in v kakšni meri so doseženi rezultati uporabljeni Cilj F.01 Pridobitev novih praktičnih znanj, informacij in veščin Zastavljen cilj Oda One Rezultat Dosežen 6 Uporaba rezultatov V celoti 6 F.02 Pridobitev novih znanstvenih spoznanj Zastavljen cilj ;Oda NE Rezultat I Dosežen 6 Uporaba rezultatov |V celoti 6 F.03 Večja usposobljenost raziskovalno-razvojnega osebja Zastavljen cilj Oda ne Rezultat I Dosežen 6 Uporaba rezultatov V celoti 6 F.04 Dvig tehnološke ravni Zastavljen cilj Oda One Rezultat Dosežen 6 Uporaba rezultatov V celoti 6 F.05 Sposobnost za začetek novega tehnološkega razvoja Zastavljen cilj Oda ne Rezultat Dosežen 6 Uporaba rezultatov |V celoti 6 F.06 Razvoj novega izdelka Zastavljen cilj ;Oda U NE Rezultat 1 Dosežen 6 Uporaba rezultatov V celoti 6 F.07 Izboljšanje obstoječega izdelka Zastavljen cilj Oda ne Rezultat Dosežen 6 Uporaba rezultatov V celoti 6 F.08 Razvoj in izdelava prototipa Zastavljen cilj Oda One Rezultat Dosežen 6 Uporaba rezultatov |V celoti 6 F.09 Razvoj novega tehnološkega procesa oz. tehnologije Zastavljen cilj €>da NE Rezultat I Dosežen 6 Uporaba rezultatov |V celoti 6 F.10 Izboljšanje obstoječega tehnološkega procesa oz. tehnologije 1 Zastavljen cilj DA NE Rezultat Dosežen ▼ Uporaba rezultatov 1V celoti 6 F.11 Razvoj nove storitve Zastavljen cilj DA One Rezultat 1 6 Uporaba rezultatov 1 6 F.12 Izboljšanje obstoječe storitve Zastavljen cilj da One Rezultat 6 Uporaba rezultatov 6 F.13 Razvoj novih proizvodnih metod in instrumentov oz. proizvodnih procesov Zastavljen cilj da One Rezultat 6 Uporaba rezultatov 6 F.14 Izboljšanje obstoječih proizvodnih metod in instrumentov oz. proizvodnih procesov Zastavljen cilj da One Rezultat 6 Uporaba rezultatov 6 F.15 Razvoj novega informacijskega sistema/podatkovnih baz Zastavljen cilj DA NE Rezultat Dosežen 6 Uporaba rezultatov 1V celoti 6 F.16 Izboljšanje obstoječega informacijskega sistema/podatkovnih baz Zastavljen cilj DA One Rezultat 1 6 Uporaba rezultatov 1 6 F.17 Prenos obstoječih tehnologij, znanj, metod in postopkov v prakso Zastavljen cilj DA NE Rezultat Dosežen 6 Uporaba rezultatov V celoti 6 F.18 Posredovanje novih znanj neposrednim uporabnikom (seminarji, forumi, konference) Zastavljen cilj DA J NE Rezultat 1 Dosežen 6 Uporaba rezultatov V celoti 6 F.19 Znanje, ki vodi k ustanovitvi novega podjetja ("spin off") Zastavljen cilj DA NE Rezultat 1 Dosežen 6 Uporaba rezultatov Uporabljen bo v naslednjih 3 letih 6 F.20 Ustanovitev novega podjetja ("spin off") Zastavljen cilj ©da One Rezultat Dosežen ▼ Uporaba rezultatov Uporabljen bo v naslednjih 3 letih 6 F.21 Razvoj novih zdravstvenih/diagnostičnih metod/postopkov Zastavljen cilj ©DA NE Rezultat Dosežen ▼ Uporaba rezultatov 1 Delno 6 F.22 Izboljšanje obstoječih zdravstvenih/diagnostičnih metod/postopkov Zastavljen cilj Oda One Rezultat 6 Uporaba rezultatov 6 F.23 Razvoj novih sistemskih, normativnih, programskih in metodoloških rešitev Zastavljen cilj ©DA NE Rezultat Dosežen ▼ Uporaba rezultatov V celoti 6 F.24 Izboljšanje obstoječih sistemskih, normativnih, programskih in metodoloških rešitev Zastavljen cilj !©DA U NE Rezultat Dosežen ▼ Uporaba rezultatov V celoti 6 F.25 Razvoj novih organizacijskih in upravljavskih rešitev Zastavljen cilj DA ©NE Rezultat 6 Uporaba rezultatov 6 F.26 Izboljšanje obstoječih organizacijskih in upravljavskih rešitev Zastavljen cilj Oda ©ne Rezultat 1 6 Uporaba rezultatov 6 F.27 Prispevek k ohranjanju/varovanje naravne in kulturne dediščine Zastavljen cilj DA ©NE Rezultat 6 Uporaba rezultatov 6 F.28 Priprava/organizacija razstave Zastavljen cilj Oda ©ne Rezultat 6 Uporaba rezultatov 1 6 F.29 Prispevek k razvoju nacionalne kulturne identitete Zastavljen cilj DA ©NE Rezultat 6 Uporaba rezultatov 6 F.30 Strokovna ocena stanja Zastavljen cilj Oda One Rezultat 6 Uporaba rezultatov 6 F.31 Razvoj standardov Zastavljen cilj Oda One Rezultat 1 JL Uporaba rezultatov 1 6 F.32 Mednarodni patent Zastavljen cilj da One Rezultat i ^ Uporaba rezultatov 6 F.33 Patent v Sloveniji Zastavljen cilj Oda One Rezultat 6 Uporaba rezultatov 6 F.34 Svetovalna dejavnost Zastavljen cilj da One Rezultat 6 Uporaba rezultatov 1 6 F.35 Drugo Zastavljen cilj Oda One Rezultat i j Uporaba rezultatov 6 Komentar 11. Samo za aplikativne projekte! Označite potencialne vplive oziroma učinke vaših rezultatov na navedena področja Vpliv Ni vpliva Majhen vpliv Srednji vpliv Velik vpliv G.01 Razvoj visoko-šolskega izobraževanja G.01.01. Razvoj dodiplomskega izobraževanja O O o O G.01.02. Razvoj podiplomskega izobraževanja O o o o G.01.03. Drugo: o o o o G.02 Gospodarski razvoj G.02.01 Razširitev ponudbe novih izdelkov/storitev na trgu O O O O G.02.02. Širitev obstoječih trgov o o o o G.02.03. Znižanje stroškov proizvodnje o o o o G.02.04. Zmanjšanje porabe materialov in energije O O O O G.02.05. Razširitev področja dejavnosti o o o o G.02.06. Večja konkurenčna sposobnost o o o o G.02.07. Večji delež izvoza o o o o G.02.08. Povečanje dobička o o o o G.02.09. Nova delovna mesta o o o o G.02.10. Dvig izobrazbene strukture zaposlenih O O O O G.02.11. Nov investicijski zagon o o o o G.02.12. Drugo: o o o o G.03 Tehnološki razvoj G.03.01. Tehnološka razširitev/posodobitev dejavnosti O O O O G.03.02. Tehnološko prestrukturiranje dejavnosti O O O O G.03.03. Uvajanje novih tehnologij o o o o G.03.04. Drugo: o o o o G.04 Družbeni razvoj G.04.01 Dvig kvalitete življenja o o o o G.04.02. Izboljšanje vodenja in upravljanja o o o o G.04.03. Izboljšanje delovanja administracije in javne uprave O O O O G.04.04. Razvoj socialnih dejavnosti o o o o G.04.05. Razvoj civilne družbe o o o o G.04.06. Drugo: o o o o G.05. Ohranjanje in razvoj nacionalne naravne in kulturne dediščine in identitete O O O O G.06. Varovanje okolja in trajnostni razvoj O O O O G.07 Razvoj družbene infrastrukture G.07.01. Informacijsko-komunikacijska infrastruktura O O O O G.07.02. Prometna infrastruktura o o o o G.07.03. Energetska infrastruktura o o o o G.07.04. Drugo: o o o o G.08. Varovanje zdravja in razvoj zdravstvenega varstva O O O O 1 12. Pomen raziskovanja za sofinancerje, navedene v 2. točki11 1. Sofinancer Vrednost sofinanciranja za celotno obdobje trajanja projekta je znašala: EUR Odstotek od utemeljenih stroškov projekta: % Najpomembnejši rezultati raziskovanja za sofinancerja Šifra 1. 2. 3. 4. 5. Komentar Ocena 2. Sofinancer Vrednost sofinanciranja za celotno obdobje trajanja projekta je znašala: EUR Odstotek od utemeljenih stroškov projekta: % Najpomembnejši rezultati raziskovanja za sofinancerja Šifra 1. 2. 3. 4. 5. Komentar Ocena 3. Sofinancer Vrednost sofinanciranja za celotno obdobje trajanja projekta je znašala: EUR Odstotek od utemeljenih stroškov projekta: % Najpomembnejši rezultati raziskovanja za sofinancerja Šifra 1. 2. 3. 4. 5. Komentar Ocena C. IZJAVE Podpisani izjavljam/o, da: • so vsi podatki, ki jih navajamo v poročilu, resnični in točni • se strinjamo z obdelavo podatkov v skladu z zakonodajo o varstvu osebnih podatkov za potrebe ocenjevanja, za objavo 6., 7. in 8. točke na spletni strani http://sicris.izum.si/ ter obdelavo teh podatkov za evidence ARRS • so vsi podatki v obrazcu v elektronski obliki identični podatkom v obrazcu v pisni obliki • so z vsebino zaključnega poročila seznanjeni in se strinjajo vsi soizvajalci projekta Podpisi: Blaž Zupan in podpis vodje raziskovalnega projekta zastopnik oz. pooblaščena oseba RO Kraj in datum: Ljubljana 18.4.2010 Oznaka poročila: ARRS-RPROJ-ZP-2010-1/159 1 Samo za aplikativne projekte. Nazaj 2 Napišite kratko vsebinsko poročilo, kjer boste predstavili raziskovalno hipotezo in opis raziskovanja. Navedite ključne ugotovitve, znanstvena spoznanja ter rezultate in učinke raziskovalnega projekta. Največ 18.000 znakov vključno s presledki (približno tri strani, velikosti pisave 11). Nazaj 3 Realizacija raziskovalne hipoteze. Največ 3.000 znakov vključno s presledki (približno pol strani, velikosti pisave 11). Nazaj 4 Samo v primeru bistvenih odstopanj in sprememb od predvidenega programa raziskovalnega projekta, kot je bil zapisan v predlogu raziskovalnega projekta. Največ 3.000 znakov vključno s presledki (približno pol strani, velikosti pisave 11). Nazaj 5 Navedite največ pet najpomembnejših znanstvenih rezultatov projektne skupine, ki so nastali v času trajanja projekta v okviru raziskovalnega projekta, ki je predmet poročanja. Za vsak rezultat navedite naslov v slovenskem in angleškem jeziku (največ 150 znakov vključno s presledki), rezultat opišite (največ 600 znakov vključno s presledki) v slovenskem in angleškem jeziku, navedite, kje je objavljen (največ 500 znakov vključno s presledki), izberite ustrezno šifro tipa objave po Tipologiji dokumentov/del za vodenje bibliografij v sistemu COBISS ter napišite ustrezno COBISS.SI-ID številko bibliografske enote. Navedeni rezultati bodo objavljeni na spletni strani http://sicris.izum.si/. PRIMER (v slovenskem jeziku): Naslov: Regulacija delovanja beta-2 integrinskih receptorjev s katepsinom X; Opis: Cisteinske proteaze imajo pomembno vlogo pri nastanku in napredovanju raka. Zadnje študije kažejo njihovo povezanost s procesi celičnega signaliziranja in imunskega odziva. V tem znanstvenem članku smo prvi dokazali... (največ 600 znakov vključno s presledki) Objavljeno v: OBERMAJER, N., PREMZL, A., ZAVAŠNIK-BERGANT, T., TURK, B., KOS, J.. Carboxypeptidase cathepsin X mediates ß2 - integrin dependent adhesion of differentiated U-937 cells. Exp. Cell Res., 2006, 312, 2515-2527, JCR IF (2005): 4.148 Tipopologija: 1.01 - Izvirni znanstveni članek COBISS.SI-ID: 1920113 Nazaj 6 Navedite največ pet najpomembnejših družbeno-ekonomsko relevantnih rezultatov projektne skupine, ki so nastali v času trajanja projekta v okviru raziskovalnega projekta, ki je predmet poročanja. Za vsak rezultat navedite naslov (največ 150 znakov vključno s presledki), rezultat opišite (največ 600 znakov vključno s presledki), izberite ustrezen rezultat, ki je v Šifrantu raziskovalnih rezultatov in učinkov (Glej: http://www.arrs.gov.si/sl/gradivo/sifranti/sif-razisk- rezult.asp), navedite, kje je rezultat objavljen (največ 500 znakov vključno s presledki), izberite ustrezno šifro tipa objave po Tipologiji dokumentov/del za vodenje bibliografij v sistemu COBISS ter napišite ustrezno COBISS.SI-ID številko bibliografske enote. Navedeni rezultati bodo objavljeni na spletni strani http://sicris.izum.si/. Nazaj 7 Navedite rezultate raziskovalnega projekta v primeru, da katerega od rezultatov ni mogoče navesti v točkah 6 in 7 (npr. ker se ga v sistemu COBISS ne vodi). Največ 2.000 znakov vključno s presledki. Nazaj 8 Pomen raziskovalnih rezultatov za razvoj znanosti in za razvoj Slovenije bo objavljen na spletni strani: http://sicris.izum.si/ za posamezen projekt, ki je predmet poročanja. Nazaj 9 Največ 4.000 znakov vključno s presledki Nazaj 10 Največ 4.000 znakov vključno s presledki Nazaj 11 Rubrike izpolnite/prepišite skladno z obrazcem "Izjava sofinancerja" (http://www.arrs.gov.si/sl/progproj/rproj/gradivo/), ki ga mora izpolniti sofinancer. Podpisan obrazec "Izjava sofinancerja" pridobi in hrani nosilna raziskovalna organizacija - izvajalka projekta. Nazaj Obrazec: ARRS-RPROJ-ZP/2010 v1.00a 16-F3-42-17-8D-85-82-E8-43-87-D7-62-62-18-DC-94-C5-AA-82-EB