Oznaka poročila: ARRS-RPROJ-ZP-2015/240 6 S ZAKLJUČNO POROČILO RAZISKOVALNEGA PROJEKTA A. PODATKI O RAZISKOVALNEM PROJEKTU 1.Osnovni podatki o raziskovalnem projektu ■H Ш5 Šifra projekta J1-4213 Naslov projekta Vloga in pomen empiričnih geometrijskih parametrov za določevanje struktur makromolekul na uspešnost predikcije vezave ligandov Vodja projekta 4988 Dušan Turk Tip projekta J Temeljni projekt Obseg raziskovalnih ur 7560 Cenovni razred C Trajanje projekta 07.2011 - 06.2014 Nosilna raziskovalna organizacija 106 Institut "Jožef Stefan" Raziskovalne organizacije -soizvajalke 2592 ACIES BIO, biotehnološke raziskave in razvoj, d.o.o. 2990 Center odličnosti za integrirane pristope v kemiji in biologiji proteinov, Ljubljana Raziskovalno področje po šifrantu ARRS 1 NARAVOSLOVJE 1.05 Biokemija in molekularna biologija Družbenoekonomski cilj Naravoslovne vede - RiR financiran iz drugih virov (ne iz SUF) Raziskovalno področje po šifrantu FOS 1 Naravoslovne vede 1.04 Kemija B. REZULTATI IN DOSEŽKI RAZISKOVALNEGA PROJEKTA 2.Povzetek raziskovalnega projekta1 SLO 3-dimensional structures of biological macromolecules are the key to understanding of the chemical basis of physiological processes in the living organisms, yet they are a result of gathering the experimental data and their interpretation. The perfection of crystals of biological macromolecules seldom enables collection of data sets at resolutions which enable determination of individual atomic positions independently from their surroundings. Therefore prior knowledge is used to assure that the resulting structures are chemically and physically reasonable. The notions that the structures in the current Protein Data Bank entries are not optimal for the use in the ligand binding prediction studies, that the extracted statistical parameters from the small molecule database may overcome this problem, and that modeling studies may provide better targets for ligand binding than the experimentally determined structures indicate that there may be systematic inconsistency in the prior knowledge. The bonding parameters in use, which restrain the geometry of biopolymers, have been extracted from the small molecule crystal structures, however, those for the heterocompounds as well as nonbonding parameters have other sources. Therefore we plan to investigate the dependance of the crystal structure accuracy from these terms. In particular the nonbonding terms will be address since they effect almost every single macromolecular crystal structure. Re-refining the structures by using the already developed statistical nonbonding parameters from the groups of Klebe (Uni Marburg) and Sali (UCSF), we plan to examine the origin of the discrepancies between the small and macro molecular worlds and to improve the accuracy of 3D crystal structures deposited in PDB. This will be done by revisiting the already published works of collaborating groups and applied and co-developed in a drug discovery project. The results are expected to have an impact on the whole structural biology community. The ultimate outcome of this project, extending beyond its time frame, is an automated Brocedure for re-refinement of all PDB entries which will be continuously updated with ie progress of knowledge and technology through the years to come. ANG 3-dimenizionalne strukture bioloških makromolekul so ključne za razumevanje kemijskih osnov fizioloških procesov v živih organizmih. Strukture so rezultat dveh ena"ko Pomembnih delov, to sta zbiranje eksperimentalnih podatkov in njihove interpretacije. .valiteta kristalov makromolekul redko omogoča snemanje in interpretacijo podatkov do takšne resolucije, ki bi omogočila določitev pozicije posameznih atomov neodvisno od njihove okolice, zato se poleg eksperimentalnih podatkov pri reševanju struktur uporablja tudi apriorno znanje, ki zagotavlja, da je kristalna struktura kemijsko in fizikalno smiselna. Opaženo je bilo, da strukture v bazi PDB niso optimalne za iskanje in napovedovanje vezave novih ligandov, da lahko statistični parametri, pridobljeni iz baze struktur malih molekul CSD, presežejo te omejitve in da so lahko modeli proteinskih tarč predstavljajo boljše tarče za predikcijo vezave ligandov kot eksperimentalno določene strukture. Trenutni vezni parametri v uporabi, ki omejujejo strukturo biopolimerov (proteini in DNA), so sicer bili izpeljani iz baze struktur malih molekul CSD, toda parametri za heteromolekule kot tudi nevezni parametri so bili razviti na drugačen način. Naš načrt je, da raziščemo odvisnost kvalitete rešene strukture od teh parametrov, še posebno pa se bomo posvetili neveznim parametrom, saj ti vplivajo na vsako kristalno strukturo. Ponovno bomo ponovili postopek določevanja struktur (refinement) za nekatere že rešene strukture, kjer bomo uporabili že razvite statistične nevezne potenciale, ki so jih določili naši sodelavci v tem projektu (prof. Klebe, Univerza Marburg, in prof. Sali, Univerza San Francisco). Te parametre bomo uporabili tudi za reševanje in določevanje novih struktur v procesu odkrivanja novih zdravil. Pričakujemo, da bomo razkrili razlike med strukturami malih molekul in makromolekul, in s tem izboljšali kvaliteto struktur, deponiranih v bazi PDB. Pričakovani rezultati bodo vplivali na celotno področje strukturne biologije. Končni rezultat tega projekta ni omejen le na opisane cilje, ampak bo sčasoma zajel izboljšavo vseh struktur, deponiranih v bazi PDB. Pričakujemo, da bo sčasoma razvita avtomatska procedura, ki bo samodejno preverjala in izboljševala vse strukture v bazi PDB. 3.Poročilo o realizaciji predloženega programa dela na raziskovalnem projektu2 Kristalne strukture so določene iz podatkov, ki se pridobijo z difrakcijo rentgenskih žarkov na kristalih makromolekul. Kvaliteta kristalov makromolekul redko omogoča merjenje podatkov pri resolucijah, ki omogoča določitev pozicije posameznih atomov neodvisno od njihove okolice. "Reševanje struktur makromolekul je problem razmerja med podatki in parametri. Pri strukturi, posneti pri 3 A, so za opis pozicije enega atoma na voljo trije ukloni, pri resoluciji 2 Aje na voljo sedem uklonov in pri resoluciji 1 A že 50 uklonov. Struktura pri resoluciji 3 A torej omogoča prepoznavoglavne verige in grobe orientacije stranske verige, medtem ko struktura pri 2 A omogoča prepoznavo detajlov, kot so orientacija karbonilnih skupin in sistem tvorjenja vodikovih vezi. Pri atomski ločljivosti(1.2 A in bolje) je lepo razvidna pozicija posameznih atomov v elektronski gostoti. Na žalost je večina struktur določena pod atomsko ločljivostjo. Da se premaga problem razmerja podatkov in parametrov, se uporablja predhodno pridobljeno, tako imenovano apriori znanje. Apriori znanje zagotavlja, da so atomski modeli makromolekul kemijsko in fizikalno smiselni, kar pomeni, da morajo vezne in nezvezne interakcije ustrezati sestavi molekul v kristalu. To znanje je združeno v obliki topoloških knjižnic in parametrov, ki opisujejo kemijsko sestavo in definirajo omejitve. Te omejitve vključujejo empirično in teoretično znanje o kemijskih in fizikalnih lastnostih sistema. Gre za omejitve pri veznih in neveznih parametrov: dolžina vezi (bodisi kot tarčna vrednost bodisi kot omejitev, da morajo vezi istega tipa imeti podobno dolžino), koti med vezmi, nekateri torzijski koti, ki so bolj kot ne fiksni, planarne skupine, odboji in privlaki med različnimi atomi in razlike v temperaturnih faktorjih med medsebojno povezanimi atomi. Te knjižnice in pravila omejitev se uporabljajo v celotnem postopku reševanja struktur, tako med grajenjem strukture kot tudi med numeričnim fitanjem strukture na eksperimentalne podatke (ang. "refinement"), in zagotavljajo, da se strukture ujemajo z ostalimi informacijami, ki so na voljo. V okviru tega projekta smo nameravali vzpostaviti okvir na katerem bomo nadgradili numerično fitanje strukture na eksperimentalne podatke (»piljenje« oziroma po angleško refinement). Projekt je imel več med seboj dopolnjujočih se ciljev, katerih doseganje je segalo izven okvirjev predloženega obdobja. a) nadgraditi smo nameravali podatkovno bazo PURY v smislu preseganja njenih konceputulanih omejitev in spremeniti osnovno zajemanja podatkov iz domene, ki je v lasti Cambdridge Structural Database (CSD), v javno domeno Crystallographic Open Database (COD) b) uporabiti statistične parametre za opis neveznih interkacij na osnovi statističnega polja sil razvitega v skupinah iz UCSF in UNI Marburg. c) validirati pridobljene parametre na primeru modeliranja inhibitorjev molekule d) vzpostaviti sistem, ki bo omogočal nadgradnjo in dopolnitve tudi v prihodnje in vodil do bolj točnih, izboljšanih modelov makromolekularnih struktur deponiranih v Proteinski Podatkovni Banki (PDB). Ta del se bo, kot smo zapisali že v projektu, izvedel v prihodnosti. Za doseganje teh ciljev je bilo potrebno razviti novo programsko kodo oziroma nadgraditi obstoječe, pripraviti zadostne količine ligandov in proteinov za empirično preverjanje ciljev s kombinacijo razvoja računalniških metod in eksperimentalnega pristopa na farmakološko pomembnem področju kot so imunosupresivi. a) Ko je bil razvit PURY strežnik (Andrejašič in sod., 2008) je postalo jasno da je bazo mogoče izboljšati v vrsti primerov. Prva omejitve je bila v konceptu atomarnih razredov, ki so bili določeni izključno na osnovi uporabe apriornega kemijskega znanja o povezavah in planarnosti struktur. Na osnovi tega pristopa je nastalo preko dva tisoč atomarnih razredov in nekaj sto tisoč geometrijskih parametrov. Analiza je pokazala da je bila približno polovica med njimi statistično nezanesljiva in da je med njimi vrsta razredov in parametrov, ki so odveč saj opisujejo parametre z dejansko enako distribucijo. Naslednji pomislek izhaja iz dostopnosti rezultatov, saj licenca uporabe CSD eksplicitno omejuje njeno uporabo v javne namene. Z namenom, da bi podatkovno bazo lahko odprli javnosti smo pripravili tudi novo vrsto parametrov, ki temeljijo na Odprti Kristalografski Bazi (COD), le ta trenutno obsega preko 300.000 vhodnih struktur. Takšen set parametrov bo lahko javno dostopen in predvidevamo, da bo kmalu postal tako natančen kot ta iz CSD. Napisali smo vrsto programov v jeziku Python in FORTRAN, ki dostopajo do vhodnih podatkov, organizirajo strukturno informacijo v podatkovni bazi in izločijo problematične vhodne podatke in molekularne strukture. Iterativni proces nato vzpostavi definicije atomarnih razredov. Proces temelji na topologiji molekul in distribuciji razdalj med posameznimi razredi. Ta shema se začne z imenom elementa in nato postopno veča kompleksnost razredov z vključevanjem sosedov z omejitvijo na tiste razrede, ki dajejo več modalne distribucije razdalj ali pa visoko standardno deviacijo. Ta postopek vodi do različnih stopenj kompleksnosti. Najvišja se pojavi pri hibridiziranih strukturah kot so obroči. Vmesni rezultat je bil predstavljen na Srečanju Ameriške Kristalografske Asociacije 2013. (Silva in Turk, poster). Do zaključka projekta je bila analiza parametrov končana, kar ostane je njena validacija (primerjava s podatki iz CSD in primerjava končnih struktur podobno kot smo izvedli v članku Andrejašič in sod., 2008) in posodobitev serverja (http:pury.ijs.si) in s tem javni dostop do podatkov. Ko bo to končano bom delo tudi objavili v članku, ki bo napisan previdoma do konca 2015. ) To delo se bo nadaljevalo v okviru programa Strukturna Biologija (raziskovalci Jure Pražnikar, Livija Tušar) in prostovoljno (Abelardo Manuel Silva) dokler se ne pridobi novih sredstev. Algoritem za določanje razredov je na kratko sledeči: V prvi stopnji se pregledajo posamezne strukture in popravijo oziroma izločijo tiste z napakami pri vnosih, izvede se ekspanzija v celotne molekule na osnovi simetrijskih operacij. V drugi stopnji se razdeli atome na tiste s kovinami in tiste brez (H, D, B, C, N, O, F, Si, P, S, Cl, As, Se, Br, Te, I and At). Na tej osnovi se ob uporabi atomskih kovalentnih radijev izračuna povezovalne tabele, dolžine razdalj vključno z njihovo napako, kiralne volumne in identificira obroče. Klasifikacija atomov poteka nivojsko. V prvem so imena atomov (na primer C, N, O, ...), na drugem imena atomov skupaj s številom prvih sosedov (C3, N2, O2, ...), na tretjem simboli vseh prvih sosedov (na primer CCCH, NCCH, OCH, . .) in podobno naprej. Iz teh razredov se grupira medatomske razdalje, ki pravzaprav povedo na katerem nivoju je posamezen atom dobro definiran. Dobro definiran set podatkov je takrat kadar je distribucija unimodalna in ima dovolj majhno sipanje. Na ta način smo se izognili problemu pod določenosti oziroma prenizke zastopanosti posameznih parametrov. Da bi lahko ugotovili če so posamezne distribucije in z njimi atomarni razredi res statistično drugačni od ostalih smo jih primerjali z iterativnim grupiranjem z metodo Kolmogorov-Smirnov testa. Na podlagi te analize smo združevali enake distribucije in s tem ponovno zmanjšali število parametrov glede na klastrom prirejeno verjetnost. Konzistentnost analize smo pokazali z distribucijami standardnih odklonov. Izmed vseh 22.146 prvih sosedov, ki kaže na dobro ujemanje parametrov, kadar je bilo za njih na voljo vsaj 10 podatkov v COD. Kar ostane je implementacija programske opreme za pripravo parametrov, ki bodo na voljo preko spletne aplikacije in na koncupisanje članka. Validacijo parametrov pa bomo izvedli skupaj s skupino P. Adamsa na UC Berkeley. b) V program MAIN smo vgradili prvo generacijo statističnih neveznih parametrov za proteine izvedene iz statistične analize podatkov DOPE, ta je bila pomankljiva saj ne vsebuje parametrov za ligande. Za naslednjo generacijo potencialov pa se je izkazalo (G.Q. Dong, H. Fan, D. Schneidman-Duhovny, B. Webb, A. Sali. Optimized atomic statistical potentials: Assessment of protein interfaces and loops. Bioinformatics 29, 31583166, 2013), da je v neprimerni obliki za uporabo v kristalografiji podobno kot set parametrov G. Klebeja. V prvem primeru gre za parametre, ki nezvezno opisujejo prostor in s tem onemogočajo računanje zveznih odvodov poleg tega je velikost datoteke neprimerno velika (preko 1.5 GB) , v drugem primeru pa je set podvržen omejitvam CSD licence. Skupaj z ekipo prof. Salija smo se odločili, da v sodelavi pripravimo ustrezen set podatkov na osnovi odprtih podatkovnih baz in temu ustrezno priredimo njihovo programsko opremo. Kar pomeni, da bo uporaba v kristalografiji zamaknjena dokler se nova baza ne pripravi. Med tem smo se srečali sproblemom odvisnosti določene strukture od tarčne funkcije uporabljene v kristalografiji. Zanimalo nas je če je tako imenovani neodvisni TEST set podatkov zares neodvisen od uporabe kemijskih energijskih izrazov. Analiza je pokazala, da temu ni tako in smo v ta namen predlagali novo tarčno funkcijo ki upošteva pri določanju struktur vse difrakcijske podatke (Pražnikar in Turk, 2014). Ta funkcija bo verjetno v prihodnosti implementirana tudi v drugih programih in paketih in s tem ustrezno spremenila način fitanja in validacijo vseh bodočih struktur deponiranih v PDB. c) Validacijo novih parametrov in piljenja smo nameravali izvesti na primeru FKBP12 proteine in vezanih spojin. V okviru projekta smo razvijali bioprocese za učinkovito pripravo novih analogov FKBP12-vezavnih spojin z bakterijami iz skupine streptomicet v merilu stresalnikov in 5 L bioreaktorjev. Optimizirali smo parametre bioprocesov, zlasti vire ogljika in dušika ter optimalno vrednost pH za produkcijo sekundarnih metabolitov (Goranovi in sod, 2012). Pri procesih, ki vključujejo kemobiosintezni pristop, smo sintetizirali večje količine sintetičnih prekurzorjev in optimalne čase dodajanja le-teh v bakterijske kulture, da smo zmanjšali inhibitoren vpliv prekurzorjev na fiziologijo celic. Prav tako smo optimizirali izolacijsko metodo za spojine, ki vežejo protein FKBP12 ki temelji na kromatografskih in ekstrakcijskih postopkih ter izolirali spojine CAB0903, CAB0904 in CAB0905 v čisti obliki. V sodelovanju z Institutom Jožef Stefan (Boris Turk) smo izvedli preliminarne eksperimente za ugotavljanje biološke aktivnosti spojine CAB0903, v nadaljevanju pa bomo ovrednotili tudi aktivnosti FKBP12-vezavnih spojin CAB0904 in CAB0905 V okviru projekta smo želeli pridobiti še več novih FKBP12-vezavnih spojin z zanimivimi farmakološkimi in kemijskimi lastnostmi, vendar pa kljub naporom pri optimizaciji bioreaktorskih parametrov oziroma postopkov za izolacijo spojin nismo uspeli pridobiti dovolj ustrezno čistega materiala za izvedbo strukturno-bioloških študij vezave teh ligandov na FKBP12. 4.Ocena stopnje realizacije programa dela na raziskovalnem projektu in zastavljenih raziskovalnih ciljev3 Že v predlogu projekta je bilo omenjeno da gre za dolgoročni projekt, ki se nadgrajuje, in da bodo cilji doseženi po izteku obdobja financiranja. v okviru tega projekta smo objavili eno publikacijo (Pražnikar in Turk, 2014) in predstavili delne rezultate na konferenci ameriškega kristalografske zveze (Silva in Turk, 2013). Kot je razvidno iz vsebinskega poročilaje analiza COD-ja kot nadgradnje podatkovne baze PURY končana, potrebno je rezulate še validirati, vgraditi na internetni server in objaviti. Objavljeni članek pa je posledica analize, ki je razkrila novo pomanjkljivost sedanjega načina piljenja struktur (odvisnost tarčne funkcije od napak v kemijskem modelu) in je v bistvu osnova za povečano točnost 3-dimenzionalnih struktur makromolekul._ 5.Utemeljitev morebitnih sprememb programa raziskovalnega projekta oziroma sprememb, povečanja ali zmanjšanja sestave projektne skupine4 ■ Pprpifrm pip p j rf|mkPnlžnijneTll sth' IQIivklkjurTeyiprfdajmoS dMk-onnt-ziijsii itTehirjnilfl s>lQ48iik.-iii-h'i!lt-itMl ■ Pmitiikopnlri pivj.oiblije rhy ialnitrlizn a za-. 6.Najpomembnejši znanstveni rezultati projektne skupine5 Znanstveni dosežek 1. COBISS ID 1537009860 Vir: COBISS.SI Naslov SLO Prosti kick namesto navzkrižne validacije pri piljenju makromolekularnih struktur z metodo maksimalne verjetnosti ANG Free kick instead of cross-validation in maximum-likelihood refinement of macromolecular crystal structures Opis SLO Piljenje molekularnega modela je računalniški postopek s katerim se atomarne modele fita na difrakcijske podatke. Splošno uporabljena tarča pri piljenju makromolekularnih struktur je funkcija maksimalne verjetnosti (MV), ki temelji na oceni napak modela. Trenutne MV funkcije temeljijo na navzkrižni validaciji. Uporabljajo ocene faznih napak, ki se izračunajo iz majhnega dela difrakcijskih podatkov imenovanega testni set, ki se ga ne uporabi pri fitanju modela. Mi smo razvili postopek, ki uporablja za oceno faznih napak delovni set s simulacijo naključno razmeščenega modela. Imenovali smo ga MV prosto brcnjeno piljenje, ker uporablja MV formulacije tarčne funkcije in je osnovan na ideji osvobajanja modela od njegovega biasa, ki je posledice uporabe kemijskih parametrov med energijsko minimizacijo. Ta pristop za oceno napak modela je boljši od metode navzkrižne validacije: zmanjšuje fazno napako in povečuje točnost modela, je bolj robusten, nudi bolj jasne mape elektronske gostote in lahko uporablja manjše dele za testni del seta za izračun Rfree-ja. Lahko pa izpusti testni del v celoti. ANG The refinement of a molecular model is a computational procedure by which the atomic model is fitted to the diffraction data. The commonly used target in the refinement of macromolecular structures is the maximum-likelihood (ML) function, which relies on the assessment of model errors. The current ML functions rely on cross-validation. They utilize phase-error estimates that are calculated from a small fraction of diffraction data, called the test set, that are not used to fit the model. An approach has been developed that uses the work set to calculate the phase-error estimates in the ML refinement from simulating the model errors via the random displacement of atomic coordinates. It is called ML free-kick refinement as it uses the ML formulation of the target function and is based on the idea of freeing the model from the model bias imposed by the chemical energy restraints used in refinement. This approach for the calculation of error estimates is superior to the cross-validation approach: it reduces the phase error and increases the accuracy of molecular models, is more robust, provides clearer maps and may use a smaller portion of data for the test set for the calculation of Rfree or may leave it out completely Objavljeno v Munksgaard; Acta crystallographica. D, Biological crystallography; 2014; Vol. 70, no. 12; str. 3124-3134; Impact Factor: 7.232;Srednja vrednost revije / Medium Category Impact Factor: 1.946; A'': 1;A': 1; Avtorji / Authors: Pražnikar Jure, Turk Dušan Tipologija 1.01 Izvirni znanstveni članek 2. COBISS ID 4146808 Vir: COBISS.SI Naslov SLO Biosinteza FK506 v Streptomyces tsukubaensis je regulirana z dvema pozitivnima regulatornima elementoma ANG FK506 biosynthesis is regulated by two positive regulatory elements in Streptomyces tsukubaensis Opis SLO FK506 (takrolimus) je klinično pomemben imunosupresiv, ki se proizvaja z industrijskimi fermentacijskimi procesi z različnimi vrstami streptomicet. Donosi FK506 v teh procesih ostajajo relativno nizki, ekonomičnost procesov pa še dodatno znižuje prisotnost strukturno podobnih nečistoč. Na biosintezne procese za sekundarne metabolite pogosto vplivajo tudi regulatorni geni, ki se nahajajo znotraj genskih skupin za njihovo biosintezo. Objavljeni članek opisuje identifikacijo in karakterizacijo dveh regulatornih elementov v genski skupini za biosintezo FK506 fkbR in fkbN, ki se uvrščata v družino LysR oziroma LAL. Prekinitev teh dveh genov je povzročila drastičen upad biosinteze FK506, njuno čezmerno izražanje pa je bistveno povečalo donos te spojine. Rezultati kažejo na velik potencial pridobljenih gensko spremenjenih sevov za povečanje donosa FK506, prav tako pa tudi analogov FK506, ki jih v okviru tega projekta pridobivamo v S. tsukubaensis s kemobiosinteznim pristopom. ANG FK506 (tacrolimus) is a clinically important immunosuppressant, produced in industrial fermentation processes by various Streptomyces species. Yields of FK506 in these processes remain relatively low and their efficiency is further reduced by the presence of structurally similar impurities in fermentation broths. Biosynthetic processes of secondary metabolites are often affected by regulatory genes, located in biosynthetic gene clusters. In this article we describe the identification and characterization of two regulatory elements present in the FK506 biosynthetic gene cluster fkbR and fkbN, belonging to the LysR and LAL family, respectively. Inactivation of these genes caused a dramatic reduction in FK506 yield whereas their overexpression significantly improved the yield of this compound. The results show a promising potential of the obtained genetically modified strains of to improve the yield of FK506 as well as FK506 analogues which are being produced in the scope of this project in S. tsukubaensis by chemobiosynthetic approach. Objavljeno v BioMed Central; BMC microbiology; 2012; Vol. 12, [article no.] 238; str. 115; Impact Factor: 3.104;Srednja vrednost revije / Medium Category Impact Factor: 3.384; WoS: QU; Avtorji / Authors: Goranovič Dušan, Blažič Marko, Magdevska Vasilka, Horvat Jaka, Kuščer Enej, Polak Tomaž, Santos-Aberturas Javier, Martinez-Castro Miriam, Barreiro Carlos, Mrak Peter, Kopitar Gregor, Kosec Gregor, Fujs Štefan, Martin Juan F., Petković Hrvoje Tipologija 1.01 Izvirni znanstveni članek 7.Najpomembnejši družbeno-ekonomski rezultati projektne skupine6 Družbeno-ekonomski dosežek 1. COBISS ID 27630887 Vir: COBISS.SI Naslov SLO Nova generacija parametrov za piljenje in validacijo molekularnih geometrij ANG A new generation of parameters for refinement and validation of molecular geometries PURY je podatkovna baza empiričnih geometrijskih parametrov za piljenje heteromolekul v kompleksih z makromolekularnimi strukturami. Temelji na Podatkovni bazi Struktur iz Cambridga (CSD). Ko je bil razvit PURY strežnik Opis SLO ANG (Andrejašič in sod., 2008) je postalo jasno da je bazo mogoče izboljšati v vrsti primerov. Prva omejitve je bila v konceptu atomarnih razredov, ki so bili določeni izključno na osnovi uporabe apriornega kemijskega znanja o povezavah in planarnosti struktur. Na osnovi tega pristopa je nastalo preko dva tisoč atomarnih razredov in nekaj sto tisoč geometrijskih parametrov. Analiza je pokazala da je bila približno polovica med njimi statistično nezanesljiva in da je med njimi vrsta razredov in parametrov, ki so odveč saj opisujejo parametre z dejansko enako distribucijo. Naslednji pomislek izhaja iz dostopnosti rezultatov, saj licenca uporabe CSD eksplicitno omejuje njeno uporabo v javne namene. Z namenom, da bi podatkovno bazo lahko odprli javnosti smo pripravili tudi novo vrsto parametrov, ki temeljijo na Odprti Kristalografski Bazi (COD). Takšen set parametrov bo lahko javno dostopen in predvidevamo, da bo kmalu postal tako natančen kot ta iz CSD. Marca 2013 je COD vsebovala 220.000 struktur in stalno raste. Napisali smo vrsto programov v jeziku Python, ki dostopajo do vhodnih podatkov, organizirajo strukturno informacijo v podatkovni bazi in izločijo problematične vhodne podatke in molekularne strukture. Iterativni proces nato vzpostavi definicije atomarnih razredov. Proces temelji na topologiji molekul in distribuciji razdalj med posameznimi razredi. Ta sheme začne z imenom elementa in nato postopno veča kompleksnost razredov z vključevanjem sosedov z omejitvijo na tiste razrede, ki dajejo več modalne distribucije razdalj ali pa visoko standardno deviacijo. Ta postopek vodi do različnih stopenj kompleksnosti. Najvišja se pojavi pri hibridiziranih strukturah kot so obroči. Trenutna stopnja razvoja parametrov bo predstavljena. PURY is a database of empirical geometric restrains for refinement of heteromolecules in the complexes with macromolecular structures. It is based on Cambridge Structural Database (CSD). When PURY server was developed (Andrejasic et al., 2008) it became clear that it can be improved in many points. The first limitation was in the concept of atom classes which were assigned using extensive prior chemical knowledge arising from connectivity and planarity of the structures. This approach resulted in over two thousand atom classes defining tens and hundreds of thousands of thousands of geometric restraints. Analysis showed that that about half were statistically under represented and that many atom classes and terms are redundant as they describe essentially the same distributions. The second consideration was that in order to make the resulting force field publicly more widely available, the new generation parameters will include also the version based on the Crystallography Open Database (COD) will besides the proprietary CSD. The new COD based set of geometric parameters will be in the public domain, and we expect that it will soon become as accurate as the set derived from the CSD. The COD includes over 220,000 entries by March, 2013, and steadily grows. A set of Python programs were written to access the crystallographic entries, organize the structural information in a database-like structure and filter out problematic files and molecular structures. Using filtered data an iterative process for atom class definition was developed. It is based only on the topology of the molecules and the distribution of atom distances among classes. This scheme starts identifying the atom class with the plain atom name and then increasing the atom class complexity by gradually including information from the neighbors only for those classes which distribution of distances are multi-modal or with a high standard deviation. This process leads to a set of atom classes of uneven complexity, with atoms on hybridized structures like rings reaching the highest level of complexity. The current state of the art of the new generation of parameter data set of geometric restraints will be presented. Šifra B.06 Drugo Objavljeno v 2013; Avtorji / Authors: Abelardo Manuel Silva, Turk Dušan Tipologija 3.15 Prispevek na konferenci brez natisa 8.Drugi pomembni rezultati projetne skupine7 Gre za projekt pri katerem nihče ni bil 100% zaposlen, tako da so rezulati skupine opisani glede na programsko skupino v kateri se nahajajo. 9.Pomen raziskovalnih rezultatov projektne skupine8 9.1.Pomen za razvoj znanosti9 SLO Raziskave pri razvoju zdravil in herbicidov so močno odvisne od zanesljivosti virov informacij kot so 3-dimenzionalne strukture tarč, na katere se vežejo zdravilne učinkovine in herbicidi ter spojinami v razvoju. S tem projektom smo nameravali izboljšati zanesljivost in točnost teh informacij in s tem povečati količino informacije v 3-dimenzionalnih strukturah makromolekul. Nova tarčna funkcijo fitanja makromolekul na difrakcijske podatke, ki smo jo imenovali Prosto brcnjena funkcija Maksimalne Verjetnosti (Pražnikar in Turk, 2014), bo imela dolgoročni vpliv v svetovnem merilu na znanost in tehnologije, ki so odvisne od rezultatov makromolekularne kristalografije. Vpliv nadgradnje »A priori« znanj na katerem temeljijo 3-dimenzionalne strukture makromolekul in njihovih kompleksov pa pričakujemo po zaključku dela zastavljenega v tem projektu. Sodelovanje z dvema v svetu vodilnima znanstvenikoma na tem področju (prof. Andrej Šali -Univerza v San Franciscu; prof. Paul Adams - Lawrence Berkeley laboratorij, Berkeley) odraža mednarodno pomembnost tega projekta. Prof. Šali je eden izmed vodilnih bioinformatikov na področju predikcije in modeliranja 3-dimenzionalnih struktur makromolekul in njihovih kompleksov. Enako prepoznaven je tudi Prof. Adams, ki je vodilni raziskovalec projekta PHENIX, ko so se nedavno priključili v razvoj in validacijo parametrov kemijskih parametrov. Sodelovanje s tema dvema skupinama bo povečalo vidnost naših dosežkov. ANG_ Drug discovery as well as herbicide research strongly depend on the delivery of reliable sources of information such as 3-dimensional structures of drug and herbicide targets and their complexes with drug candidates in development. With this project we aimed to improve the general reliability and accuracy of this information and thereby increase the information content in 3-D structures of macromolecules. The new target function of refinement called Free Kick Maximum Likelihood function (Pražnikar and Turk, 2014) we believe to have made a world wide impact on the science and technology which depends on the results of macromolecular crystallography. The impact of the upgrade of the "prior knowledge" on which the 3-dimensional structure determination of biological macromolecules and their complexes depend upon, is expected upon completion of the work started here. The collaboration with the groups of two world class leading scientists in this area (prof. Andrej Šali - University of California San Francisco, California; Prof. Paul Adams - Lawrence Berkeley Lab, Berkeley, California) reflects international importance of this project. Prof. Šali is one of the world leading bioinformatic scientist in the area of prediction and modeling of 3-dimensional structures of macromolecules and their complexes and equally renown Prof. Paul Adams PI of the PHENIX project recently involved in development of the parameters of the Chemical Prior knowledge. The collaboration with these groups will raise visibility of our achievements. This project was of interest for the pharmaceutical industry. SME AciesBio has joined the project with the hope that the application of the approaches under development will provide them the edge crucial for the success of their product. 9.2. Pomen za razvoj Slovenije10 SLO_ D. Turk je tretji najbolj citiran znanstvenik na področju bioloških ved v Sloveniji s približno 7000 citati. Ta projekt je nadaljevanje dolgoletnega dela v razvoju programske opreme za strukturno biologijo, in je pomembna podlaga za njegovo in s tem Slovensko mednarodno prepoznavnost. Rezultati tega projekta so zanimivi za farmacevtsko industrijo. Manjša firma AciesBio d.o.o. se je priključila projektu v upanju, da jim bo uporaba orodij v razvoju ponudila prednostno znanje, ki bo ključno za uspeh njihovih proizvodov. ANG_ D. Turk is the third most cited scientist in the field ob biological sciences in Slovenia (approximately 7000 citations, Hirsch index 40). This project is a continuation of his long devotion to software development tools for structural biology which has laid the foundation for his international recognition and reflected in that of Slovenia. The results of this project are of interest for the pharmaceutical industry. SME AciesBio has joined the project with the hope that the application of the approaches under development will provide them the edge crucial for the success of their product. lO.Samo za aplikativne projekte in podoktorske projekte iz gospodarstva! Označite, katerega od navedenih ciljev ste si zastavili pri projektu, katere konkretne rezultate ste dosegli in v kakšni meri so doseženi rezultati uporabljeni Cilj F.01 Pridobitev novih praktičnih znanj, informacij in veščin Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 v F.02 Pridobitev novih znanstvenih spoznanj Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 v F.03 Večja usposobljenost raziskovalno-razvojnega osebja Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.04 Dvig tehnološke ravni Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.05 Sposobnost za začetek novega tehnološkega razvoja Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 v F.06 Razvoj novega izdelka Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.07 Izboljšanje obstoječega izdelka Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.08 Razvoj in izdelava prototipa Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 v F.09 Razvoj novega tehnološkega procesa oz. tehnologije Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 v F.10 Izboljšanje obstoječega tehnološkega procesa oz. tehnologije Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 v F.11 Razvoj nove storitve Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.12 Izboljšanje obstoječe storitve Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.13 Razvoj novih proizvodnih metod in instrumentov oz. proizvodnih procesov Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 v F 14 Izboljšanje obstoječih proizvodnih metod in instrumentov oz. proizvodnih procesov Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.15 Razvoj novega informacijskega sistema/podatkovnih baz Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 v F.16 Izboljšanje obstoječega informacijskega sistema/podatkovnih baz Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.17 Prenos obstoječih tehnologij, znanj, metod in postopkov v prakso Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F 18 Posredovanje novih znanj neposrednim uporabnikom (seminarji, forumi, konference) Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.19 Znanje, ki vodi k ustanovitvi novega podjetja ("spin off") Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.20 Ustanovitev novega podjetja ("spin off") Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 v F.21 Razvoj novih zdravstvenih/diagnostičnih metod/postopkov Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.22 Izboljšanje obstoječih zdravstvenih/diagnostičnih metod/postopkov Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.23 Razvoj novih sistemskih, normativnih, programskih in metodoloških rešitev Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F 24 Izboljšanje obstoječih sistemskih, normativnih, programskih in metodoloških rešitev Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.25 Razvoj novih organizacijskih in upravljavskih rešitev Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 - F.26 Izboljšanje obstoječih organizacijskih in upravljavskih rešitev Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 - F.27 Prispevek k ohranjanju/varovanje naravne in kulturne dediščine Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 - F.28 Priprava/organizacija razstave Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 - F.29 Prispevek k razvoju nacionalne kulturne identitete Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 - F.30 Strokovna ocena stanja Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 - F.31 Razvoj standardov Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 - F.32 Mednarodni patent Zastavljen cilj DA NE Rezultat 1 - Uporaba rezultatov 1 - F.33 Patent v Sloveniji Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 - F.34 Svetovalna dejavnost Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v F.35 Drugo Zastavljen cilj DA NE Rezultat 1 v Uporaba rezultatov 1 v Komentar ll.Samo za aplikativne projekte in podoktorske projekte iz gospodarstva! Označite potencialne vplive oziroma učinke vaših rezultatov na navedena področja Vpliv Ni vpliva Majhen vpliv Srednji vpliv Velik vpliv G.01 Razvoj visokošolskega izobraževanja G.01.01. Razvoj dodiplomskega izobraževanja O o o o G.01.02. Razvoj podiplomskega izobraževanja o o o o G.01.03. Drugo: o o o o G.02 Gospodarski razvoj G.02.01 Razširitev ponudbe novih izdelkov/storitev na trgu O O O O G.02.02. Širitev obstoječih trgov o o o o G.02.03. Znižanje stroškov proizvodnje o o o o G.02.04. Zmanjšanje porabe materialov in energije O O O O G.02.05. Razširitev področja dejavnosti o o o o G.02.06. Večja konkurenčna sposobnost o o o o G.02.07. Večji delež izvoza o o o o G.02.08. Povečanje dobička o o o o G.02.09. Nova delovna mesta o o o o G.02.10. Dvig izobrazbene strukture zaposlenih O O O O G.02.11. Nov investicijski zagon o o o o G.02.12. Drugo: o o o o G.03 Tehnološki razvoj G.03.01. Tehnološka razširitev/posodobitev dejavnosti O O O O G.03.02. Tehnološko prestrukturiranje dejavnosti O O O O G.03.03. Uvajanje novih tehnologij o o o o G.03.04. Drugo: o o o o G.04 Družbeni razvoj G.04.01 Dvig kvalitete življenja o o o o G.04.02. Izboljšanje vodenja in upravljanja O o o o G.04.03. Izboljšanje delovanja administracije in javne uprave O O O O G.04.04. Razvoj socialnih dejavnosti o o o o G.04.05. Razvoj civilne družbe o o o o G.04.06. Drugo: o o o o G.05. Ohranjanje in razvoj nacionalne naravne in kulturne dediščine in identitete O O O O G.06. Varovanje okolja in trajnostni razvoj O O O O G.07 Razvoj družbene infrastrukture G.07.01. Informacijsko-komunikacijska infrastruktura O O O O G.07.02. Prometna infrastruktura o o o o G.07.03. Energetska infrastruktura o o o o G.07.04. Drugo: o o o o G.08. Varovanje zdravja in razvoj zdravstvenega varstva O O O O G.09. Drugo: o o o o Komentar 12.Pomen raziskovanja za sofinancerje11 Sofinancer 1. Naziv Naslov Vrednost sofinanciranja za celotno obdobje trajanja projekta je znašala: EUR Odstotek od utemeljenih stroškov projekta: % Najpomembnejši rezultati raziskovanja za sofinancerja Šifra 1. 2. 3. 4. 5. Komentar Ocena 13.Izjemni dosežek v letu 201412 13.1. Izjemni znanstveni dosežek Zaključno poročilo raziskovalnega projekta - 2015 Je naveden pri programu P1-0048. 13.2. Izjemni družbeno-ekonomski dosežek C. IZJAVE Podpisani izjavljam/o, da: • so vsi podatki, ki jih navajamo v poročilu, resnični in točni • se strinjamo z obdelavo podatkov v skladu z zakonodajo o varstvu osebnih podatkov za potrebe ocenjevanja ter obdelavo teh podatkov za evidence ARRS • so vsi podatki v obrazcu v elektronski obliki identični podatkom v obrazcu v pisni obliki • so z vsebino zaključnega poročila seznanjeni in se strinjajo vsi soizvajalci projekta Podpisi: zastopnik oz. pooblaščena oseba in vodja raziskovalnega projekta: raziskovalne organizacije: Institut "Jožef Stefan" Dušan Turk ZIG Kraj in datum: Ljubljana | 16.3.2015 Oznaka poročila: ARRS-RPROJ-ZP-2015/240 1 Napišite povzetek raziskovalnega projekta (največ 3.000 znakov v slovenskem in angleškem jeziku) Nazaj 2 Napišite kratko vsebinsko poročilo, kjer boste predstavili raziskovalno hipotezo in opis raziskovanja. Navedite ključne ugotovitve, znanstvena spoznanja, rezultate in učinke raziskovalnega projekta in njihovo uporabo ter sodelovanje s tujimi partnerji. Največ 12.000 znakov vključno s presledki (približno dve strani, velikost pisave 11). Nazaj 3 Realizacija raziskovalne hipoteze. Največ 3.000 znakov vključno s presledki (približno pol strani, velikost pisave 11) Nazaj 4 V primeru bistvenih odstopanj in sprememb od predvidenega programa raziskovalnega projekta, kot je bil zapisan v predlogu raziskovalnega projekta oziroma v primeru sprememb, povečanja ali zmanjšanja sestave projektne skupine v zadnjem letu izvajanja projekta, napišite obrazložitev. V primeru, da sprememb ni bilo, to navedite. Največ 6.000 znakov vključno s presledki (približno ena stran, velikost pisave 11). Nazaj 5 Navedite znanstvene dosežke, ki so nastali v okviru tega projekta. Raziskovalni dosežek iz obdobja izvajanja projekta (do oddaje zaključnega poročila) vpišete tako, da izpolnite COBISS kodo dosežka - sistem nato sam izpolni naslov objave, naziv, IF in srednjo vrednost revije, naziv FOS področja ter podatek, ali je dosežek uvrščen v A'' ali A'. Nazaj 6 Navedite družbeno-ekonomske dosežke, ki so nastali v okviru tega projekta. Družbeno-ekonomski rezultat iz obdobja izvajanja projekta (do oddaje zaključnega poročila) vpišete tako, da izpolnite COBISS kodo dosežka - sistem nato sam izpolni naslov objave, naziv, IF in srednjo vrednost revije, naziv FOS področja ter podatek, ali je dosežek uvrščen v A'' ali A'. Družbeno-ekonomski dosežek je po svoji strukturi drugačen kot znanstveni dosežek. Povzetek znanstvenega dosežka je praviloma povzetek bibliografske enote (članka, knjige), v kateri je dosežek objavljen. Povzetek družbeno-ekonomskega dosežka praviloma ni povzetek bibliografske enote, ki ta dosežek dokumentira, ker je dosežek sklop več rezultatov raziskovanja, ki je lahko dokumentiran v različnih bibliografskih enotah. COBISS ID zato ni enoznačen, izjemoma pa ga lahko tudi ni (npr. prehod mlajših sodelavcev v gospodarstvo na pomembnih raziskovalnih nalogah, ali ustanovitev podjetja kot rezultat projekta ... - v obeh primerih ni COBISS ID). Nazaj 7 Navedite rezultate raziskovalnega projekta iz obdobja izvajanja projekta (do oddaje zaključnega poročila) v primeru, da katerega od rezultatov ni mogoče navesti v točkah 6 in 7 (npr. ni voden v sistemu COBISS). Največ 2.000 znakov, vključno s presledki. Nazaj 8 Pomen raziskovalnih rezultatov za razvoj znanosti in za razvoj Slovenije bo objavljen na spletni strani: http://sicris.izum.si/ za posamezen projekt, ki je predmet poročanja Nazaj 9 Največ 4.000 znakov, vključno s presledki Nazaj 10 Največ 4.000 znakov, vključno s presledki Nazaj 11 Rubrike izpolnite / prepišite skladno z obrazcem "izjava sofinancerja" http://www.arrs.gov.si/sl/progproj/rproj/gradivo/, ki ga mora izpolniti sofinancer. Podpisan obrazec "Izjava sofinancerja" pridobi in hrani nosilna raziskovalna organizacija -izvajalka projekta. Nazaj 12 Navedite en izjemni znanstveni dosežek in/ali en izjemni družbeno-ekonomski dosežek raziskovalnega projekta v letu 2014 (največ 1000 znakov, vključno s presledki). Za dosežek pripravite diapozitiv, ki vsebuje sliko ali drugo slikovno gradivo v zvezi z izjemnim dosežkom (velikost pisave najmanj 16, približno pol strani) in opis izjemnega dosežka (velikost pisave 12, približno pol strani). Diapozitiv/-a priložite kot priponko/-i k temu poročilu. Vzorec diapozitiva je objavljen na spletni strani ARRS http://www.arrs.gov.si/sl/gradivo/, predstavitve dosežkov za pretekla leta pa so objavljena na spletni strani http://www.arrs.gov.si/sl/analize/dosez/. Nazaj Obrazec: ARRS-RPR0J-ZP/2015 v1.00a E9-57-AB-24-5E-7C-71-5A-92-DB-6A-BC-38-D0-1E-A2-3A-A2-0C-1F