Miha Pavšič Makromolekulska kristalografija Praktikum iz X-žarkovne kristalografije bioloških makromolekul Ljubljana, 2021 Makromolekulska kristalografija: Praktikum iz X-žarkovne kristalografije bioloških makromolekul Napisal doc. dr. Miha Pavšič Recenzija prof. dr. Kristina Djinović Carugo izr. prof. dr. Marjetka Podobnik Prelom doc. dr. Miha Pavšič Slikovni material doc. dr. Miha Pavšič Lektoriranje mag. Alenka Klemenc Urednica založbe doc. dr. Barbara Modec Založila Univerza v Ljubljani, Fakulteta za kemijo in kemijsko tehnologijo Za založbo prof. dr. Jurij Svete © (2021) univerza v ljubljani, fakulteta za kemijo in kemijsko tehnologijo 1. spletna izdaja Ljubljana, 2021 https://www.fkkt.uni- lj.si/sl/zalozba- ul- fkkt/e- gradiva/ Kataložni zapis o publikaciji (CIP) pripravili v Narodni in univerzitetni knjižnici v Ljubljani COBISS.SI-ID=54895875 ISBN 978-961-7078-16-9 (pdf) 3 Uvodna beseda Razumevanje delovanja organizma temelji na razumevanju delovanja celic, ki ga sestavljajo, slednje na razumevanju biokemijskih procesov in vanje vključenih bioloških makromolekul, delovanje teh pa je neposredno povezano z njihovo strukturo. Da bi lahko razpoložljive strukturne podatke pravilno in učinkovito uporabljali, in morda celo prispevali v zakladnico strukturne biologije, moramo razumeti, kako do teh podatkov pridemo – torej, kako določimo tridimenzionalno strukturo bioloških makromolekul. En pristop – X-žarkovna kristalografija – je predstavljen v tem učbeniku, ki zraven kratkih teoretičnih osnov vsebuje tudi praktične primere v obliki navodil za vaje. Za razumevanje je nujno poznavanje osnov biokemije in molekularne biologije, strukture proteinov in bioinformatike. Vsekakor naj bralec ob poglobljenem študiju v roke vzame še dodatno obsežnejšo literaturo. Delo je prvenstveno namenjeno študentom magistrskega študijskega programa Biokemija na Fakulteti za kemijo in kemijsko tehnologijo Univerze v Ljubljani, in sicer v okviru predmeta Metode določanja 3D strukture makromolekul kot učno gradivo, ki spremlja predavanja s teoretično podlago. Predmet je zasnovan tako, da študenti med vajami spoznajo praktično vse korake, ki vodijo do kristalne strukture biološke makromolekule, in sicer v okviru laboratorijskih in računalniških vaj. Nekatere tematike so obravnavane pri drugih predmetih (na primer priprava rekombinantnih proteinov), zato jih učbenik ne obravnava. Koristen vir informacij bo predstavljal tudi študentom drugih biokemijskih in molekularno-bioloških študijev. Vsem želim prijeten in uspešen študij. Miha Pavšič Kazalo Uvod 7 Kaj je struktura? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Določanje 3D strukture makromolekul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Navodila za bralca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Ostale informacije . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Od ideje do strukture 8 Pregled 9 Pot do kristalne strukture . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1 Načrtovanje proteinskih konstruktov 11 1.1 Pridobivanje proteinov za kristalizacijo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.2 Rekombinantni proteini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.3 Načrtovanje konstruktov in modifikacij . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.3.1 Modifikacije na nivoju DNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.3.2 Modifikacije na nivoju proteina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.4 Ocena kristalizabilnosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.4.1 Orodje XtalPred-RF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 Vaja 1: Načrtovanje proteinskih konstruktov 21 2 Kristalizacija 25 2.1 Proces kristalizacije . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.2 Praktična izvedba kristalizacije . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.2.1 Kristalizacija po principu viseče kapljice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.3 Kristalizacijski presejalni testi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 2.3.1 Ocenjevanje rezultatov kristalizacijskih testov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.4 Zanimiva dodatna literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Vaja 2: Kristalizacija lizocima 31 3 Snemanje in procesiranje difrakcijskih podatkov 35 3.1 Priprava kristalov za difrakcijsko analizo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.2 Snemanje difrakcijskih podatkov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.3 Procesiranje difrakcijskih podatkov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Vaja 3: Snemanje in procesiranje difrakcijskih podatkov 38 4 Reševanje, piljenje in validacija modela strukture 39 4.1 Povezava med difrakcijskimi podatki in strukturo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 4.2 Določitev faz sipanih žarkov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 4.2.1 Molekulska zamenjava . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 4.3 Asimetrična enota in njena sestava . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 4.4 Gradnja modela strukture v praksi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 4.5 Ocenjevanje kvalitete modela strukture . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 4.6 Validacija modela strukture . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 Vaja 4a: Ročno piljenje modela strukture v grafičnem okolju 43 6 Vaja 4b: Reševanje strukture človeške karbonske anhidraze II 51 Okrajšave in simboli 56 Literatura 58 Uvod Kaj je struktura? Ko rečemo “določili bomo strukturo proteina”, po navadi mislimo, da bomo z uporabo enega ali več pristopov prišli do koordinat atomov, ki proteinsko molekulo sestavljajo. S tem ne mislimo, da bomo strukturo samo modelirali, na primer na osnovi znanih struktur sorodnih proteinov, temveč bomo uporabljali eksperimentalne podatke, kar nam zagotavlja, da bo določena struktura realna, prikaz dejanskega stanja. Pa je res tako? Strukture, deponirane v podatkovnih zbirkah, se vse preveč rado interpretira na način “tako je in nič drugače”. Moramo se zavedati, da so te strukture pravzaprav modeli struktur, ki predstavljajo eno ali več stanj, ki jih zavzame molekula, ali neko povprečno stanje pri določenih pogojih1. Modeli 1 Vsekakor besedne zveze model strukture ne gre zamenjevati s teoretičnimi modeli, npr. kot taki torej ne zajemajo vseh vidikov strukture (omejeni podatki o dina-modeli na osnovi homologije ali celo modeli miki/fleksibilnosti molekul ter z njo povezanimi različnimi konformacijami, ab initio. vpliv okolja molekule med določevanjem strukture, ...), prav tako lahko vsebujejo napake. Pri njihovi uporabi moramo biti torej previdni in poznati vsaj osnove njihovega določanja, da se bomo zavedali pasti ter jih znati pravilno interpretirati in uporabljati. Določanje 3D strukture makromolekul Rentgenska (X-žarkovna) kristalografija je metoda, s katero je bil do sedaj določen večji delež struktur makromolekul v zbirki Protein Data Bank (PDB) (1), in sicer dobrih 89 % (tabela 1 in slika 1; podatki so z dne 2. 12. 2020, s strani http://www.rcsb.org/stats/). Metoda Proteini NK Proteini/NK Drugo Vsota Delež [%] Tabela 1: Število v zbirko PDB deponira- nih modelov struktur makromolekul glede MX 134576 2110 7119 8149 151954 88,4 na uporabljeno metodo (MX – makromolekul- NMR 11523 1309 269 92 13193 7,7 ska kristalografija, NMR – jedrska magnetna EM 4334 53 1544 555 6486 3,8 resonanca, EM – krio-elektronska mikrosko- HM 162 6 3 6 177 0,1 pija, HM – hibridne metode). Okrajšava NK pomeni nukleinske kisline. drugo 99 3 0 4 106 < 0,1 Skupaj 150694 3481 8935 8806 171916 Do nedavnega je bila X-žarkovna kristalografija tudi edina metoda, ki je bila primerna za določitev strukture zelo velikih makromolekul ali njihovih 200 kompleksov pri (skoraj) atomski ločljivosti. Gradnja tovrstnih modelov na-vse metode 1000) mreč zahteva ločjivosti, ki so boljše od 4 Å, saj takrat definiranje koordinat 150 MX NMR posameznih atomov postane možno in smiselno. Ločljivost večine makromo-tur (v EM 100 lekulskih struktur, deponiranih v zbirko PDB, je boljša kot 4 Å; pri relativno truk majhnih makromolekulah so se najvišje ločljivosti približale teoretični meji s 50 ilo pri približno 0,5 Å (slika 2). V to skupino metod je pred nekaj leti vstopila 0 krio-elektronska mikroskopija, s pomočjo katere je možno doseči ločljivosti, štev 1980 1990 2000 2010 2020 ki so boljše od 1,5 Å, o čemer priča tudi struktura mišjega apoferitina (0,5 leto MDa) pri ločljivosti 1,25 Å (2). Slika 1: Rast števila struktur, deponiranih v Ko govorimo o rentgenski kristalografiji v smislu določevanja struktur ma-zbirko PDB. Podatki za leto 2020 niso do- končni. kromolekul, pogosto uporabljamo besedno zvezo makromolekulska X-žarkovna 8 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja kristalografija (na kratko: makromolekulska kristalografija, okrajšava MX). Še ožji pojem, ki se nanaša na proteine, pa je proteinska kristalografija (PX). V praksi se “proteinska kristalografija” uporablja na splošno in zajema vse makromolekule; gre za zgodovinske razloge, saj so bile prve strukture makromolekul strukture proteinov, pa tudi danes strukture proteinov predstavljajo skoraj 93 % vseh struktur, deponiranih v zbirko PDB, strukture nukleinskih kislin, ki niso v kompleksu s proteini, pa zgolj 2 %. Tudi v tem besedilu je beseda “protein” pogosto uporabljena z mislijo na vse makromolekule, tako zaradi razširjene splošne uporabe kot tudi zaradi dejstva, da so opisani koraki med določevanjem strukture proteinov, nukleinskih kislin ter njihovih kompleksov zelo podobni, če ne celo identični. Slika 2: Izsek strukture in karte elektronske gostote krambina, določene z X-žarkovni di- frakcijo pri ločljivosti 0,54 Å (3). Elektronski oblaki posameznih atomov so jasno vidni, pri Navodila za bralca tej ločljivosti je bilo moč določiti tudi položaje vodikovih atomov (vezi z njimi so prikazane kot sive paličice). PDB ID 1EJG. Povezave Besedilo vsebujeprecej povezav do spletnih virov, vključene so pa na dva načina: • manj pomembne so prikazane v vijolični barvi in so vidne oz. delujoče le v elektronski obliki, na primer povezava do spletne strani Univerze v Ljubljani, ki posebne predstavtve zagotovo ne potrebuje; • pomembnejše povezave do spletnih podatkovnih zbirk so prav tako obarvane vijolično, a z drugo pisavo in izpisane, tako da je naslov URL viden v natisnjeni obliki, hkrati pa delujejo kot aktivne povezave tudi v elektronski obliki, na primer povezava do zbirke struktur PDB na naslovu http://www.rcsb.org/. Znotraj datoteke PDF kot povezave delujejo tudi številke slik, tabel in strani ter elementi kazala. Navodila za računalniške vaje Velika večina literature na temo makromolekulske kristalografije, vključno s tekočo literaturo (članki), je v angleščini. Za lažje povezovanje pojmov so nekateri pomembnejši ali za kristalografijo specifični izrazi navedeni tudi v angleškem jeziku in sicer v poševnem tisku v oklepaju neposredno za izrazom v slovenščini; primer: sejanje (seeding). Navodila za računalniške vaje V delu navodil, ki se nanaša na računalniške vaje, je za označevanje ukazov ter datotek in map uporabljena naslednja notacija: mapa V navodilih je za ločevanje med imeni map in datotek uporabljen znak / (poševnica, angl. slash), kar velja za UNIX in podobne operacijske sisteme (Linux, macOS), pri okolju MS Windows® pa se uporablja \ (leva poševnica, angl. backslash); menu predstavlja nekaj, kamor kliknemo in s tem odpremo seznam možnosti, vključimo neko določeno nastavitev ali pa kar gumb, ki sproži izvajanje. Dostop do materiala Material v obliki datotek, potrebnih za izvedbo vaj, je na voljo pri avtorju – miha.pavsic@fkkt.uni-lj.si. Ostale informacije Vse shematske slike struktur (prikaz kot trak – angl. ribbon, molekulska površina ...) so narisane s programom UCSF Chimera (4). Slike struktur, kjer je prikazana elektronska gostota, so bile narisane s programom Coot (5). V učbeniku je nekaj slik, ki so vzete iz drugih virov; ti so navedeni ob sliki. Pregled Pot do kristalne strukture Potek določanja 3D strukture nekega proteina z rentgensko difrakcijo lahko poenostavljeno razdelimo na naslednje korake, ki so shematsko prikazani na sliki 3 na strani 10: 1. Načrt projekta, v okviru katerega definiramo problem in identificiramo specifične cilje – slednji so v našem primeru kristalne strukture, katerih interpretacija nam bo po pričakovanju dala odgovore na zastavljena vprašanja.; Primer problema: "Kako vezava kalcijevih ionov na α-aktinin-1 vpliva na njegovo prečno povezovanje aktinskih filamentov?"Do odgovora bi se lahko, na primer, dokopali s kristalnimi strukturami α-aktinina-1 oz. relevantnega dela z in brez vezanih ionov Ca2+, eventuelno še s strukturo kompleksa z aktinom – te strukture oz. njihova določitev bi bili naši cilji. 2. Priprava in čiščenje makromolekule – v skladu z načrtom projekta in zastavljenimi cilji razmislimo, strukturo katerih proteinov, njihovih delov ali kompleksov želimo določiti ter kako bomo pripravili material za kristalizacijo. Danes se večinoma uporabljajo rekombinantni proteini, kjer imamo veliko možnosti vplivanja na lastnosti proteinskih molekul – lahko pripravimo nemutirane ali mutirane proteine in njihove dele, odstranimo neželene fleksibilne regije, vplivamo na posttranslacijske modifikacije ipd. Pri tem ponavadi želimo imeti čim manjše konstrukte, ki nam bodo še omogočali odgovoriti na zastavljena vprašanja, hkrati pa načrtno vplivati na njihove lastnosti z namenom povečanja verjetnosti tvorbe kristalov. Ravno ta del, načrtovanje proteinskih konstruktov, je predmet razdelka 1 in spremljajoče računalniške vaje. 3. Kristalizacija – iskanje kristalizacijskih pogojev z uporabo presejalnih testov, optimizacija kristalizacije ter v končni fazi pridobitev kristalov, primernih za difrakcijsko analizo. To je ponavadi ozko grlo projekta, saj se sestave kristalizacijskih raztopin, ki bodo omogočale tvorbo kristalov, (še) ne da izračunati oz. napovedati. Kristalizacija je predmet razdelka 2 in spremljajoče laboratorijske vaje. 4. Difrakcijska analiza – najprej kristale karakteriziramo (ocena njihove kvalitete in kvalitete difrakcije – ločljivost, defekti ...), nato pa s primernimi kristali posnamemo difrakcijske podatke (na domačih oz. hišnih virih X-žarkov ali sinhrotronu), podatke procesiramo (indeksiranje, določitev in piljenje parametrov osnovne celice, skaliranje, integracija) ter tako pridemo do najverjetnejše prostorske skupine, Millerjevih indeksov hkl ter intenzitete Ihkl. Snemanje in procesiranje difrakcijskih podatkov je na kratko opisano v razdelku 3, spremlja ga demonstracijska vaja. 5. Določitev faze sipanih žarkov in izračun elektronske gostote – da lahko izračunamo karto elektronske gostote, potrebujemo zraven intenzitete sipanih žarkov (podatek o amplitudi) še njihovo fazo; ta t. i. fazni problem lahko rešimo z različnimi metodami, na primer z molekulsko zamenjavo, prek anomalnega sipanja in izomorfno zamenjavo. Molekulsko zamenjavo obravnava razdelek 4, s spremljajočo računalniško vajo. 10 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja 6. Interpretacija karte elektronske gostote ter gradnja in piljenje modela, v okviru katere v karto elektronske gostote zgradimo model strukture, koraki gradnje pa se ciklično izmenjujejo s koraki piljenja. Naš cilj je model strukture, ki je čim bolj v skladu tako z eksperimentalnimi podatki kot tudi s splošnimi stereokemijskimi parametri (dolžine vezi, koti, ...). Korake obravnava razdelek 4, s spremljajočo računalniško vajo. 7. Validacija in analiza modela, kjer dodatno analiziramo realnost našega modela strukture in poskušamo z njim odgovoriti na vprašanja, zastavljena med načrtovanjem projekta. Proces ni tako enostaven in enosmeren, pogosto je potrebno vračanje en ali več korakov nazaj, in sicer zaradi optimizacije določenih stopenj, pridobivanja dodatnih podatkov ipd. Nekaj možnih in pogostih scenarijev je prikazanih na sliki 3. definicija problema in ciljev računalniški del: - analiza literature - zbiranje podatkov - ocena kristalizabilnosti načrtovanje konstruktov iti, - strategija pripave materiala pen, laboratorij: o zgrad , ... molekulsko kloniranje ernih) v - kloniranje no pMX etirali - izražanje rekombinantnih orem talo peš otein ni to ost, ... proteinov pr se ne izraža, ... ni (prim kris priprava materiala čljiv - čiščenje in karakterizacija interpr e ni us ela ne m - presejalni kristalizacijski od enj laba lo testi o lahko m pilj - priprava kristalov na kristalizacija ije, s snemanje te, ki bi j ifrakc sinhrotron ali hišni vir sto snemanje in procesiranje ni d X-žarkov difrakcijskih podatkov računalniški del: o karte el. go faziranje - rešitev faznega problema - avtomatska in ročna gradnja obim modela strukture ne d gradnja in piljenje - avtomatsko in ročno piljenje modela strukture modela strukture - validacija (ujemanje z eksperimentalnimi podatki in stereokem. parametri) validacija modela strukture - analiza modela strukture in interpretacija v smislu povezave struktura-funkcija analiza in interpretacija modela strukture Slika 3: Pregledna shema procesa določeva- nja strukture biološke makromolekule z X- žarkovno kristalografijo. Proces ne poteka enosmerno od problema do modela strukture temveč je pogosto potrebno vračanje en ali več korakov nazaj, kar ponazarjajo krivljene pu- ščice ob straneh. Prikazani so pogosti scenariji, ne pa vsi možni. Koraki z obarvanim ozadjem predstavljajo vaje, opisane v nadaljevanju, ki se izvajajo kot računalniške ali laboratorijske vaje oziroma kot demonstracija. 1 Načrtovanje proteinskih konstruktov 1.1 Pridobivanje proteinov za kristalizacijo Na splošno lahko proteine oz. biološke makromolekule za namen kristalizacije pridobivamo na tri načine: • izolacija iz tkiv, organov ali celotnih organizmov, • kemijska sinteza, • izražanje z uporabo homo- in heterolognih ekspresijskih sistemov. Izolacija proteinov iz tkiv, organov ali celotnih organizmov je bila aktu-alna predvsem pred razvojem in široko uporabo tehnologije rekombinantne DNA (slika 1.1). S tem pristopom so povezane številne težave: • majhna količina – veliko število proteinov je prisotnih v majhnih količinah, zato je potrebno uporabiti veliko izhodnega materiala, prav tako je izolacija redkih proteinov težja; • kemijska nehomogenost – proteini so velikokrat kemijsko nehomogeni, ker je posledica posttranslacijskih modifikacij (glikozilacija, proteolitsko procesiranje, fosforilacija, ...); • težka dostopnost izhodnega materiala – pogosto je težko priti do zadostnih količin izhodnega materiala za izolacijo proteina, npr. v primeru "eksotičnih"organizmov. Prav tako so s pridobivanjem materiala živalskega in človeškega izvora povezani številni etični vidiki; Slika 1.1: Eden prvih kristaliziranih proteinov je bil hemoglobin. Leta 1909 sta Reichert in • odsotnost enostavnih označevalnih regij – na primer, taki proteini npr. Brown objavila več kot 600 fotografij kristalov ne vsebujejo široko uporabljane heksahistidinske oznake za čiščenje z hemoglobina, izoliranega iz 109 različnih ži-afinitetno kromatografijo z imobiliziranimi kovinskimi ioni. valskih vrst, ter predpostavila, da sorodnost med temi vrstami korelira z obliko kristalov Nekaj navedenih težav bi lahko enostavno rešili s kemijsko sintezo (6). polipeptidnih verig ter verig nukleinskih kislin, a je to pri večjih molekulah in zahtevanih večjih količinah produkta zahtevno in drago, prav tako pa se pri proteinih pojavijo težave s pravilnim zvitjem polipeptidne verige. Tak pristop je torej primeren zgolj za manjše molekule, npr. peptide in kratke segmente nukleinskih kislin, ki jih je najenostavneje naročiti pri podjetjih, specializiranih za njihovo sintezo. Proteine za kristalizacijo danes najpogosteje pripravljamo z uporabo homo- in heterolognih ekspresijskih sistemov, translacijo in vitro pa zaradi omejitev pri količini pridobljenega proteina in potencialnimi težavami s pravilnim zvitjem uporabljamo redko. Kot prokariontski sistem uporabljamo večinoma bakterije Escherichia coli ali Bacillus subtilis, kot evkariontski pa kvasovke (Saccharomyes cerevisiae, Pichia pastoris), insektne celice (organizma Spodoptera frugiperda ali Trichoplusia ni, zapis najpogosteje vnašamo s pomo- čjo bakulovirusov) ter sesalske celice (mišje, človeške). Druge organizme, vključno z rastlinami, za pridobivanje proteinov za kristalizacijo uporabljamo redkeje. Podrobnosti in specifike dela s posameznim ekspresijskim sistemov tu niso obravnavane, zato naj se bralec usmeri na drugo relevantno literaturo, ki obravnava značilnosti in izbor primernega ekspresijskega sistema (7). V smislu proizvodnje rekombinantnih proteinov za uporabi v strukturni biologiji so v novejšem času stopile v ospredje visoko zmogljive metode 12 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja (angl. high-throughput (HT) methods) proizvodnje proteinov, razvite predvsem v okviru projektov strukturne genomike. Omogočajo hitro in učinkovito pripravo konstruktov za izražanje proteinov, izražanje sámo, čiščenje ter nadaljnje korake. Pregled tovrstnih metod je na voljo v znanstveni literaturi (8; 9), prav tako so zanimivi opisi nekaterih delujočih visoko zmogljivih sistemov (10; 11; 12; 13). 1.2 Rekombinantni proteini Uporaba ekspresijskih sistemov zahteva, da zapis za želeni protein kloniramo s pomočjo tehnologije rekombinantne DNA, kar nam nudi veliko fleksibilnosti pri načrtovanju proteinskih konstruktov z želenimi lastnostmi (visok nivo izražanja, topnost, enostavno čiščenje, sposobnost tvorbe kristalov ...). Za te modifikacije se moramo odločiti že v stopnji načrtovanja konstruktov na nivoju aminokislinskega oz. nukleotidnega zaporedja, na nekatere lastnosti proteinov pa lahko vplivamo tudi kasneje, ko so ti že očiščeni (na primer odstranitev glikozilacije in metilacija lizinskih ostankov). Po navadi delamo z več konstrukti vzporedno, s tem prihranimo čas ter povečamo možnost priprave proteina v primerni količini in čistosti, prav tako pa pogosto delamo kristalizacijske presejalne teste z več konstrukti oz. oblikami proteina vzporedno. Sicer je nemogoče z gotovostjo napovedati, kateri konstrukt bo dal (uporabne) kristale, kljub temu pa lahko sposobnost oz. težnjo po tvorbi kristalov, t.i. kristalizabilnost, vsaj približno ocenimo prek analize aminokislinskega zaporedja konstruktov. To je podrobneje obravnavano v razdelku 1.4 na strani 16. V nadaljevanju sledi opis nekaterih pogostih modifikacij, ki jih uvajamo na nivoju DNA in proteinov, z namenom vplivati na nekatere njihove lastnosti. 1.3 Načrtovanje konstruktov in modifikacij V okviru načrtovanja strategije priprave proteinskih konstruktov v prvi vrsti spada izbira ekspresijskega sistema, saj so od tega odvisni izbor vektorjev, način dela, možne posttranslacijske modifikacije ipd. Včasih se odločimo za delo z dvema sistemoma vzporedno (npr. bakterijski sistem in insektne celice), s čimer povečamo možnost, da nam bo uspelo pripraviti protein v topni obliki v zadostnih količinah. Pri tem kot enega izmed sistemov pogosto izberemo ravno bakterijskega, saj je čas od konstrukta DNA do izraženega proteina kratek, v primeru neuspeha pa imamo v tem času že pripravljene konstrukte za katerega od kompleksnejših sistemov. 1.3.1 Modifikacije na nivoju DNA Prek modifikacije zaporedja DNA v zaporedje proteina najpogosteje uvedemo: • označevalni zapis za detekcijo s protitelesi in čiščenje s pomočjo afinitetne kromatografije z imobiliziranimi kovinskimi ioni (npr. nikljeva afinite-tna kromatografija), najpogostejše tovrstne oznake pa so heksahistidinska oznaka (His6-oznaka oz. repek) in oznake STREP (zaporedje WSHPQFEK), HA (YPYDVPDYA; izbira iz proteina hemaglutinina) ter FLAG (zaporedje DYKDDDDK), za detekcijo s protitelesi pa se pogosto uporablja tudi oznaka Myc (zaporedje EQKLISEEDL); pregled in podroben opis označevalnih zapisov naj bralec poišče v drugi literaturi (14; 15; 16); • zaporedje, znotraj katerega cepi visokospecifična peptidaza, s katero lahko med čiščenjem odstranimo vnesen označevalni zapis ali drugi večji fuzijski del, ki bi lahko negativno vplival na sposobnost tvorbe kristalov1. 1 Na primer, kratke oznake kot je His6 so po- gosto strukturno neurejene in lahko negativno Pogosto se uporabljajo cepitvena mesta za naslednje peptidaze (↓ označuje vplivajo na tvorbo kristalnih kontaktov. mesto cepitve): trombin (LVPR↓), proteaza virusa jedkanja tobaka - TEV (Tobacco Etch Virus; ENLYFQ↓), enterokinaza (DDDDK↓) in faktor Xa (IDGR↓). Bralec lahko obširne preglede encimov najde v drugi literaturi (14; 17). na č r t ova n j e p ro t e i n s k i h k o n s t ru k t ov 13 Umestitev označevalnega zaporedja in cepitvenega mesta na N- oz. C-kDa wt mut konec proteina zahteva tehten razmislek, pri katerem upoštevamo potencialno 60 motenje pri zvijanju ter dostopnost oznake in cepitvenega mesta. Dostopnost lahko izboljšamo tako, da med želeni protein in oznako/cepitveno mest 45 vstavimo kratek fleksibilen povezovalni peptid, npr. z zaporedjem GS. 30 Tehnologija rekombinantne DNA nam omogoča tudi številne druge modifikacije, paziti pa moramo, da z njimi proteina ne spremenimo do te mere, da nam struktura s funkcijskega vidika ne omogoča več pravilne interpretacije : 20 • delecija N- in/ali C-končnih regij, ki so pogosto neurejene in lahko Slika 1.2: Iz primera na sliki je razvidno, kako negativno vplivajo na sposobnost tvorbe medmolekulskih kontaktov v je uvedba treh mutacij N→Q in posledično kristalu ter posledično na kristalizacijo (nasprotno, posledice modifikacij ugasnitev N-glikozilacije povečala kemijsko homogenost mutiranega proteina (mut) v pri- z namenom promoviranja medmolekulskih kristalnih kontaktov prek merjavi s proteinom divjega tipa (wt); muti-uvajanja dodatnih regij so izredno nepredvidljive); rana oblika je kasneje dala kristale (desno), ki so sipali do ločljivosti 1.9 Å (18). • izbris N- in O-glikozilacijskih mest prek uvedbe drugačno smiselnih mutacij na mesta aminokislinskih ostankov, kamor so pripeti ogljikovi hidrati (v primeru N-glikozilacije pogosto Nx[ST]→Qx[ST] ali Sx[ST]), s čimer omogočimo/olajšamo tvorbo medmolekulskih kontaktov med poli-peptidnimi verigami ter hkrati povečamo kemijsko (v primeru heterogene glikozilacije, primer na sliki 1.2) ter konformacijsko homogenost vzorca (ogljikohidratne verige so na površini proteina ter pogosto nimajo stabilne konformacije). Zavedati pa se moramo, da sprememba glikozilacije vpliva tudi na intrinzične lastnosti samega proteina, njegovo dinamiko in stabilnost2; 2 Zanimivo, Lee in sod. so prek simula- cij molekulske dinamike proteinskih struktur • priprava samo določene domene ali več domen, kar pomeni manjši pro-z N-pripetimi oligosaharidi pokazali, da N- tein (pogosto lažje delo), večjo topnost in načeloma večjo konformacijsko glikozilacija zmanjša dinamiko in domevno homogenost, posebej v primeru daljših fleksibilnih meddomenskih pove-posledično poveča stabilnost proteinov (19). zav; delo s posameznimi domenami vedno ni (enostavno) izvedljivo, saj so lahko stiki med domenami večdomenskega proteina hidrofobni, pri izolirani domeni pa bi to pomenilo izpostavitev teh regij ter povečane težnje k agregaciji. Prav tako pa je lahko prisotnost neke domene oz. meddomenskih stikov ključnega pomena za pravilno zvitje ali konformacijo neke druge domene; • fuzija dveh različnih proteinov ali njihovih domen prek povezovalne regije (20; 21), kar se lahko uporablja tudi z namenom povečanja možnosti tvorbe kristalnih kontaktov, na primer fuzije s proteinom, ki veže maltozo (maltose binding protein, MBP); • vnos mutacij na površini proteina, z namenom vplivanja na površinski naboj, na primer povečanje topnosti z uvedbo bolj polarnih ali celo nabitih aminokislinskih ostankov na površino, uvedbo lepljivih površin, z namenom promoviranja kristalnih kontaktov (22) ali pa zmanjšanja površinske entropije, kar je v ločenem odstavku opisano v nadaljevanju; • vnos drugih mutacij, ki vplivajo na konformacijo proteina in njegovo aktivnost (namenska inaktivacija ali namenska aktivacija proteina) – pri kristalizaciji proteaz je včasih smiselno mutirati aminokislinski ostanek, ključen za njihovo aktivnost, ter s tem preprečiti samorazgradnjo. V okviru priprave rekombinantnih proteinov je treba omeniti še možnost zamenjave metionina (Met) s selenometioninom (se-Met), kar pride v poštev za določitev faz sipanih žarkov prek anomalnega sipanja uvedenih selenovih atomov v fazi določanja strukture (na primer pri Se-SAD). Pri tem sicer ne gre za uvedbo modifikacij na nivoju DNA, gre namreč zgolj za to, da za metionin avksotrofen gostiteljski (mikro)organizem gojimo v gojišču, ki kot vir metionina vsebuje selenometionin. Na tem mestu je modifikacija omenjena zgolj zato, ker je uporabna le v primeru rekombinantnih proteinov. V luči uvedbe modifikacij je zanimiv tudi pristop usmerjene evolucije, pri kateri iščemo mutante nekega proteina z želenimi lastnostmi v obsežni knjižnici naključnih mutantov (23) (nekoliko bolj poljuden opis postopka v slovenskem jeziku je v članku (Po)moč evolucije (24)). Drugače povedano, knjižnico mutantov nekega proteina izpostavimo selekcijskemu pritisku, pri 14 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja čemer je način izbire mutant oz. "ribarjenja"po knjižnici odvisen od lastnosti, ki jo iščemo (topnost, vezava liganda ...). V okviru tega se uporabljajo pristopi, kot sta predstavitev na fagu in predstavitev na ribosomu. Na podoben način lahko pripravimo tudi kombinatorične knjižnice konstruktov, modificiranih na različne načine (skrajšanje, mutacije, fragmentacija) (25). Pristop, povezan z usmerjeno evolucijo, je uporaba kristalizacijskih šaperonov. To so proteini, ki se vežejo na protein oz. makromolekulo, ki jo želimo kristalizirati, in prek visokega potenciala tvorbe medmolekulskih kontaktov lahko pozitivno vplivajo na kristalizacijo. Primeri pogosto uporabljanih kristalizacijskih šaperonov so nanotelesa (nanobodies) in DARPINi (Designed Ankyrin Repeat ProteINs). Znani so številni primeri, kjer je uporaba tovrstnih orodij odločilno prispevala k določitvi strukture nekega proteina; pregled pristopov najdemo v znanstveni literaturi (26; 27; 28). Zmanjšanje površinske entropije pomeni, da prek uvedbe mutacij zmanj- šamo neurejenost stranskih skupin aminokislinskih ostankov na površini proteina, ki je povezana z njihovo fleksibilnostjo (29). Aminokislinski ostanki, katerih stranske skupine so pogosto izpostavljene topilu, so Lys, Glu in Gln; pri omenjenem pristopu jih najpogosteje mutiramo v Ala, Ser ali Thr. Kon-cept površinske entropije in njene vloge pri kristalizaciji temelji na naslednji enačbi: ∆G = ∆H − T(∆Sprotein + ∆Stopilo) (1.1) Glede na to, da so entalpijske vrednosti kristalnih kontaktov relativno majhne (medmolekulski kontakti so šibki), je kristalizacija entropijsko voden proces, ki pa vključuje spremembo entropije tako v smislu proteina kot topila. Prispevek topila (Stopilo) gre na račun s površine proteinskih molekul sproščenih molekul vode, do česar pride zaradi udeležbe teh delov površine proteina pri tvorbi medmolekulskih kontaktov, in ima kot tak pozitiven predznak, saj pride do povečanja entropije. Prispevek proteina (Sprotein) izvira iz: • zmanjšanja entropije zaradi zlaganja proteinskih molekul v urejeno kristalno mrežo, • ureditve stranskih skupin aminokislinskih ostankov na površini proteina zaradi tvorbe kristalne mreže (to imenujemo tudi entropijski ščit pred nastankom medmolekulskih interakcij). Slednji je predvsem izrazit v primeru aminokislinskih ostankov z velikimi fleksibilnimi stranskimi skupinami, kot sta lizinski in glutamatni ostanek. Po teoriji bi lahko z mutacijo slednjih zmanjšali omenjeni entropijski ščit in s tem prispevali k ugodnejši energetski bilanci nastanka kristala. Ravno na tem temelji pristop zmanjšanja površinske entropije (surface entropy reduction, SER), ki je implementiran v programu SERp (30). Slednji prek kompozitne napovedi, sestavljene iz napovedi sekundarne strukture, površinskega entro-pijskega profila in poravnave z zaporedji homologov z znano strukturo (za oceno izpostavljenosti aminokislinskih ostankov topilu), identificira skupke (clusters) aminokislinskih ostankov, ki so na površini proteina ter bi jih bilo smiselno mutirati ter s tem zmanjšati površinsko entropijo. Primer analize aminokislinskega zaporedja kokošjega lizocima, ki sicer precej rad kristalizira, je prikazan na sliki 1.3 na strani 15, ki vsebuje tudi kompozitni diagram posameznih analiz. V tem diagramu so nad aminokislinskim zaporedjem z modro prikazani vrhovi, ki naj bi ustrezali zankam in drugim manj urejenim regijam v strukturi, z rdečo pa regije z visoko entropijo; svetlo modra barva je namenjena prikazu aminokislinskih ostankov, ki so v strukturah homologov drugačni. Najprimernejši skupki za mutiranje so prikazani z zeleno. Pod aminokislinskim zaporedjem so posebej označeni aminokislinski ostanki, ki imajo nizko (rumeno) oz. visoko entropijo (rožnato), so predlagani za mutacije (zeleno) ali pa jih je na splošno smiselno zmutirati z namenom (rdeče). Sekundarna struktura je kot trak na dnu. 1.3.2 Modifikacije na nivoju proteina Protein lahko modificiramo tudi po izražanju. Najpogostejše modifikacije so: • omejena proteoliza, z namenom priprave manjših fragmentov (cepitev na izpostavljenih regijah z endopeptidazami); klasičen in splošno znan na č r t ova n j e p ro t e i n s k i h k o n s t ru k t ov 15 (a) (b) (c) skupek #1 K97 K96 C E35 K1 K33 skupek #2 skupek #3 Slika 1.3: Napoved površinske entropije. Pri- mer analize aminokislinskega zaporedja ko- košjega lizocima C (Uniprot ID P00698, re-primer je proteolitska fragmentacija protiteles IgG s cisteinsko proteazo gija 19–147) z orodjem SERp. (a) Kompozitni papainom, pri kateri pride do cepitev na pregibnih regijah težkih verig diagram rezultatov posameznih analiz, po- (med CH1 in CH2) in posledično do ločitve fragmentov Fab in Fc; drobneje opisan na strani 14. (b) Skupki in predlagane mutacije. Ocena SERp ima arbi- • odstranitev označevalnih zaporedij (pogosto nimajo urejene strukture) trarne enote. (c) Prikaz identificiranih skup-prek vnešenih cepitvenih mest za visoko specifične endopeptidaze (prote-kov na strukturi lizocima C (PDB ID 193L). Polipeptidna veriga je prikazana kot moder aza 3C, TEV, enterokinaza ...); trak, skupki pa kot rdeče paličice (tudi trak je na njihovem mestu rdeče obarvan). • odstranitev neurejenih N- in C-končnih regij, lahko tudi označevalnih zaporedij, s pomočjo amino- ali karboksi-peptidaz (torej eksopeptidaz), ki aminokislinske ostanke odcepljajo z N- oz. C-konca tako dolgo, dokler ne naletijo na sterično oviro (nezadostno izpostavljen aminokislinski ostanek in s tem nedostopna peptidna vez) ali aminokislinski ostanek, ki ne ustreza njihovi specifičnosti (na primer nekatere peptidaze ne cepijo tik pred/za prolinskimi ostanki); • kemijska metilacija lizinskih aminokislinskih ostankov, kar nevtralizira pozitivni naboj na površini proteinov in promovira hidrofobne medmolekulske interakcije prek metiliranih lizinskih ostankov (31); • (delna) odstranitev ogljikovih hidratov z glikoziliranih proteinov s po-močjo glikozidaz (32), kar zmanjša kemijsko (kot posledica heterogene glikozilacije) in konformacijsko heterogenost ter lahko pozitivno prispeva k tvorbi kristalnih kontaktov; na primer PNGaza F (peptid-N-glikozidaza F) cepi med N-acetilglukozaminom in asparaginskim aminokislinskim ostankom z manozo bogatih, hibridnih in kompleksnih na Asn pritrjenih ogljikohidratnih verig. Številni proizvajalci prodajajo posamezne gliko-zidaze in tudi mešanice glikozidaz, ki bolj ali manj popolno odstranijo 16 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja sladkorne ostanke, predvsem je težava lahko z dostopnostjo vezi Asn-NAcGln. Mesta cepitve različnih glikozidaz so prikazana na sliki 1.4. Slika 1.4: Cepitvena nekaterih glikozidaz, ki se uporabljajo za encimsko deglikozilacijo N- PNGaza F β-galaktozidaza glikoziliranih proteinov. neuraminidaza β-N-acetilglukozaminidaza Asn Asn Asn Asn N-acetilglukozamin manoza N-acetilneuraminska kislina galaktoza fukoza Očiščene proteine nato karakteriziramo z različnimi metodami (gelska filtracija, statično in dinamično sipanje svetlobe, termična stabilnost, elektrofo-reza pod nativnimi pogoji, izoelektrični fokusing, eno- in dvo-dimenzionalni spektri NMR, masna spektrometrija, ...) in tako ocenimo njihovo stabilnost, monodisperznost, zvitje ipd. Pristop, povezan z v prejšnjem razdelku omenjeno usmerjeno evolucijo, a tokrat na nivoju proteinov, je uporaba kristalizacijskih šaperonov. Gre za proteine, ki se vežejo na protein oz. makromolekulo (izberemo jih iz bazena mutantov), ki jo želimo kristalizirati, in prek visokega potenciala tvorbe medmolekulskih kontaktov lahko pozitivno vplivajo na kristalizacijo. Primeri pogosto uporabljanih kristalizacijskih šaperonov so nanotelesa (nanobodies) in DARPINi (Designed Ankyrin Repeat ProteINs). Znani so številni primeri, kjer je uporaba tovrstnih orodij odločilno prispevala k določitvi strukture nekega proteina. Pregled pristopov je na voljo v znanstveni literaturi (26; 27; 28). 1.4 Ocena kristalizabilnosti Zmožnost nekega proteina oz. proteinskega konstrukta, da bo tvoril kristale, imenujemo kristalizabilnost. Na enostaven način jo lahko ocenimo z upošte-vanjem nekaterih lastnosti proteina, npr. prisotnost daljših neurejenih regij in obsežna in heterogena glikozilacija, oboje je povezano z zmanjšano kristalizabilnostjo. Na tak način lahko preprosto rangiramo več variant/konstruktov za isti izvorni protein, a ocena je vseeno precej subjektivna in ne vključuje statistične evaluacije. Bolj relevantno oceno kristalizabilnosti lahko dobimo z uporabo računalniških orodij. V grobem jih lahko razdelimo v dve skupini: • orodja, ki kristalizabilnost ocenijo na podlagi iz aminokislinskega zaporedja izluščenih/napovedanih fizikalno-kemijskih lastnosti konstrukta; • orodja, ki ne temeljijo na analizi fizikalno-kemijskih lastnosti konstrukta. Orodja iz prve skupine analizirajo aminokislinsko zaporedje konstrukta, ki nas zanima, ocenijo oz. napovejo določene karakteristike zaporedja in proteina samega ter to statistično ovrednotijo v luči rezultatov enakih analiz aminokislinskih zaporedij proteinov, za katere so znani tudi rezultati real-nih presejalnih kristalizacijskih testov. Pri slednjih gre torej za empirične na č r t ova n j e p ro t e i n s k i h k o n s t ru k t ov 17 podatke o tem, ali je nek protein kristaliziral ali ne; ti podatki pa se pogosto črpajo iz strukturno-genomskih projektov, saj kot taki vsebujejo tako podatke, katere proteine jim je uspelo kristalizirati kot tudi tiste, kateri proteini niso kristalizirali. Vsekakor obetavni rezultati analize zaporedja načrtovanega proteinskega konstrukta ne pomenijo, da bomo v praksi zagotovo hitro dobili kristale – še vedno je ključna izvedba presejalnih (screening) testov, pri katerih preizkusimo veliko različnih kristalizacijskih pogojev. Drugi tip orodij za napoved kristalizabilnosti pa ne temelji na napovedi fizikalno-kemijskih lastnosti konstruktov, s čimer se izognejo težavam z (ne)zanesljivostjo tovrstnih napovedi. Aminokislinsko zaporedje konstrukta zgolj razkosajo na k-mere ter jih kot take analizirajo v luči empiričnih podatkov (podoben set kot pri prvi skupini orodij). Gre za strojno učenje, na katerem temeljijo tudi nekatera orodja iz prve skupine, le vhodni parametri se razlikujejo (pri prvi skupini napovedane fizikalno-kemijske lastnosti, pri drugi pa k-meri zaporedja). Nekatera od orodij iz druge skupine kljub temu upoštevajo nekatere napovedane fizikalno-kemijske lastnosti, a v omejenem obsegu. V znanstveni literaturi je opisanih precej orodij za napoved kristalizabilnosti, večino spremlja tudi prosto dostopen strežnik, na katerem program teče. Žal pa je nekaj naslovov strežnikov, predvsem starejšega datuma, neaktivnih. Na tem mestu je navedenih zgolj nekaj najbolj pogosto uporabljanih orodij ter najnovejših objav z delujočimi naslovi: • CrystalP2 (http://biomine.cs.vcu.edu/servers/CRYSTALP2/), ki pri napovedi uporablja aminokislinsko sestavo, sosledje aminokislinskih ostankov, izoelektrično točko in hidrofobnost (33); • PDPredictor (https://bioinformatics.anl.gov/cgi-bin/tools/pdp redictor/) temelji na analizi povprečne hidrofobnosti (indeks GRAVY, GRand AVerage hydropathY) ter nekaterih drugih lastnosti, uporablja strojno učenje (metoda podpornih vektorjev, SVM) (34); • PPCpred (http://biomine.ece.ualberta.ca/servers/PPCpred/), ki uporablja rezultate analize hidrofobnosti, aminokislinske sestave, napovedi neurejenosti, sekundarne strukture ter dostopnosti posameznih aminokislinskih ostankov topilu (35); • XtalPred-RF (https://xtalpred.godziklab.org), ki z aplikacijo metode naključnih gozdov (random forest, RF) (36) predstavlja izboljšavo osnov-nega strežnika XtalPred, kjer je napoved temeljila na analizi različnih fizikalno-kemijskih parametrov (dolžina zaporedja, izoelektrična točka, indeks GRAVY, indeks nestabilnosti, ovite vijačnice ...) (37). Orodje je podrobneje opisano na strani 18; • TargetCrys (http://csbio.njust.edu.cn/bioinf/TargetCrys) za razliko od napovedi fizikalno-kemijskih parametrov uporablja analizo aminokislinske sestave ter sestave dipeptidov in tripeptidov, temelji pa na metodi podpornih vektorjev (SVM) (38); • Crysalis (http://biotool.xmu.edu.cn/crysalis/), ki predstavlja izboljšavo starejšega orodja PredPPCrys (39) in temelji na analizi aminokislinskega zaporedja samega, brez napovedi fizikalno kemijskih lastnosti, uporablja metodo podpornih vektorjev (40); • Crysf (http://nmrcen.xmu.edu.cn/crysf/), ki za napoved kristalizabilnosti uporablja pripise iz zbirke UniProt (41); • fDETECT (http://biomine.cs.vcu.edu/servers/fDETECT/), ki zraven kristalizabilnosti napove tudi obete za uspešno izražanje ter čiščenje proteina, uporablja pa modele, osnovane na logistični regresiji (42); • DeepCrystal (https://machinelearning-protein.qcri.org/), ki apli-cira globoke nevronske mreže brez potrebe po ekstrakciji oz. napovedi fizikalno-kemijskih lastnosti konstrukta, identificira pa pogoste k-mere (43); 18 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja • BCrystal (https://machinelearning-protein.qcri.org/) z vključitvijo analiz nekaterih fizikalno-kemijskih lastnosti predstavlja nadgradnjo orodja DeepCrystal (44). 1.4.1 Orodje XtalPred-RF Osnovno orodje XtalPred je bilo predstavljeno leta 2007 in sicer kot spletna aplikacija za napoved kristalizabilnosti proteinov (37). Napoved je temeljila na primerjavi mnogih lastnosti proteina z distribucijo teh lastnosti proteinov v zbirki TargetDB3. Gre torej za podatke o tem, kateri izraženi proteini so 3 Zbirka TargetDB je bila osnovana leta 2004 in je predstavljala centraliziran vir podatkov iz bili (uspešno) kristalizirani in kateri ne. Lastnosti, ki so bile napovedane različnih raziskovalnih centrov, ki se ukvarjajo oz. izluščene iz aminokislinskega zaporedja proteinskega konstrukta ter s strukturno genomiko (določanje 3D struk-uporabljene za oceno kristalizabilnosti, so: ture vseh proteinov, zapisanih v genomu ne- • dolžina – večji proteini so kompleksnejši in pogosteje vsebujejo regije, kega organizma).To so podatki o tem, kateri neugodne za kristalizacijo; proteini se kristalizirajo ter o doseženi stopnji poti v cevovodu (pipeline) od zapisa DNA do • izoelektrična točka – ekstremno kisli in bazični proteini zaradi prevla-strukture za posamezni protein (45). dujočega enoznačnega naboja, posledičnega odboja, težje kristalizirajo, prav tako pa je, statistično gledano, znanih več struktur bazičnih kot kislih/nevtralnih proteinov; • hidrofobnost oz. indeks GRAVY4 – povezan je s topnostjo proteina, in 4 Indeks GRAVY (GRand AVerage hydropathy) je merilo za hidrofobnost oz. hidrofilnost sicer večji, kot je, bolj je protein hidrofoben in s tem manj topen v vodnih proteina, enostavno izračunano kot povpre-raztopinah; čje hidrofobnosti posameznih aminokislinskih • neurejenost, opisana kot dolžina najdaljše neurejene regije, napovedane haa ostankov po formuli i j G = ∑nj=1 , kjer je haa n z orodjem DISOPRED (47) – daljše, kot so neurejene regije, manjša je hidrofobnost posameznega aminokislinskega kristalizabilnost; odstanka (vseh v proteinu je n) po lestvici hi- • nestabilnost – indeks nestabilnosti se oceni na podlagi frekvence posame-drofobnosti Kyte-Doolitle (46). V tej lestvici so aminokislinski ostanki razvrščeni od najbolj znih dipeptidov znotraj analiziranega zaporedja, za katere je znano, da so (Ile, vrednost 4,5) do najmanj hidrofobnega povezani z metabolno nestabilnostjo proteina; (Arg, vrednost -4.5). • sekundarna struktura – večji, kot je delež polipeptidne verige, ki ne tvori elementov regularne sekundarne strukture (napovedana z orodjem PSIPRED (48)), večja je verjetnost za prisotnost neurejenih regij in s tem manjša kristalizabilnost; • ovije vijačnice (coiled coils), napovedane z orodjem COILS (49); • insercije glede na homologe v neredundančni zbirki aminokislinskih zaporedij – več, kot jih je in daljše kot so, večja je verjetnost za prisotnost neurejenih zank na površini proteina (insercije so po navadi povezane s prisotnostjo zank na površini); homologe identificira prek iskanja z orodjem PSI-BLAST; • površinska entropija; • površinska hidrofobnost; • izbokline na površini (surface ruggedness) – bolj, kot je površina "neravna", težje se tvorijo obsežni medmolekulski kontakti in manjša je kristalizabilnost. Dodatno je orodje upoštevalo še napoved transmembranskih vijačnic (orodje TMHMM (50)), prisotnost signalnega peptida (orodje RPSP (51)) in prisotnost regij z nizko kompleksnostjo zaporedja (orodje SEG (52)). Na osnovi teh analiz je bila kot rezultat podana ocena kristalizabilnosti, in sicer je bil analiziran protein oz. njegovo aminokislinsko zaporedje uvrščeno v enega od razredov od 1 do 5 (1 pomeni najvišjo kristalizabilnost), t.i. expert pool crystallizability class. Dodatno je orodje podalo tudi homologe analiziranega zaporedja iz genomov mikroorganizmov, ki jih je prav tako klasificiralo v enega od petih razredov kristalizabilnosti. V letu je 2014 je bila predstavljena nadgrajena verzija orodja, imenovana XtalPred-RF (36). Vir empiričnih podatkov je bila zbirka TargetTrack5, in sicer 5 Zbirka TargetTrack je naslednica zbirke TargetDB in sicer je nastala z združitvijo podat- 4.924 proteinskih struktur (pozitiven set) ter 21.898 proteinov, ki jih niso uspeli kov le-te ter zbirke PepcDB. Vse te zbirke je kristalizirati (negativen set), pri obeh pa so upoštevali le proteine dolžine vzdrževala skupnost PSI (Protein Structure 50–800 aminokislinskih ostankov. Pri orodju XtalPred-RF gre v osnovi za Initiative), ki je z delovanjem prenehala leta enake napovedi kot pri predhodni verziji, je pa napoved nadgrajena z metodo 2017. Zadnja verzija zbirke TargetTrack iz naključnega gozda, ki poda dodatno oceno random forest crystallizability class, v leta 2017 je dostopna v digitalni knjižnici ZE- NODO. razponu 1–10. Ta je izračunana na osnovi metode naključnih gozdov (random forests), to je pristopa strojnega učenja, ki v fazi učenja na osnovi seta podatkov izračuna odločitvena drevesa (drevesna struktura, ki ponazarja relacije med na č r t ova n j e p ro t e i n s k i h k o n s t ru k t ov 19 vhodnimi atributi in izidom), ki jih nato v fazi analize oz. klasifikacije vhodnih podatkov uporabi za izračun modusa razreda. Primer napovedi kristalizabilnosti za aminokislinsko zaporedje, izračunane z orodjem XtalPred-RF, je prikazan na sliki 1.5. Uporabljeno je bilo aminokislinsko zaporedje človeške protein kinaze C, izooblika δ (PKC δ), in sicer v celotni ter skrajšani obliki (samo katalitična domena). PKC δ je namreč sestavljena iz več regij, nekatere od njih so povezane s fleksibilnimi pove-zovalnimi regijami. V primeru celotnega zaporedja je orodje XtalPred-RF že samo dolžino prepoznalo kot problematično, tudi izoelektrično točko, k najslabšemu razredu kristalizabilnosti pa sta bistveno prispevali prisotnost neurejenih regij (najdaljša neurejena regija je dolga 27 aminokislinskih ostankov) ter visoka povprečna hidrofobnost. Glede na oba algoritma, klasičnega in RF, je celotno zaporedje uvrščeno v najbolj neobetaven razred. Napoved za skrajšano obliko, ki predstavlja zgolj katalitično domeno, je sicer nekoliko boljša (na primer neurejenih regij naj ne bi bilo več; ni prikazano na sliki) – 1. razred pri klasičnem algoritmu in 9. razred pri RF. (a) (b) (c) Slika 1.5: Primer napovedi kristalizabilnosti za človeško protein kinazo C δ (PKC δ, Uniprot ID Q05655). (a) Shematski prikaz PKC δ, kot ga prikaže ProSite. (b) Tabelarični prikaz rezultatov analiz celotnega zaporedja (PKCD, ostanki 1–676) in samo katalitične domene (PKCD_cat, ostanki 349–603). (c) Podrobnejši prikaz po- sameznih analiz za celotno zaporedke PKC δ. Podrobnejši opis je na strani 19. Vaja 1 Načrtovanje proteinskih konstruktov Namen vaje Namen vaje je na primeru enega od proteinov identificirati lastnosti, ki vplivajo na kristalizabilnost, ter na osnovi tega načrtati konstrukt za ta protein s čim višjo kristalizabilnostjo. Material Vaja je računalniška, uporabljajo se zgolj prosto dostopne zbirke in spletna orodja. Potrebujete le spletni brskalnik in internetno povezavo. Postopek dela Sledite navedenim korakom, rezultate napovedi pa pustite odprte v brskal-niku, saj si jih bomo na koncu nekaj skupaj ogledali ter debatirali o njih. 1. Izberite si poljuben protein. Lahko gre za protein, ki je bil tema vaše seminarske naloge pri katerem drugem predmetu, je predmet vašega raziskovalnega dela, ... 2. Poiščite zapis za izbrani protein v zbirki UniProt (http://www.uniprot. org)6 ter si ga oglejte. Bodite pozorni na prisotnost domen, povezovalnih 6 Zbirka UniProt je zbirka aminokislinskih zaporedij, ki vsebuje še ogromno dodatnih po- regij ipd. V primeru, da v zapisu ni veliko pripisov (anotacij), uporabite datkov v obliki pripisov (funkcija, domene, orodje InterPro, ki vam pomaga pri identifikaciji domen in pomembnih posttranslacijske modifikacije,...), razdeljena je mest (aktivno mesto, motiv za vezavo nekega liganda ipd.). Ti podatki so pa na ročno pregledan del UniProt/SwissProt pomembni za kasnejše načrtovanje krajših konstruktov, saj se izognemo ter nepregledan del UniProt/TrEMBL, ki vse-npr. razredu neke domene na polovico in s tem nevarnosti, da se tak buje prevedena nukleotidna zaporedja in zgolj avtomatske pripise. protein sploh ne bi zvil. 3. Na osnovi izluščenih značilnosti proteina pripravite več predlogov konstruktov, katerih aminokislinska zaporedja si, skupaj s smiselnimi imeni, shranite v običajno tekstno datoteko v formatu FASTA (nekaj osnovnih informacij glede tega formata je na strani 22). Med konstrukti naj bo: • celotno aminokislinsko zaporedje izbranega proteina; • del tega proteina, ki predstavlja neko zaključeno celoto, na primer katalitični del (pri encimih), zunajcelično regijo (transmembranskih proteinih tipa I) ipd. 4. Vsebino datoteke FASTA prekopirajte v okence za vnos zaporedij (slika 1.6), vključite možnost za iskanje bakterijskih homologov, vnesite vaš e-poštni naslov (za vsak primer, če po nesreči zaprete okno, preden so izračuni zaključeni) ter potrdite, da strežnik uporabljate v izobraževalne namene). 5. Počakajte, da se napoved zaključi – to prepoznate tako, da so v tabeli z rezultati (podobno kot na sliki 1.5) prikazana vsa zaporedja, ki ste jih 22 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja Slika 1.6: Zaslonski posnetek spletne strani za vnos podatkov v orodje XtalPred-RF. zaporedja v formatu FASTA iskanje bakterijskih homologov vaš e-poštni naslov potrditev namena uporabe vnesli. Z klikom na ime konstrukta (enako je imenu zaporedja v datoteki FASTA) pridete do celotne napovedi kristalizabilnosti oz. posameznih molekulskih parametrov, ki so prispevali k oceni. Oglejte si jih ter jih povežite z oceno kristalizabilnosti. 6. V primeru, da so ocene kristalizabilnosti vseh načrtanih konstruktov slabe, pripravite nove, izboljšane konstrukte. Pri tem upoštevajte napovedane molekulske parametre iz prejšnje stopnje, predvsem tiste, ki so povezani z manjšo kristalizabilnostjo, hkrati pa pazite, da bo konstrukt predstavljal neko enoto, ki se bo lahko, vsaj po pričakovanjih, uspešno zvila. 7. Preglejte bakterijske homologe izbranega proteina, ki imajo višjo kristalizabilnost, ter jih primerjajte z vašim konstruktom. 8. Napoved kristalizabilnosti naredite še z vsaj dvema drugima orodjema iz seznama na strani 17 ter primerjajte rezultate z napovedjo programa XtalPred-RF. Vprašanja za razmislek 1. Na kateri konec najboljšega konstrukta (v luči kristalizabilnosti) bi bilo najbolj smiselno umestiti heksahistidinsko oznako? 2. Če bi želeli heksahistidinsko oznako po čiščenju odcepiti, katero peptidazo bi uporabili? Načrtajte aminokislinsko zaporedje konstrukta s heksahistidinsko oznako in cepitvenim mestom za visoko specifično peptidazo. Dodatne informacije Format FASTA Format FASTA je format datotek za nukleotidna ali aminokislinska zaporedja. Razvila sta ja Davidj J. Lipman in William R. Pearson leta 1985, in sicer kot del programskega paketa FASTA, ki je program za iskanje podobnih zaporedij. Format se še danes splošno in veliko uporablja, saj je enostavno berljiv za računalnike in hkrati tudi za ljudi. na č r t ova n j e p ro t e i n s k i h k o n s t ru k t ov 23 Gre za običajno tekstno datoteko, ki ima lahko običajno končnico (file exten-sion) txt, pogosto pa se za označevanje vsebine (nukleotidna/aminokislinska zaporedja) uporablja ena od naslednjih konlnic: fasta, fna, ffn, ffa, frn ali kar seq. Datoteke lahko oblikujemo s katerim od programov, ki omogočajo delo s tektnimi datotekami, na primer Notepad (okolje Windows) ali TextEdit (okolje macOS). Tovrstnih datotek ne pripravljamo v kompleksnejših urejevalnikih besedil, kot je, na primer Microsoft Word, saj slednji v datoteko shranijo še veliko drugih ukazov, namenjenih oblikovanju (sicer lahko v teh programih datoteke shranimo kot običajne neoblikovane tekstne datoteke, a to samo zaplete delo). V datoteko lahko shranimo eno ali več zaporedij. V primeru enega zaporedja datoteko oblikujemo tako, da se prva vrstnica začne z znakom >, ki mu sledi ime zaporedja, sámo zaporedje pa je v eni ali več vrsticah, ki sledijo. Kot primer si oglejmo zaporedje za človeški interferon γ: >hIFNg MKYTSYILAFQLCIVLGSLGCYCQDPYVKEAENLKKYFNAGHSDVADNGTLF LGILKNWKEESDRKIMQSQIVSFYFKLFKNFKDDQSIQKSVETIKEDMNVKF FNSNKKKRDDFEKLTNYSVTDLNVQRKAIHELIQVMAELSPAAKTGKRKRSQ MLFRGRRASQ V zgornjem primeru je hIFNg ime zaporedja, sámo zaporedje pa je izpi-sano v naslednjih vrsticah. V isto datoteko formata FASTA lahko shranimo tudi več nukleotidnih ali aminokislinskih zaporedij. Tak primer, ki vsebuje zaporedje iz zgornjega primera ter še zaporedje prvih 50 aminokislinskih ostankov istega proteina ločeno (kot ime za slednje je uporabljeno hIFNg_1-50), je prikazan tukaj: >hIFNg MKYTSYILAFQLCIVLGSLGCYCQDPYVKEAENLKKYFNAGHSDVADNGTLF LGILKNWKEESDRKIMQSQIVSFYFKLFKNFKDDQSIQKSVETIKEDMNVKF FNSNKKKRDDFEKLTNYSVTDLNVQRKAIHELIQVMAELSPAAKTGKRKRSQ MLFRGRRASQ >hIFNg_1-50 MKYTSYILAFQLCIVLGSLGCYCQDPYVKEAENLKKYFNAGHSDVADNGT 2 Kristalizacija Priprava kvalitetnih kristalov (velikost, sposobnost sipanja X-žarkov do čim višje ločljivosti, nizka stopnja mozaičnosti, stabilnost, nezraščenost) pogosto predstavlja ozko grlo v procesu določanja kristalne strukture neke makromolekule. K uspehu lahko veliko pripomore smotrno načrtovanje proteinskih konstruktov, kar je podrobneje opisano v razdelku 1 na strani 11, prav tako pa tudi čim bolj obsežni presejalni kristalizacijski testi (crystalization screens). Čeprav se zdi, da včasih kristalizacija tako velikih in kompleksnih molekul, kot proteini so, meji na magijo, temu vsekakor ni tako – gre le za to, da vseh procesov (še) ne znamo natančno razložiti, njihova obsežnost, kompleksnost in medsebojna povezanost pa so tolikšne, da je napovedovanje ustreznih kristalizacijskih pogojev zaenkrat nemogoče. Proteinski oz. makromolekulski kristali na splošno se od kristalov soli in majhnih organskih molekul precej razlikujejo. Nekaj posebnosti: • tipična velikost kristalov, ki se uporabljajo v rentgenski kristalografiji makromolekul, je ponavadi od 50 µ m do 0,5 mm; • povezava med videzom proteinskih kristalov in njihovo difrakcijsko kvaliteto ni enoznačna (na pogled grd kristal lahko dobro sipa, lep pa sploh ne); • proteinske molekule v kristalu tvorijo medmolekulske kontakte in omogo- čajo urejeno zlaganje novih molekul v kristalno mrežo; • medmolekulske interakcije v kristalu so navadno redke in šibke, posledica je velika občutljivost makromolekulskih kristalov (mehanska in tempera-turna občutljivost); • makromolekulski kristali so ponavadi mehki in bolj podobni gostemu skupku želeja kot trdnim delcem, • prostor med makromolekulami v kristalu zapolnjuje topilo (voda in topljenci), ki v povprečju predstavlja 40–60 % kristala; • medmolekulske interakcije v kristalu so specifične za posamezen protein in pogosto vključujejo nabite aminokislinske ostanke na površini (pozor pri površinski mutagenezi!); • za isto makromolekulo/protein lahko pri različnih pogojih dobimo različne kristalne oblike (te se lahko pojavijo celo v isti kristalizacijski kapljici), ki imajo navadno različno difrakcijsko kvaliteto; • ista kristalna oblika se lahko pojavlja v različnih kristalnih načinih (s tem pojmom opisujemo videz kristala, kjer so pri enaki kristalni struktura posamezne kristalne stranice različno izražene). 2.1 Proces kristalizacije Da dobimo kristale katerekoli spojine, tudi najpreprostejše, moramo načeloma doseči stanje prenasičenosti (supernasičenost, supersaturacija, supersaturation). To je termodinamsko nestabilno stanje (metastabilno stanje), ob vračanju v stabilno stanje pa del topljenca tvori medmolekulske kontakte, kar se na makroskopskem nivoju kaže kot nastanek kristalinične (urejeno stanje – kristali) ali amorfne faze (neurejeno stanje – oborina). Potek oz. končen rezultat tega procesa je odvisen od lastnosti vzorca in pogojev: temperatura, 26 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja pH, topljenci (pufri, soli, . . . ) in njihova koncentracija, gostota in viskoznost raztopine, tip površine, električna in magnetna polja, vibracije ... Ko govorimo o proteinih, lahko ti parametri vplivajo na njegovo topnost, zmožnost tvorbe ugodnih medmolekulskih kontaktov ter konformacijo proteina in njegovih topilu izpostavljenih regij. Kristalizacija je tako izrazito multiparametričen proces (nanj vpliva več parametrov), ki ga v osnovi lahko razdelimo na tri faze: 1. nukleacija, to je spontan nastanek prvih urejenih skupkov. Nukleacija zahteva višji nivo supersaturacije kot rast kristala. Včasih je pogoje, pri katerih pride do nukleacije, težko reproducirati, lahko pa so celo takšni, da nadaljnja rast kristala ni optimalna – v teh primerih uporabljamo vnos kristalnih jeder (sejanje, seeding); 2. rast kristala, to je urejeno nalaganje makromolekul na površino nukleacij-skega jedra oz. nastajajočega kristala. Višji kot je nivo supersaturacije, večja je hitrost rasti kristala, hkrati pa je večja tudi verjetnost, da bo med rastjo prišlo do napak v kristalni mreži (slabša difrakcijska kvaliteta kristalov!); 3. ustavitev rasti, za katero so lahko vzrok pomanjkanje makromolekul v raztopini, napake med rastjo kristala, “zastrupitev” površine kristala z drugimi molekulami in/ali razgradnja makromolekul. Metode določevanja 3D struktur makromolekul: Makromolekulska kristalografija (vaje) Miha Pavšič // Univerza v Ljubljani, Fakulteta za kemijo in kemijsko tehnologijo, Katedra za biokemijo Stanje prenasičenost dosežemo z večanjem Študkoncentracije ijsko leto 2009/2010 biološke makro- molekule (zaradi izhlapevanja topila) in/ali z Stav nj e e, čanjem pri katerem koncentracije vrednosti parametrov ene rezulti ali rajo v prenasičenosti raztopine, lahko dosežemo na več načinov: difuzija preko hlapov (“vapour diffusion”), dializa, šaržne metode (“batch methods”) in difuzija preko površine (“interface več spojin, ki zmanjšajo topnost proteina – takim diffusionspojinam ”). Najpogostej r e ečemo se uporablj obar a meto jalna da difuzije preko hlapov, ki obstaja v treh izvedbah: sendvič-način, sedeča sredstva ali precipitanti, opisana so v razdelku kaplji2.3 ca , (“siskupaj tting drop”) s inkristalizacijskimi viseča kapljica (“hanging drop”); slednji način je shematsko prikazan na sliki 2. Vsem trem izvedbam je skupna počasna vzpostavitev ravnotežja med kapljico in raztopino rezervoarja. testi, katerih komponenta so. V praksi lahko prenasičenost dosežemo na več načinov, kar je na kratko opisano v naslednjem razdelku, krivulja topno opis sti dogodkov na prenasičenost (supersaturacija) molekularnem nivoju pa je v primeru ene od teh izvedb opisan v razdelku 2.2.1. krivulja “supertopnosti” le ku 2.2 Praktična izvedba kristalizacije le območje precipitacije mo (obarjanja) kro Stanje, pri katerem se vrednosti parametrov (pH, topljenci maja in njihova kon- ci centracija . . . ) kažejo v prenasičenosti raztopine, lahko tra dosežemo na več n območje nukleacije osnovnih načinov: cen ko kristalizacija z difuzijo metastabilno • difuzija prek hlapov (vapour diffusion), kjer kapljico, sestavljeno pre iz ko hrazto- lapov območje pine proteina in kristalizacijskega reagenta, v zaprtem sistemu pustimo počasi ekvilibrirati proti večji količini enakega kristalizacijskega reagenta; parameter, ki zmanjšuje topnost (npr. koncentracija precipitanta) • dializa v majhnem merilu (mikrodializa), Slika ki 1: omogo Poenostavljča en f po azni časno diagram višanje z vrisanim primerom poteka kristalizacije z difuzijo preko hlapov (“vapour koncentracije precipitanta in drugih komponent di Me ffu t si o o d n” e ), kristalizacijskega & dpo ri l o č č e eva mer nja kro&3 g D p &s re tr d u st k a t vl u ja r r& eagenta m za a č k et r n o e m p o o l g e ojk e u , l:&Ma kone k c r p o u m šč o i le ce k p u a lsk ko a n & č k n r e i s p ta oglo oj g e r -a fi raja& vn ( o v t a e j ž e n ) o & stanje na krivulji toMi pn h o a st%iP . avš Me itč a%/ st/ a%U bilniv o er o z b a%v mo %čL j j e u jb e l jan stai, n%jF ea k n u i lte zke t a p %za re % n k a e simi če jo n %in sti %,k e kimi š j es k oo%te mo h g n očo al og ra ijo st ,%K kri at st e al d a r , a%z sp a o %b nt io a k n enmi a j st o a %nek novih v raztopini proteina; n Št uklu ed a ij cisjko% ski l h e j t eo% d 2 e 0 r 1 p 0 a j/2 e 01 mo 1 g %oč le v ozkem območju nukleacije. % Slika 2: Shematski prikaz kristalizacije z metodo difuzije • šaržne metode (batch methods), pri katerihSl pre raztopino ika&2:%Shematsk ko hlapov, način pr i%pr viseoteina ikaz%kristal če kapljice zmešamo izacije%z%metodo% difuzije%preko%hlapov,%način%viseč.e %ka Na pllj e ic vi ej.%eN a p %l ri ev ka i%j za en%a cX = AX / 2 cX > AX / 2 s kristalizacijsko raztopino, kapljico pa nato lu pr kn iji pr ka ca z a n ekrijemo na a %l kri uknj stali ic za aci%jna% ski skr pl plastjo is o ta šči liciz a n ceijpso parafin- ki%pl sred o n šoč ipcoi %nastavitvi, cP = B / 2 cP > B / 2 pri čemer je sta bila za pripravo kapljice uporabljena enaka skega olja; neposredno%po%nastavitvi,%pri%čemer%je%sta%bila%za% v pr oluipr m a n v a o%rka azpl tojipcien%upo e p rra o bl teijenna a %esna k ka on%vco e lum ntra na cij %o B ter kapljica H2O ra kristzato li p za in cij e%pro ske te ra i zt noapi%s% n k e on ko cen mpotra ne cnitjeo %B X %te s r% koncentracijo AX. Topilo, v tem primeru voda, počasi izhlapeva iz kapljice v • difuzija prek stične površine (interface diffusion kristaliz s m e r i v z), aci p o kjer jske%ra s t a v i t gradient ztopine%kom v e r a v n o t e ž koncentra- ponente%X%s% j a m e d k a p l j i c o i n koncentracijo%A cX = AX cX = AX cije proteina in kristalizacijskega reagenta ustvarimoX.%Topilo,%v%tem%primeru%voda,%počasi% rezervoarjem, pri čemer v kapljici naraščata tako izhlapeva%iz%kapl s jice%pomo v%smeri%včjo zpos po tavitčasne ve%ravnotežja% koncentracija proteina kot koncentracije ostalih komponent difuzije komponent obeh raztopin preko njune med%ka raztopine sti p ljic čne o%in%re po z (desno), e r vršine vo kara rjem,%p v ri%č kapilari. eme eventuelno r%v%k vodi ap v l jici% stanje p na renra a š si č č a e t na o%ta sti ko . Ti%ko sto nc e ko nt mpra o c n i e ja nt %pr o o kri te st i ana li %ko zacij t% ske raztopine, kristalizacijska ko kate nc re ent ve r č a a c nijje e %ost ko a n lih% cen ko tra m cij po e ne na nt jb % orlja zt p o ri pi spne e %( va de k sno st ) a ,% nju raztopina (rezervoar) Najpogosteje se uporablja metoda difuzije pr kar% eko eve prenasi nt č hlapo uelno% enosti, v o v di% , v% ki sta pogosto obstaja nje%prenasičev no imenujemo tr sti eh .%Tisto% precipitant. izvedbah: viseča kapljica (hanging drop), sede kom ča ponekapljica nto Kristalizacijska %kristaliza raztopina c (isitting js je ke %raz tako to dr pi tipi ne čn op ,% o k s) ate es in rtea%ve vlj č e an na jei%k z oncent Slika racij 2.1:e%najbolj%pris Shematskipeva%k%s prikaztanju%prenasiče kristalizacijenos z ti,% me- n po e g ke o g s a tpou%fim ra,e nuj ki d e olm o o č % a pr e vre c dipi no ta st nt p . H%K , t reis r tpali re z ciapcitijaska nta %ra (p z o t g o o pi st na o %j so e l %t a a li ko po%ltiiepi til č e no ngl%ise koslt ),a iv nl je rana zn %iiz h %ne do ke dat ga ko %puf v (a r diati,%ki vo %d v) o v l o o č b a li %ki todo difuzije preko hlapov na način viseče ka- sendvič (sandwich drop). Način sedeče kapljice dru je vred gih shematsko nos soli t, %p d H et ,% e ter rge %p nt roec v, ioprikazan pit rg an an ta% ski ( h p t ogos opil, .na t.o% . s sliki ol%ali%polietilenglikol),%in%raznih%dodatkov%(aditivov)%v%obliki%drugih%soli,% pljice. Na levi je prikazana kapljica na kristali- 2.1. Vsem trem izvedbam je skupna počasnade Kristvzposta tergentov,% alizacijskih pvite organs ogoje v ki v, kira h%t bi vnotežja opil,%. .% vzdrževali ma med % kromolekulo v nativni obliki zacijski in ki ploš b ˇ i ci hkrat tkoj i omo po gočal nastai nast vitvianek nukleacijskih eksperimenta, kapljico in raztopino rezervoarja. je Kr de ir sita n liz ra a st c ijs kri k stih al %p ovo, goj (za eevn,%ki kra%tb) i%v ni zdr mo žgeovčael i%nm a a p k o ro ve m datoi,l eekduelo n %iv%n pri a zme tdˇi vn ra i% zl oo cemerb g loik v je i%pin a %jke bila i %ibi% za h zre k d r n a a ti% ra om zno priprav oligo ko ča st liin%n a kost kapljice a mpnle e k% ksnost upora- nukl makro eac mol ij e ski kul.h %jed Pro e blr%ein% m riast ska%kr njai sta se l otva,%( koz ae re nkr šujea t)p%ni ret %m ež o n g o oč e e%na mpiri po čn v o eda s tpi,% re eide zkunš%iaznm je ed% m ra ve zčlogov jega %špta e %vijlea%i zre set dn ov a%pogojev bljena enaka volumna raztopine proteina (s razn (“cryst oall ikost% screein ni %k n o g” m ), ple za k sn karo st% ob m st aajkaro m ve o č lestku rat l.e%P gi ro j bl (speam%i rsesk an mat ja ri %xse %tak scre o e %nre s, šu g jried% prete scre ž e n n o s, %eim n p co iri mpčln etoe% s%fp a re ctoizrikalu ša denj si egm n % screens, reverse screen, ...). Tipičen primer t.i. “sparse matrix screen”-a je Cryst koncentracijo al B) Scre in en podjetja Hamp kristalizacijske ton Research raztopine večjega%števila%setov%pogojev%(“crystal%screening”),%za%kar%obstaja%več%strategij%(sparse%matrix%screens,%grid% (vsebuje 50 različnih kristalizacijskih raztopin), ki temelji na izboru komponent kristalizacijskih raztopin, ki so se izkazale 2.2.1 Kristalizacija po principu viseče screens,%inco kapljice mplete%factorial%design%screens,%reverse%screen,%. .).%Tipičen% komponente pri X me (s r%t.i.%“sparse%matri koncentracijo x%scre Ax). en” T Sa%je% opilo kot uporabne pri kristalizaciji drugih proteinov. V novejšem času je uvedba robotizirane priprave kristalizacijskih Crystal%Screen%podjetja%Hampton%Research%(vsebuje%50%razl (v ičnih% oda) kris potal ˇ izac casi ijskih%raz izhlape t v op a in iz ),%ki%temelj kapljice i%n v a%izboru smeri % nastavkov omogočila hkratno testiranje ogromnega števila pogojev (več kot 1000 različnih kristalizacijskih raztopin) ob ko Na poenostavljen način lahko potek mini mpo malnine p nt o % ra kr bi kristalizacijskega ista vzo liza rca cijs ma kih% kro ra mol z e to kupi le n, eksperimenta %ki (ka % p s ljio%s ce e%i vez li ka ko za ponazo- sti l en%ko ekatj% upo nl). rabne%pri%kristalizaciji%drugih%proteinov.%V% vzpostavitve ravnotežja med kapljico in rezer- novejšem%času%je%uvedba%robotizirane%priprave%kristalizacijskih%nastavkov%omogočila%hkratno%testiranje% rimo s t. i. faznim diagramom (phase ogr diagram om ), nega%števi imeno la% v pogojev% anim (več%k tudiot%1000%različn diagram ih%kristalivzaci oarjskih% jem, raztop pri ˇ in)%ob cemer%mvinimalni%p kapljici orabi%vz narašˇorca% cata tako makromolekule%(kapljice%velikosti%nekaj%nl%do%0,1%µl).% koncentracija proteina kot koncentracija osta- topnosti (slika 2.2). V tovrstnih diagramih koncentracijo proteina v zmesi 2 / 9 % lih komponent raztopine (desno). Cilj&vaje& • Priprava%kristalizacijskih%nastavkov%za%kristalizacijo%lizocima%na%način%sedeče%kapljice%(metoda%difuzije% preko%hlapov%S%“vapour%diffusion%method”)%S%set%24%različnih%pogojev.% • Ugotovitev%vpliva%nekaterih%parametrov%(pH,%ionska%jakost,%koncentracija%proteina,%. .)%na%kristalizacijo% lizocima.% & Material& Kemikalije:% • proteinski%vzorec:%vodna%raztopina%lizocima%s%koncentracijo%30%mg%mlS1%(100%μl)% • precipitant:%20%%(w/v)%NaCl% • pufri:% o 1,0%M%NaSacetat,%pH=4,5% o 0,5%M%BisTrisSHCl,%pH=6,5% o 1,0%M%TrisSHCl,%pH=8,5% • dH2O% Ostalo:%kristalizacijske%plošče%s%po%24%luknjicami%(“24%well%plates”)%z%nastavki%v%sredini%luknjic%(za%sedeče% kapljice),%lepilni%trak,%pipete%in%nastavki,%mikrocentrifugirke%S%epice,%stereomikroskop%za%opazovanje%v% polarizirani%svetlobi.% % %% % % % % %% % 3%/%10 k r i s ta l i z ac i ja 27 nanesemo na ordinatno os (y-os), na absciso (x-os) pa na primer koncentracijo Metode&določevanja&3D&struktur&makromolekul:&Makromolekulska&kristalografija&(vaje)& Mihapr %Paecipitanta. všič%//%Univerz Pr a%v%edsta Ljublja vljajmo ni,%Fakulte si ta%z hipoteti a%kemijo%inčen %ke primer mijsko%teh , no ko logij med o,%Kate kristalizacijskim dra%za%biokemijo% Študieksperimentom jsko%leto%2010/2011% koncentracija precipitanta v kristalizacijski kapljici narašča do % točke, kjer je koncentracija proteina na meji topnosti v novih (spremenjenih) Posamezne%faze%najenostavneje%ponazorimo%s%faznim%diagramom%(slika%1).%Nekateri%najpogosteje%variirani% para pogojih. metri,%ki%vpli Ob vajo% nadaljnjem na%topnost%makr naraš omole čanju kul,%so%na koncentracije slednji:% precipitanta pridemo v t. i. 1. metastabilno ionska&jakost%S% obmo makro čje, molekulkjer e%lahklahko o%obrav ob nava primer mo%kot%p nih olival pogojih entne%ione,% (pH njihov .o .%t .o )p pride nost%pa% do heter obrogene avn in avamo% homogene v%skladu%z%Deb spontane yeSHückelS nukleacije. ovo%teorijo;%pri%niz Če ki%i do onskitega %jakosttor i%t ej opn dejansko ost%makrom pride olekul%z% naraščanjem%ionske%jakosti%ponavadi%do%neke%mere%narašča%(vsoljevanje%S%“salting%in”),%pri%visoki%ionski% in se jak za osti%čnejo pa%z%na molekule daljnjim%narašpr ča oteina njem%top nalagati nost%pada%(izna sol ur jeva ejen nje%S% na “saltičin, ng%oudobimo t”)% kristal, ki raste 2. pH& na in& ra pr čun otiAion dodajanja i%S%topnost%mano krovih molemolekul kul%je%najni iz žja% super v%njihovnasi i%izoe čene lektrič raztopine, ni%točki,%to%je% dokler pri%tisti%v ne rednosti% pH,%pri%kateri%je%neto%naboj%enak%0%(kljub%temu%lahko%imamo%na%površini%makromolekule%obsežne% pridemo nazaj na krivuljo topnosti (ravnotežno stanje). V tej točki s površine negativno%in%pozitivno%nabite%regije),%na%topnost%pa%vpliva%tudi%jakost%interakcij%med%makromolekulami% kristala in%proti oddisociira Sioni% enako število molekul, kot se jih na novo doda, kristal tor 3. ej te na mp vzv era en tura%Sne %vpl raste iv%tempin er se atur ne e%n raztaplja. a%topnost%mak V r primeru, omolekul%je%pr da ecej%pa k pogoji ompleksen, v %s sistemu aj%je%odvise ne n%od% Metode ddr ol u o g č ih% ev p a a njra a m 3 e D tr s ov tru %( k ion tur ska ma %kja r kos omotl,%epkri u s l ot : n Maos kr t% o or m g olan ekski ul h% sk taop kriil, s%. . ta )l,% o n g arč a e fi ljom a a (v % a p jea)%velja,%da%je%pri%visoki% Miha omogo Pavšič // U čajo nive nukleacije, rza v Ljubljani, Fa lahko kulteta za pride kemijo inbodisi kemijsko do tehnobar ologijojanja , Kated pr ra oteina za biokemi (v jo skrajnem ionski%jakosti%topnost%višja%pri%nižjih%temperaturah%in%obratno% Študij primeru 4. sko or let goa ns 2009pride ka / & 2t0opi 10 l do a%S% denaturacije), organska%topila%zniž lo ajo%čitv diel e ek faz tričn (super o%konst nasi anto%r čena aztopin raztopina e%ter%s%tem%po pr sre oteina dno%ojačajo% Stanje ter , pri raztopina elektrostatske%i katerem vrednopr nt sti oteina erakcije%m parametro na ed%n v re meji asprot zultirajo topnosti) no%nabitimi%d v prenasičeno. el .i% sti . po ra lahko vršine%m ztopine, lapa akro hko se mol do tudi ekul,%p sežemo ne osl na zgodi edica%je%ni več načino ni žja% v: č topnost.% difuzija preko na hlavzv pov en (“va opaznega pour diffusion” – ), ostanemo dializa, šaržne v metastabilnem metode (“batch metho stanju ds”) in d ali ifuzij celo a pre pod ko po krivuljo vršine (“interface % diffusion”). Najpogosteje se uporablja metoda difuzije preko hlapov, ki obstaja v treh izvedbah: sendvič-način, sedeča % topnosti (kapljica ostane “prazna”). kapljica (“sitting drop”) in viseča kapljica (“hanging drop”); slednji način je shematsko prikazan na sliki 2. Vsem trem % izvedbam je skupna počasna vzpostavitev ravnotežja med kapljico in raztopino rezervoarja. % krivulja topnosti Slika 2.2: Poenostavljen prikaz faznega dia- prenasičenost (supersaturacija) grama za kristalizacijo preko difuzije hlapov. Majhen krog predstavlja začetno stanje, konec krivulja “supertopnosti” puščice pa končno stanje (ravnotežno stanje na krivulji topnosti). le kule območje precipitacije mo (obarjanja) kro majaci tran območje nukleacije cen ko kristalizacija z difuzijo metastabilno preko hlapov območje parameter, ki zmanjšuje topnost (npr. koncentracija precipitanta) % Slika&1:%Poenostavljen%fazni%diagram%z%vrisanim%primerom%poteka%kristalizacije%z%difuzijo%preko%hlapov%(“vapour% di Sli ffku a sion 1: ”),%p Poe r n io%čstem avl ejr e %k n rfo a g%p zni redidast g a ravl mj a%z z ače vri tn sa e ni %p m o gporije,%k me o ro n m e c%p potuešči ka ce%p kri a st %k alion za čcinje e %pzo gdoifje u %S zij %ra o vpno re te ko žn hl oa%sta pov n je%n (“va ap%our kr diff iv u ul sio jin%”to ), pno pri sčtei.%M mer e tas kro tga bi p l reno d % st oabm vlja o čj za eč%jeet%nset apnj o e g %oni je z, ke ko %pr ne e c na pusič šči eno ce s p tai ,%ki ko %nščen%o e mpo o g g o oj čea %-r as ra t%kr vnot is e tžanla o ,%s st po anj nt e ann% a krivulji topnosti. Metastabilno območje je stanje nizke prenasičenosti, ki še omogoča rast kristala, spontan nastanek novih nastanek%novih%nukleacijskih%jeder%pa%je%mogoč%le%v%ozkem%območju%nukleacije.% nukleacijskih jeder pa je mogoč le v ozkem območju nukleacije. % % Slika 2: Shematski prikaz kristalizacije z metodo difuzije 2.3 Kristalizacijski presejalni testi St p an rekoj e, h%lp a r pi% ok v at , e n r a e čim n %vr vi ed sečn e os t kai% pp lj ar i am ce. e N t a r ov% levir e j z e ul p ti ri raj ka o% za v% nap renasičenosti%raz cX top = A iXne, / 2%lahko%dosežemo%na%ve cX č > %n A ač X in / 2 ov:% l di u fu knjizij ca a % np a r eko% krist hl ali ap za ov cij %( ski“ v p a l p o ou šči r ci %di neff p u o sion sred ” n ) o,% di poa l niz a a st,%š a a vi r t ž vi n , e%metode%(“batch% cP m = et B hods / 2 ”)%in%difuzija%preko% cPp ov > r B š / in 2 e% (“ p i ri n č te e rf mea r cje e Kot % di st f af u b uv silio a n” za ). % p N ri odomaa p jp ra og vo os ka te plj jie%s ce e u omenjeno%u p p o o ra je ra blj b e izrlj n a a % m e e n to a edna d ka a%difuzije%prek raznolikost o%h inlapov,%ki%obstaja%v%tre kompleksnost h%izved makrbah:% omo- se voln u dv m i nčS a na r č a izn, t % o s peid n eč a% p ka ro pl teijic n a a %(“ s s it kti o ng nc %d e r n o tr p” ac)i%jin% o vi Bs etča e % r kapljica%(“hanging%drop”);%slednji%način%je%shematsko% lekul ter procesov, ki potekajo med kristalizacijo,kapljica razlog, da je trenutno pr kri i stka ali za za n% cijna%s ske liki ra % zt 2 o .% pVs in e e m% ko tre mp m on%i ezv nt edb X a s m %j ko e n %sku cent p rana cij %p o oč A H2O X a . sna%vzpostavitev%ravnotežja%med%kapljico%in%raztopino% re To z pi e l rv o, o v a t rj e a m.% prime nemogořu ce voda, p napooč v asi izh edati lapeva ustr iz kap ezne ljice v pogoje, ki bi omogočali nastanek nuklea- % s m e r i v z p o s t a v i t v e r a v n o t e ž j a m e d k a p l j i c o i n cijskih jeder ter rast kristalov proteinov. cProblem iskanja takšnih pogojev X = AX cX = AX % rezervoarjem, pri čemer v kapljici naraščata tako rešujemo pretežno empirično, in sicer s preizkušanjem večjega števila pogojev % koncentracija proteina kot koncentracije ostalih komponent % raztopine (desno), kar eventuelno vodi v stanje oz. presejanjem (crystalization screening), pri katerem uporabljamo mešanice kristalizacijska % prenasičenosti. Tisto komponento kristalizacijske raztopine, (kristalizacijske raztopine1), ki ponavadi vsebujejo: 1 katere večanje koncentracije najbolj prispeva k stanju raztopina (rezervoar) Pogosto jim v žargonu rečemo kar kristaliza- prenasičenosti, pogosto imenujemo precipitant. cijski pufri (crystallization bufers), kar tehnično 2%/%10 Kristalizacijska • raztopina precipitant je – tako tipičn spojina, o kisestavljena zmanjša iz topnost makromolekul; ni pravilno, saj vsebujejo še kaj drugega kot nekega pufra, ki določa vrednost pH, ter precipitanta (pogosto sol ali polietilenglikol), in raznih dodatkov (aditivov) v obliki pufre, nekatere od teh raztopin pa pufrske drugih soli, detergentov, organskih topil, ... • pufer – določa vrednost pH ter s tem vpliva na naboj na površini makro-komponente sploh ne vsebujejo. Kristalizacijskih pogojev molekul;, ki bi vzdrževali makromolekulo v nativni obliki in ki bi hkrati omogočali nastanek nukleacijskih jeder in rast kristalov, (zaenkrat) ni mogoče napovedati, eden izmed razlogov pa je izredna raznolikost in kompleksnost makromolekul. Problem iskanja se tako rešuje pretežno empirično s preizkušanjem večjega števila setov pogojev • sol – ioni soli vplivajo na topnost makromolekul in tvorbo medmolekulskih (“crystal screening”), za kar obstaja več strategij (sparse matrix screens, grid screens, incomplete factorial design screens, reverse screen kontakto , v ....). Tipičen primer t.i. “sparse matrix screen”-a je Crystal Screen podjetja Hampton Research (vsebuje 50 različnih kristalizacijskih raztopin), ki temelji na izboru komponent kristalizacijskih raztopin, ki so se izkazale kot uporabne p Kot ri kri pr stalizaciji dru ecipitanti gih se proteinov. V nove najpogosteje jšem času je u uporabljajo vedba robotizirane prip polietilenglikoli rave krist (PEG, alizaci slikajskih nastavkov omogočila hkratno testiranje ogromnega števila pogojev (več kot 1000 različnih kristalizacijskih raztopin) ob 2.3), sledijo pa spojine: amonijev sulfat (klasično obarjalno sredstvo za pro-minimalni porabi vzorca makromolekule (kapljice velikosti nekaj nl). teine), 2,4-metilpentandiol (MPD), etilenglikol, glicerol in drugi alkoholi (2-propanol, 1,4-butandiol ...), natrijev citrat, kalij-natrijev tartrat ter še šte-Slika 2.3: Polietilenglikol (PEG) je polieter, pri 2 / 9 vilne druge. katerem se ponavlja osnovna enota glikola. Dolžino verige ponavadi opišemo kot pov- prečno molekulsko maso v Da, npr. PEG 200, V zvezi s sestavo kristalizacijskih raztopin pri presejalnih testih obstaja več PEG 8000 ipd. Nizkomolekularni PEG (npr. strategij: PEG 200) so tekoči, visokomolekularni PEG (npr. PEG 2000 in višji) pa so vodotopne trdne snovi bele barve, njihove vodne raztopine pa so brezbarvne. 28 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja • mrežni testi (grid screens) – sistematična variacija manjšega števila parametrov, npr. % PEG/pH testi, ki kjub omejenosti pogosto nudijo uporabne informacije o kristalizabilnosti proteina (primer je na sliki 2.4); • testi na osnovi redkih (raztresenih) matrik (sparse matrix screens) – ti testi so osnovani na pogojih oz. kristalizacijskih raztopinah, ki so se v preteklosti (torej na empirični osnovi) že izkazali kot primerni za številne proteine, tipičen primer takšnega testa je Crystal Screen avtorjev Jancarik in Kim (53) (primer je na sliki 2.4); • polni / nepopolni faktorialni testi (full / incomplete factorial design screens) – ti testi nudijo podrobno analizo (medsebojnih!) vplivov različnih spremenljivk na kristalizacijo, zaradi preobsežnosti kompletnih testov pa pogosto uporabljamo nepopolne, pri katerih analizo omejimo na vplive prvega reda ter ustrezno uravnotežimo kristalizacijski načrt (posamezni vplivi – faktorji se pojavljajo z enako frekvenco po celotnem testu). naraščanje pH 5,5 6,0 6,5 7,0 7,5 8,0 000 30% 1 2 3 4 5 6 4 PEG 35% 7 8 9 10 11 12 c.n koje 40% n 13 14 15 16 17 18 aščra 45% a 19 20 21 22 23 24 n grid screen sparse matrix screen 1 100 mM Tris-HCl pH 8,0; 30% w/v PEG 4000; 50 mM MgCl2 2 3 M (NH4)2SO4 3 0,2 M (NH4)2SO4; 30% w/v PEG 8000 … 7 100 mM Na+-HEPES pH 7,5; 1.4 M trinatrijev citrat 8 100 mM trinatrijev citrat pH 5,6; 20% v/v 2-propanol; 20% w/v PEG 4000 … 13 0,5 M Li2SO4; 15% w/v PEG 8000 … 24 20 mM CaCl2; 100 mM Na-acetat pH 4,6; 30% v/v 2-metil-2,4-pentandiol Slika 2.4: Primer grid (levo) in sparse matrix (desno) kristalizacijskega testa v merilu 6×4 Kristalizacijske teste lahko nastavljamo “na roko”, kar zahteva precej (24 pogojev). časa, prav tako potrebujemo večje količine proteina (približno 0,5-1 µ l za posamezni pogoj oz. kapljico). Tak način po navadi uporabljamo v kasnejših stopnjah optimizacije kristalizacijskega pogoja, ki ga identificiramo s pomočjo obširnih kristalizacijskih testov, nastavljenih s pomočjo robotskih sistemov. Ti ob uporabi že pripravljenih komercialno dostopnih kristalizacijskih testov omogočajo testiranje ogromnega števila pogojev (npr. 1000) ob minimalni porabi vzorca (kapljice velikosti 100 nl ali celo manjše). Pri tem gre v veliki večini za način sedeče kapljice, saj je to najlažje avtomatizirati prek robotskega pipetiranja raztopin. 2.3.1 Ocenjevanje rezultatov kristalizacijskih testov Po nastavitvi presejalnih kristalizacijskih testov moramo plošče redno pre-gledovati. Frekvenca pregledovanja je kmalu po nastavitvi višja (vsak dan), kasneje jo zmanjšamo. Pregledovanje lahko izvajamo ročno, kar je, sploh v k r i s ta l i z ac i ja 29 primeru obširnih kristalizacijskih testov, zelo zamudno, zato se danes pogosto uporabljajo avtomatizirani robotski sistemi, ki z želeno frekvenco poslikajo vse kristalizacijske kapljice. Slike nato pregledamo sami, je pa napredna programska oprema že sposobna prepoznati, ali je v neki kapljici kristal, kar nam prihrani zamudno pregledovanje tisočih slik. Za ocenjevanje kristalizacijskih testov se, tako pri ročnem kot avtomatskem pregledovanju, pogosto uporablja ocenjevalni sistem, kjer so ocene v območju 0–9. Enomestna števila so izbrana zato, da jih lahko med seboj brez dvoumnosti kombiniramo. Pomen oznak: • 0 pomeni prazno kapljico, kar pomeni, da stanja prenasičenosti nismo dosegli; • 1 pomeni prisotnost delcev v raztopini, ki niso kristali, lahko gre za kakšne drobne smeti, ki so med nastavljanjem padle v kapljico; • 2–9 pomenijo prisotnost oborine, ločitev faz in kristale, primeri in po-drobna razdelitev pa je prikazana na sliki 2.5 na strani 30. Oborine so lahko kristalinične (gre pravzaprav za izredno drobne kristale oz. strukture, ki spominjajo na kristale – pri teh ne gre za denaturacijo proteina) ali pa amorfne, pri slednjih ponavadi pride do denaturacije proteina. Tretji tip oborine je t.i. gelatinozna oborina, ki jo je zaradi prosojnosti nekoliko težje opaziti. V primeru, da po daljšem času po nastavitvi kristalizacijskega testa (na primer, 2–3 tedne) ostane večina kapljic praznih oz. v njih ni prisotne oborine, je to znak, da prenasičenosti večinoma nismo dosegli. V tem primeru je priporočeno test ponoviti pri višji koncentraciji proteina. Obratno pa, če je v veliki večini kapljic prisotna oborina, še posebej, če se ta pojavi že kmalu po nastavitvi testa, to pomeni, da smo uporabili raztopino proteina s previsoko koncentracijo, zato velja test ponoviti z nižjo koncentracijo proteina. 2.4 Zanimiva dodatna literatura Zgodovinski pregled kristalizacije proteinov od leta 1840 do današnjega časa: Richard Giegé, A Historical Perspective on Protein Crystallization from 1840 to the Present Day., The FEBS journal, 280(24), 2013, str. 6456–6497 30 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja 2 - majhna količina oborine 3 - veliko oborine 3 - veliko oborine 3 - veliko oborine in kožica na 4 - gelatinozna oborina 5 - ločitev faz površini kapljice, ki ponavadi predstavlja denaturiran protein 6 - sferuliti 7 - paličasti (1D) kristali , združeni 8 - ploščati (2D) kristali v snope 9 - (3D) kristal 9 - (3D) kristala 9 - (3D) kristala Slika 2.5: Primeri tipičnih rezultatov kristaliza- cijskih testov, ki bi jih lahko ocenili v območju med 2–9. Vaja 2 Kristalizacija lizocima Namen vaje Namen vaje je na primeru kristalizacije lizocima v praksi spoznati pripravo presejalnega kristalizacijskega testa z omejenim številom pogojev (24) z metodo difuzije preko hlapov (način viseče kapljice) ter analizirati, kako sprememba pogojev v kristalizacijski raztopini vpliva na nastanek in rast kristalov. Material Seznam kemikalij • založne raztopine precipitantov: – 4 M NaCl, – 60 % (w/v) PEG 3350, – 60 % (w/v) PEG 4000, – 60 % (w/v) PEG 6000; • založne raztopine precipitantov: – 1 M natrijev acetat, pH 4,5, – 1,5 M TRIS/HCl, pH 8,0; • deionizirana voda; • raztopina proteina – 60 µ l raztopine kokošjega lizocima s koncentracijo 100 mg/ml (v 50 mM natrijevem acetatu, pH 4,5). Uporabljali boste še naslednji drobni material: • kristalizacijske plošče s 24 vdolbinicami (konfiguracija 6×4) za pripravo kristalizacijskih nastavkov po principu viseče kapljice, • silikonizirana krovna stekelca2, 2 Pri navadnih, nesilikoniziranih stekelcih, se kapljica ponavadi razleze po površini, pri si- • silikonsko mast za zatesnitev stikov med robom vdolbinic in krovnim likoniziranih pa zaradi hidrofobne površine stekelcem, stekelca ostane večinoma bolj kompaktne izbo- • pipete in nastavke, čene oblike. Razmerje med površino kapljice • mikrocentrifugirke. in njenim volumnom vpliva na proces kristali- zacije prek spremenjene hitrosti izhlapevanja vode oz. hitrosti ekvilibracije kapljice z oko- lico. Postopek dela Priprava načrta za presejalni kristalizacijski test Izdelajte načrt za kristalizacijski eksperiment/test, v okviru katerega boste preizkusili 24 različnih pogojev (kristalizacijskih raztopin). Posamezen pogoj naj sestavlja set vrednosti naslednjih parametrov: • sestava kristalizacijske raztopine (raztopina v rezervoarju): – koncentracija in tip precipitanta (PEG ali natrijev klorid), – ionska jakost (koncentracija NaCl), – pH (4,5 ali 8,0, vmesne vrednosti lahko dobite z mešanjem obeh pufrov, a točne vrednosti pH ne boste poznali); 32 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja • koncentracija lizocima v kapljici (lizocim lahko nekoliko razredčite, lahko kar z vodo, vsekakor pa ne preveč, saj v tem primeru kristali ne bodo zrasli v času izvajanja vaje); • razmerje med volumnom raztopine lizocima in kristalizacijskega reagenta v viseči kapljici. Sestavo raztopin oz. razporeditev vrednost spremenljivk vpišite v tabelo 2.1. Primer enega pogoja oz. set vrednosti spremenljivk: • koncentracija lizocima 100 mg/ml, • sestava kapljice: 2 µ l raztopine lizocima + 2 µ l kristalizacijske raztopine, • sestava kristalizacijske raztopine: 50 mM natrijev acetat, pH 4,5, 1 M NaCl, 25 % (w/v) PEG 4000. Pripravite si tudi načrt pipetiranja, pri čemer upoštevajte, da naj bo končni volumen kristalizacijske raztopine v posamezni luknjici kristalizacijske plošče v območju 0,5–1 ml. Za pripravo kristalizacijske raztopine iz zgornjega primera v volumnu 1 ml bi zmešali: • 50 µ l 1 M raztopine natrijevega acetata pH 4,5, • 416 µ l 60 % (w/v) PEG 4000, • 250 µ l 4 M NaCl • ter dopolnili z deionizirano vodo do 1 ml (torej 284 µ l vode). 1 2 3 4 5 6 A B C D Tabela 2.1: Tabela za načrtovanje presejalnega kristalizacijskega testa. Priprava in nastavitev kristalizacijskega testa 1. Označite 24 mikrocentrifugirk (posamezna mikrocentrifugirka ustreza eni luknjici na plošči s 24 luknjicami). 2. V označenih mikrocentrifugirkah pripravite kristalizacijske raztopine (po 0,5–1 ml) v skladu z izdelanim načrtom. Pri pipetiranju raztopin PEG bodite pozorni, saj so zelo viskozne. Potrebno je počasno pipetiranje, prav k r i s ta l i z ac i ja 33 tako pa je priporočljivo, da odrežete konico nastavka za pipeto in s tem naredite večjo odprtino. 3. Raztopine dobro premešajte z vibracijskim mešalom, mikrocentrifugirke pa na koncu kratko centrifugirajte, da vsebino zberete na dnu. 4. Na robove vseh luknjic na kristalizacijski plošči nanesite silikonsko mast. 5. Pripravite raztopino (ali več raztopin raztopin) lizocima z želeno koncentracijo (lizocim redčite s 50 mM Na-acetat pH 4,5). 6. Raztopine iz posameznih mikrocentrifugirk odpipetirajte v ustrezne luknjice na kristalizacijski ploščici. 7. Pripravite kapljice: na sredino krovnih stekelc odpipetirajte raztopino lizocima (npr. 2 µ l) ter ji dodajte enak volumen raztopine iz posamezne luknjice. 8. Krovna stekelca obrnite nad luknjice ter jih dobro zatesnite s pomočjo nanesene silikonske masti. 9. Kapljice preglejte pod mikroskopom. Kristali lizocima se lahko pojavijo že v prvi minuti! 10. Kapljice preglejte še po 20 minutah ter si zabeležite opažanja. 11. Na podlagi rezultatov vašega testa, ki vsebuje 24 pogojev, ter rezultatov kolegov v vaši skupini analizirajte vpliv posameznih faktorjev na izid kristalizacijskega eksperimenta ter določite najprimernejši pogoj oz. več pogojev, ki so dali velike in posamične kristale. Vprašanja za razmislek 1. Kakšna je pravzaprav vloga natrijevega klorida in kako je povezana z njegovo koncentracijo v kristalizacijski raztopini? 2. Kako koncentracija precipitanta vpliva na število kristalizacijskih jeder? Menite, da je smiselno imeti ogromno število majhnih kristalov ali majhno število zelo velikih kristalov? Kaj so prednosti enih in drugih? 3. Lahko pH kristalizacijske raztopine ter izoelektično točko (pI) lizocima povežete z izidom kristalizacije pri posameznih pogojih? 4. V nekaterih kapljicah so se kristali začeli pojavljati že skoraj takoj po nastavitvi. Kaj to pomeni v luči faznega diagrama, prikazanega na sliki 2.2 na strani 27? 3 Snemanje in procesiranje difrakcijskih podatkov Pridobitev kristala proteina oz. biološke makromolekule je, predvsem v smislu ozkega grla v procesu določanja strukture, vsekakor spodbuden rezultat, za nadaljevanje projekta pa je ključnega pomena, da dobljeni kristali dejansko sipajo X-žarke in to do čim višje (ali vsaj zadostne) ločljivosti. Edini način, da to preizkusimo, je difrakcijska analiza, v kateri kristal pripravimo (namestimo na ustrezno podporo) ter z njim posnamemo nekaj difrakcijskih slik. Že iz nekaj slik lahko precej izvemo o njegovi kvaliteti, prav tako pa lahko približno ocenimo parametre, kot so dimenzije in koti osnovne celice ter prostorsko skupino (to naredimo v okviru t. i. procesiranja difrakcijskih podatkov). V primeru, da je kvaliteta difrakcije zadostna in obeta prispevek k določitvi strukture, posnamemo popoln set difrakcijskih podatkov, kar pomeni, da zajamemo signale oz. vse reflekse znotraj asimetrične enote recipročnega prostora v luči prisotne simetrije (povezana s prostorsko skupino). Procesiran set teh podatkov, ki vsebuje Millerjeve indekse refleksov, intenzitete ter oceno nedoločenosti, nato služi kot osnova za reševanje strukture. 3.1 Priprava kristalov za difrakcijsko analizo Kristal moramo pred snemanjem pripraviti1. To pomeni, da ga vzamemo 1 Obstaja pristop t.i. difrakcijske analize in situ, kjer kristal izpostavimo X-žarkom kar v iz kapljice, v kateri je zrasel, namestimo na neko podporo ter ga primerno kapljici, v kateri je zrasel. Pristop je bolj ali zaščitimo. Običajno uporabljamo dva pristopa, in sicer nameščanje (mounting) manj omejen na začetno karakterizacijo kri-kristalov v: stala, za kvaliteten set difrakcijskih podatkov • kapilaro (hramba in snemanje pri sobni temperaturi), je potrebno izvesti snemanje na običajen način • zanko (hramba pri temperaturi tekočega dušika, snemanje pa po navadi pri temperaturi 100 K). Nameščanje kristalov v kapilaro je starejši od obeh pristopov. Kristal z majhno količino matične raztopine posrkamo v kapilaro, odvečno tekočino popivnamo, da se kristal nalepi na steno kapilare (sicer se lahko kristal med premikanjem zanke prosto premika), v kapilaro na enem ali obeh koncih posrkamo še malo matične raztopine (da se kristal ne izsuši) ter kapilaro na obeh straneh zatesnimo. Kristal je tako zaščiten pred izsušitvijo, kapilaro pa lahko namestimo neposredno na nastavek goniometrske glave in posnamemo difrakcijski vzorec (pri tem pazimo, da je kristal v snopu X-žarkov). Ta pristop ima sicer kar nekaj slabosti, od katerih je najbolj očitna hitrejše nastajanje obsežnih radiacijskih poškodb (radikali, ki nastajajo med obsevanjem, hitro difundirajo in reagirajo s proteinom). S takim načinom namestitve kristala je povezana tudi večja termična gibljivost molekul v kristalu, posledično se to lahko kaže na nižji ločljivosti in večji nedoločenosti nekoliko bolj fleksibilnih regij/zank makromolekul. Prav tako ta način ni primeren za občutljive in nestabilne kristale. Danes se v veliki večini primerov uporablja pristop zamrzovanja kristalov in snemanje difrakcijskih podatkov pod krio-pogoji, in sicer pri temperaturi približno 100 K. Bistvena prednost je močno zmanjšan obseg radiacijskih poškodb, kar omogoča snemanje podatkov z daljšimi časi ekspozicije. Pri tem načinu kristal ujamemo v majhno zanko ali mrežasto podporo, nato pa 36 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja zanko potopimo v tekoči dušik (temperatura −196 ◦C) in s tem zamrznemo (a) kristal ter majhno količino matične raztopine, ki ga obkroža. Ko je kristal enkrat zamrznjen, ga moramo ves čas hraniti pri podobni nizki temperaturi, najbolje tako, da je potopljen v tekoči dušik. Lahko ga tudi hranimo v parah nad tekočim dušikom (pri tem načinu moramo biti pozorni na to, da na zanki in kristalu ne pride do kondenzacije in tvorbe kristalov vode iz zraka, saj tudi slednji sipajo X-žarke in nam njihov difrakcijski vzorec delno zakrije našega). Prav tako snemanje difrakcijskih podatkov poteka na način, ki omogoča neprestano hlajenje kristala s curkom par tekočega dušika, ki ima (b) temperaturo 100 K. Primeri zank, ki se uporabljajo za t.i. krio-nameščanje kristalov, so prikazani na sliki 3.1. Zanke so sicer nameščene na podporo v obliki igle, slednja pa je nameščena v kovinsko osnovo, ki omogoča magnetno pritrjevanje na nastavek goniometrske glave med snemanjem difrakcijskih podatkov. Pri namestitvi kristalov v krio-zanke in zamrzovanju moramo biti pozorni, da je kristal v raztopini, ki ob hitrem zamrzovanju (flash-cooling oz. flash-freezing) ne tvori kristalov vode, ki poškodujejo sicer fragilne makromolekulske kristale. To dosežemo tako, da uporabimo krio-protektante oz. krio-zaščitne spojine (cryo-protectants) kot komponento raztopine, v kateri je kristal. Najpogosteje uporabljane spojine s takim učinkom so glicerol, etilenglikol ter nizkomolekularni polietilenglikoli (običajno v koncentracijskem območju od 10–30 (w/v) %). Poznamo dva načina njihove uvedbe, in sicer glede na to, če so ali niso prisotne v osnovni kristalizacijski raztopini oz. matični raztopini kristala: Slika 3.1: Primeri zank za nameščanje ma- kromolekulskih kristalov. (a) Proteinski kri- • če so krio-zaščitne spojine tam prisotne lahko kristal enostavno ulovimo v stal, ujet v zanko klasične oblike proizvajalca zanko in zamrznemo; HamptonResearch. (b) Alternativne zanke, mrežice in podobne strukture za nameščanje • če krio-zaščitne spojine v matični raztopini niso prisotne, moramo pri-kristalov proizvajalca Mitegen. Vir slik: sple-praviti kristalizacijsko raztopino s tako sestavo, kot je bila uporabljena za tne strani proizvajalcev. kristalizacijo (lahko nekoliko povišamo koncentracijo precipitanta), kot dodatno sestavino pa uvedemo eno od krio-zaščitnih raztopin. Nato kristal v matični raztopini ujamemo v zanko, ga prenesemo v majhno kapljico kristalizacijske raztopine z dodano krio-zaščitno komponento in šele nato zamrznemo. Izbira primerne krio-zaščitne raztopine je sicer predmet optimizacije oz. poizkušanja. Kristale, zamrznjene v zankah, hranimo v ohlajenih Dewar-posodah, in sicer jih naložimo v posebne nastavke, ki preprečujejo njihove fizične poškodbe ter omogočajo robotizirano nameščanje v snop X-žarkov na sinhrotronskih žarkovnih linijah. 3.2 Snemanje difrakcijskih podatkov Snemanje difrakcijskih podatkov z X-žarki običajno poteka na sinhrotronih ali na t. i. hišnih difraktometrih (in-house diffractometers). Njihova prednost je sicer enostavna dostopnost, a sinhrotroni jih prekašajo v marsičem: izredno fokusiran žarek, visok fluks fotonov ter možnost izbire valovne dolžine. Dodatno prednost predstavlja možnost eksperimentov s spremljanjem časovnega poteka procesov. Danes difrakcijske podatke večinoma snemamo pod krio-pogoji, pri tem pa je sam potek snemanja na sinhrotronu in hišnem difraktometru v osnovi podoben: 1. Kristal je treba iz tekočega dušika prenesti do nastavka goniometrske glave, kar na hišnih virih naredimo ročno, na sinhrotronih pa za to poskrbi robotiziran sistem. 2. Sledi centriranje kristala, pri čemer se z nastavitvijo vijakov goniometrske glave (hišni difraktometri) oz. prilagajanjem položaja goniometrske glave kristal namesti v tak položaj, da bo ob vrtenju ostal v snopu X-žarkov. s n e m a n j e i n p ro c e s i r a n j e d i f r a k c i j s k i h p o dat k ov 37 3. Izpostavitev (ekspozicija) kristala X-žarkom in zajemanje difrakcijskih podatkov prek detektorja (danes ponavadi kamera CCD ali detektorji na osnovi štetja fotonov), ob hkratni rotaciji kristala okoli izbrane osi. Natančno rotacijo omogoča naprava, imenovana goniometer. Po navadi v okviru posamezne ekspozicije zavrtimo kristal za 0,5–1◦. 4. Po končanem snemanju difrakcijskih podatkov lahko kristal ponovno shranimo v tekočem dušiku za kasnejše ponovno snemanje. Sinhrotron nam prek nastavitve valovne dolžine X-žarkov zraven snemanja t. i. nativnih podatkov omogoča tudi podatke, kjer je prišlo do anomalnega sipanja. Tega hišni viri načeloma ne omogočajo, razen ko imamo v kristalu prisoten element, ki pri določeni valovni dolžini anomalno sipa (na primer pri valovni dolžini 1,54 Å (bakrova anoda) lahko izkoristimo šibek anomalni signal žveplovih atomov). Anomalne podatke lahko uporabimo za rešitev faznega problema, na primer v okviru anomalne disperzije pri eni valovni dolžini (Single-wavelength Anomalous Dispersion, SAD). Na UL FKKT je nameščen hišni difraktometer Agilent SuperNova s CCD-detektorjem Atlas. Ne temelji na rotirajoči anodi, temveč gre za mikrofokusni vir, kjer je snop elektronov usmerjen na zelo majhno območje statične anode. Difraktometer ima dve anodi, in sicer molibdenovo ( λ = 0, 71 Å) in bakrovo ( λ = 1, 54 Å); za proteinsko kristalografijo se uporablja slednja. Sam sistem je sicer prvenstveno namenjen difrakcijski analizi kristalov manjših molekul in anorganskih spojin, v primeru dovolj velikih makromolekulskih kristalov pa je v omejenem obsegu uporabljen tudi za te. Difraktometer je prikazan na sliki 3.2. Slika 3.2: Difraktometer Agilent SuperNova na UL FKKT. Na zgornji fotografiji je na de- sni vidna eksperimentalna komora, na vrhu katere je krmilnik za krio-sistem, levo je kon- trolni računalnik. Na spodnji fotografiji je približan del komore s krio-sistemom, koli- matorjem X-žarkov, goniometrom ter kamero CCD. običajna kamera za centriranje šoba za kristala dušik pri 100 K (krio-sistem) kamera CCD kolimator zanka s kristalom goniometrska goniometer glava 3.3 Procesiranje difrakcijskih podatkov Prvo oceno o difrakcijski kvaliteti dobimo že ob vizualni analizi difrakcijskih slik. Želimo visoko ločljivost, odsotnost obročev zaradi difrakcije na 38 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja morebitnih kristalih ledu, visoko ostrino difrakcijskih pik ter nizko mozaičnost. Več nam razkrije procesiranje difrakcijskih podatkov, ki so v obliki slik z dodanimi meta-podatki (geometrija, čas ekspozicije ipd.) – procesiranje izvedemo takoj, ko imamo posnetih nekaj difrakcijskih slik. To nam omogoča, da določimo najverjetnejšo prostorsko skupino ter pripravimo strategijo za nadaljnje snemanje. Območje rotacije kristala, za katero moramo posneti difrakcijske podatke, da bomo imeli popoln podatkovni set, je namreč povezano s simetrijo oz. prostorsko skupino. Procesiranje izvajamo s specializiranimi programi, ki lahko že z uporabo avtomatskih postopkov sami hitro in dobro analizirajo difrakcijske podatke, večinoma pa kljub temu izvedemo reprocesiranje ob prilagoditvi oz. ročni izbiri parametrov. Na splošno ločimo naslednje stopnje procesiranja: 1. indeksiranje, kar pomeni lociranje difrakcijskih pik in določitev kristalne mreže ter približnih parametrov osnovne celice; 2. ocena mozaičnosti, 3. odstranitev neželenih regij difrakcijskih slik, kot so sence in obroči zaradi difrakcije kristalov ledu; 4. piljenje parametrov osnovne celice; 5. integracija, v okviru katere se določijo intenzitete (I) sipanih žarkov in ozadje ( σ I); 6. analiza integriranih podatkov z namenom določitve prostorske skupine; 7. skaliranje in zlivanje (scaling, merging), imenovano tudi redukcija podatkov, kjer integrirane vrednosti z različnih difrakcijskih slik združimo v en set strukturnih faktorjev. V okviru procesiranja programi izračunajo nekaj parametrov, ki so kazal-niki kvalitete difrakcijskih podatkov. Zraven podatkov o samem kristalu jih navadno navedemo v t.i. Tabeli 1, ki je obvezen del članka o na novo določeni makromolekulski strukturi in vsebuje: • prostorsko skupino, parametre osnovne celice ter valovno dolžino uporabljenih X-žarkov, • vsebino osnovne celice oz. asimetrične enote (to dejansko določimo med reševanjem same strukture), • najvišjo ločljivost, • Wilsonov B-faktor, ki predstavlja splošen izotropni B-faktor, • vrednosti faktorjev R pri zlivanju podatkov, • redundantnost (število neodvisnih opažanj) in popolnost podatkov, • jakost signala, izražena kot razmerje I/ σ I. Te parametre navedemo tako za celotno območje ločljivosti kot tudi za lupino z najvišjo ločljivostjo (highest resolution shell). Vaja 3 Snemanje in procesiranje difrakcijskih podatkov Vaja, ki obravnava te korake v procesu določanja strukture, je demonstracijska. Med vajo bo predstavljeno: • nameščanje kristalov lizocima, pripravljenih pri vaji 1, v zanko in zamrzo-vanje v tekočem dušiku, • snemanje difrakcijskih podatkov kristalov lizocima na hišnem viru X- žarkov, • procesiranje nekaj začetnih difrakcijskih slik kristala lizocima, določitev parametrov osnovne celice in prostorske skupine, pregled kazalnikov kvalitete difrakcijskih podatkov. 4 Reševanje, piljenje in validacija modela strukture 4.1 Povezava med difrakcijskimi podatki in strukturo V prejšnjem poglavju je opisano, da s kristalom primerne kvalitete posnamemo set difrakcijskih slik, ki ga nato sprocesiramo – določimo parametre osnovne celice (stranice a, b,c in kote α, β, γ), določimo prostorsko skupino1 1 V praksi velja, da smo lahko prepričani o pravilnosti protorske skupine šele takrat, ko ter izračunamo Millerjeve indekse hkl refleksov in njihove intenzitete Ihkl granja in piljenje modela strukture potekata skupaj z oceno nedoločenosti intenzitete σ hkl. Postopek je precej avtomati-uspešno. ziran. Za rešitev strukture potrebujemo elektronsko gostoto. Če strukturne faktorje in elektronsko gostoto zapišemo kot Fourierjevo serijo, ugotovimo, da med njimi obstaja tesna povezava. Elektronska gostota ni nič drugega kot Fourierjeva transformacija strukturnih faktorjev, z drugimi besedami, obstaja enačba, s katero lahko difrakcijske podatke oz. iz njih določene strukturne faktorje pretvorimo v sliko osnovne celice in njene vsebine. Vendar nam pri tem za vsak strukturni faktor manjka ena komponenta, saj lahko izmerimo zgolj intenziteto posameznih refleksov, ne pa tudi popolnega strukturnega faktorja. Amplituda slednjega je proporcionalna kvadratnemu korenu izmer-jene intenzitete. Povezava med amplitudo strukturnega faktorja in intenziteto je naslednja: |Fhkl| ∝ pIhkl (4.1) Povezava med elektronsko gostoto ρ(x, y, z) in difrakcijskim vzorcem (V pomeni volumen osnovne celice, Fhkl posamezni strukturni faktor) je: 1 ρ(x, y, z) = ∑ ∑ ∑ F V h k l hkl e−2 π i(hx+ky+lz) (4.2) Če torej poznamo intenzitete, poznamo tudi amplitude strukturnih faktorjev, nimamo pa podatka o njihovih fazah. 4.2 Določitev faz sipanih žarkov Za reševanje t. i. faznega problema (določitev faz) je na voljo več metod. V grobem jih delimo na metode eksperimentalnega faziranja, kjer faze izračunamo prek anomalnega sipanja (na primer na selenovih atomih), večkratne izoformne zamenjave ipd., ter metodo molekulske zamenjave. Metode faziranja oz. njihovo teoretično ozadje so podrobneje predstavljene v drugi literaturi2, zato jih tu ne bomo posebej obravnavali. V nadaljevanju sledi zgolj 2 Dober, izčrpen in moderen pregled je na voljo v učbeniku Biomolecular Crystallography kratek opis pristopa molekulske zamenjave, ki je predmet računalniške vaje. avtorja Bernharda Ruppa Bernhard Rupp, Bi- omolecular Crystallography: Principles, Practice, and Application to Structural Biology, Garland 4.2.1 Molekulska zamenjava Science, New York, 2010. Pri metodi molekulske zamenjave uporabimo že znano podobno strukturo, ki jo preko prileganj aminokislinskih zaporedij poiščemo v zbirki že določenih struktur. Pattersonovo funkcijo strukture, ki jo rešujemo, sistematično primerjamo s Pattersonovo funkcijo modela (znana struktura). Na ta način določimo rotacijsko (intramolekulski vektorji) in translacijsko komponento (intermolekulski vektorji), na osnovi katere lahko izračunamo približne faze, na osnovi teh pa karto elektronske gostote, ki ponavadi ni najboljša, saj so 40 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja faze zgolj približne. Sledi gradnja modela in piljenje, v času katerega natančneje izračunamo strukturne faktorje ter posledično dobimo boljšo karto elektronske gostote. 4.3 Asimetrična enota in njena sestava Pri določanju strukture z X-žarkovno difrakcijo določamo strukturo asimetrične enote (asymmetric unit, asu), to je najmanjši del kristala, na osnovi katerega lahko z aplikacijo simetrijskih operacij prostorske skupine3 gene-3 V primeru proteinskih kristalov govorimo o rotacijah, translacijah in vijačnih oseh. riramo osnovno celico in s translacijo slednje po prostoru celoten kristal. Asimetrična enota lahko vsebuje biološko relevanten skupek4 molekul (mo-4 V zbirki PDB se za to uporablja termin biolo- gical assembly. nomer ali oligomer), le del njega ali pa celo več biološko relevantnih skupkov (spet, lahko gre za monomer ali oligomer). Tehnično gledano nas slednje med določanjem strukture niti ne zanima toliko, je pa pomembno, koliko kopij neke polipeptidne verige je prisotnih v asimetrični enoti. Pri molekulski zamenjavi nas tako npr. zanima, koliko kopij določene polipeptidne verige moramo poiskati in umestiti v asimetrično enoto. Pri določanju števila molekul oz. kopij neke polipeptidne verige (ali nukleinske kisline) si pomagamo s t. i. Matthewsovim koeficientom (imenovan tudi Matthewsov volumen, VM). Gre za količnik med volumnom osnovne celice (v Å) in v njej vsebovane mase proteina (Da); Matthewsov koeficient 3 ima tako enoto Å Da−1. Lahko ga tudi obravnavamo kot količnik med volumnom asimetrične enote in v njej vsebovane mase proteina, kar je ekvi-valentno prej napisanemu. Volumen osnovne celice je na podlagi parametrov osnovne celice (stranice in koti) enostavno izračunati, podobno velja za asimetrično enoto. Če poznamo prostorsko skupino, vemo, koliko asimetričnih enot vsebuje osnovna celica, od tukaj do volumna asimetrične enote je zgolj preprost račun. Prav tako poznamo maso proteina (saj poznamo tudi njegovo aminokislinsko zaporedje), preostane nam le, da za različno število kopij proteina na asimetrično enoto (N = 1, 2, 3 ... kopije) izračunamo Matthewsov koeficient in izračunane vrednosti evaluiramo na osnovi možnih. Namreč, 3 Matthewsov koeficient se ponavadi giblje med 1,62 do 3,53 Å Da−1 in je direktno povezan z deležem topila v asimetrični enoti (osnovni celici, kristalu), ki se giblje v območju od 28 % do 78 % (to so ekstremne vrednosti). Na podlagi tega program predlaga najbolj verjetno razmerje N/asu. 4.4 Gradnja modela strukture v praksi Po določitvi faz sipanih žarkov, kar nam omogoča izračun karte elektronske gostote, gradnja modela v praksi poteka navadno tako: 1. avtomatska gradnja5, med katero računalniški program umesti dele ali 5 Moderni programi za avtomatsko gradnjo modela so prevej dobri in nam lahko ob kva- celo večino polipeptidne verige/verig v elektronsko gostoto, pri tem pa litetnih eksperimentalnih podatkih (visoki lo-kot dodaten vhodni podatek uporabi aminokislinsko zaporedje ter (v čljivosti) že sami zgradijo zelo dober model primeru molekulske zamenjave) lahko tudi strukturo, uporabljeno za strukture. Vsekakor je potrebno take modele sámo molekulsko zamenjavo; ročno pregledati, analizirati in izpiliti. 2. izmenjevanje med: • ročno gradnjo in piljenjem (refinement) modela v grafičnem okolju, • avtomatskim piljenjem6, med katerim pride tudi do izračuna novih 6 Pregled o ozadju in teoriji avtomatskega piljenja je na voljo v drugi literaturi (56). kart elektronske gostote ter izračuna faktorjev R in R f ree. Postopek gradnje in piljenja je torej iterativen, saj nam ustrezno delno prilagojen model omogoča izračun novih, natančnejših faz, na osnovi katerih izračunamo natančnejšo elektronsko gostoto itd. Med piljenjem upoštevamo tudi splošne fizikalno-kemijske/stereokemijske parametre (dolžine vezi in koti med njimi . . . ), v model dodamo molekule vode in druge molekule (ligande) in/ali ione. Značilnost procesa piljenja je tudi to, da nismo osredoto- čeni zgolj na posamezni aminokislinski ostanek in elektronsko gostoto, ki mu ustreza, temveč gledamo širše – analiziramo neposredno okolico. V primeru aminokislinskih ostankov glutamin in asparagin npr. ni vseeno, kako je konec r e š e va n j e , piljenje in validacija modela strukture 41 stranske skupine (karbonilna in amino skupina) obrnjen, saj ima posamezna stran različen potencial oz. preference do interakcij z drugimi skupinami v neposredni bližini. Povzeto, naš cilj je, da model strukture ustreza tako eksperimentalnim podatkom kot tudi stereokemijskim parametrom, kar bo najbolje ilustrirano v okviru dveh računalniških vaj: • vaje 4a, ki obravnava ročno piljenje sicer že zgrajene strukture ribonukleaze Sa, z namenom seznanitve s programskim orodjem Coot za delo z modelom strukture in karto elektronske gostote; • vaje 4b, ki vsebuje celoten postopek reševanja strukture človeške karbonske anhidraze od sprocesiranih difrakcijskih podatkov do končnega modela strukture, pri vaji pa se uporabljajo veščine, pridobljene na primeru iz vaje 4R1. 4.5 Ocenjevanje kvalitete modela strukture Pogosto uporabljano merilo kvalitete modela, ki ga izračunamo med piljenjem, je faktor R, predstavlja pa statistično merilo ujemanja opaženih - eksperimentalno izmerjenih (observed, Fobs ali Fo) in iz modela izračunanih (calculated, Fcalc ali Fc) amplitud strukturnih faktorjev: ∑ |F R = obs − Fcalc | (4.3) ∑ |Fobs| Teoretična vrednost faktorja R sega od 0 (popolno ujemanje med izračuna-nimi in izmerjenimi intenzitetami) do približno 0,6 (set izmerjenih intenzitet, ki jih primerjamo s setom naključnih intenzitet – takšna struktura bi bila za v smeti). V praksi na splošno velja, da je pri strukturah s slabšo ločljivostjo (>3 Å) dopustna vrednost faktorja R nad 0,2, v primeru struktur visoke ločljivosti (< 2Å) pa pod 0,2. Med piljenjem je pomemben tudi izračun faktorja R f ree, saj faktor R ne zajema pristranskosti, ki jo vnesemo med piljenjem. Razlika med izračunom vrednosti R in R f ree je v tem, da pri slednjem upoštevamo le naključno izbran set refleksov (5–10 % vseh refleksov), ki smo jih v postopku piljenja izpustili. V idealnem primeru bi na osnovi piljenega modela izraču-nali enak Fcalc, tako za izpuščeni kot pri piljenju uporabljeni set refleksov; v tem primeru bi bila vrednost R f ree enaka vrednosti R. V primeru prekomer-nega piljenja (t. i. overfitting7), kjer bi upoštevali preveč šuma in bi atome 7 Pri tem gre pravzaprav za to, da imamo v na- šem modelu preveč parametrov kot jih lahko na silo umeščali v položaje brez neke osnove (brez definirane elektronske utemeljimo z eksperimentalnimi podatki. gostote), bi piljen model za izpuščen set napovedal vrednosti Fcalc precej slabše kot za piljen set. V praksi se smatra za sprejemljivo, če je razlika med R f ree in R manjša od 0,05–0,1. 4.6 Validacija modela strukture Validacija modela strukture pomeni, da ocenimo zanesljivost modela in sicer tako v smislu eksperimentalnih podatkov (difrakcijski podatki) kot tudi znanih fizikalnih in kemijskih parametrov. Pravzaprav validacijo modela strukture (oz. vsaj nekaj vidikov) delamo že med piljenjem, kjer spremljamo veliko število parametrov, na primer: • faktorja R in R f ree kot ujemanje med iz modela izračunano elektronsko gostoto ter elektronsko gostoto, izračunano na podlagi eksperimentalnih podatkov; • dolžine vezi in kote med njimi, prav tako spremljamo dihedralne kote ϕ in ψ (naš cilj je, da se ne nahajajo v nedovoljenih regijah Ramachandranovega diagrama); • sterične ovire (sterical clashes), kjer gre za to, da so si posamezni atomi ali skupine atomov preblizu; • nekovalentne interakcije, kjer preverimo, ali so stranske skupine aminokislinskih ostankov orientirane tako, da lahko tvorijo ugodne interakcije, če so seveda na primerni razdalji. Podobno velja tudi za interakcije med aminokislinskimi ostanki in ligandi8. 8 Tipični primer je orentacija distalnega dela stranske skupine asparagina in glutamina, kjer ima vsaka stran (CO in NH2) specifično preferenco po tvorbi nekovalentnih interakcij z drugimi, sosednjimi skupinami). 42 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja Veliko od zgoraj navedenega lahko moderni programi naredijo sami, tudi med avtomatskim piljenjem, a vsak avtomatsko generiran model strukture je treba ročno pregledati. Velja, da je uporaba programov po principu črne škatle lahko izredno nevarna in zavajajoča. Vsekakor je validacija ključen korak, ki ga moramo narediti pred funkcijsko analizo modela strukture, saj model strukture, ki ni skladen tako z eksperimentalnimi podatki kot fizikalno-kemijskimi omejitvami, nima praktične vrednosti. Vidiki validacije so, tudi v matematičnem smislu, obdelani v številni znanstveni literaturi, priporočeno branje je zgoščen pregledni članek Validation of protein crystal structures, avtorja G. J. Kyeywegta (57). Vaja 4a Ročno piljenje modela strukture v grafičnem okolju Vaja je osnovana na priročniku za delo s programom Coot, avtorja Paula Emsleya, ki je prosto dostopen na spletu: https://www2.mrc-lmb.cam.ac.uk /personal/pemsley/coot/web/tutorial/tutorial.pdf. Namen vaje Namen vaje je na primeru ročnega piljenja modela strukture ribonukleaze Sa spoznati principe piljenja strukture v grafičnem okolju v realnem prostoru. Veščine, pridobljene pri tej vaji, so potrebne za vajo 4R2 (stran 51), ki obravnava celoten postopek reševanja strukture, od sprocesiranih difrakcijskih podatkov do končnega modela, vključno z ročnim piljenjem. Material Vaja je računalniška. Za izvedbo so potrebne datoteke z vhodnimi podatki, ki jih dobite pri asistentu: • rnaSa.pdb z modelom strukture ribonukleaze Sa, ki pa ni popoln, • rnaSa.mtz, ki vsebuje sprocesirane difrakcijske podatke ter strukturne faktorje ter omogoča izračun karte elektronske gostote. Nekaj osnovnih informacij o ribonukleazi Sa je v nadaljevanju, sledi pa opis programa Coot, ki je potreben za izvedbo vaje. Uvodne informacije o ribonukleazi Sa Ribonukleaza Sa je iz bakterije Streptomyces aureofaciens, predstavniki rodu Streptomyces pa so vir številnih tetraciklinskih antibiotikov. Te bakterije so po Gramu pozitivne, imajo visok delež parov GC v genomu, živijo pa pretežno v prsti in razpadajočih rastlinskih tkivih. Imajo značilen vonj po zemlji, ki ga daje hlapen metabolit geozmin. Delali boste z modelom strukture ribonukleaze Sa (RNaza Sa) iz omenje-nega organizma. Ta encim je pravzaprav za gvanil-specifična ribonukleaza, pri cepitvi nastaneta nukleozid 3’-fosfat in 3’-fosfooligonukleotid, ki se konča z G-P. Ločljivost difrakcijskih podatkov, uporabljenih pri določevanju strukture, je približno 1,8 Å. RNaza Sa je bila kristalizirana v pufru, ki je med drugim vseboval sulfatne ione (SO2−) in 3’-gvanozin monofosfat (3’-GMP; 4 slika 4.1). Slika 4.1: Struktura 3’-gvanozin monofosfata (3’-GMP). Programska oprema Od programske opreme je potreben program Coot9, ki je trenutno eden naj-9 Kratica Coot pomeni Crystallographic Object- Oriented Toolkit, hkrati pa je to angleško ime za pogosteje uporabljanih programov za gradnjo in piljenje modelov strukture ptico, ki živi tudi v naših krajih in jo poznamo bioloških makromolekul na svetu. Avtor programa je Paul Emsley (58; 5), ki po imenu liska. To je tudi razlog, da je liska program velikodušno daje v brezplačno uporabo. Spletna stran programa maskota programa. 44 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja je dostopna na naslovu https://www2.mrc-lmb.cam.ac.uk/personal/pems ley/coot/; na tej strani je program na voljo za prenos. Teče na vseh pogosto uporabljanih operacijskih sistemih, instalacija pa včasih ni popolnoma enostavna. Če si želite program namestiti na domači računalnik, vam bo pomagal asistent. Grafični vmesnik programa Coot je sestavljen iz več oken, ki so ločena, zato je pri delu zelo pripravno uporabljati dva zaslona. V primeru dela na zgolj enem, pa moramo upoštevati, da del ekrana namenimo oknom programa, namenjenim za specifične analize ali manipulacije (slika 4.2). (a) (d) (e) (b) (c) Slika 4.2: Grafični vmesnik programa Coot. Prikazana sta okni za ogled in manipulacijo modela strukture ter karte elektronske gostote ter okno z najpogosteje uporabljanimi orodji (a), okno za pomikanje po aminokislinskem ali Postopek dela nukleotidnem zaporedju oz. verigi/verigah (b), Ramachandranov diagram (c), ter okni za analizo ujemanja modela strukture z elektron- Odpiranje datotek in osnovne manipulacije sko gostoto (d) in analizo rotamerov (e). 1. Zaženite program Coot in naložite koordinate atomov modela strukture ribonukleaze Sa: File . Open Coordinates ... → navigirajte do datoteke rnaSa.pdb ter potrdite izbiro. V glavnem oknu programa se odpre model strukture (slika 4.3). 2. Preizkusite načine manipuliranja modela strukture v prostoru: • rotacija – držimo levi gumb miške in jo premikamo; • translacija – držimo levi gumb miške in jo premikamo, hkrati pa na tipkovnici držimo tipko Alt; r e š e va n j e , piljenje in validacija modela strukture 45 Go To Atom... glavni meni Real Space Refine Zone Rigid Body Fit Zone Rotate Translate Zone Auto Fit Rotamer Rotamers Flip Sidechain 180° Mutate & AutoFit Simple Mutate Add Residue Add Alternate Conformation Place Atom at Pointer stranska orodna vrstica Slika 4.3: Glavno okno programa Coot z odpr- tim modelom strukture ribonukleaze Sa. Ne- katera orodja, ki so omenjena v posameznih • približevanje/oddaljevanje – držimo levi gumb miške in jo premikamo korakih vaje, so označena. (za oddaljevanje v desno ali proti sebi, za odmikanje pa v levo ali stran od sebe). 3. Razmislite, koliko polipeptidnih verig je v asimetrični enoti ter ali predstavljajo biološko relevanten oligomer. Pomagajte si s pripisi v zbirki UniProt. 4. Center rotacije (označen z rožnato kockico) prenesemo na posamezni atom tako, da bodisi kliknemo z levim gumbom miške na ta atom ob hkratnem pritisku na tipko Alt, ali pa na ta atom kliknemo s sredinskim gumbom miške. Ob tem se nam izpišeta oznaki atoma in aminokislinskega ostanka, npr. CA /43 VAL/A, kar pomeni atom C α aminokislinskega ostanka Val43 v verigi A. 5. Po aminokislinskih ostankih se lahko na enostaven način premikamo tudi tako, da v orodni vrstici neposredno nad prikazom modela strukture kliknemo na gumb Go To Atom ...) → odpre se novo okno, v katerem lahko izberemo posamezni aminokislinski ostanek v odprti datoteki PDB (mimogrede, hkrati imamo lahko odprtih več datotek PDB, v tem primeru moramo v tem oknu izbrati želeno). 6. Odprite datoteko, ki vsebuje strukturne faktorje za prikaz elektronske gostote: File . Auto Open MTZ → navigirajte do datoteke rnaSa.mtz ter potrdite izbiro. Odpreta se dve karti elektronske gostote, in sicer: • kompozitna karta elektronske gostote 2Fo − Fc, ki je obarvana modro (privzet način barvanja prve karte elektronske gostote, ki jo odpremo v programu); 46 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja • diferenčna karta elektronske gostote Fo − Fc, ki jo uporabljamo za detekcijo napak v modelu, in sicer ločimo dvoje različnih načinov prikaza: – pozitivne regije so obarvano zeleno, to pomeni, da v našem modelu (uporabljen za izračun Fc) nekaj manjka, a eksperimentalni podatki kažejo, da je nekaj vseeno tam (Fo); |Fo| > |Fc|; – negativne regije so obarvane rdeče, to pomeni, da je v našem modelu (uporabljen za izračun Fc) nekaj, za kar ni eksperimentalne podlage (Fo) oz. tam ni ničesar, kar bi prispevalo k sipanju žarkov; |Fo| < |Fc|. 7. Karta elektronske gostote je prikazana v nekem radiju od središča rotacije (rožnata kockica). Ta radij lahko spremenite v izbirniku Edit . Map Parameters, kjer povečate Map Radius. Pozor, povečevanje obsega znatno zmanjša hitrost prikazovanja! Identificirajte oblake elektronske gostote, ki ustrezajo proteinu (dobro definirana elektronska gostota) ter kanale topila v kristalu (ni definirane elektronske gostote). 8. Pri karti elektronske gostote lahko spreminjate konturiranje (najenostav-0,1 0,5 neje je s premikanjem miškinega koleščka, lahko tudi s pritiskom na tipki + oz. − na tipkovnici), pri čemer dejansko nastavljamo r.m.s.d. vrednost, pri kateri je prikazana elektronska gostota (ponavadi prikazana kot mreža). Na primer pri 1 bi bila mreža narisana na mestih funkcije ρ(x, y, z) v prostoru, kjer so vrednosti za eno standardno deviacijo večje od povprečne. Z večanjem vrednosti za konturiranje (npr. na 3 ali celi 4) bomo tako videli samo tiste regije, kjer je elektronska gostota res velika (npr. kovinski ioni); 1,0 3,0 z večanjem najprej izginejo tiste regije, kjer je elektronska gostota manjša, npr. (delno) fleksibilne regije. Po drugi strani, npr. z manjšanjem pod npr. 0,5, bo šum postajal bolj izrazit in bomo posledično težko ločili, kateri deli prikazane elektronske gostote predstavljajo molekulo, kateri pa so zgolj šum. Primer karte elektronske gostote 2Fo − Fc ribonukleaze Sa pri različnih konturiranjih je prikazan na sliki 4.4. Slika 4.4: Karta elektronske gostote ribonu- kleaze Sa, konturirane pri različnih nivojih (r.m.s.d.). Prikazana je elektronska gostota v radiju 12,6 Å od centra rotacije. Izbira rotamer Eden od načinov identifikacije problematičnih delov strukture je analiza ujemanja modela strukture z elektronsko gostoto. Ta analiza je dostopna preko menija: Validate . Density Fit Analysis → izberite datoteko pdb. Oglejte si histogram: • Višje vrednosti in rdeča barva pomenita slabo ujemanje oz. slabo geome-trijo. V verigi A posebej izstopata dve regiji in sicer v bližini aminokislinskih ostankov 41A in 89A. • Oglejte si tudi regijo 40B–41B (kliknite na histogram in opazujte model strukture in karto elektronske gostote). Kako razlagate slabo ujemanje z elektronsko gostoto? V nadaljevanju bomo neujemanje med modelom strukture in karto elektronske gostote popravili: 1. Kliknite na stolpič histograma, ki predstavlja 89A. Coot nacentrira prikaz na atom C α tega aminokislinskega ostanka. 2. Oglejte si situacijo. V stranskem izbirniku kliknite na gumb Rotamers. 3. V grafičnem delu okna kliknite (levi klik) na katerikoli atom ostanka 89A, po kliku pa Coot prikaže okno možnih rotamerov stranske skupine. Trenutni je v modelu strukture prikazan z običajno barvo, ostali možni pa s sivo. Izberite najustreznejšega (tistega, ki se najbolje prilega elektronski gostoti) ter izbiro potrdite s klikom na OK. 4. Dodatno izpilite konformacijo tega aminokislinskega ostanka, in sicer z uporabo avtomatskega piljenja v realnem prostoru, kar dosežete s klikom na gumb Real Space Refine Zone v stranskem izbirniku. Nato morate aktivirati regijo, ki ji želite izpiliti: r e š e va n j e , piljenje in validacija modela strukture 47 • če gre za samo en aminokislinski ostanek, potem dvakrat zaporedoma kliknete na katerikoli atom tega aminokislinskega ostanka (ni nujno, da sta prvi in drugi klik narejena na isti atom tega aminokislinskega ostanka), • če gre za regijo (od ... do ... aminokislinskega ostanka), pa prvič kliknete na katerikoli atom aminokislinskega ostanka na eni strani te regije, drugi klik pa naj bo na katerikoli atom aminokislinskega ostanka na drugi strani te regije (splošen primer regije bi bil lahko od 80. do 85. aminokislinskega ostanka). 5. Coot prikaže nove, izpiljene koordinate s sivo barvo (stare koordinate so rumene). Potrdite s klikom na OK. Atomi aminokislinskega ostanka 89A sedaj lepo ležijo v karti elektronske gostote. 6. Podobno bi lahko dosegli z uporabo zgolj možnosti Real Space Refine Zone. Dvakrat kliknite na Undo ter ponovite piljenje z uporabo Real Space Refine Zone ter atome stranske skupine povlecite v oblak elektronske gostote. 7. Oglejte si še regijo okrog aminokislinskega ostanka 41A. Kaj je narobe? 8. Uporabite možnost Real Space Refine Zone, pri čemer izberite celotno regijo polipeptidne verige, od 40A do 42A (najprej kliknite na en atom ostanka 40A, nato pa na en atom ostanka 42A). Povlecite atome v oblak elektronske gostote ter njihove položaje prilagajajte tako dolgo, dokler ne ležijo v oblaku elektronske gostote oz. je ujemanje z elektronsko gostoto in modelom strukture zadovoljivo. Mehurčkologija Mehurčki (v angleščini oz. programu Coot se zanje uporablja izraz blob) so oblaki elektronske gostote, ki so preveliki, da bi ustrezali molekulam vode. Z njimi se med gradnjo modela strukture pogosto srečamo; ustrezajo lahko ligandom, komponentam kristalizacijskega pufra . . . Kot mehurčki so tudi majhni oblaki elektronske gostote, ki ustrezajo molekulam vode, a te zaradi majhnosti obravnavamo posebej. Mehurčke lahko poiščemo tako, da izberemo Validate . Unmodelled blobs ... in kliknemo na Find Blobs (nastavitve pustite na privzetih vrednostih). Odpre se novo okno s seznamom najdenih mehurčkov. Med delom ga pusite odprtega, saj se lahko s klikanjem na imena mehurčkov pomikate med njimi. Poglejmo si jih: 1. Mehurček 2 (Blob 2): (a) Kakšne oblike je ta mehurček? Kaj menite, da bi vanj glede na obliko najbolje prilegalo? Razmislite, kaj bi lahko vanj vgradili (glede na sestavo kristalizacijskega pufra). (b) V stranskem izbirniku kliknite na gumb Place Atom At Pointer ... V oknu, ki se odpre, izberite SO4, ter izbiro potrdite s klikom na OK. (c) Z uporabo možnosti Real Space Refine Zone izpilite koordinate sulfa-tnega iona. 2. Mehurček 3 (Blob 3): (a) Kakšne oblike je ta mehurček? Kaj menite, da bi se vanj najbolje prilegalo (glede na sestavo kristalizacijskega pufra)? Namig: slika 4.1. (b) Koordinate tega liganda so že v zbirki znanih ligandov10 pod kodo 10 Zbirka znanih ligandov se imenuje Ligand Expo in je del zbirke PDB. Dostopna je na na- 3GP. Dobimo jih tako: File . Get Monomer. V polje vpišite 3GP. slovu https://ligand-expo.rcsb.org. Gre (c) Z uporabo Rotate/Translate Zone (gumb v stranskem izbirniku) prema-za ligande, ki so že bili identificirani v drugih knite 3’-GMP tako, da se bosta obliki liganda in bloba 3 ujemali: po strukturah makromolekul in so dobili svojo identifikacijsko oznako, sestavljeno iz kombi- izbiri tega orodja kliknite dvakrat kliknite na isti atom (ali po enkrat nacije črk in številk (skupno trije znaki). na dva različna atoma) v molekuli 3’-GMP, nato pa z vlečenjem pre-maknite 3’-GMP. Celoten sistem ali zgolj 3’-GMP lahko med tem tudi vrtite. Končen položaj potrdite s klikom na OK. 48 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja (d) Prileganje elektronski gostoti optimizirajte z uporabo Real Space Refine Zone. Analizirajte kontakte, ki jih ligand tvori z bližnjimi aminokislinskimi ostanki. To je tudi eden izmed načinov, da ugotovite njegovo pravilno orientacijo! (e) Model strukture ribonukleaze Sa in 3’-GMP združite: Calculate . Merge Molecules. (f) V isto datoteko PDB zlijte še sulfatni ion iz prejšnjega primera. 3. Mehurček 1 (Blob 1): (a) Oglejte si situacijo. Kaj menite, da manjka? Primerjajte zaporedje proteina v strukturi z zaporedjem ribonukleaze Sa v zbirki UniProt. Primerjajte pa tudi zaporedji verig A in B v vašem modelu strukture. (b) Razmislite, kaj bi lahko bil razlog, da manjkajočega dela strukture v na- šem primeru ne moremo identificirati prek karte diferenčne elektronske gostote. (c) Manjkajoči del polipeptidne verige dodate tako: Calculate . Fit Loop → območje zaporedja ustrezno nastavite (novo dodani aminokislinski ostanki bodo imeli te številčne oznake!) ter v spodnje polje vpišite zaporedje aminokislinskih ostankov, ki manjkajo v strukturi (enočrkovne kode). Kliknite Fit Loop in opazujte. (d) Oglejte si C-končni aminokislinski ostanek in njegovo bližino. Bi kaj spremenili? Uporabite Real Space Refine Zone. (e) Na C-konec dodajte tudi kisikov atom (OXT, t.j. terminal oxygen11): 11 Tak atom ima samo C-končni aminokislinski ostanek polipeptidne verige in kot tak ozna- Calculate . Other Modelling Tools . Add OXT to Residue. čuje njen konec. Voda Oglejte si majhne okrogle oblačke elektronske gostote v neposredni bližini proteina. To je t. i. kristalna voda. Te molekule so v stiku s proteinom in so zato urejene, v karti elektronske gostote pa jih vidimo kot majhne okrogle oblačke. S podrobnejšo analizo njihove bližnje okolice lahko ugotovimo, kateri atomi katerih aminokislinskih ostankov sodelujejo pri njihovi vezavi. V povprečju lahko v strukturi proteina pri ločljivosti ≈2 Å zaznamo toliko molekul vode kot je aminokislinskih ostankov v strukturi12. 12 Za zanimivo analizo koliko molekul vode lahko identificiramo v kristalnih strukturah je Molekule vode na avtomatiziran način lahko poiščemo tako: Calculate . zanimivo branje članek How many water mole- Other Modelling Tools . Find Waters. cules can be detected by protein crystallography? (59). Alternativna konformacija aminokislinskih ostankov Oglejte si aminokislinski ostanek 72A. Za kateri aminokislinski ostanek gre? Je s strukturo tega dela ribonukleaze Sa vse v redu? 1. Izbrišite ostanek 72A: Calculate . Model/Fit/Refine . Delete . Residue/Monomer ali kliknite Delete Item ... v stranskem izbirniku. 2. Na to mesto dodajte alaninski ostanek: Calculate . Model/Fit/Refine . Add Terminal Residue, lahko pa tudi uporabite gumb Add Residue v stranskem izbirniku (kliknite na 71A, na katerega želite dodati končen aminokislinski ostanek). 3. Na novo dodani aminokislinski ostanek13 Ala72 mutirajte v Cys: kliknite 13 Kot nov aminokislinski ostanek se ponavadi v fačetni fazi dodajajo alaninski ostanki. Tak na gumb Mutate & Auto Fit v stranskem izbirniku, nato kliknite na ostanek ostanek je namreč najmanjši ostanek, ki ima 72A (Ala), v oknu pa izberite Cys. neko stransko skupino z možnostjo usmeritve, 4. Konformacijo dela polipeptidne verige 71A–73A izpilite z uporabo Real hkrati pa nudi dovolj konformacijske svobode, da ga lahko umestimo skoraj kamorkoli. Space Refine Zone. 5. Ponovno si oglejte ostanek 72A. Kaj opazite? 6. Aminokislinskemu ostanku Cys72A dodajte alternativno konformacijo: v stranskem izbirniku kliknite na Add Alternate Coformation ter nato kliknite na ta aminokislinski ostanek. Razmislite, kakšen je najprimernejši delež oz. zasedenost (occupancy). 7. Alternativno konformacijo 72A izpilite z uporabo Real Space Refine Zone. r e š e va n j e , piljenje in validacija modela strukture 49 Ramachandranov diagram Oglejte si še Ramachandranov diagram: Validate . Ramachandran Plot . RNa-seSa.pdb: • So vsi aminokislinski ostanki v dovoljenih regijah? (Samo aminokislinske ostanke, ki so v nedovoljenih regijah, lahko prikažete s klikom na gumb Outliers Only). • Se lega posameznih aminokislinskih ostankov v diagramu ujema z njiho-vim položajem znotraj elementov sekundarne strukture? Vaja 4b Reševanje strukture HCAII in validacija Namen vaje Namen vaje je na primeru reševanja strukture človeške karbonske anhidraze II spoznati naslednje stopnje: faziranje z uporabo molekulske zamenjave, avtomatska gradnja modela strukture, ročna gradnja modela strukture in piljenje (avtomatsko in ročno) ter validacija modela. Za izvedbo vaje so potrebne veščine, pridobljene v predhodni vaji 4a (stran 43). Material Vaja je računalniška. Za izvedbo so potrebne datoteke z vhodnimi podatki, ki jih dobite pri asistentu: • hca2.mtz, ki vsebuje sprocesirane difrakcijske podatke14 kristala človeške 14 Podatki je posnel dr. Bjoern Sjöblom iz skupine prof. dr. Kristine Djinović Carugo. Po- karbonske anhidraze II, a brez faz, tako da izračun kart elektronske gostote datki so bili posneti pod krio-pogoji. ni možen, • hca3.pdb s strukturo homologa - karbonske človeške anhidraze III. Nekaj osnovnih informacij o karbonski anhidrazi II je v nadaljevanju, sledi pa opis programske opreme. Uvodne informacije o karbonski anhidrazi II Karbonske anhidraze katalizirajo reverzibilno hidratacijo ogljikovega dio-ksida: CO2 + H2O * ) HCO− + H+ 3 Nahajajo se v vseh živalih in fotosintetizirajočih organizmih ter nekaterih nefotosintetizirajočih bakterijah. Obstajajo tri evolucijsko nesorodne družine karbonskih anhidraz ( α – živali, β – rastline in γ – bakterije), med katerimi ni sekvenčne podobnosti, so pa vse cinkovi metaloencimi. Družine karbonskih anhidraz tako predstavljajo jasen primer konvergentne evolucije katalitske funkcije. Pri človeku poznamo 7 gensko različnih α-izoencimov (CA I–VII). Karbonska anhidraza II (CA II) je najbolje preučena oblika, nahaja se v številnih tipih celic ter je znana kot eden najbolj učinkovitih encimov z maksimalno pretvorbeno hitrostjo 106 s−1 (pri pH 9,0 ter temperaturi 25 °C). Izooblika CAIII ima precej nižjo pretvorbeno število (8 × 103 s−1), nahaja pa se pretežno v mišičnih vlaknih, kjer sodeluje pri facilitirani difuziji CO2 do tkivnih kapilar. Katalitski mehanizem človeških karbonskih anhidraz je prikazan na sliki 4.5. Programska oprema Del vaje, ki se nanaša na gradnjo in piljenje modela v grafičnem okolju, poteka z uporabo programa Coot, ki je opisan v vaji 4a na strani 43. 52 m Metoa dek &d r ol o oč m ev o an l ja& e 3 k D& u str l u s kt k ura &m k ak r ro is mo t lea k l ul:& og Makr r a omf o i leja kulska&kristalografija&(vaje)& Miha%Pavšič%//%Univerza%v%Ljubljani,%Fakulteta%za%kemijo%in%kemijsko%tehnologijo,%Katedra%za%biokemijo% Študijsko%leto%2010/2011% % % % H H H Slika 4.5: Katalitski mehanizem človeških kar- O H O H O- H+ bonskih anhidraz. N N N N Zn2+ N Zn2+ N Zn2+ N N N N N N His N His N His N His His His N N N His His His O O H C H C O- O O O- N N N Zn2+ N Zn2+ N N N N His N His N His His N N His His % Slika&4:%Katalitski%mehanizem%človeške%karbonske%anhidraze.% % Za ostale posamezne korake vaje je na voljo več ločenih programov, ki se danes najpogosteje uporabljajo kot del večjih programskih paketov. Najpopu-larnejša sta dva, in sicer CCP4 (60), dostopen na naslovu https://www.ccp4.a c.uk, in Phenix (61), dostopen na naslovu https://www.phenix-online.org. Oba sta prosto dostopna in tečeta na vseh pogostih operacijskih sistemih, pri obeh pa gre pravzaprav za skupek velikega števila programov, ki so namenjeni posameznim opravilom, s skupnim in bolj ali manj enotnim grafičnim vmesnikom. Tako pri obeh paketih najdemo programe za analizo difrakcijskih podatkov, faziranje z eksperimentalnimi metodami ter molekulsko zamenjavo, avtomatsko gradnjo modela ter piljenje, validacijo ... V novejšem času so orodja paketa CCP4 na voljo brezplačno tudi prek spletnega vmesnika CCP4Cloud: https://cloud.ccp4.ac.uk. To bistveno poenostavi uporabo, sploh za začetniške uporabnike, saj ni potrebe po insta-laciji velikega programskega paketa, prav tako pa vsi procesi (nekateri so računsko zelo zahtevni) tečejo na skupku oddaljenih računalnikov. Omejeni smo le s prostorom in številom opravil oz. procesorskim časom, ki nam je na voljo. Ravno ta, spletni vmesnik, je opisan v nadaljevanju, je pa kot sistem v razvoju seveda podvržen spremembam, zato se lahko vmesniki oz. način prikaza rezultatov analiz nekoliko 10%/%10 razlikuje od tega, prikazanega na slikah. Postopek dela Molekulska zamenjava Najprej analizirajte podobnost med karbonsko anhidrazo II in III prek poravnave aminokislinskih zaporedij. Razmislite, ali je uporaba strukture karbonske anhidraze III dejansko smiselna za molekulsko zamenjavo pri izoobliki II. V nadaljevanju je orisan postopek molekulske zamenjave s ključnimi koraki, podrobne informacije in navodila 1. Prijavimo se v sistem CCP4Cloud in ustvarimo nov projekt. 2. Dodamo novo opravilo (job), prek klika na velik zelen znak plus (+), in sicer uvozimo podatke (Data Import). Naložimo datoteko hca2.mtz. Po uvozu se nam prikaže analiza podatkov, ki jih vsebuje, med drugim kratek povzetek (slika 4.6). Vidimo, da je bila valovna dolžina uporabljenih X-žarkov 1,54 Å, stranice osnovne celice imajo dimenzije a = 42, 07 Å, b = 41, 387 Å in c = 72, 067 Å, koti so α = γ = 90◦, β = 104, 141◦. Najvišja ločljivost podatkov je 1,59 Å, prostorska skupina je P 1 21 1. 3. Uvozite (Import Sequence(s) by Copy-Paste) še aminokislinsko zaporedje karbonske anhidraze II, ki ga najdete v zbirki UniProt. Zaporedje naj bo v formatu FASTA. r e š e va n j e , piljenje in validacija modela strukture 53 Slika 4.6: Prikaz povzetka po uvozu difrakcij- skih podatkov. 4. Prek opravila Asymmetric Unit Contents določite najbolj verjetno število kopij polipeptidne verige na asimetrično enoto. Izračun poteka prek izračuna Matthewsovega koeficienta, kar je podrobneje opisano na strani 40. 5. Sedaj bi že lahko začeli z molekulsko zamenjavo, lahko pa model (strukturo karbonske anhidraze III) nekoliko obdelamo, in sicer odstranimo atome, ki se med strukturama zagotovo razlikujejo. Eden izmed pristopov, ki to naredi, je Chainsaw, do katerega pridemo prek Prepare MR Model(s) from Coordinate data in uporabe datoteke hca3.pdb. Uporaba takega pristopa je posebej smiselna, če se aminokislinsko zaporedje strukture za molekulsko zamenjavo bolj razlikuje od zaporedja proteina v kristalu. 6. Molekulsko zamenjavo s programom Phaser začnemo prek izbire Molecular Replacement with Phaser. Kot vhodne podatke izberemo difrakcijske podatke iz datoteke hca2.mtz ter model Chainsaw, pripravljen v prej- šnjem koraku. Pozorni pa moramo biti tudi na to, koliko kopij modela v asimetrični enoti bomo iskali (parameter Look for X copies in ASU). 7. Po zaključku nam Phaser sporoči nekaj statističnih parametrov, iz katerih lahko izluščimo, ali je bila molekulska zamenjava uspešna. To sta vrednosti LLG (Log Likelihood Gain, ki je povezana z ujemanjem modela s podatki (višja kot je, bolje je; vrednosti nad 120 se smatrajo kot dobre) ter TFZ (Translation Function Z-score), ki predstavlja število standardnih deviacij od srednje vrednosti. Velja naslednje pravilo: TFZ < 5 → molekulska zamenjava ni uspešna; TFZ > 8 → molekulska zamenjava je zagotovo uspešna; vmesne vrednosti predstavljajo različne nivoje uspešnosti. 8. Po molekulski zamenjavi je smiselno narediti nekaj ciklov avtomatskega piljenja: Refinement with Refmac. Kot vhodne podatke izberemo izhodne podatke prejšnje stopnje. 9. Po končanem avtomatskem piljenju si oglejmo, kako so se vrednosti faktorjev R in R f ree spreminjale s cikli – padanje vrednosti je dober znak, da je bila molekulska zamenjava dejansko uspešna. Ročna gradnja in piljenje modela S CCP4Cloud prenesite datoteke avtomatskega piljenja po molekulski zamenjavi (datoteki mtz in pdb), jih odprite v programu Coot ter po vzoru iz vaje 4a (stran 43) nadaljujte z ročnim piljenjem modela strukture karbonske anhidraze II. Upoštevajte in razmislite: • Kot rezultat molekulske zamenjave dobimo datoteko pdb. Kaj pravzaprav vsebuje? Je to že model strukture, v našem primeru karbonske anhidraze II? Če ne, kaj moramo s tem modelom najprej narediti? • Po večjih spremembah oz. popravkih modela strukture ga ponovno prenesite (uvozite koordinate) v CCP4Cloud ter naredite nekaj ciklov avtomatskega piljenja z orodjem Refmac. Tako boste prišli do natančnejših faz oz. strukturnih faktorjev ter posledično do boljše (bolj detajlne) karte elektronske gostote. 54 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja • Kje je aktivno mesto karbonske anhidraze II? Kateri aminokislinski ostanki sodelujejo pri koordiniranju osrednjega kovinskega iona? Ročno in avtomatsko piljenje izmenjujte, dokler vrednosti faktorjev R in R f ree ne padajo več. Razmislite, ali je model strukture popoln oz. dobro izpiljen ter v skladu tako z eksperimentalnimi podatki kot stereokemijskimi parametri. Primer oz. zaslonska slika iz CCP4Cloud, na kateri so razvidne posamezne stopnje, je prikazan na sliki 4.7. Model strukture še ni popolnoma izpiljen! Slika 4.7: Koraki do skoraj izpiljenega modela strukture karbonske anhidraze II v CCP4Cloud. Zadnji prikazan korak (ccp4build) vsebuje avtomatsko gradnjo mo- dela strukture po molekulski zamenjavi in pr- vem avtomatskem piljenju – avtomatsko gene- riran model vsekakor ni tako dober kot ročno izpiljen. Avtomatska gradnja modela Za primerjavo z vašo, ročno grajeno in izpiljeno, strukturo zaženite po prvem avtomatskem piljenju po molekulski zamenjavi avtomatsko gradnjo modela strukture Automatic Model Building with CCP4Build. Kako dober je algoritem v primerjavi z vašo, človeško logiko? Validacija modela strukture Validacija modela strukture je, kot je opisano v razdelku 4.6, integralen del piljenja. Številna orodja za ročno validacijo modela strukture vsebuje Coot, vrednosti parametrov, s katerimi ovrednotimo model strukture, nam izračuna tudi Refmac5 med avtomatskim piljenjem (primer nekaj parametrov za nepopolno izpiljen model strukture je na sliki 4.8). Statistični parametri, izračunani med validacijo modela strukture, so skupaj s podatki o procesiranju difrakcijskih podatkov del t. i. Tabele 1. Slednja je dobila ime po tem, da je bila po navadi prva tabela v člankih, ki so opisovali na novo določene strukture makromolekul. Dodatek za entuziaste Za tiste, ki jih piljenje in analiza modelov strukture bioloških makromolekul posebej zanimata, bodo vsekakor zanimive karte elektronske gostote, ki jih moramo ob deponiranju samega modela strukture naložiti v zbirko PDB. V tej zbirki sta tako ob kristalnih strukturah na voljo klasična kompozitna karta elektronske gostote ter karta diferenčne elektronske gostote, na voljo so tudi koeficienti karte elektronske gostote oz. strukturni faktorji. r e š e va n j e , piljenje in validacija modela strukture 55 (a) Slika 4.8: Nekaj glavnih parametrov, s kate- rimi ovrednotimo model strukture, je prika- zanih na izhodu programa Refmac5: (a) fak- torja R in R free, r.m.s. dolžine vezi, sterične ovire (clash score) ter število aminokislinskih ostankov v nedovoljenih regijah Ramachan- dranovega diagrama. (b) Ramachandranov diagram. Glicin kot najmanjši in posledično najmanj sterično omejen aminokislinski osta- nek ni problematičen. (b) Okrajšave in simboli Okrajšave asu asimetrična enota (angl. asymmetric unit) krio-EM krio-elektronska mikroskopija (angl. cryo-electron microscopy, cryo-EM) LLG logaritem pridobljenega verjetja (angl. log likelihood gain) MR molekulska zamenjava (angl. molecular replacement) MX makromolekulska kristalografija (angl. macromolecular crystallography) NMR jedrska magnetna resonanca (angl. nuclear magnetic resonance) PDB zbirka makromolekulskih struktur, tudi format datoteke (angl. Protein Data Bank) PX proteinska kristalografija (angl. protein crystallography) RF rotacijska funkcija (angl. rotational function) TF translacijska funkcija (angl. translation function) TFZ Z-vrednost translacijske funkcije (angl. translation function Z-score) Simboli α, β, γ koti osnovne celice λ valovna dolžina ν frekvenca a, b, c dolžine stranic osnovne celice F strukturni faktor (angl. structure factor) Fc, Fcalc strukturni faktor, izračunan na osnovi modela Fo, Fobs strukturni faktor, izračunan na osnovi eksperimentalnih (opaženih) podatkov h Planckova konstanta (6, 62607004 × 10−34 m2kg/s) I intenziteta R, R f ree statistični faktor, merilo ujemanja med modelom strukture in eksperimentalnimi podatki VM Matthewsov volumen o k r a j šav e i n s i m b o l i 57 Literatura [1] H. M. Berman, “The Protein Data Bank”, Nucleic Acids Research, 28(1), 2000, str. 235–242. [2] Ka Man Yip, in sod., “Atomic-Resolution Protein Structure Determination by Cryo-EM”, Nature, 587(7832), 2020, str. 157–161. [3] C. Jelsch, in sod., “Accurate Protein Crystallography at Ultra-High Resolution: Valence Electron Distribution in Crambin”, Proceedings of the National Academy of Sciences, 97(7), 2000, str. 3171–3176. [4] Eric F Pettersen, in sod., “UCSF Chimera–a Visualization System for Exploratory Research and Analysis”, J Comput Chem, 25(13), 2004, str. 1605–12. [5] P. Emsley, in sod., “Features and Development of Coot”, Acta Crystallographica Section D Biological Crystallography, 66(4), 2010, str. 486–501. [6] Edward Tyson Reichert in Amos Peaslee Brown, The Differentiation and Specificity of Corresponding Proteins and Other Vital Substances in Relation to Biological Classification and Organic Evolution : The Crystallography of Hemoglobins, Carnegie Institute of Washington, Washington, DC, 1909. [7] William H. Brondyk, “Chapter 11 Selecting an Appropriate Method for Expressing a Recombinant Protein”, in Methods in Enzymology, Elsevier, vol. 463, 2009, str. 131–147. [8] Raymond C Stevens, “Design of High-Throughput Methods of Protein Production for Structural Biology”, Structure, 8(9), 2000, str. R177–R185. [9] Youngchang Kim, in sod., “High-Throughput Protein Purification and Quality Assessment for Crystallization”, Methods, 55(1), 2011, str. 12–28. [10] Youngchang Kim, in sod., “Automation of Protein Purification for Structural Genomics”, Journal of Structural and Functional Genomics, 5(1/2), 2004, str. 111–118. [11] Rong Xiao, in sod., “The High-Throughput Protein Sample Production Platform of the Northeast Structural Genomics Consortium”, Journal of Structural Biology, 172(1), 2010, str. 21–33. [12] Georg Mlynek, in sod., “The Center for Optimized Structural Studies (COSS) Platform for Automation in Cloning, Expression, and Purification of Single Proteins and Protein–Protein Complexes”, Amino Acids, 46(6), 2014, str. 1565–1582. [13] Joanne E. Nettleship, in sod., “Overview of a High-Throughput Pipeline for Streamlining the Production of Recombinant Proteins”, in High-Throughput Protein Production and Purification, rednik Renaud Vincentelli, Springer New York, New York, NY, vol. 2025, 2019, str. 33–49. [14] José Arnau, in sod., “Current Strategies for the Use of Affinity Tags and Tag Removal for the Purification of Recombinant Proteins”, Protein Expression and Purification, 48(1), 2006, str. 1–13. [15] Michelle E. Kimple, in sod., “Overview of Affinity Tags for Protein Purification”, Current Protocols in Protein Science, 73(1), 2013. [16] David W Wood, “New Trends and Affinity Tag Designs for Recombinant Protein Purification”, Current Opinion in Structural Biology, 26, 2014, str. 54–61. [17] David S. Waugh, “An Overview of Enzymatic Reagents for the Removal of Affinity Tags”, Protein Expression and Purification, 80(2), 2011, str. 283–293. [18] Miha Pavšič, in sod., “Crystal Structure and Its Bearing towards an Understanding of Key Biological Functions of EpCAM”, Nature Communications, 5, 2014, str. 4764. [19] Hui Sun Lee, in sod., “Effects of N-Glycosylation on Protein Conformation and Dynamics: Protein Data Bank Analysis and Molecular Dynamics Simulation Study”, Scientific Reports, 5(1), 2015, str. 8926. [20] Vishnu Priyanka Reddy Chichili, in sod., “Linkers in the Structural Biology of Protein-Protein Interactions.”, Protein Science, 22(2), 2013, str. 153–167. [21] Xiaoying Chen, in sod., “Fusion Protein Linkers: Property, Design and Functionality”, Adv Drug Deliv Rev, 65(10), 2013, str. 1357–69. l i t e r at u r a 59 [22] Zygmunt S. Derewenda in Adam Godzik, “The "Sticky Patch"Model of Crystallization and Modification of Proteins for Enhanced Crystallizability.”, Methods in molecular biology (Clifton, NJ), 1607, 2017, str. 77–115. [23] Michael S. Packer in David R. Liu, “Methods for the Directed Evolution of Proteins”, Nature Reviews Genetics, 16(7), 2015, str. 379–394. [24] Miha Pavšič, “(Po)Moč Evolucije. Nobelova Nagrada Za Kemijo”, Proteus, 81(2), 2018, str. 102–108. [25] Darren J. Hart in Franck Tarendeau, “Combinatorial Library Approaches for Improving Soluble Protein Expression in Escherichia Coli”, Acta Crystallographica Section D Biological Crystallography, 62(1), 2006, str. 19–26. [26] Shohei Koide, “Engineering of Recombinant Crystallization Chaperones”, Current Opinion in Structural Biology, 19(4), 2009, str. 449–457. [27] Magdalena A Bukowska in Markus G Grütter, “New Concepts and Aids to Facilitate Crystallization”, Current Opinion in Structural Biology, 23(3), 2013, str. 409–416. [28] Peer RE Mittl, in sod., “Chaperone-Assisted Structure Elucidation with DARPins”, Current Opinion in Structural Biology, 60, 2020, str. 93–100. [29] Zygmunt S. Derewenda, “Rational Protein Crystallization by Mutational Surface Engineering”, Structure, 12(4), 2004, str. 529–535. [30] Lukasz Goldschmidt, in sod., “Toward Rational Protein Crystallization: A Web Server for the Design of Crystallizable Protein Variants.”, Protein Science, 16(8), 2007, str. 1569–1576. [31] Thomas S Walter, in sod., “Lysine Methylation as a Routine Rescue Strategy for Protein Crystallization.”, Structure (London, England : 1993), 14(11), 2006, str. 1617–1622. [32] Min-Sung Kim in Dan Leahy, “Enzymatic Deglycosylation of Glycoproteins”, in Methods in Enzymology, Elsevier, vol. 533, 2013, str. 259–263. [33] Lukasz Kurgan, in sod., “CRYSTALP2: Sequence-Based Protein Crystallization Propensity Prediction”, BMC Structural Biology, 9(1), 2009, str. 50. [34] György Babnigg in Andrzej Joachimiak, “Predicting Protein Crystallization Propensity from Protein Sequence.”, Journal of structural and functional genomics, 11(1), 2010, str. 71–80. [35] Marcin J. Mizianty in Lukasz Kurgan, “Sequence-Based Prediction of Protein Crystallization, Purification and Production Propensity”, Bioinformatics, 27(13), 2011, str. i24–i33. [36] Samad Jahandideh, in sod., “Improving the Chances of Successful Protein Structure Determination with a Random Forest Classifier”, Acta Crystallographica Section D Biological Crystallography, 70(3), 2014, str. 627–635. [37] Lukasz Slabinski, in sod., “XtalPred: A Web Server for Prediction of Protein Crystallizability.”, Bioinformatics, 23(24), 2007, str. 3403–3405. [38] Jun Hu, in sod., “TargetCrys: Protein Crystallization Prediction by Fusing Multi-View Features with Two-Layered SVM”, Amino Acids, 48(11), 2016, str. 2533–2547. [39] Huilin Wang, in sod., “PredPPCrys: Accurate Prediction of Sequence Cloning, Protein Production, Purification and Crystallization Propensity from Protein Sequences Using Multi-Step Heterogeneous Feature Fusion and Selection”, PLoS ONE, 9(8), 2014, str. e105902. [40] Huilin Wang, in sod., “Crysalis: An Integrated Server for Computational Analysis and Design of Protein Crystallization”, Sci Rep, 6, 2016, str. 21383. [41] Huilin Wang, in sod., “Critical Evaluation of Bioinformatics Tools for the Prediction of Protein Crystallization Propensity.”, Briefings in Bioinformatics, 19(5), 2018, str. 838–852. [42] Fanchi Meng, in sod., “fDETECT Webserver: Fast Predictor of Propensity for Protein Production, Purification, and Crystallization”, BMC Bioinformatics, 18(1), 2017, str. 580. [43] Abdurrahman Elbasir, in sod., “DeepCrystal: A Deep Learning Framework for Sequence-Based Protein Crystallization Prediction.”, Bioinformatics (Oxford, England), 35(13), 2019, str. 2216–2225. [44] Abdurrahman Elbasir, in sod., “BCrystal: An Interpretable Sequence-Based Protein Crystallization Predictor”, Bioinformatics, 36(5), 2020, str. 1429–1438. [45] L. Chen, in sod., “TargetDB: A Target Registration Database for Structural Genomics Projects”, Bioinformatics, 20(16), 2004, str. 2860–2862. [46] Jack Kyte in Russell F. Doolittle, “A Simple Method for Displaying the Hydropathic Character of a Protein”, Journal of Molecular Biology, 157(1), 1982, str. 105–132. [47] J.J. Ward, in sod., “Prediction and Functional Analysis of Native Disorder in Proteins from the Three Kingdoms of Life”, Journal of Molecular Biology, 337(3), 2004, str. 635–645. [48] David T Jones, “Protein Secondary Structure Prediction Based on Position-Specific Scoring Matrices 1 1Edited by G. Von Heijne”, Journal of Molecular Biology, 292(2), 1999, str. 195–202. 60 m a k ro m o l e k u l s k a k r i s ta l o g r a f i ja [49] A. Lupas, in sod., “Predicting Coiled Coils from Protein Sequences”, Science, 252(5009), 1991, str. 1162–1164. [50] Anders Krogh, in sod., “Predicting Transmembrane Protein Topology with a Hidden Markov Model: Application to Complete genomes11Edited by F. Cohen”, Journal of Molecular Biology, 305(3), 2001, str. 567–580. [51] Dariusz Plewczynski, in sod., “The RPSP: Web Server for Prediction of Signal Peptides”, Polymer, 48(19), 2007, str. 5493–5496. [52] John C. Wootton, “Non-Globular Domains in Protein Sequences: Automated Segmentation Using Complexity Measures”, Computers & Chemistry, 18(3), 1994, str. 269–285. [53] J. Jancarik in S. H. Kim, “Sparse Matrix Sampling: A Screening Method for Crystallization of Proteins”, Journal of Applied Crystallography, 24(4), 1991, str. 409–411. [54] Richard Giegé, “A Historical Perspective on Protein Crystallization from 1840 to the Present Day.”, The FEBS journal, 280(24), 2013, str. 6456–6497. [55] Bernhard Rupp, Biomolecular Crystallography: Principles, Practice, and Application to Structural Biology, Garland Science, New York, 2010. [56] Dale E Tronrud, “Introduction to Macromolecular Refinement.”, Acta crystallographica Section D, Biological crystallography, 60(Pt 12 Pt 1), 2004, str. 2156–2168. [57] Gerard J. Kleywegt, “Validation of Protein Crystal Structures”, Acta Crystallographica Section D Biological Crystallography, 56(3), 2000, str. 249–265. [58] Paul Emsley in Kevin Cowtan, “Coot: Model-Building Tools for Molecular Graphics.”, Acta crystallographica Section D, Biological crystallography, 60(Pt 12 Pt 1), 2004, str. 2126–2132. [59] O Carugo in D Bordo, “How Many Water Molecules Can Be Detected by Protein Crystallography?”, Acta crystallographica Section D, Biological crystallography, 55(Pt 2), 1999, str. 479–483. [60] Martyn D. Winn, in sod., “Overview of the CCP4 Suite and Current Developments”, Acta Crystallographica Section D Biological Crystallography, 67(4), 2011, str. 235–242. [61] Dorothee Liebschner, in sod., “Macromolecular Structure Determination Using X-Rays, Neutrons and Electrons: Recent Developments in Phenix”, Acta Crystallographica Section D Structural Biology, 75(10), 2019, str. 861–877. Document Outline Uvod Kaj je struktura? Določanje 3D strukture makromolekul Navodila za bralca Ostale informacije Od ideje do strukture Pregled Pot do kristalne strukture Načrtovanje proteinskih konstruktov Pridobivanje proteinov za kristalizacijo Rekombinantni proteini Načrtovanje konstruktov in modifikacij Ocena kristalizabilnosti Vaja 1: Načrtovanje proteinskih konstruktov Kristalizacija Proces kristalizacije Praktična izvedba kristalizacije Kristalizacijski presejalni testi Zanimiva dodatna literatura Vaja 2: Kristalizacija lizocima Snemanje in procesiranje difrakcijskih podatkov Priprava kristalov za difrakcijsko analizo Snemanje difrakcijskih podatkov Procesiranje difrakcijskih podatkov Vaja 3: Snemanje in procesiranje difrakcijskih podatkov Reševanje, piljenje in validacija modela strukture Povezava med difrakcijskimi podatki in strukturo Določitev faz sipanih žarkov Asimetrična enota in njena sestava Gradnja modela strukture v praksi Ocenjevanje kvalitete modela strukture Validacija modela strukture Vaja 4a: Ročno piljenje modela strukture v grafičnem okolju Vaja 4b: Reševanje strukture človeške karbonske anhidraze II Okrajšave in simboli Literatura