Uporaba računalniške kemije pri načrtovanju in iskanju novih spojin vodnic The use of computational chemistry in the design and screening of novel lead compounds Andrej Perdih, Miha Kotnik, Marko Oblak, Tomaž Šolmajer Povzetek: V zadnjih letih je intenzivno potekal razvoj računalniške kemije, ki je postala sestavni del odkrivanja novih zdravilnih učinkovin tako v farmacevtski industriji kot v akademskih institucijah. V prispevku je predstavljen pregled nekaterih pomembnejših metodologij, ki so se uveljavile v tem procesu, predvsem načrtovanje, izhajajoče iz strukture ligandov, in načrtovanje na osnovi strukture tarče. Komplementarne mehanistične študije z uporabo in silico metod (molekulska dinamika, QM/MM računi) omogočajo še učinkovitejše iskanje spojin vodnic. Ključne besede: računalniško podprto načrtovanje učinkovin, virtualno rešetanje, načrtovanje učinkovin na osnovi fragmentov, molekulsko sidranje, farmakoforna hipoteza, molekulsko modeliranje Abstract: In the last years an intensive development of computational chemistry grew to become an integral part of the drug discovery programs in major pharmaceutical industry as well as in the academia. In this review an overview of the computational methodologies which have found application in this process is presented. In particular, ligand-based drug design and structure-based drug design techniques are discussed. Furthermore, complementary mechanism-based in silico studies (molecular dynamics, QM/MM calculations) enable even more efficient discovery of novel lead compounds. Keywords: computer-assisted drug design, virtual screening, fragment-based drug design, molecular docking, pharmacophore hypothesis, molecular modeling 1 Uvod V zadnjem desetletju so bila registrirana prva zdravila, katerih učinkovine so bile pridobljene s pomočjo principa računalniško podprtega načrtovanja učinkovin (CADD = computer-assisted drug design). Med pomembnejšimi dosežki CADD velja omeniti inhibitorje HIV proteaze (nelfinavir, amprenavir in lopinavir), nevraminidaze (zanamivir in oseltamivir), trombina (ksimelagatran in dabigatran) ter zdravilno učinkovino za zdravljenje kronične mieloidne levkemije, imatinib (1, 2). V sodobnem pristopu racionalnega načrtovanja in iskanja novih zdravilnih učinkovin hkrati uporabljamo eksperimentalne tehnike (eksperimentalno rešetanje) in metode računalniške kemije CADD, imenovane tudi in silico rešetanje, ki so shematsko predstavljene na sliki 1 (1). Virtualno rešetanje (VS - virtual screening) je komplementaren pristop k eksperimentalnemu rešetanju visokih zmogljivosti (HTS - high- throughput screening) in predstavlja in silico iskanje biološko aktivnih molekul v obširnih podatkovnih (kombinatornih) knjižnicah sintetiziranih in/ali virtualnih spojin (3). V nasprotju s HTS, kjer dejansko testiramo aktivnost več deset ali sto tisoč spojin oz. fragmentov iz dostopnih knjižnic, pri virtualnem rešetanju z uporabo in silico metod iz knjižnic najprej izberemo manjše število potencialno aktivnih spojin (do tisoč) in jih nato ovrednotimo z biološkimi testi. Tak pristop lahko bistveno skrajša in poceni začetne faze raziskav. Glavna računalniška orodja in algoritmi za virtualno rešetanje so povzeti na sliki 2 in jih delimo v dve skupini: načrtovanje na osnovi ligandov (LBDD - ligand-based drug design) (4) in načrtovanje na osnovi strukture tarče (SBDD - structure-based drug design, tudi TBDD - target-based drug design) (5, 6). V idealnem primeru, ko imamo na razpolago tako 3D strukturo tarčnega sistema kot tudi znanje o aktivnih spojinah oz. naravnih ligandih, lahko uporabimo kombinacijo obeh temeljnih pristopov racionalnega načrtovanja učinkovin (3, 5, 6). Poleg omenjenih pristopov pri asist. dr. Andrej Perdih, mag. farm. Kemijski institut, Hajdrihova 19, 1001 Ljubljana dr. Miha Kotnik, mag. farm. Lek d.d. Verovškova 57, 1526 Ljubljana dr. Marko Oblak, univ. dipl. kem. Lek d.d. Verovškova 57 ,1526 Ljubljana prof. dr. Tomaž Solmajer, univ. dipl. fiz. Kemijski institut, Hajdrihova 19, 1001 Ljubljana Slika 1: Pristop racionalnega načrtovanja zdravilnih učinkovin. a) Eksperimentalno rešetanje: Določamo biološko aktivnost na preiskovano tarčo več deset ali sto tisoč spojinam oz. fragmentom iz dostopnih knjižnic s pomočjo različnih eksperimentalnih tehnik kot so: rešetanje visokih zmogljivosti (HTS), metode jedrske magnetne resonance (NMR) in masne spektroskopije (MS) ter načrtovanje na osnovi fragmentov (FBLD) b) In silico rešetanje: Uporaba metod računalniške kemije za preiskovanje virtualnih knjižnic spojin bodisi na osnovi poznanih ligandov (LBDD) bodisi na osnovi poznavanja strukture tarče (SBDD). Figure 1: Scheme of the rational drug design approach. a) Experimental screening: Thousands of compounds from the available libraries are tested for potential biological activity against its target using diverse experimental screening techniques: high-throughput screening (HTS), methods based on nuclear magnetic resonance (NMR) and mass spectroscopy (MS) as well as fragment-based lead discovery (FBLD) approach. b) In silico screening: By using computational chemistry tools, libraries of virtual compunds are screened for potential hit compounds exploiting either ligand-based drug design (LBDD) or structure-based drug design (SBDD) approach. racionalnem načrtovanju študiramo tudi povezave med strukturo aktivnih molekul in njihovim delovanjem (SAR - Structure-Activity Relationship in QSAR - Quantitative Structure-Activity Relationship). Te korelacije omogočajo vpogled v strukturne elemente, ki so odgovorni za aktivnost, in lahko nadalje usmerjajo tako eksperimentalno kot tudi in silico optimizacijo spojin vodnic (slika 1) (7). Izbor možnih spojin vodnic ne poteka le na osnovi podobnosti z aktivnimi spojinami oz. komplementarnosti in ustrezni umestitvi v aktivno mesto tarče, temveč tudi glede na različne lastnosti spojin. Tako ponavadi že v zgodnjih fazah VS vse preiskovane spojine v knjižnicah ovrednotimo z različnimi filtri, ki število možnih zadetkov občutno znižajo. Eden izmed prvih uporabljenih filtrov je tako imenovan filter REOS (Rapid Elimination of Swill), s pomočjo katerega izločimo spojine, ki so prevelike, preveč fleksibilne ter vsebujejo neželene funkcionalne skupine (3, 6). Pogosto uporabljeni filter je tudi pravilo Lipinskega (pravilo petic) (ROF = Rule of Five) (8), ki sloni na štirih omejitvah: (i) da mora imeti spojina molekulsko maso manj kot 500 Da, (ii) manj kot 10 akceptorjev H-vezi, (iii) manj kot 5 donorjev H-vezi ter (iv) vrednost porazdelitvenega koeficienta oktanol/voda manj kot 5. Pravilo Lipinskega ne velja za učinkovine, ki v celico ne prehajajo s pasivnim transportom, kot so npr. nekateri antibiotiki in antimikotiki (8). Dodatne filtre predstavljajo izračunane ADME lastnosti (absorpcija, porazdelitev, metabolizem in izločanje), ki za samo vezavo molekule v aktivno mesto niso pomembne, so pa odločilnega pomena v poznejših fazah razvoja učinkovin. Tako mora spojina kandidatka zadostiti pogoju zadostne vodotopnosti, izkazati pa mora tudi ustrezne lastnosti glede na pasivno absorpcijo, prehod hematoencefalne bariere, vezavo na plazemske albumine in drugo. Vedno bolj se uveljavlja tudi in silico modeliranje toksičnosti in metabolizma (9). Na področju eksperimentalnega rešetanja se je v zadnjih letih zelo uveljavilo načrtovanje zdravilnih učinkovin na osnovi fragmentov (Fragment-based lead discovery (FBLD)), ki je predstavljeno na sliki 3 (10). Tu rešetamo manjše knjižnice fragmentov - spojin z molekulskimi masami do 200 Da. Z uporabo različnih eksperimentalnih tehnik (NMR ali proteinske kristalografije (11)) identificiramo fragmente, ki se prilegajo posameznim regijam v aktivnem mestu receptorja. Z ustrezno povezavo fragmentov z vmesniki (»linkerji«) nato afiniteto znatno izboljšamo ter dobimo spojine vodnice. Izkazalo se je, da je možno uporabiti te ideje tudi za virtualno fragmentno načrtovanje. V primerjavi s klasičnim HTS pristopom je za FBLD značilno, da potrebujemo v začetnih stopnjah le manjše knjižnice fragmentov. Slika 2: Različni pristopi virtualnega rešetanja. a) Načrtovanje učinkovin na osnovi ligandov (LBDD): ligand z znano aktivnostjo nam omogoči, da izbiramo med različnimi orodji na osnovi strukture liganda, kot je npr. iskanje po podobnosti (»prstni odtis molekule«) in iskanje podstrukturnih elementov. V uporabi je tudi kompleksnejše 3D farmakoforno iskanje, ki lahko vključuje še primerjavo molekulskih površin oz. volumnov. b) Načrtovanje učinkovin na osnovi strukture tarče (SBDD): v primeru znane 3D strukture tarče je učinkovito orodje molekulsko sidranje z uporabo cenilnih funkcij (3). Figure 2: Different methods for virtual screening. a) Ligand-based drug design (LBDD): Ligand with known activity enables the use of various tools based on its structure e.g., similarity search (»molecular fingerprints«) and substructure search. Popular tools include more complex 3D pharmacophore models and comparison of molecular surfaces and volumes. b) Structure-based drug design (SBDD): Molecular docking and scoring is applied when 3D structure of the target is available (3). Slika 3: Princip fragmentnega iskanja spojin vodnic (FBLD), kjer z identifikacijo posameznih fragmentov, ki jih nato povežemo med seboj v spojino vodnico, lahko izboljšamo vezavno konstanto liganda iz začetnega šibkega milimolarnega (mM) do nanomolarnega (nM) območja. Figure 3: Fragment-based lead discovery (FBLD) can improve the initial single fragment affinity from milimolar (mM) to nanomolar (nM) range by identifying additional small fragments which are subsequently connected into a potent lead compound. 2 Knjižnice spojin Knjižnice spojin, v katerih iščemo potencialno zanimive spojine, so bodisi stvarne (komercialne ali korporativne knjižnice dostopnih molekul) bodisi virtualne. Pomembne so tudi knjižnice majhnih fragmentov s spojinami z manjšo molekulsko maso (do okoli 200 Da). Pri načrtovanju in izgradnji virtualnih knjižnic je potrebno paziti, da je načrtovane spojine sploh možno sintetizirati, kar pa je ob poznavanju ustreznih sinteznih poti z novejšimi programi za načrtovanje knjižnic že izvedljivo. Pomembna je tudi pravilna obravnava protoniranja, kiralnosti in tavtomernih oblik (12). Glede na namen poznamo: splošne knjižnice spojin, ki so namenjene rešetanju na različnih tarčah in vsebujejo veliko število strukturno najbolj raznolikih spojin (več milijonov). Ciljane (targeted) knjižnice so namenjene družinam sorodnih tarč (npr. kinaze) ali pa specifični tarči (npr. CDK kinaza), medtem ko usmerjene (focused) knjižnice spojin poskušajo čim bolje zapolniti soroden kemijski prostor glede na identificirano spojino vodnico (6,12). 3 Načrtovanje in rešetanie na osnovi ligandov (LBDD) Najpreprostejše virtualno rešetanje podatkovnih zbirk spojin je iskanje podstrukturnih analogov (slika 2), a je računalniška izvedba precej zapletena, saj zahteva primerjavo vseh atomov in vezi v molekulah iz zbirke z zahtevano iskano podstrukturo (4). Zapis 2D kemijske strukture molekule je možen na več načinov: (i) s povezovalno tabelo in molekulskim grafom opišemo tipe kemijskih vezi med posameznimi atomi v molekuli, (ii) dvodimenzionalno strukturo lahko predstavimo tudi z vrstičnim nizom znakov (npr. s kodo SMILES ali SLN) in (iii) z molekulskimi "prstnimi odtisi". Slednji so približno 100-bitni binarni zapisi strukturnih elementov molekule, kot so obročni skeleti, razvejanost sekundarne strukture in položaj heteroatomov. Rezultat iskanja podstruktur je niz spojin (zadetkov), ki so sorodne začetni izbrani (pod)strukturi liganda (3, 4). Podobnost med dvema spojinama ocenjujemo z matematičnimi algoritmi, kot so kosinusni koeficient, Evklidova razdalja in Tanimotov koeficient (13). Metode za določanje podobnosti med tridimenzionalno strukturo molekul poleg topoloških značilnosti molekul upoštevajo tudi ustrezno razporeditev funkcionalnih skupin oz. njihovih izosterov v prostoru (slika 2). V uporabi so programi, ki molekule primerjajo tako, da 3D strukturo aktivne (referenčne) molekule prekrijejo s testno molekulo v njenih različnih konformacijah, nato pa s pomočjo ocene podobnosti rangirajo izračunane konformacije. Pri tem je referenčna molekula lahko bodisi rigidna bodisi fleksibilna, medtem ko je testna molekula vedno obravnavana fleksibilno. V ta namen se ponavadi poslužujemo generatorjev tridimenzionalnih struktur. Poznamo tudi metode, ki temeljijo na izračunu specifičnih lastnosti v vseh točkah mreže, ki jo zgradimo okoli 3D strukture aktivne molekule. Testno in referenčno molekulo med seboj primerjamo tako, da molekuli ali pa pripadajoča polja z mrežami prekrijemo v 3D prostoru. Molekule lahko med seboj primerjamo tudi na osnovi površin okoli 3D strukture referenčne molekule, ki izvira iz tridimenzionalne strukture kompleksa tarče z ligandom dobljenega na osnovi rentgenske kristalografije (3). Pogosto molekule med seboj primerjamo na osnovi njihovih farmakoforov. Farmakofor definiramo kot zbirko steričnih in elektronskih lastnosti, ki so potrebne za zagotovitev optimalnih molekularnih interakcij s specifično biološko tarčo, kar vodi do biološkega odziva (14). Farmakofor nikoli ne predstavlja zbirke konkretnih funkcionalnih skupin, ampak ključne lastnosti molekule predstavi s farmakofornimi elementi. To so točke v prostoru, obdane z določenim tolerančnim radijem (npr. ionski center, hidrofobna interakcija, sterična omejitev, aromatski obroč itd.), v katerih se nahaja fragment preiskovane molekule, da izkazuje enake lastnosti kot fragment referenčne molekule (slika 2). Pri donorjih in akceptorjih vodikove vezi kot farmakofornih elementih moramo poleg tolerančnega radija upoštevati še usmerjenost H-vezi v prostoru, zato moramo dodati še geometrijsko omejitev, ki omogoča tvorbo H-vezi le pri določenih vrednostih interakcijskega kota (3, 14, 15). Farmakoforno hipotezo ustvarimo na osnovi molekul (llgandov) z znanimi biološkimi aktivnostmi, kjer s primerjavo 3D struktur aktivnih ligandov določimo skupna funkcionalna področja in pripadajoče farmakoforne elemente. V farmakoforno hipotezo lahko vključimo tudi skupno površino prekritih ligandov, ali položaj v prostoru, ki naj ga iskane spojine ne zasedejo. Izključitvena mesta in celotno farmakoforno hipotezo lahko zgradimo na osnovi strukture receptorja, na katerem moramo prepoznati ključna interakcijska mesta (14). V tem primeru govorimo o strukturnih farmakoforih (structure-based pharmacophores). Tako dobljene farmakoforne hipoteze lahko uporabimo za razlago odnosa med strukturo in aktivnostjo (SAR) ter za in silico virtualno rešetanje. Za VS s farmakofornimi hipotezami potrebujemo podatkovne zbirke spojin, v katerih so poleg 2D struktur zapisane tudi 3D konformacije molekul (15). Spojina ustreza farmakoforni hipotezi, če vsebuje ustrezno prostorsko porazdeljen niz funkcionalnih skupin. Komercialno dostopni programi za farmakoforno modeliranje (npr. Catalyst, DISCO, GASP in LigandScout) se med seboj razlikujejo v algoritmih, ki jih uporabljajo za prekrivanje spojin, ter v načinu obravnavanja fleksibilnosti (konformacij) ligandov (16, 17). 4 Načrtovanje in rešetanje na osnovi strukture tarče (SBDD) Če je tridimenzionalna struktura tarče znana, je največkrat uporabljena metoda virtualnega rešetanja podatkovnih zbirk spojin sidranje molekul v aktivno mesto receptorja in ocena vezavne afinitete sidranih konformacij. Poleg strukture molekul in aktivnega mesta je potreben iskalni algoritem, ki pravilno umesti ligande v aktivno mesto, in cenilna funkcija (scoring function) za izbiro pravega rezultata (slika 4) (6, 18). Ta princip uporabljamo v procesu virtualnega rešetanja (19-22) in za interpretiracijo biološke aktivnosti molekul (23-26). Pogosto sidranje kombiniramo z virtualnim rešetanjem z uporabo farmakoforov (27). Eksperimentalni podatek o 3D strukturi tarče lahko pridobimo s pomočjo rentgenske (X-ray) kristalografije ali s pomočjo jedrske magnetne resonance (NMR) (1, 28). Če je izbrani tarčni protein, pri katerem struktura ni znana, po primarni strukturi soroden proteinu z že znano eksperimentalno določeno 3D strukturo (ponavadi najmanj 30 % identičnih aminokislinskih ostankov), lahko njegovo 3D strukturo tudi napovemo z uporabo teoretičnih metod. Rezultate modeliranja na osnovi homologije (homology modeling) pa je potrebno uporabljati s previdnostjo, saj ne morejo nadomestiti eksperimentalnih podatkov (6). Strukturni podatki, dobljeni s pomočjo kristalografije visoke ločljivosti, so zaenkrat najbolj uporabni za načrtovanje novih učinkovin (28). Kristalne strukture spojin vodnic z izbrano tarčo prav tako igrajo ključno vlogo pri nadaljnjem ciklu optimizacije (29-33). 4.1 Molekulsko sidranje Številni programi za molekulsko sidranje se med seboj razlikujejo v iskalnih algoritmih za obravnavo fleksibilnosti liganda in možnostih fleksibilne obravnave receptorja (preglednica 1) (5, 6, 18). Najpopolnejšo obravnavo fleksibilnosti liganda omogočajo sistematični iskalni algoritmi, ki poskušajo upoštevati vse prostostne stopnje molekule. Zaradi problema kombinatorične eksplozije števila možnih konformacij pa večina algoritmov uporablja poenostavitve. Možna poenostavitev je inkrementna izgradnja liganda v vezavnem mestu med samim procesom sidranja ali pa generiranje konformacijskih knjižnic ligandov že pred začetkom sidranja. Slednje lahko izračunamo s pomočjo stohastičnih pristopov, ki naključno spreminjajo konformacijo liganda (metoda Monte Carlo, genetski algoritmi), ali pa s pomočjo simulacijskih pristopov (molekulska dinamika) (34). V nasprotju z ligandom je med sidranjem aktivno mesto proteina največkrat statično, čeprav se razvijajo nove metode, ki tudi protein obravnavajo fleksibilno (35). Najpogosteje se pri tem uporabljajo molekulska dinamika, Monte Carlo simulacije ter knjižnice rotamerov Slika 4: Shematski prikaz metode molekulskega sidranja. Za izbrano tridimenzionalno strukturo tarče iskalni algoritem izračuna možne orientacije (vezavne geometrije) liganda v aktivnem mestu. Izračunane geometrije kompleksa ocenimo z izbrano cenilno funkcijo. Figure 4: Schematic representation of molecular docking method. For the target with known structure the search algorithm computes the conformations of the ligand which would fit in the protein active site. The determined geometry of the complex is then evaluated by a selected scoring function. ali pa več različnih eksperimentalno določenih struktur istega proteina. V postopek sidranja lahko vključimo tudi vpliv topila, kar omogoči realnejšo obravnavo procesa vezave, a žal precej podaljša čas računanja (35). Preglednica 1: Seznam nekaterih računalniških programov za molekulsko sidranje (5, 18), Table 1: A list of commonly used molecular docking programs (5, 18), Program Algoritem za obravnavo fleksibilnosti liganda Fleksibilnost proteina Lit. AutoDock Monte Carlo, genetski algoritem ne (36) CHARMM* molekulska dinamika da (37) DOCK inkrementna izgradnja ne (38) FlexE inkrementna izgradnja da (39) FlexX inkrementna izgradnja ne (40) Glide Monte Carlo, genetski algoritem ne (41) Gold genetski algoritem ne (42) LigandFit Monte Carlo ne (43) LUDI* inkrementna izgradnja ne (44) "CHARMM in LUDI nista primerna za VS velikega števila spojin Poleg hitrosti je ključni kriterij vrednotenja iskalnega algoritma kvaliteta prileganja izračunane konformacije liganda v primerjavi z eksperimentalno določeno strukturo v kompleksu. Te primerjave naredimo na osnovi RMSD parametra (root-mean square distance), ki predstavlja kvantitativno oceno povprečnega odmika dveh primerjanih konformacij izraženo v A . Velja ocena, da naj bi bil RMSD med sidrano in eksperimentalno konformacijo liganda manjši od 2 A (45). 4.2 Cenilne funkcije Če želimo identificirati spojine, ki bodo v eksperimentalnih testih izkazovale interakcijo s tarčo (npr. inhibicijo encima), je pomembno pravilno rangiranje napovedanih konformacij ligandov v vezavnem mestu. V ta namen uporabljamo cenilne funkcije za napoved afinitete, ki bi v idealnem primeru morale biti zanesljive, natančne, hitre, robustne in fizikalno osnovane, vendar zaradi številnih poenostavitev in uporabe približkov teh ciljev v veliki meri ne dosegajo (46). Pri fizikalno zasnovanih metodah za napovedovanje vezave izračunamo proste energije vezave ligandov Gvezave. Pri tem uporabimo princip termodinamskih ciklov, za katere velja, da je prosta energija kot funkcija stanja neodvisna od poti (47, 48). Najbolj znani metodi iz tega sklopa sta metoda perturbacije proste energije (FEP = Free Energy Perturbation) ter termodinamska integracija (TI = Thermodynamic Integration), ki pa zaradi svoje časovne zahtevnosti nista primerni za vrednotenje velikega števila kompleksov ligand-protein v postopku VS (47). Učinkovito poenostavitev predstavlja metoda linearne interakcijske energije (Linear Interaction Energy - LIE), ki omogoča manj rigorozno, toda še vedno natančno določitev proste energije vezave (49, 50). Tudi tu prosto energijo vezave izračunamo kot spremembo proste energije liganda, ko preide iz kapljevine (prosto stanje - free state) v vezavno mesto na encimu (vezano stanje - bound state), a uporabimo empiričen izračun povprečne interakcijske energije. Tako bistveno zmanjšamo potreben računski čas, odpravimo pa tudi možne probleme s konvergenco, kar je slabost rigoroznejših metod (48). V programih za molekulsko sidranje se sicer večinoma uporabljajo cenilne funkcije (preglednica 2), ki temeljijo na empiričnih principih: cenilne funkcije, ki temeljijo na polju sil (force-field-based), empirične cenilne funkcije (empirical) in cenilne funkcije, dobljene s pomočjo statistične mehanike (knowledge-based) (46, 51). Cenilne funkcije, ki temeljijo na polju sil, ocenijo interakcijo liganda v kompleksu kot vsoto van der Waalsovih in elektrostatskih členov, ki ji lahko dodamo še empirično izračunane solvatacijske prispevke. Njihova slabost je predvsem v neupoštevanju entropijskih prispevkov, ki jih skušajo v novejših različicah odstraniti z uporabo dodatnih členov (38, 42). Empirične cenilne funkcije so osnovane na eksperimentalno določenih kompleksih protein-ligand. Vezavna energija je izražena kot utežena vsota različnih členov (npr. za opis H-vezi, hidrofobnih interakcij, interakcij s kovinskimi ioni ipd.). Koeficiente posameznih členov dobimo iz eksperimentalnih podatkov s pomočjo regresijske analize. Pri uporabi moramo pazljivo oceniti prenosljivost teh funkcij na ligande iz drugih strukturnih razredov, ki niso bili uporabljeni v regresijskih analizah (40, 52-55). V ta razred sodi tudi cenilna funkcija na osnovi kemometrijskega pristopa s kvantnokemijskim izračunom interakcij ligandov (56-58). Preglednica 2: Seznam nekaterih standardnih cenilnih funkcij pri VS, Table 2: A list of standard scoring functions used in VS, Cenilna funkcija Metoda Lit. DOCK-score potencialno polje, empirična prosta energija vezave (38) GOLD-score potencialno polje, empirična prosta energija vezave (42) FlexX-score empirična prosta energija vezave (40) ChemScore empirična prosta energija vezave (53) LUDI-score empirična prosta energija vezave (54) PLP-score empirična prosta energija vezave (55) PMF-score termodinamsko potencialno polje povprečne srednje sile (59) DrugScore termodinamsko potencialno polje povprečne srednje sile (60) CScore ocena soglasja (61) Cenilne funkcije, ki so del programov za molekulsko sidranje, omogočajo približno oceno realnega procesa vezave, saj le delno upoštevajo entropijski prispevek pri vezavi in ne upoštevajo, da je prosta energija vezave kot vsaka termodinamska količina povprečje večih stanj, dosegljivih obravnavnemu sistemu. Zato je njihova zanesljivost navadno ustrezna le na izbranem nizu molekul. Zato so za vrednotenje cenilnih funkcij vpeljali postopek, kjer večjemu številu neaktivnih spojin dodamo manjše število aktivnih inhibitorjev. Dobra cenilna funkcija mora prepoznati aktivne inhibitorje iz take zbirke spojin, jih čimbolje oceniti in pri tem izbrati čim manj neaktivnih spojin. To ocenjujemo z dvema kriterijema: uspešnost (hit rate) in faktor obogatitve (EF-enrichment factor) (45, 61). Tretji razred cenilnih funkcij predstavljajo funkcije, dobljene z uporabo principov statistične mehanike na eksperimentalno določenih strukturah kompleksov ligand-receptor. Temeljijo na prepostavki, da so medatomske razdalje, ki se pogosteje pojavljajo v kompleksih, ugodnejše od drugih razdalj. S statističnim vrednotenjem frekvenc razdalj med vsemi možnimi pari tipov atomov liganda in proteina dobimo preproste parne potenciale atomskih interakcij (59, 60). Ocena na osnovi soglasja (consensus scoring), to je ocenjevanje z več cenilnimi funkcijami hkrati, lahko zmanjša število napačno ocenjenih zadetkov pri VS. V primeru mikromolarnih inhibitorjev p38 MAP kinaze so pokazali, da je uspešnost ene cenilne funkcije 9 %, medtem ko je bila uspešnost pri oceni soglasja treh cenilnih funkcij 29 % (62). 5 Mehanistične študije tarče z uporabo računalniške kemije za učinkovitejše iskanje spojin vodnic Racionalno načrtovanje zdravilnih učinkovin, ki temelji na uporabi statičnih eksperimentalnih tridimenzionalnih struktur, pogosto neustrezno obravnava proteinske tarče, ki imajo precejšnjo interno dinamiko (npr. premiki proteinskih zank, vrtenje domen itd). V tem primeru računska obravnava fleksibilnosti lahko pomaga pri izboru uporabljenih proteinskih struktur pri virtualnem rešetanju. Najpogosteje uporabljana metodologija za modeliranje konformacijskih prehodov je molekulska dinamika. Časovna skala, na kateri se konformacijske spremembe v proteinih dogajajo ( s do ms), predstavlja glavno oviro pri aplikaciji običajnih algoritmov molekulske dinamike, kjer je časovni korak, s katerim opisujemo gibanje, za več redov velikosti krajši (63). Zato uporabimo metode molekulske dinamike, ki take prehode pospešijo, da se zgodijo v bistveno krajšem simulacijskem času. Takim metodam pravimo »biased« metode, saj uvedejo spremembo ali omejitev, ki med simulacijo sistem usmerja iz začetnega v končno stanje (64-66). 5 študijem mehanizma encimskih procesov lahko pridobimo podatke o strukturi ključnih intermediatov med reakcijo. V procesih, kjer pride do cepitve ali tvorbe kemijskih vezi, je potrebno uporabiti pristope kvantne kemije, saj uporaba empiričnega opisa sistema z metodo molekulske mehanike (MM) ne zadostuje. Ker velikih makromolekularnih sistemov zaradi računske zahtevnosti ne moremo v celoti obravnavati na nivoju kvantne kemije, so se razvili mešani kvantnomehansko-molekulskomehanski (QM/MM) pristopi, kjer razdelimo sistem na dva dela: aktivno mesto encima obravnavamo s kvantnomehanskim (QM) opisom, preostali sistem pa opišemo z empiričnim poljem sil (molekulsko mehaniko MM). (67, 68). Zahteve po velikih računalniških zmogljivostih, ki so povezane z uporabo QM/MM metod, so bile vzrok, da so te metode šele v zadnjih letih prisotne na področju načrtovanja zdravilnih učinkovin (69). 6 Sklep Uporaba metod računalniške kemije, ki omogočajo in silico načrtovanje in rešetanje, se je v zadnjem času uveljavila kot integralni del procesa odkrivanja spojin vodnic tako v farmacevtski industriji kot v akademskih institucijah. Tako načrtovanje na osnovi ligandov (LBDD) kot načrtovanje na osnovi strukture tarče (SBDD) sta se že izkazala kot uspešni metodi pri identifikaciji novih zdravilnih učinkovin. Mehanistične študije z uporabo in silico metod (molekulska dinamika, QM/MM računi) omogočajo globje razumevanje mehanizma delovanja učinkovin in s tem učinkovitejše iskanje spojin vodnic. Nazoren primer učinkovitosti virtualnega rešetanja je primerjalna študija z eksperimentalnim rešetanjem visoke zmogljivosti (70), kjer je bila uspešnost VS pri odkrivanju zadetkov 25-krat višja od uspešnosti rešetanja visokih zmogljivosti (HTS). Kot nova metoda izbire pri eksperimentalnem načrtovanju se je uveljavilo fragmentno načrtovanje spojin vodnic (FBLD), alternativni pristop HTS rešetanju. Ključni izziv nadaljnjega razvoja VS predstavlja izboljšanje kakovosti cenilnih funkcij. Trenutno je najprimernejši pristop odkrivanja novih spojin vodnic sočasna uporaba eksperimentalnih in in silico metod načrtovanja, ki v vse večji meri vključuje tudi modeliranje toksičnosti in metabolizma. 7 Literatura 1. Congreve M, Murray CW, Blundell TL. Structural biology and drug discovery. Drug Discov Today 2005; 10: 895-907. 2. Davis AM, Teague SJ, Kleywegt GJ. Application and limitations of X-ray crystallo-graphic data in structure-based ligand and drug design. Angew Chem Int Ed Engl 2003; 42: 2718-36. 3. Bajorath J. Integration of virtual and high-throughput screening. Nat Rev Drug Discov 2002; 1: 882-94. 4. Miller MA. Chemical database techniques in drug discovery. Nat Rev Drug Discov 2002; 1: 220-227. 5. Lyne PD. Structure-based virtual screening: an overview. Drug Discov Today 2002; 7: 1047-1055. 6. Walters WP, Stahl MT, Murcko MA. Virtual screening - an overview. Drug Discov Today 1998; 3: 160-178. 7. Kubinyi H. QSAR and 3D QSAR in drug design Part 1: methodology, Drug Discov Today 1997; 2: 457-467. 8. Lipinski CA, Lombardo F, Dominy BW et al. Experimental and computational approaches to estimate solubility and permeability in drug discovery and development settings. Adv Drug Deliv Rev 1997; 23: 3-25. 9. Muster W, Breidenbach A, Fischer H et al. Computational toxicology in drug development. Drug Discov Today 2008; 13: 303-310. 10. Shuker SB, Hajduk PJ, Meadows RP, et al. Discovering High-Affinity Ligands for Proteins: SAR by NMR. Science 1996; 274: 1531-1534. 11. Jhoti H, Cleasby A, Verdonk M, et al. Fragment-based screening using X-ray crystallography and NMR spectroscopy Curr. Opin. Chem. Biol. 2007; 11: 485-493. 12. Weber L. Current Status of Virtual Combinatorial Library Design. QSAR Comb Science 2005; 2: 809 - 823. 13. Willet P, Barnard JM, Downs GM. Chemical similarity searching. J Chem Inf Comp Sci 1998; 38: 983-996. 14. Guener OF. Pharmacophore perception, development, and use in drug design. La Jolla: International University Line; 2000. 15. Mason JS, Good AC, Martin EJ. 3-D pharmacophores in drug discovery. Curr Pharm Des 2001; 7: 567-597. 16. Patel Y, Gillet VJ, Bravi G, et al. A comparison of the pharmacophore identification programs: Catalyst, DISCO and GASP. J Comput Aided Mol Des 2002; 16: 653681. 17. Wolber G, Langer T. LigandScout: 3-D pharmacophores derived from protein-bound ligands and their use as virtual screening filters. J Chem Inf Model 2005: 45: 160-169. 18. Glen RC, Allen SC. Ligand-protein docking: cancer research at the interface between biology and chemistry. Curr Med Chem 2003; 10: 763-77. 19. Oblak M, Grdadolnik SG, Kotnik M et al. In silico fragment-based discovery of indolin-2-one analogues as potent DNA gyrase inhibitors. Bioorg Med Chem Lett 2005; 5: 5207-5210. 20. Kovač A, Konc J, Vehar B et al. Discovery of New Inhibitors of D-Alanine:D-Alanine Ligase by Structure-Based Virtual Screening. J Med Chem 2008: 51: 7442-7448. 21. Turk S, Kovač A, Boniface A et al. Discovery of new inhibitors of the bacterial peptidoglycan biosynthesis enzymes MurD and MurF by structure-based virtual screening. Bioorg Med Chem. 2009: 17: 1884-1889. 22. Ilas J, Jakopin Z, Borštnar T et al. (3,4-dihydro-2H-1,4-benzoxazine derivatives combining thrombin inhibitory and glycoprotein IIb/IIIa receptor antagonistic activity as a novel class of antithrombotic compounds with dual function. J Med Chem 2008: 51: 5617-5629. 23. Ilaš J, Tomaži T, Kikelj D. Novel potent and selective thrombin inhibitors based on a central 1,4-benzoxazin-3(4H)-one scaffold. J Med Chem 2008: 51: 2863-2867. 24. Gobec S, Plantan I, Mravljak J et al. Design, synthesis, biochemical evaluation and antimycobacterial action of phosphonate inhibitors of antigen 85C, a crucial enzyme involved in biosynthesis of the mycobacterial cell wall. Eur J Med Chem 2007: 42: 54-63. 25. Sova M, Perdih A, Kotnik M et al. Flavonoids and cinnamic acid esters as inhibitors of fungal 17 beta-hydroxysteroid dehydrogenase: A synthesis, QSAR and modelling study. Bioorg Med Chem 2006: 14: 7404-7418. 26. Sova M, Cadež G, Turk S et al. Design and synthesis of new hydroxyethylamines as inhibitors of D-alanyl-D-lactate ligase (VanA) and D-alanyl-D-alanine ligase (DdlB). Bioorg Med Chem Lett 2009: 19: 1376-1379. 27. Perdih A, Kovač A, Wolber G et al. Discovery of novel benzene 1,3-dicarboxylic acid inhibitors of bacterial MurD and MurE ligases by structure-based virtual screening approach. Bioorg Med Chem Lett 2009: 19: 2668-2673. 28. Muchmore SW, Hajduk PJ. Crystallography, NMR and virtual screening: Integrated tools for drug discovery. Curr Opin Drug Discovery Dev 2003: 6: 544549. 29. Zega A, Mlinsek G, Solmajer T et al. Thrombin inhibitors built on an azaphenylala-nine scaffold. Bioorg Med Chem Lett 2004: 14: 1563-1567. 30. Peterlin-Masič L, Kranjc A, Marinko P et al. Selective 3-amino-2-pyridinone acetamide thrombin inhibitors incorporating weakly basic partially saturated heter-obicyclic P-1-arginine mimetics. Bioorg Med Chem Lett 2003: 13: 3171-3176. 31. Plantan I, Selič L, Mesar T, et al. 4-substituted trinems as broad spectrum beta-lactamase inhibitors: Structure-based design, synthesis, and biological activity. J Med Chem 2007: 50: 4113-4121. 32. Kotnik M, Humljan J, Contreras-Martel C et al. Structural and functional characterization of enantiomeric glutamic acid derivatives as potential transition state analogue inhibitors of MurD ligase. J Mol Biol 2007: 370: 107-115. 33. Humljan J, Kotnik M, Contreras-Martel et al. Novel Naphthalene-N-sulfonyl-D-glu-tamic Acid Derivatives as Inhibitors of MurD, a Key Peptidoglycan Biosynthesis Enzyme J Med Chem 2008: 51: 7486-7494. 34. Kitchen DB, Decornez H, Furr JR, et al. Docking and scoring in virtual screening for drug discovery: methods and applications. Nat Rev Drug Discov 2004: 3: 935949. 35. Erickson JA, Jalaie M, Robertson DH, et al. Lessons in molecular recognition: the effects of ligand and protein flexibility on molecular docking accuracy. J Med Chem 2004: 47: 45-55. 36. Goodsel DS, Morris GM, Olson AJ. Automated docking of flexible ligands: applications of AutoDock. J Mol Recognit 1996: 9: 1-5. 37. Brooks BR, Bruccoleri RE, Olafson BD et al. CHARMM: a program for macromole-cular energy, minimization, and dynamics calculations. J Comput Chem 1983: 4: 187-217. 38. Ewing TJA, Makino S, Skillman AG et al. DOCK 4.0: Search strategies for automated molecular docking of flexible molecule databases. J Comput Aided Mol Des 2001: 15: 411-428. 39. Claussen H, Buning C, Rarey M et al. FlexE: efficient molecular docking considering protein structure variations. J Mol Biol 2001: 308: 377-395. 40. Rarey M, Kramer B, Lengauer T et al. A fast flexible docking method using an incremental construction algorithm. J Mol Biol 1996: 261: 470-489. 41. Friesner RA, Banks JL, Murphy RB et al. Glide: a new approach for rapid, accurate docking and scoring. 1. Method and assessment of docking accuracy. J Med Chem 2004: 47: 1739-1749. 42. Jones G. WillettP, Glen RC. A genetic algorithm for flexible molecular overlay and pharmacophore elucidation. J Comput Aided Mol Des 1995: 9: 532-549. 43. Venkatachalam CM, Jiang X, Oldfield T et al. LigandFit: a novel method for the shape-directed rapid docking of ligands to protein active sites. J Mol Graph Model 2003: 21: 289-307. 44. Bohm HJ. The computer program LUDI: a new method for the de novo design of enzyme inhibitors. J Comput Aided Mol Des 1992; 6: 61-78. 45. Kirchmair J, Markt P, Distinto S et al. Valuation of the performance of 3D virtual screening protocols: RMSD comparisons, enrichment assessments, and decoy selection - What can we learn from earlier mistakes? J Comput Aided Mol Design 2008; 22: 213-228. 46. Gohlke H, Klebe G. Approaches to the Description and Prediction of the Binding Affinity of Small-Molecule Ligands to Macromolecular Receptors. Angew Chem Int Ed 2002; 41: 2644-2676. 47. Kollman PA. Free energy calculations: Applications to chemical and biochemical phenomena. Chem Rev 1993; 93: 2395-2417. 48. Mlinsek G, Oblak M, Hodoscek M et al. Thrombin inhibitors with novel P1 binding pocket functionality: free energy of binding analysis J Mol Mod 2007; 13: 247254. 49. Aqvist J, Luzhkov VB, Brandsdal BO. Ligand Binding Affinities from MD Simulations. Acc Chem Res 2002; 35: 358-365. 50. Perdih A, Bren U, Solmajer T. Binding free energy calculations of W-sulphonyl-glu-tamic acid inhibitors of MurD ligase. J Mol Mod 2009; 15: 983-996. 51. Schulz-Gasch T, Stahl M. Scoring functions for protein-ligand interactions: a critical perspective. Drug Discov Today Tec 2004; 1: 231-239. 52. Morris GM, Goodsell DS, Halliday RS, et al. Automated docking using a Lamarckian genetic algorithm and an empirical binding free energy function. J Comput Chem 1998; 19: 1639-1662. 53. Eldridge MD, Murray CW, Auton TR et al. Empirical scoring functions: I. The development of a fast empirical scoring function to estimate the binding affinity of ligands in receptor complexes. J Comput Aided Mol Des 1997; 11: 425-445. 54. Bohm H-J. LUDI: rule-based automatic design of new substituents for enzyme inhibitor leads. J Comput Aided Mol Des 1992; 6: 593-606. 55. Verkhivker GM, Bouzida D, Gehlhaar DK et al. Dechipering common failures in molecular docking of ligand-protein complexes. J Comput Aided Mol Des 2000; 14 : 731-751. 56. Mlinsek G, Novic M, Hodoscek M et al. Prediction of enzyme binding: Human thrombin inhibition study by quantum chemical and artificial intelligence methods based on X-ray structures J Chem Inf Comp Sci 2001; 41: 1286-1294 57. Mlinsek G, Novic M, Kotnik M et al. Enzyme binding selectivity prediction: alpha-thrombin vs trypsin inhibition J Chem Inf Comp Sci 2004; 44: 1872-1882. 58. Zuperl S, Mlinsek G, Solmajer T et al. Prediction of binding affinities of thrombin and trypsin inhibitors by chemometric modeling J Chemom 2007; 21: 346-356 59. Muegge I, Martin YC. A general and fast scoring function for protein-ligand interactions: a simplified potential approach. J Med Chem 1999; 42: 791-804. 60. Gohlke H, Hendlich M, Klebe G. Knowledge-based scoring function to predict protein-ligand interactions. J Mol Biol 2000; 295: 337-56. 61. Brooijmans N, Kuntz ID. Molecular recognition and docking algorithms. Annu Rev Biophys Biomol Struct 2003; 32: 335-73. 62. Charifson PS, Corkery JJ, Murcko MA, Walters WP. Consensus scoring: A method for obtaining improved hit rates from docking databases of three-dimensional structures into proteins. J Med Chem 1999; 42: 5100-9. 63. van der Vaart A. Simulation of conformational transitions. Theor Chem Acc 2006: 116: 183-193. 64. Struthers RS, Tanaka G, Koerber SC et al. Design of biologically active, conforma-tionally constrained GnRH antagonists Proteins-Stuct Funct Genetics 1990 8, 295304. 65. Schlitter J, Engels M, Krüger P. Targeted molecular dynamics: a new approach for searching pathways of conformational transitions. Mol Graph 1994; 12: 84-89. 66. Perdih A, Kotnik M, Hodoscek M et al. Targeted molecular dynamics simulation studies of binding and conformational changes in E-coli MurD. Proteins-Stuct Funct Bioinf 2007; 68: 243-254. 67. Warshel A, Levitt M. Theoretical studies of enzymic reactions. J Mol Biol 1976; 103: 227-249. 68. Field MJ, Bash PA, Karplus M. A combined quantum mechanical and molecular mechanical potential for molecular dynamics simulations. J Comput Chem 1990; 11: 700-733. 69. Perdih A, Hodoscek M, Solmajer T. MurD ligase from E. coli: Tetrahedral intermediate formation study by hybrid quantum mechanical/molecular mechanical replica path method. Proteins-Str Funct Bioinf 2009; 74: 744-759. 70. Polgar T, Baki A, Szendrei GI et al. Comparative virtual and experimental high-throughput screening for glycogen synthase kinase-3ß inhibitors. J Med Chem 2005; 48: 7946-5947.