Hmeljarski bilten / Hop Bulletin 14(2007) 11 MOŽNOSTI UPORABE NUMERIČNIH METOD PRI ŽLAHTNJENJU HMELJA – IDEJNA ZASNOVA EKSPERTNEGA SISTEMA Viljem PAVLOVIČ1, Andreja ČERENAK2, Martin PAVLOVIČ2, Črtomir ROZMAN3 UDK / UDC 633.791:631.528 (045) pregledni znanstveni članek / review article prispelo / received: 25.08.2007 sprejeto / accepted: 11.11.2007 IZVLEČEK V programu žlahtnjenja hmelja, ki poteka na Inštitutu za hmeljarstvo in pivovarstvo Slovenije že od leta 1952, poskušajo slediti novostim, ki se porajajo v verigi od pridelovalcev do trgovcev hmelja in pivovarske industrije. Številni razpoložljivi podatki pa so pri odločitvah o kakovosti križancev in primernosti nove sorte lahko tudi zavajajoči, saj lahko nevede prezremo nekatere ključne momente. Ekspertni sistemi temelječi na numeričnih metodah vse bolj prodirajo v segment pomoči pri odločanju. Cilj uporabe numeričnih metod v klasifikacijskih analizah je izdelava objektivne in stabilne klasifikacije. V tem segmentu je računalniški model nenadomestljivo orodje v rokah eksperta. Metode umetne inteligence sicer ne bodo nadomestile ekspertov, lahko pa so nam v pomoč pri odločanju. V ospredju sta predvsem hitrost in zanesljivost procesiranja informacij kar pa je ključnega pomena za kvalitetno odločanje. V prispevku je prikazana možnost uporabe numeričnih metod pri klasični metodi žlahtnjenja hmelja. Ključne besede: žlahtnjenje, ekspertni sistem, umetna inteligenca, podpora odločanju USE OF NUMERICAL METHODS IN HOP BREEDING – CONCEPT OF AN EXPERT SYSTEM ABSTRACT In the programme of hop breeding that has been carried out at the Slovenian Institute of Hop Research and Brewing since 1952, they try to follow the new trends appearing within the chain from hop growers to hop consumers. The high amount of available data can easily be misleading while deciding on the quality of hybrids and suitability of new sorts because some of the key elements can unintentionally be overlooked. The use of expert systems based on numerical methods has increasingly been influencing the decision-making process. Numerical methods are used in classification analyses in order to obtain objective and stable classification. In this segment the computer model is an irreplaceable tool in the hands of an expert. Methods based on artificial intelligence cannot replace experts but they can be of great help in the field of decision-making. Speed and reliability of processing information are in the forefront which is crucial to efficient decision-making. The article presents the use of numerical methods used in the field of classical hop breeding. Key words: hop breeding, expert system, artificial intelligence, support for decision-making Alfa college, d.o.o., Celje; viljem.pavlovic@guest.arnes.si Inštitut za hmeljarstvo in pivovarstvo Slovenije, Žalskega tabora 2, 3310 Žalec Fakulteta za kmetijstvo Maribor, Vrbanska 30, 2000 Maribor 12 Hmeljarski bilten / Hop Bulletin 14(2007) 1 UVOD Genetska diverziteta v kmetijstvu se že tisočletja uporablja pri divjih in gojenih rastlinah. Zaradi napredka znanosti danes ustvarjamo različne sorte rastlin, ki so bolj prilagojene okolju. Agroekosistemi so zato najbolj napredni produktivni sistemi, vendar so hkrati tudi najbolj ranljivi in občutljivi na spremembe podnebja, rastlinske škodljivce in bolezni, živalske bolezni itd. Genetsko izboljšavo ene ali več lastnosti kmetijskih rastlin lahko dosežemo s klasičnim žlahtnjenjem ali s postopki biotehnologije. Klasično žlahtnjenje je dobilo znanstveno osnovo v začetku 20. stoletja, ko so izbiro metod žlahtnjenja začeli prilagajati novim spoznanjem genetike, rastlinske fiziologije in drugih razvijajočih se ved, tehnologija rekombinantne DNA pa sega v zgodnja 80-leta prejšnjega stoletja [2]. Cilj žlahtnjenja hmelja je zadovoljiti potrebe celotne verige hmeljne industrije. Zato obstajajo številni programi žlahtnjenja novih sort hmelja. Ciljne lastnosti novih sort vključujejo visoko vsebnost alfa kislin, kakovostno dobro aromo, visoke pridelke in odpornost proti pomembnejšim boleznim in škodljivcem. Sem uvrščamo predvsem hmeljevo peronosporo (Pseudoperonospora humuli (Miyabe & Takah.) G.W. Wils.), hmeljevo pepelovko (Sphaerotheca humuli Wallr. U. Braun & Takam), hmeljevo uvelost (Verticillium albo-atrum Reinke & Berthold) in škodljivce kot so hmeljeva listna uš (Phorodon humuli Schrank) ter navadna (hmeljeva) pršica (Tetranychus urticae Koch.). Glavni porabnik hmelja je pivovarska industrija. Ta potrebuje stabilne količine kakovostnega hmelja želenih sort in izvora, ob nizki ceni in konstantni kakovosti [7, 9, 10]. Žlahtnjenje rastlin poteka običajno s križanji, opazovanjem križancev in selekcijo. Težava je le v tem, da sam postopek vzgoje nove sorte traja 10 ali več let pri tem pa je interes pridelovalcev čim hitrejši odziv na zahteve industrije. Raziskave kažejo, da lahko sodobni molekulski pristopi bistveno prispevajo k učinkovitejši vzgoji izboljšanih novih sort. Ljudje smo zaradi tehnologij, ki bi nam lahko koristile, a so bile v preteklosti zlorabljene, postali nezaupljivi in previdni. Hitrejša vzgoja novih sort po klasični poti žlahtnjenja s pomočjo molekulskih pristopov je tako alternativna smer razvoja, žlahtnitelji pa se tudi tu lahko poslužujejo sodobnih metod [10, 13]. Za opis genetske diverzitete hmelja se uporabljajo numerični podatki kemijskih analiz in fizikalnih meritev ter senzorične ocene hmeljne rastline. Za kvalitetno odločitev pri selekciji in nadaljnji vzgoji se pri klasičnem žlahtnjenju eksperti lahko zanašajo predvsem na svoje izkušnje in nepregledno množico numeričnih podatkov, kjer ni vedno enostavno opaziti korelacij. Kvalitetna in hitra odločitev na osnovi množice podatkov lahko občutno skrajšata čas do predstavitve nove sorte. Pri tem so nam lahko v veliko pomoč metode za podporo odločanju . Odločanje je proces, v katerem je potrebno izmed več variant izbrati tisto, ki v največji meri zadosti našim željam in zahtevam. Poleg izbora najboljše variante je dobro, če lahko variante tudi rangiramo. Pri izbiri nove sorte hmelja so variante posamezni križanci. Odločanje je običajno del splošnega reševanja problemov in nastopa kot pomembna mentalna aktivnost na praktično vseh področjih človekovega delovanja. Težavnost odločitvenih problemov je zelo raznolika. Sega od enostavnih osebnih odločitev, ki so večinoma rutinske in se jih niti ne zavedamo, vse do kompleksnih, kjer se je nemogoče znajti že med količino podatkov, ki jih ima ekspert pred sabo. Najpomembnejši problemi, ki nastopajo pri težkih odločitvenih problemih, izvirajo iz [6]: Hmeljarski bilten / Hop Bulletin 14(2007) 13 • velikega števila dejavnikov, ki vplivajo na odločitev, • številnih oziroma slabo definiranih ali poznanih variant, • zahtevnega in pogosto nepopolnega poznavanja odločitvenega problema in ciljev odločitve, • obstoja več skupin odločevalcev z nasprotujočimi si cilji in • omejenega časa in drugih virov za izvedbo odločitvenega procesa. S problemi odločanja se ukvarja vrsta znanstvenih področij in disciplin, od filozofije, psihologije, ekonomije in matematike, do bolj specifičnih, kot sta odločitvena teorija in odločitvena analiza. Posebej pomembno je vprašanje, kako pomagati odločevalcu, da bi na sistematičen, organiziran in čim lažji način prišel do kvalitetne odločitve. V zahtevnih odločitvenih problemih, v katerih se pojavlja veliko število dejavnikov, ki imajo vpliv na odločanje s strani različnih odločevalcev, si je smiselno pomagati z večparametrskimi modeli. Tako odločevalec gradi strukturiran model, ki omogoča sistematičnost in preglednost procesa odločanja. Model omogoča, da so doseženi izhodni rezultati bolje razumljivi, kar ima pozitiven učinek pri utemeljevanju odločitve. Vsekakor se je treba zavedati, da končne odločitve ni možno prenesti na model oziroma računalnik, saj je naloga in odgovornost eksperta, da stoji za sprejetimi odločitvami ne glede na to, kako so bile sprejete. 2 EKSPERTNI SISTEMI ZA PODPORO ODLOČANJU Ekspertni sistemi podpirajo umsko delo strokovnjakov, ki se ukvarjajo z oblikovanjem, postavljanjem diagnoz, procesom odločanja ali obvladovanjem kompleksnih situacij, kjer je potrebno znanje človeškega eksperta na ozkem in dobro definiranem področju. Pri tem uporabljajo tehnike umetne inteligence, ki so bile razvite pri proučevanju računalniške predstavitve znanja izvedencev. Pomembna lastnost, ki jo od ekspertnega sistema pričakujemo je, da lahko smiselno uporablja tudi nepopolne in nezanesljive informacije. Zaradi tega se lahko pojavijo vprašljive rešitve v procesu sklepanja. Uporaba negotovih podatkov in nezanesljivih relacij zahteva verjetnostno sklepanje. Ljudje smo sposobni razpoznavati vzorce, značilne za posamezna problemska področja, znajdemo se v novih, nepredvidljivih situacijah, računalnik pa odlikuje sposobnost ponavljanja velikega števila operacij, hitrost, sistematičnost in praktična nezmotljivost [6, 11]. Ekspertni sistemi so značilno računalniške rešitve, ki služijo kot pomoč pri reševanju problemov. Njihovo izhodišče je v tem, da se ekspertno znanje posameznika učinkovito prenese v računalniško podprt model, ki ima sposobnost to znanje posnemati. Dobro oblikovani sistemi posnemajo razumske procese, ki jih eksperti uporabljajo za reševanje specifičnih problemov. Vsem ekspertnim sistemom je skupno, da so narejeni za reševanje nekega konkretnega problema. Stično točko vseh ekspertnih sistemov lahko opišemo v izrazoslovju umetne inteligence s trditvijo, da mora sistem v problemskem prostoru znati oceniti dano situacijo in ustrezno ukrepati [6, 12]. Ena najpomembnejših lastnosti ekspertnih sistemov je zmožnost pojasnjevanja rešitve, s čimer sistem postane transparenten oziroma uporabniku razumljiv. Sistem mora pojasniti svojo rešitev v takšni obliki, da jo uporabnik lahko preveri in v primeru, ko se z rešitvijo ne strinja, ugotovi vzrok svoje napake ali napake sistema. Ekspertno obnašanje se torej odlikuje po transparentnosti znanja in razlage [11]. 14 Hmeljarski bilten / Hop Bulletin 14(2007) Sistemi, ki temeljijo na bazah znanja in sistematičnem pregledovanju, nudijo podporo človeškemu dolgotrajnemu spominu, ki ima zelo veliko kapaciteto. Problem pa predstavlja priklicati vso to količino podatkov v zavest. Iskanje podatkov tako lahko vzpodbudimo s polnjenjem ekspertnih sistemov. Podatki sami zase pa nam kaj malo povedo, če ne najdemo med njimi korelacij. Avtomatizirano odkrivanje zanimivih vzorcev v podatkih je poznano pod različnimi imeni. Najbolj uveljavljen izraz za celoten proces je »odkrivanje znanja v podatkovnih bazah« (Knowledge Discovery in Databases), pri čemer je »podatkovno rudarjenje« (Data Mining) zgolj specifičen korak v procesu in se nanaša na aplikacijo algoritmov za izpeljavo vzorcev. Podatkovno rudarjenje je eden najpomembnejših korakov v procesu odkrivanja znanja. Uporablja se za odkrivanje vzorcev in relacij iz podatkov, ki pomagajo pri boljših odločitvah. Razvilo se je iz preseka raziskav na področjih podatkovnih baz, strojnega učenja, razpoznavanja vzorcev, statistike in vizualizacije podatkov. Danes imamo na razpolago več zelo močnih orodij za podatkovno rudarjenje. Če je ta pojem v začetku 60 let zajemal predvsem klasične postopke statistične analize, se je danes postopek rudarjenja podatkov oddaljil od zgolj uporabe statističnih postopkov. Približal se je bolj poglobljenim pristopom, kako iz zbranih podatkov nekaj razložiti oziroma napovedati. V poznih osemdesetih se je postopek klasične statistične analize nadgradil z izbranimi tehnikami, kot so mehka logika, hevristična metoda reševanja problemov in nevronske mreže [6]. Slika 1: Shematska zgradba ekspertnega sistema Figure 1: The expert system structure Hmeljarski bilten / Hop Bulletin 14(2007) 15 3 PREDPOSTAVKE KONCEPTA EKSPERTNEGA MODELA Izbiro ustrezne metode žlahtnjenja narekujejo specifične lastnosti hmeljne rastline (trajna, dvodomna rastlinska vrsta, storžke razvijejo le ženske rastline). Zaradi dvodomnosti so hmeljne rastline genetsko zelo različne. Potomstvo rastlin, vzgojenih iz semena, je raznoliko (heterogeno). Da bi se obdržala homogena (genetsko izenačena) populacija, se hmelj v pridelovalnih nasadih razmnožuje vegetativno. Uspeh križanja je odvisen tudi od kombinacijske vrednosti staršev, ki je boljša, čim večja je njihova genetska variabilnost. Genetsko variabilnost lahko ugotavljamo na osnovi analize variabilnosti določenih kemijskih komponent, uveljavljena pa je tudi že uporaba molekulskih markerjev, ki temeljijo na osnovi analize DNA. Želene lastnosti križancev dobimo s selekcijo lastnosti starševskih rastlin. S populacijskim pristopom žlahtnjenja hmelja, ko želimo izboljšati več lastnosti bolj ali manj istočasno, se nam število možnih variant hitro povečuje. Genetsko bližino rastlin nam lahko pomaga določati metoda grupiranja. S pomočjo dobljenih dendrogramov se lažje odločamo za nadaljnje korake [1, 5]. V najširšem pomenu je razvrščanje v skupine (Cluster Analysis) proces abstrakcije poimenovanja skupin objektov, za katere menimo, da so na nek način podobni med seboj. Je eno najosnovnejših opravil vsake raziskave in verjetno tudi najsplošnejša znanstvena metoda, ki je uporabna na vseh področjih. Kot primer naj omenimo Darwinovo razvojno teorijo in razvrstitev kemijskih elementov v periodni zakon, kar sta naredila Mendelejev in Mayer [4]. Na prvem nivoju lahko klasifikacijska shema preprosto predstavlja priročno metodo, s katero lahko organiziramo veliko množico podatkov, da jih lažje razumemo in interpretiramo. Ko podatke ustrezno sumiramo v manjše število skupin objektov, nazivi skupin oblikujejo dovolj natančen opis vzorca podatkov. Potreba po klasifikaciji podatkov v svetu postaja vse pomembnejša zaradi velikega števila rastočih baz podatkov, ki so na razpolago na vseh področjih znanosti. Na podlagi grupiranja množice podatkov lahko predpostavljamo določene lastnosti in napovedujemo dogodke in dejanja, včasih pa tudi raziskujemo vzroke in postavljamo diagnoze (biologija, kemija, agronomija, genetika...). Kljub matematični teoriji na kateri sloni model, se moramo zavedati, da razvrščanje množice objektov v skupine ni zgolj znanstvena teorija in jo moramo ovrednotiti bolj glede na njeno uporabnost [4, 12]. Poleg klasične metode selekcije superiornih genotipov lahko selekcijo izvajamo tudi s pomočjo matematičnega modela, ki ga je potrebno predhodno pripraviti. Za izgradnjo takega modela je smiselna uporaba skupka numeričnih metod. Preizkusiti ga je mogoče s pomočjo hierarhične metode razvrščanja podatkov, dobljenih na osnovi kemičnih analiz superiornih križancev, v skupine (clustering), ter dvofaktorske analize variance ANOVA (two factor without replication). Kot pomoč pri odločanju o superiornosti križancev pa se lahko uporabi tudi posebej razvit ekspertni sistem za večparametrsko odločanje DEXi [3, 8]. 16 Hmeljarski bilten / Hop Bulletin 14(2007) Slika 2: Shema ekspertnega modela za pomoč pri odločanju Figure 2: Scheme of the expert model for decision making 4 ZAKLJUČEK V prispevku je prikazana možnost uporabe numeričnih metod pri klasični metodi žlahtnjenja hmelja. Glavni namen preliminarne raziskave je bil v pripravi koncepta za preizkusni ekspertni model ter metodologije kontrole ujemanja odločitev ekspertov s ponujenimi odločitvami ekspertnega sistema. Dokončno razvit sistem bo lahko skrajšal čas in povečal učinkovitost dela, žlahtniteljem pa olajšal delo pri njihovih odločitvah. Delo na razvoju sistema bo potrebno v prihodnjih letih še nadaljevati. LITERATURA 2. 3. Costa, G. I. et al., Comparative analysis of clustering methods for gene expression time course data.- Genet. Mol. Biol., 27(2004)4. Čerenak, A., Jakše, J., Identifikacija Slovenskih sort hmelja z mikrosatelitskimi markerji. Hmeljarski bilten, 12(2005), s. 43-48. Eisen, M.B. et al., Cluster analysis and display of genome-wide expression patterns.- Proc. Natl. Acad. Sci. USA, 95(1988), s. 14863-14868. 5 1. Hmeljarski bilten / Hop Bulletin 14(2007) 17 4. Ferligoj, A., Razvrščanje v skupine.- Metodološki zvezki, št. 4, Raziskovalni inštitut FSPN, Ljubljana, 1988, 182 s. 5. Henning, A. J., Townsend, M. S., Field-Based Estimates of Heritability and Genetic Correlations in Hop.- Crop Sci. 45(2005), s. 1469-1475. 6. http://www-ai.ijs.si/MarkoBohanec/org95/index.html (10. avgust 2007). 7. Javornik, B., Molekularno genetske raziskave hmelja. Hmeljarski bilten, 12(2005), s. 71- 77. 8. Košmelj, K., Osnove analize kovariance.- Acta agriculturae slovenica, 83(2004), s. 341- 352. 9. Murakami, A. et al., Molecular phylogeny of wild Hops, Humulus lupulus L..- Heredity 97(2006), s. 66–74. 10. Pavlovič, M., Aplikacija simulacijskega modela SIMAHOP 3.1 za primerjalne stroškovne analize v kmetijstvu.- Hmeljarski bilten, 13(2006), s. 21-31. 11. Rajkovič, V., Bohanec, M., Sistemi za pomoč pri odločanju.- Organizacija in kadri, (1988), s. 127-140. 12. Zupan, J., Uporaba računalniških metod v kemiji.- DZS, Ljubljana, (1992), 276 s. 13. Žel, J., Gensko spremenjene rastline. Biološka znanost in družba, Genialna prihodnost: genetika, determinizem in svoboda, Zbirnik prispevkov posveta, Ljubljana, oktober 2007.