Pregledni prispevek/Review article MEDICINSKA INFORMATIKA DANES IN JUTRI MEDICAL INFORMATICS TODAY AND TOMORROW Jure Dimec, EmilHudomalj, Dimitar Hristovski, Gaj Vidmar Inštitut za biomedicinsko informatiko, Medicinska fakulteta Ljubljana, Vrazov trg 2, 1000 Ljubljana Prispelo 2003-11-24, sprejeto 2003-12-11; ZDRAV VESTN 2004; 73: 77-80 Ključne besede: medicinska informatika; znanstveno informiranje; spletna informacijska orodja; standardi za izmenjavo podatkov; odkrivanje zakonitosti iz baz podatkov Izvleček - Prispevek opisuje stanje in nekatere trende v razvoju medicinske informatike na področjih znanstvenega informiranja in odkrivanja zakonitosti v velikih zbirkah podatkov ter v vlogi standardov pri izmenjavi podatkov v zdravstvu. Spremenjeni načini objavljanja v spletnem okolju so prinesli velike spremembe v načine informiranja. V sodobnih besedilnih podatkovnih zbirkah so urejeni polni dokumenti hiper-tekstne in večpredstavne (multimedijske) narave. Tudi bibliografske zbirke vedno pogosteje nudijo dostop do polnih dokumentov, ki jih opisujejo bibliografski zapisi. Minulo desetletje je prineslo razmah spletnih informacijskih orodij, od spletnih portalov in velikih spletnih iskalnikov, ki zahtevajo od uporabnika veliko mero kritičnosti do tako pridobljenih dokumentov, do digitalnih knjižnic, ki so nastale s samoorganiziranjem akademskih institucij ali raziskovalnih skupin. Informacijska podpora kot pomemben sestavni del medicinskih postopkov je vsaj načeloma omogočila izmenjavo podatkov med vsemi segmenti zdravstva. Izkazalo pa se je, da je med pomembnejšimi ovirami za tako izmenjavo pomanjkanje standardov, ki urejajo strukturo, vsebino in varnost izmenjanih podatkov. Avtorji poročajo tudi o metodah odkrivanja zakonitosti v zbirkah podatkov, s katerimi v velikih količinah podatkovodkri-vamo strukture in potencialno znanje, ki bi pri obdelavi podatkov z običajnim programom ostalo prikrito. Key words: medical informatics; scientific information; web information tools; data exchange standards; knowledge discovery in databases Abstract - The article describes the state and some trends in the development of medical informatics especially regarding the fields of scientific information, knowledge discovery in databases, and the role of standards in data exchange. The ways of publication of scientific documents experienced dramatic changes with the development of the www, hence causing major changes in daily information practice. Contemporary textual databases contain full documents of hyper-textual and multimedia nature and links to full documents are increasingly common within the records of bibliographic databases. The last decade brought the advent of the web information tools, from web portals to global search engines, which are powerful aids but demand strong precaution regarding the quality of retrieved documents from the users. On the other hand, we are witnessing the development of digital libraries of scientific documents as a result of the self-organization of academic institutions, research groups and individuals, often in the opposition to the interests of publishing companies. The information support as an important element of medical procedures made possible the exchange of data between all segments of the health-care system and it has become clear that lack of standards governing structure, understanding and safety is among the biggest obstacles to successful data exchange. In addition, the article comprises a report on the methods of knowledge discovery in databases, which help us discover hidden structures and potential knowledge, invisible to the normal data-processing software, in the enormous amount of data. Uvod Za današnji čas je značilna informatizacija vseh postopkov pri znanstvenem in strokovnem delu ter velika vloga informacijskih tehnologij v vsakdanjem življenju, posebno tistem njegovem delu, ki je povezan z objavljenimi informacijami. Vpliv računalniško podprtih metod obdelave informacij je v medicini, zlasti v znanstvenem informiranju, opazen že od 60. let, ko je nastala bibliografska zbirka Medline. Med značilnostmi medicine, ki spodbujajo razvoj in rabo informacijskih orodij, so velika količina informacij, ki nastajajo kot rezultat medicinskih postopkov in objavljanja v medicini, majhna toleranca do napak in poseben pomen hitrega odzivanja, osno-vanega na zanesljivi analizi podatkov. Področje medicinske informatike oziroma informatike v zdravstvu je izjemno široko in raznotero. V prispevku bomo skušali podati pregled stanja pri nas in v svetu, omejili pa se bomo na področja, s katerimi se ukvarjamo na Inštitutu za biomedicinsko informatiko Medicinske fakultete v Ljubljani. Znanstveno informiranje in komuniciranje na področju medicine Napredek računalniške in informacijske tehnologije v zadnjih desetletjih je prinesel velike spremembe tudi v načine objavljanja in dostopanja do dokumentov. Na področju znanstvenega informiranja sta najočitnejši spremembi prehod od ponudbe bibliografskih zapisov k ponudbi polnih dokumentov in izraba medmrežja (Interneta, natančneje Svetovnega spleta, WWW) kot infrastrukture za prenos in prikaz teh dokumentov. Standardi, na katerih temelji splet, so izredno poenostavili objavljanje in distribucijo objavljenega - avtor dokumenta potrebuje zelo malo dodatnega informacijskega znanja in nekaj prostora na spletnem strežniku, njegov dokument pa je takoj po objavi dostopen globalno. Elektronski dokumenti obstajajo, odkar obstajajo računalniki, toda uporaba spletnih standardov je spremenila naše dojemanje naravne oblike dokumenta - ta je hipertekstna in večpredstavna. Elektronski dokument je dosegel in presegel izrazne možnosti klasičnega dokumenta na papirju. Verjetno so te spremembe večje za običajnega udeleženca omrežnega sporočanja kot pa za uporabnika storitev znanstvenega informiranja. Enostavnost in učinkovitost spletnega objavljanja je v prvi polovici 90. let sprožila eksponentno rast števila dokumentov v elektronski obliki. Trend se sicer v zadnjih letih umirja (1), število javno dostopnih spletnih dokumentov pa je doseglo doslej nepojmljive desetine milijard dokumentov. Verjetno se je zgodilo prvič, da je bila ob izbruhu informacijske eksplozije že prisotna zavest o nujnosti gradnje informacijskih orodij in tudi potrebno znanje za njihov razvoj. Največji med spletnimi iskalniki, Google (2), je že spomladi 2003 zbral v svojih zbirkah opise vsebine več kot treh milijard dokumentov. Metodologija gradnje vsebinskih opisov teh zbirk, iskanja in razvrščanja poiskanih dokumentov izvira iz klasičnega področja shranjevanja in iskanja informacij, ki se je začelo razvijati v 70. letih, v spletnem okolju pa je doživela resnično potrditev. Posebnost spletnega okolja je način zbiranja dokumentov, ki ga opravlja programska oprema iskalnikov. Avtonomni programski agenti (imenovani tudi roboti, pajki ali žanjci) izkoriščajo hipertekstno mrežo spleta in uvrščajo opise dokumentov, dostopnih preko kazalcev, v zbirke iskalnikov. Indeksiranje dokumentov, ki je bilo pri dosedanjih informacijskih orodjih (sekundarne revije, bibliografske zbirke, knjižnični katalogi) vedno naloga informacijskih strokovnjakov, je pri zbirkah spletnih iskalnikov zaradi njihove velikosti popolnoma neizvedljivo na enak način. Indeksiranje opravljajo avtonomni programski agenti avtomatsko, algoritmi pa pri tem ovrednotijo količino informacije v posameznih besedah v dokumentih. Pomemben del teh algoritmov je vezan na jezik dokumentov, uspešno pa jih znamo izvesti tudi za slovenščino (3). Spletne iskalnike nedvomno lahko ocenimo kot izreden dosežek informatike, še posebno, če se zavedamo velikosti njihovih zbirk in tega, da vsako sekundo odgovorijo na nekaj deset tisoč informacijskih zahtev. Vprašljiva pa je njihova uporabnost za informiranje v znanosti, zlasti v zdravstvu, kjer je napačna informacija lahko usodna. Na spletu ne obstajajo splošno sprejeti mehanizmi ugotavljanja in označevanja kvalitetnih in zaupanja vrednih dokumentov. Uporabnik je prepuščen svoji presoji, ki pa je olajšana, če gre za dokumente v e-verzijah klasičnih znanstvenih revij, dokumente na strežnikih akademskih institucij, dokumente v kakovostnih digitalnih knjižnicah ali pa vsaj za dokumente, na katere kažejo kazalci s strani, ki jih vzdržujejo osebe oziroma ustanove, ki jim zaupa. Kljub temu pa je spletna tehnologija prinesla velike spremembe tudi v informiranje v znanosti. Založniki znanstvene literature so, po začetnem oklevanju, ki je bilo posledica strahu pred zlorabo dokumentov, dostopnih na medmrežju, izrabili možnosti, ki jih omrežje nudi pri distribuciji člankov. Večina velikih založnikov zdaj objavlja svoje revije tudi v e-obliki, tako da so lahko organizacije, ki gradijo bibliografske zbirke, opremile številne bibliografske zapise s kazalci na polne dokumente. Informacijska tehnologija založnikom omogoča, da je končni cilj priprave članka njegova »nevtralna« oblika, ki je enako uporabna za krmiljenje tiskarskih strojev kot za spletno ponudbo. Veliki založniki razumejo spletno objavo svojih revij le kot dodatno možnost zaslužka (stroški so, ob ustreznih spremembah produkcijskega postopka, relativno majhni), večini uporabnikov znanstvenih revij pa je spletni dostop do člankov omogočen le v primeru, da njihova knjižnica plačuje najemnino e-verzij revij, pogosto celo ob pogoju, da je naročena na klasične, papirne verzije. Lahko bi rekli, da za običajnega uporabnika spletna tehnologija pomeni revolucijo v načinu objavljanja, za uporabnika storitev znanstvenega informiranja pa kvečjemu korak v evoluciji. Način organiziranja dokumentov, ki se je v zdravstvu razvil izraziteje kot v drugih vedah, so spletniportali. Gre za strani s kazalci na dokumente, zelo pestre tako glede izvora kot glede oblike, s katerimi želijo avtorji portala celovito pokriti neko področje medicine ali informirati neko uporabniško skupino. Večina zdravstvenih portalov je namenjena laični populaciji, z dokumenti, ki naj bi vzgojili informiranega bolnika. Ni naključje, da take portale gradijo institucije (večinoma ameriške), ki z informiranim bolnikom največ pridobijo - vladne zdravstvene agencije in velike klinike (4, 5). Prevladujejo opisi bolezni, njihovega nastanka in prognoze, razlage načinov zdravljenja, pogosto na visoki kakovostni ravni. Manj številni so zaenkrat portali, namenjeni zdravnikom, pri katerih je opazna kakovostna ločnica med plačljivimi in takimi z javnim dostopom. Dober primer plačljivega portala je MDConsult (6), ki ga gradi konzorcij založnikov medicinske literature, nudi pa dostop do številnih referenčnih del, e-revij, farmakopej, algoritmov medicinskih postopkov in drugih informacij, koristnih za vsakodnevno prakso. Osrednji pojem, povezan s spletno ponudbo dokumentov, je digitalna knjižnica. Z odraščanjem samega komunikacijskega medija in informacijskih storitev na njem je pojem izgubil nekaj svoje širine. Danes pomeni storitev ali institucijo, ki preko spleta nudi dostop do kvalitetnih dokumentov, običajno vključuje dokumente iz omejene vsebinske domene, ni pa omejena glede njihovih tipov, razen da so zapisani v digitalni obliki. Podatki o dokumentih so organizirani v zbirkah, kar omogoča brskanje ali iskanje. Gradivo, ki ga digitalna knjižnica nudi, je vsaj deloma nastalo v njej, lahko tudi z digitalizacijo klasičnega fonda. Pogosto so del storitve tudi kazalci na tematsko sorodne dokumente, nameščene drugje, vendar pa samo seznam kazalcev, kot najpogostejša oblika urejanja informacij na spletu, ni digitalna knjižnica. Obstajata dve glavni obliki digitalnih knjižnic - plačljiva, ki jo gradijo založniki in v kateri prevladujejo e-oblike klasičnih znanstvenih revij, ter odprta, ki nastaja večinoma na akademskih institucijah. Kaže, da je prihodnost razvoja spletnega informiranja v povezovanju lokalnih digitalnih knjižnic v širšo virtualno strukturo. Te knjižnice so lahko založniške zbirke e-revij, magisteriji ali doktorati na visokošolskih ustanovah (7), predtiski člankov, raziskovalna poročila, digitalizirano arhivsko in muzejsko gradivo idr., skratka majhne in velike zbirke lokalnega gradiva, ki je zanimivo tudi globalno in kakršne v veliki meri obstajajo že danes. V ta trend se je vključila tudi Medicinska fakulteta v Ljubljani z zbirko polnih besedil magistrskih in doktorskih del (8), ki jo urejamo na Inštitutu za biomedicinsko informatiko. Identificiramo lahko nekaj problemskih sklopov, od katerih je odvisno uspešno delovanje in povezovanje lokalnih digitalnih knjižnic. Za enoten poizvedovalni vmesnik potrebujemo dogovor o enotnih strukturah podatkov o dokumentih (metapodatkov) in dogovor o standardnih načinih dostopa do metapodatkov in samih dokumentov, ki bi omogočil avtomatsko gradnjo skupnih indeksov. Za stalno dosto- pnost dokumentov pa potrebujemo sistem identifikacije dokumentov, ki bi bil, za razliko od zdaj uporabljanega URL, neobčutljiv na spremembe položaja dokumentov ob reorganizacijah spletnih strežnikov. Vitalnega pomena je tudi uspešen razvoj metod za ohranjanje in arhiviranje e-dokumentov. Vsak od naštetih problemov je deležen obsežnih raziskav in razvoja in nekatere rešitve so že dosegle zrelost. V akademskih in znanstvenih krogih se zadnja leta krepijo gibanja za večjo javno dostopnost znanstvenih informacij, ki vsaj deloma zahtevajo tudi redefiniranje vloge založnikov znanstvene literature. Pobude teh skupin segajo od samoor-ganiziranja akademskih institucij, da bi svojo produkcijo znanstvenih dokumentov ponudile javnosti v okviru lokalnih digitalnih knjižnic, do najbolj skrajnih, ki predvidevajo zamenjavo plačnika znanstvenih informacij: objavo članka in postopek recenzije naj bi plačal avtor, po objavi pa bi bil dostop do članka javen in neomejen. Skupna vsem tem pobudam je skrb za ohranjanje obstoječega recenzentskega sistema, ki je odgovoren za kontrolo kakovosti znanstvenih dokumentov. Pionirsko vlogo v gibanju za javno dostopnost je odigral arXiv (9), arhiv predtiskov člankov z nekaterih področij fizike, matematike in deloma računalništva. V tem arhivu se je od avgusta 1991 do maja 2003 nabralo dobrih 235.000 predtiskov in začetni odpor založnikov fizikalne in matematične literature je premagal le splošni konsenz vpletene raziskovalne srenje, ki mesečno opravi povprečno po 3.000.000 dostopov v arhiv. Le nekaj mlajši in malo manj obsežen istovrstni projekt je Cog-prints (10) s področja kognitivne znanosti, in CiteSeer (11) ter z njim povezan Computer Science Directory kot povezava javno dostopne bibliografske podatkovne zbirke s polnimi besedili znanstvenih člankov z najrazličnejših področij računalništva in informatike. V medicini takih širokih skupin pritiska še ni bilo, pač pa so se ideje o prostem dostopu do znanstvene literature oblikovale znotraj institucij in z dogovarjanjem z založniki: dober primer takega pristopa sta Bio-MedCentral (12) in PubMedCentral (13). Standardi v medicinski informatiki Povečevanje pretoka podatkov in težnja po čim boljšem obvladovanju stroškov sta dve značilnosti sodobne informatike, zdravstvene organizacije pa se morajo ob tem soočati še s spremenljivostjo financiranja, hitrim razvojem stroke in velikimi pričakovanji bolnikov. Še nedavno se je večino informacij med organizacijami izmenjalo preko dopisov in pošte, nato preko teleksov in telefaksov, danes pa verjetno že večina informacij potuje po elektronski pošti in drugih elektronskih poteh. Kljub temu le redki informacijski sistemi omogočajo izmenjavo podatkov (npr. o preiskavah bolnikov ali naročilih dobaviteljem) brez ročnega posredovanja. Razlogi za to so predvsem v nezdružljivosti podatkov, nezaupanju med organizacijami in pomanjkljivostih pri zagotavljanju kakovosti podatkov. V zadnjem času je dozorelo spoznanje, da omenjene probleme precej laže rešujemo z upoštevanjem splošno veljavnih standardov - predvsem standardov za izmenjavo podatkov (npr. za elektronski medicinski zapis), za upravljanje varnosti informacij in za zagotavljanje kvalitete storitev. V zadnjih letih in desetletjih je bilo v razvoj in vpeljevanje standardov vloženega sicer že veliko truda, vendar je videti, da so bila pričakovanja večja od rezultatov. V prihodnjih letih bodo standardi omogočili hitrejše približevanje splošnim informacijskim zahtevam, kot so nepodvajanje podatkov, njihovo sprotno posodabljanje, hiter prenos in varna izmenjava. Tako bo standard na področju upravljanja varnosti podatkov (ISO 17799) omogočil zaupanje med organizacijami, ki je prvi pogoj za neposredno izmenjavo podatkov. Podobno vlogo bodo imeli globalni ali lokalni podatkovni standardi in standardi za zagotavljanje kakovosti storitev. Vpeljava standardov bo pospešila ali celo pogojevala razvoj na številnih področjih, med njimi: neposredno povezovanje informacijskih sistemov različnih organizacij v zdravstvu in zunaj njega, izdelavo elektronskega zapisa o bolniku (podatki se bodo lahko fizično nahajali na različnih medijih in lokacijah), možnost bolnika, da učinkovito pregleda lastne podatke, ki so bili zbrani v letih, zagotavljanje nadzora, zaupnosti ter odkrivanja morebitnih zlorab pri uporabi osebnih podatkov. Glavne ovire pri sprejemanju in vpeljevanju standardov v organizaciji so težave pri poenotenju mnenj in interesov, pomanjkanje podpore vodstva, odpor do organizacijskih sprememb, pomanjkanje ustrezne dokumentacije in pomanjkanje sredstev ter ustreznega kadra. Videti je, da bodo to bistveni problemi tudi pri nadaljnjem razvoju informatike v zdravstvu. Če nam jih bo uspelo zadovoljivo rešiti, lahko pričakujemo hiter razvoj, na katerega bodo vplivali zlasti pristopi, ki se pri manj obsežnih podatkih in na sorodnih področjih sicer uporabljajo že danes. Tisti, ki ne bodo pravočasno pripravljeni na ta razvoj, se mu bodo težko priključili kasneje, saj je znano, da je uvajanje standardov dolgotrajen proces. Zato dandanes skoraj nihče več ne dvomi o ustreznosti uvajanja standardov, le o tem, kako se ga lotiti čim bolj učinkovito, so mnenja deljena. Zelo pomembni so ustrezni kadri - ker gre za projekte, ki vključujejo mnogo področij delovanja vsake organizacije, bodo ključno vlogo nosili izkušeni strokovnjaki v sodelovanju z zunanjimi sodelavci. Ustrezno kadrovsko podporo je potrebno zagotoviti tudi za prihodnost, saj je znano, da se procesi, kot sta upravljanje varnosti in zagotavljanje kakovosti, pravzaprav nikoli ne končajo. Pričakovati je torej večjo skrb za lastne kadre in dodatno povpraševanje po uspešnih kadrih zunaj organizacije. V zadnjih letih se je v slovenski medicini pričelo mnogo velikih projektov, ki vsaj deloma vključujejo standarde in informatiko, med njimi Projekt razvoja upravljanja sistema zdravstvenega varstva v Sloveniji, ki skuša standarde vpeljati v mnoge segmente zdravstva v Sloveniji, prenova pouka na Medicinski fakulteti, ki skuša evropske standarde vpeljati v pedagoški proces, in izgradnja varnostne infrastrukture na državni ravni, ki bo omogočala varno elektronsko povezovanje tudi med zdravstvenimi organizacijami. Vsi ti projekti so šele na začetku, zaradi njihove obsežnosti pa lahko rezultate pričakujemo šele v nekaj letih. Sodelovanje zdravstvenih organizacij v teh projektih bo ena njihovih najpomembnejših nalog v prihodnjih letih, saj je pričakovati, da bodo šele s temi projekti pridobile osnove za uporabo novih tehnologij in pristopov ter osnove za učinkovito obvladovanje stroškov in lažje povezovanje z Evropo. Odkrivanje zakonitosti iz baz podatkov Kot odgovor na izzive analiziranja vse večjih količin podatkov se v zadnjih letih uveljavlja raziskovalno področje, ki se imenuje odkrivanje zakonitosti iz baz podatkov (Knowledge Discovery in Databases, s kratico KDD). Namen področja je odkrivanje novih, veljavnih, netrivialnih, zanimivih in potencialno uporabnih zakonitosti iz baz podatkov (14). KDD združuje metode, razvite na področjih podatkovnih baz, strojnega učenja, razpoznavanja vzorcev, statistike, umetne inteligence in vizualizacije podatkov. Po številu in obširnosti podatkovnih baz se genetika uvršča v vrh biomedicinskih znanstvenih disciplin. V projektih, kakršen je na primer Projekt človeškega genoma (The Human Genome Project) (15), nastajajo številne nove baze, javnosti večinoma prosto dostopne na internetu, s podatki, kot so sek-vence DNK človeškega genoma in genomov nekaterih drugih modelnih organizmov, proteinske sekvence in strukture, podatki o mapiranju genomov, metabolnih poteh, izražanju genov, bolezenskih fenotipih in podobno. Tudi zaradi izjemnih razsežnosti teh baz je v genetiki opazen razkorak med hitrostjo pridobivanja novih podatkov in sposobnostjo njihovega analiziranja ter sintetiziranja v novo znanje. Med genetske probleme, pri katerih je potreba po avtomatskem odkrivanju zakonitosti iz baz podatkov še posebej izrazita, sodijo odkrivanje genov iz sekvence DNK različnih organizmov, iskanje sekvenc, ki imajo strukture višjega reda podobne dani začetni sekvenci, razumevanje funkcije genov in kompleksne mreže genetskih interakcij ter iskanje genov za bolezni in razumevanje njihove funkcije v fizioloških in patoloških pogojih. Za analiziranje teh podatkov se uporabljajo predvsem programi, ki temelje na nevronskih mrežah, statističnih metodah in pristopih umetne inteligence, zelo pereč in predmet živahnih raziskav pa je problem izboljševanja natančnosti teh programov. Večinoma se metode za odkrivanje zakonitosti v medicini uporabljajo na strukturiranih (faktografskih) bazah podatkov o organizmih. Nov izziv pa predstavlja področje odkrivanja zakonitosti iz besedilnih, zaenkrat predvsem bibliografskih, baz podatkov (16), s katerim se ukvarjamo tudi na Inštitutu za bio-medicinsko informatiko (17). Sistemi in metode za podporo pri odkrivanju biomedicinskih zakonitosti, ki jih razvijamo, pomagajo raziskovalcem pri ustvarjanju novih hipotez, ki jih je potem seveda treba ovrednotiti in preveriti z uveljavljenimi znanstvenimi metodami. Hipoteze, ki imajo obliko relacij med biomedicinskimi koncepti, dobimo s pomočjo metod podatkovnega rudarjenja iz različnih baz podatkov, predvsem iz bibliografske zbirke Medline pa tudi iz specializiranih zbirk podatkov za področje genetike. Zaradi integracije genetskih zbirk so naše metode še zlasti uporabne za odkrivanje novih zakonitosti na področju genetike, denimo pri napovedovanju kandidatnih genov za dano bolezen. Sistemi, ki jih razvijamo, so dostopni raziskovalcem preko svetovnega spleta (18). Zaključki V besedilu smo poskušali na kratko predstaviti stanje na izbranih področjih informatike v zdravstvu. Znanstveno informiranje še vedno temelji na uveljavljenih informacijskih orodjih, predvsem največjih bibliografskih podatkovnih zbirkah, porajajo pa se novi načini informiranja, pri katerih ima veliko vlogo lastna dejavnost raziskovalne srenje (zbirke predtiskov, institucijski e-arhivi, zbirke e-verzij magisterijev in doktoratov ipd.). Obstajata torej dva svetova, ki se izrazito usmerjata k omrežnemu dostopu do polnih dokumentov: prvi v sodelovanju s komercialnimi založniki, drugi pa z organiziranjem lastne produkcije dokumentov in v pričakovanju sprememb vloge založnikov ter njim na kožo pisane zakonodaje o avtorskih pravicah. Informatizacija je prodrla v vse pore raziskovalnega in strokovnega dela. Informacijska podpora je postala tako kompleksna, da zahteva uvedbo standardov na vseh ravneh - od vsakodnevnega omrežnega komuniciranja, znanstvenega in- formiranja, izmenjave podatkov, do zagotavljanja varnosti in nadzora nad kakovostjo strokovnih storitev. Informacijska podpora nekaterih področij, npr. znanstvenega informiranja, traja že desetletja, v katerih se je nabralo zelo veliko podatkov v e-obliki, nekatera druga področja, ki so doživela informatizacijo kasneje (npr. genetika), pa kopičijo velike količine podatkov zaradi same narave dela. Ti podatki vsebujejo tudi znanje, ki zaradi obsežnosti zbirk ostaja prikrito človeku in sposobnostim programske opreme za običajno analizo podatkov. Z odkrivanjem skritega, a predvidoma obstoječega znanja se v zadnjih letih ukvarja področje informatike, imenovano odkrivanje zakonitosti iz baz podatkov. Z metodami podatkovnega rudarjenja je mogoče med drugim odkriti funkcionalne strukture na podlagi sekvenc DNK ali pa nakazati obetajoče smeri raziskovanja z odkrivanjem možnih, a neopaženih, vsebinskih povezav med pojmi v bibliografskih zbirkah. Nakazali smo tudi nekatere trende razvoja zdravstvene in medicinske informatike. Ne domišljamo si, da vidimo daleč v prihodnost. V razvoju informatike se je že večkrat zgodilo, da so izpopolnjene storitve in boljša ponudba informacij vzpodbudile nove potrebe in usmerile razvoj v nepričakovane smeri. Literatura Vsi spletni kazalci so bili preverjeni 10. 11. 2003. 1. O'Neill ET, FL Brian, R Bennett. Trends in the Evolution of the Public Web: 1998-2002. D-Lib Magazine 2003; 9. URL: http://www.dlib.org/dlib/april03/lavoie/04lavoie.html 2. Google. URL: http://www.google.com 3. Dimec J, Džeroski S, Todorovski L, Hristovski D. WWW search engine for Slovenian and English medical documents. In: Kokol P, Zupan B, Stare J et al eds. Medical informatics Europe '99. Amsterdam: IOS press, 1999: 547-52. 4. Seznam zdravstvenih spletnih portalov Fast Health. URL: http://www.fasthealth.com/dirs/health_portals2.php 5. Spletni portal Klinike Mayo. URL: http://www.mayoclinic.com/index.cfm 6. mD Consult. Clinical information for physicians. URL: http://www.mdconsult.com/ 7. Networked digital library of theses and disertations. URL: http://www.ndltd.org/ 8. Elektronske teze in disertacije. Zbirka magisterijev in doktoratov Medicinske fakultete Univerze v Ljubljani. URL: http://www.mf.uni-lj.si/ETD-mf/ 9. arXiv.org e-Print archive. URL: http://arxiv.org/ 10. Cogprints. Cognitive sciences e-prints archive. URL: http://cogprints.ecs.soton.ac.uk/ 11. CiteSeer. Scientific literature digital library. URL: http://citeseer.org/ 12. BioMedCentral. URL: http://www.biomedcentral.com/ 13. PubMedCentral. An archive of life science journals. URL: http://www.pubmedcentral.nih.gov/ 14. Fayyad UM, Piatetsky-Shapiro G, Smyth P. From data mining to knowledge discovery: An overview. AKDDM. AAAI/MIT Press 1996; 1-30. 15. The human genome project. URL: http://www.ornl.gov/TechResources/Human_Genome/home.html 16. Swanson DR. Fish oil, Raynaud's syndrome, and undiscovered public knowledge. Perspect Biol Med 1986; 30: 7-18. 17. Hristovski D, Peterlin B, Mitchell JA, Humphrey SM. Improving literature based discovery support by genetic knowledge integration. Stud Health Technol Inform 2003; 95: 68-73. 18. Hristovski D, Peterlin B. BITOLA - Biomedical Discovery Support System. URL: http://www.mf.uni-lj.si/bitola/