.• INFORMATICA MEDICA SLOVENICA Casopis Slovenskega društva za medicinsko informatiko Journal of the Slovenian Medical Informatics Association LETNIK / VOLUME 27 (2022), ŠTEVILKA / NO. 1-2 ISSN 1318-2129 (tiskana izdaja / printed edition) ISSN 1318-2145 (spletna izdaja / online edition) http://ims.mf.uni-lj.si/ Editor in Chief / Glavni urednik Gaj Vidmar Managing Editor / Odgovorna urednica Ema Dornik Associate Editors / Souredniki Kevin Doughty Malcolm Fisk Peter Juvan Technical and Web Editor / Tehnicni in spletni urednik Peter Juvan Editorial Board Members / Clani uredniškega odbora Barbara Artnik Andreja Kukec Brane Leskošek Drago Rudel Former Editors in Chief / Bivši glavni uredniki Martin Bigec Peter Kokol Janez Stare About the Journal Informatica Medica Slovenica (IMS) is an interdisciplinary professional journal that publishes contributions from the field of medical informatics, health informatics, nursing informatics and bioinformatics. Journal publishes scientific and technical papers and various reports and news. Especially welcome are the papers introducing new applications or achievements. IMS is the official journal of the Slovenian Medical Informatics Association (SIMIA). It is published two times a year in print (ISSN 1318-2129) and electronic editions (ISSN 1318-2145, available at http://ims.mf.uni-lj.si). Prospective authors should send their contributions in Slovenian, English or other acceptable language electronically to the Editor in Chief Prof. Gaj Vidmar, PhD. Detailed instructions for authors are available online. The journal subscription is a part of the membership in the SIMIA. Information about the membership or subscription to the journal is available from the secretary of the SIMIA (Mrs. Mojca Paulin, mojca.paulin@gmail.com). O reviji Informatica Medica Slovenica (IMS) je interdisciplinarna strokovna revija, ki objavlja prispevke s podrocja medicinske informatike, informatike v zdravstvu in zdravstveni negi, ter bioinformatike. Revija objavlja strokovne prispevke, znanstvene razprave, porocila o aplikacijah ter uvajanju informatike na podrocjih medicine in zdravstva, pregledne clanke in porocila. Še posebej so dobrodošli prispevki, ki obravnavajo nove in aktualne teme iz naštetih podrocij. IMS je revija Slovenskega društva za medicinsko informatiko (SDMI). Izhaja dvakrat letno v tiskani (ISSN 1318-2129) in elektronski obliki (ISSN 1318­2145, dostopna na naslovu http://ims.mf.uni-lj.si). Avtorji clankov naj svoje prispevke pošljejo v elektronski obliki glavnemu uredniku prof. dr. Gaju Vidmarju. Podrobnejša navodila so dosegljiva na spletni strani revije. Revijo prejemajo vsi clani SDMI. Informacije o clanstvu v društvu oziroma o narocanju na revijo so dostopne na tajništvu SDMI (Mojca Paulin, mojca.paulin@gmail.com). Contents Research Papers Mirza Tupkušic, Rok Blagus Over-optimistic Assessment of the Performance of Prediction Models: An Illustration Based on the Joint Use of Sampling Techniques and Cross-Validation 14 Živa Rant, Hajdi Kosednar, Dalibor Stanimirovic The Role and Importance of the Service Desk for eHealth Solutions in Slovenian Health Care Research Review Paper 20 Žiga Lovšin, Barbara Artnik Data Sources on Oral Health in Slovenia Technical Papers 27 Sara Mocnik, Dejan Dinevski, Hojka Gregoric Kumperšcak The Usage of Artificial Intelligence to Diagnose and Treat Individuals with Borderline Personality Disorder 33 Mojca Dovnik, Jože Balažic, Dejan Dinevski Potentials of Artificial Intelligence for Use in Forensic Medical Practice SIMIA Bulletin 42 Ema Dornik, Boštjan Žvanut MI'2022 “Decisively Digital for More Health”: Report from the Meeting of the Nursing Informatics Section – SIZN 2022 Tutorial 44 Andrej Kastrin Knowledge Networks and Their Use in Biomedicine Vsebina Izvirna znanstvena clanka 1 Mirza Tupkušic, Rok Blagus Preoptimisticne ocene tocnosti napovednih modelov: ilustracija na primeru skupne uporabe tehnik vzorcenja in navzkrižnega preverjanja 14 Živa Rant, Hajdi Kosednar, Dalibor Stanimirovic Vloga in pomen Centra za pomoc uporabnikom rešitev eZdravja v slovenskem zdravstvu Pregledni znanstveni clanek 20 Žiga Lovšin, Barbara Artnik Viri podatkov na podrocju ustnega zdravja v Sloveniji Strokovna clanka 27 Sara Mocnik, Dejan Dinevski, Hojka Gregoric Kumperšcak Uporaba umetne inteligence za diagnosticiranje in zdravljenje oseb z mejno osebnostno motnjo 33 Mojca Dovnik, Jože Balažic, Dejan Dinevski Potenciali umetne inteligence za uporabo v sodnomedicinski praksi Bilten SDMI 42 Ema Dornik, Boštjan Žvanut MI'2022 “Odlocno digitalno za vec zdravja”: porocilo s srecanja Sekcije za informatiko v zdravstveni negi – SIZN 2022 Študijsko gradivo 44 Andrej Kastrin Omrežja znanja in njihova uporaba v biomedicini • Izvirni znanstveni clanek Mirza Tupkušic, Rok Blagus Preoptimisticne ocene tocnosti napovednih modelov: ilustracija na primeru skupne uporabe tehnik vzorcenja in navzkrižnega preverjanja Povzetek. Napovedni modeli uporabljajo razlicne statisticne metode za gradnjo pravil za uvršcanje enot v posamezno skupino na podlagi ucnih podatkov. Podatki v praksi obicajno niso primerni za postopek gradnje pravila, pac pa jih je potrebno predprocesirati. Tak primer so neuravnoteženi podatki, kjer dobimo slabo napovedno tocnost za manjši razred, ce se razvršcanja lotimo naivno. Z razlicnimi popravki podatkov se da izboljšati tocnost napovednega modela. Toda pri tem je treba paziti, da delovanje razvršcevalca oziroma njegovo tocnost pravilno ovrednotimo, saj v primeru napacnega ovrednotenja lahko pride do preoptimisticne ocene tocnosti napovednega modela. Ta problem podrobno razložimo in prikažemo dejavnike, ki vplivajo na preoptimizem pri ocenjevanju tocnosti napovednih modelov. Rezultate ilustriramo na razlicnih primerih, kjer uporabljamo razlicne mere napovedne tocnosti, razlicne metode za uravnoteženje podatkov ter razlicne nacine navzkrižnega preverjanja. Rezultati lahko pomagajo razvijalcem napovednih modelov pri pravilnem ovrednotenju dejanske napovedne moci modela oziroma pri razumevanju in kriticnemu ovrednotenju, ali je bila ocena napovedne moci modela izvedena pravilno ali pa so rezultati zaradi napacne izvedbe preoptimisticni. Kljucne besede: napovedni model; neuravnoteženi podatki; navzkrižno preverjanje; preprileganje. Over-optimistic Assessment of the Performance of Prediction Models: An Illustration Based on the Joint Use of Sampling Techniques and Cross-Validation Abstract. Prediction models use various statistical methods for building classification rules to classify units into pre-specified groups based on the learning data. In practice, the data are often not suitable for the chosen procedure and they need to be pre-processed before training the classifier. An important example are imbalanced data where the naďve approach can lead to poor accuracy for the minority class. Many data augmentation approaches have been developed to alleviate this issue. However, when using these techniques, one needs to be careful to correctly evaluate the performance of the classifier in terms of its predictive accuracy, because incorrect evaluation can lead to an overly optimistic estimate of the classifier’s performance. We explain in detail why this happens and showcase the different contributing factors. The results are illustrated using various performance measures, various data augmentation techniques, and various cross-validation techniques. Our results can help the developers of prediction models to correctly evaluate predictive ability of the derived model, as well as to understand and critically appraise whether the predictive ability of the model was correctly estimated or the evaluation was too optimistic. Key words: prediction models; cross-validation; rare events; overfitting. . Infor Med Slov 2022; 27(1-2): 1-13 Institucije avtorjev / Authors' institutions: Medicinska fakulteta, Univerza v Ljubljani (MT, RB); Fakulteta za šport, Univerza v Ljubljani (RB); FAMNIT, Univerza na Primorskem, Koper (RB). Kontaktna oseba / Contact person: izr. prof. dr. Rok Blagus, MF, IBMI, Vrazov trg 2, 1000 Ljubljana. E-pošta / E-mail: rok.blagus@mf.uni-lj.si. Prispelo / Received: 28. 11. 2022. Sprejeto / Accepted: 24. 12. 2022. Uvod Napovedovanje lahko definiramo kot problem ocenjevanja in odlocanja na podlagi znanih podatkov.1 V vsakdanjem življenju se vseskozi srecujemo z nalogami ali vprašanji, na katera želimo odgovoriti cim bolj pravilno. Cloveški odgovori so subjektivni, zato so lahko povsem napacni. Zaradi tega postajajo racunalniško izdelani napovedni modeli (angl. prediction models) vse bolj priljubljeni, še zlasti na podrocju medicine,2-7 pogosto pa se uporabljajo tudi na drugih podrocjih, npr. v trženju in strojništvu.8 V klinicnih raziskavah nas pogosto zanima verjetnost ali napoved, da bo pacient zbolel za doloceno boleznijo, kako se bo odzval na zdravljenje ipd. Podobno velja na drugih podrocjih, npr. za odliv strank iz podjetja ali cas do okvare stroja. V medicini so napovedni modeli posebej pomembni v okviru presejalnih programov za zgodnje odkrivanje dolocene bolezni,9 na primer raka. Gradnjo oziroma razvoj napovednih modelov razdelimo v tri faze: ¦ faza 1: priprava podatkov; ¦ faza 2: gradnja/ucenje razvršcevalca; ¦ faza 3: preverjanje tocnosti razvršcevalca. V prvi fazi pripravimo podatke za izgradnjo modela oziroma za ucenje razvršcevalca (angl. classifier). Gradnjo razvršcevalca pogosto otežuje narava zbranih podatkov: v podatkih se lahko pojavljajo manjkajoce vrednosti, napake, osamelci, veliko število spremenljivk itd. V tem clanku se bomo osredotocili na pogost problem, ko so podatki v dveh razredih neuravnoteženi (angl. unbalanced data),10-12 se pa podobne težave pojavijo tudi v primeru nadomešcanja manjkajocih podatkov, izlocanja osamelcev iz podatkov, izbire spremenljivk za analizo ipd. O neuravnoteženih podatkih govorimo, ko se število enot med razredoma razlikuje. Na podrocju medicine je obicajno število pacientov z doloceno boleznijo veliko manjše kot število zdravih ljudi; podobno je število strank, ki ostanejo v podjetju, praviloma veliko vecje od števila strank, ki podjetje zapustijo. Razred z vecjim številom enot imenujemo vecinski razred (angl. majority class), razred z manjšim številom enot pa manjšinski razred (angl. minority class). Gradnja napovednega modela na podlagi neuravnoteženih podatkov je problematicna predvsem zaradi slabe napovedne tocnosti v manjšinskem razredu.12 Preprosto povedano, do tega pride, ker se razvršcevalcu, ki želi minimizirati celotno napako, izplaca osredotociti na vecinski razred, posledica pa je slaba tocnost za manjšinski razred. Mogoca rešitev tega problema, ki dokazano deluje dobro, so razlicne metode za uravnoteženje razredov.10,13-17 Tovrstne metode izboljšajo napovedano tocnost modela v manjšinskem razredu tako, da zmanjšajo neravnotežje v podatkih ali pa da celo izenacijo število enot v vecjem in manjšem razredu.13 K temu lahko pristopimo na vec nacinov. Razreda lahko uravnotežimo z vecanjem števila enot v manjšinskem razredu (angl. oversampling), zmanjševanjem števila enot v vecinskem razredu (angl. undersampling) ali kombinacijo teh dveh pristopov.10,13 Ko smo koncali prvo fazo uravnoteženja podatkov, lahko pristopimo k fazi ucenja. Enote, za katere poznamo pripadnost razredu, uporabimo za izgradnjo modela ali razvršcevalca, na podlagi katerega bomo uvršcali nove enote.1 Obstaja množica razlicnih razvršcevalcev.18 V ilustraciji bomo uporabili grebensko regresijo (angl. ridge regression),19-23 so pa ugotovitve splošne in v podobni meri veljajo tudi za druge razvršcevalce. Ko razvršcevalec izgradimo in s tem koncamo drugo fazo, bi seveda radi ovrednotili njegovo tocnost oziroma ocenili njegovo napako. Na voljo so razlicne mere tocnosti.24 Pri izbiri ustrezne mere tocnosti moramo biti previdni, še posebej, ko imamo opraviti z neuravnoteženimi podatki.25 V ilustraciji bomo uporabljali plošcino pod krivuljo ROC26 (mero AUC),24,27 tocnost za manjšinski in vecinski razred, njuno geometrijsko sredino (..-povprecje)28 ter mero .., ki se pogosto uporabljajo v tem kontekstu. Idealno bi se tocnost razvršcevalca ovrednotila na (veliki) neodvisni tesni množici,1,18 ki pa v praksi pogosto ni dostopna. Za preverjanje tocnosti razvršcevalca se zato pogosto uporabi navzkrižno preverjanje s k pregibi (angl. k-fold cross-validation – CV) oziroma njegova razlicica navzkrižno preverjanje z izpustitvijo ene enote (angl. leave-one-out CV – LOOCV), za katero velja ..= .., kjer je .. velikost ucne množice. Pisali bomo ..= ..+ .., kjer je .. število enot v manjšinskem razredu, .. število enot v vecinskem razredu in velja ..< ... Problem napacnega ovrednotenja tocnosti napovednih modelov v razlicnih kontekstih (npr. v kontekstu izbire spremenljivk v prvi fazi) je znan.29,30 Raziskave kažejo na nujnost pravilnega ovrednotenja tocnosti delovanja razvršcevalcev: v primeru napacnega ovrednotenja je delovanje napovednega modela lahko slabše ali boljše, kot je predstavljeno. V clanku bomo ilustrirali, kakšen je vpliv napacne uporabe navzkrižnega preverjanja na oceno tocnosti napovednega modela ob uporabi razlicnih pristopov za uravnoteženje podatkov. Pokazali bomo, da napacna uporaba navzkrižnega preverjanja vodi do precenjenih mer tocnosti, in prikazali razlicne dejavnike, ki na to vplivajo. Rezultati so pomembni, ker je bilo doslej objavljenih precej clankov, kjer je bilo navzkrižno preverjanje izvedeno napacno (npr. v kombinaciji s prevzorcenjem31-33), objavljene mere tocnosti pa so posledicno preoptimisticne. Podobno tematiko smo že obravnavali,34 s to razliko, da se tokrat bolj osredotocamo na oris in pomembnost posameznih dejavnikov, ki vplivajo na preoptimizem zaradi napacne uporabe navzkrižnega preverjanja, manj pa na pojasnjevanje razlogov, zakaj do tega pride. V pricujocem clanku obravnavamo tudi razlicne mere tocnosti, ki jih v prvotnem34 nismo. V nadaljevanju najprej predstavimo uporabljene metode, kjer na kratko orišemo razlicne pristope za uravnoteženje podatkov, uporabljeni razvršcevalec in mere tocnosti. Sledi ilustracija, kjer prikažemo vpliv razlicnih dejavnikov na precenjenost ocene tocnosti napovednega modela. Clanek zakljucimo s kratkim povzetkom kljucnih ugotovitev. Metodologija V nadaljevanju bolj podrobno predstavljamo metode, ki jih kasneje v ilustraciji uporabljamo v posameznih fazah razvoja napovednega modela. Metode za uravnoteženje razredov V ilustraciji bomo uporabili tri razlicne metode uravnoteženja razredov. Pri nakljucnem prevzorcenju (angl. random oversampling) nakljucno s ponavljanjem izberemo ..=..-.. enot iz manjšega razreda, izbrane enote kopiramo in jih dodamo v nabor podatkov.35 Tako se manjšinski razred poveca za .. neinformativnih enot, popolnih kopij prvotnih enot iz manjšinskega razreda. Metoda prevzorcenja torej uravnoteži razrede z znanimi enotami, zato uravnoteženi podatki ne nosijo nobene dodatne informacije kot izvorni, so le (umetno) uravnoteženi. Posledicno so lahko ob uporabi napacnega pristopa navzkrižnega preverjanja iste enote uporabljene v fazi ucenja in preverjanja tocnosti razvršcevalca in zato zaradi problema preprileganja (angl. overfitting18) dobimo preoptimisticno oceno tocnosti. O preprileganju na primer govorimo, ko je v fazi preverjanja tocnosti razvršcevalca vrednost AUC velika, a je uspešnost razvršcevalca na neznanih (novih) podatkih mnogo slabša. Pri nakljucnem podvzorcenju (angl. random undersampling) nakljucno (obicajno brez ponavljanja) izberemo ..=.. enot iz vecinskega razreda.12 Izbrane enote vecinskega razreda združimo z enotami manjšinskega razreda v novi podatkovni okvir. Na tak nacin ostane število enot v manjšinskem razredu nespremenjeno, število enot v vecinskem razredu pa je za ..-.. manjše. Posledicno v fazi ucenja razvršcevalca lahko izpustimo pomembno informacijo, ki se nanaša na vecinski razred, kar se lahko odrazi v slabši napovedni tocnosti v vecinskem razredu. Izgubo informacije se lahko omili z veckratnim nakljucnim podvzorcenjem, kar lahko bistveno poveca tocnost razvršcevalca,12 a za namen naše analize to ni zelo pomembno, zato tega ne bomo podrobneje obravnavali. Metoda podvzorcenja uravnoteži razrede z izgubo informacije, zato so uravnoteženi podatki manj informativni kot izvorni. Toda ker nobena enota ni podvojena, do problema preprileganja, ki nastopi pri nakljucnem prevzorcenju, pri nakljucnem podvzorcenju ni. Bi pa do podobnega problema vseeno prišlo, ce so enote, ki se jih obdrži v vecinskem razredu, izbere sistematicno36,37 (s tem se podrobneje ne bomo ukvarjali). SMOTE (angl. Synthetic Minority Oversampling Technique) je metoda kjer se hkrati podvzorci in prevzorci, pri cemer se pri prevzorcenju tvorijo sinteticni podatki za manjšinski razred (v primarni definiciji je metoda SMOTE vezana le na sinteticno prevzorcenje, vendar obstaja vec izvedb, med katerimi se bomo osredotocili na kombinacijo prevzorcenja in podvzorcenja).13 S tvorjenjem sinteticnih enot metoda SMOTE pomaga pri premagovanju problema preprileganja, a ga ne odpravi povsem. V manjšinskem razredu metoda nakljucno izbere eno enoto .. (angl. random minority), nato pa poišce njenih .. najbližjih sosedov .. (angl. ..-nearest neighbours38). Nato izracuna razdaljo med izbrano enoto in .. najbližjimi sosedi, na kateri nakljucno tvori eno ali vec sinteticnih enot .., ..= ..+ ........0,1..-....=1,…, .. (1) Ô Ô kjer ........(0,1) oznacuje nakljucno vrednost iz enakomerne porazdelitve na intervalu (0,1). Tako nove enote niso identicne obstojecim, pac pa so njihove linearne kombinacije (slika 1). Med tvorbo novih sinteticnih enot metoda SMOTE lahko izvaja podvzorcenje.13 Postopek se konca, ko dosežemo želeno (ne)ravnotežje števila enot v manjšem in vecjem razredu (obicajno podatke povsem uravnotežimo). Ker nove (sinteticne) enote niso popolnoma neodvisne od osnovnih enot (saj so tvorjene z uporabo informacij o osnovnih enotah), lahko seveda pride do problema preprileganja; o tem vec kasneje. Slika 1 Nacelo delovanja metode SMOTE (angl. Synthetic Minority Oversampling Technique). Navzkrižno preverjanje s k pregibi Navzkrižno preverjanje s k pregibi je ena izmed metod, ki jih lahko uporabimo za oceno razvrstitvene tocnosti.18 V navzkrižnem preverjanju s k pregibi je podatkovni okvir razdeljen na k podmnožic (angl. folds): ..-1 podmnožic uporabljamo za gradnjo razvršcevalca, eno podmnožica pa za oceno njegove tocnosti. Podmnožice ustvarimo tako, da je število enot v vsaki podmnožici enako in je delež enot manjšinskega in vecinskega razreda v vsaki podmnožici enak kot v osnovni množici. Iterativni postopek ponovimo k-krat, tako je vsaka izmed k podmnožic enkrat uporabljena kot testna množica (slika 2).24 Navzkrižno preverjanje z izpustitvijo ene enote je skrajna razlicica navzkrižnega preverjanja s k pregibi: ..-1 enot uporabljamo za gradnjo razvršcevalca, eno enoto pa uporabimo za preverjanje njegove tocnosti. Iterativni postopek ponovimo ..-krat, tako je vsaka enota enkrat uporabljena kot testna množica. Izvedba z izpustitvijo ene enote je seveda racunsko in casovno najbolj zahtevna. Slika 2 Navzkrižno preverjanje s k pregibi. Pri uporabi navzkrižnega preverjanja imamo dve možnosti, kako izracunati neko mero tocnosti. Prva možnost je, da tocnost izracunamo za vsak pregib posebej in potem povprecimo k tako dobljenih ocen. Druga možnost je, da vse napovedi združimo in mero tocnosti izracunamo zgolj enkrat. Katera izbira je pravilna je odvisno med drugim tudi od uporabljene mere tocnosti in je še vedno predmet razprave.39 Zaradi primerljivosti med razlicnimi oblikami navzkrižnega preverjanja bomo uporabili drugo možnost (ki je v primeru LOOCV edina možnost, ce želimo oceniti AUC), za katero je sicer znano, da vodi do pristranske ocene AUC in pravilne ocene mere F1;39 s podrobno primerjavo obeh pristopov se ne bomo ukvarjali. Pri skupni izvedbi navzkrižnega preverjanja in ene izmed metod uravnoteženja razredov moramo paziti, da oba postopka izvedemo pravilno. Ce najprej uravnotežimo podatke, potem pa uporabimo navzkrižno preverjanje, smo slednje izvedli napacno (slika 3). Navzkrižno preverjanje je pravilno, ce proces uravnoteženja podatkov izvedemo znotraj postopka navzkrižnega preverjanja. V pravilni izvedbi navzkrižnega preverjanja metode uravnoteženja razredov uporabljamo samo na ucni množici, kar pomeni, da moramo uravnoteženje razredov k-krat (oziroma v primeru LOOCV ..-krat) ponoviti (slika 3). Slika 3 Napacna (levo) in pravilna (desno) izvedba navzkrižnega preverjanja s k pregibi in nakljucnega prevzorcenja. Razvršcevalec Grebenska regresija19 je statisticna metoda, s katero lahko izboljšamo tocnost napovedi z zmanjšanjem ocen parametrov (t. i. krcenjem, angl. shrinkage).23 Z dodajanjem penalizacijske funkcije (angl. penalising function) spreminja oziroma zmanjša ocenjeno vrednost regresijskega koeficienta, s cimer poskušamo zmanjšati problem preprileganja. Splošni regresijski model lahko zapišemo v matricni obliki kot ..= ....+ .., kjer so .. izidi, .. napovedne spremenljivke, .. regresijski koeficienti, .. pa nakljucne napake.18 Regresijske koeficiente z grebensko regresijo dobimo tako, da rešimo optimizacijski problem á ă Ř 6 ..= ............ ..-..-....+ ....j (2), Ý 5 5 5 kjer je .. uglaševalski parameter. Opazimo, da za ..=0 dobimo enako rešitev, kot ce uporabljamo standardna orodja (denimo metodo najvecjega verjeta40), medtem ko za ..= 8 vse ocene postavimo na nic. Parameter .. se obicajno doloci s navzkrižnim preverjanjem.41 Ce želimo zgornji model uporabiti za (binarno) razvršcanje, moramo enotam dolociti vrednost izidov, ... V našem primeru bomo enotam iz manjšinskega razreda dolocili vrednost 0, enotam iz vecinskega razreda pa vrednost 1 (lahko bi uporabili tudi obratno definicijo, rezultati pa bili enaki). Ko izberemo parameter .. in pridobimo ocene regresijskih koeficientov, lahko na podlagi teh ocen izracunamo verjetnost dogodka, ki jo oznacimo s ..^. Za izracun nekaterih mer tocnosti (npr. AUC) lahko ..^ uporabimo neposredno, medtem, ko moramo za izracun drugih mer (npr. napovedne tocnosti) verjetnostno napoved spremeniti v napoved vrednosti 0 ali 1 (ki jo oznacimo z ..), za kar lahko uporabimo pravilo 1 c....^.. ..Ü = (3), 0 c....^ < .. kjer je .. prag za uvršcanje. Ce velja ..^ = .., enoto nakljucno uvrstimo v enega izmed razredov. Ker (podobno kot v obicajni logisticni regresiji) velja, da so ocenjene verjetnosti zgošcene okrog neravnotežja v ucni množici, naivna uporaba ..=0,5 za neuravnotežene podatke praviloma ni ustrezna.12 V ilustraciji bomo zato kot prag za uvršcanje uporabljali delež dogodkov na (uravnoteženi) ucni množici. Mere razvrstitvene tocnosti Za oceno tocnosti razvršcanja bomo izracunali plošcino pod krivuljo ROC (angl. area under the curve – AUC),24 ..-povprecje (angl. ..-mean) kjer je .... število pravilno uvršcenih enot iz manjšinskega razreda, .... število napacno uvršcenih enot iz vecinskega razreda, .... število pravilno uvršcenih enot iz vecinskega razreda, .... število napacno uvršcenih enot iz manjšinskega razreda, ....= in ....= pa sta tocnost za manjšinski invecinski razred, ter mero ..5 2.... ..5 =2....+ ....+ .... (5). Pri izracunu AUC bomo uporabljali verjetnostno napoved ..^, za izracun ostalih mer pa bomo uporabljali .., ki ga dobimo, kot je pojasnjeno zgoraj. Implementacija metod v programskem jeziku R Za izvedbo metode nakljucnega prevzorcenja uporabljamo funkcijo upSample(x, y, list = FALSE, yname = class) iz paketa caret, kjer je x matrika ali podatkovni okvir vrednosti enot za vsako spremenljivko, y indikatorska spremenljivka, ki doloci pripadnost, in argument yname doloci ime spremenljivke, ki nam pove pripadnost posamezne enote v izhodu funkcije. Funkcija dela enako, kot je opisano v razdelku o metodah za uravnoteženje razredov: razreda uravnotežimo z nakljucnim dodajanjem enot manjšinskega razreda s ponavljanjem v nabor podatkov. Za izvedbo nakljucnega podvzorcenja uporabljamo funkcijo downSample(x, y, list = FALSE, yname = class), iz paketa caret. Funkcija ima enake argumente kot funkcija za nakljucno prevzorcenje. Tudi ta funkcija deluje enako, kot je opisano zgoraj. Za izvedbo metode SMOTE uporabljamo funkcijo SMOTE(formula, data, perc.over = 100, k = 5, perc.under = 200, …) iz paketa DMwR. Z argumentom formula zapišemo napovedni model, z argumentom data podamo orginalni neuravnoteženi podatkovni okvir, z argumentom perc.over definiramo število dodanih sinteticnih enot, z argumentom k definiramo število najbližjih sosedov, z argumentom perc.under pa definiramo število izbrisanih enot v vecinskem razredu. Funkcija vrednosti perc.over in perc.under deli s 100, dobljeni vrednosti pa dolocita, koliko novih enot v vsaki ponovitvi dodamo in odstranimo. Za vpogled v ostale parametre, ki jih lahko nastavimo v funkciji, priporocamo pregled dokumentacije paketa DMwR. Za ogled izvorne kode priporocamo ogled funkcije SMOTE(form, data, perc.over = 200, k = 5, perc.under = 200, learner = NULL, …) in smote.exs(data, tgt, N, k) na spletu (https://rdrr.io/cran/DMwR/src/R/smote.R). Funkcijo smo uporabili na dva nacina: pri prvem nacinu smo uporabili perc.over = 100, perc.under = 200; pri drugem pa perc.over = 400, perc.under = 100. Za ucenje razvršcevalca, ki smo ga predstavili istoimenskem razdelku, uporabljamo funkcijo glmnet(x, y, alpha = 0, lambda, …) iz paketa glmnet. Z argumentom x definiramo matriko neodvisnih spremenljivk, z y definiramo odzivno (indikatorsko) spremenljivko in z argumentom lambda nastavimo vrednost parametra .. Optimalno vrednost parametra . dolocimo s pomocjo funkcije cv.glmnet(x, y, alpha = 0, nfolds = 10, …), ki doloci optimalno vrednost na podlagi navzkrižnega preverjanja z 10 pregibi; ostali vhodni argumenti, x, y in alpha, so enaki kot pri funkciji glmnet. Za izracun napovedi uporabimo funkcijo predict(ovject, s, newx, type, …) iz paketa stats. Z argumentom object dolocimo model, za katerega želimo izracunati napovedi, argument s doloca optimalno vrednost ., argument newx doloca vrednosti napovednih spremenljivk in z argumentom type dolocimo tip izhoda, ki ga vrne funkcija (v našem primeru je to ocenjena verjetnost dogodka). AUC izracunamo s pomocjo funkcije auc() iz paketa pROC, meri ..in ..5 mero pa izracunamo po zgoraj predstavljeni definiciji. Navzkrižno preverjanje s k pregibi in z izpustitvijo ene enote smo sprogramirali sami, kot je opisano v razdelku o navzkrižnem preverjanju. Ilustracija Za primer nakljucnega prevzorcenja lahko izracunamo verjetnost, da je enota iz manjšega razreda hkrati vkljucena v ucno in testno množico, ce navzkrižno preverjanje izvedemo napacno (ce navzkrižno preverjanje izvedemo pravilno, je ta verjetnost seveda nic, enako pa velja tudi za primer, ko uporabimo nakljucno podvzorcenje, tudi ce navzkrižno preverjanje izvedemo napacno, kar smo že pojasnili). Verjetnost, da je ista enota vkljucena v ucno in testno množico, je odvisna od števila enot v podatkovnem okvirju, deleža enot, vkljucenih v testno množico ../ , in deleža enot v manjšinski množici ..á = ....: l ..-.. / ..p ..=1 -....ç -.. .. (6). l ..-1/ ....ç -1 Z manjšanjem deleža enot v manjši množici .. se verjetnost povecuje (slika 4). Ce imamo opravka z neuravnoteženimi podatki (npr. ..á =0.1), metoda prevzorcenja veckrat v podatkovni okvir doda veliko obstojecih enot, zaradi cesar se bolj pogosto zgodi, da imamo pri napacnem navzkrižnem preverjanju v ucni in testni množici vkljucene iste enote. Ce je delež enot v manjši množici blizu vrednosti 0,5, metoda prevzorcenja v podatkovni okvir doda manjše število podvojenih enot, posledicno se redkeje zgodi, da je v primeru napacnega navzkrižnega preverjanja ena enota vkljucena v ucno in testno množico hkrati. Z manjšanjem deleža enot v testni množici .. se verjetnost povecuje (slika 4). To pomeni, da se verjetnost povecuje z vecanjem števila podmnožic .. pri navzkrižnem preverjanju. Posledicno ima navzkrižno preverjanje z izpustitvijo ene enote, ki predstavlja skrajni primer navzkrižnega preverjanja s.. pregibi (..=..), pri vsakem številu enot .. in ..á vedno najvecjo verjetnost. Na omenjeno verjetnost lahko vplivamo tudi s številom enot v podatkih, pri cemer se z vecanjem števila enot se verjetnost zmanjšuje. Ko za prevzorcenje uporabljamo metodo SMOTE, je verjetnost, da bo ista enota vkljucena v testni in ucni množici, seveda enaka nic, vendar pa so lahko v primeru napacne izvedbe navzkrižnega preverjanja v testni množici vkljucene podobne enote kot v ucni. Spomnimo, da z metodo SMOTE ne ustvarjamo kopij enot iz manjšinskega razreda, temvec njihove linearne kombinacije, te linearne kombinacije (novi sinteticni podatki) pa vsebujejo tudi informacijo, ki je vkljucena v osnovnih podatkih, zato ti novi podatki nikakor niso neodvisni od prvotnih. Slika 4 Verjetnost, da je vsaj ena enota vkljucena v ucno in testno množico, v odvisnosti od deleža enot v manjšinskem razredu (..). Ceprav sinteticne enote niso identicne prvotnim, je torej v primeru napacne izvedbe navzkrižnega preverjanja v testni množici prisotna informacija, ki smo jo dobili neposredno iz ucne množice, kar lahko vodi do preprileganja in preoptimisticne ocene. V nadaljevanju podrobneje ilustriramo, kakšen je vpliv napacne izvedbe navzkrižnega preverjanja na (pre)optimisticno oceno razlicnih mer tocnosti. V ilustraciji uporabljamo podatke, ki smo jih simulirali neodvisno iz standardne normalne porazdelitve za vse enote iz ucne množice; odlocitev o uporabi konkretne porazdelitve ni bistvena, podobne ugotovitve bi veljale tudi za druge porazdelitve. V simulaciji smo spreminjali število neodvisno generiranih spremenljivk .., število enot .., delež enot v manjšem razredu .. in delež enot v testni množici ..ç (preko razlicne izbire števila pregibov ..=2,10,.. v navzkrižnem preverjanju); podatke smo simulirali stokrat in rezultati, o katerih porocamo, so povpreceni cez 100 ponovitev. Naj poudarimo, da simuliramo na nacin, da med razredoma dejansko ni razlike: tocna vrednost AUC je enaka 0,5, ....5 +....6 =1 in zato .. =....(1-....)=....(1-....) in ()..5 =Ů =Ů Ce dobimo Ů . vrednosti, ki odstopajo od pravih, tocnosti napovednega modela nismo pravilno ovrednotili: ce so ocene vecje od pravih, smo delovanje napovednega modela precenili, ce so manjše, pa podcenili. Ce bi med razredoma obstajale razlike, bi bili zakljucki podobni predstavljenim. Naj na tem mestu opomnimo, da smo pri izracunu pravih mer tocnosti za našo ilustracijo predpostavljali zgolj, da je razvršcevalec neinformativen, torej tak, za katerega velja ....5 +....6 =1. To je (malenkost) bolj splošna zahteva, kot ce bi bil razvršcevalec nakljucen, torej tak, za katerega velja ....=....=1/2. 6 Opazimo lahko, da je vsak nakljucen razvršcevalec tudi neinformativen, ni pa vsak neinformativen razvršcevalec tudi nakljucen. Ilustrirajmo to na primeru, ko se o razredu odlocimo glede na met kovanca. V prvem primeru denimo, da je kovanec pošten (verjetnost grba je 12), v drugem pa, da je verjetnost grba enaka ...12. V prvem primeru bo / seveda v povprecju (!) veljalo (kot vemo iz osnov verjetnosti) ....=....=1/2, v drugem pa ....= 6 5 )/ / (......=.. in ....=(1-..)....=1-... V 6 obeh primerih gre za neinformativen razvršcevalec, vendar pa je zgolj prvi razvršcevalec tudi nakljucen. Ignoriranje problema neuravnoteženih razredov Najprej bomo prikazali, kaj se zgodi, ko zanemarimo problem neuravnoteženih razredov, torej izpustimo prvo fazo gradnje napovednega modela. Ilustracija se nanaša na primer, ko spreminjamo delež enot v manjšem razredu: ..á =0,1,0,2,…,0,5. Ostali Vrednosti ..-povprecja in mere .. so enake pravim vrednostim, saj v tretji fazi nismo naredili nobene napake, zaradi katere bi prišlo do preoptimisticnih ocen. Za razliko od ..-povprecja in mere.. pa so ocenjene vrednosti AUC ob uporabi LOOCV premajhne, do cesar pride zaradi napake, ki smo jo naredili, ko smo združevali ocene razlicnih pregibov. Ko smo združili napovedane verjetnosti v posameznih pregibih, smo namrec združili nezdružljive ocene: združili smo ocene, ki so bile pridobljene na ucnih množicah z razlicnimi neravnotežji (neravnotežje je seveda drugacno, ko izpustimo enoto iz manjšinskega oziroma vecinskega razreda). Ko uporabljamo ..=2 in ..=10, do tega problema seveda ne pride, ker pregibe ustvarjamo tako, da je neravnotežje ves cas enako. Ce bi pri izracunu AUC uporabljali napovedani razred (..) in ne ocenjene verjetnosti (..^), bi bila tudi ob uporabi LOOCV za vsak .. AUC pravilno ovrednotena (bila bi enaka 0.5). To je tudi razlog, zakaj sta ..­povprecje in mera .. pravilno ocenjena tudi, ce uporabimo LOOCV. Slika 5 Navzkrižno preverjana tocnost razvršcevalca za razlicna neravnotežja v podatkih (..). Pojasnimo ta problem bolj podrobno na primeru, ko velja ..= 8 (dejansko so bile pri nas ocenjene vrednosti za .. zelo velike, kar je pricakovano, saj to pomeni, da model pravilno ugotovi, da spremenljivke niso pomembne za pojasnjevanje izida). V tem primeru je namrec ocenjena verjetnost tocno enaka deležu dogodkov v ucni množici.23 To pomeni, da je enaka ..^ŕ = .. /(..-1) za vse enote iz manjšinskega razreda (ki ga kodiramo z vrednostjo 0 – nedogodek) in ..=(..-1)(..-1) za vse enote iz vecinskega ^é /razreda (ki ga kodiramo z 1 – dogodek). Opazimo, da velja ..^ŕ > ..^: vse enote iz manjšega razreda so rangirane višje od enot iz vecjega razreda (imajo vecjo verjetnost, da spadajo v vecinski razred), zato je AUC enaka nic (spomnimo se interpretacije AUC: to je verjetnost, da bo razvršcevalec nakljucno izbran dogodek rangiral višje kot nedogodek24). Ce ocenjeno verjetnost spremenimo v razred, opazimo, da vsako enoto popolnoma nakljucno uvrstimo v enega izmed razredov (enacba 3), posledicno je AUC (v povprecju!) enaka 0,5 in do problema podcenjene AUC ne pride. Odvisnost preoptimisticne ocene od deleža enot v manjšem razredu Vsi parametri se enaki kot v prejšnjem primeru (..= 300, ..= 1000, ..0,1, 0,2, … , 0,5), le á = da tu uporabimo eno od treh predstavljenih metod za uravnoteženje podatkov ter primerjamo rezultate pravilne in napacne uporabe navzkrižnega preverjanja. Na sliki 6 smo prikazali razliko med pravilno in napacno izvedbo navzkrižnega preverjanja s .. pregibi (..=2, 10 in ..), ob uporabi razlicnih metod za uravnoteženje podatkov, pri razlicni vrednosti deleža enot v manjšinskem razredu. V primeru pravilne izvedbe navzkrižnega preverjanja so vse mere pravilno ocenjene. Zanimivo, opazimo, da do podcenjenega AUC v primeru uporabe LOOCV v tem primeru ne pride. V kolikor uporabimo napacno navzkrižno preverjanje v kombinaciji s podvzorcenjem, potem sta AUC in ..-povprecje ocenjena pravilno; izjema je AUC ob uporabi LOOCV, o razlogih za to pa smo govorili že v prejšnjem primeru. Slika 6 Navzkrižno preverjana tocnost razvršcevalca v visokorazsežnem prostoru za razlicne velikosti manjšinskega razreda ob skupni uporabi razlicnih metod za uravnoteženje podatkov in razlicnih izvedb navzkrižnega preverjanja. Spomnimo, s podvzorcenjem v testno množico ne uvajamo nobene informacije iz ucne množice, zato je ta rezultat popolnoma pricakovan. Kljub temu, pa je .. mera precenjena. Pri vseh ostalih popravkih za uravnoteženje podatkov so v primeru napacne uporabe navzkrižnega preverjanja (izrazito) precenjene, še posebej, ko je neravnotežje v podatkih vecje. Odvisnost preoptimisticne ocene od števila spremenljivk V tem delu spreminjamo število spremenljivk ..= 10, 100, 500, ostali parametri pa so ..= 500 in ..á =0.1, rezultati so prikazani na sliki 7. Rezultati so zelo podobni kot v prejšnjem primeru, opazimo pa, da z vecanjem števila spremenljivk ocene postajajo vedno bolj precenjene. Ko se število spremenljivk povecuje, postaja problem preprileganja bolj izrazit, kar se v primeru napacne izvedbe navzkrižnega preverjanja bolj pozna na preoptimisticnih oceni tocnosti delovanja razvršcevalca. Slika 7 Navzkrižno preverjana tocnost razvršcevalca za razlicne velikosti manjšinskega razreda ob skupni uporabi razlicnih metod za uravnoteženje podatkov in razlicnih izvedb navzkrižnega preverjanja, ko je število enot vecje od števila spremenljivk. Odvisnost preoptimisticne ocene od števila napacne izvedbe navzkrižnega preverjanja ocene enot postajajo vedno bolj precenjene. Razlogi so enaki kot v prejšnjem primeru: ko se velikost ucne množice Tu spreminjamo število ..= 300, 500, 1000, ostala zmanjšuje, se problem preprileganja povecuje, kar parametra pa sta ..= 500 in ..á =0,1. Rezultati so vodi do precenjenih ocen. prikazani na sliki 8. Podobno kot v prejšnjem primeru opazimo, da ob manjšanju števila enot v primeru Slika 8 Navzkrižno preverjana tocnost razvršcevalca ob skupni uporabi razlicnih metod za uravnoteženje podatkov in razlicnih izvedb navzkrižnega preverjanja pri razlicnem številu enot. Zakljucek Ocenjevanje tocnosti napovednih modelov je pomemben, ce ne kar najpomembnejši korak pri razvoju napovednih modelov. Pokazali smo, da v primeru napacne uporabe navzkrižnega preverjanja v kombinaciji z uporabo metod za uravnoteženje podatkov precenimo tocnost napovednega modela. Naše ocene tedaj nakazujejo, da gre za (zelo) dober napovedni model, dejansko pa je njegovo delovanje zelo slabo. Pojasnili smo razloge za to in predstavili dejavnike, ki vplivajo na preoptimizem: delež enot v manjšinski množici (preoptimizem se povecuje, ko se delež enot v manjšinski množici zmanjšuje), število spremenljivk (z vecanjem števila spremenljivk se preoptimizem povecuje) in število enot (preoptimizem narašca z manjšanjem števila enot). Prvi dejavnik je neposredna posledica uvajanja informacije iz ucne množico v testno: pri nakljucnem prevzorcenju v ucni in testni množici nastopajo iste enote, ki jih je zaradi preprileganja precej lažje pravilno uvrstiti kot neke enote, ki jih med ucenjem razvršcevalca nismo vkljucili v ucno množico. Problem preprileganja je seveda bolj izrazit, ko je število spremenljivk veliko in ko je število enot majhno, kar pojasnjuje druga dva dejavnika. Pravilna izvedba navzkrižnega preverjanja je torej kljucna, da se izognemo preoprimisticnim ocenam in pravilno ovrednotimo moc napovednega modela. Zelo pomembno je, da so vse faze izgradnje modela (najsi gre za uravnoteženje podatkov, izbiro spremenljivk, izbiro najboljšega razvršcevalca ali nadomešcanje manjkajocih vrednosti) del navzkrižnega preverjanja. V nasprotnem primeru lahko v testni množici napacno upoštevamo informacijo iz ucne množice in zato preoptimisticno ocenimo tocnost napovednega modela. Reference 1. Bishop CM. Pattern recognition and machine learning (information science and statistics). New York 2007: Springer. 2. Ramaswamy S, Ross KN, Lander ES, Golub TR. A molecular signature of metastasis in primary solid tumors. Nat Genet 2003, 33(1): 49-54. https://doi.org/10.1038/ng1060 3. Shipp MA, Ross KN, Tamayo P, et al. Diffuse large B-cell lymphoma outcome prediction by gene-expression profiling and supervised machine learning. Nat Med 2002; 8(1): 68-74. https://doi.org/10.1038/nm0102-68 (15. 10. 2022) 4. Iizuka N, Oka M, Yamada-Okabe H, et al. Oligonucleotide microarray for prediction of early intrahepatic recurrence of hepatocellular carcinoma after curative resection. Lancet 2003; 361(9361): 923­929. https://doi.org/10.1016/S0140-6736(03)12775-4 (19. 11. 2022) 5. Sotiriou C, Neo SY, McShane LM, et al. Breast cancer classification and prognosis based on gene expression profiles from a population-based study. Proc Natl Acad Sci USA 2003; 100(18): 10393-10398. https://doi.org/10.1073/pnas.1732912100 (12. 10. 2022) 6. Wang Y, Klijn JG, Zhang Y, et al. Gene-expression profiles to predict distant metastasis of lymph-node-negative primary breast cancer. Lancet 2005; 365(9460): 671-679. https://doi.org/10.1016/S0140-6736(05)17947-1 (12. 10. 2022) 7. Shen R, Ghosh D, Chinnaiyan A, Meng Z. Eigengene-based linear discriminant model for tumor classification using gene expression microarray data. Bioinformatics 2006; 22(21): 2635-2642. https://doi.org/10.1093/bioinformatics/btl442 (10. 9. 2022) 8. Jimeno-Yepes AJ, Plaza L, Mork JG, Aronson AR, Díaz A. MeSH indexing based on automatically generated summaries. BMC Bioinformatics 2013; 14: 208. https://doi.org/10.1186/1471-2105-14-208 (10. 9. 2022) 9. Štotl I, Blagus R, Urbancic-Rovan V. Individualised screening of diabetic foot: creation of a prediction model based on penalised regression and assessment of theoretical efficacy. Diabetologia 2022; 65(2): 291­300. https://doi.org/10.1007/s00125-021-05604-2 (19. 11. 2022) 10. Tao D, Tang X, Li X, Wu X. Asymmetric bagging and random subspace for support vector machines-based relevance feedback in image retrieval. IEEE Trans Pattern Anal Mach Intell 2006; 28(7): 1088-1099. https://doi.org/10.1109/TPAMI.2006.134 (19. 11. 2022) 11. He H, Garcia EA. Learning from imbalanced data. IEEE Trans Knowl Data Eng 2009; 21(9):, 1263-1284. https://doi.org/10.1109/TKDE.2008.239 (5. 9. 2022) 12. Blagus R, Lusa L. Class prediction for high-dimensional class-imbalanced data. BMC Bioinformatics. 2010; 11: 523. https://doi.org/10.1186/1471-2105-11-523 (13. 8. 2022) 13. Chawla, N. V., Bowyer, K. W., Hall, L. O., & Kegelmeyer, W. P. (2002). SMOTE: synthetic minority over-sampling technique. J Artif Intell Res 2002; 16: 341-378. https://doi.org/10.1613/jair.953 (5. 9. 2022) 14. Liu XY, Wu J, Zhou ZH. Exploratory undersampling for class-imbalance learning. IEEE Trans Syst Man Cybern B Cybern 2009; 39(2): 539-550. https://doi.org/10.1109/TSMCB.2008.2007853 (10. 9. 2022) 15. Lin WJ, Chen JJ. Class-imbalanced classifiers for high-dimensional data. Brief Bioinform 2013; 14(1): 13-26. https://doi.org/10.1093/bib/bbs006 (14. 10. 2022) 16. Galar M, Fernandez A, Barrenechea E, Bustince, H, Herrera F. A review on ensembles for the class imbalance problem: bagging-, boosting-, and hybrid-based approaches. IEEE Trans Syst Man Cybern, Part C Appl Rev 2012 42(4): 463-484. https://doi.org/10.1109/TSMCC.2011.2161285 (20. 10. 2022) 17. Blagus R, Lusa L. SMOTE for high-dimensional class-imbalanced data. BMC Bioinformatics 2013; 14: 106. https://doi.org/10.1186/1471-2105-14-106 (17. 11. 2022) 18. Hastie T, Tibshirani R, Friedman J. The elements of statistical learning: data mining, inference, and prediction. New York 2003: Springer. 19. Hoerl AE, Kennard RW. Ridge regression: biased estimation for nonorthogonal problems. Technometrics 1970; 12(1): 55-67. https://doi.org/10.1080/00401706.1970.10488634 (20. 10. 2022) 20. Schaefer RL, Roi LD, Wolfe RA. A ridge logistic estimator. Commun Stat Theory Methods 1984; 13(1): 99­113. https://doi.org/10.1080/03610928408828664 (3. 11. 2022) 21. Zhu J, Hastie T. Classification of gene microarrays by penalized logistic regression. Biostatistics 2004; 5(3): 427-443. https://doi.org/10.1093/biostatistics/5.3.427 (18. 11. 2022) 22. Goeman J, Meijer R, Chaturvedi N, Lueder M. L1 (lasso and fused lasso) and L2 (ridge) penalized estimation in GLMs and in the Cox model. 2014. http://CRAN.R-project.org/package=penalized (20. 10. 2022) 23. Blagus R, Goeman JJ. Mean squared error of ridge estimators in logistic regression. Stat Neerl 2020; 74(2): 159-191. https://doi.org/10.1111/stan.12201 (10. 9. 2022) 24. Pepe MS. The statistical evaluation of medical tests for classification and prediction. New York 2003: Oxford University Press. 25. Blagus R, Goeman JJ. What (not) to expect when classifying rare events. Brief Bioinform 2018; 19(2): 341­349. https://doi.org/10.1093/bib/bbw107 (20. 10. 2022) 26. Fawcett T. An introduction to ROC analysis. Pattern Recognit Lett 2006; 27(8): 861-874. https://doi.org/10.1016/j.patrec.2005.10.010 (10. 9. 2022) 27. Perme MP, Manevski D. Confidence intervals for the Mann-Whitney test. Stat Methods Med Res 2019; 28(12): 3755-3768. https://doi.org/10.1177/0962280218814556 (18. 11. 2022) 28. Blagus R, Lusa L. Improved shrunken centroid classifiers for high-dimensional class-imbalanced data. BMC Bioinformatics 2013; 14: 64. https://doi.org/10.1186/1471-2105-14-64 (3. 11. 2022) 29. Simon R, Radmacher MD, Dobbin K, McShane LM. Pitfalls in the use of DNA microarray data for diagnostic and prognostic classification. J Natl Cancer Inst 2003; 95(1): 14-18. https://doi.org/10.1093/jnci/95.1.14 (20. 10. 2022) 30. Ambroise C, McLachlan GJ. Selection bias in gene extraction on the basis of microarray gene-expression data. Proc Natl Acad Sci U S A 2002; 99(10) :6562-6566. https://doi.org/10.1073/pnas.102102699 (6. 10. 2022) 31. Taft LM, Evans RS, Shyu CR, et al. Countering imbalanced datasets to improve adverse drug event predictive models in labor and delivery. J Biomed Inform 2009; 42(2): 356-364. https://doi.org/10.1016/j.jbi.2008.09.001 (8. 10. 2022) 32. Lez-de-Uralde J, Ruiz I, Santos I, et al. Automatic morphological categorisation of carbon black nano-aggregates. In: Bringas PG, Hameurlain A, Quirchmayr G (eds). Database and Expert Systems Applications. DEXA 2010. Lecture Notes in Computer Science, vol 6262. Berlin, Heidelberg 2010: Springer: 185-193. https://doi.org/10.1007/978-3-642-15251-1_15 (3. 11. 2022) 33. Naseriparsa M, Kashani MM. Combination of PCA with SMOTE resampling to boost the prediction rate in lung cancer dataset. Int J Comput Appl 2013; 77(3): 33-38. https://doi.org/10.5120/13376-0987 (16. 11. 2022) 34. Blagus R, Lusa L. Joint use of over-and under-sampling techniques and cross-validation for the development and assessment of prediction models. BMC Bioinformatics 2015; 16: 363. https://doi.org/10.1186/s12859-015-0784-9 (3. 11. 2022) 35. Japkowicz N. The Class Imbalance Problem: Significance and Strategies. In: Proceedings of the 2000 International Conference on Artificial Intelligence ICAI, 2000. 36. Rahman MM, Davis D. Cluster based under-sampling for unbalanced cardiovascular data. In: Proceedings of the World Congress on Engineering, vol. 3, London 2013: 3-5. https://www.iaeng.org/publication/WCE2013/WCE20 13_pp1480-1485.pdf (3. 11. 2022) 37. Zhang JP, Mani I. KNN Approach to unbalanced data distributions: a case study involving information extraction. In: Proceeding of International Conference on Machine Learning (ICML 2003), Workshop on Learning from Imbalanced Data Sets. Washington 2003: 1-7. 38. Cover TM, Hart PE. Nearest neighbor pattern classification. IEEE Trans Inf Theory 1967 13(1): 21-27. https://doi.org/10.1109/TIT.1967.1053964 (20. 10. 2022) 39. Forman G, Scholz M. Apples-to-apples in cross-validation studies: pitfalls in classifier performance measurement. SIGKDD Explor Newsl 2010; 12(1): 49­57. https://doi.org/10.1145/1882471.1882479 (10. 9. 2022) 40. Cox DR, Hinkley DV. Theoretical statistics. New York 1979: CRC Press. 41. Le Cessie S, Van Houwelingen JC. Ridge estimators in logistic regression. J R Stat Soc Ser C Appl Stat 1992; 41(1): 191-201. https://doi.org/10.2307/2347628 (3. 11. 2022) • Izvirni znanstveni clanek Živa Rant, Hajdi Kosednar, Dalibor Stanimirovic Vloga in pomen Centra za pomoc uporabnikom rešitev eZdravja v slovenskem zdravstvu Povzetek. Center za pomoc uporabnikom rešitev eZdravja je kljucna komponenta sistema eZdravje v Sloveniji, ki je namenjena vsem uporabnikom tega sistema. Center izvaja tri osnovne naloge. Splošna podpora vsem uporabnikom rešitev eZdravja je namenjena zdravstvenim delavcem, administrativnemu osebju, informatikom, ponudnikom programskih rešitev, pacientom in vsem drugim uporabnikom rešitev eZdravja, ki želijo prijaviti motnje v delovanju, potrebujejo pomoc ali zahtevajo informacije v zvezi z delovanjem rešitev eZdravja. Storitev elektronskega narocanja na zdravstvene storitve pomaga pacientom pri narocanju. Podpora pri priklopu v zNET je namenjena izvajalcem zdravstvene dejavnosti pri postopku vkljucitve v omrežje zNET. Dostopanje do pomoci je možno s spletnim obrazcem, preko elektronske pošte, pogosto zastavljenih vprašanj ali telefona. Na svoji spletni strani Center za pomoc uporabnikom objavlja obvestila, povezana z delovanjem rešitev eZdravja, in semafor o delovanju rešitev. V zadnjih dveh letih je bilo v delo Centra vkljucenih vec novih rešitev. Uporaba je pospešeno narasla – v letu 2021 smo beležili vec kot sedemkratno povecanje glede na leto 2020. Prispevek analizira delovanje Centra skozi dinamiko in vsebino obravnavanih zahtevkov in opravljenih storitev. Delovanje Centra je pomembna komponenta uspešne uporaba rešitev eZdravja v Sloveniji, kar se je še posebej izkazalo v casu epidemije COVID-19. Kljucne besede: eZdravje; slovensko zdravstveno omrežje; elektronsko narocanje; pomoc uporabnikom. The Role and Importance of the Service Desk for eHealth Solutions in Slovenian Health Care Abstract. The eHealth Service Desk is a key component of the eHealth system in Slovenia, which is intended for the all users of the system. The Service Desk performs three main tasks. General support for all users of eHealth solutions addresses health care professionals, administrative staff, information technology specialists, software solution providers, patients and all other users of eHealth solutions who wish to report malfunctions, need assistance or require information related to the functioning of the eHealth solutions. The electronic appointment for health care services helps patients to make an eAppointment for health care services. The zNET Connection Support offers help to health care providers in the process of joining the zNET network. Assistance can be accessed in several ways: via an online form, email, FAQs or phone. The Service Desk publishes notifications related to the eHealth solutions on its website and maintains a simple indicator that displays the status of eHealth solutions. During the last two years, several new eHealth solutions have been added to the Service Desk portfolio. The use has been growing rapidly in recent years, namely in 2021 we recorded a more than sevenfold increase compared to 2020. The paper analyses the operation of the eHealth Service Desk through the dynamics and content of the requests handled or services provided. The Service Desk is an important component for the successful use of eHealth solutions in Slovenia, which was particularly evident during the COVID-19 epidemic. Key words: eHealth; Slovenian healthcare network; electronic appointment; user support. . Infor Med Slov 2022; 27(1-2): 14-19 Institucije avtorjev / Authors' institutions: Nacionalni inštitut za javno zdravje, Ljubljana (ŽR, HK); Fakulteta za upravo, Univerza v Ljubljani (DS). Kontaktna oseba / Contact person: mag. Živa Rant, NIJZ, Trubarjeva cesta 2, 1000 Ljubljana. E-pošta / E-mail: ziva.rant@nijz.si. Prispelo / Received: 27. 1. 2023. Sprejeto / Accepted: 31. 1. 2023. Uvod Ucinkovita in celovita digitalna preobrazba slovenskega zdravstvenega sistema je ena izmed temeljnih sprememb, ki naj bi pripomogla k bolj uspešnemu spopadanju s številnimi izzivi, ki se nahajajo pred slovenskim zdravstvom. Nekatere izkušnje razvitih držav kažejo,1,2 da imajo uspešno izvedeni projekti digitalizacije zdravstva velik strateški pomen za nadaljnji razvoj zdravstvenega sistema, po navedbah Evropske komisije pa imajo tudi širše implikacije v smeri povecanja družbene blaginje in gospodarske rasti.3 Projekt digitalizacije slovenskega zdravstva (eZdravje), ki sledi nacionalnim in evropskim usmeritvam, je bil eden kljucnih dolgorocnih ciljev javnega sektorja v Sloveniji. Upravljanje digitalnih rešitev, ki so nastale v sklopu projekta eZdravje, je konec leta 2015 prevzel Nacionalni inštitut za javno zdravje (NIJZ). Do takrat je projekt eZdravje vodilo Ministrstvo za zdravje, velik delež zagonskih sredstev pa je bil zagotovljen iz Evropskega socialnega sklada. Pregled razmer na obravnavanem podrocju kaže, da težave, s katerimi se že od vsega zacetka srecuje projekt eZdravje, na eni strani izhajajo iz tehnicno­tehnoloških znacilnosti obstojecih (vecinoma razdrobljenih) zdravstvenih informacijskih sistemov (ZIS), ki so posledica neusklajenega razvoja na podrocju zdravstvene informatike v zadnjih desetletjih. Na drugi strani pa gre odgovornost za obstojece stanje pripisati predvsem odlocevalskim krogom, ki so razvoj zdravstvene informatike v tem obdobju prepustili lastnim pobudam, potrebam in partikularnim interesom posameznikov na ravni zdravstvenih zavodov (ali celo oddelkov), brez enotnih strateških usmeritev. Poleg tega pristojni v tem obdobju niso uspeli spodbuditi razvoja in uresnicitve projekta digitalizacije z mocnejšo politicno (financno, kadrovsko, organizacijsko) podporo ter oblikovanjem konsistentne strategije na tem podrocju. Posledice navedenih vzrokov se odražajo v izzivih, ki jih je NIJZ zaznal v teku dosedanjih aktivnosti za implementacijo rešitev eZdravja: ¦ nepripravljenost (upravljavska, tehnološka, organizacijska, procesna ipd.) dolocenih izvajalcev zdravstvene dejavnosti za ustrezno uporabo rešitev eZdravja; ¦ procesne, organizacijske, varnostne in uporabniške težave pri izvajalcih zdravstvene dejavnosti; ¦ neusklajenost zdravstvene stroke pri vsebinskih vprašanjih (npr. šifrant vrst zdravstvenih storitev (VZS), matrika dostopov v Centralni register podatkov o pacientu (CRPP)); ¦ ozka usmerjenost posameznih deležnikov v lastno strokovno podrocje brez zavedanja o soodvisnosti vseh deležnikov zdravstvenega sistema; ¦ pomanjkanje kompetentnih strokovnjakov s podrocja informatike pri izvajalcih zdravstvene dejavnosti, ki bi skrbeli za ustrezno vzdrževanje in delovanje rešitev eZdravja; ¦ nezadostna sredstva za digitalizacijo pri izvajalcih zdravstvene dejavnosti in na NIJZ, ki skrbi za razvoj, vzdrževanje in nadgradnje centralnih nacionalnih rešitev eZdravja. Navkljub navedenim izzivom, pomanjkanju enotnih strateških dokumentov in nezadostnemu vlaganju na podrocje zdravstvene informatike je v zadnjih štirih letih prišlo do velikega napredka pri razvoju in implementaciji rešitev eZdravja. V casu upravljanja rešitev se je pricakovano izkazalo, da uporabniki potrebujejo tudi pomoc pri uporabi rešitev eZdravja. Zato je bila vzpostavljena storitev Pomoc in podpora za uporabnike eZdravja. Namenjena je vsem uporabnikom rešitev eZdravja, ki želijo prijaviti motnje v delovanju, potrebujejo pomoc ali zahtevajo informacije v zvezi z delovanjem rešitev eZdravja. Skladno z navedenimi izhodišci se prispevek v nadaljevanju osredotoca na analizo delovanja Centra za pomoc uporabnikom eZdravja skozi dinamiko in vsebino obravnavanih zahtevkov oziroma storitev, ki jih izvaja. Center za pomoc uporabnikom rešitev eZdravja Storitev Pomoc in podpora za uporabnike rešitev eZdravja je bila zamišljena že v prvih strateških dokumentih na podrocju eZdravja. Od prenosa eZdravja na NIJZ konec leta 2015 postaja njena vloga vse vecja. Še posebej se je to izkazalo v casu epidemije COVID-19, ko obicajni nacini usposabljanja uporabnikov in reševanja zahtevkov niso bili mogoci, razvoj informacijskih rešitev eZdravja pa je naredil izrazit preskok. Center za pomoc uporabnikom zagotavlja pomoc za skoraj trideset rešitev eZdravja. Ima tri osnovne naloge: ¦ splošno podporo vsem uporabnikom rešitev eZdravja, ¦ podporo pri priklopu v varno zdravstveno omrežje zNET in ¦ elektronsko narocanje na zdravstvene storitve. Splošna podpora vsem uporabnikom rešitev eZdravja je namenjena zdravstvenim delavcem, administrativnemu osebju, informatikom, ponudnikom programskih rešitev, pacientom in vsem drugim uporabnikom rešitev eZdravja, ki želijo prijaviti motnje v delovanju, potrebujejo pomoc ali zahtevajo informacije v zvezi z delovanjem rešitev eZdravja. Podpora pri priklopu v zNET izvaja pomoc izvajalcem zdravstvene dejavnosti pri postopku vkljucitve v varno zdravstveno omrežje zNET. Storitev elektronskega narocanja na zdravstvene storitve pomaga pacientom pri elektronskem narocanju. Uporabniki dostopajo do pomoci preko spletnega obrazca na spletni strani https://podpora.ezdrav.si/, preko sporocil po elektronski pošti ali s telefonskim klicem za vse rešitve eZdravja, za pomoc pri e-narocanju in za zNET. Na spletni strani https://podpora.ezdrav.si/pogosta-vprasanja/ so objavljeni odgovori na pogosto zastavljena vprašanja. V casu epidemije COVID-19 je bila storitev razširjena tako, da je zagotavljala podporo za vrsto novih informacijskih rešitev. Za izvajalce zdravstvene dejavnosti so to pomoc za porocanje o presejalnem testiranju na COVID-19, za vnos rezultatov testov na COVID-19 v zdravstveni portal zVEM+, rešitev zVEM+ za covid vstopne tocke in podporo obvešcanja pacientov. Za paciente sta to digitalno covidno potrdilo (EU DCP) in prijava na cepljenje proti COVID-19. Poleg teh rešitev se zagotavlja podpora tudi za rešitev za poslovno analitiko za eNarocanje in prenarocanje pacientov na zdravstvene storitve v okviru nacionalnega razpisa. Podporo izvaja stalna in izkušena ekipa svetovalcev, ki je specializirana za razlicna podrocja in rešitve eZdravja. Svetovalci se neprestano izobražujejo – splošno in za posamezne rešitve – ter udeležujejo predavanj, usposabljanj in delavnic. Posnetki so na voljo tudi za ponoven ogled in usposabljanje novih sodelavcev. Center za pomoc in podporo gradi bazo znanja, vzdržuje dokumentacijo in skrbi za odgovore na pogosto zastavljena vprašanja. Center za pomoc uporabnikom na spletni strani objavlja obvestila, povezana z delovanjem rešitev eZdravja, in vzdržuje semafor o delovanju rešitev. Metode V prispevku predstavljamo analizo funkcionalnosti in uporabe storitve Pomoc in podpora za uporabnike eZdravja. Z raziskavo smo želeli odgovoriti na vprašanje, kako je epidemija COVID-19 vplivala na razvoj in uporabo storitve Pomoc in podpora za uporabnike eZdravja. Gre za primer agilnega razvoja storitve, ki se je pospešeno razvijala v casu epidemije, ki je bila s tega vidika posebna priložnost za razvoj. Za raziskavo smo uporabili metodologijo študije primera,4,5,6 ki je vkljucevala poglobljeno študijo podrocja in njeno kriticno analizo. Analiza je bila na eni strani izvedena na podlagi pregleda literature s tega podrocja7 ter projektne dokumentacije in tehnicnih specifikacij rešitve Pomoc in podpora za uporabnike eZdravja, na drugi strani pa na podlagi opazovanj, izkušenj ter strokovnega mnenja strokovnjakov na NIJZ, ki upravljajo z rešitvami eZdravja (tudi s storitvijo Pomoc in podpora za uporabnike eZdravja) in Centra za pomoc uporabnikom rešitev eZdravja ter dejanskih statisticnih podatkov o uporabi iz administratorskega modula rešitve.8 Analiza funkcionalnosti in uporabe rešitve Pomoc in podpora za uporabnike eZdravja, v smislu pregleda literature s tega podrocja ter projektne dokumentacije in tehnicnih specifikacij, je bila izvedena v prvi polovici leta 2022. Strukturirani razgovori s strokovnjaki NIJZ in pridobitev statisticnih podatkov iz poslovnih in administratorskih modulov pa so bili izvedeni v obdobju od aprila do julija 2022. Rezultati Epidemija COVID-19 je pokazala, kako pomembna je digitalizacija zdravstva,9 še posebej pa je za digitalizacijo kljucen obstoj nacionalnih rešitev. To se je pokazalo tudi pri razvoju rešitev eZdravja v Sloveniji. Razmere so zahtevale številne nadgradnje informacijskih rešitev, ki jih je bilo potrebno razviti in uvesti v cim krajšem casu. Za nekatere cilje digitalizacije je bilo mogoce uporabiti že obstojece rešitve s prilagoditvami, nekatere rešitve je bilo potrebno predelati, nekatere pa razviti na novo. V obdobju 2020-2021 sta se še posebej razvili rešitvi Zdravstveni portal za paciente zVEM in Centralni register podatkov o pacientih (CRPP).10 Pri portalu zVEM se je število registriranih uporabnikov v letu 2021 povecalo devetkrat (na 925 % izhodišcne vrednosti) glede na leto 2020, število obiskov pa kar dvanajstkrat (na 1273 %). Število dokumentov v CRPP se je napram letu 2019 v letu 2021 povecalo osemkrat (849 %).10 Hiter razvoj informacijskih rešitev in izredno kratek cas za uvajanje, ki ni omogocal obicajnega usposabljanja uporabnikov ter reševanja zahtevkov, sta povzrocila nepricakovan pritisk na Center za pomoc uporabnikom. Podatki o uporabi kažejo na izreden porast aktivnostiv zadnjih dveh letih. Število dogodkov v letu 2021 se je povecalo vec kot sedemkrat (766 %), prav tako število sprejetih klicev (742 %), porabljen cas v pa petkrat (493 %; slika 1). Najvecji porast je viden maja in junija 2021 (slika 2), kar je povezano tudi s pridobivanjem evropskih digitalnih potrdil preko portala za paciente zVEM in z vnosom cepljenj in testiranj pri izvajalcih zdravstvene dejavnosti. V maju 2021 se je na primer 80 % do 90 % zahtevkov nanašalo na zVEM oziroma vprašanja za DCP (slika 3). Kasneje je ta delež padel. Zanimiv je tudi pogled na razlicno obremenitev centra za pomoc uporabnikom glede na dan v tednu in uro dneva. Podatki iz administrativnega modula kažejo, da je bilo podanih najvec zahtevkov v torek (slika 4) in v urah okrog poldneva. Eden od vzrokov za tako povpraševanje po pomoci za rešitev zVEM je zagotovo pomoc svetovalcev pri pridobivanju evropskega digitalnega covidnega potrdila (EU DCP), ki so ga zahtevala stroga pravila gibanja v Sloveniji v casu epidemije COVID-19. Bistvena prednost je, da so se na strani svetovalcev na telefonske klice oglašali ljudje in ne samo odzivnik. Svetovalci so se lahko prilagodili uporabniku, njegovemu znanju, izkušnjam in ravni digitalne pismenosti. Uporabniki so tako dobili pomoc najprej pri dostopanju do rešitve zVEM, svetovalci pa so jih nato korak za korakom usmerjali do dokoncne pridobitve EU DCP. Zadovoljstvo uporabnikov kažejo tudi številne pohvale, ki so jih podali. Pomoc pri narocanju je najbolj narasla maja 2021, po prvem valu epidemije COVID-19 (slika 5). Svetovalci se pri izvajanju podpore srecujejo z mnogimi izzivi in težavami. Zagotovo najvecjo težavo predstavlja nepredvidljivost dnevnih in mesecnih obremenitev, na kar se je težko pripraviti. Zelo se je povecalo število klicev in zahtevkov v casu epidemije COVID-19, obremenitev centra za pomoc pa se mocno poveca ob uvedbi novih rešitev (npr. portal zVEM, covidno potrdilo). Ena od težav pri izvajanju storitve je veliko število klicev, ki niso povezani z rešitvami eZdravja, predvsem iskanje informacij, povezanih z epidemijo COVID-19. Taki klici povzrocajo opazne obremenitve v klicnem centru in nedosegljivost klicnih številk, kar povzroca nezadovoljstvo pri tistih uporabnikih, ki pomoc dejansko potrebujejo, in morajo zato marsikdaj na pomoccakati dlje. Slika 3 Podatki o deležu pomoci uporabnikom za rešitev zVEM v letu 2021. Slika 4 Evidentirani zahtevki po dnevih v tednu. Slika 5 Podatki o uporabi pomoci za e-narocanje. V casu epidemije je center za pomoc uporabnikom prejemal vprašanja, povezana z zdravjem, vprašanja o bolezni COVID-19, vprašanja o zdravljenju in zdravilih, vprašanja o cepljenju, cepivih in stranskih ucinkih. Poleg tega so se pacienti obracali na klicni center z vprašanji o veljavnih ukrepih in omejitvah gibanja. S tem se je zameglil pravi namen centra za pomoc, namrec podpora uporabnikom rešitev eZdravja. Uporabniki so potrebovali pomoc pri raznovrstnih digitalnih rešitvah v zdravstvu, od narocanja na cepljenje, narocanja na pregled, pridobivanja napotnic in receptov, dostopa do izvidov in odpustnih pisem. Vse to jim je bilo na voljo v portalu zVEM, za katerega su nujno potrebovali najprej kvalificirano digitalno potrdilo, kasneje pa SI-PASS. Svetovalci v centru za pomoc so uporabnike vodili skozi vcasih res zapletene in zamudne postopke registracije v razlicne digitalne in spletne storitve. Razprava Izbira raziskovalne metode je temeljila na posebnostih raziskovalnega podrocja in dejstvu, da je celotno podrocje digitalizacije zdravstva v Sloveniji še vedno v razmeroma zgodnji fazi, zato obstaja le ozek krog strokovnjakov z ustreznim znanjem in izkušnjami na tem podrocju. Tovrsten pristop je omogocil tako vpogled v dosedanja teoretska in tehnološka izhodišca tovrstnih digitalnih rešitev kot tudi empiricni pregled uporabe storitve Pomoc in podpora za uporabnike eZdravja v slovenskem zdravstvenem sistemu. Sodelovanje strokovnjakov z NIJZ in Centra za pomoc uporabnikom rešitev eZdravja pri raziskavi je poleg vpogleda v tehnološke in statisticne vidike delovanja storitve omogocilo tudi kriticen in temeljit vpogled v uporabniške vidike te storitve, saj so strokovnjaki z NIJZ in Centra za pomoc uporabnikom rešitev eZdravja dobro seznanjeni z uporabniškimi izkušnjami pacientov in zdravstvenih delavcev na terenu ter njihovim zadovoljstvom z rešitvami eZdravja. Prispevek se osredotoca na storitev Pomoc in podpora za uporabnike eZdravja predvsem zaradi njene pomembnosti tako za paciente kot tudi za zdravstvene delavce. Sinteza ugotovitev iz literature, uporabniških funkcionalnosti, statisticnih porocil ter stališc strokovnjakov z NIJZ in Centra za pomoc uporabnikom rešitev eZdravja omogoca oblikovanje verodostojnih in na preverljivih podatkih temeljecih zakljuckov glede izpostavljenih raziskovalnih ciljev.11 Uporaba takega metodološkega okvira, vkljucujoc kombinacijo razlicnih pristopov ter tehnik zbiranja podatkov, je zagotovila verodostojnost analize funkcionalnosti storitve.12 Celovita analiza podatkov, pridobljenih iz raznoterih virov in strukturiranih razgovorov s strokovnjaki NIJZ in Centra za pomoc uporabnikom rešitev eZdravja je v sklepni fazi raziskave zagotavljala osnovo za interpretacijo podatkov ter oblikovanje zakljuckov glede raziskovalnih izhodišc prispevka.13 Zakljucek Nacionalne rešitve eZdravja v Sloveniji so od zakljucka projekta leta 2015 doživele izjemen razvoj. Še posebej je bil ta razvoj pospešen v casu epidemije COVID-19. Poleg razvoja rešitev se je vec kot desetkrat povecala tudi njihova uporaba. V tem obdobju so se razkrile pomanjkljive kompetence uporabnikov informacijskih rešitev, od najosnovnejše uporabe racunalniške in telekomunikacijske opreme preko racunalniške in informacijske pismenosti do uporabe racunalniških rešitev samih. Zato se je v tem casu izredno povecala tudi potreba po uporabi Centra za pomoc uporabnikom rešitev eZdravja, ki je s svojim delom marsikateremu uporabniku omogocal uporabo digitaliziranih rešitev. Pokazalo se je tudi, da je potrebno izboljšati digitalno kulturo v zdravstvenih ustanovah in digitalne kompetence vseh zaposlenih v zdravstvu na eni strani in pacientov oziroma prebivalstva na drugi strani. Epidemija COVID-19 je pokazala izjemen pomen digitalnih rešitev v zdravstvu. Tudi zato bo v prihodnje potrebno vložiti veliko naporov in sredstev za ohranitev spodbudnega razvojnega trenda in nadaljnje povecanje uporabe rešitev eZdravja. Reference 1. Bokolo AJ. Application of telemedicine and eHealth technology for clinical services in response to COVID-19 pandemic. Health Technol (Berl) 2021; 11(2): 359-366. https://doi.org/10.1007/s12553-020-00516-4 (1. 12. 2022) 2. Arcury TA, Sandberg JC, Melius KP, et al. Older Adult internet use and ehealth literacy. J Appl Gerontol 2020; 39(2): 141-150. https://doi.org/10.1177/0733464818807468 (10. 12. 2022) 3. Communication from the Commission to the European Parliament, the European Council, the Council, the European Economic and Social Committee and the Committee of the Regions on enabling the digital transformation of health and care in the Digital Single Market; empowering citizens and building a healthier society. SWD (2018) 126 final. Brussels 2018: European Commission. https://eur-lex.europa.eu/legal­content/EN/TXT/PDF/?uri=CELEX:52018DC0233&fro m=EN (10. 12. 2022) 4. Yin RK. Case study research and applications: design and methods (6th ed.). Thousand Oaks 2018: Sage Publications. 5. Kljajic Borštnar M. Raziskovanje informacijskih sistemov. Kranj 2021: Fakulteta za organizacijske vede. 6. Myers MD, Avison DE (eds.). Qualitative research in information systems: a reader. London 2002: SAGE Publications. 7. Lee WL, Lim ZJ, Tang LY, Yahya NA, Varathan KD, Ludin SM. Patients' technology readiness and ehealth literacy: implications for adoption and deployment of ehealth in the covid-19 era and beyond. Comput Inform Nurs 2021; 40(4): 244-250. https://doi.org/10.1097/CIN.0000000000000854 (25. 11. 2022) 8. Statistika zahtevkov na Prvem nivoju podpore uporabnikom eZdravja. Ljubljana 2021: Nacionalni inštitut za javno zdravje. 9. Rant Ž, Stanimirovic D, Janet J. Razvoj portala zVEMin Centralnega registra podatkov o pacientu. In: Šprajc P, Maletic D, Pavlovic N et al. (eds). 41. mednarodna konferenca o razvoju organizacijskih znanosti: izzivi družbe za priložnosti organizacij: konferencni zbornik.. Maribor 2022: University of Maribor, University Press; 873-884. https://doi.org/10.18690/um.fov.3.2022.63 (25. 11. 2022) 10. Lindgren BM, Lundman B, Graneheim UH. Abstraction and interpretation during the qualitative content analysis process. Int J Nurs Stud 2020; 108: 103632. https://doi.org/10.1016/j.ijnurstu.2020.103632 (7. 12. 2022) 11. Sim J, Waterfield J. Focus group methodology: some ethical challenges. Qual Quant 2019; 53(6): 3003-3022. https://doi.org/10.1007/s11135-019-00914-5 (7. 12. 2022) 12. Thomas G. How to do your case study. Thousand Oaks, CA 2021: Sage Publications. 13. Stanimirovic D, Matetic V. Can the COVID-19 pandemic boost the global adoption and usage of eHealth solutions?. J Glob Health 2020; 10(2): 0203101. https://doi.org/10.7189/jogh.10.0203101 (10. 12. 2022) • Pregledni znanstveni clanek Žiga Lovšin, Barbara Artnik Viri podatkov na podrocju ustnega zdravja v Sloveniji Povzetek. Na podrocju ustnega zdravja se za razlicne namene beležijo razlicni podatki, med drugim za oceno stanja ustnega zdravja prebivalstva in potreb po zdravljenju, za nacrtovanje preventivnih programov ter za spremljanje delovanja sistema zobozdravstvenega varstva. V Sloveniji obstaja vec razpršenih virov in nacinov zbiranja podatkov. Namen tega clanka je identificirati in na enem mestu zbrati in prikazati vire, ki vsebujejo kljucne podatke o ustnem zdravju v Sloveniji. Vire podatkov razdelimo na primarne in sekundarne. Primarni viri v zobozdravstvu se nadalje lahko delijo na podatke raziskav in podatke iz porocanja, na klinicne in neklinicne podatke ter na podatke glede na populacijsko skupino (otroci, mladostniki, odrasli). Sekundarne vire podatkov najdemo v razlicnih slovenskih in mednarodnih publikacijah ter podatkovnih zbirkah, ki podatke pridobivajo iz enega ali vec primarnih virov. V prihodnje je na podrocju ustnega zdravja v Sloveniji na nacionalni ravni potrebno vzpostaviti zbiranje, digitalizacijo in sistematizacijo klinicnih podatkov ter vpeljati kontinuirano zbiranje in analiziranje neklinicnih podatkov. Kljucne besede: ustno zdravje; zobozdravstvo; viri informacij; viri podatkov; podatkovne zbirke. Data Sources on Oral Health in Slovenia Abstract. In the field of oral health, various data are recorded for different purposes, including the assessment of oral health status and treatment needs of the population, planning prevention programmes, and monitoring the functioning of the dental care system. In Slovenia, there are several scattered sources and methods of data collection. The aim of this article is to identify, assemble and present in one place the sources that contain key data on oral health in Slovenia. Data sources can be divided into primary and secondary ones. Primary data sources in dentistry can be further divided into research and report data, clinical and non-clinical data, and data by population groups (children, adolescents, adults). Secondary data sources can be found in various Slovenian and international publications and databases that draw data from one or more primary sources. In the future, it is necessary to establish the collection, digitisation and systematisation of clinical oral health data in Slovenia at the national level, and to introduce continuous collection and analysis of non-clinical data. Key words: oral health; dentistry; information sources; data sources; databases. . Infor Med Slov 2022; 27(1-2): 20-26 Institucije avtorjev / Authors' institutions: Nacionalni inštitut za javno zdravje, Ljubljana (ŽL); Medicinska fakulteta, Univerza v Ljubljani (BA). Kontaktna oseba / Contact person: doc. dr. Barbara Artnik, dr. dent. med., spec., Katedra za javno zdravje, Medicinska fakulteta, Univerza v Ljubljani, Zaloška 4, 1000 Ljubljana, Slovenija. E-pošta / E-mail: barbara.artnik@mf.uni-lj.si. Prispelo / Received: 27. 1. 2023. Sprejeto / Accepted:. 31. 1. 2023. Uvod Kakovostni in ažurni podatki so kljucen del katerekoli stroke. Na podrocju ustnega zdravja se med drugim beležijo podatki za oceno stanja ustnega zdravja prebivalstva in potreb po zdravljenju, za nacrtovanje preventivnih programov ter za spremljanje delovanja sistema zobozdravstvenega varstva.1 V vec novejših mednarodnih publikacijah pozivajo k boljšemu nacionalnemu sistematskemu zbiranju podatkov.2-4 Trenutno v Sloveniji ni celostnega sistematicnega zbiranja podatkov o stanju ustnega zdravja in zobozdravstvene oskrbe.2 Pomanjkanje podatkov za dolocene populacijske skupine in raznolikost obstojecih podatkov zato nakazujeta potrebo po organiziranem in sistematicnem spremljanju podrocja ustnega zdravja v Sloveniji.5 Vendarle pa obstaja na podrocju ustnega zdravja v Sloveniji vec razpršenih virov in nacinov zbiranja podatkov. Namen tega clanka je identificirati in na enem mestu zbrati ter prikazati vire, ki vsebujejo kljucne podatke o ustnem zdravju v Sloveniji. Slika 1 Razdelitev klinicnih in neklinicnih primarnih virov podatkov v zobozdravstvu glede na populacijske skupine. Primarni viri podatkov Primarne vire podatkov v zobozdravstvu lahko razdelimo na klinicne in neklinicne (slika 1). Podatki iz raziskav Ustno zdravje otrok in mladostnikov 2019 je znanstvena monografija na osnovi presecno pregledne epidemiološke raziskave, ki je zajela neklinicni del kazalnikov po metodologiji projekta Evropskega globalnega razvoja kazalnikov ustnega zdravja (angl. European Global Oral Health Indicators Development Project – EGOHID) za otroke in mladostnike v Sloveniji. Vkljucuje podatke o ustni higieni in uporabi fluoridov, prehrani, obiskih pri zobozdravniku, zobozdravstveni vzgoji in preventivi, zobozdravstveni preventivi v casu nosecnosti, dostopnosti do zdravstvenih storitev in kakovosti življenja v povezavi z ustnim zdravjem.6 Ustno zdravje odraslih 2019 je znanstvena monografija na osnovi presecno pregledne epidemiološke raziskave, ki je zajela neklinicni del kazalnikov po metodologiji EGOHID za odraslo populacijo v Sloveniji. Vkljucuje podatke o ustni higieni in uporabi fluoridov, prehrani, obiskih pri zobozdravniku, brezzobosti, proteticnih pripomockih, dostopnosti do zdravstvenih storitev, kakovosti življenja v povezavi z ustnim zdravjem ter samooceno ustnega zdravja.7 Obe publikaciji izpostavljata, da v Sloveniji na nacionalni ravni nimamo podatkov o potrebah in zahtevah po zdravljenju na podrocju ustnega zdravja. Z zdravjem povezana vedenja v šolskem obdobju (angl. Health Behaviour in School Aged Children – HBSC) je raziskava, ki poteka vsaka štiri leta v organizaciji Svetovne zdravstvene organizacije (SZO) za evropsko regijo. V Sloveniji je bila izvedena v letih 2002,8 2006,9 2010,10 201411 in 2018. Tarcna populacija je reprezentativni vzorec ucencev in dijakov, starih 11, 13, 15 in 17 let.12 Raziskava vkljucuje vprašanje o pogostnosti šcetkanja zob. Z zdravjem povezan vedenjski slog v okviru programa CINDI (angl. Countrywide Integrated Noncommunicable Disease Intervention). CINDI je mednarodni program, ki deluje v okviru SZO in je namenjen ohranjanju in krepitvi zdravja ter preprecevanju kronicnih nenalezljivih bolezni pri odraslih.13 V Sloveniji se raziskave izvajajo vsaka štiri leta (2001,14 2004,14 2008,14 2012,15 2016,16 202017) in v zvezi z ustnim zdravjem vkljucujejo vprašanja o pogostosti cišcenja zob, številu manjkajocih zob in pogostosti obiska zobozdravnika v zadnjih 12 mesecih. Nacionalna raziskava o zdravju in zdravstvenem varstvu (angl. European Health Interview Survey – EHIS). Namen te raziskave pri prebivalcih Slovenije, starih 15 let in vec, je oceniti njihovo zdravstveno stanje, življenjski slog, povezan z zdravjem, in pogostost uporabe razlicnih zdravstvenih storitev. V Sloveniji je bila raziskava izvedena trikrat, v letih 2007,18 201419 in 2019.20 Glede ustnega zdravja vkljucuje podatka o zadnjem obisku pri zobozdravniku in neizpolnjenih potrebah po zobozdravstveni oskrbi zaradi financnih razlogov. Anketa o življenjskih pogojih (angl. European Union Survey on Income and Living Conditions – EU-SILC) je raziskava EU o dohodkih in življenjskih razmerah. Prikazuje neizpolnjene potrebe ljudi po zobozdravstvenem pregledu v zadnjih 12 mesecih in razloge za neobisk zobozdravnika.2 Podatki se zbirajo vsako leto od leta 2012 naprej.21 Periodicne raziskave zdravja zob z indeksom KEP, ki nam pove povprecno število zaradi kariesa zbolelih (K), izdrtih (E) in popravljenih (P) stalnih zob pri posamezniku. Gre za klinicne raziskave, izvedene po metodologiji SZO22 v letih 1987,23 1993,24 1998,25 2003,26 2008,27 201328 in 2017.29 Na zacetku so se raziskave izvajale pri starostnih skupinah 6, 12, 15, 18 in 35-44 let ter pri starejših od 65 let, od leta 1998 pa le še pri 12-letnikih.29 Slovensko javno mnenje. Raziskava, ki se izvaja vsako leto od leta 1968, je v letih 1981,30 1994,31 199932 in 200132 vsebovala tudi vprašanja o zobozdravstvu. Vprašanja so naslavljala zadovoljstvo z delovanjem zobozdravstvene službe, potrebo po oskrbi pri zasebnem zobozdravniku, podkupovanje v zdravstvu, redno obiskovanje zobozdravnika, cakalne vrste in cas cakanja v ambulanti. Podatki iz porocanja Evidencni obrazec za zdravstvenovzgojno delo (obrazec 8,74) vsebuje podatke o številu izvajalcev, številu udeležencev in izvedenih programov zobozdravstvene vzgoje. Porocevalci so vsi izvajalci zdravstvenovzgojne dejavnosti v zdravstvenih ustanovah, podatki se zbirajo enkrat letno. Podatke za celotno Slovenijo zbira Nacionalni inštitut za javno zdravje (NIJZ), ki vsako leto pripravi podatke za Zdravstveni statisticni letopis.33,34 Porocilo o izvršenih sistematicnih pregledih šolskih otrok in mladostnikov (obrazec 8,288) vsebuje podatke o kariesu 1. in 2. stopnje pri otrocih in mladostnikih. Porocevalci so vsi javni in zasebni izvajalci zobozdravstvenega varstva otrok, podatki se zbirajo enkrat letno. Podatke za celotno Slovenijo zbira NIJZ, ki vsako leto pripravi podatke za podatkovni portal NIJZ.35 Porocilo o dejavnosti zobozdravstvenega varstva (Obrazec 8,294) vsebuje podatke o številu preventivnih, kurativnih in specialisticnih obiskov ter številu opravljenih storitev (restavracije, endodontija, parodontija, kirurgija, protetika, ortodontija, druge storitve). Porocevalci so vsi javni zdravstveni zavodi (zdravstveni domovi) in zasebni izvajalci zobozdravstvenega varstva, ki opravljajo zobozdravstveno dejavnost v Republiki Sloveniji. Podatki se zbirajo enkrat letno, objavljeni so na podatkovnem portalu NIJZ in v Zdravstvenem statisticnem letopisu Slovenije.36 Register izvajalcev zdravstvene dejavnosti in delavcev v zdravstvu (RIZDDZ) spremlja tudi število zobozdravnikov in zobozdravnikov specialistov v Sloveniji. Register upravlja in ga sproti posodablja NIJZ.37 Porocevalski sistem je med letoma 1984 in 2000 beležil klinicne podatke o zdravju zob (z indeksom KEP) in obzobnih tkiv. Osnovan je bil na vsakoletnih zobozdravstvenih pregledih otrok in mladostnikov.38-40 Register raka Republike Slovenije (RRRS) je eden najstarejših populacijskih registrov raka v Evropi.41 Beleži vse primere raka v Sloveniji in tako vkljucuje tudi vse vrste raka ustnega predela.42 Podatki so dostopni prek portala SLORA, vsako leto pa izide tudi letno porocilo Rak v Sloveniji.43 Sekundarni viri podatkov Slovenski viri Zdravstveni statisticni letopis Slovenije je letna publikacija NIJZ, ki med drugim zbira in ureja tudi z ustnim zdravjem povezane podatke. Viri podatkov za publikacijo so obrazec 8,294 (število preventivnih, kurativnih in specialisticnih obiskov; število opravljenih storitev), dosedanji nacin vodenja podatkov o zunajbolnišnicnih obravnavah ZUBSTAT (zbirka zunajbolnišnicne zdravstvene statistike; obiski v specialisticni ambulantni dejavnosti za oralno kirurgijo), RIZDDZ (število izvajalcev zobozdravstvene dejavnosti) in Statisticni urad Republike Slovenije (SURS; izdatki za zobozdravstveno varstvo).34,44 ZUBSTAT z letošnjim letom prehaja v spletni portal eSZBO.45 Podatkovni portal NIJZ vkljucuje podatke iz obrazca 8,74 (zobozdravstvena vzgoja), obrazca 8,288 (zdravstveno stanje šolskih in otrok in mladostnikov – karies 1. in 2. stopnje), obrazca 8,294 (število preventivnih, kurativnih in specialisticnih obiskov) ter RIZDDZ (število zobozdravnikov in zobozdravnikov specialistov).46 Zdravje v obcini je projekt, ki predstavlja vir informacij o kljucnih kazalnikih zdravja v slovenskem prostoru, ki ga pripravlja NIJZ v sodelovanju z drugimi organizacijami. Informacije o zdravju prebivalstva so predstavljene na ravni Slovenije, statisticnih regij, upravnih enot in obcin.47 V zvezi z zobozdravstvom zajema podatke o cišcenju zob, ki jih pridobiva iz raziskav CINDI.48 Tuji viri Eurostat je statisticni urad EU, ki zagotavlja statisticne podatke na evropski ravni. V svoji podatkovni zbirki vkljucuje podatke o številu aktivnih zobozdravnikov (vir podatkov je NIJZ)49 in podatke o neizpolnjenih potrebah po zobozdravstvenem varstvu (vir podatkov je anketa o življenjskih pogojih (angl. European Union Statistics of Income and Living Conditions – EU-SILC).21 OECD Health Statistics je spletna podatkovna zbirka Organizacije za gospodarsko sodelovanje in razvoj, ki zajema zdravstvene podatke, vkljucno s podatki o številu zobozdravnikov (aktivnih, licenciranih in delujocih v praksi) v Sloveniji. Vir podatkov je NIJZ.50,51 Krovni evropski kazalniki zdravja (angl. European Core Health Indicators – ECHI) so nastali na podlagi dolgorocnega sodelovanja med državami EU in Evropsko komisijo in služijo za zagotavljanje primerljivosti zdravstvenih informacij in znanja za spremljanje zdravja na ravni EU.52 Zobozdravstveno varstvo pokrivata dva kazalnika, in sicer pod zaporedno št. 72 (delež oseb, ki so bile pri zobozdravniku ali ortodontu v zadnjih štirih tednih; vir podatkov je EHIS)53 ter pod zaporedno št. 80 (delež oseb z neizpolnjenimi potrebami po zobozdravstvenih storitvah zaradi financnih razlogov, cakalnih dob ali razdalj; vir podatkov je EU-SILC).54 Študija o globalnem bremenu bolezni (angl. Global Burden of Disease Study – GBD). Upravlja jo Inštitut za zdravstvene meritve in vrednotenja (angl. Institute for Health Metrics and Evaluation – IHME) Univerze v Washingtonu v ZDA in prikazuje podatke o bremenu bolezni v 195 državah sveta. Podatki so standardizirani po dolocenih metodah in prikazani graficno glede na umrljivost, manjzmožnosti prilagojena leta življenja (angl. disability-adjusted life years – DALY) ali izgubljena leta zdravega življenja zaradi manjzmožnosti (angl. years lived with disability – YLD). Viri podatkov za ustno zdravje v Sloveniji so publikacije Rak v Sloveniji, raziskava HBSC ter nekatere druge ankete in znanstveni clanki.55 Evropski svet nacionalnih predstavnikov za zobozdravstvo (angl. The Council of European Chief Dental Officers – CECDO). Pobuda za zbiranje podatkov s strani CECDO se je zacela z namenom obravnavanja pomanjkanja celovitih podatkov o sistemih ustnega zdravstvenega varstva. Od leta 2013 CECDO zbira informacije v zvezi s številom zobozdravnikov, zobozdravstvenim izobraževanjem, stroški in kazalniki ustnega zdravja v državah clanicah EU ter Islandiji, Lihtenštajnu, Norveški in Švici, vendar se podatki ne posodabljajo redno in sistematicno.2 Viri podatkov za Slovenijo niso navedeni, razen za indeks KEP, katerega vir je clanek iz leta 2000.56 Podatkovna zbirka CAPP (angl. WHO Oral Health Country/Area Profile Programme) je vzpostavljena v podporo Globalnemu programu za ustno zdravje SZO (angl. WHO Global Oral Health Programme) za spremljanje ustnega zdravja. Zbirajo se podatki o indeksu KEP, CPI (angl. Community Periodontal Index), brezzobosti, raku in kadrovskih virih.57 Viri podatkov za Slovenijo niso navedeni, poleg tega tudi niso popolni in posodobljeni.58 Podatkovna zbirka HFA-DB (angl. European Health for All Database). Na tem portalu SZO zasledimo podatke o številu zobozdravnikov v Sloveniji (vir podatkov: RIZDDZ, NIJZ)59 ter številu diplomantov dentalne medicine (vir podatkov: Zdravstveni statisticni letopis Slovenije, NIJZ).60 Podatki so sicer stari, zadnji so iz leta 2014. Podatkovna zbirka je v preteklosti vsebovala tudi podatke o indeksu KEP (vir za Slovenijo so bile periodicne raziskave indeksa KEP po metodologiji SZO22), a niso vec dostopni. Zakljucek Ustno zdravje je del splošnega zdravja, vendar so bolezni ustne votline, ki jih je mogoce prepreciti, med najpogostejšimi zdravstvenimi stanji v Evropi in tudi v Sloveniji.2,61 Za boljše oblikovanje zdravstvenih politik glede preventivnih programov, zdravljenja in sistema zdravstvenega varstva je potreben celostni pristop, ki vkljucuje tudi sistematicno zbiranje ustreznih podatkov, tako klinicnih kot neklinicnih. Danes se zdravstvenih izidov ne vrednoti vec samo z ozdravitvijo, temvec tudi z vplivom na kakovost življenja.1,62 Potreben je torej celostni pristop, ki upošteva tudi z ustnim zdravjem povezano kakovost življenja (angl. oral health-related quality of life – OHRQoL).63 V tem pogledu je v prihodnje na podrocju ustnega zdravja v Sloveniji na nacionalni ravni potrebno vzpostaviti zbiranje, digitalizacijo in sistematizacijo klinicnih podatkov s sodobnimi kazalniki, na primer za ocenjevanje prisotnosti kariesa z ICDAS64,65 (angl. International Caries Detection and Assessment System), ter vpeljati kontinuirano zbiranje in analiziranje neklinicnih podatkov, ki se je zacelo leta 2019.6,7 Zahvala Raziskavo je financno podprla Javna agencija za raziskovalno dejavnost Republike Slovenije (ARRS) (P3-0429, Slovenski raziskovalni program za celostno obravnavo raka SLORApro). Reference 1. Bourgeois DM, Llodra JC, Norblad A, Pitts NB (eds.). A selection of essential oral health indicators. Recommended by European Global Oral Health Indicators Development Project, Chapter 5. In: Bourgeois DM (ed.). Health surveillance in Europe. European Global Oral Health Indicators Development Project. Final report 2003-2005. Lyon 2005: Community Action Programe on Health Monitoring, European Commission, Health and Consumer Protection Directorate-General. https://ec.europa.eu/health/ph_projects/2002/monitor ing/fp_monitoring_2002_frep_03b_en.pdf (21. 1. 2023) 2. Winkelmann J, Gez Rossi J, van Ginneken E. Oral health care in Europe: Financing, access and provision. Health Syst Transit 2022; 24(2): 1-176. 3. Platform for Better Oral Health in Europe. Why Oral Health Matters? Policy recommendations to improve oral health in the EU. http://www.oralhealthplatform.eu/news/platform­launches-manifesto-in-european-parliament/ (21. 1. 2023) 4. Watt RG, Daly B, Allison P et al. Ending the neglect of global oral health: time for radical action. Lancet 2019; 394(10194): 261-272. https://doi.org/10.1016/S0140-6736(19)31133-X (21. 1. 2023) 5. Ministrstvo za zdravje. Strategija ustnega zdravja v Republiki Sloveniji za obdobje 2020-2030. Ljubljana 2022: Ministrstvo za zdravje. https://www.gov.si/novice/2022-05-26-ni-zdravja­brez-ustnega-zdravja/ (21. 1. 2023) 6. Artnik B, Ranfl M, Blatnik J, Magajna A, Rostohar K. Ustno zdravje otrok in mladostnikov, 2019. Nacionalna raziskava o ustnem zdravju otrok in mladostnikov v Sloveniji leta 2019. Ljubljana 2020: Nacionalni inštitut za javno zdravje. https://nijz.si/wp­content/uploads/2022/07/publikacija_otroci_ustno_zd ravje.pdf (21. 1. 2023) 7. Artnik B, Ranfl M, Blatnik J, Magajna A, Rostohar K. Ustno zdravje odraslih, 2019. Nacionalna raziskava o ustnem zdravju odraslih v Sloveniji leta 2019. Ljubljana 2020: Nacionalni inštitut za javno zdravje. https://nijz.si/wp­content/uploads/2022/07/ustno_zdravje_odraslih_kon cna_splet_0.pdf (21. 1. 2023) 8. Stergar E, Scagnetti N, Pucelj V. Z zdravjem povezano vedenje. Ljubljana 2006: Inštitut za varovanje zdravja Republike Slovenije. https://nijz.si/wp­content/uploads/2022/07/hbsc_2002.pdf (21. 1. 2023) 9. Jericek H, Lavtar D, Pokrajac T. Z zdravjem povezano vedenje v šolskem obdobju. Ljubljana 2007: Inštitut za varovanje zdravja Republike Slovenije. https://nijz.si/wp­content/uploads/2022/07/hbsc_2006.pdf (21. 1. 2023) 10. Jericek Klanšcek H, Roškar S, Koprivnikar H, Pucelj V, Bajt M, Zupanic T. Neenakosti v zdravju in z zdravjem povezanih vedenjih slovenskih mladostnikov. Ljubljana 2011: Inštitut za varovanje zdravja Republike Slovenije. https://nijz.si/wp­content/uploads/2022/07/hbsc_2010_0.pdf (21. 1. 2023) 11. Jericek Klanšcek H, Bajt M, Drev A, Koprivnikar H, Zupanic T, Pucelj V. Z zdravjem povezana vedenja v šolskem obdobju med mladostniki v Sloveniji. Izsledki mednarodne raziskave HBSC, 2014. Ljubljana 2015: Nacionalni inštitut za javno zdravje. https://nijz.si/wp­content/uploads/2022/07/hbsc_2015_e_verzija30_06 _2015.pdf (21. 1. 2023) 12. Jericek Klanšcek H, Roškar M, Drev A, Zupanic T, Prelec Poljanšek P. Z zdravjem povezana vedenja v šolskem obdobju med mladostniki v Sloveniji. Izsledki mednarodne raziskave HBSC, 2018. Ljubljana 2019: Nacionalni inštitut za javno zdravje. https://nijz.si/wp­content/uploads/2022/07/hbsc_2019_e_verzija_obl.p df (21. 1. 2023) 13. CINDI Slovenija. CINDI v Sloveniji. http://cindi-slovenija.net/index.php?option=com_content&task=vi ew&id=167&Itemid=84 (21. 1. 2023) 14. Maucec Zakotnik J, Tomšic S, Kofol Bric T, Korošec A, Zaletel Kragelj L. Zdravje in vedenjski slog prebivalcev Slovenije. Trendi v raziskavah CINDI 2001-2004-2008. Ljubljana 2012: Inštitut za varovanje zdravja Republike Slovenije. https://nijz.si/wp­content/uploads/2022/07/zdravje_in_vedenjski_slog_p rebivalcev_slo_2011-2004-2008.pdf (21. 1. 2023) 15. Tomšic S, Kofol Bric T, Korošec A, Maucec Zakotnik J. Izzivi v izboljševanju vedenjskega sloga in zdravja. Desetletje CINDI raziskav v Sloveniji. Ljubljana 2014: Nacionalni inštitut za javno zdravje. https://nijz.si/wp­content/uploads/2022/07/izzivi_desetletje_cindi_14.pd f (21. 1. 2023) 16. Vinko M, Kofol Bric T, Korošec A, Tomšic S, Vrdelja M. Kako skrbimo za zdravje? Z zdravjem povezan vedenjski slog prebivalcev Slovenije 2016. Ljubljana 2018: Nacionalni inštitut za javno zdravje. https://nijz.si/wp­content/uploads/2022/07/kako_skrbimo_za_zdravje_s plet_3007_koncna.pdf (21. 1. 2023) 17. Zupanic T, Korošec A. Z zdravjem povezan vedenjski slog 2020, Prva objava. Ljubljana 2021: Nacionalni inštitut za javno zdravje. https://www.nijz.si/sites/www.nijz.si/files/uploaded/pod atki/podatkovne_zbirke_raziskave/CINDI/cindi2020_pr va_objava.pdf (21. 1. 2023) 18. Božic A, Zupanic T. Zdravje in zdravstveno varstvo v Sloveniji. Ljubljana 2009: Statisticni urad Republike Slovenije. https://www.stat.si/doc/pub/zdravje%20in%20zdravstve no%20varstvo-slo.pdf (21. 1. 2023) 19. Nacionalni inštitut za javno zdravje. Anketa o zdravju in zdravstvenem varstvu. Ljubljana: Nacionalni inštitut za javno zdravje. https://podatki.nijz.si/docs/EHIS.pdf (21. 1. 2023) 20. Nacionalni inštitut za javno zdravje. Nacionalna raziskava o zdravju in zdravstvenem varstvu (EHIS 2019). https://nijz.si/podatki/podatkovne-zbirke-in­raziskave/nacionalna-raziskava-o-zdravju-in­zdravstvenem-varstvu-ehis-2019/ (21. 1. 2023) 21. EUROSTAT. Self-reported unmet needs for dental examination by sex, age, main reason declared and groups of country of birth (HLTH_SILC_31). https://ec.europa.eu/eurostat/databrowser/view/hlth_si lc_31/default/table?lang=en (21. 1. 2023) 22. World Health Organization. Oral health surveys: basic methods (4th ed.). Geneva 1997: World Health Organization. https://apps.who.int/iris/bitstream/handle/10665/419 05/9241544937.pdf?sequence=1&isAllowed=y (21. 1. 2023) 23. Vrbic V, Vulovic M, Rajic Z et al. Oral Health in SFR Yugoslavia in 1986. Community Dent Oral Epidemiol 1987; 16: 286-288. https://doi.org/10.1111/j.1600­0528.1988.tb01776.x 24. Vrbic V. Oral health in Slovenia, 1987-1993. Community Dent Oral Epidemiol. 1996; 24: 364-365. https://doi.org/10.1111/j.1600­0528.1996.tb00878.x 25. Vrbic V. Upadanje zobnega kariesa v Sloveniji v obdobju 1987-1998. Zobozdrav Vestn 1999; 54(2): 39­43. 26. Vrbic V, Premik M. Caries decline among 12-year-old children in Slovenia, 1987-2003. J Dent Res 2004; 83(Special Issue A): 789. 27. Vrbic V. Zobno zdravje pri 12-letni mladini v Sloveniji, 1987-2008. Zobozdrav Vestn 2008; 63(4-5): 169-171. 28. Vrbic V. Zobno zdravje pri 12-letni mladini v Sloveniji (1987-2013). Zobozdrav Vestn 2014; 69: 74-80. 29. Vrbic V, Vrbic M, Petersen PE. Epidemiology of dental caries and disease prevention among 12-year-olds in Slovenia over thirty years (1987-2017). Oral Health Prev Dent 2020; 18(1): 185-96. https://doi.org/10.3290/j.ohpd.a44309 30. Toš N. Vrednote v prehodu I. Slovensko javno mnenje 1968­1990. E-Vrednote I. Ljubljana 2021: Univerza v Ljubljani, Fakulteta za družbene vede, IDV, CJMMK. https://www.cjm.si/wp-content/uploads/2021/10/VREDNOTE-1-WEB.pdf (21. 1. 2023) 31. Toš N. Vrednote v prehodu II. Slovensko javno mnenje 1990­1998. E-vrednote II. Ljubljana 2021: Univerza v Ljubljani, Fakulteta za družbene vede, IDV, CJMMK. https://www.cjm.si/wp-content/uploads/2022/04/VREDNOTE-2-WEB.pdf (21. 1. 2023) 32. Toš N. Vrednote v prehodu III. Slovensko javno mnenje 1999­2004. E-vrednote III. Ljubljana 2021: Univerza v Ljubljani, Fakulteta za družbene vede, IDV, CJMMK. https://www.cjm.si/wp-content/uploads/2021/10/VREDNOTE-3-WEB.pdf (21. 1. 2023) 33. Nacionalni inštitut za javno zdravje. Evidenca zdravstvenovzgojnega dela (ZV). Ljubljana: Nacionalni inštitut za javno zdravje. https://podatki.nijz.si/docs/6h_Zdravstvenovzgojna_dej avnost_Metodolo%C5%A1ka_pojasnila_NIJZ.pdf (21. 1. 2023) 34. Nacionalni inštitut za javno zdravje. Zdravstveni statisticni letopis Slovenije. https://nijz.si/podatki/zdravstveni-statisticni-letopis­slovenije/ (21. 1. 2023) 35. Nacionalni inštitut za javno zdravje. Porocilo o izvršenih sistematicnih pregledih šolskih otrok in mladostnikov. Ljubljana: Nacionalni inštitut za javno zdravje. https://podatki.nijz.si/docs/Sistematika_%C5%A1olskih _otrok_in_mladine_do_dopolnjenega_19._leta_starosti _MP_2021.pdf (21. 1. 2023) 36. Nacionalni inštitut za javno zdravje. Porocilo o dejavnosti zobozdravstvenega varstva (NIJZ 54). Ljubljana: Nacionalni inštitut za javno zdravje. https://podatki.nijz.si/docs/6_6m_ZOBJE_2016.pdf (21. 1. 2023) 37. Nacionalni inštitut za javno zdravje. Izvajalci zdravstvene dejavnosti. https://nijz.si/podatki/izvajalci-zdravstvene-dejavnosti/ (21. 1. 2023) 38. Premik M. Zdravstveno stanje zob in ustne votline pri šoloobveznih otrocih v SR Sloveniji: ugotavljanje, spremljanje in nacrtovanje: doktorska disertacija. Ljubljana 1988: Univerza v Ljubljani, Medicinska fakulteta. 39. Premik M, Artnik B. Otroško zobozdravstvo v pogledu javnega zdravja v Sloveniji. In: Gregoric A (ed.). XVIII. srecanje pediatrov v Mariboru. Zbornik. Maribor, 11. in 12. april 2008. Maribor 2008: Univerzitetni klinicni center: 119-122. 40. Artnik B, Kosem R. Zdravje ustne votline otrok in mladostnikov nekoc in danes. In: Matic L, Fink A, Vettorazzi R (eds.). Strokovno srecanje Ustna nega - vloga zdravstvene nege za zdravje ustne votline, 22. 4. 2009, Ljubljana. Ljubljana 2009: Zbornica zdravstvene in babiške nege Slovenije, Sekcija medicinskih sester v vzgoji in izobraževanju: 23-30. 41. Zadnik V, Gašljevic G, Hocevar M et al. Rak v Sloveniji 2019. Ljubljana 2022: Onkološki inštitut Ljubljana, Epidemiologija in register raka, Register raka Republike Slovenije. https://www.onko­i.si/fileadmin/onko/datoteke/rrs/lp/Letno_porocilo_20 19.pdf (21. 1. 2023) 42. Blatnik J, Zadnik V, Artnik B. Rak ustnega predela v Sloveniji v letih 1985-2014. Zdrav Vestn 2019; 88(11­12): 493-508. https://doi.org/10.6016/ZdravVestn.2845 43. Onkološki inštitut Ljubljana. Register raka Republike Slovenije in drugi registri. https://www.onko-i.si/rrs (21. 1. 2023) 44. Zaletel M, Vardic D, Hladnik M. Zdravstveni statisticni letopis Slovenije 2020. Ljubljana 2022: Nacionalni inštitut za javno zdravje. https://nijz.si/wp­content/uploads/2022/03/zdravstveni_statisticni_letopi s_2020.pdf (21. 1. 2023) 45. Nacionalni inštitut za javno zdravje. Spremljanje zunajbolnišnicnih obravnav (SZBO). https://nijz.si/podatki/podatkovne-zbirke-in­raziskave/spremljanje-zunajbolnisnicnih-obravnav­szbo/ (21. 1. 2023) 46. Nacionalni inštitut za javno zdravje. Podatkovni portal. https://podatki.nijz.si/pxweb/sl/NIJZ%20podatkovni%2 0portal/ (21. 1. 2023) 47. Zdravje v obcini. O zdravju v obcini. https://obcine.nijz.si/vsebine/strani/o-zdravju-po­obcini/ (21. 1. 2023) 48. Zdravje v obcini. Kazalnik K2.8 Umivanje zob. https://obcine.nijz.si/kazalniki/K2.8 (21. 1. 2023) 49. EUROSTAT. Health care staff. Dentists. 2021: EUROSTAT. https://ec.europa.eu/eurostat/cache/metadata/Annexe s/hlth_res_esms_an2.pdf (21. 1. 2023) 50. OECD. Stat. Health care resources: dentists. https://stats.oecd.org/Index.aspx?QueryId=30177 (21. 1. 2023) 51. OECD. OECD Health Statistics 2022. Definitions, sources and methods. Practising dentists (ISCO-08 code: 2261). 2022: OECD. https://stats.oecd.org/fileview2.aspx?IDFile=dcc2eaa1 -1b9a-4a69-8651-8abfa8da199c (21. 1. 2023) 52. Evropska komisija. Krovni evropski kazalniki zdravja. https://health.ec.europa.eu/indicators-and­data/european-core-health-indicators-echi_sl (21. 1. 2023) 53. Evropska komisija. ECHI Data Tool, Metadata: Indicator HIHSI058 - Selected outpatient visits: self-reported visits. https://webgate.ec.europa.eu/dyna/echi/?indlist=72 (21. 1. 2023) 54. Evropska komisija. ECHI Data Tool, Metada: Indicator HIHSI059 - Equity of access to dental care services. https://webgate.ec.europa.eu/dyna/echi/?indlist=80b (21. 1. 2023) 55. Institute for Health Metrics and Evaluation. Global Burden of Disease (GBD). https://www.healthdata.org/gbd/2019 (23. 1. 2023) 56. The Council of European Chief Dental Officers. CECDO Database. https://cecdo.org/oral-healthcare/cecdo-database/ (23. 1. 2023) 57. MalmUniversity Oral Health Country/Area Profile Project. Oral Health Country/Area Profile Project. https://capp.mau.se/ (21. 1. 2023) 58. MalmUniversity Oral Health Country/Area Profile Project. Country Areas: Slovenia. https://capp.mau.se/country-areas/slovenia/ (21. 1. 2023) 59. WHO European Health Information Gateway. Indicators: Dentists (PP) per 100.000. https://gateway.euro.who.int/en/indicators/hfa_509­5300-dentists-pp-per-100-000/ (21. 1. 2023) 60. WHO European Health Information Gateway. Indicators: Dentists graduated per 100.000. https://gateway.euro.who.int/en/indicators/hfa_532­5440-dentists-graduated-per-100-000/ (21. 1. 2023) 61. Institute for Health Metrics and Evaluation. GBD Results Tool. https://vizhub.healthdata.org/gbd-results/ (21. 1. 2023) 62. Bourgeois DM, Llodra JC, Nordblad A, Pitts NB. Report of the EGOHID I Project. Selecting a coherent set of indicators for monitoring and evaluating oral health in Europe: criteria, methods and results from the EGOHID I project. Community Dent Health 2008; 25(1): 4-10. https://www.cdhjournal.org/issues/25-1-march-2008/142-report-of-the-egohid-i­project?downloadarticle=download (21. 1. 2023) 63. Gift HC, Redford M. Oral health and the quality of life. Clin Geriatr Med 1992; 8(3): 673-683. 64. Ismail AI, Sohn W, Tellez M et al. The International Caries Detection and Assessment System (ICDAS): an integrated system for measuring dental caries. Community Dent Oral Epidemiol 2007; 35: 170-178. 65. Sebastian ST, Johnson T. International Caries Detection and Assessment System (ICDAS): an integrated approach. Int J Oral Health Med Res 2015; 2(3): 81-84. • Strokovni clanek Sara Mocnik, Dejan Dinevski, Hojka Gregoric Kumperšcak Uporaba umetne inteligence za diagnosticiranje in zdravljenje oseb z mejno osebnostno motnjo Povzetek. Umetna inteligenca prevzema pomembno mesto v zdravstvu, pri cemer je najpogosteje uporabljeno strojno ucenje. Na podrocju psihiatrije opažamo strm porast raziskav o uporabi strojnega ucenja predvsem z namenom objektivizacije postavljanja psihiatricnih diagnoz in personalizacije zdravljenja. Mejna osebnostna motnja je huda, obremenjujoca in razmeroma pogosta duševna motnja, prizadeti posamezniki pa bi imeli pomembne koristi od zgodnje postavitve diagnoze in optimalnega zdravljenja. Clanek predstavlja najnovejše raziskave s podrocja diagnosticiranja in zdravljenja mejne osebnostne motnje s pomocjo umetne inteligence. Kljucne besede: umetna inteligenca; strojno ucenje; psihiatrija; mejna osebnostna motnja. The Usage of Artificial Intelligence to Diagnose and Treat Individuals with Borderline Personality Disorder Abstract. Artificial intelligence is gaining an important role in health care, with machine learning being the most commonly used approach. In the field of psychiatry, we are witnessing a sharp increase in research on the use of machine learning, primarily for the purpose of objectifying psychiatric diagnostics and personalising the treatment. Borderline personality disorder is a severe, burdensome and relatively common mental disorder. The affected individuals would benefit substantially from early diagnosing and optimal treatment. The article presents the latest research in the field of diagnostics and treatment of borderline personality disorder with the help of artificial intelligence. Key words: artificial intelligence, machine learning; psychiatry, borderline personality disorder. . Infor Med Slov 2022; 27(1-2): 27-32 Institucije avtorjev / Authors' institutions: Zdravstveni dom Velenje (SM); Medicinska fakulteta, Univerza v Mariboru (SM, DD, HGK); Univerzitetni klinicni center Maribor (HGK). Kontaktna oseba / Contact person: Sara Mocnik, Zdravstveni dom Velenje, Vodnikova 1, 3320 Velenje, Slovenija. E-pošta / E-mail: sara.mergole@student.um.si. Prispelo / Received: 23. 12. 2022. Sprejeto / Accepted: 8. 1. 2023. Uvod Psihiatricne motnje predstavljajo veliko breme za bolnike, saj pogosto povzrocajo invalidnost ali prezgodnjo smrt, bremenijo pa tudi družbo – njihova obravnava je dolgotrajna in draga. Kljub pomembnim napredkom raziskav s psihiatricnega podrocja v zadnjih letih, bi si strokovnjaki želeli hitrejšega napredka na podrocju zaznavanja in zdravljenja psihiatricnih motenj. Kljub vecjemu številu uveljavljenih strukturiranih in polstrukturiranih intervjujev trenutni pristopi pri diagnosticiranju in zdravljenju duševnih motenj še vedno v veliki meri slonijo na nestrukturiranem psihiatricnem intervjuju in subjektivni oceni duševnega stanja.1 Upad duševnega zdravja, vpliv le-tega na bolnike in družbo ter pomanjkanje ustrezno izobraženega zdravstvenega osebja so nakazali potrebo po uporabi umetne inteligence (UI) za identifikacijo oseb z visokim tveganjem za razvoj psihiatricnih motenj ter kot pomoc pri nudenju ustreznih psihosocialnih intervenc in drugih terapevtskih ukrepov za preprecevanje pojava teh motenj in zdravljenje bolnikov.2 Mejna osebnostna motnja (MOM) je duševna motnja, za katero ocenjujejo, da prizadene 2 % splošne odrasle populacije,3 in mocno obremenjuje bolnika, njegovo družino in zdravstveni sistem. Povezana je s številnimi slabimi izidi, vkljucujoc nižjo stopnjo izobrazbe in slabše poklicne dosežke, manj dolgotrajnih partnerskih zvez in prijateljskih odnosov, vec konfliktov v partnerskem odnosu, tvegano spolno vedenje, slabo socialno podporo, nižje zadovoljstvo z lastnim življenjem in pogostejšo uporabo javnih zdravstvenih storitev. Pri osebah z MOM opazimo znacilno moteno uravnavanje custev, izkrivljeno in nestabilno samopodobo in moteno funkcioniranje v medosebnih odnosih. Do nedavnega je veljalo, da se MOM ne da zdraviti. Trenutno bistveni del zdravljenja predstavlja psihoterapija, farmakološko zdravljenje je indicirano le za socasne psihiatricne motnje, ki potrebujejo zdravljenje z zdravili že same po sebi, ali kadar je ob izjemnem poslabšanju duševnega stanja krizna intervenca v obliki psihosocialne podpore nezadostna.4 Poleg raznolikih simptomov MOM psihoterapijo otežujejo tudi osebnostne znacilnosti bolnikov. Težave v medosebnih stikih povzrocijo, da se upirajo terapiji, dvomijo v terapevta, sabotirajo zdravljenje. Zelo pogosto psihoterapijo na lastno željo predcasno zakljucijo. Psihoterapevtsko zdravljenje MOM je dolgotrajno in drago, zaradi dolgih cakalnih vrst, pomanjkanja usposobljenega osebja in ''težavnosti'' pacientov pa so le-ti iz zdravstvenega sistema pogosto izloceni. Z UI podprta terapija bi lahko predstavljala dodatek k terapiji z osebnim stikom in potencial za izboljšanje dolgorocnega izida zdravljenja.5 Umetna inteligenca v psihiatriji Umetna inteligenca se v zdravstvu vedno pogosteje uporablja, uspešno na primer v onkologiji, radiologiji in dermatologiji. Primeri njene uspešne uporabe so analiza podatkov iz elektronskih zdravstvenih kartotek, analiza (iskanje vzorcev) radioloških slik, nadzorni sistemi z uporabo senzorjev ter analiza podatkov iz družbenih omrežij.2 UI v psihiatriji pomeni uporabo naprednih racunalniških tehnik in algoritmov za diagnosticiranje, preprecevanje in zdravljenje duševnih motenj.1 Njena uporaba na podrocju duševnega zdravja je trenutno skromna. Razlogi za to so obcutljiva narava podatkov, pridobljenih med interakcijo med bolnikom in terapevtom, razmeroma majhno število razpoložljivih podatkov za ucenje in zelo raznoliki diagnosticni kriteriji v aktualnem Diagnosticnem in statisticnem prirocniku za duševne motnje Ameriškega psihiatricnega združenja (Diagnostic and Statistical Manual of Mental Disorders, DSM-5). Obdelava podatkov in klinicno odlocanje sta v psihiatriji veliko kompleksnejša kot nekatere druge specificne in objektivne naloge v zdravstvu (npr. identifikacija tumorja na sliki), ki jih že lahko opravi UI.2 Podrocje duševnega zdravja se mocno opira na vzpostavitev dobrega terapevtskega odnosa. Njegovo omejitev predstavlja kolicina casa, ki ga osebje lahko nameni posameznemu bolniku. UI lahko ponudi razbremenitev osebja na podrocjih, kjer osebni stik ni nujen in s tem omogoci osredotocenost psihiatra, psihologa in drugih clanov strokovnega tima na bolj empaticno obravnavo – v tem smislu bi UI celo lahko naredila psihiatrijo bolj »cloveško«. Podrocja, ki bi jih lahko prevzela UI, so podatkovno vodenje zdravstvenih kartotek in njihovo posodabljanje ter pridobivanje pomembnih informacij iz drugih razpoložljivih virov. Cilji uporabe UI v psihiatriji so odkrivanje motenj že v prodromalni fazi, personalizacija zdravljenja in opolnomocenje bolnikov pri sodelovanju v zdravljenju.2 Strojno ucenje in procesiranje naravnega jezika Strojno ucenje je najpogosteje uporabljena oblika UI v zdravstvu. Za ucenje, ocenjevanje in predvidevanje izidov prihodnjih dogodkov uporablja podatkovno vodene algoritme. Od tradicionalnih statisticnih pristopov se razlikuje v marsicem: hipoteze praviloma ustvarja in jih ne preverja; ima manj predpostavk v primerjavi s strogimi predpostavkami, potrebnimi za statisticno sklepanje; bolj je osredotoceno na napovedi in prepoznavanje vzorcev kot na ocenjevanje vnaprej izbranih parametrov.2 UI lahko uspešno obdeluje masivne podatke (angl. big data). Podzvrst strojnega ucenja, imenovana globoko ucenje (angl. deep learning), se v psihiatriji uporablja predvsem za podporo diagnostiki demence – bolezni, za katero so na podrocju psihiatrije na voljo najvecje podatkovne zbirke. Kot rešitev za pomanjkanje velikih podatkovnih zbirk s podrocja psihiatrije se ponuja ucenje s prenosom znanja (angl. transfer learning), ki ponudi prednaucene algoritme kot zacetne tocke za analizo novih podatkov.2 Procesiranje naravnega jezika vkljucuje razlicne metode: prepoznava govora, sentimentalna, leksicna in semanticna analiza govora in prepoznava opticnih znakov za prenos besedila iz nestrukturiranega v strukturiran format za nadaljnje analize. Navedene metode so za podrocje psihiatrije še posebej pomembne, saj sta jezik in govor primarna vira informacij za postavljanje diagnoz in zdravljenje psihiatricnih motenj. Zapisi nestrukturiranih psihiatricnih ocen (psihiatricna anamneza in status) so enostavno dostopni, poceni in nudijo veliko uporabnih informacij.2 Pomoc pri postavljanju diagnoze in zdravljenju Sistemi UI lahko pri postavljanju diferencialne diagnoze pomagajo na vec nacinov: ¦ izboljšajo razlikovanje med diagnozami s podobno zacetno klinicno sliko in razlicnimi pristopi zdravljenja (npr. razlikovanje med depresivno epizodo bipolarne motnje in unipolarno depresijo na podlagi slikanja možganov); ¦ pomagajo pri identifikaciji novih podtipov bolezni (npr. endofenotipi shizofrenije, podtipi depresije na osnovi slikanja možganov); ¦ iz neobicajnih podatkov in podatkovnih virov zgradijo modele – združevanje podatkov iz elektronskih zdravstvenih kartotek, nosljivih senzorjev, govora, objav v družbenih medijih, nevrofizioloških in slikovnih podatkov (RTG, CT, MR, …) ter genetike v modele za obravnavo duševnih motenj (npr. uporaba slik, objavljenih na družbenem omrežju, za dolocanje tveganja za depresijo). UI lahko upošteva tako genetske kot okoljske dejavnike tveganja, kar je pomembno pri kompleksni bio-psiho-socialni naravi psihiatricnih motenj.2 UI lahko psihiatricno zdravljenje podpre na vec nacinov: ¦ predvidevanje odziva na zdravljenje, s cemer se izognemo sodelovanju v klinicnih študijah, ki so za pacienta neucinkovite, invazivnim in dragim elektrostimulacijam možganov in zamudnim psihoterapijam (npr. odziv na zdravljenje z antidepresivom glede na dosežke na klinicnem vprašalniku in EEG posnetek); ¦ predvidevanje pojava resnih neželenih ucinkov (npr. tveganje za ledvicno insuficienco pri zdravljenju z litijem glede na podatke iz elektronske zdravstvene kartoteke); ¦ gradnja novih teoreticnih modelov patofiziologije bolezni (npr. dolocitev casovnice poteka bolezni in razvoja sprememb možganov od prodroma preko prve psihoze do shizofrenije); ¦ dolocanje genetskih vzorcev, znacilnih za razlicne psihiatricne motnje; ¦ dolocanje potencialnih novih zdravil z uporabo simulacije in podatkovno vodenih pristopov.2 Mejna osebnostna motnja Klinicna slika Spekter znakov MOM je zelo širok in se lahko tekom življenja pri posamezniku spreminja. Simptomatika MOM je najocitnejša na treh podrocjih: intenzivno custvovanje z mocnimi nihanji, vkljucujoc impulzivnost; nestabilna in spreminjajoca se samopodoba; in težave v medosebnih odnosih. Pri osebah z MOM se pogosteje kot v splošni populaciji pojavljajo nekatera disfunkcionalna vedenja: ponavljajoce samopoškodovalno vedenje, kronicne samomorilne misli, agresivni izbruhi in preobcutljivost na zavrnitev. Simptomi se prvic pojavijo v adolescenci, dosežejo vrh v pozni adolescenci in zgodnji odrasli dobi, kasneje se praviloma postopno umirjajo.4 Diagnosticiranje Pomembno je na diagnozo posumiti že v zgodnji adolescenci in poiskati osebe s povišanim tveganjem za razvoj MOM. Ob akutni krizni situaciji je, ce pacient zaradi MOM še ni bil obravnavan, pomembno izvesti potrebno diagnostiko. Vecini pacientov z MOM postavitev diagnoze predstavlja bistveno olajšanje, saj si z njo razložijo svoje vedenje in pretekle življenjske izkušnje. Postavljena diagnoza je pogoj za pricetek ustrezne psihoedukacije in zdravljenja.4 Zdravljenje Pomembno je, da z zdravljenjem MOM zacnemo kar se da hitro, da preprecimo potencialno kronifikacijo motnje. Zdravljenje v prvi vrsti predstavljajo psihosocialne intervence. Poleg bistvene psihoterapije so pomembni tudi preventiva pri osebah s povišanim tveganjem za razvoj MOM, individualni nacrti za ravnanje ob krizah, vkljucitev pomembnih drugih, osredotocenost na funkcioniranje osebe izven zdravljenja, šola za starše, pomoc Centra za socialno delo itd. Glavni obliki psihoterapije, ki se uporabljata pri zdravljenju MOM, sta dialekticna vedenjska terapija in na mentalizaciji temeljeca terapija.4 Akutno zdravljenje MOM vkljucuje akutne psihosocialne intervence in uporabo psihofarmakoterapije.4 Pogosto so predpisana razlicna psihotropna zdravila, ceprav nimajo uradne indikacije za zdravljenje MOM (angl. off-label medication use).6 Kolicina dokazov o ucinkovitosti razpoložljive psihofarmakoterapije je omejena. Trenutne raziskave ne podpirajo uporabe zdravil ob odsotnosti komorbidnih psihiatricnih bolezni. V primerjavi s placebom naj bi imela zdravila minimalen do nicen ucinek na jakost simptomov MOM, samopoškodovalno vedenje, s samomorom povezane izide ter psihosocialno funkcioniranje. Dokazi z nizko stopnjo gotovosti kažejo na manj težav v medosebnih odnosih po uporabi antipsihotikov ali stabilizatorjev razpoloženja, pri uporabi antidepresivov pa je ta ucinek minimalen do nicen.6 Bistveno je, da pacienta motiviramo za zdravljenje in ga spodbudimo, da si poišce psihoterapevtsko podporo. V idealnih javnozdravstvenih okolišcinah bi osebi z MOM takoj bilo omogoceno specificno psihoterapevtsko in psihiatricno zdravljenje, ki bi intenzivno potekalo vsaj šest mesecev. Bolnišnicno zdravljenje MOM ni priporocljivo; ce je nujno, mora biti cim krajše.4 Uporaba umetne inteligence pri obravnavi oseb z mejno osebnostno motnjo Diagnosticiranje mejne osebnostne motnje Osebe z MOM pogosto dobijo napacno diagnozo ali je sploh nimajo, zato veckrat zamudimo optimalen cas za pricetek zdravljenja. Avtomatsko presejanje elektronskih zdravstvenih kartotek je ena izmed možnosti za zgodnjo identifikacijo oseb z MOM. Osnovano je na algoritmu, ki vkljucuje na pravilih osnovano izbiro in strojno ucenje. Algoritem najprej izbere potencialne bolnike glede na socasne bolezni in simptome, pogosto povezane z MOM, nato pa predvidi, ali je pri posamezniku bolj verjetno, da motnjo ima ali je nima.7 Druga možnost uporabe UI za zgodnje odkrivanje oseb z MOM vkljucuje uporabo razvršcanja z algoritmom nakljucnih gozdov (angl. random forest classification). Algoritem je izlušcil znacilke custvovanja pri osebah s postavljeno diagnozo MOM z 81 % tocnostjo.8 Z metodo strojnega ucenja, regularizirano regresijo, lahko identificiramo najpomembnejše dejavnike tveganja za razvoj MOM. Tako zgrajen model vkljucuje 19 dejavnikov tveganja; simptomi depresije in anksioznosti, samokontrola, strogo kaznovanje ter slabo socialno in šolsko funkcioniranje so se izkazali za najbolj kriticne.9 Povsem objektivno klinicno orodje za postavitev diagnoze MOM ne obstaja. Opisana je uporaba strojnega ucenja, natancneje prepoznavanja vzorcev in metod razvršcanja, za izlušcenje znacilk iz funkcijskega magnetnoresonancnega slikanja (nenormalna možganska aktivnost v izbranih regijah ob odzivih na izraze obraza) za prepoznavo MOM. Predlagani pristop je dosegel 94 % tocnost pri razlikovanju 21 oseb z MOM od 10 zdravih oseb.10 Mnoge raziskave so že potrdile morfološke spremembe možganov pri osebah z MOM. Opisano je razlikovanje oseb z MOM od zdravih s kombinacijo avtomatiziranih morfometricnih orodij za merjenje kortikalne debeline in razvršcanja z uporabo metode podpornih vektorjev. Pristop vkljucuje izbiro znacilk za identifikacijo regij z najvecjim potencialom za razlikovanje. Opisano bi lahko slikanje možganov vkljucilo v diagnostiko razlicnih psihiatricnih motenj.11 Razlikovanje bipolarne motnje od mejne osebnostne motnje je pogosta diagnosticna dilema, saj se njuni simptomi pogosto prekrivajo. Pri obeh opazimo disforicno razpoloženje, samomorilnost in samopoškodovalno vedenje, impulzivnost – najpogosteje zapravljanje – in spolno dezinhibiranost ter zlorabo alkohola in prepovedanih drog. Predvsem na osnovi impulzivnosti lahko osebo z MOM hitro oznacimo kot manicno ali hipomanicno. Na podlagi strojnega ucenja je mogoce uspešno razlikovati med tema motnjama.12 Zdravljenje mejne osebnostne motnje V literaturi je predstavljena uporaba UI v obliki procesiranja naravnega govora kot dodatka k dialekticni vedenjski terapiji ali na mentalizaciji temeljeci terapiji, pa tudi drugim, pri MOM redkeje uporabljenim terapijam. Pri tem lahko navidezni agent nudi podporo pri mentalizaciji in bolnika z usmerjenimi vprašanji vodi skozi psihoterapevtsko seanso. Dodatno lahko prepoznava bolnikova custva, izbiro besed, negativno razmišljanje, zmožnost samokontrole itd. ter v skladu s tem usmerja potek seanse.5 Le približno polovica oseb z MOM se dobro odzove na ustrezno obliko psihoterapije, ki je sicer težko dostopna in draga. Razmeroma nizek delež uspešnosti bi lahko dvignili, ce bi poznali objektivne napovedne dejavnike za izboljšanje simptomov po terapiji. Z uporabo strojnega ucenja je mogoce iskati klinicne znacilnosti, ki bi lahko napovedale izboljšanje ali poslabšanje resnosti motnje in impulzivnosti oseb z MOM po skupinski dialekticni vedenjski terapiji. Izbrana metoda je uspešno identificirala 34 pomembnih napovednih dejavnikov za resnost motnje in 17 za impulzivnost. Takšna metoda bi lahko predstavljala osnovo za personalizirano zdravljenje MOM.13 Znižanje tveganja za custveno krizo pri osebah z MOM je možno doseci z zdravljenjem osnovne custvene disregulacije in/ali s terapevtsko podporo med krizo (npr. s telefonskim klicem), toda tak pristop ni ucinkovit, saj porablja veliko cloveških virov in financnih sredstev. Terapevtska racunalniška aplikacija bi lahko predstavljala nacin za reševanje potreb po dodatni terapiji oseb z MOM med samo krizo. Mobilna aplikacija B-RIGHT, osnovana na psihoterapevtskih algoritmih UI, se poslužuje dialekticne vedenjske terapije, ki je bila uspešna pri zmanjšanju zlorabe prepovedanih drog in samopoškodovalnega vedenja brez samomorilnega namena ter pri zniževanju averzivne napetosti. Bolniki so bili z uporabo aplikacije v smislu omilitve simptomov zelo zadovoljni.3 Razprava Pregled aktualnih raziskav z obravnavanega podrocja razkriva potencial za povezovanje metod umetne inteligence in klinicnega dela psihiatrov ter drugih sodelujocih v obravnavi oseb z mejno osebnostno motnjo. Pomembno omejitev pri obravnavi razpoložljive literature predstavlja omejitev izkljucno na mejno osebnostno motnjo; zelo verjetno bi bilo tudi dela s podrocja drugih osebnostnih motenj ali drugih podrocij psihiatrije možno in smiselno aplicirati na obravnavo mejne osebnostne motnje. Literatura torej v splošnem podpira smiselnost razvoja na umetni inteligenci osnovanih intervenc za diagnosticiranje in zdravljenje psihiatricnih motenj. Poleg ocitnega prenosa opravljanja rutinskih nalog iz zdravnika na inteligentna orodja in posledicne razbremenitve ter vecje osredotocenosti na odnos med zdravnikom in bolnikom so njihove pomembne prednosti tudi dejstvo, da nekateri bolniki ob še vedno mocno prisotni stigmatizaciji svoje težave lažje zaupajo racunalniku kot zdravniku, izogibanje negativnemu transferju ob stiku bolnika s terapevtom ter enostaven in hiter dostop do terapije.1,5 Ker je ustrezno zdravljenje MOM v mnogih okoljih težko dostopno, je potrebna usmeritev v razvoj konceptov zdravljenja s kratkimi programi za samopomoc pri osebah z blago obliko MOM in v zagotavljanje kompleksnejših in daljših obravnav s strani strokovnjakov za osebe s hujšimi oblikami.4 Umetna inteligenca je osnovana na cloveški inteligenci in lahko marsikatero nalogo opravi hitreje in bolje kot clovek. Z nadaljnjimi izboljšavami se bo morda nekoc razvila v superinteligenco. Kljub temu, da lahko ponovi marsikatero cloveško inteligentno sposobnost, kot so hitrost obdelave podatkov, spomin, sklepanje, vidno-prostorske sposobnosti, slušno procesiranje in povezava znanja z razumevanjem, pa umetna inteligenca ni sposobna socutnih in pravicnih odlocitev. Ni sposobna upoštevati raznolikosti med ljudmi, razlicnih perspektiv, etike in morale. Vse to govori v prid potrebe po nadgradnji umetne inteligence v umetno modrost, ki bo lahko omogocila bolj socutno in eticno oskrbo raznolikih skupin ljudi.2 Kljub velikim obetom in pricakovani rasti uporabe razlicnih oblik umetne inteligence v raznolikih zdravstvenih situacijah je skrb, da bi robot ali algoritem v celoti prevzel delo psihiatra ali psihologa, odvec. Pricakovati je in dobrodošel bo prenos monotonih, obremenjujocih in ponavljajocih se vsakodnevnih nalog na UI, ki bi lahko vodil do višje ucinkovitosti in manjše možnosti napak pri zdravljenju. Reference 1. Fakhoury M. Artificial intelligence in psychiatry. Adv Exp Med Biol 2019; 1192: 119-125. https://doi.org/10.1007/978-981-32-9721-0_6 2. Lee EE, Torous J, De Choudhury M, et al. Artificial intelligence for mental health care: clinical applications, barriers, facilitators, and artificial wisdom. Biol Psychiatry Cogn Neurosci Neuroimaging 2021; 6(9): 856-864. https://doi.org/10.1016/j.bpsc.2021.02.001 3. Frías Á, Palma C, Salvador A, et al. B·RIGHT: usability and satisfaction with a mobile app for self-managing emotional crises in patients with borderline personality disorder. Australas Psychiatry 2021; 29(3): 294-298. https://doi.org/10.1177/1039856220924321 4. Bohus M, Stoffers-Winterling J, Sharp C, Krause-Utz A, Schmahl C, Lieb K. Borderline personality disorder. Lancet 2021; 398(10310): 1528-1540. https://doi.org/10.1016/S0140-6736(21)00476-1 5. Szalai J. The potential use of artificial intelligence in the therapy of borderline personality disorder. J Eval Clin Pract 2021; 27(3): 491-496. https://doi.org/10.1111/jep.13530 6. Stoffers-Winterling JM, StorebOJ, Pereira Ribeiro J, et al. Pharmacological interventions for people with borderline personality disorder. Cochrane Database Syst Rev 2022; 11(11): CD012956. https://doi.org/10.1002/14651858.CD012956.pub2 7. Zang C, Goodman M, Zhu Z, et al. Development of a screening algorithm for borderline personality disorder using electronic health records. Sci Rep 2022; 12(1): 11976. https://doi.org/10.1038/s41598-022-16160-z 8. Deb K, De H, Chatterjee SS, Pal A. Studying borderline personality disorder using machine learning. In: 16th International conference on ubiquitous information management and communication (IMCOM). Seoul, Korea: 2022: IEEE: 1-6, https://doi.org/10.1109/IMCOM53663.2022.97218 00 9. Beeney JE, Forbes EE, Hipwell AE, et al. Determining the key childhood and adolescent risk factors for future BPD symptoms using regularized regression: comparison to depression and conduct disorder. J Child Psychol Psychiatry 2021; 62(2): 223-231. https://doi.org/10.1111/jcpp.13269 10. Xu T, Cullen KR, Houri A, Lim KO, Schulz SC, Parhi KK. Classification of borderline personality disorder based on spectral power of resting-state fMRI. Annu Int Conf IEEE Eng Med Biol Soc 2014; 2014: 5036-5039. https://doi.org/10.1109/EMBC.2014.6944756 11. Sato JR, de Araujo Filho GM, de Araujo TB, Bressan RA, de Oliveira PP, Jackowski AP. Can neuroimaging be used as a support to diagnosis of borderline personality disorder? An approach based on computational neuroanatomy and machine learning. J Psychiatr Res 2012; 46(9): 1126-1132. https://doi.org/10.1016/j.jpsychires.2012.05.008 12. Bayes A, Spoelma MJ, Hadzi-Pavlovic D, Parker G. Differentiation of bipolar disorder versus borderline personality disorder: a machine learning approach. J Affect Disord 2021; 288: 68-73. https://doi.org/10.1016/j.jad.2021.03.082 13. Jiménez S, Angeles-Valdez D, Rodríguez-Delgado A, et al. Machine learning detects predictors of symptom severity and impulsivity after dialectical behavior therapy skills training group in borderline personality disorder. J Psychiatr Res 2022; 151: 42-49. https://doi.org/10.1016/j.jpsychires.2022.03.063 • Strokovni clanek Mojca Dovnik, Jože Balažic, Dejan Dinevski Potenciali umetne inteligence za uporabo v sodnomedicinski praksi Povzetek. Raziskovanje možnosti, ki jih umetna inteligenca ponuja za reševanje razlicnih problemov v medicini, predstavlja zelo aktualno podrocje znanosti. Na podrocju sodne medicine, ki je izrazito vizualna veja medicine tako na makroskopski kot na mikroskopski ravni, so posebej obetavne konvolucijske nevronske mreže, ki imajo odlicno sposobnost prepoznave in kategorizacije slikovnega materiala. Specialistu sodne medicine so lahko v pomoc pri ugotavljanju vzrokov smrti, identifikaciji, interpretaciji strelnih ran, dolocanju casa nastopa smrti in pri klinicnem delu. Vendar pa so metode umetne inteligence na podrocju sodne medicine v razlicnih fazah zrelosti za uporabo v realnih delovnih okolišcinah. V splošnem so še posebej uporabne za pregled kompleksnih baz podatkov, ko je potrebno izlušciti dolocen podatek ali opozoriti na doloceno podrobnost, ki bi se lahko izkazala za pomembno pri koncni odlocitvi oziroma diagnozi. Interpretacija zakljuckov algoritmov umetne inteligence pa ostaja v domeni specialista sodne medicine. Umetno inteligencni sistemi imajo tudi slabosti, njihova vpeljava v vsakodnevno delo pa na podrocju sodne medicine predstavlja še posebej kompleksno nalogo, saj ocena relevantnosti uporabe in sprejemanje takšnega nacina dela ni odvisna zgolj od zdravnikov, temvec tudi od sodnikov ter odvetnikov, žrtev in storilcev kaznivih dejanj. Kljucne besede: umetna inteligenca; sodna medicina; identifikacija; cas smrti; kremenaste alge; strelne rane. Potentials of Artificial Intelligence for Use in Forensic Medical Practice Abstract. The potential of artificial intelligence to solve various problems in medicine is an intensively researched area of science. Convolutional neural networks, which have an excellent ability to recognize and categorize imagery, are especially promising in the field of forensic medicine, which is a particularly visual branch of medicine at both the macroscopic and microscopic level. They can be helpful to the forensic medicine specialist in determining causes of death, identification of human remains, interpretation of gunshot wounds, estimating post-mortem interval, and in clinical work. However, artificial intelligence methods in forensic medicine are at various stages of maturity for use in real-world work situations. In general, they are particularly useful in reviewing complex databases, extracting specific information or pointing out a particular detail that may prove important to the final decision or diagnosis. However, the interpretation of the conclusions of artificial intelligence algorithms is left to the forensic medical specialist. Artificial intelligence systems also have weaknesses, and their introduction into the daily work of forensic medicine is a particularly complex task, since the assessment of the relevance of the use and the acceptance of such a way of working depends not only on medical doctors, but also on judges and lawyers, victims and offenders. Key words: artificial intelligence; forensic medicine; identification; post-mortem interval; diatoms; gunshot. . Infor Med Slov 2022; 27(1-2): 33-41 Institucije avtorjev / Authors' institutions: Univerzitetni klinicni center Maribor (MD); Medicinska fakulteta Ljubljana, Univerza v Ljubljani (JB); Medicinska fakulteta Maribor, Univerza v Mariboru (DD). Kontaktna oseba / Contact person: Mojca Dovnik, dr. med., UKC Maribor, Ljubljanska ulica 5, 2000 Maribor, Slovenija. E-pošta / E-mail: mojca.dovnik@student.um.si. Prispelo / Received: 30. 1. 2023. Sprejeto / Accepted: 31. 1. 2023. Uvod Raziskovanje možnosti, ki jih umetna inteligenca (UI; angl. artificial intelligence) ponuja za reševanje razlicnih problemov v medicini, predstavlja zelo aktualno in pomembno podrocje znanosti. UI se ukvarja s tako imenovanimi »mislecimi stroji«. Predstavlja teorijo in razvoj racunalniških sistemov, ki so sposobni opravljati naloge, za katere bi sicer bila potrebna cloveška inteligenca, kot so vidno zaznavanje, prepoznava govora in odlocanje. Umetnointeligencni sistemi so sposobni ucinkovitega pregledovanja masivnih podatkov (angl. big data) in njihovega razvršcanja. Ena izmed vej UI je strojno ucenje (angl. machine learning). Obsega razlicne tehnike analize vhodnih podatkov in odlocanja, pri cemer se praviloma zanaša na posredovanje programerja pri razumevanju vhodnih podatkov. Globoko ucenje (angl. deep learning) je metoda strojnega ucenja, ki omogoca reševanje kompleksnih problemov in za svoje delovanje ne potrebuje clovekovega posredovanja. Definiranje znacilnosti, ki so potrebne za koncni odlocitveni proces, pri globokem ucenju ni potrebno, temvec gre za avtomatski proces oziroma sposobnost samostojnega ucenja. Globoko ucenje posnema delovanje cloveških možganov in je zasnovano na nevronskih mrežah. Natancneje so konvolucijske nevronske mreže (angl. convolutional neural networks) tiste, ki imajo odlicno sposobnost prepoznave in kategorizacije slikovnega materiala. Za svoje delovanje uporabljajo principe linearne algebre, predvsem matricno množenje za prepoznavanje vzorcev v slikah.1-4 Konvolucijske nevronske mreže so že pokazale velik potencial za uporabo v diagnostiki in obravnavi razlicnih bolezenskih stanj in so obetavne tudi na podrocju sodne medicine, ki je izrazito vizualna veja medicine tako na makroskopski kot na mikroskopski ravni. Sodna medicina s posredovanjem medicinskih ugotovitev pravnim in drugim pristojnim oblastem sodeluje v razrešitvah kazenskih in civilnih zadev. Temeljno opravilo specialista sodne medicine vkljucuje obdukcije umrlih sumljivih smrti, ki so v zvezi ali posledica kaznivega dejanja. Prav tako je pomembno delo na podrocju izvedenstva v kazenskih, civilnopravnih ter zavarovalniških zadevah, mrliškopregledna služba, histološka dejavnost, forenzicna genetika, forenzicna toksikologija in antropologija, katastrofna služba ter klinicna forenzicna medicina. Metode UI so na podrocju sodne medicine v razlicnih fazah zrelosti za uporabo v realnih delovnih okolišcinah. Vecinoma gre za fazo intenzivnega raziskovanja, s tem pa razvoja in preverjanja veljavnosti številnih modelov za uporabo. V nadaljevanju so opisani primeri uporabe UI na podrocju tanatologije in klinicne forenzicne medicine, ki so do sedaj pokazali najvecji potencial.5,6 Identifikacija trupel ali delov trupel Pozitivna identifikacija mrtvih na podlagi medicinsko relevantnih znacilnosti je mogoca s pomocjo ne­primerjalnih tehnik, kjer gre za dolocitev osnovnih znacilnosti trupla (tj. spola, starosti, višine, teže in indeksa telesne mase) ali primerjalnih tehnik, kjer pa gre za iskanje ujemanja med posmrtnimi ostanki in informacijami in dokumenti živih za katere predvidevamo, da bi lahko bili med umrlimi. Znacilnosti na katere se je mogoce upreti in tehnike, ki se bodo uporabile za dolocitev identitete, so v veliki meri odvisne od ohranjenosti trupla. Obstajajo razlicne možnosti vkljucevanja umetne inteligence tako v neprimerjalne kot tudi v primerjalne tehnike identifikacije.5,6 Neprimerjalne tehnike identifikacije UI se na podrocju neprimerjalnih tehnik identifikacije najveckrat uporablja za dolocanje spola in starosti trupla na podlagi rentgenskih slik (npr. ortopantomogramov), nekatere novejše metode za dolocanje spola pa temeljijo tudi na razlikah v možganskih znacilnostih, prikazanih s pomocjo magnetne resonance. Nekatere metode se uporabljajo tudi za rekonstrukcijo obraza na podlagi zobozdravstvenih znacilnosti.5,7 Uporaba raznih 3D in slikovnih tehnik (racunalniške tomografije, magnetne resonance, skenerjev, ipd.) v sodnomedicinskih postopkih identifikacije je sicer dobrodošla, vendar ena sama tehnika obicajno ne zadošca za dolocitev spola žrtve, še posebej skeletiziranega trupla. Kombinirana uporaba navedenih tehnik je predvsem s financnega vidika zaenkrat nesprejemljiva, zato se v sodni medicini poslužujemo osnovne DNK genotipizicije (dolocitev osnovnega genetskega profila), ki združuje tudi fenotip in je zaenkrat tudi najnatancnejša in cenovno sprejemljiva metoda za dolocanje spola neznanega, predvsem skeletiziranega trupla. Dolocanje spola neskeletiziranih trupel obicajno temelji na zunanjem pregledu trupla, v primeru skeletiziranih posmrtnih ostankov pa na morfoloških znacilnostih ter morfometriji lobanje, medenice ter dolgih in nekaterih drugih kosti. Dolocanje starosti je težavnejše od dolocanja spola neskeletiziranega trupla in gre obicajno za grobo oceno z ozirom na barvo las, elasticnost kože, stanje zobovja, morebitno prisotnost senilnega obroca na robu roženice in prisotnost razlicnih stopenj degenerativnih ateroskleroticnih sprememb arterij. Eden izmed bolj natancnih pokazateljev starosti je ocena osifikacijskih jeder in stopnje fuzije epifiz. Po zakljucku razvoja skeleta in zobovja obstaja manj zanesljivih znakov, ki bi bili uporabni za oceno starosti, zato ostaja dolocanje biološke starosti odraslih okostnjakov ena izmed najtežjih nalog na podrocju forenzicne antropologije.5 Razlicni modeli UI lahko pripomorejo k odlocitvi glede spola in starosti skeletnih ostankov. Eden izmed takih modelov za dolocanje spola skeletnih ostankov je prikazan na sliki 1. Temelji na virtualnih 3D rekonstrukcijah medenice, izoblikovanih na osnovi slikovnega materiala, pridobljenega z racunalniško tomografijo (CT). Algoritem se je izkazal za ucinkovitejšega od cloveka v pravilni dolocitvi spola navideznih 3D rekonstrukcij medenice dejanskih skeletnih ostankov. Te rekonstrukcije so ustvarili s pomocjo rocnega 3D opticnega citalca. Ceprav je uporaba CT povezana z visokimi stroški nakupa opreme in njenega vzdrževanja in zahteva specializirano strokovno znanje; tak model konvolucijske nevronske mreže, ki ga je mogoce uporabiti na prenosnih napravah ob dostopu do 4G/5G omrežja, veliko obeta na podrocju dolocanja spola skeletnih ostankov na samem kraju zlocina oziroma najdbe ostankov.8 Slika 1 Primer modela umetne inteligence za dolocanje spola skeletnih ostankov. Problem v slovenskem prostoru predstavlja tudi dejstvo, da obe Medicinski fakulteti nista del zdravstvenega sistema po analogiji univerzitetnih klinik (Nemcija, Švica) in je tako sodelovanje z radiološkimi inštituti in oddelki bolnišnic ter obeh Univerzitetnih klinicnih centrov prakticno nemogoce. Trenutno edini Inštitut za sodno medicino na Medicinski fakulteti v Ljubljani pa si modernih slikovnih tehnik razen prenosnega rentgenskega aparata ter skenerja iz financnih razlogov ne more samostojno privošciti, zato je primoran pri svojem delu uporabljati konvencionalne metode in tehnike. Primerjalne tehnike identifikacije Umetna inteligenca je lahko v pomoc na podrocju genetike pri analizi kompleksnih genetskih profilov, v forenzicni antropologiji v procesu kraniofacialne superprojekcije ali v forenzicni odontologiji za klasifikacijo razlicnih posegov na zobovju ali prepoznavo dolocenih znacilnosti zobovja (npr. avtomatsko analizo dentalnih rentgenskih slik). Trenutno se umetna inteligenca že uporablja v procesu identifikacije žrtev množicnih nesrec in je bila vkljucena v ta proces pri strmoglavljenju letala MH17 v Ukrajini leta 2014, letalski nesreci v Tripoliju leta 2010 in cunamiju na Tajskem leta 2004. Specialist sodne medicine se v primeru množicne nesrece srecuje s številnimi žrtvami. Nekatere izmed njih lahko identificira s pomocjo primerjave obraza s sliko na potnem listu, najdenem na kraju nesrece. Poškodbe pa so lahko zelo hude in zaradi tega je tak nacin identifikacije ni mogoc. V tem primeru bi lahko zdravnik uporabil umetno inteligenco za izlušcenje relevantnih znacilnosti iz slike obraza, programska oprema pa bi nato te podatke primerjala z zbirko že identificiranih obrazov. Rezultate ujemanja bi nato zdravnik ustrezno ovrednotil in odlocil o morebitnih dodatnih metodah, ki bi bile potrebne za identifikacijo.5 Pri uporabi tovrstnih algoritmov umetne inteligence so strokovnjaki pri identifikaciji žrtev letalske nesrece in cunamija naleteli na velik problem, saj vecina predhodno fotografsko obdelanih obrazov žrtev ni bila na razpolago, oziroma so bili fotografski posnetki za tovrstno delo neuporabni. Specialist sodne medicine se v procesu identifikacije osredotoca na razlicne znacilnosti trupla. Pomembna je predvsem prepoznava prstnih odtisov, analiza dednega materiala in ocena zobovja. Manj pogosto analizira anatomske in biološke znacilnosti sfenoidalnega ali frontalnega sinusa, ki pa so prav tako edinstvene in se lahko uporabijo za identifikacijo posameznikov. Primer metode UI za identifikacijo posameznikov, ki temelji na oceni znacilnosti 3D modelov sfenoidalnih sinusov, rekonstruiranih na osnovi CT slikovnega gradiva, je prikazan na sliki 2. Algoritem je sposoben izlušciti relevantne geometrijske znacilnosti sfenoidalnega sinusa neidentificirane osebe in jih primerjati s slikovnim gradivom iz drugega obdobja (tj. zaživljenjskimi CT posnetki sfenoidalnega sinusa). Metoda se opira na cloveka zgolj v procesu 3D rekonstrukcije sfenoidalnega sinusa.9 Slika 2 Primer modela umetne inteligence za identifikacijo. Dolocanje casa nastopa smrti Metode UI se za dolocanje casa nastopa smrti opirajo predvsem na podatke, pridobljene z zunanjim pregledom trupla, zakonitosti forenzicne entomologije in biokemije ter na spremembe telesne temperature trupla. Raziskujejo se nacini za avtomatizirano dolocanje casa nastopa smrti na podlagi posmrtnih fotografij z dolocanjem stopnje motnosti roženice, na podlagi rezultatov biokemijske analize ocesne vodice (predvsem koncentracije K+) ali na podlagi mikrobioma in za dolocanje starosti in vrste forenzicno pomembnih žuželk na podlagi spektrogramov ali fotografij. Prav tako se razvijajo metode UI, ki posredno prispevajo k dolocitvi casa nastopa smrti, npr. z oceno temperature okolice.5,10 Metode za dolocanje casa nastopa smrti zaenkrat ne dopušcajo avtomatizacije, ker je za postmortalni interval potrebno upoštevati vec razlicnih metod in tehnik. Avtomatizirana bi zaenkrat lahko postala normogramska metoda uporabe temperature jeder trupla (Henssgejev normogram), ki ga je mogoce z ustreznim racunalniškim programom avtomatizirati. Metoda daje zaenkrat najbolj sprejemljiv postmortalni interval. Po smrti roženica pomotni in se naguba zaradi postopne degeneracije in nekroze roženicnih celic, neenakomerne zadebelitve strome in izhlapevanja vode. Obicajno specialist sodne medicine s prostim ocesom oceni stopnjo motnosti roženice in ugotovitve zapiše v obdukcijski izvid. Vendar pa v tem primeru ne gre za objektivno kvantifikacijo in zato je ocena casa nastopa smrti na podlagi te ugotovitve zelo nezanesljiva. Raziskovalci so zato razvili metode UI za izboljšanje zanesljivosti ocene casa nastopa smrti na podlagi znacilnosti roženice trupla. Primer predstavlja naprava (angl. Corneal-Smart Phone), ki omogoca fotografiranje in digitalno analizo pridobljenega slikovnega materiala ter oceno casa nastopa smrti, prikazana na sliki 3. Gre za prenosno napravo, sestavljeno iz pametnega telefona in nastavka, ki zagotavlja enakomerno osvetlitev in s tem ustrezno kakovost slik za nadaljnjo analizo, ki jo opravi aplikacija na telefonu. Sistem je sposoben avtomatske prepoznave relevantnih znacilnosti na slikah in ocene casa nastopa smrti, ki se nato prikaže na zaslonu telefona.11 Slika 3 Shematski prikaz naprave za fotografiranje roženic trupel na terenu (angl. Corneal – Smart Phone). Ugotavljanje vzroka smrti Metode UI so lahko v pomoc tudi pri ugotavljanju vzroka smrti. Lahko temeljijo na podatkih iz obdukcijskih zapisnikov, zdravniških potrdil o smrti in porocil o vzroku smrti, dokumentih s klinicnimi podatki o posamezniku ali na drugih analiticnih podatkih in so usmerjene predvsem na ovrednotenje verjetnosti za posamezni vzrok smrti. Lahko temeljijo tudi na analizi posmrtnega slikovnega gradiva in so v pomoc pri iskanju radioloških znacilnosti, povezanih s posameznim vzrokom smrti (npr. zgostitve mlecnega stekla z zadebelitvijo acinarnega in lobularnega intersticija na CT slikah utopljencev). Eden izmed najbolj obetajocih nacinov vkljucevanja teh metod v sodnomedicinsko prakso je uporaba metod UI v diagnostiki utopitve s testom na prisotnost kremenastih alg.5,12 Kremenaste alge ali diatomeje so enocelicne alge s silicijevim eksoskeletom. V primeru utopitve predrejo alveolarne stene, nato po vstopijo v krvni obtok in se prenesejo tudi do oddaljenih organov, kot so možgani, ledvice, jetra in kostni mozeg. Po obdelavi vzorcev organov, odvzetih med obdukcijo, z žveplovo ali dušikovo kislino se visoko odporni eksoskelet kremenastih alg ohrani in ga je mogoce prepoznati pod mikroskopom. Alternativno se organizmi lahko dolocajo tudi iz krvi. Zaradi možnosti izgube kremenastih alg med pripravo preparatov za analizo po klasicnih metodah in v izogib lažno negativnim rezultatom se lahko kemijska digestija organskih snovi zamenja tudi z mikrovalovno digestijo, centrifugiranje z vakuumsko filtracijo, klasicno svetlobno mikroskopiranje pa z vrsticnim elektronskim mikroskopiranjem.2,6,13,14 Ce je bilo truplo zgolj odvrženo v vodo, lahko kremenaste alge kljub temu pasivno poniknejo v pljuca, vendar pa jih v tem primeru ne bo mogoce najti v oddaljenih organih, kar bi bila posledica odpovedi cirkulacije že pred stikom z vodo. Zaradi tega test s kremenastimi algami predstavlja eno od možnosti za diagnosticiranje utopitve (slika 4) in je še posebej uporaben pri mocno gnilobno spremenjenih truplih.6 Ocenjujejo, da obstaja vec kot 20.000 razlicnih vrst kremenastih alg. V splošnem oligohalofilne diatomeje živijo v sladkovodnih obmocjih, mezo- in polihalofilne pa v slani oziroma morski vodi. Posamezne živijo le v tocno dolocenem habitatu z doloceno kolicino hranil, svetlobe, mineralno sestavo, temperaturo in globino. Populacije kremenastih alg so zato raznolike in dinamicne oziroma odvisne od okoljskih sprememb na dolocenem obmocju. Z ekološko tipizacijo kremenastih alg, njihovo kvantifikacijo in primerjavo vzorcev tkiv in vzorcev vode je tako mogoce oceniti tudi lokacijo utopitve (npr. v primerih, ko je vodni tok truplo naplavil na oddaljeno mesto). Ucinkovitost dolocanja lokacije utopitve pa je odvisna tudi od vzpostavljanja podatkovnih zbirk, v katerih bi bili zbrani profili kremenastih alg v vodnih virih na dolocenem obmocju v dolocenem mesecu ali letnem casu, da bi z njimi lahko primerjali profile kremenastih alg iz vzorcev tkiv trupel.6,13 Slika 4 Nacelo uporabnosti kremenastih alg pri opredelitvi utopitve kot vzroka smrti. Test s kremenastimi algami za potrditev utopitve pa ima tudi nekatere slabosti. Kremenaste alge so prisotne prakticno povsod, ne le v vodnih virih, temvec tudi v zraku in zemlji. Nahajajo se v hrani, npr. v morskih sadežih, pa tudi nekateri pogosto uporabljani minerali in drugi proizvodi, kot je npr. kreda, vsebujejo diatomejam podobne materiale. Kremenaste alge bi lahko oddaljene organe dosegle tudi preko vstopa v cirkulacijo iz prebavnega trakta. Zaradi tega je zanesljivost testa s kremenastimi algami še vedno sporna. Potrebno je upoštevati okolišcine smrti ter kvantitativno razliko v številu kremenastih alg, dolocenih v truplih utopljencev, v primerjavi z drugimi trupli. Test s kremenastimi algami specialistom sodne medicine ostaja v pomoc pri dolocitvi utopitve kot vzroka smrti, vendar ni primeren kot dokaz na sodišcu.6 Verjetnost za lažno pozitivne rezultate testa na prisotnost kremenastih alg v oddaljenih organih zaradi kontaminacije pred ali po smrti se lahko zmanjša z natancno kvalitativno in kvantitativno analizo. Ker pa je dolocanje morebitne prisotnosti kremenastih alg v izbranih vzorcih utrudljivo, casovno zahtevno in drago ter pogosto zahteva specificno znanje taksonomije, so bili razviti visoko ucinkoviti, hitri in objektivni umetnointeligencni sistemi za avtomatizirano prepoznavo in razvršcanje posameznih vrst kremenastih alg. Temeljijo na kombinaciji globoke konvolucijske nevronske mreže s sposobnostjo prepoznave in kategorizacije slikovnega materiala z digitalno patologijo, ki ponuja platformo, preko katere je mogoce digitalno pregledovati, upravljati, deliti in analizirati mikroskopske preparate.2,13 Na sliki 5 je prikazan primer strategije umetnointeligencnega sistema za mikroskopsko identifikacijo skeleta kremenastih alg na digitaliziranih mikroskopskih preparatih. Iz tkivnih vzorcev se po obdelavi s kislinami pripravijo mikroskopski preparati, ki jih je nato potrebno digitalizirati z opticnim bralnikom. Model konvolucijske nevronske mreže prepozna kremenaste alge iz vzorcev tkiv (ali vzorcev vode) in jih nato tudi razvrsti, kar omogoci sklepanje na mesto utopitve (primerjava profila specificnih diatomej v vzorcih tkiv in vzorcih vode).13 Slika 5 Primer strategije umetnointeligencnega sistema za mikroskopsko identifikacijo skeleta kremenastih alg. Interpretacija strelnih ran Balistika je veda, ki se ukvarja z gibanjem, obnašanjem in ucinkom izstrelkov in zajema tudi balistiko rane, tj. preucevanje gibanja izstrelka po prodoru v cloveško tkivo. Interpretacija strelnih ran s strani specialista sodne medicine pomembno prispeva k rekonstrukciji dogajanja v casu streljanja, kar je v javnem interesu in ima seveda tudi pravne posledice. Zaradi tega morajo biti zakljucki glede tipa orožja in izstrelka, strelne razdalje in smeri strela cim bolj natancni. Modeli UI so lahko v pomoc pri interpretaciji strelnih ran, npr. pri oceni strelne razdalje na podlagi fotografij rane. Na sliki 6 so prikazani primeri strelnih stran. Od leve proti desni prva slika predstavlja negativno kontrolo; druga slika rano po strelu iz absolutne bližine z vidno sledjo cevi in strelno rano, ki je vecja od kalibra izstrelka zaradi delovanja smodniških plinov; tretja slika rano po strelu iz bližine z vidno sledjo plamena, dimnim kolobarjem in tetovažo; cetrta slika pa rano po strelu iz razdalje, kjer dopolnilnih faktorjev ne najdemo. Razlicni tipi strelnih ran imajo torej razlicne vizualne znacilnosti, kar je osnova modelov UI za dolocanje oddaljenosti strela.6,15 Slika 6 Reprezentativni primeri strelnih ran, nastalih po streljanju z razlicnih strelnih razdalj. Klinicna forenzicna medicina Klinicna forenzicna dejavnost vkljucuje telesne preglede živih preiskovancev in izvajanje drugih preiskav, potrebnih za oceno starosti, mentalnega stanja ali stopnje telesnih poškodb posameznikov. Metode UI zaenkrat niso vkljucene v delo specialista sodne medicine na tem podrocju, kljub temu pa se številne raziskave ukvarjajo s potencialnimi možnostmi za njihovo uporabo, še posebej na podrocju forenzicne psihiatrije. Metode UI so lahko v pomoc tudi pri pregledu žrtev spolnega nasilja z avtomatsko razvrstitvijo kolposkopskih slikovnih izvidov. Tako bi npr. specialist sodne medicine lahko žrtev pregledal z digitalnim kolposkopom, povezanim z racunalnikom. Vsakic bi posneto sliko pregledal umetnointeligencni sistem na racunalniku in prepoznal ter izpostavil poškodbe, vidne na sliki, ki bi jih nato specialist sodne medicine ustrezno ovrednotil glede na relevantnost za opredelitev posilstva. Prav tako bi bila možna avtomatska ocena starosti podplutb na osnovi fotografij (slika 7). Podplutbe so namrec krvavitve pod površino kože, ki nastanejo zaradi udarca s topim predmetom in so na površini vidne kot obarvanje kože, ki se spreminja s casom in je lahko opazno tudi po 30 dneh po poškodbi.5,16 Slika 7 Primer modela umetne inteligence za avtomatsko oceno starosti podplutb. Virtopsija Skupaj s klinicno radiologijo se razvija tudi podrocje forenzicne radiologije. Vecrezinski racunalniški tomograf, magnetna resonanca in 3D skeniranje se v nekaterih primerih kombinirajo s klasicnimi obdukcijami za dokumentiranje poškodb na objektiven in neinvaziven nacin. Radiološke metode so se za prepoznavanje nekaterih poškodb skeleta in tkiv izkazale kot boljše v primerjavi s klasicno obdukcijo. Trirazsežni pristopi imajo potencial tudi za oblikovanje animacij, ki lahko pripomorejo k boljšemu razumevanju dinamicnega nastanka dolocenega vzorca poškodb, s tem pa k oceni verjetnosti, da je bila dolocena poškodba povzrocena z dolocenim predmetom (možna je npr. primerjava telesnih poškodb s poškodbami na vozilu v primeru prometnih nesrec).17-19 Uvajanje novih metod v sodnomedicinsko prakso pa je prineslo tudi potrebo po ustrezni podatkovni zbirki za shranjevanje forenzicnih radioloških in patoloških ugotovitev v digitalni standardizirani obliki, ki so registriranim uporabnikom ves cas na voljo za ogled in medsebojno primerjavo z namenom ovrednotenja navideznega pristopa k pregledu trupla (t. i. virtopsije) glede na trenutno uveljavljen zlati standard klasicne obdukcije. Takšna podatkovna zbirka je tudi vir informacij za raziskovalne in ucne namene, sredstvo za zbiranje, arhiviranje in posredovanje medicinskih podatkov na anonimen nacin zaradi sodelovanja in izmenjave izkušenj med institucijami na nacionalni in mednarodni ravni (telemedicina) ter orodje za spremljanje kakovosti dela. V Švici so razvili metodo centraliziranega upravljanja s podatki (preko osrednjega strežnika), ki od koncnega uporabnika ne zahteva nakupa, namešcanja ali vzdrževanja nobene specializirane programske ali strojne opreme. Omogoca hitro in enostavno deljenje ustreznih protokolov številnim uporabnikom, medtem ko se dostop do podatkov in njihova analiza opravlja centralno. Na ta nacin je mogoce bolj enostavno vzpostavljanje razlicnih registrov. Dodatno lokalni internetni strežnik deluje kot filter med uporabnikom in centralno podatkovno zbirko oziroma omogoca, da vsak inštitut dostopa do sistema preko lastne spletne strani ter tako ohranja kontrolo in odgovornost za obcutljive medicinske podatke. Samo anonimizirani podatki se posredujejo do osrednjega strežnika. Takšna podatkovna zbirka torej pomembno prispeva tudi k uveljavljanju virtopsije v sodnomedicinsko prakso, saj omogoca neposredno primerjavo radioloških in patoloških podatkov ter s tem dolocanje locljivosti in obcutljivosti posamezne metode za prepoznavo razlicnih znacilnosti trupla.19 Razprava Z napredkom informacijske tehnologije, racunalniških sistemov in dostopnostjo do obširnih podatkovnih zbirk so se v zadnjem desetletju pokazale številne potencialne možnosti uporabe metod UI na podrocju sodne medicine. Predvsem gre za metode s sposobnostjo reševanja dolocenih nalog na podlagi prepoznavanja vzorcev v kopici razlicnih vrst podatkov (številskih vrednosti, slikovnega gradiva, porocil, videoposnetkov in grafikonov), kar omogoca širšo uporabno vrednost teh metod, npr. prepoznavo razlicnih anomalij na posmrtnem slikovnem gradivu. Vendar pa dolocen model UI lahko opravlja zgolj tocno doloceno nalogo (npr. model za dolocanje starosti posameznika ne more dolocati tudi spola ali uporabljati kakršnihkoli drugih podatkov, ki niso bili vkljuceni v proces ucenja brez posredovanja cloveka).5 Metode UI so lahko kljub temu na razlicne nacine v pomoc specialistu sodne medicine pri njegovem delu, npr. ugotavljanju vzrokov smrti, identifikaciji, interpretaciji strelnih ran, dolocanju casa nastopa smrti in pri klinicnem delu. Zaenkrat je po porocanju v literaturi identifikacija žrtev množicnih nesrec edino podrocje sodne medicine, kjer se UI že uporablja. Najnaprednejši tovrstni sistemi so že nekaj casa v praksi švicarskih sodnomedicinskih inštitutov, kjer se najvec ukvarjajo z virtopsijo, ki bi naj scasoma nadomestila klasicno avtopsijo. Pri tem uporabljajo številne tehnike in racunalniške programe, ki pa brez izkušenega cloveškega strokovnega potenciala ne dajejo pricakovanih rezultatov (postmortalna racunalniško tomografska angiografija, 3D racunalniška obdelava trupla, jemanje bioloških vzorcev po nacinu igelne biopsije, MRI slikovna obdelava). Toda avtomatizacija bi tudi na drugih podrocjih bistveno pospešila sicer casovno zahtevne, kompleksne in utrudljive naloge ter prihranila administrativno delo. Avtomatizirana prepoznava in razvršcanje kremenastih alg in njihova primerjava med vzorci tkiv in vode prinaša veliko prednosti pred rocnim pregledovanjem mikroskopskih preparatov in njihovo medsebojno primerjavo. Prav tako so umetnointeligencni sistemi sposobni pravilne prepoznave manjših ostankov kremenastih alg, ki bi jih clovek obicajno spregledal, kar zmanjšuje verjetnost za lažno negativne rezultate. Pri tem pa bo v prihodnosti potrebno zagotoviti, da je algoritem UI dovolj fleksibilen in sposoben prepoznati nove vrste kremenastih alg, na katere še ni naletel, oziroma bo potrebno sprotno ucenje algoritma z novimi podatki o novih vrstah za zagotavljanje ustrezne natancnosti in pravilnosti prepoznave.2,3,5,14 Ena od pomanjkljivosti obstojece sodnomedicinske metodologije na podrocju dolocanja biološkega profila trupla ali njegovih ostankov je subjektivnost. Zanesljivost rezultata, ki temelji na makroskopski analizi, je namrec odvisna od izkušenosti opazovalca. Izkušnje pa je težko kvantificirati, kar lahko predstavlja problem v pravnem okolju, ko je nujna tudi natancna opredelitev verjetnosti za napako pri predstavljenih dokazih ozirom izvedenskem mnenju. Metode UI lahko pripomorejo k objektivizaciji in povecajo zanesljivost omenjenih metod, še posebej kadar gre za analizo subtilnih razlik npr. v obliki crevnice in spodnje celjustnice pred puberteto in dolocanju spola na podlagi teh razlik.3 Metode UI so uporabne v procesu odlocanja in se v dolocenih nalogah izkažejo celo za ucinkovitejše in natancnejše od cloveka. Avtomatsko definiranje znacilnosti, ki so relevantne za koncno odlocitev, npr. o starosti skeletnih ostankov na podlagi zobovja, omogoca premostitev dolocenih slabosti obstojecih metod na dolocenem podrocju. Omeji lahko nakljucne napake, ki so posledica clovekove utrujenosti, trenutnega custvenega stanja ali drugih motenj. Model, ki deluje na ta nacin, lahko hkrati analizira vec razlicnih struktur in znacilnosti ter upošteva tudi dodatne, na katere se do sedaj v študijah še niso osredotocali.3,7,10 Za doseganje zadovoljive tocnosti pa mora biti na voljo osnovna podatkovna zbirka z zadostno kolicino podatkov, ki se lahko uporabi za ucenje algoritma, ter ustrezna strojna in programska oprema. Velikokrat take podatkovne zbirke v našem okolju še ne obstajajo (npr. nimamo zbirke, kjer bi bile zbrane vse vrste kremenastih alg v slovenskih vodnih virih v razlicnih letnih casih, ki bi lahko predstavljale reprezentativne podatke za ucenje algoritmov). Najprej bi bilo potrebno vzpostaviti te zbirke s podatki, zbranimi v enotnem formatu. Problem predstavlja tudi nezmožnost razumevanja in analiziranja delovanja UI v celoti (npr. ni natancno pojasnjeno, kako model UI na osnovi konvolucijskih nevronskih mrež, ki je sposoben ocene višine posameznika glede na antropometricne meritve, dejansko interpretira te meritve in poda koncno oceno, kar je povezano s kompleksno arhitekturo konvolucijskih nevronskih mrež). Potrebno je upoštevati tudi stroške nakupa in vzdrževanja potrebne opreme. Ker v veliki meri temelji na slikovnem gradivu, dodatna slikovna diagnostika predstavlja dodatni strošek, ki ga v primeru klasicne obravnave s strani specialista ni. Prav tako je zanesljivost koncnega rezultata, ki ga poda algoritem UI, odvisna od kakovosti slikovnega gradiva, kar je lahko problem pri fotografiranju (npr. roženice ali strelnih ran) na terenu. Zaradi tega je potrebno pozornost usmeriti tudi na zagotavljanje enakovrednih pogojev za fotografiranje (npr. kot je to zagotovljeno pri roženicnem pametnem telefonu).2,3,5,8,14 V splošnem je UI na podrocju sodne medicine še posebej uporabna za pregled kompleksnih zbirk podatkov, ko je potrebno izlušciti dolocen podatek ali za opozarjanje na doloceno podrobnost, ki bi se lahko izkazala za pomembno pri koncni odlocitvi ozirom diagnozi. Interpretacija zakljuckov algoritmov UI pa ostaja v domeni specialista sodne medicine.5 Zakljucek Glede na trenutna prizadevanja za vkljucevanje metod UI v medicinsko stroko in številne raziskave na tem podrocju, bo UI v prihodnosti najverjetneje našla svoje mesto tudi v vsakodnevni sodnomedicinski praksi. Vendar pa na podrocju sodne medicine to predstavlja še posebej kompleksno nalogo, saj ocena relevantnosti uporabe in sprejemanje takšnega nacina dela ni odvisna zgolj od zdravnikov, temvec tudi od sodnikov ter odvetnikov, žrtev in storilcev kaznivih dejanj. Vsako novo metodo mora pravosodje najprej priznati kot relevantno in verodostojno metodo, ki omogoca objektivne verodostojne materialne dokaze v kazenskih in civilno pravdnih zadevah, za kar obicajno pretece veliko casa. UI predstavlja orodje za pridobivanje informacij, ki se nato na sodišcu uporabijo v argumentih in kot dokazno gradivo, zato mora biti ustreznost in neomajnost rezultatov vsakega takega orodja sistematicno preverjena. Prav tako morajo biti algoritmi z vkljucevanjem UI neoporecni tudi v eticnem smislu (npr. ne sme biti nobenega suma, da je z uporabo algoritma prišlo do spolne ali rasne diskriminacije). Neoporecnost uporabljenih algoritmov mora biti zagotovljena na vseh podrocjih medicine, vendar pa so v pravnem kontekstu le-ti še pogosteje predmet kritike in dvomov.20 Reference 1. Lidstrmer N, Aresu F, Ashrafian H. Basic concepts of artificial intelligence: primed for clinicians. In: Lidstrer N, Ashrafian H (eds.). Artificial intelligence in medicine. Cham 2022: Springer; 3-20. 2. Zhou Y, Zhang J, Huang J, et al. Digital whole-slide image analysis for automated diatom test in forensic cases of drowning using a convolutional neural network algorithm. Forensic Sci Int 2019; 302: 109922. https://doi.org/10.1016/j.forsciint.2019.109922 3. Ortega RF, Irurita J, Campo EJE, Mesejo P. Analysis of the performance of machine learning and deep learning methods for sex estimation of infant individuals from the analysis of 2D images of the ilium. Int J Legal Med 2021; 135(6): 2659-2666. https://doi.org/10.1007/s00414-021-02660-6 4. Burger G. Definicije in algoritmi umetne inteligence. https://www.dihslovenia.si/assets/images/DIH_Slovenia _Definicije_in_algoritmi_umetne_inteligence.pdf (22. 11. 2022) 5. Tournois L, Lefčvre T. AI in forensic medicine for practicing doctor. In: Lidstrmer N, Ashrafian H (eds.). Artificial intelligence in medicine. Cham 2022: Springer; 1777-1786. 6. Saukko P, Knight B. Knight´s forensic pathology (4th ed.). Boca Raton 2015: CRC Press. 7. Han M, Du S, Ge Y, et al. With or without human interference for precise age estimation based on machine learning? Int J Legal Med 2022; 136(3): 821­831. https://doi.org/10.1007/s00414-022-02796-z 8. Cao Y, Ma Y, Vieira DN, et al. A potential method for sex estimation of human skeletons using deep learning and three-dimensional surface scanning. Int J Legal Med 2021; 135(6): 2409-2421. https://doi.org/10.1007/s00414-021-02675-z 9. Wen H, Wu W, Fan F, et al. Human identification performed with skull's sphenoid sinus based on deep learning. Int J Legal Med 2022; 136(4): 1067-1074. https://doi.org/10.1007/s00414-021-02761-2 10. Sharma R, Diksha, Bhute AR, Bastia BK. Application of artificial intelligence and machine learning technology for the prediction of postmortem interval: a systematic review of preclinical and clinical studies. Forensic Sci Int 2022; 340: 111473. https://doi.org/10.1016/j.forsciint.2022.111473 11. Zheng J, Huo D, Wen H, Shang Q, Sun W, Xu Z. Corneal-Smart Phone: a novel method to intelligently estimate postmortem interval. J Forensic Sci 2021; 66(1): 356-364. https://doi.org/10.1111/1556-4029.14611 12. Homma N, Zhang X, Qureshi A, et al. A Deep learning aided drowning diagnosis for forensic investigations using post-mortem lung ct images. Annu Int Conf IEEE Eng Med Biol Soc 2020; 2020: 1262-1265. https://doi.org/10.1109/EMBC44109.2020.9175731 13. Zhang J, Zhou Y, Vieira DN, et al. An efficient method for building a database of diatom populations for drowning site inference using a deep learning algorithm. Int J Legal Med 2021; 135(3): 817-827. https://doi.org/10.1007/s00414-020-02497-5 14. Yu W, Xue Y, Knoops R, et al. Automated diatom searching in the digital scanning electron microscopy images of drowning cases using the deep neural networks. Int J Legal Med 2021; 135(2): 497-508. https://doi.org/10.1007/s00414-020-02392-z 15. Oura P, Junno A, Junno JA. Deep learning in forensic gunshot wound interpretation-a proof-of-concept study. Int J Legal Med 2021; 135(5): 2101-2106. https://doi.org/10.1007/s00414-021-02566-3 16. Tirado J, Mauricio D. Bruise dating using deep learning. J Forensic Sci 2021; 66(1): 336-346. https://doi.org/10.1111/1556-4029.14578 17. Thali MJ, Yen K, Schweitzer W, et al. Virtopsy, a new imaging horizon in forensic pathology: virtual autopsy by postmortem multislice computed tomography (MSCT) and magnetic resonance imaging (MRI): a feasibility study. J Forensic Sci 2003; 48(2): 386-403. 18. Thali MJ, Braun M, Buck U, et al. VIRTOPSY: scientific documentation, reconstruction and animation in forensic: individual and real 3D data based geo-metric approach including optical body/object surface and radiological CT/MRI scanning. J Forensic Sci 2005; 50(2): 428-442. 19. Aghayev E, Staub L, Dirnhofer R, et al. Virtopsy - the concept of a centralized database in forensic medicine for analysis and comparison of radiological and autopsy data. J Forensic Leg Med 2008; 15(3): 135-140. https://doi.org/10.1016/j.jflm.2007.07.005 20. Lefčvre T. Artificial intelligence in forensic medicine. In: Lidstrer N, Ashrafian H (eds.). Artificial Intelligence in Medicine. Cham 2022: Springer; 1767-1773. • Bilten SDMI Ema Dornik, Boštjan Žvanut MI'2022 “Odlocno digitalno za vec zdravja”: porocilo s srecanja Sekcije za informatiko v zdravstveni negi – SIZN 2022 MI'2022 “Decisively Digital for More Health”: Report from the Meeting of the Nursing Informatics Section – SIZN 2022 Tradicionalno srecanje clanov Sekcije za informatiko v zdravstveni negi (SIZN), ki deluje pri Slovenskem društvu za medicinsko informatiko (SDMI), je potekalo 11. novembra 2022 v Termah Zrece kot "hibridni" dogodek. Letos smo lahko – z enoletno zamudo – tudi fizicno obeležili 20. obletnico delovanja SIZN. Programski in organizacijski odbor sta nas presenetila s tortama, s katerimi smo lahko obeležili ta jubilej (slika 1). Obsežen programski sklop je postregel s 17 predavanji v treh sklopih. Ponosni smo, da je bil en sklop v celoti namenjen študentom, ki kažejo na svetlo bodocnost SIZN. Vecina predavateljev je predavala v živo, trije so svoje prispevke predstavili preko spleta. Slišali smo zanimive vsebine, ki jih navajamo po vrstnem redu v programu: ¦ Vladislav Rajkovic: Digitalne kompetence v zdravstvene nege v luci umetne inteligence ¦ Jožica Cehovin Zajc, Marija Milavec Kapun: SmartNurse: kaj se lahko naucimo, ko ucimo ¦ Tina Kamenšek, Marija Milavec Kapun: GenoNurse – mednarodno partnerstvo za izboljšanje kompetenc študentov zdravstvene nege na podrocju genomike ¦ Nino Fijacko, Gregor Štiglic, Lucija Gosak: Percepcija uporabe navidezne resnicnosti za ucenje temeljnih postopkov oživljanja odrasle osebe pri študentih zdravstvene nege: študija uporabnosti ¦ Jerneja Meža, Barbara Smrke: Obrnjeno ucenje v okviru študijskega programa Zdravstvena nega ¦ Maja Drešcek Dolinar, Nataša Mlinar Reljic, Barbara Donik, Gregor Štiglic: E-ucenje študentov zdravstvene nege v casu pandemije COVID-19 ¦ Darja Fridau, Cvetka Krel, Sebastjan Bevc: Vkljucitev negovalnih diagnoz NANDA-I v elektronski zdravstveni zapis ¦ Cvetka Krel, Dominika Vrbnjak, Gregor Štiglic, Sebastjan Bevc: Vsebinska veljavnost slovenske razlicice vprašalnika »Vprašalnik za merjenje uporabe, kakovosti in zadovoljstva z elektronskim zdravstvenim zapisom z vidika medicinskih sester« ¦ Samanta Mikuletic, Boštjan Žvanut: Informacijska varnostna kultura med zaposlenimi v zdravstveni negi: rezultati preliminarne študije ¦ Aljaž Bajc, Neža Jarc: Organizacija informatike v Covid enoti intenzivne terapije ¦ Mihael Nedeljko, Boris Miha Kaucic: Uporaba informacijsko komunikacijske tehnologije pri starejših odraslih zmanjšuje socialno izolacijo in izboljšuje kakovost življenja ¦ Anže Mihelic, Boštjan Žvanut, Simon Vrhovec: Pametne naprave v pomoc starejšim odraslim ¦ Nives Matko, Marizela Nuhanovic, Megi Trojar: Ocena tveganja za nastanek razjede zaradi pritiska ¦ Tjaša Ulcnik, Rok Škedelj: Model za oceno ustreznosti perfuzorja ¦ Maša Zapušek, Klara Vrtacnik: Ocena ogroženosti dializnega bolnika ¦ Alen Loncar, Marija Milavec Kapun: Uporabnost aplikacije NurseCal za izracun odmerkov in pretocnosti zdravil ¦ Uroš Višic: Digitalizacija zdravstveno-vzgojnih vsebin Šole za starše v casu pandemije Covid-19 Povzetki in prispevki predstavitev so objavljeni v zborniku srecanja. Zakljucek Ob zakljucku rednega letnega strokovnega srecanja je potekal sestanek clanov SIZN, kjer je predsedniksekcije izr. prof. dr. Boštjan Žvanut podal porocilo o delu SIZN za leto 2022, prav tako so bile opredeljeni nacrti in usmeritve za nadaljnje delo SIZN. Program srecanja je bil tudi v tem v letu posredovan v evalvacijo za licencne tocke Zbornice zdravstvene in babiške nege Slovenije – Zveze strokovnih društev medicinskih sester, babic in zdravstvenih tehnikov Slovenije (Zbornice-Zveze). Komisija za oceno ustreznosti stalnega strokovnega izpopolnjevanja, imenovana s strani Zbornice-Zveze, je programu SIZN 2022 dodelila 6 licencnih tock za pasivne udeležence in 10 licencnih tock za aktivne udeležence. Zakljucki srecanja in kljucne ugotovitve se nanašajo na dopolnjevanje kompetenc s podrocja zdravstvene nege, ki jih zahteva uporaba sodobnih IKT rešitev, in pomen pedagoškega dela na tem podrocju ter razvoj IKT rešitev za ucenje in poucevanje (navidezna resnicnost, obrnjeno ucenje), izpostavili pa smo tudi pomen usposabljanja pacientov na podrocju informacijske in zdravstvene pismenosti. Clani SIZN smo si enotni, da je potrebno spodbujati uvajanje IKT rešitev, ki dejansko podpirajo delo v zdravstveni negi, zato je potrebno medicinske sestre vkljuciti v nacrtovanje IKT sistemov. Informacijski varnosti je treba dati posebno pozornost zaradi vse bolj zahtevne zašcite osebnih in obcutljivih podatkov pacientov. Zahvala Hvaležni smo vsem clanom SIZN za skupno rast, podporo in zaupanje. Zahvaljujemo se avtorjem, ki so s svojimi prispevki aktivno sodelovali na srecanju, ter vsem clanom SIZN, ki sodelujejo v naših aktivnostih. Iskrena hvala SDMI, ki je omogocilo naše srecanje. . Infor Med Slov 2022; 27(1-2): 42-43 • Študijsko gradivo Andrej Kastrin Omrežja znanja in njihova uporaba v biomedicini Povzetek. Ucno gradivo celovito predstavi podrocje proucevanja omrežij znanja. Omrežje znanja je formalno definirano kot heterogeno omrežje, sestavljeno iz vozlišc in povezav razlicnih semanticnih tipov. Na kratko je predstavljena zgodovina raziskovanja omrežij znanja, formalna definicija in temeljne lastnosti. Predstavljeni so primeri uporabe omrežij znanja na podrocju biomedicine, vkljucno s pregledom virov podatkov, metodami konstrukcije omrežja (lušcenje entitet/relacij, normalizacija in integracija omrežij) ter reprezentacijskim ucenjem nad njimi. Kljucne besede: reprezentacija znanja; semanticna mreža; biomedicina; viri podatkov; besedilno rudarjenje; algoritmi. Knowledge Networks and Their Use in Biomedicine Abstract. The tutorial provides a comprehensive introduction to the field of knowledge networks. Knowledge network is defined as a heterogeneous network consisting of nodes and relations of different semantic types. The history of knowledge networks research, formal definition, and basic properties are briefly presented. Examples of the application of knowledge networks in the biomedical domain are provided, including possible data sources, construction methods (entity/relationship extraction, normalisation, and network integration), and representation learning. Key words: knowledge representation; semantic network; biomedicine; data sources; text mining; algorithms. . Infor Med Slov 2022; 27(1-2): 44-50 Institucije avtorjev / Authors' institutions: Medicinska fakulteta, Univerza v Ljubljani. Kontaktna oseba / Contact person: doc. dr. Andrej Kastrin, Univerza v Ljubljani, Medicinska fakulteta, Vrazov trg 2, 1000 Ljubljana, Slovenija. E-pošta / E-mail: andrej.kastrin@mf.uni-lj.si. Prispelo / Received: 21. 1. 2023. Sprejeto / Accepted: 28. 3. 2023. Uvod Odgovor na vprašanje, kaj je znanje, ni preprost. Že bežen pregled literature razkriva paleto razlicnih opredelitev pojma. V nadaljevanju bomo privzeli preprosto definicijo, da je znanje skupek urejenih informacij, ki nam omogocajo razumevanje obravnavanega pojava. Najbrž se bo vsakdo strinjal, da je ustrezen nacin organizacije znanja kljucen, da uspešno opravimo dano nalogo. Študent, ki se na zahteven izpit pripravlja sistematicno in za ponavljanje uporablja razlicne miselne sheme, bo predvidoma dosegel boljši uspeh kot njegov kolega, ki je študijsko gradivo le bežno pregledal. Bolj uceno lahko recemo, da je študentov uspeh povezan z uspešnostjo njegove reprezentacije oz. predstavitve znanja. Boljša kot bo predstavitev znanja v študentovem spominu, bolje ga bo ta razumel, laže ga bo dopolnjeval in o njem bolj poglobljeno razmišljal. Tako osvojeno znanje bo tudi bolj modularno, saj bo lahko posamezne dele uporabil kot gradnike, na osnovi katerih bo razširjal svoje védenje v druge problemske domene. Tematika predstavitev znanja je danes v središcu pozornosti na podrocjih kognitivne znanosti in umetne inteligentnosti. Ce vzamemo v roke sodoben ucbenik kognitivne psihologije1 ali umetne inteligentnosti,2 ugotovimo, da so vsebine, povezane s podrocjem reprezentacij znanja, praviloma obravnavane v samostojnem poglavju. Na podoben nacin kot v clovekovih možganih je potrebno za uspešno reševanje nalog predstaviti znanje tudi stroju. Poznamo vec razlicnih pristopov k reprezentaciji znanja. Tako locimo med predstavitvami s (i) pravili, (ii) semanticnimi mrežami, (iii) scenariji oz. skripti ter (iv) okviri. Med njimi je najbrž najbolj znana semanticna mreža. To je preprost model za reprezentacijo znanja, cloveku je lahko razložljiv, enostavno ga je predstaviti tudi racunalniku. Opišemo jo z množico entitet in množico relacij med njimi; vsako entiteto obicajno opremimo s seznamom lastnosti, ki jo natancneje dolocajo, pomen relacije pa predstavimo z njenim tipom. To gradivo ima dva namena. Prvic, v slovenšcini želimo predstaviti nekaj osnovnih konceptov, na katerih gradi sodobno proucevanje omrežij znanja, zlasti na podrocju biomedicine in znanosti o živem. In drugic, cim vec bralcev želimo spodbuditi, da tudi sami pokukajo v svet raziskovanja omrežij. Zato mu ponujamo nekaj kazalcev, ki mu utegnejo priti prav pri nadaljnjem študiju. Jedro gradiva predstavljajo trije razdelki, v katerih obravnavamo podatkovne vire, postopek gradnje omrežja ter osvetlimo pristop, ki omogoca enostavno transformacijo relacijskega podatkovja v obliko, ki je primerna za zagon razlicnih metod statisticnega ucenja. Zakljucimo s pregledom najpomembnejših izzivov za prihodnost. Omrežje znanja Za razumevanje notacije v nadaljevanju moramo na hitro ponoviti oziroma vpeljati nekaj osnovnih pojmov iz teorije grafov. Graf je matematicna struktura, s katero predstavimo množico entitet in v kateri so izbrane dvojice entitet medsebojno povezane. Entiteto upodobimo z vozlišcem (angl. node), relacijo med dvema entitetama pa bodisi z usmerjeno (angl. arc) bodisi neusmerjeno (angl. edge) povezavo. Omrežje je graf, opremljen s podatki. Besedno zvezo “omrežje znanja” danes povezujemo s širokim naborom aktivnosti. Neposredno se z omrežjem znanja srecujemo ob pregledovanju Wikipedie, uporabi Twitterja ali pri nacrtovanju novega biooznacevalca za Alzheimerjevo bolezen. Primer je prikazan na sliki 1. Slika 1 Izsek iz omrežja znanja Nobelovega nagrajenca Herberta A. Simona (1916–2001), pionirja sodobnega pojmovanja umetne inteligentnosti. Enoznacne definicije pojma “omrežje znanja” v literaturi ne bomo našli. Paulheim3 ponuja seznam kriterijev, na podlagi katerih presojamo, ali dejansko obravnavamo omrežje znanja. Najpomembnejša med njimi sta: ¦ posamezne elemente realnosti (tj. entitete) ter interakcije med njimi (tj. relacije) lahko predstavimo s pomocjo grafa; ¦ poznamo t. i. metashemo, na osnovi katere lahko opredelimo dovoljene tipe relacij med entitetami. Ehrlinger in W4 pravita, da je omrežje znanja “namenjeno integraciji informacij v ontologijo in omogoca lušcenje novega znanja”. Wang in sodelavci5 pa eksplicitno definirajo omrežje znanja kot heterogeno omrežje, v katerem lahko vozlišcem in povezavam dolocimo razlicne tipe. V tem gradivu bomo omrežje znanja formalno definirali z množico trojckov .glava, relacija, rep. oz. krajše .h, r, t., s katerimi opišemo relacijo r med zacetno entiteto h in koncno entiteto (ali atributom) t. Krajša oblika izhaja iz prvih crk angleških izrazov head, relation in tail. Locimo dva tipa trojckov: z njimi lahko (i) opišemo relacijo med entitetama, tj. .entiteta1, relacija, entiteta2., ali (ii) entiteto opremimo z atributom in pripadajoco vrednostjo, tj. .entiteta, atribut, vrednost.. Trojcek .H. A. Simon, podrocje dela, umetna inteligentnost. je torej prvega tipa, saj vzpostavlja relacijo med dvema entitetama, trojcek .Univerza v Ljubljani, št. študentov, 39.010. pa entiteto Univerza v Ljubljani razširi z atributom, na podlagi katerega dobimo informacijo o številu vpisanih študentov. Formalno bomo omrežje znanja predstavili kot G = (E, R, A, V, TR, TA), kjer je E množica entitet, R množica relacij, A množica atributov in V množica vrednosti atributov. Relacije med pari entitet bomo potemtakem predstavili z množico TR . E × R × E, z množico TA . E × A × V pa analogno množico entitetam pripisanih atributov. Na podrocju biomedicine je bilo prvo odmevno omrežje znanja predstavljeno pred poldrugim desetletjem, ko so Belleau in sodelavci6 podatke iz prosto dostopnih podatkovnih zbirk – pretežno s podrocja bioinformatike – prepisali iz klasicne tabelarne oblike v zapis RDF (angl. Resource Description Framework). Za ilustracijo so v tabeli 1 povzete osnovne lastnosti nekaterih najpogosteje uporabljenih omrežij znanja na podrocju biomedicine. Tabela 1 Osnovne lastnosti nekaterih najpogosteje uporabljanih omrežij znanja na podrocju biomedicine. DRKG 97 · 103 5,9 · 106 13 107 2000 BioKG 105 · 103 2 · 106 10 17 2017 PharmKG 8 · 103 501 · 103 3 29 2017 OpenBioLink 185 · 103 4,8 · 166 7 30 2017 Clinical Knowledge Graph 19 · 106 217,3 · 106 36 47 2017 Viri podatkov Kakovostni viri podatkov so za gradnjo omrežja znanja kljucnega pomena. Sledi pregled treh skupin podatkovnih virov, ki so bili doslej uporabljeni pri izdelavi omrežij znanja na podrocju biomedicine. To so (i) ontologije in terminologije, (ii) zdravstveni ipd. zapisi in (iii) obstojece zbirke podatkov. Ontologije in terminologije Nujen (seveda pa ne zadosten) pogoj za reševanje nalog, povezanih s strojno obdelavo besedil, je zbirka pojmov, ki posamezen termin preslika v ustrezno pojmovno oznako. Na podrocju biomedicine in znanosti o živem to nalogo opravlja sistem UMLS (angl. Unified Medical Language System), ki ga sestavljajo tri komponente (slovenske ustreznice in pojasnila k posameznim komponentam podaja Vintar7): 1. Metatezaver (angl. Metathesaurus) – v trenutni razlicici je sestavljen iz približno 4,5 milijona strokovnih pojmov in okrog 17 milijonov izrazov, izlušcenih iz 159 virov v razlicnih jezikih (npr. kontroliranih geslovnikov in klasifikacijskih sistemov, kot so MeSH, SNOMED CT, ICD-10, DSM-IV in Gene Ontology); 2. Semanticno omrežje (angl. Semantic Network) – omrežje trenutno sestavlja 127 semanticnih tipov (tj. pojmovnih kategorij) in 54 semanticnih relacij (tj. pomenskih razmerij), ki jih lahko vzpostavimo nad semanticnimi tipi; 3. Zakladnica besedišca (angl. SPECIALIST Lexicon) – slovar izrazov z razlicnimi besednimi oblikami, oblikoslovnimi lastnostmi in lemami. Zdravstveni zapisi Druga skupina virov združuje podatkovja, ki jih glede na stopnjo urejenosti poznamo pod oznako nestrukturirani podatki. Najpogosteje so to (elektronski) zdravstveni zapisi, povzetki klinicnih raziskav in laboratorijski izvidi. V tem okviru gre izpostaviti omrežje znanja, zgrajeno nad elektronskimi zdravstvenimi zapisi vec kot 260 tisoc pacientov, ki omogoca pregledovanje omrežja po tipih izlušcenih entitet (bolezen, zdravilo, postopek obravnave in uporabljen pripomocek).8 Na podobnem obsegu zapisov so omrežje znanja zgradili tudi Rotmensch in sodelavci,9 ki so ugotovili visoko stopnjo tocnosti avtomatskega lušcenja trojckov v primerjavi z domenskim ekspertom. Zhao in sodelavci10 porocajo, da se omrežje znanja, zgrajeno na osnovi klinicnih zapisov, ponaša s topološkimi lastnostmi, ki so sicer znacilna za kompleksna omrežja (npr. majhen premer omrežja, brezlestvicnost in visoka stopnja grucenja). Obstojece zbirke podatkov V to skupino sodijo bibliografski viri in druge sorodne zbirke podatkov. Med bibliografskimi zbirkami prvenstvo zaseda zbirka MEDLINE/PubMed, ki trenutno obsega vec kot 35 milijonov bibliografskih zapisov, s povprecnim dnevnim prirastom okrog 3000 zapisov. Zbirka je prosto dostopna in enostavno strojno berljiva, kar je bržkone glavni razlog, da jo za preizkušanje novih metod besedilnega rudarjenja uporabljajo številni raziskovalci. Prvi resen poskus preslikave celotne zbirke MEDLINE/PubMed v strukturirano obliko predstavlja izgradnja omrežja SemKG. Avtorji so uporabili vrsto prosto dostopnih orodij, s katerimi so iz množice slabih 23 milijonov povzetkov izlušcili približno milijon entitet in vec kot 14 milijonov relacij. Tako entitete kot posamezne relacije so opremili s semanticnimi tipi oz. tipi semanticne relacije. Obseg omrežja so kasneje pomembno razširili, ko so v omrežje dodali tudi avtorje sestavkov z ustrezno razdvoumljenimi imeni, imena institucij, na katerih so zaposleni, ter raziskovalne projekte, pri katerih sodelujejo.11 Pandemija covida-19 je pustila sled tudi v objavi množice orodij in zbirk za rudarjenje besedil. Od zacetka pandemije je raziskovalna skupnost gradila korpuse znanstvenih sestavkov s tematiko novega koronavirusa, med katerimi gre izpostaviti CORD-1912 in LitCovid.13 Oba korpusa sta temeljna kamna, na osnovi katerih je bilo zgrajeno – in nedavno objavljeno – omrežje CovidPubGraph, ki ponuja trenutno najbolj celovit pregled védenja o virusu SARS-CoV-2.14 Trenutna razlicica omrežja je sestavljena iz vec kot 268 milijonov trojckov. Gradnja omrežja znanja Gradnja omrežja znanja je povezana s številnimi metodološkimi izzivi in zahteva interdisciplinarna znanja. V nadaljevanju izpostavimo tri korake, s katerimi se srecamo v postopku konstrukcije slehernega omrežja: (i) lušcenje entitet in relacij; (ii) normalizacijo terminov ter (iii) integracijo in zlivanje znanja. Lušcenje entitet in relacij Osnovno orodje za besedilno rudarjenje biomedicinskih besedil je MetaMap, ki deluje kot oznacevalnik biomedicinskih izrazov in omogoca, da prosto besedilo (npr. naslov in/ali povzetek zapisa MEDLINE/PubMed) preslikamo v ustrezno pojmovno oznako (t. i. biomedicinski koncept) iz metatezavra UMLS.15 V tem koraku še nicesar ne vemo o pomenskem razmerju med dvema izlušcenima konceptoma. Slednjemu je namenjeno orodje SemRep za procesiranje naravnega jezika, ki na osnovi leksikalnih pravil in zgoraj omenjenega semanticnega omrežja iz sistema UMLS identificira tudi pomensko razmerje med obema konceptoma.16 Alternativno orodje je PKDE4J, ki je prav tako namenjeno lušcenju biomedicinskih entitet in relacij, a zahteva rocno dodajanje terminoloških slovarjev.17 Pred kratkim so bila raziskovalni skupnosti ponujena tudi orodja za lušcenje entitet, ki temeljijo na modelu globokih nevronskih mrež, npr. HunFlair18 in BERN2.19 Ti orodji se v primerjavi s prej omenjenima SemRep in PKDE4J ponašata s pomembno višjima merama natancnosti in priklica. Na voljo je tudi že nekaj aplikacij globokega ucenja za lušcenje relacij, a so prilagojene le za kitajšcino.20 Nemalo težav na podrocju globokega ucenja povzroca slaba interpretatibilnost rezultatov, saj algoritmi nevronskih mrež v dobršni meri delujejo po principu crne škatle. Smiselna razlaga rezultatov je zato – v primerjavi s sistemi, ki temeljijo na leksikalnih pravilih – pogosto nemogoca. Normalizacija terminov V avtomatiziranem postopku gradnje omrežja znanja je poleg gole prepoznave entitete pomemben korak tudi normalizacija, ki razlicne jezikovne razlicice, sinonime in izpeljanke poveže z eno entiteto. S problemom normalizacije se v biomedicinskih besedilih najpogosteje srecamo pri obravnavi imen in simbolov genov (npr. razlicne simbole in termine, kot so IL12, IL-12 in interleukin 12, je potrebno preslikati v pomensko entiteto Interleukin-12). Še pred nedavnim se je normalizacija v pretežni meri opravljala s pomocjo sistema UMLS in geslovnika MeSH. Danes lahko v ta namen uporabimo oznacevalnik PubTator.21 Integracija in zlivanje znanja V postopku gradnje omrežja znanja razlikujemo med integracijo in zlivanjem podatkov. Pojem “integracija” se nanaša na povezovanje razlicnih podatkovnih zbirk, s pojmom “zlivanje” pa merimo na dopolnjevanje modalnosti podatkov. Dober primer integrativnega pristopa h gradnji omrežja znanja je storitev PreMedKB.22 Razpršenosti in heterogenost biomedicinskih zbirk pogostokrat botruje situaciji, ko “zaradi dreves ne vidimo gozda” in onemogoca celosten vpogled v mehanizme delovanja kompleksnih, multifaktorskih bolezni in nacine njihovega zdravljenja. Z orodjem PreMedKB so avtorji pokazali, da lahko z razmeroma preprosto uporabo metapodatkovnih shem in sistema UMLS integriramo vecje število sicer heterogenih zbirk podatkov. Uporaba omrežij znanja Omrežja so kompleksne strukture, predvsem ki jih ni lahko razumeti in interpretirati. V skupnosti, ki se ukvarja z analizo omrežij, se je pred dobrima dvema desetletjema porojilo – v zadnjem desetletju pa mocno intenziviralo – podrocje reprezentacijskega ucenja, ki omogoca enostavno preslikavo relacijskega podatkovja v vektorsko obliko (govorimo o t. i. vložitvi omrežja), ki ohrani karseda veliko strukturnih lastnosti izvornega omrežja. Na podrocju analize kompleksnih omrežij sta v vrsti razlicnih pristopov k reprezentacijskemu ucenju, najpogosteje uporabljena algoritma DeepWalk in node2vec. Osnovna ideja vložitve posameznih vozlišc je ilustrirana na sliki 2. Algoritem DeepWalk vložitev vozlišc opravi na osnovi modela skip-gram s prirezanimi slucajnimi sprehodi,24 node2vec pa z maksimizacijo pogojne verjetnosti nad sosedstvi vozlišc.25 Dober vpogled v razlicne družine pristopov k reprezentacijskemu ucenju nad homogenimi omrežji nudita pregledna clanka.5, 26 Spomnimo se, da lahko s heterogenim omrežjem predstavimo razlicne tipe relacij med vozlišci.27 Ustrezen pristop za reprezentacijsko ucenje nad omrežjem znanja mora zato upoštevati tako tip entitete kot tip relacije. Paleta možnosti za obravnavo vložitev omrežja znanja je široka. Chang in sodelavci28 so orali ledino in predlagali arhitekturo globokega ucenja za obravnavo heterogenih interakcij v omrežju. Odmeven je bil tudi prispevek avtorjev algoritma metapath2vec, ki za okolico vozlišc najprej preišce z vnaprej definiranimi vzorci slucajnih sprehodov, nato pa pripravi vložitev s pomocjo modela skip-gram.29 Pregled literature razkrije tri družine algoritmov za reprezentacijsko ucenje nad omrežji znanja:30 (i) modeli translacije v vektorskem prostoru; (ii) semanticni modeli in (iii) modeli na osnovi globokih nevronskih mrež. ¦ Osnovna zamisel modelov, ki temeljijo na konceptu vzporednega premika v vektorskem prostoru je, da v trojcku .h, r, t. relacijo r obravnavamo kot translacijo iz izhodišcnega vozlišca h v koncno vozlišce t, torej h + r '. t. Najenostavnejši algoritem TransE vektorsko vložitev vozlišc in povezav pripravi na osnovi modela nevronske mreže, v katerem minimiziramo kriterijsko funkcijo f(h, r, t) = || h + r – t ||.31 TransE odpove v primeru vecrelacijskega omrežja (tj. v kardinalnostih ena-proti-mnogo in mnogo-proti­mnogo). To pomanjkljivost odpravlja model TransR, v katerem entitete in relacije vlagamo v locena latentna prostora.32 ¦ Osnova semanticnih modelov je koncept razdalje. Algoritem RESCAL je bil razvit na predpostavki, da sta si entiteti podobni, ce se s podobnimi entitetami povezujeta s podobnimi relacijami. V to družino spadata še algoritma DistMult33 in ComplEx.34 ¦ Tretja družina algoritmov za reprezentacijsko ucenje nad omrežji znanja temelji na pristopu globokih nevronskih mrež. V tem okviru omenjamo dva konvolucijska modela, ConvE35 in ConvKB.36 Njuna glavna slabost je, da pri pripravi vložitev posamezne trojcke obravnavata loceno. Pomanjkljivost lahko odpravimo z vkljucitvijo mehanizma pozornosti, na katerem je osnovan model HRGAT.37 Slika 2 Vložitev vozlišc homogenega omrežja. Vozlišca omrežja (levo) predstavimo v vektorski obliki (sredina), pri cemer težimo k ohranitvi kar najvec njihovih (strukturnih) lastnosti. Število vrstic matrike ustreza številu vozlišc omrežja. Osenceno je predstavljena vektorska vložitev za izbrano vozlišce. Dolžino vektorjev v praksi izberemo na podlagi kompromisa med natancnostjo reprezentacije in sprejemljivo kompleksnostjo. Koncno lahko nad matriko vložitev uporabimo nalogi primeren postopek statisticne analize. Za graficni prikaz smo matriko vložitev dodatno skrcili z analizo glavnih komponent. Opazimo, da sta skupnosti vozlišc v omrežju (levo) lepo razvidni tudi v prostoru, ki ga razpenjata le prvi dve glavni komponenti (desno). Zakljucek Predstavljeni pregled podrocja omrežij znanja nikakor ni izcrpen. Upamo pa, da ponuja dovolj celovit vpogled v to obširno tematiko. Razlicne nacine predstavitve znanja smo naslovili le bežno; zgolj toliko, da smo poudarili dolgo preteklost raziskav na tem podrocju. Prav tako smo navedli le tiste vire podatkov, ki jih najpogosteje navaja znanstvena literatura. Pri tem smo namenoma – zaradi aktualnosti – poudarili gradnjo omrežij iz nestrukturiranih podatkov. Obravnava reprezentacijskega ucenja bi zahtevala samostojen prispevek, zato vabimo bralce, da sežejo po dodatni literaturi. Zahvala Prispevek je nastal v okviru raziskovalnega projekta J5-2552, ki ga financira Agencija za raziskovalno dejavnost Republike Slovenije. Posebna zahvala – za potrpežljivost in vsebinske pripombe – gre glavnemu uredniku. Reference 1. McBride DM, Cutting JC, Zimmerman C. Cognitive psychology: theory, process, and methodology (3rd ed.). Thousand Oaks 2023: Sage. 2. Russell SJ, Norvig P. Artificial intelligence: a modern approach (4th ed.). Hoboken 2020: Pearson. 3. Paulheim H. Knowledge graph refinement: a survey of approaches and evaluation methods. Semant Web 2017; 8(3): 489-508. https://doi.org/10.3233/SW-160218 4. Ehrlinger L, W W. Towards a definition of knowledge graphs. In: Martin M, Cuquet M, Folmer E (eds.). SEMANTiCS (posters, demos, SuCCESS) 2016. Leipzig 2016: CEUR-WS.org; 4. https://ceur-ws.org/Vol-1695/paper4.pdf 5. Wang Q, Mao Z, Wang B, Guo L. Knowledge graph embedding: a survey of approaches and applications. IEEE Trans Knowl Data Eng 2017; 29(12): 2724-2743. https://doi.org/10.1109/TKDE.2017.2754499 6. Belleau F, Nolin MA, Tourigny N, Rigault P, Morissette J. Bio2RDF: towards a mashup to build bioinformatics knowledge systems. J Biomed Inform 2008; 41(5): 706-716. https://doi.org/10.1016/j.jbi.2008.03.004 7. Vintar Š. Oznacevanje in odkrivanje pomenskih razmerij v medicinskih besedilih. Infor Med Slov 2005; 10(1): 9-18. 8. Finlayson SG, LePendu P, Shah NH. Building the graph of medicine from millions of clinical narratives. Sci Data 2014; 1(1): 140032. https://doi.org/10.1038/sdata.2014.32 9. Rotmensch M, Halpern Y, Tlimat A, Horng S, Sontag D. Learning a health knowledge graph from electronic medical records. Sci Rep 2017; 7(1): 5994. https://doi.org/10.1038/s41598-017-05778-z 10. Zhao C, Jiang J, Xu Z, Guan Y. A study of EMR-based medical knowledge network and its applications. Comput Methods Programs Biomed 2017; 143: 13-23. https://doi.org/10.1016/j.cmpb.2017.02.016 11. Xu J, Kim S, Song M, et al. Building a PubMed knowledge graph. Sci Data 2020; 7(1): 205. https://doi.org/10.1038/s41597-020-0543-2 12. Wang LL, Lo K, Chandrasekhar Y et al. CORD-19: the COVID-19 open research dataset (v4). arXiv 2020: 2004.10706. https://doi.org/10.48550/arXiv.2004.10706 13. Chen Q, Allot A, Leaman R et al. LitCovid in 2022: an information resource for the COVID-19 literature. Nucleic Acids Res 2023; 51(D1): D1512-D1518. https://doi.org/10.1093/nar/gkac1005 14. Pestryakova S, Vollmers D, Sherif MA et al. COVIDPUBGRAPH: a FAIR knowledge graph of COVID-19 publications. Sci Data 2022; 9(1): 389. https://doi.org/10.1038/s41597-022-01298-2 15. Aronson AR. Effective mapping of biomedical text to the UMLS Metathesaurus: the MetaMap program. Proc AMIA Symp 2001: 17-21. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC22436 66/ 16. Rindflesch TC, Fiszman M. The interaction of domain knowledge and linguistic structure in natural language processing: interpreting hypernymic propositions in biomedical text. J Biomed Inform 2003; 36(6): 462-477. https://doi.org/10.1016/j.jbi.2003.11.003 17. Song M, Kim WC, Lee D, Heo GE, Kang KY. PKDE4J: entity and relation extraction for public knowledge discovery. J Biomed Inform 2015; 57: 320­332. https://doi.org/10.1016/j.jbi.2015.08.008 18. Weber L, Sänger M, Mchmeyer J, Habibi M, Leser U, Akbik A. HunFlair: an easy-to-use tool for state-of-the-art biomedical named entity recognition. Bioinform 2021; 37(17): 2792-2794. https://doi.org/10.1093/bioinformatics/btab042 19. Sung M, Jeong M, Choi Y, Kim D, Lee J, Kang J. BERN2: an advanced neural biomedical named entity recognition and normalization tool. Bioinform 2022; 38(20): 4837-4839. https://doi.org/10.1093/bioinformatics/btac598 20. Yang Y, Lu Y, Yan W. A comprehensive review on knowledge graphs for complex diseases. Brief Bioinformatics 2023; 24(1): bbac543. https://doi.org/10.1093/bib/bbac543 21. Wei C-H, Allot A, Leaman R., Lu Z. PubTator Central: automated concept annotation for biomedical full text articles. Nucleic Acids Res 2019; 47(W1): W587-W593. https://doi.org/10.1093/nar/gkz389 22. Yu Y, Wang Y, Xia Z et al. PreMedKB: an integrated precision medicine knowledgebase for interpreting relationships between diseases, genes, variants and drugs. Nucleic Acids Res 2019; 47(D1): D1090-D1101. https://doi.org/10.1093/nar/gky1042 23. Nelson W, Zitnik M, Wang B, Leskovec J, Goldenberg A, Sharan R. To embed or not: network embedding as a paradigm in computational biology. Front Genet 2019; 10: 381. https://doi.org/10.3389/fgene.2019.00381 24. Perozzi B, Al-Rfou R, Skiena S. DeepWalk: online learning of social representations. In: Krishnapuram B et al. (eds.). Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining – KDD ’14. New York 2014: Association for Computing Machinery; 701-710. https://doi.org/10.1145/2623330.2623732 25. Grover A, Leskovec J. Node2vec: scalable feature learning for networks. In: Krishnapuram B et al. (eds.). Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York 2016: Association for Computing Machinery; 855-864. https://doi.org/10.1145/2939672.2939754 26. Yi, H-C, You Z-H, Huang D-S, Kwoh CK. Graph representation learning in bioinformatics: trends, methods and applications. Brief Bioinformatics 2022; 23(1): bbab340. https://doi.org/10.1093/bib/bbab340 27. Shi C, Li Y, Zhang J, Sun Y, Yu PS. A survey of heterogeneous information network analysis. IEEE Trans Knowl Data Eng 2017; 29(1): 17-37. https://doi.org/10.1109/TKDE.2016.2598561 28. Chang S, Han W, Tang J, Qi G-J, Aggarwal CC, Huang TS. Heterogeneous network embedding via deep architectures. In: Cao L (ed.). Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York 2015: Association for Computing Machinery; 119-128. https://doi.org/10.1145/2783258.2783296 29. Dong Y, Chawla NV, Swami A. Metapath2vec: scalable representation learning for heterogeneous networks. In: Matwin S, Yu S. Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining – KDD ’17. New York 2017: Association for Computing Machinery; 135-144. https://doi.org/10.1145/3097983.3098036 30. Ji S, Pan S, Cambria E, Marttinen P, Yu PS. A survey on knowledge graphs: representation, acquisition, and applications. IEEE Trans Neural Netw Learn Syst 2022; 33(2): 494-514. https://doi.org/10.1109/TNNLS.2021.3070843 31. Bordes A, Usunier N, Garcia-Durán A, Weston J, Yakhnenko O. Translating embeddings for modeling multi-relational data. In: Burges CJC et al. (eds.). NIPS'13: Proceedings of the 26th International Conference on Neural Information Processing Systems – Volume 2. Austin 2013: AAAI Press; 2787-2795. https://dl.acm.org/doi/10.5555/2999792.2999923 32. Lin Y, Liu Z, Sun M, Liu Y, Zhu X. Learning entity and relation embeddings for knowledge graph completion. Proceedings of the AAAI Conference on Artificial Intelligence 2015; 9(1): 2181-2187. https://doi.org/10.1609/aaai.v29i1.9491 33. Yang B, Yih W-T, He X, Gao J, Deng L. Embedding entities and relations for learning and inference in knowledge bases. arXiv 2015: 1412.6575. https://doi.org/10.48550/arXiv.1412.6575 34. Trouillon T, Welbl J, Riedel S, Gaussier E, Bouchard G. Complex embeddings for simple link prediction. In: Balcan MF, Weinberger KQ (eds.). ICML'16: Proceedings of the 33rd International Conference on Machine Learning – Volume 48. New York 2016: JMLR.org; 2071-2080. https://proceedings.mlr.press/v48/trouillon16.html 35. Dettmers T, Minervini P, Stenetorp P, Riedel S. Convolutional 2D knowledge graph embeddings. Proceedings of the AAAI Conference on Artificial Intelligence 2018; 32(1): 1811-1818. https://doi.org/10.1609/aaai.v32i1.11573 36. Nguyen DQ, Nguyen TD, Nguyen DQ, Phung D. A novel embedding model for knowledge base completion based on convolutional neural network. In: Walker M, Ji H, Stent A (eds.). Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 2 (Short Papers). New Orleans 2018: Association for Computational Linguistics; 327-333. https://doi.org/10.18653/v1/N18-2053 37. Zheng S, Rao J, Song Y et al. PharmKG: a dedicated knowledge graph benchmark for bomedical data mining. Brief Bioinformatics 2021; 22(4): bbaa344. https://doi.org/10.1093/bib/bbaa344