UPORABNA INFORMATIKA 67 2021 - πtevilka 2 - letnik XXIX STROKOVNI PRISPEVKI Odkrivanje prevar z orodji poslovne inteligence T omaž Dular 1 , Špela Povrženič 1 , Julija Lapuh Bele 1 , 2 , Rok Pirnat 1 1 B2 BI d.o.o., 2 Visoka šola za poslovne vede tomaz.dular@b2-bi.com, spela.povrzenic@b2-bi.com, julija.bele@b2.eu, rok.pirnat@b2-bi-com Izvleček Sistem poslovnega obveščanja mora uporabnikom zagotavljati vrhunsko uporabniško izkušnjo, biti mora prilagodljiv in temeljiti na zanesljivih podatkih. Uporabnikove zbirke podatkov pogosto niso prečiščene, kar je lahko posledica nekonsistentnih poslovnih proce- sov , napak pri beleženju podatkov ali prevar . Z orodjem Power BI in SQL strežnikom smo pripravili rešitev , ki s pomočjo Benfordove- ga zakona določi sporne podatke in jih prikaže na grafično všečen način. Interni revizorji tako dobijo odličen pripomoček, s katerim si pomagajo pri analizi poslovanja in odkrivanju napak in prevar . Ključne besede: odkrivanje prevar , Benfordov zakon, poslovna inteligenca, poslovna analitika Abstract Business intelligence systems must be flexible, based on reliable data while providing users with a premium user experience in data analysis. A user’ s databases are often unrefined, which can be the result of inconsistent business processes, errors in data logging or fraud. Using Power BI and SQL Server , we have developed a solution that, based on Benford’ s law , determines conflicting infor- mation and renders graphically pleasing presentations. Internal auditors are thus provided an excellent tool to help them analyze their operations and detect errors and fraud. Keywords: Fraud detection, Bedford’ s law , business intelligence, business analytics Uv Od Odkrivanje prevar z metodami strojnega učenja je v različnih finančnih institucijah v uporabi že vrsto let (Horan, 2020). S pomočjo naprednih računalniških tehnologij se specializirane skupine strokovnjakov prebijajo skozi milijone transakcij na računih upo- rabnikov – podjetij in fizičnih oseb. Naložbe v strojno opremo in človeške vire se bankam povrnejo v krat- kem času. Z uvedbo spletnih storitev, kot sta na primer Microsoft Azure AI ali Google Cloud AI Platform, pa za vstop v svet umetne inteligence (AI) niso več potrebne velike investicije. Poleg orodij umetne inte- ligence obstaja še nekaj drugih možnosti za prever- janje podatkov. Več avtorjev se je lotilo preverjanja računovodskih izkazov (Amiram idr., 2015). Niso pa samo knjigovodski izkazi predmet podrobnih analiz. Holz (2014) je na primer proučeval kvaliteto podat- kov kitajskih državnih statistik o rasti bruto domače- ga proizvoda in ni potrdil domnev o potvorjenih re- zultatih. Zaključuje, da nacionalni zavod za statistiko ne potvarja rezultatov ali pa rezultate prireja skladno s statističnimi zakoni. V prispevku smo se teme prevar lotili na dru - gačen način, z uporabo empiričnega Benfordovega zakona in brez zahtevnih modelov strojnega učenja. Cilj je bila priprava informacijske rešitve z orodji poslovne inteligence za odkrivanje prevar, ki bi no- tranje revizorje v podjetju usmerila na »problematič- ne« podatke. Revizorji namreč ne morejo pregleda- ti celotne množice podatkov, ki jih letno zberejo ali ustvarijo zaposleni v raznih poslovnih procesih. Na osnovi izkušenj podrobno preverijo le podmnožice »problematičnih« podatkov. Naš cilj je bil pripraviti UPORABNA INFORMATIKA 68 2021 - πtevilka 2 - letnik XXIX Tomaž Dular, Špela Povrženič, Julija Lapuh Bele, Rok Pirnat: Odkrivanje prevar z orodji poslovne inteligence testne podmnožice s pomočjo rešitve v analitičnem okolju Power BI, ki za teoretično podlago prikazuje pojavnost števk (cifer) v primerjavi z napovedjo Ben- fordovega zakona. BeNFOR d Ov Z ak ON Benfordov empirični zakon (Benford, 1938) obravna- va verjetnost pojavitve posameznih števk v množici števil. Po občutku bi trdili, da se vse števke pojavljajo enako verjetno. Benford pa trdi, da se nizke števke (1, 2,..) pojavijo pogosteje kot visoke števke (7, 8 in 9). Zakon potrjujejo analize mnogih podatkovnih zbirk, ki ji najdemo v statističnih letopisih. Benford (1938) je svojo domnevo potrdil na dvajsetih zelo raznovr- stnih zbirkah podatkov. Zanimivi primeri so analiza časovnih intervalov med zaporednimi potresi, mol- ske mase kemičnih spojin, količina vode v rečnih tokovih, populacija v občini ali državi, rezultati vo- litev po mestih, analiza vseh dohodkov gospodinj- stev znotraj neke države ali mesta, velikost datotek v megabajtih na poljubnem računalniku (Povrženič, 2019). Za nas so posebej zanimive zbirke računovod- skih podatkov, ki prav tako sledijo zakonu, kar je do- kazal Nigrini (2012). Na osnovi Benfordovega zakona lahko postavimo trditev: če podatki ne potrjujejo Benfordovega zako- na, potem lahko podvomimo v njihovo pravilnost in poštenost. Benfordovega zakona seveda ne moremo uporabljati brez omejitev in na vsaki množici podat- kov. Razen tega se moramo zavedati, da je sumljive podatke treba še podrobneje pregledati z drugimi metodami. Zakon je v bistvu odkril Simon Newcomb (1881). Zato ga imenujemo tudi Newcomb-Benfordov za- kon. Ob listanju logaritemskih tabel je opazil, da so vse knjige na začetnih straneh veliko bolj obrablje- ne in umazane, kakor strani pri koncu (Kossovsky, 2014). V času pred računalniki so bile logaritemske tablice glavni pripomoček za računanje – predvsem za množenje in deljenje večjih števil. Logaritemske tablice so urejene po števkah na prvem mestu - zače- tne strani vsebujejo logaritme za števila, ki se začnejo z 1, 2. Zaradi umazanih začetnih strani je Newcomb (1881) dobil idejo, da se uporabniki večkrat srečujejo s števili z manjšimi vodilnimi števkami, kakor pa z velikimi. Pojasnimo najprej izraze. Predznaka števila ne upoštevamo. Prva vodilna števka (cifra) v številu je prva neničelna števka na levi strani števila. Za na- slednje števke velja podobno: druga vodilna števka je druga levo ležeča števka (njene vrednosti so lahko od 0 do 9), … Zakon temelji na empiričnih dokazih. Benford (1938) je ugotovil, da je na proučevanih podatkih iz realnega življenja (npr. hišne številke, število prebi- valcev po krajih) kar 30,0 % verjetnost, da je na prvem mestu števila števka 1. Števka 2 se pojavlja na prvem mestu z verjetnostjo 17,6 %, števka 3 pa z verjetnostjo 12,5 %. Verjetnosti z rastjo števke padajo. Če bi bile števke porazdeljene enakomerno, bi imela vsaka od njih verjetnost 11,11 %. Frekvenco pojavitve števke na prvem mestu oz. verjetnost, da se števka d pojavi na prvem mestu v številu je mogoče izračunati po naslednji formuli T abela 1: Benfordov zakon Zakon Oznaka števke V erjetnost pojavitve Pogoji Zakon 1. vodilne števke 1. števka = d log (1 + 1 d ) d ∈ Z, d ∈ [1, 9] Zakon 2. vodilne števke 2. števka = d Σ k = 1 log (1 + 1 10 k + d ) d ∈ [0, 9] Zakon 3. vodilne števke 3. števka = d Σ m = n Σ n = 0 log (1 + 1 100m + 10n + d ) d ∈ [0, 9] Zakon n-te vodilne številke n. števka = d Σ log (1 + 1 10 k + d ) d ∈ Z, d ∈ [0, 9] Kombinacija prvih dveh števk 1. števka = p, 2. števka = q log (1 + 1 10 p + q ) p ≥ 0 in q ≥ 0. Kombinacija prvih treh števk 1. števka = p, 2. števka = q, 3. števka = n log (1 + 1 100p + 10q + r ) p ≥ 0 in q ≥ 0 in r ≥ 0. Kombinacija zadbjih dveh števk 1 100 oz. 1% - enakomerna porazdelitev 9 k = 10 n – 2 10 n – 1 − 1 UPORABNA INFORMATIKA 69 2021 - πtevilka 2 - letnik XXIX Tomaž Dular, Špela Povrženič, Julija Lapuh Bele, Rok Pirnat: Odkrivanje prevar z orodji poslovne inteligence P(d) = log (1 + 1 d ) V tabeli 1 so navedene verjetnosti pojavitve za prve tri vodilne števke in posplošena formula verjetno- stne porazdelitve za n-to vodilno števko. Benfordov zakon lahko posplošimo in prevede- mo tudi na drug številski sistem in posledično upo- rabimo drugo logaritemsko osnovo. Empirično lahko pokažemo, da ima veliko podat- kovnih zbirk iz vsakdanjega življenja logaritemsko porazdeljene vodilne števke pod pogojem, da imajo širok interval podatkov oz. velik red velikosti podat- kovne množice. Red velikosti izračunamo iz nasle- dnje formule. Red velikosti = log(X Max ) − log(X Min ) Podatkovne zbirke, ki imajo razliko logaritmov skrajnih podatkovnih vrednosti večjo kot 3, imajo ponavadi logaritemsko porazdeljene vodilne števke. Načelo invariantnosti Načelo invariantnosti (scale invariance) pravi: ne glede na to, v katerem merskem sistemu enot ima - mo dane podatke, je naključna spremenljivka enako porazdeljena. Če torej prvotni podatki ustrezajo Ben- fordovemu zakonu in podatke pretvorimo v katero koli drugo mersko enoto in porazdelitev, bo še ve- dno ostala Benfordova. Enako velja tudi za podatke, ki niso logaritemski in tudi po pretvarjanju ne bodo. T estiranje podatkovne zbirke Za testiranje odmikov v podatkih od Benfordove po- razdelitve uporabljamo več testov. S standardni stati- stičnim testom Z testiramo skladnost za posamezno števko, s testom hi-kvadrat pa za celotno podatkovno množico. Zelo dobra mera je tudi odstopanje vsote kvadratov (SSD), s katero za vodilne števke ali kom- binacije ugotovimo, ali se zbirka podatkov popolno, sprejemljivo, mejno prilega, ali ne prilega Benfordovi porazdelitvi. T est ponavljajočih se vrednosti Test ponavljajočih se vrednosti je dopolnilni test, ki preveri, kolikokrat se v podatkovni množici po- javi določena vrednost. Ta test je bistven pri analizi nepravilnosti v podatkih, saj nam pomaga pri pre- poznavanju značilnih količin, ki povzročajo skoke na grafih. V testu se osredotočimo na zelo pogosto ponavljajoče se podatke v podatkovni zbirki in sku- šamo odkriti razloge za odstopanja. Pogosto pona- vljanje posameznih števil lahko kaže na posebnosti v zbirki. Odkloni od Benfordove porazdelitve nakazujejo možnosti prevare. Odstopanje od porazdelitve ni do- kaz, da je do prevare res prišlo, temveč le usmeritev revizorju, kje naj išče. Ponarejevalec pri navajanju la- žnih številk ne sledi Benfordovemu zakonu, temveč nezavedno večkrat uporabi iste kombinacije števk. Takšne kombinacije z uporabo Benfordovega zako- na hitro odkrijemo, še posebej, če je izmišljenih števil veliko. Test prvih vodilnih števk ni zadosten pri odkriva- nju prevar. Nujno moramo preveriti tudi teste višjih stopenj in teste kombinacij prvih nekaj in zadnjih ne- kaj števk. Preveriti moramo tudi test ponavljajočih se vrednosti in odkriti razvojni vzorec števk. Carslaw (1988) je ugotovil, da veliki presežki ali pomanjkanja deleža števke 0 v testih višjih redov pomenijo golju- fiva zaokroževanja. Pri analizi vedno ločeno obravnavamo pozitivne in negativne vrednosti in pri tem pogosto negativne vrednosti izpustimo. To počnemo le zaradi vsebin- ske interpretacije. Negativni dokumenti so navadno samo stornacije dokumentov in kvarijo porazdelitev. Lahko pa ločeno obravnavamo stornacije in iščemo morebitne prevare. Ločeno obravnavano tudi podat- kovne zbirke glede na vrsto podatkov. Na primer po- datke iz glavne knjige analiziramo ločeno po kontih prihodkov, stroškov, prilivov, odlivov. Paziti pa moramo, da v analizi obravnavamo samo surove, neobdelane podatke. Vse vsote, zmnožke in druge agregacije odstranimo iz analize. Prav tako ne smemo analizirati mešanice surovih in agregiranih podatkov. P RI me R a a N a LIZe Pripravili smo dva primera analize na isti računo- vodski zbirki podatkov, ki je vsebovala približno štiri milijone zapisov. Zbirka je vsebovala podatke na rav- ni postavke računa, brez seštevkov. Tako smo izpol- nili zgoraj navedeni pogoj za analizo, da ne smemo analizirati surovih podatkov skupaj z agregati. Ana- lizirali smo vrednost zaračunane prodaje in zneske avansov. Podatke smo analizirali v Power BI in dobili analitično orodje, s katerim bodo revizorji preverjali skladnost podatkovne zbirke z Benfordovim zako- nom. S preprosto dosegljivimi filtri lahko omejujejo UPORABNA INFORMATIKA 70 2021 - πtevilka 2 - letnik XXIX Tomaž Dular, Špela Povrženič, Julija Lapuh Bele, Rok Pirnat: Odkrivanje prevar z orodji poslovne inteligence podatke po več dimenzijah: obdobje, države, kupci, stroškovna mesta, referenti, skupine artiklov … Z analizo prodajnih vrednosti smo želeli preveriti veljavnost zakona na resnični računovodski zbirki podatkov. Rezultate analize vidimo na grafih od 1 do 4. Stolpce na vseh grafih smo obarvali s štirimi barvami, skladno s štirimi razredi napak, navedeni- T abela 2: SS d – razredi klasifikacije z velikostjo odstopanj ( k ossovsky, 2014) SS d (%) Popolni Benford Sprejemljiv Benford m ejni Benford Ni Benford Zakon prve vodilne števke <2 2-25 25-100 >100 Zakon druge vodilne števke <2 2-10 10-50 >50i Kombinacija prvih dveh števk <2 2-10 10-50 >50 Kombinacija zadnjih dveh števk <4 4-10 40-100 >100 Barve na slikah mi v tabeli 2. Z zeleno barvo sta obarvana »popolni« in »sprejemljivi Benford«. Naslednja dva razreda sta obarvana rjavo in rdeče. Rdeča barva označuje po- polno neskladje z Benfordovim zakonom. Benfor- dova porazdelitev je kot referenčna črta narisana z modro barvo. Analiza neto zaračunanih vrednosti Analiza neto zaračunane vrednosti pokaže skoraj idealno ujemanje z Benfordovim zakonom. Poraz- Slika 1: Delež prve vodilne števke pri neto zneskih računov delite po zakonu so zapisane v tabeli 1. Ujemanje je skoraj popolno pri prvi števki (slika 1). Tudi na drugi števki je ujemanje zelo dobro (slika 2). Slika 2: Delež druge vodilne števke pri neto zneskih računov (izsek) UPORABNA INFORMATIKA 71 2021 - πtevilka 2 - letnik XXIX Tomaž Dular, Špela Povrženič, Julija Lapuh Bele, Rok Pirnat: Odkrivanje prevar z orodji poslovne inteligence Tudi kombinacija prve in druge števke kaže sko- raj idealno porazdelitev. Na sliki 3, ki prikazuje po- gostnost kombinacij prve in druge števke, opazimo Na sliki 4 je porazdelitev zadnjih dveh števk. Za razliko od logaritemske porazdelitve vodilnih števk je tu pričakovana enakomerna porazdelitev. Posa- Slika 4: Delež kombinacije zadnjih dveh števk pri neto zneskih računov (izsek) večja odstopanja, vendar ta ne presegajo sprejemljive vrednosti (sprejemljivi Benford). Slika 3: Delež kombinacije prve in druge vodilne števke pri neto zneskih računov (izsek) mezne vrednosti vidno odstopajo, vendar nobena vrednost SSD ne preseže meja »sprejemljivega Ben- forda«. a naliza avansov Obvladovanje tveganj v poslovanju podjetja zahteva, da kupci iz slabših bonitetnih razredov pred prevze- mom blago plačajo vnaprej - avansirajo. V drugi ana- lizi smo zajeli samo skupino kupcev, ki so zavezani k plačilu avansa. Takšni kupci imajo posebno oznako v šifrantu. Prva hipoteza: če poslovna politika podjetja zah- teva od vseh kupcev enak avans (npr. 50% od zneska računa), bi zaradi pravila invariantnosti dobili Ben- fordovo porazdelitev kot pri računih. V drugi hipotezi smo predpostavili, da bi Benfor- dovo porazdelitev dobili tudi, če bi deleže avansov delili v več razredov (na primer v razrede 50%, 75% in 100% avans). Rezultati, ki so vidni na slikah od 5 in 6, nobene od hipotez ne potrjujejo. Analizo smo predstavili re- vizorju, ki bo s pregledom dokumentov odgovoril na naslednja vprašanja. Ali je neujemanje z Benfordovo porazdelitvijo posledica kršenja poslovnih pravil? Ali se dogaja to pri vseh kupcih iz slabših bonitetnih razredov, ali je morda kakšen kupec neupravičeno v privilegiranem položaju? UPORABNA INFORMATIKA 72 2021 - πtevilka 2 - letnik XXIX Tomaž Dular, Špela Povrženič, Julija Lapuh Bele, Rok Pirnat: Odkrivanje prevar z orodji poslovne inteligence Pri analizi zadnjih dveh števk na sliki 7, pri kom- binaciji cifer v dveh primerih opazimo precejšnje od- stopanje od Benfordove porazdelitve. Predpostavi- Slika 5: Delež prve vodilne števke pri avansih Slika 6: Delež druge vodilne števke pri avansih Slika 6: Delež kombinacije zadnjih dveh števk pri avansih (izsek) mo lahko, da je razlog odstopanja pri 00 v napačnem zaokroževanju (Carslaw (1988). Razlog odstopanja pri cifrah 21 ni pojasnjen. UPORABNA INFORMATIKA 73 2021 - πtevilka 2 - letnik XXIX Tomaž Dular, Špela Povrženič, Julija Lapuh Bele, Rok Pirnat: Odkrivanje prevar z orodji poslovne inteligence Primer uporabe: analiza testne zbirke podatkov AdventureW orks Benfordov test lahko uporabimo v različnih zbirkah podatkov. Na spletu najdemo algoritme v več pro- gramskih jezikih (npr. https://rosettacode.org/wiki/ Benford%27s_law#SQL). Spodnja koda je prirejena za TSQL - jezik za Microsoft SQL strežnik. Analizirali smo znano testno podatkovno zbir- ko AdventureWorks2014, ki je splošno dostopna na spletu. Predpostavili smo, da bomo z Bendfordom dokazali, da ne gre za dejanske podatke. S progra - mom Koda 1 smo analizirali vrednost vrstice Line- Total v tabeli SalesOrderDetail. Program vrne prvo števko (digit), delež ponovitev (actual), pričakovano vrednost (expected) in kvadrat razlike obeh (SSD). Koda 1: Izračun Bedforda po prvi številki Slika 8: Rezultati Benforda po prvi števki v zbirki AdventureW orks2014 Rezultat poizvedbe, prikazan na sliki 8, potrjuje hipotezo. Rdeče obarvani SSD pokaže, da števka 1 ne sledi Benfordovi porazdelitvi. Števke od 2 do 4 so mejni Benford. S Kodo 2 smo analizirali še prvi dve števki. Zaradi nekaj vrednosti manjših od deset, smo vse vrednosti pomnožili s sto, kar ne vpliva na rezultat analize [9]. UPORABNA INFORMATIKA 74 2021 - πtevilka 2 - letnik XXIX Tomaž Dular, Špela Povrženič, Julija Lapuh Bele, Rok Pirnat: Odkrivanje prevar z orodji poslovne inteligence Rezultat analize na sliki 8, po prvih dveh števkah, nas je presenetil. Na osnovi analize po prvi števki smo pričakovali največje odstopanje (SSD) pri vo- dilni števki 1. Največja napaka pa je pri števkah 49, čeprav tudi števke med 10 in 19 ne sledijo Benfordu. Analiza po dveh števkah torej ni le potrditev analize po prvi števki. Primer ponazarja, da je analizo podat- kov treba narediti po več števkah. Skupna interpreta- cija več kazalcev nam šele poda celovito sliko. Koda 2: Izračun Bedforda po prvi in drugi številki Slika 8: Rezultati analize v zbirki AdventureW orks2017 po prvih dveh števkah Analizo smo nadaljevali za prve tri števke in ugo- tovili največjo napako pri števkah 499 in 349. Podatke z največjo napako smo izolirali in našli približno deset tisoč zapisov s količino 1 in ceno 4,99 in 49,9. Analizi- rali smo tudi zadnji dve števki in dobili največja odsto- panja pri 99 in 98. Odstopanja bi lahko pojasnili z za- okrožitvijo cen na 99 centov in dejstvom, da ima 61% pozicij količino enako ena. Na osnovi opravljene ana- lize trdimo, da ne gre za dejansko zbirko podatkov. Z AKLj Uče K Pri iskanju prevar so sicer zelo popularne metode strojnega učenja. S prevarami se lahko uspešno spo- pademo tudi s preprostejšim matematičnim orod- jem. Benfordov empirični zakon porazdelitve števk je uspešen kazalnik nepravilnosti v zbirkah podat- kov, kar so dokazali številni avtorji in tudi naši pri- meri. Uporaba zakona ni omejena samo na finančna poročila. Med članki smo zasledili tudi rabo zakona za ločevanje resničnih fotografij od generiranih slik [12]. Avtorji so v zadnjem času z Benfordom prever- jali COVID-19 poročila [13] iz Kitajske in vsaj tako potrdili njihovo verodostojnost. Z analitskim orodjem, kot je Power BI, ali s pro- cedurami SQL je mogoče izdelati računalniškega pomočnika, ki je v rokah revizorjev močno orožje za odkrivanje nepravilnosti v podatkovnih zbirkah. Analiza podatkov z Benfordom ne da dokončne sod- be, ali je podatkovni vir potvorjen. Za dokončno sod- bo je treba poznati vsebino podatkov. So pa analize odličen pomočnik, ki usmerja revizorjevo iskanje in tako skrajša čas revizije. UPORABNA INFORMATIKA 75 2021 - πtevilka 2 - letnik XXIX Tomaž Dular, Špela Povrženič, Julija Lapuh Bele, Rok Pirnat: Odkrivanje prevar z orodji poslovne inteligence v IRI IN LIT e R a TUR a [1] Amiram, D., Bozanic, Z., Rouen, E. (2015). Financial state- ment errors: Evidence from the distributional properties of financial statement numbers- Review of accounting studies, Springer [2] Benford, F. (1938). The law of anomalous numbers. Proc. Am. Philos. Soc. 78 (4): 551–572, JSTOR 984802. Pridoblje- no 15. 4. 2020, s [3] Carslaw, C. (1988). Anomalies in Income Numbers: Evidence of Goal Oriented Behavior, The Accounting Review (1988), 321–327. [4] Holz, C. A. (2014). The quality of China's GDP statistics – Chi- na Economic Review, Elsevier [5] Horan, T. J. (2018). 5 Keys to Using AI and Machine Learning in Fraud Detectionhttps. Pridobljeno 6. 2. 2020, https://www. fico.com/blogs/5-keys-using-ai-and-machine-learning-fra- ud-detection [6] Kossovsky, A. E. (2014). Benford's Law: Theory, The Gene- ral Law Of Relative Quantities, And Forensic Fraud Detection Applications, World Scientic, New Jersey. [7] Newcomb, S. (1881). Note on the frequency of use of the diffe- rent digits in natural numbers. American Journal of Mathema- tics. 4 (1/4), 39–40. . JSTOR 2369148. Pridobljeno 6.2.2020, s: https://www.jstor.org/stable/2369148?seq=1#metadata_ info_tab_contents (potrebna registracija) [8] Nigrini, M. (2012). Benford's Law : Applications for Forensic Ac- counting, Auditing, and Fraud Detection, Wiley Corporate F&A [9] Povrženič, Š. (2019). Analiza Benfordovega zakona, magistrsko delo, Univerza v Ljubljani, Fakulteta za matematiko in fiziko. [10] Jeffrey Irwin, (2015) The Effective Use of Benford's Law to Assist in Detecting Fraud in U.S. Environmental Protection Agency (EPA) Toxics Release Inventory (TRI) Data. [11] Heng Qu, Richard Steinberg, Ronelle Burger, (2002), Abiding by the Law? Using Benford’s Law to Examine the Accuracy of Nonprofit Financial Reports, https://journals.sagepub.com/ doi/abs/10.1177/0899764019881510?journalCode=nvsb [21] Nicolò Bonettini, Paolo Bestagini, Simone Milani, Stefano Tubaro, (2020) On the use of Benford's law to detect GAN- -generated images , Cornell University, https://arxiv.org/abs/ 2004.07682 [13 ]Koch, Christoffer, Okamura, Ken, Benford's Law and CO- VID-19 Reporting (April 28, 2020). Available at SSRN: https:// ssrn.com/abstract=3586413 or http://dx.doi.org/10.2139/ ssrn.3586413 [41] Aamo Iorliam, Anthony T.S. Ho, Norman Poh, Santosh Tiruna- gari, Patrick Bours; (2015), 3rd International Workshop on Bio- metrics and Forensics (IWBF 2015), Data forensic techniques using Benford’s law and zipf’s law for keystrokedynamics [15] Aldwin T. Miranda, World’s Distribution of Covid-19 Cases and The Benford’s Law, (2020), Cape Comorin, An Internati- onal Multidisciplinary Double-Blind Peer-reviewed Research JournalSpecial Issue, Volume II Issue V June 2020, ISSN: 2582–1962 [16] Lucas Silva, Dalson Figueiredo Filho, (2020), Using Benford’s law to assess the quality of COVID-19 registerdata in Bra- zil, Journal of Public Health | pp. 1–4 | doi:10.1093/pubmed/ fdaa193 T omaž Dular je po izobrazi elektro inženir in magister znanosti, s področja računalništva in informatike. Ukvarja se s poslovno analitiko, analizo podatkov , umetno inteligenco, bazami podatkov , poslovnimi informacijskimi sistemi in podatkovnimi integracijami. Deloval je kot inovator v svo - bodnem poklicu, zasebni raziskovalec. T renutno deluje kot arhitekt sistema v podjetju MIT informatika in specialist za podatkovno integracijo ter analitik v B2-BI. j ulija Lapuh Bele je diplomantka uporabne matematike, magistrica računalništva in informatike ter doktorica znanosti. V zadnjih letih je njeno raziskovalno področje informatika v poslovnih financah in poslovna analitika, pred tem pa je raziskovala področje uporabnosti programske opreme in sodelovala v razvoju metod in sistema za e-izobraževanje, kjer se je njeno delo navezovalo na implementacijo poslovne analitike v LMS sistem, izboljševanje uporabniške izkušnje in razvoj interaktivnih e-gradiv za področje poslovne matematike ter računalništva in informatike. Rok Pirnat , magister poslovnih ved vodi podjetje B2 BI d.o.o., katerega osnovna dejavnost je izvedba projektov s področja poslovne analitike in raziskovalno razvojna dejavnost. Ukvarja se z razvojem analitičnih modelov v vseh segmentih poslovanja, s čimer pomaga podjetjem, da se razvijajo v pametne organizacije. Rok je predavatelj na številnih poslovnih konferencah in tudi višji predavatelj na visoki šoli. Špela Povrženič je po izobrazbi magistrica finančne matematike. Je poslovna analitičarka. Skozi analitiko podjetjem odkriva vrline, pomanjkljivosti in priložnosti za izboljšave, s tem pa jim pomaga pri rasti in razvoju. Specializirana je na področju analiziranja financ, terjatev in obveznosti. Pohvali se lahko tudi s certifikatom MCSA: BI Reporting, ki potrjuje njeno znanje in izkušnje na področju analiziranja in vizualiziranja podatkov z Excelom in Power BI.