Elektrotehniški vestnik 82(1-2): 61-65, 2015 Izvirni znanstveni članek
Napovedovanje izidov svetovnega prvenstva v nogometu z uporabo modela matričnega razcepa
Štefan Dobravec
Univerza v Ljubljani, Fakulteta za elektrotehniko, Tržaška 25, 1000 Ljubljana, Slovenija E-pošta: stefan.dobravec@fe.uni-lj.si
Povzetek. Napovedovanje izidov nogometnih srečanj zaradi stohastične narave je velik izziv. Dodatne težave povzročata odsotnost standardnega nabora parametrov za napovedovanje in odsotnost strokovnega znanja. V prispevku opisana metoda temelji na uporabi modela matričnega razcepa, ki napoveduje rezultate izključno na podlagi izidov ze odigranih srečanj brez uporabe strokovnega znanja, in sicer napoveduje število zadetkov moštva proti danemu nasprotniku. Uporabljen je model z upoštevanjem pristranskosti, kar omogoča učinkovitejšo karakterizačijo moštev. Metoda je testirana na primeru nedavno končanega svetovnega prvenstva. Očenjena je z vidika uspešnosti pri napovedovanju števila zadetkov in z vidika uspešnosti pri napovedovanju izidov srečanj. Pri napovedovanju uspešnosti je bila z analizo krivulj ROC dosezena uspešnost AUC= 0, 677.
Ključne besede: napovedovanje športnih izidov, matrični razčep
Forecasting the football world cup results using a matrix-factorization model
Forecasting results of football matches poses a serious challenge due to the stochastic nature of the game. The absence of a standardized set of parameters and difficulty to incorporate the expert knowledge present additional problems. The forecasting method presented in the paper is based on the matrix factorization model, which uses only results of the already played matches as an input. More specifically, it forecasts the number of goals scored by a team against a given opponent. A model with biases is used to better characterize the teams. The method is tested on the case of the recently finished world cup championship. The success of forecasting the number of goals scored and the success of forecasting the match result are evaluated. The quality of the classifier is assessed by the ROC curve analysis, yielding the value of AUC= 0.677.
1 Uvod
Napovedovanje rezulatov športnih dogodkov je vedno zanimiva tema, tako z vidika zabave, kot tudi s popolnoma poslovnega vidika (npr. sšportne stave). zato je nogomet kot eden svetovno najbolj priljubljenih sšportov pogosto predmet raziskav, saj po eni strani zaradi sto-hasticšne narave nudi velik raziskovalni izziv, po drugi strani pa ga obicšajno usmerja natancšno izbrana igralna strategija [1].
Različne tehnike modeliranja nogometnega srečanja nas privedejo do razlicšnih algoritmov za napovedovanje izidov. V literaturi [2] so postopki modeliranja razvršceni v štiri splošne skupine: (i) empiricni modeli, (ii) dinamicni sistemi, (iii) statisticni postopki in (iv) ekspertni sistemi. V skupini statisticnih postopkov za najosnovnejši pristop velja uporaba Poissionove porazde-
Prejet 16. december, 2014 Odobren 12. januar, 2015
litve pri napovedovanju števila dosezenih zadetkov [3], izid srecanja je torej dolocen posredno (iz medsebojne napovedi za nastopajocši mosštvi). Nasprotno pa vecšina drugih pristopov napoveduje izid srecanja neposredno, pri cšemer pa rezultati v vecšini primerov ne odstopajo bistveno [4]. V skupini ekspertnih sistemov prevladujejo pristopi k modeliranju na podlagi Bayes-ovih mrez (ang. Bayesian Networks) [1] [5] [6]. Ti pristopi so praviloma kompleksni, temeljijo na številnih predpostavkah in zahtevajo veliko statisticnih vzorcev [8], vendar omogocajo preprosto vkljucevanje znanja o domeni uporabe, zato so v napovedih praviloma natancnejši [5]. Na pristope iz preostalih dveh skupin pa v zadnjih letih tako rekoc sploh ne naletimo.
Skupna tezava opisanih pristopov je nekompatibil-nost nabora podatkov, uporabljenih za napovedovanje izidov. Standardnega nabora namrec ni, prav tako tudi ni enotne raziskovalne podatkovne zbirke. V literaturi [7] lahko najdemo analizo parametrov nogometnega srecanja, kljub temu opisani pristopi uporabljajo od primera do primera razlicne parametre, kar onemogoca pravo primerjavo njihove uspešnosti. Delno lahko vzroke teh tezšav pripisšemo dinamicšnosti nogometne igre, ki otezuje sistematicno zbiranje statisticnih podatkov, ki je poleg tega še omejeno le na izbrana ligaška in turnirska tekmovanja.
V prispevku je opisana metoda za napovedovanje izidov svetovnega nogometnega prvenstva, ki temelji na modelu matricnega razcepa. Tovrstni postopki so v zadnjih letih pridobili na veljavi na podrocju priporocilnih sistemov za multimedijske vsebine, kjer so izkazali svojo superiornost pri napovedi uporabniške izkušnje [9]. Pomembna prednost opisane metode je v tem, da model matricnega razcepa uporablja latentne parametre.
62
DOBRAVEC
Večina do zdaj uveljavljenih pristopov namreč uporablja subjektivno določen (znanje strokovnjaka), od primera do primera različen nabor parametrov. V primeru, ko bodisi strokovnega znanja bodisi primernega nabora merljivih parametrov nimamo, so latentni parametri modela matričnega razcepa boljša izbira kot nabor parametrov, ki ga ne znamo ustrezno ovrednotiti.
Predlagana metoda temelji izključno na rezultatih (številu dosezenih zadetkov) ze odigranih srečanj, torej brez dodatnih statističšnih podatkov in strokovnega znanja. Rezultat srečanja je namreč univerzalen podatek in je vedno zabelezen. Metoda napoveduje število dosezšenih zadetkov posameznega mosštva na določšenem srečanju in posredno tudi izid srečanja.
V nadaljevanju je najprej predstavljena metodologija napovedovanja sštevila zadetkov, sledi opis postopka razvrsščšanja izidov nogometnih tekem, rezultati napovedovanja in razvrščanja za izbrani primer ter sklepne ugotovitve.
2 Metodologija in podatki
2.1	Testni podatki
Algoritem je bil preizkusšen na primeru nedavnega svetovnega prvenstva v nogometu v Braziliji 2014, ki se je odvijalo v turnirski obliki. Prvi del turnirja je skupinski del, kjer so sodelujočši razdeljeni v osem skupin po sštiri ekipe. V skupini ekipe igrajo po sistemu vsak z vsakim, torej dve srečanji na krog, skupaj trije krogi, v osmih skupinah pa to pomeni skupaj 48 srečanj. Najuspešnejši ekipi iz vsake skupine napredujeta v izločilni del turnirja, kjer se igra po sistemu izločanja. V drugem deluje odigranih 16 tekem: 8 v osmini finala, 4 v četrfinalu ter po dve v polfinalu in finalu).
Poleg srečanj svetovnega prvenstva smo v postopku učenja algoritma uporabili tudi prijateljska srečanja ekip udelezšenk neposredno (en meseč) pred prvenstvom, in sičer skupaj 56 srečanj.
Vsi podatki, tako o ze odigranih srečanjih kot tudi o srečanjih naslednjega kroga, so bili dostopni na uradni strani svetovnega nogometnega prvenstva (http://www.fifa.čom/worldčup/). Ker v izločilnem delu turnirja neodločšen rezultat ni večš mogočš (igra se do končšnega zmagovalča), smo uporabili rezultat po izteku rednega dela srečanja, prav tako tudi napoved velja za rezultat po izteku rednega dela srečanja.
2.2	Model matričnega razcepa
Modeli matričnega razčepa so se na področju priporočilnih sistemov multimedijskih vsebin izkazali kot učinkoviti pri napovedovanju uporabniške izkušnje [9]. Pri tem gre za poskus modeliranja interakčije med uporabniki in multimedijskimi vsebinami tako, da se model gradi na podlagi očen, ki so jih uporabniki dodelili vsebinam. Model se nato uporabi za napoved uporabnikove izkušnje (zadovoljstva) s še neočenjeno vsebino.
V našem primeru je model prirejen tako, da temelji na številu dosezenih zadetkov gen. Opazujemo torej, koliko zadetkov izbrana ekipa e doseze proti nasprotni ekipi n. Z modelom napovemo pričakovano število zadetkov gen, torej koliko zadetkov bo izbrana ekipa dosegla proti določšenemu nasprotniku. Odločšitev za ta parameter utemeljujemo z dejstvom, da sštevilo zadetkov enega in drugega mosštva neposredno odločša o končšnem izidu srečanja. V model matričnega razčepa sičer lahko vključimo tudi druge parametre, ki vplivajo na napoved (v [10] je na primer dodana časovna komponenta), vendar smo se zadovoljili z osnovnim modelom z uposštevanjem pristranskosti (ang. bias):
9en = M + be + K + pe ■	(1)
V modelu sta ekipi (e in n) predstavljeni z vektorjema (pe in qn) v prostoru latentnih parametrov tako, da njun produkt ponazarja tisti del napovedi, ki je posle-diča neposredne 'interakčije', m pomeni povrečje vseh dosezenih zadetkov, be in bn pa odstopanja izbrane in nasprotne ekipe od tega povprečja.
Prostor latentnih parametrov je v postopku učenja modela postavljen tako, da ustrezno povzame tiste vidike srečanj iz učne mnoziče kt, ki najbolje pojasnijo odstopanja v sštevilu dosezšenih zadetkov izbrane ekipe proti različnim nasprotnikom. Za učenje je uporabljen stohastični gradientni postopek (ang. Stočhastič Gradient Desčent), ki temelji na zmanjševanju kvadratične napake napovedi za znane rezultate iz kt :
min J2 (gen - den)2 + HllPef + Unf + &n +
(e,n)EKT
š (2) Ce rezultate iz kt predstavimo s (i, j, Gi; Gj), kjer sta i in j ekipi, Gi in G j pa števili zadetkov teh ekip, potem za vsak rezultat izluščimo dve vrednosti, ki ju upoštevamo v enačbi: gij = Gi ter gji = G j Drugi del vsote je namenjen regularizačiji, ki jo nadzoruje parameter A.
Testna mnoziča algoritma so pari moštev (i in j), ki igrajo srečanje v naslednjem krogu tekmovanja ke =
{(i,j)}.
2.3 Napovedovanje izida
Uporabljeni model matričnega razčepa ne napoveduje neposredno izida, temveč pričakovano ševilo zadetkov (gen) izbrane ekipa (e) proti nasprotniku (n). Za vsako srečanje (i, j) iz ke tako dobimo dve napovedi: Gi = gij in Gj = gji. Za napovedovanje izida je treba načrtovati še razvrščevalnik (C), ki pare napovedi razvrsti v enega naslednjih treh razredov: zmaga prvega mosštva v paru (1), zmaga drugega mosštva v paru (2) in neodločen rezultat (0):
(i,j,Gi,Gj) {(1), (2), (0)}.	(3)
Za navedene oznake razredov smo se odločšili, ker so splosšno uveljavljene tako pri statističšni analizi nogometnih rezultatov kot na področšju nogometnih stav.
NAPOVEDOVANJE IZIDOV SVETOVNEGA PRVENSTVA V NOGOMETU
63
Najpreprostejši način razvrščanja predstavlja primerjava na najbližje celo število zaokrožene napovedi števila zadetkov:
{(1) ; round(Gi) >round(Gj)
(2) ; round(Gi) <round(Gj ) (4)
(0) ; round(Gi) = round(Gj).
Takšno razvrščanje ima težave, ko sta napovedani vrednosti G i in G j tik ob meji zaokrozevanja, vendar vsak na svoji strani (npr. 1,51 in 1,49). V takem primeru je kljub zelo podobni napovedi števila zadetkov napovedan izid zmaga in ne neodločen izid.
Več uspeha lahko pričakujemo, če za razvrščanje uporabimo katerega od uveljavljenih postopkov razvrščanja. V raziskavi je uporabljen Bayesov naivni razvrščevalnik (ang. Naive Bayes). Ta spada med bolj robustne in v večini primerov uspešne razvrščevalnike, čeprav temelji na domnevi o nekoreliranosti vhodnih značšilk (v tem primeru Gi in G j ) [12].
Medtem ko v prvem primeru ne potrebujemo učne faze, pa je ta seveda potrebna pri razvrščanju z uporabo Bayesovega naivnega razvrsščševalnika. Uspesšnost razvrsščšanja je seveda odvisna tudi od velikosti učšne mnoziče, zato izidi v tem primeru niso napovedani 'sproti'. Uspešnost napovedovanja je namreč odvisna tudi od velikosti učšne mnozšiče, ker pa nabor podatkov obsega vsega 64 izidov srečanj, je pri določanju učnega in testnega nabora uporabljeno navzkrizšno pregibanje (ang. čross-folding) nabora podatkov. V tem primeru je uporabljenih 8 pregibov (8-folding), da je v vsakem enako število vzorčev, ki so po pregibih razporejeni naključšno tako, da je porazdelitev glede na razred enaka kot v čelotnem naboru.
2.4 Ovrednotenje
Očena uspešnosti napovedovanja števila dosezenih zadetkov je podana s srednjo kvadratično napako (ang. Root Mean Square Error - RMSE) med napovedanim in dejanskim številom zadetkov parov ekip (e, n) iz testnega niza ke .Za primerjavo med različnimi nabori podatkov, kjer lahko pride do večjih medsebojnih statističnih odstopanj, pa moramo uporabiti njeno normalizirano obliko (NRMSE) [15]:
RMSE
i
(gen gen)))
NRMSE
Nke
RMSE g .
(5)
(6)
Na podlagi matrike pravilnih in napačnih razvrstitev je izpeljana cela vrsta mer uspešnosti razvrščevalnika, ki so pogosto odvisne od področja uporabe. Smiselno je, da uporabimo tiste mere, ki jih je za dani primer preprosto interpretirati [16]. Najpogosteje se uporabljajo mere: skupna uspešnost razvrščanja (ang. Overall Success Rate - OSR), natančnost (ang. Precission) in priklic (ang. Recall). Uspešnost razvrščanja, ki poda odstotek pravilno napovedanih izidov, izračšunamo kot delezš pravilno napovedanih izidov:
OSR = pii + p)) + P33 .
(7)
Za natančnejši vpogled v učinkovitost razvrščevalnika se uporabljata še natančnost in priklič, ki ovrednotita uspesšnost razvrsščšanja v posamičšne razrede. Natančšnost pove, koliko izidov izbranega tipa smo napovedali pravilno, priklič pa pove, koliko izidov, razvrsščšenih v izbrani razred, je bilo napovedanih pravilno:
Pi
Pii
Pil + Pi) + Pi3 '
, Ri
Pii
Pli + P)i + P3i
(8)
(1) (0) (2)
pil	pi)	pi3
p)1	P))	P)3
P31	P3)	p33
Uspešnost napovedi razvrščanja izidov srečanj je prikazana s pomočjo matrike pravilnih in napačnih razvrstitev (ang. Confusion Matrix). V našem primeru gre za razvrščanje v tri razrede, kot je ponazorjeno z enačbo 3. V matriki (glej tabelo 1) so s strešičo (npr. (1)) označeni napovedani razredi, brez strešiče pa dejanski (dosezeni) razredi. Vrednosti pj pomenijo deleze izidov, ki smo jih razvrstili v ¿-ti razred, dejansko pa spadajo v j-ti razred.
Tabela 1: Matrika pravilnih in napačnih razvrstitev
Tovrstne splošne očene uspešnosti imajo nekaj tezav, in sičer kazejo le na uspešnost razvrščanja pri izbranih pogojih (naučenih odločitvenih pragih) in so občutljive na neuravnotezenost razredov (ang. Class Skew) [11] [13]. Fawčett [11] zato predlaga uporabo krivulj ROC (ang. Rečeiver Operating Charačterističs), ki prikazuje razmerje med dvema parametroma: delezem pravilnih razvrstitev v izbrani razred (ang. True Positive Rate) in delezem napačnih razvrstitev v izbrani razred (ang. False Positive Rate). Kot mero kakovosti razvrščevalnika pa isti avtor predlaga površino pod krivuljo ROC - AUC (ang. Area Under Curve). Za naključno razvrščanje, ki ga kaze diagonala v diagramu ROC tako velja, da je AUC = 0, 5.
Ker pri Bayesovem naivnem razvrščevalniku uporabljamo navzkrizno pregibanje nabora podatkov z osmimi čikli (8-folding), kot rezultat dobimo 8 krivulj ROC, ki jih, kot je predlagano v [13], predstavimo s povprečno krivuljo in intervalom zaupanja, kakovost razvrsščševalnika pa z AUC povprečšne krivulje.
Krivulje ROC so v osnovi namenjene analizi razvrsščšanja v dva razreda, primer v prispevku pa uporablja tri razrede. Namesto krivulje bi tako morali uporabiti šestrazseznostni politop ter s tem bolj zapletene postopke analize [11]. Preprostejša moznost je prikaz s tremi osnovnimi krivuljami ROC, po eno za vsak razred
64
DOBRAVEC
(kjer 'pozitivnega' pomeni izbrani razred, 'negativnega' pa preostala dva). Pri tem zato dobimo tri vrednosti AUC, za skupno oceno pa uporabimo, kot predlaga [14], utezeno povprečje:
AUC = AUC(cj) * w(ci),	(9)
OiEC
kjer so utezi w(ci) delezi vzorcev v razredih ci.
3 Poskus
Potek poskusa je ponazorjen na sliki 1. Rezultate ze odigranih srečanj (i,j,gij), shranjene v lokalni podatkovni zbirki, smo uporabili v učni fazi, katere rezultat so parametri modela za napoved rezultatov naslednjega kroga srečanj (qn, pe, be, bn). Pare naslednjega kroga smo pridobili z uradne spletne strani, prav tako tudi rezultate po odigranem krogu. Ti so testna mnozica podatkov, na podlagi katerih je bilo opravljeno ovrednotenje napovedanih rezultatov, kot je to opisano v prejšnjem poglavju. Izide odigranih tekem smo nato dodali v lokalno podatkovno zbirko in ga uporabili v naslednji ucšni fazi.
Ucšna faza in faza ovrednotenja sta se ponovili po vsakem odigranem krogu. V začetnem stanju (pred zacšetkom prvenstva) so bili v ucšni fazi uporabljeni izidi pripravljalnih tekem sodelujočih ekip.
4 Rezultati
Uspesšnost napovedovanja sštevila dosezšenih zadetkov smo ugotavljali po vsakem odigranem krogu. Pri izračunu uspešnosti po določenem krogu so upoštevane
	(i)	(0)	(2)	P
(1)	0.219	0.188	0.109	0.424
(0)	0.078	0.047	0.078	0.230
(2)	0.078	0.031	0.172	0.611
R 0.583 0.176 0.478 OSR= 0.438
Tabela 2: Matrika pravilnih in napačnih razvrstitev pri razvrščanju z zaokrozevanjem
napovedi in izidi vseh do tedaj odigranih srečanj. Ugotovitve so povzete na sliki 2.
Uspešnost napovedovanja izidov z uporabo razvrščanja z zaokrozevanjem (glej enačbo 4) je prikazana v tabeli 2. Izračun je narejen po končanem prvenstvu, torej ob uposštevanju napovedi in izidov vseh srečanj.
Uspešnost Bayesovega razvrščevalnika je prikazana v tabeli 3. Opazno je občutno izboljšanje natančnosti (P) razvrščanja za razred (0), prikliča (R) za razred (2) ter posledično uspešnosti razvrščanja (OSR). Na sliki 3 so prikazane krivulje ROC za vsak razred posebej, kjer je senčen 95-odstotni interval zaupanja. Najslabše se obnese napovedovanje v razred (1), kjer je dobljena krivulja tudi najblize diagonali, ki kaze naključno razvrsščšanje.
Za dani primer je bila ugotovljena naslednja porazdelitev razredov: p(i) = 0, 375,p(0) = 0,266, p(2) = 0,359. Po enačbi 9 tako dobimo za Bayesov razvrsščševalnik
AUC = 0, 677.
5 Sklep
Opisana metoda temelji izključšno na rezultatih (sštevilu dosezenih zadetkov) ze odigranih srečanj, torej brez dodatnih statističnih podatkov in strokovnega znanja. Tovrstna obravnava je še posebej primerna, ko statističnih podatkov in/ali strokovnega znanja ni na voljo oziroma ga ne znamo pravilno uporabiti.
•	t.47

1. krog 2. kiog 3. krog 1/8 1/4 1/2 iim
i ,i . ..	i . . n.i 4 :
O • I. I I -■#--! I
Slika 1: Izvedba poskusa
Slika 2: Napaka pri napovedovanju sštevila dosezšenih zadetkov
NAPOVEDOVANJE IZIDOV SVETOVNEGA PRVENSTVA V NOGOMETU
65
razred '0'
,—'							
							
\							
r							
							
							
				AUC =		0,76	
							
0.1		3 0.4 0		0	0	7 0	8 0.
Delež napačnih rawrstitev
Slika 3: Krivulje ROC za posamezne razrede Bayesovega razvrscevalnika
	(i)	(0)	(2)	P
(1)	0.234	0.219	0.109	0.417
(0)	0.031	0.031	0.016	0.400
(2)	0.109	0.016	0.234	0.652
R 0.625 0.118 0.652 OSR= 0.500
Tabela 3: Matrika pravilnih in napačnih razvrstitev pri Baye-sovem razvrsčevalniku
Pri napovedovanju števila doseženih zadetkov ni bilo pričakovati visoke uspešnosti, saj samo število zadetkov pri nogometu v večini primerov ni ključnega pomena, pomembnejši je namreč izid. To še posebej velja v srečanjih 'na izločanje', kjer ima zmaga z minimalno razliko (1:0) za moštvi popolnoma enake poslediče kot npr. visoka zmaga s 7:0, kar seveda občutno vpliva na igralno taktiko.
Napovedovanje izidov s preprostim postopkom za-okrozevanja napovedanih vrednosti je iz ze opisanih razlogov relativno neuspesšno. Podrobnejsši vpogled v matriko pravilnih in napačnih razvrstitev kaze na hude tezave pri napovedovanju neodločenih rezultatov. Z razvrščanjem z uporabo Bayesovega razvrščevalnika se to izboljsa, prav tako se izboljsa delez pravilno napovedanih izidov (OSR).
Pomankljivost uporabljenega primera je v razmeroma majhni učni mnoziči. Zaradi stohastične narave nogometne igre bi se namreč z večjo učno mnozičo izboljšala učinkovitost napovedovanja. Večjo učno mnozičo bi imeli na voljo, če bi podaljsali obdobje napovedovanja (npr. na več let), vendar bi se pri tem soočili s časovno komponento karakterizačije mostev.
Literatura
[1]	B. Min, J. Kim, C. Choe, H. Eom, R. MčKay, "A čompound framework for sports results predičtion: A football čase study," Knowledge-Based Systems, vol. 21, n. 7, pages 551-562, 2008.
[2]	M. Hughes, I. Franks, The essentials of performance analysis: an introduction, Routledge, 2007.
[3]	D. Karlis, I. Ntzoufras, "Analysis of sports data by using bivariate poisson models," Journal of the Royal Statistical Society: Series D (The Statistician, vol. 52, n. 3, pages 381-393, Wiley Online Library, 2003.
[4]	J. Goddard, "Regression models for forecasting goals and match results in association football," International Journal of Forecasting, vol. 21, n. 2, pages 331-340, Elsevier, 2005.
[5]	A. Joseph, N. Fenton, M. Neil, "Predicting football results using Bayesian nets and other machine learning techniques," Knowledge-Based Systems, vol. 19, n. 7, pages 544-553, Elsevier, 2006.
[6]	A. Constantinou, N. Fenton, M. Neil, "pi-football: A Bayesian network model for forecasting Association Football match outcomes," Knowledge-Based Systems, vol. 36, pages 322-339, 2012.
[7]	D. Bunker, R. Thorpe, "A model for teaching games in the secondary school," Bulletin of Physical Education, n. 10, pages 9-16, 1982.
[8]	G. Kumar, Machine Learning for Soccer Analytics, Cambridge University Press, MSc thesis, KU Leuven, 2013.
[9]	Y. Koren, R. Bell, C. Volinsky, "Matrix factorization techniques for recommender systems," Computer, vol. 42, n. 8, pages 30-37, IEEE 2009.
[10]	Y. Koren, "Collaborative Filtering with Temporal Dynamics," Communications of the ACM, vol. 53, n. 4, pages 89-97, 2010.
[11]	T. Fawcett, "An introduction to ROC analysis," Pattern recognition letters, vol. 27, n. 8, pages 861-874, Elsevier, 2006.
[12]	I. Rish, "An empirical study of the naive Bayes classifier," IJCAI 2001 workshop on empirical methods in artificial intelligence, vol. 3, n. 22, pages 41-46, 2001.
[13]	F. J. Provost, T. Fawcett, R. Kohavi, "The case against accuracy estimation for comparing induction algorithms," proceedings of ICML-98, vol. 98, pages 445-453, 1998.
[14]	F. J. Provost, P. Domingos, "Well-trained PETs: Improving probability estimation trees," Citeseer, 2000.
[15]	J. L. Herlocker, J. A. Konstan, L. G. Terveen, J. T. Riedl, "Evaluating collaborative filtering recommender systems," ACM Transactions on Information Systems, vol. 22, n. 1, pages 5-53, ACM, 2004.
[16]	V. Labatut, H. Cherifi, "Evaluation of Performance Measures for Classifiers Comparison," Ubiquitous Computing and Communication Journal, vol. 6, pages 21-34, 2011.
Štefan Dobravec je leta 2003 magistriral s področja elektrotehnike na Univerzi v Ljubljani. Je asistent na Fakulteti za elektrotehniko. Njegovo področje raziskovanja vključuje uporabniku prilagojene vmesnike, priporočilne sisteme za multimedijske vsebine ter obdelavo sočialnih signalov.