IZ TEORIJE ZA PRAKSO 26 Matematika v šoli, št. 2., letnik 28, 2022 Raziskovalna naloga na Evropskih statističnih igrah: Nasveti za pripravo nalog Dr. Aleš Toman Univerza v Ljubljani, Ekonomska fakulteta Izvleček Evropske statistične igre so mednarodno ekipno tekmovanje, ki spodbuja radovednost in zanimanje za statisti- ko, uporabo uradnih statističnih podatkov, osvajanje dodatnih statističnih znanj in veščin ter skupinsko delo in sodelovanje med mladimi. Na šolski ravni tekmovanja ekipe rešujejo spletni test iz poznavanja statističnih pojmov in podatkov, na državni ravni pripravijo statistično raziskovalno nalogo na osnovi danega podatkov- nega niza, na evropski ravni pa pripravijo videoposnetek, v katerem s pomočjo uradnih statističnih podatkov obravnavajo predpisano temo. Avtor prispevka kot član strokovne žirije že 5 let ocenjuje raziskovalne naloge na državni ravni tekmovanja. V prispevku navaja primere dobre in manj dobre prakse, vse z namenom, da bodo lahko ekipe v prihodnje pripravljale še boljše naloge. Poudarek je na tistih vsebinah, ki so tesno povezane s poukom matematike (izračuni in grafikoni). Kljub temu so zapisani nasveti dovolj splošni, da so uporabni pri vsaki raziskovalni nalogi. Prispevek vključuje tudi kratek opis vseh ravni tekmovanja in spodbuja učiteljice in učitelje matematike k mentoriranju ekip na svojih šolah. Ključne besede: Evropske statistične igre, raziskovalna naloga, analiza podatkov, statistični grafikoni European Statistics Competition: Tips for Preparing Research Papers Abstract The European Statistics Competition is an international team competition that encourages young people to work together and cooperate while using official statistical data and developing their statistical knowledge and skills. At the school level, teams complete an online test on statistical concepts and data; at the national level, they write a research paper based on an actual dataset; and at the European level, they create a video in which they present a given topic using official statistical data. The author is a member of the expert jury and has been evaluating research papers at the national level for five years. The article offers examples of both the best and less effective techniques to help teams produce even better papers in the future. Although the emphasis is on topics directly relevant to mathematics (calculations and diagrams), these broad guidelines adhere to any research paper. The summaries of each competition stage further encourage math professors to mentor school teams. Keywords: European Statistics Competition, research paper, data analysis, statistical graphs. 1 Opis tekmovanja Evropske statistične igre so mednarodno ekipno tekmovanje sre- dnješolcev, ki ga organizirajo statistični urad Evropske unije Eu- rostat in nacionalni statistični uradi sodelujočih držav z name- nom, da bi med mladimi spodbudili zanimanje za statistiko in uporabo podatkov uradne statistike ter s tem prispevali k dvigu statistične pismenosti v Evropi (https://www.esc2022.eu). Prve Evropske statistične igre so potekale v šolskem letu 2017/18. T ek- movanje se vselej odvija v dveh fazah, prva faza je nacionalna in poteka v nacionalnih jezikih sodelujočih držav, druga faza pa je evropska in poteka v angleškem jeziku. Popularnost iger raste tako v Sloveniji kot tudi v Evropi. Ker je tekmovanje v celoti izve- deno preko spleta, je lahko nemoteno potekalo tudi v času epide- mije. O tekmovanju in uspehu ekipe Teglzarože 1 iz leta 2021 sta članici ekipe skupaj z mentorico že poročali v reviji Matematika v šoli (Rauter Repija in drugi, 2021). 1 Imena ekip si tekmovalke in tekmovalci izberejo sami. Imena članic in članov ekip niso objavljena. IZ TEORIJE ZA PRAKSO 27 Matematika v šoli, št. 2., letnik 28, 2022 1.1 Nacionalna faza tekmovanja Slovenija na Evropskih statističnih igrah sodeluje že od same- ga začetka, nacionalno fazo tekmovanja organizira Statistični urad Republike Slovenije (SURS) v sodelovanju s Statističnim društvom Slovenije (https://www.stat.si/igre). Nacionalna faza tekmovanja se deli na šolsko in državno raven. Na obeh ravneh dijakinje in dijaki tekmujejo v stalnih največ tričlanskih ekipah v dveh starostno ločenih tekmovalnih skupinah, in sicer • v kategoriji A dijakinje in dijaki zadnjih dveh letnikov srednih šol (16–18 let), • v kategoriji B pa dijakinje in dijaki prvih dveh letnikov sre- dnjih šol (14–16 let). Na šolski ravni tekmovanja ekipe odgovarjajo na 3 sklope po 10 vprašanj izbirnega tipa. • Sklop a) preverja osnovno znanje statistike. • Sklop b) preverja poznavanje in uporabo uradnih statističnih virov. • Sklop c) preverja razumevanje izbrane Eurostatove publikaci- je s statističnimi podatki. Šolsko tekmovanje poteka v obliki spletnega testa in traja pri- bližno 2 tedna, ekipe pa lahko na vprašanja odgovarjajo v po- ljubnem tempu in zaporedoma na več napravah (v šoli, dijaškem domu, doma …). Sodelujoči na šolski ravni tekmovanja lahko osvojijo bronasto priznanje. Najuspešnejše ekipe se uvrstijo na državno raven tekmovanja. Tam prejmejo obsežen podatkovni niz, na osnovi katerega pri- pravijo statistično raziskovalno nalogo, ki jo oceni strokovna žirija. Ekipe so povsem samostojne pri izbiri raziskovalne teme, vprašanj, hipotez, podmnožice podatkov ter metod dela. Časa za pripravo naloge imajo približno 4 tedne, nalogo nato v ocenjeva- nje oddajo preko spletnega obrazca. Sodelujoči na državni ravni tekmovanja lahko osvojijo srebrno ali zlato priznanje. 1.2 Evropska faza tekmovanja V evropsko fazo tekmovanja se iz vsake sodelujoče države uvr- stita po 2 (prvo leto tekmovanja pa 3) najuspešnejši ekipi iz vsa- ke starostne skupine. Organizator tekmovanja izbere temo, nato vsaka ekipa pripravi videoposnetek, v katerem s pomočjo ura- dnih statističnih podatkov na zanimiv način obravnava izbrano tematiko. Vsebino predstavijo v največ 2 minutah, temu sledi še največ 10 sekund za navedbo virov. Videoposnetek je lahko v na- cionalnem ali angleškem jeziku, obvezno pa mora biti opremljen z angleškimi podnapisi. Ekipe skupaj z videoposnetkom preko spletnega obrazca oddajo še spremljevalni dokument, v katerem na največ 4 straneh opišejo postopek priprave videoposnetka. Časa za pripravo obeh datotek imajo približno 6 tednov, nato da- toteki po vnaprej znanem kriteriju oceni mednarodna strokovna žirija. Sodelujoči v evropski fazi tekmovanja lahko osvojijo pokal ali priznanje. 1.3 Namen prispevka Ekipe na državni ravni tekmovanja pripravijo izredno zanimive in kakovostne raziskovalne naloge, najvišje uvrščene naloge pa vsako leto SURS objavi na svoji spletni strani. Objavljene izdelke posebej pozorno pregledajo prihodnje generacije tekmovalk in tekmovalcev, saj v njih iščejo ključ do visoke uvrstitve na državni ravni tekmovanja. A tudi v najboljših nalogah se najdejo napa- ke in nespretnosti. V upanju, da se te zaradi objave nalog ne bi širile, sodelavci SURS in člani Statističnega društva pripravljajo izobraževanja za ekipe in njihove mentorice in mentorje. T emu je namenjen tudi ta prispevek. Predstavljeni zgledi izhajajo iz razi- skovalnih nalog, ki so jih ekipe pripravile v obdobju 2018−2022. Čeprav nekateri nasveti izhajajo iz priročnika Making Data Mea- ningful (2009), so v prispevku opisana predvsem lastna opažanja. 2 Podatkovni niz in raziskovalno vprašanje Državna raven tekmovanja se prične, ko SURS ekipam posre- duje podatke, na osnovi katerih pripravijo raziskovalne naloge. Podatki so shranjeni v Excelovi datoteki z več listi, numerične vrednosti pa so zapisane v tabeli, kjer stolpci predstavljajo spre- menljivke, vrstice pa geografske enote. Vrednosti so najpogosteje dane na ravni 212 slovenskih občin, v dodatnih listih pa so lahko podane še agregirane vrednosti za 12 statističnih regij in Slove- nijo kot celoto. V nadaljnjih listih Excelove datoteke ekipe najde- jo metapodatke ter prostorski šifrant. Metapodatki so podrobni opisi spremenljivk, prostorski šifrant pa kodna tabela, ki jo ekipe potrebujejo, saj so geografske enote v tabeli s podatki določene s kodami in ne imeni. V letu 2020 so imele ekipe na voljo kar sto spremenljivk, a so vse opisovale družine v Sloveniji v točno določenem trenutku. Leto kasneje je bilo spremenljivk skoraj pol manj, a so ekipe imele na voljo vrednosti vsake spremenljivke v 5 zaporednih letih, zato so lahko tematiko okolja v Sloveniji spremljale skozi čas. Prva naloga vsake ekipe je, da dane podatke zelo natančno preuči in razišče njihovo kompleksno strukturo. Le tako si lahko zastavijo ustrezna raziskovalna vprašanja in kasneje pripravijo ustrezne izračune (Slika 1). Slika 1: Klasifikacija družin. Razumevanje medsebojne povezanosti 12 spremenljivk (tipov družin) omogoča računanje ustreznih deležev. Vseh spremenljivk ni mogoče uporabiti v eni raziskovalni nalogi, ekipa mora zato izbrati natanko tiste, ki ustrezajo postavljenemu raziskovalnemu vprašanju. Podatkovni niz preučijo tudi člani strokovne žirije in zato lahko preverijo ustreznost posamezne izbire. Ekipe lahko uporabljajo le podatke danega podatkovnega niza. Uporaba dodatnih podatkov ni dovoljena in vodi v diskva- IZ TEORIJE ZA PRAKSO 28 Matematika v šoli, št. 2., letnik 28, 2022 lifikacijo. Lahko pa ekipe iščejo dodatne metapodatke ali ideje za pripravo naloge (Slika 2). Prav tako lahko uporabljajo poljubne vire pri učenju statistične analize, dela z računalnikom in izde- lavi predstavitve. Slika 2: Podatek o količini vode, uporabljeni v procesu izdelave enega avtomobila (zgoraj), v podatkovnem nizu ni bil na voljo. Ker pa je služil kot zanimivost in ne kot informacija za nadaljnje analize, uporaba podatka ni sporna. Vir: Deadsirius (2021). Čeprav vse ekipe analizirajo iste podatke in je njihov vir iz kon- teksta povsem jasen, SURS ob uporabi podatkov izrecno zahte- va navedbo vira, pri čemer je dovolj že zapis Vir: SURS. Kadar ekipe podatke še naprej preračunavajo (združevanja, povprečja, deleži), je pravilen še pripis Lastni izračuni. Vir praviloma nava- jamo tudi ob tabelaričnih in grafičnih prikazih podatkov. 3 Elementi raziskovalne naloge Pravila za nacionalni del tekmovanja določajo, da ekipe svoje delo predstavijo na največ 8 prosojnicah, ki jim lahko sledita največ 2 prosojnici z metodološkimi pojasnili. Vsaka naloga mora vsebovati uvodno prosojnico in zaključek, pri ostalih 6 prosojnicah pa imajo ekipe proste roke. Žirija ima pri ocenje- vanju na voljo le prosojnice, zato je pomembno, da je z njih raz- vidno logično zaporedje vsebin, zlasti kadar je na eni prosojnici prikazanih več analiz. Ekipe lahko urejenost (pa tudi jasnost in razumljivost) nalog preverijo tako, da ob prosojnicah pripravijo predavanje za mentorja ali prijatelje. Pri tem bodo hitro ugoto- vile, ali so na pravem mestu zapisale vse potrebne informacije. 3.1 Uvodna prosojnica Uvodna prosojnica obvezno vsebuje ime ekipe, šole, statistične regije in navedbo starostne kategorije. Preostali prostor na uvo- dni prosojnici lahko ekipa izkoristi za informativen naslov nalo- ge ter privlačno grafiko, ki lahko prispeva k razumevanju naloge. Pri uporabi slikovnega gradiva pazi, da ne krši avtorskih pravic in da v nalogi navede ustrezne vire. Uvodna prosojnica je prvi stik bralca z raziskovalno nalogo, zato se jo splača čim bolj pre- mišljeno izkoristiti (Slika 3). 3.2 Cilji in hipoteze Na drugi prosojnici ekipe običajno navedejo cilje in hipoteze. Hipoteze niso obvezne, če jih ekipa zapiše, pa morajo biti jasne, argumentirane in zapisane pred analizo podatkov. Nedoločene hipoteze je bolje nadomestiti z navedbo ciljev (Slika 4). Cilji po- magajo ustvariti pregledno strukturo naloge. Pravila ne zahte- vajo, da so cilji zbrani na drugi prosojnici. Ekipa se zato lahko odloči, da cilje preplete s statistično analizo. Zaželjeno je, da si ekipe zastavijo glavni (primarni) cilj, ki dolo- ča zgodbo raziskovalne naloge, nato pa navedejo še sekundarne cilje, s katerimi postopoma dosežejo glavni cilj. Pri številu ciljev naj ekipe upoštevajo, da imajo na voljo 8 prosojnic. Količina ana- liz, ki jih lahko prikažejo, je zato omejena. Tudi sekundarni cilji so lahko dovolj splošni, da so zapisani kratko in jedrnato. Čeprav je cilj zapisan splošno, so lahko z njim povezane ugotovitve veli- ko bolj podrobne. 3.3 Statistični kazalniki Ko so cilji določeni, lahko ekipe v podatkovnem nizu poiščejo ustrezne podatke in se lotijo analize. Večina podatkov je rezultat preštevanja (število prebivalcev, gospodinjstev …), zato po vre- dnostih med regijami običajno izstopa osrednjeslovenska (Slika 5), med občinami pa Ljubljana. Ker regije in občine niso enako velike, je pred primerjavo treba opraviti ustrezne preračune. Statistični kazalnik je iz danih podatkov izvedena (izračunana) spremenljivka, ki omogoča primerjavo različnih geografskih enot. Če sta števili zaposlenih in brezposelnih oseb odvisni od velikosti občine ali regije, je stopnja brezposelnosti kazalnik, s Slika 3: Uvodna prosojnica ekipe Statisti1 (zgoraj) poleg obveznih sestavin vsebuje še osrednje raziskovalno vprašanje, tri slike pa kažejo okoljske vidike, ki jih v nadaljevanju obravnava ekipa. Pri uvodni prosoj- nici ekipe Lnmstorm (spodaj, ime in logotip šole sta zakrita) je nesrečna izbira pisave močno otežila branje. Vir: zgoraj Statisti1 (2021), spodaj Lnmstorm (2020). IZ TEORIJE ZA PRAKSO 29 Matematika v šoli, št. 2., letnik 28, 2022 katerim je mogoče primerjati občine ali regije med seboj. Pri izbiri kazalnikov si ekipe lahko pomagajo s pregledovanjem spletnih strani SURS. Če uporabijo standardni kazalnik, lahko izračunane vrednosti primerjajo s tistimi, ki jih objavi SURS, in preverijo ustreznost izračunov 2 (Slika 6). Pri izbiri kazalnikov je ekipa lahko zelo izvirna, paziti mora le, da so vsi izračuni dobro dokumentirani (Slika 7). 3.4 Metode dela Uporabljene metode dela morajo biti skladne z ravnjo izobrazbe ekipe. Torej lahko ekipe uporabijo vse znanje opisne statistike iz srednješolskih učbenikov. Dovoljeni so kakršnikoli preračuni ali tabelacije. Če vrednosti statističnih kazalnikov ekipe prikažejo še grafično, nimajo nikakršnih omejitev pri uporabi klasičnih grafi- konov ali modernejših infografik (Slika 6 in Slika 8). Slika 4: Primer presplošnih (zgoraj levo) in ustrezno argumentiranih (spodaj) hipotez. Hipoteze, ki navajajo le izbrana leta in konkretne vrednosti (zgoraj desno), dajejo vtis, da so bile pripravljene po analizi podatkov. Vir: zgoraj levo 20in20 (2020), zgoraj desno Kapljice (2022), spodaj Plan_xy (2021). Slika 5: Neinformativen prikaz absolutnih vrednosti. V osrednjeslo- venski regiji živi približno četrtina prebivalcev Slovenije, zato so tam vrednosti demografskih spremenljivk običajno najvišje. Vir: Teglzarože (2020). Slika 6: Število vodovodnih ali kanalizacijskih priključkov na 100 gos- podinjstev sta statistična kazalnika. Zapisana ugotovitev nas preseneti. Ekipa je spregledala, da v večstanovanjskih stavbah več gospodinjstev uporablja isti priključek na javni vodovod oziroma kanalizacijsko omrež- je. Vir: Kamni (2021). 2 Možna so manjša odstopanja, če SURS v standardnem kazalniku uporabi podatek za dan, ki v podatkovnem nizu ni na voljo. Ekipe imajo na primer na voljo podatke o številu prebivalcev na začetku leta, SURS pa v standardnem kazalniku uporabi število prebivalcev na sredini leta. IZ TEORIJE ZA PRAKSO 30 Matematika v šoli, št. 2., letnik 28, 2022 Težave lahko nastopijo pri bivariatni statistiki (povezanost dveh spremenljivk). Ekipe pogosto izračunajo in interpretirajo kore- lacijski koeficient, pri čemer se ne zavedajo, da je to zgolj mera linearne povezanosti. Povezanost med dvema spremenljivkama lahko učinkoviteje preučijo in opišejo z razsevnim grafikonom. Včasih razsevni grafikon razkrije, da je preučevana zveza neline- arna ali trivialna (Slika 9). Večja težava je uporaba linearne regresije. Prileganje premice množici točk je vsebina, ki jo srednješolci poznajo iz fizike, kljub temu pa izračun in interpretacija determinacijskega koeficienta (R 2 ) običajno spadata med visokošolske statistične vsebine. Tam študenti spoznajo potrebne okoliščine, v katerih je uporaba re- gresije ustrezna (Slika 10). Uporabo metod, ki jih ekipe ne razu- mejo dovolj dobro, odsvetujemo. Najbolj sporna je uporaba sklepne statistike (statistični testi), ki je v kontekstu tekmovanja nepotrebna. S sklepno statistiko razi- skovalci ugotovitve, do katerih so prišli na vzorcu, posplošijo na celotno populacijo. Podatkovni niz pa ni vzorec, temveč vsebuje Slika 7: Opis izračuna in interpretacija zapletenega statističnega kazal- nika. Vir: Marreb (2021). Slika 8: Infografika prikazuje povprečne mesečne neto plače po dejavnostih v Sloveniji 2020. Raziskovalna naloga je vsebovala tudi legendo upora- bljenih grafik. Vir: Avengers (2022). Slika 9: Pearsonov korelacijski koeficient, ki je izjemno blizu vrednosti 1, lahko nakazuje, da je preučevana zveza trivialna; v regijah z veliko prebivalci živi veliko otrok. Vir: Teglzarože (2020). Slika 10: Enostavna linearna regresija predpostavlja linearno povezanost spremenljivk (levo). Uporaba regresije pri deležih (desno) ni nujno smisel- na. Prilegana premica zavzame tudi negativne vrednosti, ki pri deležu niso možne. Vir: zgoraj Gimvel (2020), spodaj Latte (2022). IZ TEORIJE ZA PRAKSO 31 Matematika v šoli, št. 2., letnik 28, 2022 podatke za prav vse enote populacije. Še huje je, če so rezultati sklepne statistike napačno interpretirani (Slika 11). 3.5 Izračuni O matematičnih napakah v statističnih izračunih sem že pisal (Toman, 2022). Napake se nanašajo predvsem na računanje pov- prečij iz povprečij. Poglejmo si namišljen zgled, ki hkrati pojasni dve napaki. Preučevana regija naj ima le dve občini, v katerih je skupaj zaposlenih 5 oseb. Tabela 1 prikazuje podatke o njihovih neto plačah v izbranem mesecu ter pripadajoča občinska pov- prečja. Tabela 1: Podatki o plačah v izbranem mesecu v dveh namišljenih občinah. Občina A Občina B Oseba Neto plača Oseba Neto plača Andrej 1680 € Bojan 1760 € Ana 1920 € Barbara 1848 € Branko 2464 € Povprečje 1800 € Povprečje 2024 € Kako izračunamo povprečno mesečno neto plačo v regiji? Za pravo vrednost seštejemo plače vseh 5 zaposlenih in vsoto delimo s 5, torej . Ekipe tako podrobnih podatkov nimajo na voljo, zato velikokrat izračunajo povprečje objavljenih občinskih povprečij , kar je narobe. Do pravilnega rezultata lahko pridejo, če objavljeni povprečji ustrezno utežijo sorazmerno s številom zaposlenih v posamezni občini . Enaka zako- nitost velja tudi pri združevanju deležev. V občini A delež žensk med zaposlenimi znaša 50 %, v občini B pa 33,3 %. S prešte- vanjem hitro ugotovimo, da je delež žensk med zaposlenimi v regiji enak . Če izračunamo le povprečje občinskih deležev , dobimo napačen rezultat. Do prave vrednosti lahko pridemo z uporabo uteženega povprečja . Zaradi pogostosti te napake so v za- dnjih letih nekatera regionalna povprečja ali deleži na voljo v podatkovnem nizu in jih ekipam ni treba izračunati (ali pa za ustrezen izračun niti nimajo na voljo dovolj podatkov). Izračunane vrednosti morajo ekipe tudi ustrezno interpretirati in zapisati ugotovitve. Interpretacija ni zgolj ubesedenje številk. Slika 11: Uporaba statističnih programov lahko privede do izračunov, ki presegajo srednje- šolski okvir statistike. Posledično so možne napačne interpre- tacije. Vrednost Sig. (2-tailed) je narobe interpretirana. Vir: Statisti (2018). Slika 12: Ekipa na zapleten način sporoča, kar enostavno povzame za- dnja zapisana poved. Več ugotovitev ekipe je nakazovalo na težave pri razumevanju partnerjev brez otrok. V ta tip družine spadajo tudi pari, katerih otroci so se že osamosvojili. Vir: Yobama (2020). IZ TEORIJE ZA PRAKSO 32 Matematika v šoli, št. 2., letnik 28, 2022 Čeprav so opisi spremenljivk pogosto dolgi in birokratski, mo- rajo biti ugotovitve zapisane v obliki preprostih in pravilnih po- vedi (Slika 12). Izrazi, kot so odpadna regija, obrobna občina …, so lahko za prebivalce žaljivi. Tudi zapisom najbolj izobražena regija ali pa največ odpadkov proizvede regija se izogibamo. Izo- bražujejo se in odpadke proizvajajo ljudje v regijah in ne regije. Zaključimo še s opozorilom pri opisovanju sprememb. Če koli- čina odpadkov naraste z 10 ton na 11 ton, rečemo, da se je povi- šala za 10 %. Če stopnja brezposelnosti naraste z 10 % na 11 %, rečemo, da se je povišala za 1 odstotno točko. 3.6 Grafični prikazi T udi o prikazovanju podatkov sem že pisal (T oman, 2022). Ekipe z grafikoni primerjajo regije (ali občine) ali pa prikažejo dina- Slika 13: Kompleksen prikaz s stolpčnim grafikonom omogoča primerjavo enostarševskih družin po regijah (skupki stolpcev), spolu starša (barva) in izobrazbi starša (zasičenost barve). Izobrazba je urejenostna (ordinalna) spremenljivka – višja zasičenost barve ustreza višji stopnji izobrazbi. Spol je imenska (nominalna) spremenljivka – ker vrednosti nista urejeni, je uporabljena enaka zasičenost barve. Vir: Frekvenca9 (2020). Slika 14: Stolpčni in tortna grafikona imajo odvečno tretjo dimenzijo. Pri stolpcih je zato težko določiti njihovo višino, tortna grafikona pa poudarita (a ne tu) tiste vrednosti, ki so prikazane v ospredju. Na sliki je moteče tudi ozadje, ki oteži branje in stilsko posnema grafične prikaze podatkov. Vir: Številopi (2018). miko pojava v času. Kadar prikazujejo vrednosti številske spre- menljivke po regijah, najpogosteje izberejo stolpčni ali vrstični grafikon. Možna nerodnost pri takšnem grafikonu je izbira vr- stnega reda regij. Abecedni vrstni red ali pa urejenost po kodah, ki jih uporablja SURS, običajno nista primerna (Slika 5 in Slika 17). Ker želijo primerjati regije med seboj, je grafikon nazornej- ši, če so regije urejene po naraščajočem ali padajočem vrstnem redu prikazane spremenljivke. Odločitev o vrstnem redu je težja, če ekipa s stolpci prikazuje več spremenljivk hkrati (Slika 13). Urejenost naj bo tedaj taka, da čim bolj podpre trditve, ki so za- pisane v ugotovitvah. Stolpčni grafikoni morajo biti dvorazsežni (Slika 14). Pri prikazovanju prostorske razporeditve vrednosti spremen- ljivk ekipe pogosto uporabijo tematske karte. Pri tem je vsaka geografska enota na zemljevidu pobarvana v skladu s položajem IZ TEORIJE ZA PRAKSO 33 Matematika v šoli, št. 2., letnik 28, 2022 Slika 15: Primerjava geografskih enot s pomočjo tematske karte je zah- tevnejša, kadar je geografskih enot veliko (zgoraj) ali pa je na isti karti prikazanih več spremenljivk (spodaj). Vir: zgoraj No1liga (2022), spodaj Amaterji (2020). Slika 16: Dinamika pojava je lahko prikazana s stolpčnim ali črtnim grafikonom. Kombinacija obeh je koristna, kadar spremenljivki nimata podobnih vrednosti ali istih enot. Vir: Kalamari (2021). Slika 17: Primerjava regij je lažja, če so urejene padajoče glede na prikazano spremenljivko. Ker med regijami ni logičnih povezav, uporaba črtnega grafikona ni primerna. Grafikon uporablja dve navpični osi, pri tem oznake na desni osi niso povsem usklajene z vodilnimi črtami. Vir: Ekotistiki (2019). Slika 18: Polarni grafikon je poseben primer črtnega grafikona, pri katerem mora biti smiselna tudi povezava prve in zadnje vrednosti. Pri regijah to ne drži. Vir: Llama (2020). njene vrednosti spremenljivke v barvni lestvici. Na eni karti je možno s kombinacijo barv in drugih elementov prikazati več spremenljivk, a je tak prikaz za bralca zahteven (Slika 15). Kadar ekipe prikazujejo spreminjanje vrednosti ene ali več spre- menljivk v času, najpogosteje izberejo črtni grafikon. Pri tem je pomembno, da so razmiki na vodoravni osi sorazmerni dolži- nam časovnih intervalov (soroden primer je prikazan na Slika 19). Opomnimo, da lahko ekipe časovno dinamiko pojava pri- kazujejo tudi s stolpci (Slika 16), vrednosti po regijah pa nikoli s črtnim grafikonom, saj črte, ki povezujejo zaporedne regije, nimajo pomena (in Slika 18). IZ TEORIJE ZA PRAKSO 34 Matematika v šoli, št. 2., letnik 28, 2022 Slika 19: Pregled vodoravne osi razkrije, da časovna obdobja niso enako dolga. Višine stolpcev v različnih obdobjih zato niso primerljive, linearni trend je neustrezen. V prikazu najdemo še vsebinsko napako, saj grafikon v resnici prikazuje razvrstitev trenutnih stanovanj po letu izgradnje. Vir: Možganci (2019). Slika 20: Histogram prikazuje porazdelitev občin glede na odstotno spremembo količine odpadkov. Razredi so matematično označeni, vendar niso enako široki. V večini občin se izboljšuje odnos do okolja, ker pa se občine razlikujejo po številu prebivalcev, je preštevanje občin lahko zavajajoče. Vir: Gimvel (2021). Za konec omenimo še razliko med stolpčnim grafikonom in hi- stogramom. Na vodoravni osi stolpčnega grafikona so nanešene vrednosti (ali kategorije), ki niso povezane. Stolpci so zato ločeni s praznim prostorom. Na vodoravni osi histograma pa so enako široki razredi številske (numerične) spremenljivke. Višine stolp- cev so frekvence razredov; te povedo število enot v posameznem razredu (Slika 20 in Slika 21). 3.7 Ugotovitve in zaključki Podrobne ugotovitve je najbolje zapisati na prosojnici, na kateri je prikazana ustrezna analiza. Na zadnji vsebinski prosojnici lah- ko ekipe glavne ugotovitve povzamejo in jih interpretirajo v kon- tekstu zastavljenih ciljev. Če ekipa na začetku postavi hipoteze, je na koncu treba vsako hipotezo ovrednotiti. Kriteriji ocenjevanja spodbujajo razmislek o omejitvah podatkovnega niza. O tem razmišlja in poroča le malo ekip. Pri pregledovanju ugotovitev in zaključkov žirija ponovno pregleda celotno nalogo in preveri, ali so bili vsi zastavljeni cilji doseženi (vsak cilj mora imeti svoj za- ključek) in ali je vsaka ugotovitev podprta z vmesnimi izračuni. 3.8 Prikazi izračunov Raziskovalne naloge morajo biti ponovljive. Avtorji nalog mora- jo zato navesti dovolj informacij, da lahko bralci, ki razpolagajo s podatki, ponovijo vse izračune in preverijo vse trditve, ki so zapisane v nalogi. Da tehnične podrobnosti ne zameglijo vsebine analize, sta ekipam na voljo dodatni prosojnici za predstavitev izračunov. Natančnost in izčrpnost sta tu pomembnejši od este- tike. Zaželjeno je, da ekipe v opisih uporabljajo imena spremen- ljivk, kot so na voljo v podatkovnem nizu (Slika 22). IZ TEORIJE ZA PRAKSO 35 Matematika v šoli, št. 2., letnik 28, 2022 Slika 21: Prebivalstvena piramida je posplošitev histograma. Ker so starostni razredi stični, prostor med vrsticami ni potreben. Različno široki razredi so bili določeni v podatkovnem nizu, razred 30−49 je na sliki neustrezno označen. Vir: 20in20 (2020). Slika 22: Opis izračunov v opisni (zgoraj) in matematični (spodaj) obliki. Oba opisa omogočata ponovitev opravljene analize. Vir: zgoraj Koale (2021), spodaj Lnmstorm (2020). Zaključek V šolskem letu 2021/22 so se uspešno zaključile 5. Evropske statistične igre. Kljub mladosti je tekmovanje po- pularno, znano in priznano v Sloveniji in Evropi in je uspešno premagalo vse ovire, ki jih je prinesla epidemija. Slovenske ekipe se skoraj vedno uvrstijo med najboljše v Evropi, kar utrjuje prepričanje, da smo na pravi poti, in nam daje neizmerno motivacijo za nadaljnje korake. Poleg tekmovalnih uspehov pa Evropske statistične igre prinašajo še spodbudo mladim in njihovim mentoricam in mentorjem k pridobivanju novih statistič- nih (in interdisciplinarnih) znanj in preučevanju naravnih in družbenih pojavov. Tekmovanje s tem vzgaja odgovorne in mednarodno vpete državljanke in državljane, ki znajo svoje odločitve in mnenja oblikovati in podpreti s pomočjo podatkov uradne statistike. Več informacij o aktualni izvedbi iger je na voljo na naslovih https://www.stat.si/igre in statigre.surs@gov.si. IZ TEORIJE ZA PRAKSO 36 Matematika v šoli, št. 2., letnik 28, 2022 Viri in literatura Rauter Repija, I. in Godec, M.; Karas, T., in Štampar, N. (2021). Evropske statistične igre. Matematika v šoli 27(2), str. 45−51. Toman, A. (2022). Evropske statistične igre in spodbujanje statistične pismenosti pri matematiki. Zbornik 1. mednarodne konference o poučevanju matematike, fizike in astronomije, str. 72–78. Dostopno na https://www.dmfa.si/_CmsFiles/2022/08/zbornik-1-konferenca- -dmfa-2022.pdf Making Data Meaningful (2009). Part 2: A Guide to Presenting Statistics. United Nations Economic Commission for Europe. Dostopno na http://www.unece.org/fileadmin/DAM/stats/documents/writing/MDM_Part2_English.pdf 20in20 (2020). Ali se Slovenci odločamo za družinsko življenje? Dostopno na https://www .stat.si/StatW eb/File/DocSysFile/10877/20IN20. pdf Amaterji (2020). Izobrazba v slovenskih družinah. Dostopno na https://www.stat.si/StatWeb/File/DocSysFile/10879 Avengers (2022). Trg dela, Slovenija 2020. Dostopno na https://www.stat.si/StatWeb/File/DocSysFile/11827 Deadsirius (2021). Voda. Dostopno na https://www.stat.si/StatWeb/File/DocSysFile/11341 Ekotistiki (2019). Analiza stanovanjske problematike v Sloveniji. Frekvenca9 (2020). Slovenija, dežela ločitev in visoke izobrazbe? Dostopno na http://www.stat.si/StatWeb/File/DocSysFile/10883 Gimvel (2021). Ali je Slovenija res tako čista država? Dostopno na https://www.stat.si/StatWeb/File/DocSysFile/11346 Kalamari (2021). Odpadki v Sloveniji. Dostopno na https://www.stat.si/StatWeb/File/DocSysFile/11347 Kamni (2021). Uporaba in pridobivanje voda v letu 2018. Dostopno na https://www.stat.si/StatWeb/File/DocSysFile/11348 Kapljice (2022). Ali na zaposlitev v gospodarskih dejavnostih vplivajo migracije ter višina plače ali je ravno obratno? Dostopno na https://www.stat.si/StatWeb/File/DocSysFile/11834 Koale (2021). Dostopno na https://www.stat.si/StatWeb/File/DocSysFile/11349 Latte (2022). Ali je Slovencem pomembnejši čas ali denar? Dostopno na https://www.stat.si/StatWeb/File/DocSysFile/11837 Llama (2020). Družine v Sloveniji. Dostopno na https://www.stat.si/StatWeb/File/DocSysFile/10886 Lnmstorm (2020). Družine v Jugovzhodni Sloveniji 2018. Dostopno na https://www.stat.si/StatWeb/File/DocSysFile/10887 Marreb (2021). Primerjava statističnih regij glede na odnos do okolja. Dostopno na https://www.stat.si/StatWeb/File/DocSysFile/11350 Možganci (2019). Dostopno na https://www.stat.si/StatWeb/File/DocSysFile/10382 No1liga (2022). Neenakost med delovno aktivnim prebivalstvom v Sloveniji. Kje v Sloveniji je najbolje delati? Dostopno na https://www. stat.si/StatWeb/File/DocSysFile/11840 Plan_xy (2021). Kako Slovenci ravnamo z vodo? Dostopno na https://www.stat.si/StatWeb/File/DocSysFile/11353 Statisti (2018). Analiza statističnih podatkov po občinah v Sloveniji za Evropske statistične igre Statisti1 (2021). Slovenija = Ekološka? Dostopno na https://www.stat.si/StatWeb/File/DocSysFile/11356 Številopi (2018). Evropske statistične igre 2018. Teglzarože (2020). Slovenske družine. Dostopno na http://www.stat.si/StatWeb/File/DocSysFile/10893 Y obama (2020). (Zunaj)zakonski partnerji, njihova izobrazba ter otroci. Dostopno na http://www.stat.si/StatW eb/File/DocSysFile/10896