VARSTVOSLOVJE, let. 16 št. 3 str. 362-373 Ravni merjenja: številne posledice preproste ideje Matevž Bren Namen prispevka: Podati temeljit opis ravni merjenja, osnovnega pa vseeno zahtevnega pojma v teoriji merjenja. Raven merjenja spremenljivke ima daljnosežne posledice, tj. glede na zastavljeno raziskovalno vprašanje in preverjano domnevo, izbiro ravni merjenja ustreznih statističnih kazalcev, metod ali preizkusov domnev. Metode: Princip ravni merjenja je opisan in razložen s primeri iz vsakdanjega življenja, iz učbenikov statistike oz. metod raziskovanja ter iz varstvoslovne prakse. Podan je primer izračuna mer srednje vrednosti, ki ustrezajo ravni merjenja spremenljivk, predstavljeni so statistični testi preverjanja domnev o povezanosti pojavov, ki ustrezajo ravni merjenja uporabljenih spremenljivk. Ugotovitve: Težave študentov, pa tudi raziskovalcev pri razumevanju in uporabi zamisli ravni merjenja so razumljive, saj je zamisel dovolj zapletena, pa vseeno osnovna, tako da jo nekateri učbeniki predstavijo mimogrede in bralca ne opozorijo na daljnosežne posledice - raven merjenja spremenljivk določa ustrezne metode analize podatkov ter preizkusov domnev. Izvirnost/pomembnost prispevka: Predstavitev in razlaga ravni merjenja je namenjena študentom in raziskovalcem, da bi že pri zbiranju podatkov upoštevali in načrtovali ustrezne ravni merjenja spremenljivk in s tem preizkuse domnev ter odgovore na zastavljena raziskovalna vprašanja. Podan je načelni napotek, da naj raziskovalec spremenljivke meri na čim višji ravni (saj je v kasnejši analizi korak na nižjo raven merjenja vedno mogoč), da pa mora na drugi strani upoštevati tudi načelo ekonomičnosti, tj. ne zbirati podatkov na višji ravni, če jih za analize ne potrebuje. UDK: 311.1 Ključne besede: ravni merjenja, merska lestvica, mere srednje vrednosti, mere razpršenosti, statistični testi povezanosti Measurement Levels: Numerous Consequences of a Basic Idea Purpose: In the article, a comprehensive description of measurement levels, a basic yet complex principle of measurement theory, is given. A variable's measurement _level has far-reaching consequences as regards a particular research question and 362 Matevž Bren a derived hypothesis, as well as for selection of an adequate statistical indices, methods, or tests. Design/Methods/Approach: The measurement levels' principle is described and explained in terms of everyday examples and examples from statistics textbooks and criminal justice practice. It is illustrated through an example of a central tendency indices' calculation, where all applied indices are in line with the variables' level of measurement. For testing the hypothesis on association, adequate statistical tests which are in concordance with the level of measurement of variables involved are presented. Findings: The measurement levels present a basic yet complex principle; therefore, students'/researchers' difficulties are understandable. In some statistics' text books, this principle is overlooked or described in brief without due emphasis on its far-reaching consequences: the applied statistical indices, methods, and tests must be in line with a variable's level of measurement. Originality/Value: Presenting and explaining the measurement levels will help students and researchers to incorporate variables on the adequate level of measurement in their research planning, so that they will be able to properly test the hypothesis and thereby find the answers to their research questions. A general instruction is given that variables should be measured at the highest level possible (for the analysis, a step down to a lower level is always possible), but on the other side, the parsimony principle demands that the data collection not be performed at a higher level than the one needed for the data analyses. UDC: 311.1 Keywords: measurement levels, measurement scales, indices of central tendency and dispersion, statistical tests of association 1 UVOD Pri razlagi zamisli ravni merjenja imam na dodiplomski stopnji univerzitetnega programa FVV precejšnje težave, kar verjetno pomeni, da razumevanje sicer preproste zamisli ni enostavno. So prepreke samo v zavzetosti poslušalcev -izkušnja izpita me uči, da ne. Seveda ob predpostavki, da so kandidati za izpit pa že visoko motivirani - po moji izkušnji so, le da nekateri to motivacijo usmerijo v vse mogoče in nemogoče načine, kako priti do pozitivne ocene, ne do znanja. Pa sem spet pri predpostavkah: če kandidati svojo zavzetost za pozitivno oceno pri izpitu ustrezno sprostijo v pridobivanju znanja, mi izpitni rezultati kažejo, da razumevanje (sicer preproste zamisli) ravni merjenja ni enostavno: na zadnjih sedmih izpitnih rokih UNI programa so kandidati (156) na uvodno vprašanje o prepoznavanju ravni merjenja od možnih 312 točk s svojimi odgovori zbrali le 171 točk, torej 54,8 %, kar je za (preprosto) uvodno vprašanje seveda (pre)malo. 363 Ravni merjenja: številne posledice preproste ideje Prepričanje, da razumevanje sicer preproste zamisli ravni merjenja ni enostavno, mi potrjujejo tudi izkušnje z raziskovalci, saj pri recenzijah člankov (avtorjev namerno ne navajam, saj tudi imen študentov nisem) lahko naletim na izračun povprečja spola npr. 0,76. Kaj ta številka pomeni? Kako si jo lahko predstavim, razložim, uporabim - saj sta prav razlaga in uporaba pač razloga, da kazalce sploh računamo (in sam izračun kazalca, ne da ga razložimo, nima ne pomena, ne vsebine)! Če sta vrednosti spremenljivke spol 0 - ženski in 1 - moški, gre: povprečje 0,76 je delež moških in je izračun povprečja sicer neprava pot do pravega rezultata - deleža moških. Se pa izračun ne izide, če so izbrane vrednosti spremenljivke npr. spol 1 - ženski in 2 - moški: povprečje je sedaj 1,76 in ne pove oz. prikrije, da je delež moških 0,76. Poudarim, da računanje povprečja za imensko spremenljivko (tj. spremenljivko, merjeno na imenski ravni merjenja, npr. spol) ni ustrezno. Zakaj ga nekateri (raziskovalci) izračunajo? Preprosto, ker se da, računalniški programi to omogočajo, saj »znajo« seštevati števila; klik-klik ... pa je. Toda uporabnik programa je tisti, ki mora vedeti, kaj računa, ne samo, kako mu program to omogoči. S (statističnim) programom lahko izračunamo marsikaj uporabnega, presenetljivega, zapletenega, s klik-klik ... po programu pa tudi kak nesmisel -razmislek in odločitve so vedno in samo v glavi uporabnika. V nadaljevanju bom predstavil ravni merjenja, možne primerjave vrednosti in računske operacije, smiselne na posamezni ravni, ter s tem povezal ravni merjenja z ustreznimi statističnimi kazalci in statističnimi metodami. Predstavitev bom popestril z zgledi iz varstvoslovne prakse in zaključil s kratkim primerom. Kot vedno v življenju, se je za razumevanje osnov vredno potruditi, saj se le na trdnih osnovah da graditi. 2 RAVNI MERJENJA Zato začnem na začetku, z ravnijo merjenja. Tudi v svojem vsakdanu merimo, pravzaprav merimo oz. ocenjujemo kar naprej: 1. moja barva je peščena, predavam na FVV, sodelavka je Jerneja; 2. pridem bolj pozno, delam veliko, kuham ne prav pogosto; 3. prišla je tri ure za menoj; 4. v hladilniku je pet jogurtov, zaslužim trikrat več. V primeru 1) sem poimenoval, 2) primerjal, 3) podal razliko in v 4) preštel. In to so ravni merjenja: 1. imenska, 2. urejenostna, 3. razmična, 4. razmernostna. Ko imamo ustrezno domače poimenovanje, tujk ne uporabljam, so pa za ravni merjenja v slovenski strokovni literaturi pa tudi v učbenikih pogoste (Brvar, 2007; Ferligoj, 1995; Jesenko, 2001), zato jih naštejem: nominalna, ordinalna, intervalna in ratio-lestvica. Zadnje poimenovanje pove, da se hkrati z ravnijo merjenja opredeli tudi: 364 Matevž Bren • merska lestvica kot imenska, urejenostna, razmična ali razmernostna; • spremenljivka, merjena na določeni (izbrani) ravni oz. v določeni lestvici kot imenska, urejenostna, razmična ali razmernostna spremenljivka. Tako je spol imenska spremenljivka, zaslužek pa razmernostna. Naštejem, po ravni merjenja, še nekaj primerov spremenljivk iz strokovnega področja varstvoslovja: 1. imenska: osumljenec, žrtev, kraj kaznivega dejanja; 2. urejenostna: kazniva dejanja (kraja, tatvina, povzročitev lažje telesne poškodbe, povzročitev težje telesne poškodbe, uboj, umor); 3. razmična: čas tatvine - prva ob 9h, druga ob 12h in tretja ob 14h; 4. razmernostna: število prometnih nesreč na območju policijske postaje v določenem dnevu, število kaznivih dejanj v občini v enem mesecu, število zapornikov v Sloveniji na prestajanju zaporne kazni na določen dan ali v določenem letu, materialna škoda ob prometni nesreči. Vrednosti spremenljivk, merjenih na naštetih ravneh, lahko med seboj primerjamo na različne načine in prav v tem dejstvu je bistvo zgodbe, je ideja ravni merjenja. Poglejmo: 1. primerjava na imenski ravni: je oz. ni enako; 2. primerjava na urejenostni ravni: je več, je manj oz. enako; 3. primerjava na razmični ravni: za koliko več oz. manj; 4. primerjava na razmernostni ravni: za koliko-krat več oz. koliko-krat manj. In prav te možnosti primerjanja imajo dolgoročne posledice: iz računskih operacij, ki so smiselne na določeni ravni merjenja, sledijo smiselne uporabe določenih statističnih kazalcev in metod. Torej, katere računske operacije med vrednostmi spremenljivk so smiselne na posamezni ravni merjenja? 1. Imenska raven: smiselno je preštevanje, štetje, koliko je enih, drugih, tretjih ..., 2. urejenostna raven: smiselno je urejanje enot po velikosti, tj. rangiranje, 3. razmična raven: smiselno je seštevanje, odštevanje, 4. razmernostna raven: smiselne so vse računske operacije. In na hitro k vprašanju, na kateri ravni merjenja je smiselno uporabiti povprečje? Povprečje izračunamo s seštevanjem vrednosti spremenljivke na enotah (npr. povprečno število let prestajanja zaporne kazni za kaznivo dejanje posesti in preprodaje drog izračunamo s seštevanjem vrednosti spremenljivke »dolžina zaporne kazni« za posamezne »enote«, tj. za zapornike, obsojene za preprodajo drog) - pomeni, da je povprečje smiselno izračunati samo za spremenljivke, merjene na razmični ali razmernostni ravni merjenja. In to je že nekajkrat napovedana daljnosežna posledica ravni merjenja spremenljivk! Preden zapišem še kaj več o, glede na ravni merjenja, ustreznih statističnih kazalcih in metodah, pa še nekaj dejstev o samih ravneh merjenja. Ravni merjenja so po eni strani (od spodaj navzgor, tj. od imenske k razmernostni) vključujoče: vse kar velja za spodnjo raven, velja tudi za zgornjo in vse nadaljnje, po drugi strani pa izključujoče: računske operacije smiselne na zgornji ravni, so na spodnji brez pomena in zato neuporabne. 365 Ravni merjenja: številne posledice preproste ideje Izključujoče/vključujoče smiselne primerjave po ravneh merjenja lahko zapišem: 1. imenska raven: je oz. ni enako; 2. urejenostna raven: je več, je manj; je oz. ni enako; 3. razmična raven: za koliko več oz. manj; je več, je manj; je oz. ni enako; 4. razmernostna raven: za koliko-krat več oz. koliko-krat manj; za koliko več oz. manj; je več, je manj; in je oz. ni enako. Nazornejša od spiska je tabela primerjanja (tabela 1), ki po ravneh merjenja podaja smiselne primerjave. Ravni merjenja si lahko grafično predstavimo tudi z lestvijo, angl. ladder of measurement (Weisburd in Britt, 2007), vsaka višja raven je predstavljena z višjo prečko na lestvi. Tabela 1: Ravni merjenja in smiselne primerjave vrednosti spremenljivk, merjenih na posamezni ravni Kaj pomeni »interval«? Da so razlike, koraki od ene do naslednje vrednosti spremenljivke enaki. In ker so enaki, je vrednosti smiselno seštevati. Npr. za znano Likertovo lestvico strinjanja 1 - se nikakor ne strinjam 2 - se ne strinjam 3 - sem nevtralen 4 - se strinjam 5 - se popolnoma strinjam ne morem trditi, da so razlike, koraki enaki: da je razlika v mnenju od 1 do 2 enaka kot od 2 do 3? Tako te različno velike korake ni smiselno seštevati (1 + 2 ni 3). Likertova lestvica je urejenostna, ni pa razmična - predstavim si jo lahko kot stopnišče z neenako višino stopnic. Primer razmične spremenljivke pa je npr. čas merjen po koledarju: od 5. do 15. januarja je enako 10 dni, kot od 5. do 15. julija. In tu dneve smiselno seštevamo 10 + 10 = 20 dni (pa čeprav lahko komu počitniški dnevi hitreje minevajo). Razmično lestvico si predstavim kot stopnišče enako visokih stopnic. Kaj pomeni »dejanska ničla«? Dobesedno to, da lestvica merjenja vsebuje vrednost nič in ta vrednost ni »dogovorna«, kot sta npr. ničli pri razmičnih spremenljivkah času (začetek štetja) in temperaturi v stopinjah Celzija (ledišče): • Ničla v merjenju časa je dogovorna, začetek štetja časa, koledar je kulturno pogojen, kristjani so celo štetje začeli z letom ena in ne z letom nič. • Ničla pri merjenju temperature je dogovorna, pri 0 °C (ob normalnem tlaku) voda zmrzne, dejanska ničla pa bi pomenila, »da temperature ni«. Iz srednješolske fizike se morda bralec spomni Kelvinove temperaturne lestvice, ki pa ima dejansko (absolutno) ničlo pri - 273,15 °C. RAVNI MERJENJA kategorije urejenost interval dejanska ničla Imenska X Urejenostna X X Razmična X X X Razmernostna X X X X X v tabeli označuje smiselno primerjavo na določeni ravni merjenja. 366 Matevž Bren Lestvice razmernostnih spremenljivk pa ,dejansko ničlo' vsebujejo: • Jogurtov v hladilniku ni; nič jogurtov. • Če nič ne zaslužim, zaslužim dejansko nič in nimam prihodkov. • Če določen dan na območju policijske postaje ni prometnih nesreč, je število prometnih nesreč enako nič - srečen dan. In le pri razmernostnih spremenljivkah je vprašanje »Koliko-krat več?« smiselno: dvakrat več jogurtov pomeni, da jih je sedaj 10, če jih je bilo prej pet, prav tako je možen trikrat večji zaslužek. Pred časom, ob razpravah za zakonsko opredelitev zajamčene neto plače v Sloveniji, je bil znan slogan »Kako je za vas 6.000 € premalo, če je za nas 600 € preveč?«, ki jasno kaže primerjavo: 10-krat večja plača. Tu seveda novinarsko-bombastična izmišljotina o ,neprimerljivih plačah' ne zdrži. Razjasnim razliko med dejansko in dogovorno ničlo še s primerom iz varstvoslovja (Weisburd in Britt, 2007). Uvrstitev mladostnika med prestopnike ni smiselna že pri prvem srečanju s policijo, pač pa šele pri večjem številu aretacij oz. od nekega števila naprej - npr. do četrte aretacij ne upoštevamo in štejemo mladostnemu prestopniku aretacije od četrte naprej. Na tej lestvici bo prestopnik • A s petimi aretacijami dobil vrednost 1; • B s petnajstimi aretacijami pa vrednost 11. Razlika med prestopnikoma je na novi lestvici 11 - 1 = 10 in je enaka razliki na lestvici dejanskega števila aretacij, to je 15 - 5 = 10. Nova lestvica ni spremenila razlik, saj je razmična. Je pa nova dogovorna lestvica spremenila odgovor na vprašanje »Koliko-krat več?« V dejanski lestvici je bil prestopnik B aretiran trikrat več (3 x 5 = 15), v novi lestvici pa 11-krat več, saj je 11 x 1 = 11. Vidimo, da je nova lestvica razmična, ni pa razmernostna, saj si je socialni delavec ali policist za delo z mladoletniki postavil dogovorno ničlo števila aretacij. Tabela 2: Ravni merjenja in smiselne računske operacije za posamezno V tabeli označuje X smiselno računsko operacijo za računanje z vrednostmi spremenljivk, merjenih na določeni a e ravni merjenja. In sem (že) pri »daljnosežni posledici« ravni merjenja: za vrednosti spremenljivke, merjene na določeni ravni, so smiselne samo izbrane računske operacije (tabela 2) in s tem so določeni tudi kazalci (statistike in parametri), ki jih je za spremenljivko na določeni ravni smiselno računati. Npr. najenostavnejše, povprečje izračunamo s seštevanjem vrednosti spremenljivke na vseh enotah -pomeni, da je povprečje smiselno izračunati samo za spremenljivke, merjene na razmični ali razmernostni ravni merjenja oz. krajše: za razmične in razmernostne spremenljivke. S tem zaključim v uvodu zapisano dejstvo, da računanje povprečja za spol nima pomena. Spol je imenska spremenljivka in za imensko spremenljivko_ 367 RAVNI MERJENJA Preštevanje Rangiranje Seštevanje-odštevanje Vse računske operacije Imenska X Urejenostna X X Razmična X X X Razmernostna X X X X Ravni merjenja: številne posledice preproste ideje je smiselno preštevanje, koliko je enih (žensk) in koliko drugih (moških) in s tem računanje deleža. Pri imenskih spremenljivkah z več možnimi vrednostmi (npr. kraj bivanja, zaposlitev itd.) pa tudi določanje gostiščnice (modus - najpogostejša vrednost). Če raziskujemo demografska vprašanja, nas bo npr. zanimal kraj bivanja in se lahko odločimo za kategorije: mesto, primestje, manjši kraj in vas. Če je večina prebivalstva v obravnavani deželi/državi mestnega, bo gostiščnica mesto in tako nam gostiščnica pove, da je v obravnavani deželi/državi mestno prebivalstvo prevladujoče. Nabor ustreznih statističnih kazalcev na posamezni ravni merjenja je podan v tabeli 3. Tabela 3: Ustrezni statistični kazalci na posamezni ravni merjenja RAVNI MERJENJA Ustrezne opisne statistike Ustrezni preizkus oz. mera povezanosti Imenska frekvence, deleži, gostiščnica X2 test Urejenostna rangi, kvantilni rangi in kvantili (mediana, kvartili, decili ...) Spearmanov koeficient ko-relacije Razmična aritmetična sredina, standardni odklon, kvartilni razmik in odklon, absolutni odklon, va-riacijski razmik Pearsonov koeficient linearne korelacije Razmernostna vsi statistični kazalci Tabela se bere vključujoče: na vsaki višji ravni merjenja so smiselni vsi kazalci nižje ravni. Za pomen kazalcev (rang, kvantilni rangi in kvantili, mediana, kvartili, decili ...), testa X2 in mer povezanosti si oglejte katerega izmed učbenikov opisne in sklepne statistike (Brvar, 2007; Ferligoj, 1995; Košmelj, 2007; Košmelj in Rovan, 2003; Kožuh, 2009, 2013). Zapišem še odstavek o ustreznih merah razpršenosti, saj brez razpršenosti (variabilnosti) ni statistike - pa tudi življenja ne, saj bi bili brez razpršenosti, tj. različnosti vsi enaki in vse enako. Na imenski ravni merjenja ugotovimo lahko samo, da so kategorije (npr. spol: moški-ženski, kraj bivanja: mesto-primestje-manjši kraj-vas) med seboj različne, izračun, za koliko se razlikujejo, pa je smiseln šele na razmični (in razmernostni) ravni merjenja, saj ima le tu seštevanje (in odštevanje) pomen. Zato so mere razpršenosti (standardni odklon, kvartilni odklon, absolutni odklon in variacijski razmik) v tabeli 3 zapisane v razmični ravni merjenja, smiselne pa so seveda tudi za razmernostne spremenljivke. Bralcu v razmislek zapišem še dilemo izračuna povprečne šolske ocene. Na kateri ravni se meri šolska ocena? Zagotovo je raven imenska, tudi urejenostna, saj ocena 4 je višja od 3 in ta od 2. Kaj pa razmična? Je razlika med ocenama 1 in 2 enaka kot med 2 in 3 in ta enaka razliki od 4 do 5? Odgovor je verjetno ne. Zato v nekaterih šolskih sistemih ocene tudi niso številske, pač pa uporabljajo črke (npr. A-F v ZDA). Na urejenostni ravni merjenja pa seštevanje ni smiselna računska operacija in s tem tudi ne računanje povprečja! Ustrezna mera srednje ocene je torej mediana. Pa se povprečne ocene v Sloveniji (in drugod po svetu) računajo od osnovne šole do univerze. Kaj storiti? Očitno nič, saj je uporaba »povprečne 368 Matevž Bren ocene« preveč zakoreninjena. V uteho pa mi je lahko dejstvo, da tudi v ZDA za končno letno oceno izračunavajo »point grade average« (College Board inspiring minds, 2014; Massachusetts Institute of Technology, n. d.), ki ni nič drugega kot povprečje. Na domači strani Massachusetts Institute of Technology (n. d.) je predstavljen preračun ocen A do F v povprečno oceno:1 Grades used in the calculation are weighted as follows: A = 5, B = 4, C = 3, D = 2, F = 0, O = 0. Total all the units of „A" level work and multiply this number by 5. Total all units of „B" level work and multiply by 4 and so on. Add the results and divide by the total number of units. The resulting number is rounded to one decimal place. 3 PRIMER Prispevek zaključim s kratkim primerom tabele podatkov sedmih mladostnikov, ki so imeli opravka s policijo. Zbrali smo podatke: spol, starost, število aretacij od vključno četrte naprej in socio-ekonomski status družine (podatki so izmišljeni). Vrednosti spremenljivk so: • spol: 1 - moški, 2 - ženski; • starost: dopolnjena leta starosti; • število aretacij od vključno četrte naprej: 1 - pet aretacij; 2 - šest aretacij ...; • socio-ekonomski status družine: N - nizek, S - srednji, V - visok. oseba spol socio-ekonomski status družine število aretacij (od četrte naprej) starost O1 1 N 17 21 O2 2 V 2 15 O3 1 N 6 16 O4 1 S 9 17 O5 1 N 7 15 O6 2 N 10 14 O7 1 S 6 15 Gostiščica 1 N 6 15 Mediana N 7 15 Povprečje 8,1 16,1 Tabela 4: Spol, socio-ekonomski status družine, število aretacij od vključno četrte naprej in starost sedmih mladostnikov (podatki so izmišljeni) V našem primeru sedmih mladostnikov izračunani kazalci nimajo posebnega pomena, saj sedem podatkov zlahka pregledamo (glej tabelo 4), vidimo posamezne vrednosti in ,izvemo vse'. Kaj pa, če je oseb 70 ali 700? Kazalci pridobijo pomen, saj nam o obsežni in s tem nepregledni množici podatkov povedo njihovo srednjo vrednost in, če vrednosti niso preveč razpršene (se vrednosti preveč ne razlikujejo), je mera srednje vrednosti zgovoren kazalec. 1 Ker želim poudariti avtentičnost informacije, je tekst najprej zapisan v originalu. Prevod: Ocene, uporabljene v izračunu, imajo naslednje vrednosti: A = 5, B = 4, C = 3, D = 2, F = 0, O = 0. Preštejemo vse 'A' enote in število pomnožimo s 5, nato preštejemo vse 'B' enote in število pomnožimo s 4 in tako naprej. Rezultate nato seštejemo in jih delimo s številom vseh enot. Rezultat zaokrožimo na eno decimalno mesto. 369 Ravni merjenja: številne posledice preproste ideje Poudarim še, da raven merjenja določa tudi ustrezen grafični prikaz: za imensko raven je to tortni diagram, saj prikaže tako deleže kot celoto (glej sliko 1), za urejenostne (in višje) ravni pa je ustrezen histogram (če je spremenljivka zvezna2) in pa prikaz s stolpci (za diskretne številske in urejenostne opisne spremenljivke), saj so vrednosti, prikazane na osi x, urejene od manjše proti večji in jih prepoznavamo po velikosti - jih gledamo od leve proti desni (slika 2). Slika 1: Tortni diagram spremenljivke spol Slika 2: Prikaz s stolpci spremenljivke socio-ekonomski status družine 5 4 N-nižji S-srednji V-visoki Socio-ekonomski status družine 2 Spremenljivke glede na zalogo vrednosti delimo na opisne in številske, pri km pa so številske spremenljivke (spet glede na zalogo vrednosti) zvezne ali diskretne. Diskretna škvilska spremenljivka ima zalogo sestavljenoiz posameznih diskretnihvrednosti (npr. zaloae tzpttntS orertjs 1, 2, ..., SOe ktevilo atetocit je 0,1, 2, ... itddali pair ikjeaval) tj. vrarzatnaštevitd a Osivdsnth mšjaV (npr. ktkrost mladšstnika od 14,00 pa do 2S,ad vtt vMddenrot nesvn ^zmve^ dejan(a odknrrk hivanja osumlaencv ima zalogo vrednosti od 0,0d, če jo tidzstke VeoznSaatoail domala Ov 200.00 km, toeao kazniva dejavja amavena na Olvvenija iia.).Za več podrobnosti si oglejte katerega izmed učbenikov opisne in sklepne statistike (Brvar, 2007; Ferligoj, 1995; Košvelp, Va07tKojmelo'sndovdn, 20ap;Kozuh, 2ahd, a0e3S. 370 Matevž Bren Kaj pa povezanost spremenljivk? Poudarim, da je praviloma glavni motiv in tudi izziv raziskovalcev iskanje povezanosti in še več, odvisnosti pojavov. Iz nedavne preteklosti so nam znani rezultati raziskav, ki so kajenje povezovale s pljučnim rakom, sončenje s kožnim rakom itd. V vseh teh primerih so raziskovalci dokazali le povezanost (korelacijo) med izbranimi spremenljivkami (npr. kajenje in obolevnost za pljučnim rakom), tj. več kadilcev kot nekadilcev je obolevalo - ne pa vzročnosti. Tako je obolevnost za pljučnim rakom višja pri kadilcih, kot nekadilcih, ni pa kajenje povzročitelj pljučnega raka. Kožuh (2009: 94) zapiše poučen primer pozitivne povezanosti dolžine palca in bralnih veščin pri osnovnošolcih - zagotovo pojava nista odvisna, saj dolg palec ne pomaga pri branju in obratno, branje ne podaljša palca; sta pa spremenljivki povezani prek starosti, saj so starejši otroci praviloma večji in bolje berejo (imamo torej eno neodvisno spremenljivko starost in dve odvisni dolžino palca in bralne veščine). Zato je v raziskavah nujno ločiti, ali gre samo za povezanost ali odvisnost opazovanih spremenljivk, kar pa nam ne odkrije noben statistični kazalec oz. metoda, te nam razkrijejo zgolj povezanost. O vsebini, vzročnosti, katera od spremenljivk v raziskavi je odvisna (so odvisne) in katere so neodvisne (napovedne) je razmislek in odločitev raziskovalca. V našem primeru sedmih mladostnikov, katera od spremenljivk je odvisna in katere so neodvisne (napovedne)? Število aretacij je odvisna, ostale, spol, starost in socio-ekonomski status družine pa so neodvisne in povezane z odvisno spremenljivko, npr. izkušnja nas uči, da nižji socio-ekonomski status družine povečuje tveganje prestopništva. Tako si lahko zastavim raziskovalna vprašanja: 1. Ali je število aretacij mladostnika odvisno od starosti? 2. Ali socio-ekonomski status družine vpliva na število aretacij mladostnika? 3. Ali spol vpliva na število aretacij mladostnika? Iz raziskovalnih vprašanj sledijo domneve: 1. Število aretacij je odvisno od starosti mladostnika; starejši prestopnik je večkrat aretiran. 2. Socio-ekonomski status družine vpliva na število aretacij mladostnika; nižji socio-ekonomski status poveča tveganje prestopništva, pomeni več aretacij. 3. Število aretacij je odvisno od spola mladostnika; fantje predstavljajo večje tveganje. S katerimi statističnimi testi lahko preverim te domneve? Odgovor je v tabeli 3. 1. Starost je razmernostna, število aretacij pa razmična spremenljivka; ničelno domnevo, da ni povezanosti med spremenljivkama, preverim s Pearsonovim koeficientom linearne3 korelacije. 3 Pridevnik »linearna« pri Pearsonovem koeficientu korelacije r je bistvenega pomena, saj koeficient z vrednostmi med -1 in 1 izmeri, kako je zveza med spremenljivkama npr. x - starost in y - število aretacij blizu linearni zvezi y = ax + b, kjer je b = y(0) presečišče premice z y-osjo in a smerni koeficient premice, ki pove, za koliko se v povprečju spremeni (za a > 0 poveča ali za a < 0 zmanjša) vrednost y, če se vrednost x poveča za eno enoto. R in a sta primerljiva samo po predznaku. Če govorimo o povezanosti, ima vsebinski pomen r, če pa o odvisnosti, ima vsebinski pomen a! Tako r = 1 oz. r = -1 pove, da je zveza točno linearna, r = 0 pa, da linearne zveze ni. Za več razlage si oglejte katerega izmed učbenikov opisne in sklepne statistike (Brvar, 2007; Ferligoj, 1995; Košmelj, 2007; Košmelj in Rovan, 2003; Kožuh, 2009, 2013). 371 Ravni merjenja: številne posledice preproste ideje 2. Socio-ekonomski status družine je urejenostna, število aretacij pa razmična spremenljivka; ničelno domnevo, da ni povezanosti med spremenljivkama, preverim s Spearmanovim koeficientom korelacije. 3. Spol je imenska, število aretacij pa razmična spremenljivka; ničelno domnevo, da ni povezanosti med spremenljivkama, preverim s x2 testom. Na koncu ponovno poudarim, da statistični testi v primeru, ko ničelno domnevo zavrnem, dajo odgovor, da povezanost med spremenljivkama obstaja. Nikakor pa ne določijo odvisnosti in pa smeri odvisnosti: kaj je vzrok in kaj posledica, kaj je neodvisna in kaj odvisna spremenljivka? Da starost vpliva na število aretacij - pri starejšem mladostniku pričakujem več aretacij (premo sorazmerje) in ne obratno; da socio-ekonomski status vpliva na prestopništvo -nižji socio-ekonomski status praviloma pomeni več aretacij (obratno sorazmerje) in ne obratno, je ocena raziskovalca. In tudi, da starost ali socio-ekonomski status sam po sebi še ni povod za prestopništvo. 4 ZAKLJUČEK Ravni merjenja spremenljivk in ustrezna merska lestvica je ključna izbira že pri zbiranju podatkov, saj mora raziskovalec načrtovati take ravni merjenja spremenljivk, ki mu bodo omogočale ustrezne preizkuse domnev in s tem odgovore na zastavljena raziskovalna vprašanja. Npr. za spremenljivko »starost izpraševancev« raziskovalec lahko zastavi vprašanje o dopolnjeni starosti (ali letnici rojstva) in s tem meri starost na razmernostni lestvici, ali pa poda na izbiro razrede (do 20 let, od 21 do 30, od 31 do 40 in ... nad 60 let) in tako starost izmeri na urejenostni lestvici. Kaj bo izbral, je njegova prosta izbira, pri izbiri pa naj ga vodijo zastavljene domneve in ustrezni preizkusi za preverjanje teh domnev. Načelni napotek je, da naj raziskovalec spremenljivke meri na čim višji ravni, saj je korak na nižjo raven merjenja vedno mogoč (podatke o dopolnjeni starosti zlahka preračunamo v razrede), v obratno smer pa ne. Po drugi strani pa ni smotrno izpraševance obremenjevati z natančnostjo odgovorov, če zbranih podatkov raziskovalec ne uporabi v zbrani obliki, ampak jih druži v skupine oz. razrede. Če sem za opis (sicer) enostavnega pojma - ravni merjenja spisal prispevek na šestih straneh, moram le priznati, da razumevanje tega sicer osnovnega pojma ni povsem enostavno in da so težave študentov (pa tudi raziskovalcev) pri razumevanju in uporabi zamisli ravni merjenja razumljive. Se je pa za razumevanje ravni merjenja vredno potruditi, saj od tod izvirajo spremenljivkam ustrezne metode analize podatkov ter odgovori na domneve in z njimi na raziskovalna vprašanja, ki nas poganjajo od problema do rešitve. Kot vedno v življenju, se nam je za osnove vredno potruditi, saj se le na trdnih osnovah da graditi. UPORABLJENI VIRI Brvar, B. (2007). Statistika. Ljubljana: Fakulteta za varnostne vede. College Board inspiring minds. (2014). How to convert your GPA to a 4.0 scale. Pridobljeno na http://www.collegeboard.com/html/academicTracker-how toconvert.html 372 Matevž Bren Ferligoj, A. (1995). Osnove statistike na prosojnicah. Ljubljana: Samozaložba. Jesenko, J. (2001). Statistika v organizaciji in managementu. Kranj: Fakulteta za organizacijske vede. Košmelj, B. in Rovan, J. (2003). Statistično sklepanje. Ljubljana: Ekonomska fakulteta. Košmelj, K. (2007). Uporabna statistika (2. dop. izd.). Ljubljana: Biotehniška fakulteta. Pridobljeno na http://www.bf.uni-lj.si/fileadmin/groups/2721/ Uporabna_statistika_okt_2007/Uporabna_statistika_01.pdf Kožuh, B. (2009). Statistične metode v pedagoškem raziskovanju. Ljubljana: Znanstvena založba Filozofske fakultete. Kožuh, B. (2013). Knjiga o statistiki. Ljubljana: Znanstvena založba Filozofske fakultete. Massachusetts Institute of Technology. (n. d.). GPA Calculation and Unit Conversion. Pridobljeno na http://web.mit.edu/registrar/gpacalc.html Weisburd, D. in Britt, C. (2007). Statistics in Criminal Justice (3rd ed.). New York: Springer. O avtorju: Dr. Matevž Bren, izredni profesor, je visokošolski učitelj statistike in metod raziskovanja na Fakulteti za varnostne vede Univerze v Mariboru, predstojnik Katedre za družboslovje, humanistiko in metodologijo, pa tudi raziskovalec na Inštitutu za matematiko in fiziko. Njegovi raziskovalni interesi so strah pred kriminaliteto, učinkovitost v izobraževanju, matematična kemija, mere različnosti/ podobnosti, analiza podatkov o mešanicah, teorija sistemov in izobraževanje na daljavo. E-mail: matevz.bren@fvv.uni-mb.si 373