DR. MARIJAN BLEJEC STATISTIČNE METODE ZA PSIHOLOGE LJUBLJANA 1959 DR. MARIJAN BLEJEC IZR. PROF. ZA STATISTIKO NA EKONOMSKI FAKULTETI V LJUBLIANI STATISTIČNE METODE ZA PSIHOLOGE LJUBLJANA 1959 ZALOŽILA; UPRAVA ZA POSREDOVANJE DELA LR SLOVENIJE Priročnik je izdelan po predavanjih iz statističnih metod za psihologe, ki jih je v juniju 1957 za psihologe okrajnih poklicnih posvetovalnic organiziral Sekretariat za delo LRS. Namen tečaja, ki sem ga vodil, in priročnika, ki sem ga napisal, je seznaniti psihologa-praktika s sodobnimi statističnimi metodami, s posebnim poudarkom na praktično uporabo. Zaradi tega ni slučaj, da je v priročniku 147+ 12 praktičnih primerov in da je vsak postopek, če je le bilo možno, ilustriran s primerom. Iz istega razloga je za reševanje nekaterih problemov danih več alternativnih rešitev z opisom, kdaj je prikladnejša ena ali druga rešitev. Primeri so bili vzeti predvsem iz gradiva DAT srednješolske mladine v LRS, ki ga je dal na razpolago Zavod za proučevanje organizacije dela in varnosti pri delu LRS. Nekaj primerov sem vzel tudi iz gradiva o raziskovanju zaznavanja barv in likov predšolske mladine, ki ga je dal na razpolago tov. France Kovač, psiholog v Poklicni posvetovalnici v Kranju. Obema se na tem mestu zahvaljujem za pomoč, ki sta mi jo s tem nudila. Dr. Marijan Blejec Ljubljana, oktobra 1957. •• /• /• / O MASOVNI POJAVI 01. Masovni pojavi Pojavi v družbi in prirodi ne nastopajo posamič, temveč v velikem številu, ne izolirano, pač pa se medsebojno povezujejo in vplivajo drug na drugega. Take pojave imenujemo masovne pojave. Z masovnim pojavom razumemo istovrsten pojav, ki v času in prostoru množično nastopa. Po tej definiciji je masoven pojav na primer človek, kmetijsko gospodarstvo, poizkus, ki ga večkrat izvajamo pod istimi pogoji, in tako dalje. Zaradi specifičnosti masovnih pojavov se je razvila posebna metoda proučevanja masovnih pojavov — statistika, ki se bistveno razlikuje od drugih metod proučevanja pojavov. Statistika se je razvila v vedo, ki s kvantitativnim proučevanjem masovnih pojavov s specifičnimi metodami odkriva kvalitativne zako¬ nitosti teh pojavov. Ker imamo opravka z masovnimi pojavi v najrazličnejših pod¬ ročjih, je statistika postala važno orodje proučevanja v velikem številu znanosti, med drugimi tudi v psihologiji. 02. Populacija. Enota V mnogih primerih raziskovalca ne zanima ena sama oseba, niti vse človeštvo, temveč določena skupina ljudi, ki ima neke skupne karakteristike. To skupino enolično določimo tako, da povemo, katere osnovne značilnosti mora imeti posa¬ mezna oseba, da je član te skupine. Enako postopamo v vseh primerih masovnih pojavov. Skupnost elementov, ki zadoščajo nekim osnovnim — opredeljujočim pogojem, imenujemo statistično maso — populacijo, posamezne elemente populacije pa enote populacije. Primer 1. Kot populacijo moremo smatrati učence četrtega razreda gimnazij v LRS na dan 31. marca 1957. Enota te populacije je vsaka oseba, kije bila 31. mar¬ ca 1957 dijak četrtega razreda katerekoli gimnazije v LRS. Opredeljujoči pogoji 5 . te populacije pa so: vsebinski: oseba mora biti četrtošolec; krajevni: oseba mora biti v LRS; časovni: oseba mora biti četrtošolec v LRS na dan 31. marca 1957. Točno fiksiranje datuma je potrebno zaradi nedvoumne opredelitve; iz populacije izpadejo vsi tisti četrtošolci, ki so eventualno izstopili iz šole pred 31. marcem 1957 ali vstopili po tem datumu. Primer 2. Kot drugi primer populacije moremo vzeti vsa testiranja osnovno¬ šolskih otrok, izvedena v letu 1956 v Ljubljani s testom mehanskih zmožnosti. Enota populacije je posamezno testiranje. Opredeljujoči pogoji populacije pa so: vsebinski: testiranje osnovnošolskih otrok z mehanskim testom; krajevni: Ljubljana; časovni: leto 1956. 03. Znaki Razen z opredeljujočimi pogoji je posamezna enota populacije karakterizirana z nizom značilnosti, ki jo opisujejo. Tako so značilnosti, ki karakterizirajo posamezno osebo, na primer: starost, spol, šolska izobrazba, poklic, število točk, ki jih je oseba dosegla pri določenem testu, čas, v katerem je izvršila nalogo, ki jo določa gornji test, številka čevljev, ki jih nosi, in tako dalje. Značilnosti, ki karakterizirajo določeno osebo, je nešteto. Čim več značilnosti te osebe je znanih, tem bolje jo poznamo. Vendar nas pri konkretni raziskavi ne zanimajo vse značilnosti. Katere od njih so važne, je odvisno od problema, ki ga proučujemo. Če izdelujemo testne norme zmožnosti, nas zanimajo dosežki pri testu, prav nič pa ne, kakšno številko čevljev ima testirana oseba. Obratno nas pri analizi velikosti nog za potrebe čevljarske industrije zanima številka čevljev posameznih ljudi, prav nič pa ne, koliko točk je anketirana oseba dosegla pri testiranju besednih zmožnosti. Izmed vseh možnih značilnosti izberemo in opazujemo v vsakem primeru one, ki so v zvezi z vsebino in ciljem raziskovanja. Te značilnosti imenujemo s skupnim imenom statistični znaki. Primer 3. Pri DAT (diferencialnem testiranju zmožnosti) srednješolske mla¬ dine v LRS 1957. leta smo opazovali naslednje znake: spol, razred in število doseženih točk pri posameznem izmed sedmih različnih testov. Vsak statistični znak ima določeno število vrednosti Tako ima znak spol dvoje možnih vrednosti: moški, ženski; znak stan štiri: samski, poročen, razveden, ovdovel; starost v letih okrog sto različnih vrednosti; število doseženih točk pri danem testu vsa cela števila med najnižjim in najvišjim možnim številom točk, in tako dalje. Posamezna enota je karakterizirana z eno izmed možnih vrednosti znaka. Karakte¬ ristično za znake je, da ima po pravilu vsaka enota drugo vrednost znaka. Osebe, ki smo jih testirali, so različno stare, pri testu so dosegle različne dosežke in tako dalje. 6 Pravimo, da znaki variirajo. To lastnost znakov imenujemo variabilnost znakov. Enote populacije variirajo v vseh znakih z izjemo opredeljujočih pogojev. Znaki dajo statističnim enotam in populaciji vsebino in masovne pojave pro¬ učujemo in analiziramo s pomočjo proučevanja in analiziranja statističnih znakov. Zaradi tega sta izbira znakov in tudi način analize znakov izredno važna. Od tega je namreč odvisno, ali bo raziskovanje dalo odgovor na vprašanja, zaradi katerih je bilo izvedeno. 03.1 Vrste znakov Znake delimo po vsebini v tri skupine: krajevne, časovne in stvarne. Krajevni znaki so vsi znaki, ki so v zvezi s krajem, kjer se enota nahaja ali se je nahajala, časovni so v zvezi s časom, ko se je zgodil kak dogodek, ki je za enoto važen (na primer čas rojstva), vsi drugi znaki pa so stvarni. V psihologiji pridejo kot predmet proučevanja v poštev predvsem stvarni znaki. Vrednosti nekaterih stvarnih znakov izražamo z besedami (n. pr. spol: moški, ženski; socialna skupina: delavec, kmet, uslužbenec itd.; mnenje o določenem problemu: popolnoma soglasen, soglasen, indiferenten, se ne strinja, nasproten). Take znake imenujemo atributivne za razliko od numeričnih, katerih vrednosti izražamo s števili (n. pr. starost, število doseženih točk, čas testiranja itd.). Numerične znake delimo glede na to, ali morejo na številčni premici zavzeti na danem intervalu vse ali samo nekatere vrednosti na zvezne — kontinuirne (n. pr. starost, čas reševanja naloge) in nezvezne — diskontinuirne (n. pr. število otrok v družini, število pravilno rešenih nalog). Zvezni znaki morejo teoretično zavzeti vse vrednosti na nekem odseku številčne premice. Vendar se glede na potrebe in zmožnosti merjenja v praksi običajno usta¬ vimo pri določeni natančnosti. Tako merimo na primer višino učencev v cm, čas v sekundah ali minutah itd., čeprav bi teoretično mogli čas in višino meriti tudi natančneje. Pri tem računamo vse učence, katerih višina je med 95,50 cm in 96,50 cm kot 96 cm visoke. Vrednosti znaka se pri tem »zaokroževanja« spremene v nezvezen niz 90 cm, 91 cm, 92 cm, 93 cm ... Te vrednosti predstavljajo vse vrednosti v inter¬ valih enega centimetra in ne samo eno vrednost. Enaka situacija je pri vseh zveznih numeričnih znakih. Čeprav bi mogli teoretično vrednosti zveznih numeričnih znakov določati poljubno natančno, se glede na potrebe in zmožnosti merilnih instrumentov vedno zaustavljamo pri dani natančnosti, pri kateri vrednosti zaokrožujemo in enačimo v okviru tega zaokroževanja. Vse vrednosti takega elementarnega intervala karakteriziramo z vrednostjo, ki leži v sredini tega intervala. Glede na to, ali želimo, da so zaokrožene vrednosti ali meje elementarnih inter¬ valov okrogla števila, je zaokroževanje vrednosti zveznih znakov dvojno. Tako 7 moremo formirati razred 90,50 cm do 91,50 cm z vrednostjo 91 cm kot karakte¬ ristično vrednostjo, ali po celih centimetrih razred od 90,00 cm do 91,00 cm z 90,50 kot karakteristično vrednostjo. Pri konkretnih primerih je treba pri uporabi za¬ okroženih vrednosti paziti, ali je bil pri zaokroževanju upoštevan prvi ali drugi princip. Nezvezni znaki morejo zavzeti samo nekatere, običajno cele vrednosti na številčni premici. Medtem ko so zvezni znaki navadno rezultat merjenja, so nezvezni znaki običajno rezultat preštevanja. Število pravilno rešenih nalog more biti 0, 1, 2, 3, ..., število otrok v družini 0, 1, 2, ..., ne pa neka vmesna vrednost. Iz tehničnih razlogov obdelave statističnih podatkov običajno teoretično vza¬ memo, da so tudi vrednosti nezveznih znakov razporejene na zvezni številčni premici. Pri tem koordiniramo vsaki vrednosti nezveznega znaka interval enotine širine, tako da je vrednost nezveznega znaka v sredini enotinega elementarnega intervala. Tako smatramo, da vrednost 1 reprezentira vse vrednosti na intervalu 0,5 do 1,5, vrednost 2 vse vrednosti na intervalu 1,5 do 2,5 in tako dalje. S tem da smo elementarnim intervalom zveznih znakov dali sredino razreda kot karakteristično vrednost in vrednostim nezveznih znakov enotin elementarni interval okrog te vrednosti, smo zvezne in nezvezne znake glede na obdelavo izenačili. Značilnost numeričnih znakov je številčna oblika vrednosti. Ta lastnost je s stališča kvantitativne obdelave velikega pomena, ker moremo vrednosti numeričnih znakov med seboj primerjati, iskati razlike in z njimi vršiti najrazličnejše računske operacije. Ne najmanjša prednost je tudi ta, da moremo vrednosti numeričnih znakov enolično razvrstiti po velikosti. Vseh teh lastnosti atributivni znaki nimajo. Razlik med njimi ni možno izražati tako kot pri numeričnih, ker so vrednosti dane z besedami. Enako v splošnem ne moremo vrednosti atributivnih znakov razporediti v enoličen vrstni red po velikosti in tako dalje. To pa ne velja strogo za vse atributivne znake. Nekateri atributivni znaki imajo numerično osnovo, kljub temu da jih izražamo z besedami. Tak znak je na primer znak pogostost, ki jo lahko izra¬ žamo bodisi numerično s številom, kolikokrat se je dogodek zgodil, ali atributivno z vrednotenjem: nikoli, včasih, redno, pogosto in vedno. Ta znak, čeprav izražen atributivno, ima lastnost, da moremo njegove vrednosti razvrstiti po velikosti, ker je njegova osnova numerična. Tudi znak stopnja šolske izobrazbe je možno razvrstiti po velikosti v stopnje: brez šolske izobrazbe, nedokončana osnovna šola, dokončana osnovna šola, nedokončana nižja srednja šola, dokončana nižja srednja šola, ne¬ dokončana višja srednja šola, dokončana višja srednja šola, nedokončana visoka šola in dokončana visoka šola. Razvrstitev je možna, ker je v osnovi stopnje šolske iz¬ obrazbe dolžina šolanja, ki pa je numeričen znak. V psihologiji nastopa veliko število znakov, katere smatramo kot atributivne in izražajo večkrat zelo abstraktne 8 pojme, kot so na primer: ubogljivost, pridnost, poštenost, državljanska zavest, kvaliteta umetniškega dela, smešnost šale, inteligenca, zmožnost, zbranost pri delu, spomin, prilagodljivost in tako dalje. Za vse te znake je težko reči, ali so atributivni ali numerični, ali jih je sploh možno definirati. Običajno jih izražamo atributivno, vendar s prilastki: sploh ne, bolj, manj, čisto, zelo, malo, in tako dalje, kar pa so tipično numerični prilastki. Poleg tega je vrednosti teh znakov za konkretne primere težko določiti in je mnenje o teh stopnjah zelo subjektivno. Vendar je možno, kot bomo videli kasneje, tem znakom pod določenimi predpostavkami dati numerični izraz in jih torej moremo šteti tudi med čisto numerične znake. 03.2 Grupiranje vrednosti znakov Število vseh možnih vrednosti precejšnjega števila znakov je za pregledno pri¬ kazovanje preveliko. V teh primerih sorodne vrednosti grupiramo v grupe, posamezna grupa pa služi kot nova vrednost znaka. Grupirati moremo tako atributivne kot numerične znake. Vse vrste delavskih poklicev moremo na primer grupirati v grupo, ki ji damo vrednost znaka »delavec«, vse vrste uslužbencev v grupo, ki jo zazna¬ mujemo z »uslužbenec«, in tako dalje. Tako atributiven znak z ogromnim šte¬ vilom vrednosti z grupiranjem prevedemo v znak z razmeroma majhnim številom vrednosti. S tem sicer trpi preciznost, preglednost pa je boljša. Sorodnost med vrednostmi numeričnih znakov je dana z razliko. Tako sma¬ tramo, da je na primer vrednost »dva člana družine« sorodnejša vrednosti »trije člani družine« kot pa vrednost »šest članov družine«. Grupe numeričnih znakov imenujemo razrede. Vsak razred ima svoj razredni interval, to je interval, v katerem so vse vrednosti razreda. Spodnja in zgornja meja razreda sta vrednosti, med katerima leže vse vrednosti razreda, a nobena vrednost drugega razreda. Sredina razreda je vrednost, ki leži točno v sredini razrednega intervala in je reprezentant vseh vrednosti razreda, širina razreda pa je merjena z velikostjo razrednega intervala. Ako zaznamujemo z x kymin spodnjo mejo splošnega razreda, ki ga imenujmo razred k, z x kmax pa zgornjo mejo istega razreda, izračunavamo sredino razreda x k po obrazcu _ x k,min + x k ,max , t Xk - ( 1 ) 2 širino razreda i k pa po obrazcu 'k X k,max x k,min (2> Če ni drugega posebnega vsebinskega razloga, formiramo razrede z enakimi širinami. Razredi z enakimi širinami imajo pri obdelavi in analizi podatkov veliko prednost. 9 Meje serije razredov z enakimi širinami i dobimo enostavno s sukcesivnim prištevanjem širine razreda spodnji meji najnižjega razreda po obrazcu X k + 1 .min *k,min r i (3) serijo sredin razredov pa enako, če sukcesivno prištevamo širino razreda sredinam razredov, začnemo pa s prvim razredom. Ta postopek je nakazan v obrazcu x k +i=x k +i (4) Grupacija vrednosti znaka mora biti taka, da vsaka vrednost pade v en in en sam razred. Primer 4. Grupe nezveznega znaka »dosežene točke pri testiranju« so takele: Širina vseh razredov je enaka, zato smo dobili meje razredov in sredine razredov s sukcesivnim prištevanjem i= 5 posameznim vrednostim. Sredina prvega razreda je na primer jCi = 2 ; x t — -j- i = 2 -j- 5 = 7 x,= x 2 + i — 7+ 5= 12; itd. Paziti pa je treba, da širina razreda v našem primeru ni 4 — 0=4, temveč 4,5 — (—0,5) = 5, ker so meje razredov zaradi enotinih intervalov okrog nezveznih vrednosti —0,5, 4,5, 9,5, 14,5 ... Primer 5. Kot primer grupiranja zveznega znaka vzemimo »čas rešitve dane naloge«. Vzemimo najprej, da je čas zaokrožen na minute. V nadaljevanju so na¬ vedeni za isto grupacijo trije načini. Minute so zaznamovane z '. Prvo vprašanje je, kako je bil čas zaokroževan. Če je bil zaokroževan kot pravimo »polovico navzgor in navzdol«, pomeni 9' vse čase med 8'31" in 9' 30", če pa je bil zaokroževan na iz¬ polnjene minute, pa 9' pomeni vse čase med 9'00" in 9'59". V zaokroževanju je torej bistvena razlika. Vzemimo, da smo v našem primeru zaokroževali čas po drugem principu — principu izpolnjenih minut. Zaradi tega so možne s temi podatki na¬ slednje grupacije A B C 5' do 10' 10' do 15' 15' do 20' 20' do 25' 5'do 9' 10' do 14' 15' do 19' 20' do 24' 5' do pod 10' 10' do pod 15' 15' do pod 20' 20' do pod 25' Prva grupacija je nepravilna, ker se razredi prekrivajo, in ne zadošča pogoju, da mora vsaka vrednost pasti v en sam razred. Tako na primer čas 15'35" pade 10 istočasno v drugi in tretji razred. Grupaciji B in C sta enaki, le da sta pisani v raz¬ ličnih oblikah. Prva predpostavlja poznavanje sistema zaokroževanja na minute, medtem ko to v drugem primeru ni potrebno. Širina razredov je enaka za vse razrede in je ■*-l ,max -*•! ,min ^ b ^ ^ sredine razredov pa dobimo takole: Xl= 5 f-°-= 7'30"; x 2 = 7'30"+ 5'= 12' 30"; x 3 = 17' 30" ... 2 Ob tej priliki je treba opozoriti, da navedene grupacije ne bi mogli sestaviti, če bi bilo zaokroževanje časov izvedeno po alternativnem sistemu. Če bi bili časi dani na sekunde natančno, bi bile iste grupacije časa takele: 5'00" do 9'59" 10'00" do 14'59" 15'00" do 19'59" 20' 00" do 24' 59" 5'01" do 10'00" 10'01" do 15'00" 15'01" do 20'00" 20'01" do 25'00" Da so razredi enako široki, vidimo iz serije mej, ki se v vseh primerih enakomerno večajo za 5'. Ker imajo statistični znaki v statistiki isti značaj in vlogo kot spremenljivke v matematiki, jih označujemo s simboli x, y, z in tako dalje. 11 1 UREJEVANJE PODATKOV 11. Urejevanje numeričnih podatkov 11.0 Frekvenčna distribucija Podatki statističnega opazovanja, to je anketiranja, masovnega testiranja in podobno, so dani v nepregledni obliki individualnih podatkov. Te rezultate imamo dane bodisi na individualnih obrazcih za vsako enoto posebej ali pa za več ali vse enote populacije na enem — kolektivnem obrazcu. Pregled nad temi podatki dobimo šele, ako jih uredimo. Ena izmed običajnih oblik urejenih podatkov je frekvenčna distribucija. V frekvenčni distribuciji so po vrsti napisane posamezne vrednosti znaka, ki v populaciji nastopajo, poleg njih pa dane frekvence, to je število enot, ki imajo dano vrednost znaka. Frekvenco zaznamujemo na splošno s /. Kadar je število vseh vrednosti znaka, ki v populaciji nastopajo, veliko, individualne vrednosti znaka zamenjamo z razredi, frekvence pa v tem primeru pomenijo število enot, ki imajo vrednosti v ustrezajočih razredih. Število razredov frekvenčne distribucije ne sme biti niti preveliko niti premajhno. Če je število razredov preveliko, je frekvenčna distribucija nepregledna, razen tega pa ne pridejo do izraza osnovne značilnosti pojavljanja vrednosti. Premalo razredov pa ima za posledico, da se značilnosti pojavljanja vrednosti zabrišejo. Število razredov frekvenčne distribucije vzamemo v praksi od 10 do 20, odvisno od tega, kako velika je populacija in v kakšne namene frekvenčno distribucijo formiramo. Primer 6. V četrtem razredu postojnske gimnazije je bilo testiranih s testom mehanskega presojanja 20 dijakinj. Dosegle so naslednje število točk: Tabela 1. Število doseženih točk pri testiranju mehanskih odnosov 20 četrtošolk postojnske gimnazije 33 26 13 11 19 16 29 21 41 12 28 30 14 15 18 13 34 13 32 23 Podatki, ki so vpisani v tabeli 1 po abecednem redu dijakinj, so nepregledni. V fre¬ kvenčni distribuciji moremo te podatke pisati v urejeni obliki. 12 Tabela 2. Frekvenčna distribucija 20 rezultatov testiranja dijakinj postojnske gimnazije s testom mehanskega presojanja točke . 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 frekvenca. 1 1 3 1 1 1 — 1 1 — 1 — 1-1 — 1 1 1 točke . 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 frekvenca. — 1 1 1----- 1--- Frekvenčna distribucija individualnih vrednosti znaka v tabeli 2 je dolga in zaradi tega nepregledna. Poleg tega so frekvence majhne in ne pride do izraza značilnost pojavljanja. Če tvorimo razrede po pet vrednosti, dobimo preglednejšo obliko fre¬ kvenčne distribucije. Tabela 3. Frekvenčna distribucija 20 rezultatov testiranja mehanskih odnosov dijakinj postojnske gimnazije N = 20 Vsota vseh frekvenc je enaka skupnemu številu enot populacije, ki ga zazna¬ mujemo z N (numerus). Vrednosti populacije so v tabeli 3 dane v preglednejši obliki kot v tabeli 2, izgubili pa smo informacijo o vrednostih znaka znotraj razredov. Vemo le, da ima na primer sedem enot vrednosti med 11 in 15 točk, ne vemo pa točne vrednosti teh sedmih enot. V tej situaciji običajno predpostavimo, da so vrednosti znotraj razredov po raz¬ rednem intervalu razporejene enakomerno ali da imajo vse enote enega razreda isto vrednost — sredino razreda. Bolj se približa stvarnosti prva predpostavka, druga pa je ugodnejša za računske operacije s frekvenčnimi distribucijami. Primer 7. V sliki 1 so v prvi vrsti pod a) vrisane stvarne vrednosti podatkov iz tabele 1. V drugi vrsti pod b) so vrisane individualne vrednosti pri predpostavki enakomerne razporeditve v razredih. V tretji vrsti pod c) pa je nakazana razporeditev pod predpostavko, da vse vrednosti leže v sredini razredov. Iz slike vidimo, da se razporeditev b) veliko bolj približuje stvarnemu stanju a) kot razporeditev c). 13 Ar "COCa-IO T 1 ' ■«/ lili! b OOOOOOO Q O Q Q_O O O O O O O O __O toč/: I -H-15 | - 16-20 j 21-25 26-30 I 31-35 | 36-40 | 41 -45 | Slika 1. Razmestitev 20 rezultatov testiranja zmožnosti mehanskega presojanja dijakinj postojnske gimnazije pri različnih predpostavkah: a) dejanska razmestitev, b) enakomerna razmestitev v razredih, c) enake vrednosti v razredih 11.1 Metode sestavljanja frekvenčnih distribucij Tehnično moremo iz osnovnih podatkov sestaviti frekvenčno distribucijo na več načinov. Po metodi črtkan j a sestavimo frekvenčno distribucijo po naslednjih točkah: a) sestavimo obdelovalno tabelo, v kateri pustimo vsakemu razredu določeno polje; b) podatke vnašamo v obdelovalno tabelo tako, da za vsako vrednost včrtamo v ustrezajoči razred črtico; c) ko smo tako vnesli v obdelovalno tabelo vse po¬ datke populacije, črtice v posameznih razredih preštejemo in jih vpišemo kot frekvence. Da si olajšamo končno štetje črtic, tvorimo grupe po pet črtic po nasled¬ njem sistemu: 7 H-L- Primer 8. Tabela 4. Sestavljanje frekvenčne distribucije rezultatov testiranja iz tabele 1 po metodi črtkanja JV= 20 14 Po metodi sortiranja listkov sestavimo frekvenčno distribucijo tako, da: a) individualne listke s podatki za posamezne enote po vrednostih znaka razdelimo v grupe, b) listke v posameznih grupah preštejemo in dobimo frekvence razredov. Metodo črtkanja uporabljamo pri majhnih populacijah in pri manj komplici¬ ranih obdelavah. Pri tem načinu so namreč velike možnosti pomot, ki jih moremo popraviti edino s ponovno obdelavo. Zaradi tega večkrat večje populacije razdelimo v manjše dele, vsak del posebej obdelamo, rezultate pa na koncu združimo v fre¬ kvenčno distribucijo populacije. Vendar je za večje populacije in bolj komplicirane obdelave priporočljivejši drugi način, pri katerem je možnost odkrivanja pomot večja. 11.2 Distribucija relativnih frekvenc Absolutne frekvence so odvisne od tega, na kateri razred se nanašajo, in od velikosti populacije. Da odstranimo vpliv velikosti populacije na frekvenco, izraču¬ navamo relativne frekvence, ki v obliki koeficientov /°, odstotkov /7» ali promilov /°/oo pokažejo, koliki del vrednosti populacije leži v posameznem razredu. Relativne frekvence izračunavamo glede na to, katero od zgornjih oblik iščemo, po obrazcih /° = - (5); f°lo = 100 — (6); /•/„■= 1000- (7) N N N Relativne frekvence omogočajo zelo dobro primerjavo populacij z različnim številom enot. Primer 9. Tabela 5. Distribuciji absolutnih in relativnih frekvenc za rezultate testiranja računskih zmožnosti dečkov in deklic četrtega razreda gimnazij v LR Sloveniji (DAT LRS 1957) 15 Relativne frekvence so bile izračunane, kot kaže primer: 3 100 -= 22,0 = /°/, 1631 Isti rezultat bi bil pisan v obliki koeficienta /° = 0,220, v promilih pa /°/oo = 220. 11.3 Grafično prikazovanje frekvenčnih distribucij 11.31 Histogram. Poligon. Frekvenčne distribucije moremo grafično pri¬ kazovati na dva načina: s histogrami in poligoni. S histogramom grafično prikažemo frekvenčno distribucijo tako, da drugega poleg drugega rišemo stolpce — pravokotnike, katerih višina je v sorazmerju s frekvenco v razredih. Širina stolpcev je za distribucije, katerih razredi so enako široki, enaka. S poligonom pa prikažemo frekvenčno distribucijo tako, da nad sredino posa¬ meznega razreda napravimo točko, kije od abscise oddaljena v sorazmerju s frekvenco. Če te točke med seboj povežemo, dobimo lomljeno črto ■— poligon, ki dobro po¬ nazori razmestitev vrednosti znaka populacije. Poligon bolje prikazuje razmestitev vrednosti kot histogram, ker predpostavlja znotraj razredov razmestitev, ki je realnejša kot enakomerna razmestitev, ki jo ima za osnovo histogram. Na oba načina moremo prikazovati tako distribucije absolutnih kot relativnih frekvenc. Primer 10. f 16 Slika 2. Histogram frekvenčne distribucije za rezultate testiranja računskih zmožnosti deklic četrtega razreda gimnazij v LRS Za primerjavo več frekvenčnih distribucij so poligoni prikladnejši kot histo¬ grami. Primer 11. Iz slik 3 in 4 vidimo, da grafikon relativnih frekvenc bolje ponazarja odnose in razlike med populacijami kot grafikon absolutnih frekvenc. Slika 3. Frekvenčna poligona absolutnih frekvenc rezultatov testiranja računskih zmožnosti četrtošolcev v LR Sloveniji Slika 4. Frekvenčna poligona relativnih frekvenc rezultatov testiranja računskih zmožnosti četrtošolcev v LR Sloveniji 2 — Statistične metode 17 11.32 Oblike frekvenčnih distribucij. Frekvenčna distribucija je prikaz variiranja znaka, variacija pa je rezultat individualnih faktorjev, ki vplivajo na posamezne enote. Ti vplivi so najrazličnejši in imajo za posledico različne oblike frekvenčnih distribucij za posamezne znake. Oblika frekvenčne distribucije je prav posebno razvidna iz grafičnega prikaza. Ne da bi se spuščali v analizo bomo navedli nekaj karakterističnih oblik frekvenčnih distribucij. Kot idealno frekvenčno distribucijo smatramo normalno distribucijo (sl. 5a), ki ima v statistiki posebno važno vlogo in jo bomo še podrobneje obravnavali. Zanjo rečemo, da je unimodalna, ker ima samo en vrh, simetrična, ker enako in enakomerno pada od sredine v obe smeri, in zvonasta. Za razliko od nje imamo bimodalne (sl. 5b), polimodalne (sl. 5c), če ima dva ali več vrhov, asimetrične v levo (sl. 5d) ali desno (sl. 5 e), če se frekvence vlečejo v eno smer bolj kot v drugo. Frekvenčne distribucije imajo zvonasto, J (sl. 5 f) ali U (sl. 5 g) obliko, glede na podobnost z zvonom ali črkami J ali U. Izmed teh treh so zelo pogoste zvonaste, manj J-distribucije, najmanj pa U-distribucije. V primerjavi z normalno krivuljo, ki jo smatramo kot idealno, imamo še koničaste (sl. 5 h) in sploščene (sl. 5 i) distribucije. Vzroki, da nastopi ena ali druga oblika, so najrazličnejši: nehomogena populacija ima za vzrok lahko tako asimetrijo kot polimodalnost, okrnjeno delovanje določenih faktorjev ima za posle¬ dico asimetričnost ali J obliko, in tako dalje. a / ntn-malng b/ b/modalna c/ polimodalna Slika 5. Različne oblike frekvenčnih distribucij 11.4 Kumulativna frekvenčna distribucija Iz frekvenčne distribucije moremo izpeljati kumulativno frekvenčno distribucijo F po nas'ednjem postopku: a) V najnižji razred vpišemo 0, ker je kumulativa tega razreda vedno 0. 18 b) Kumulativo drugega razreda dobimo, če vrednosti kumulative prvega raz¬ reda 0 prištejemo frekvenco prvega razreda. To kumulativno vrednost vpišemo v koloni kumulativ v drugi razred. Kumulativno vrednost tretjega razreda dobimo, če kumulativni vrednosti drugega razreda prištejemo frekvenco drugega razreda. S sukcesivnim prištevanjem frekvenc kumulativam nadaljujemo do konca frekvenčne distribucije. Zadnji člen kumulativne frekvenčne distribucije je po vrednosti enak N in pade v vrsto »skupno« frekvenčne distribucije. To je obenem kontrola pravilnega izračunavanja kumulative. Princip izračunavanja členov kumulativne distribucije moremo opisati v obliki obrazca F k+ i = Fk + fk (8) Pri tem pomeni F k in F k + , Ar-ti in A -j- 1-ti člen kumulative, f k pa k -ti člen frekvenčne distribucije. Posamezni členi kumulative povedo, koliko enot v populaciji ima vrednost znaka, ki je manjša kot spodnja meja razreda, na katerega se kumulativa nanaša. Primer 12. Da vidimo postopek izračunavanja kumulativne serije, bomo na¬ kazali izračunavanje kumulativ za eno izmed frekvenčnih distribucij iz tabele 5. Tabela 6. Izračunavanje kumulative iz frekvenčne distribucije rezultatov testiranja računskih zmožnosti četrtošolcev v LR Sloveniji Točke fk F k f k — F k+i Šesti člen kumulativne serije F c = 460 pomeni, da je od 1167 skupno testiranih četrtošolcev 460 doseglo manj kot 16,5 oziroma v celih vrednostih 16 ali manj točk. Enako moremo sklepati tudi za druge člene. Kumulative moremo v primeru, da jih računamo na računski seštevalni stroj z registrirnim trakom, računati zelo enostavno s sukcesivno uporabo »subtotala«. 19 11.5 Grafično prikazovanje kumulativnih serij Podobno kot smo s poligoni prikazali frekvenčno distribucijo, moremo prikazati tudi kumulativno serijo. Vrednosti členov kumulativne serije nanašamo nad začetke ustrezajočih razredov s točkami, ki so od abscise oddaljene v sorazmerju z veli¬ kostjo kumulative. Če te točke med seboj povežemo, dobimo lomljeno črto, ki venomer narašča in ima tipično obliko črke S, če je frekvenčna distribucija unimo- dalna (z enim samim vrhom). Grafikon kumulativne serije omogoča za razliko od tabele oceno števila enot, ki leže pod katerokoli vrednostjo znaka (sl. 6 a). Obratno moremo, če imamo dano število ali odstotek enot, najti tisto vrednost znaka, od katere ima to število ali odstotek enot manjše vrednosti (sl. 6b). Primer 13. Ker moremo kumulativne serije računati tako iz absolutnih kot relativnih frekvenčnih distribucij, bomo grafično prikazali seriji relativnih frekvenc rezultatov testiranja računskega presojanja iz tabele 5. Tabela 7. Kumulative relativnih frekvenc iz tabele 5 Dečki Deklice Iz grafikona v sliki 6 sta razvidna tipična S oblika in način, kako moremo za dano vrednost znaka x odbrati iz grafikona ustrezajočo vrednost P°/ 0 in obratno. 1 2. Urejevanje atributivnih znakov 12.1 Frekvenčne distribucije atributivnih podatkov O frekvenčnih distribucijah v ožjem smislu govorimo le za distribucije vrednosti numeričnih znakov. Vendar je za atributivne znake problem popolnoma enak. Niz vrednosti atributivnega znaka in frekvenc ustrezajočih vrednosti je tehnično in 20 f% Slika 6. Kumulative relativnih frekvenc rezultatov testiranja računskih zmožnosti četrtošolcev v LR Sloveniji vsebinsko popolnoma enak pravim frekvenčnim distribucijam. Frekvenčne distri¬ bucije atributivnih znakov na popolnoma analogen način sestavljamo po metodi črtkanja in metodi sortiranja listkov. Zanje moremo izračunavati relativne frekvence, ki jih v primeru, da računamo koeficiente, imenujemo strukturne deleže, v primeru odstotkov pa strukturne odstotke. Kumulativne serije moremo iz atributivnih serij računati le v primeru, če je možno atributiven znak razvrstiti po velikosti. Primer 14. 493 oseb je izdelalo po predloženi šabloni iz žice obliko ključa. Z ocenami: podpovprečno, povprečno in nadpovprečno je bila ocenjena kvaliteta izdelkov. Podatki so bili obdelani po metodi črtkanja in sestavljena je bila frekvenčna distribucija, ki je dana V tabeli 8. V tabeli so dani še strukturni odstotki in kumulativa 21 strukturnih odstotkov. To smo mogli izračunati, ker je kvaliteta znak, ki ga moremo razvrstiti po enoličnem vrstnem redu. Kumulativni odstotek 84,7% pomeni, daje 84,7 % izdelkov slabših od nadpovprečnih. Tabela 8. Kvaliteta izdelave poskusnih ključev kolektiva 493 testirancev Skupaj . 493 100,0 100,0 12.2 Grafično prikazovanje struktur Strukture moremo prikazovati na najrazličnejše načine: s strukturnimi stolpci, strukturnimi krogi in drugimi specifičnimi načini. Strukturni stolpci in strukturni krogi so pravokotniki oziroma krogi, ki so razdeljeni v sorazmerju s strukturnimi odstotki. V slikah naslednjega primera imamo poleg navedenih metod v sliki 8 še tako imenovano trikotniško strukturo, v kateri je struktura s tremi členi prikazana kot točka. To omogoča zelo kompleksno analizo celih serij struktur, ki imajo po tri člene. Čeprav v navedenem primeru ta metoda ne pride popolnoma do veljave, so vendar razvidne njene prednosti. Primer 15. Statistična obdelava podatkov o izdelavi ključev ni dala samo zgornjih rezultatov; podatki so bili obdelani tudi po kvaliteti izdelkov za različne stopnje hitrosti pri delu: počasen, zmeren in hiter. S proučevanjem struktur za posamezne grupe hitrosti pri delu moremo odkriti odvisnost kvalitete dela od hitrosti. V slikah 7, 8 in 9 so na različne načine prikazane iste serije struktur. Tako je možna primerjava za različne načine grafičnega prikazovanja istih podatkov. Rezultati obdelave podatkov o hitrosti in kvaliteti izdelkov so prikazani v ta¬ belah 10 in 11. Tabela 10. Frekvenčna tabela izdelave ključev Tabela 11. Strukturni odstotki kvalitete izde- po kvaliteti za različne stopnje hitrosti pri delu lave ključev za različne stopnje hitrosti pri delu Sliki 7 a in 7b zelo nazorno prikažeta odvisnost kvalitete izdelkov od hitrosti. Primerjava struktur je lahka zaradi tega, ker so stolpci nanizani drug poleg drugega. 22 Razlika med sliko 7 a in 7b je v tem, da so stolpci v sliki 7 a enako široki, medtem ko so na sliki 7b širine stolpcev v sorazmerju z odstotkom enot za posamezno sku¬ pino hitrosti. Tako daje slika 7b dodatno informacijo. hiter zmeren počasen / o Me > M če je distribucija asimetrična v desno, pa je M> Me> Mo (29) (30) 38 3 MERE VARIACIJE 30. Vrste Vrednosti znaka posameznih enot populacije se zaradi individualnih vplivov odklanjajo od centralne — srednje vrednosti. Variiranje smo že opazovali tako na primerih individualnih podatkov kot na frekvenčnih distribucijah. Čim močnejši so individualni vplivi, tem močnejša je variacija in obratno, čim slabši so indivi¬ dualni vplivi, tem manjša je variacija. S tem da merimo variacijo, merimo torej jakost individualnih vplivov. Mer variacije imamo več: a) variacijski razmak, b) kvar- tilni odklon, c) povprečni absolutni odklon, d) varianco oziroma standardni odklon. 31. Variacijski razmak Variacijski razmak je po definiciji razlika med največjo in najmanjšo vrednostjo v populaciji. Če zaznamujemo variacijski razmak z R, z x max največjo, z x min pa najmanjšo vrednost, ki nastopi v populaciji, moremo nakazati izračunavanje variacij- skega razmaka v obliki obrazca H == X m ax x min ( 31 ) Primer 30. Za 20 testiranj mehanskega presojanja za četrtošolke iz primera 6 dobimo: x min = 11; x max = 41. Variacijski razmak je torej po obrazcu 31 i?= 41 — 11= 30 točk Variacijski razmak ima, čeprav je enostaven za določanje, niz pomanjkljivosti, ki omejujejo njegov pomen. Odvisen je namreč samo od dveh vrednosti, ki sta poleg tega še skrajni in zaradi tega nestabilni. Poleg tega se R z večanjem populacije veča, kar ni v skladu z dejstvom, da je variabilnost od velikosti populacije neodvisna. 32. Kvartilni odklon Solidnejša mera variacije je kvartilni razmak, ki je po definiciji razlika med tretjim in prvim kvartilom, torej interval, v katerem je polovica vrednosti populacije. 39 Vendar običajno namesto njega izračunavamo kvartilni odklon Q, ki je polo¬ vica kvartilnega razmaka Q= & ~ Ql - (32) 2 Ta mera variacije je stabilnejša od variacijskega razmaka, ker ni odvisna samo od ekstremnih vrednosti. Določamo jo tako, da po znanih postopkih izračunamo kvar- tile in njihove vrednosti vstavimo v obrazec 32. Opomba: Za mero variacije bi mogel enako rabiti tudi interdecilni razmak D, ki je razlika med devetim in prvim decilom D= D, — D x (33) Interdecilni razmak obsega 80 °/o vseh vrednosti populacije. Primer 31. Za rezultate testiranja računskih zmožnosti četrtošolcev smo v pri¬ meru 20 dobili: Q x — 12,76; Q 3 = 23,19. Iz teh podatkov dobimo, da je kvartilni odklon testa računskih zmožnosti četrtošolcev Q = 23,19 — 12,76 2 5,22 točke Interdecilni razmak pa je enak D = 28,09 — 8,79 = 19,30 točke ker je iz istega primera 20 razvidno, da je D x = 8,79, D, = 28,09. 33 . Povprečni absolutni odklon Odklon posamezne vrednosti od sredine e e = x — M (34) je rezultat individualnih vplivov na enoto. Sumaren parameter velikosti vseh od¬ klonov bi bila aritmetična sredina vseh odklonov. Odkloni so pozitivni in negativni, njih vsota pa je enaka 0. Zaradi tega vzamemo za merilo variacije povprečni absolutni odklon, ki ga izračunamo po naslednjih stopnjah: a) Izračunamo aritmetično sredino M ali mediano Me. b) Izračunamo absolutne odklone individualnih vrednosti od srednje vrednosti M ali Me in dobimo J x •— M\ ali \x — Me |. 40 c) Absolutne odklone seštejemo in delimo s številom enot AD m = \x — M\ ; AD Me = -'Z\x-Me\ (35) N ' N Če so vrednosti dane v frekvenčni distribuciji, je treba izračunati tehtani po¬ vprečni absolutni odklon po obrazcih AD m = — M b AD Me =-^f\x — Me\ (36) N N Odklone moremo računati od aritmetične sredine M ali mediane Me. Odkloni od mediane so v tem primeru vsebinsko primernejši. Primer 32. Za dvajset testiranj presojanja mehanskih zmožnosti iz primera 6 moramo izračunati povprečen absoluten odklon od mediane AD Me . V primeru 18 smo našli, da je mediana teh podatkov Me = 20. Tabela 17. Izračunavanje povprečnega absolutnega odklona od mediane AD Me za 20 podatkov testiranja mehanskega presojanja iz primera 6 x . 33 26 13 11 19 16 29 21 41 12 28 30 14 15 18 13 34 13 32 23 \x — Me\ ... 13 6 7 9 1 4 9 1 21 8 8 10 6 5 2 7 14 7 12 3 2\x — Me |= 13+6 + ...+12+3= 153 N= 20 153 Po obrazcu 35 je AD Me =-= 7,65 točke 20 34. Varianca, standardni odklon Najvažnejša mera variacije je varianca oziroma iz nje izpeljan standardni odklon. Varianca in standardni odklon imata velike teoretične in praktične prednosti pred drugimi merami variacije zaradi zveze z normalno distribucijo, verjetnostnim raču¬ nom, metodo najmanjših kvadratov in tako dalje. Zaradi tega so druge mere bolj opisnega, varianca pa je analitičnega značaja. Varianca je po definiciji povprečen kvadratičen odklon od aritmetične sredine. To definicijo moremo pisati v obliki obrazca o 2 = -2(x — MY (37) N 41 Standardni odklon a pa je kvadratni koren iz variance. Včasih zaznamujemo standardni odklon tudi s SD, tako da velja obrazec SD = o = ]/o* (38) 34.1 Izračunavanje variance iz individualnih podatkov 34.11 Glede na zgornji obrazec izračunavamo varianco iz individualnih podatkov na direktni način: a) izračunamo aritmetično sredino, b) izračunamo odklone posameznih vrednosti od aritmetične sredine, c) odklone kvadriramo, d) kvadrate odklonov seštejemo, e) vsoto kvadratov delimo z N. 34.12 Direktni način je običajno nepraktičen in moremo varianco izračunati enostavnejše z vpeljavo pomožnega znaka u. Po tej metodi izračunamo varianco po naslednjih stopnjah: a) izberemo neko poljubno okroglo vrednost x„, ki leži med stvarnimi vred¬ nostmi, b) izračunamo odklone posameznih vrednosti od x„. Tako dobimo vrednosti u = x — x 0 , c) količine u kvadriramo, d) seštejemo vse vrednosti u, da dobimo 2 u = U, in vse m 2 , da dobimo 2 k 2 , e) iz teh količin izračunamo varianco po obrazcu C/ 2 2u 2 — ■ — N K N N (39) Opomba: Kadar se ne moremo odločiti za nobeno vrednost x 0 , ki bi zmanjšala podatke, vzamemo x„ = 0. V tem primeru rabijo osnovne vrednosti direktno kot količine, katere seštevamo in kvadriramo, varianco pa računamo po obrazcu a 2 X 2x 2 — X* N N K N (40) Primer 33. Za dvajset testiranj z mehanskim testom iz primera 6 je izračun variance naslednji: 42 Tabela 18. Izračunavanje variance iz individualnih podatkov po metodi pomožnega znaka u za 20 podatkov testiranja z mehanskim testom iz primera 6 34.2 Izračunavanje variance iz frekvenčnih distribucij Oceno variance moremo dobiti iz frekvenčne distribucije na več načinov: a) na direkten način, b) z vpeljavo pomožnega znaka u, c) s kumulativnimi serijami. 34.21 Na direkten način po obrazcu 41 običajno variance ne računamo, ker je prezamudno v primerjavi z ostalima dvema metodama. 0 *=-; K = 2f{x — M) 2 (41) N 34.22 S pomožnim znakom u izračunamo varianco takole: a) V poljuben razred (najbolje sredi distribucije) postavimo vrednost znaka u — 0, v razrede, ki so nižji od razreda 0, vrednosti — 1, -— 2, — 3, ..., v razrede, ki so višji od razreda 0, pa -j- 1, + 2, -j- 3, ... To so vrednosti pomožnega znaka u, ki jih vpišemo v kolono 3 poleg frekvenc. 43 b) V kolono 4 vpišemo produkte frekvenc in znaka u. Tako dobimo fu. c) Produkte fu ponovno pomnožimo z u. Tako dobimo fu 2 in te vrednosti vpišemo v naslednjo kolono 5. d) Seštejemo f fu in fu 2 v kolonah 3, 4 in 5. Tako dobimo N, 2 fu = U, 2 fu 2 . e) Iz teh količin izračunamo varianco po obrazcu i 2 U 2 o 2 ——K\ K = 2fu* - (42) N N f) Iz variance izračunamo standardni odklon po obrazcu o*= [/+ (43) Primer 34. Iz frekvenčne distribucije za rezultate testiranja mehanskih odnosov četrtošolk gimnazij z enim četrtim oddelkom v LRS je treba po metodi pomožnega znaka u izračunati a 2 in a x . Tabela 19. Izračunavanje variance mehanskega testa s pomočjo pomožnega znaka « Kot izhodišče smo vzeli razred 21 do 25. Razredni interval / = 5. Po obrazcu 42 in podatkih, dobljenih v tabeli 19, je ( — 40) 2 K= 1392 — -- -= 1387,32 342 5 2 a 2 = - 1387,32 = 101,5 342 a x = j/lOl ,5 = 10,08 točke 44 34.23 Po metodi kumulativ pa je izračunavanje variance naslednje: a) Iz frekvenčne distribucije / na znan način izračunamo prvo kumulativo F. Zadnji člen pod črto je N. b) Iz dobljene prve kumulative F po enakem principu izračunamo drugo ku¬ mulativo FF. Zadnji člen — pod črto — je A. c) Seštejemo člene druge kumulative brez zadnjega člena A pod črto. To vsoto zaznamujmo z B. d) Iz teh količin izračunamo varianco po obrazcu i* , A 2 a 2 = — K; K=2B+A - (44) N N Metoda kumulativ je posebno prikladna iz dveh razlogov. Po tej metodi je mno¬ ženje reducirano na minimum, postranski rezultat pa je kumulativna serija, ki je za analizo distribucij važna, posebno če moramo poleg variance izračunati še do¬ ločene kvantile. Primer 35. Za distribucijo iz primera 34 je treba izračunati varianco in standardni odklon po metodi kumulativ. Tabela 20. Izračunavanje variance rezultatov mehanskega testa po metodi kumulativ Druga kumulativa FF je tvorjena: 1 + 0= 1; 6 + 1=7; 17+7 = 24 itd. Iz dobljenih količin sledi po obrazcu 44 1750 2 ZŠT = 2 -4296+ 1750— -= 1387,32 342 45 a 2 = — 1387,32 = 101,5 342 o x = j/lOl,5 = 10,08 točke 34.3 Sheppardova korektura Zgornje ocene variance so računane pod predpostavko, da so vrednosti v posa¬ meznih razredih enake sredini razreda. To seveda ne ustreza dejanskemu stanju in je vir sistematične napake pri ocenjevanju variance. Za zvezne znake, katerih distri¬ bucija je unimodalna in zvonasta, korigiramo napako, ki izvira iz grupiranja podatkov, po obrazcu ° 2 x,cor=o 2 x — (45) Pri tem pomeni a 2 xCor korigirano varianco, o\ varianco, izračunano po zgor¬ njih postopkih, i pa razredni interval. To je Sheppardova korektura. Primer 36. Za varianco rezultatov mehanskega testiranja iz primera 35 je Sheppardova korektura variance po obrazcu 45 °l.cor= 101,5 - =99,4; o xkcor = 9,97 12 Vidimo, da je korigirana varianca za malenkost manjša od nekorigirane. 34.4 Varianca iz delnih populacij Če imamo za delne populacije znano število enot N k , aritmetične sredine M k in variance o \, moremo izračunati varianco celotne populacije iz delnih po obrazcu a 2 = - 2 N k ol + - 2 N k (M k - M)* = M a > + o 2 u (46) N N Skupna varianca je torej vsota povprečja varianc v delnih populacijah M„i in variance delnih aritmetičnih sredin o 2 M . Ta obrazec je zelo važen ne samo zaradi tega, ker omogoča izračunavanje skupne variance iz podatkov delnih populacij, ampak predvsem zaradi tega, ker omogoča razstavljanje variance v njene sestavne dele in s tem analizo variance po faktorjih. Primer 37. Za mehanski test tretješolcev in tretješolk smo pri masovnem testi¬ ranju dobili naslednje rezultate: Tretješolci: JV,= 1567; M^= 33,1; o]= 121,0 Tretješolke: N t — 2057; Af, = 19,8; a\ — 81,0 46 N^+Nzol _ 1567-121,0+2057-81,0 N,+ N 2 1567 + 2057 a 2 _ M M (M, — My+ N, (M, — M ) 2 n x +n 2 1567 (33,1 — 25,5) 2 + 2057 (19,8 — 25,5) 2 1567+ 2057 43,4 , . w 1567-33,1 + 2057-19,8 _ ker j e M = ~y,N k M k =-=-= 25,5 N iVi+ N t 1567+ 2057 Od skupne variance rezultatov mehanskega testiranja a a = M 0 * + a 2 w = = 98,4 + 43,4 = 141,8 je 43,4 ali 30,6% variance na račun spola, 98,4 ali 69,4 °/o pa na račun drugih, individualnih faktorjev. Večji odstotek variance, ki bi izviral iz spola, bi kazal na to, da je zmožnost mehanskega presojanja bolj, manjši odstotek pa, da je zmožnost mehanskega presojanja manj odvisna od spola. V pri¬ meru neodvisnosti od spola bi bile grupne sredine enake; a 2 M = 0, v primeru, da bi bila zmožnost presojanja mehanskih odnosov odvisna samo od spola, pa bi bila M 0 t = 0. Vsa varianca bi v tem primeru izvirala iz odvisnosti od spola. Čeprav je izračunavanje variance in standardnega odklona razmeroma kompli¬ cirano, je njihov praktični, predvsem pa teoretični pomen tako velik, da ju uporab¬ ljamo v večini primerov kot mero variacije. 34.5 Koeficient variacije Varianca in standardni odklon sta primerljiva samo za sorodne populacije. Zaradi tega izračunavamo včasih koeficient variacije KV, ki je po definiciji odstotno razmerje med standardnim odklonom in aritmetično sredino in ga izračunavamo po obrazcu KV= 100 — (47) M Koeficient variacije KV omogoča primerljivost variabilnosti za različne populacije. Vendar moramo opozoriti, da je izračunavanje koeficienta variacije brez smisla, če je izhodišče merjenja arbitrarno, kar je pogosto primer pri psiholoških meritvah. Primer 38. Za mehanski test tretješolcev in tretješolk v LRS imamo naslednje podatke: tretješolci: Mi=33,l, Oi= 11,0; tretješolke: M t = 19,8, o 2 = 9,0. Pri¬ merjava standardnih odklonov pokaže, da je variabilnost za dečke večja kot za deklice. Če izračunamo po obrazcu 47 koeficiente variacije, pa dobimo: 11.0 9,0 KV! = 100 —— = 33 % KV 2 = 100 — = 45% 33.1 19,8 Relativno merilo variacije torej kaže večjo variabilnost rezultatov deklic. Razmerje učinka individualnih vplivov in splošnih vplivov je za deklice večje kot za dečke. 47 4 MERE ASIMETRIJE IN SPLOŠČENOSTI 40. Splošno Populacija ni popolnoma opisana s sredino in mero variacije, temveč kaže pri isti srednji vrednosti in isti meri variacije različne lastnosti: večjo ali manjšo stopnjo asimetričnosti in večjo ali manjšo stopnjo sploščenosti. Več o teh lastnostih smo povedali že pri frekvenčnih distribucijah v odstavku 11.32. Asimetrijo in sploščenost merimo z beta koeficienti, katerih izračunavanje je precej zamudno. Imamo pa tudi enostavnejše mere, ki opisujejo ti dve lastnosti populacij. 41. Mere asimetrije Enostavne mere asimetrije, ki jih moremo izračunati iz srednjih vrednosti, mer variacije in kvantilov, izračunavamo po obrazcih: Primer 39. Iz primera 19 vemo, daje za rezultate testiranja računskih zmožnosti četrtošolcev: Me= 18,18; 0i = 12,76; &= 23,19; A = 8,79; D,= 28,09, aritme¬ tična sredina M— 18,21; o= 7,3. Po obrazcih 48, 49 in 50 izračunamo iz teh po¬ datkov lahko vse tri mere asimetrije: , 23,19 + 12,76 — 2-18,18 As a = —- - 1 -— = _o,039 23,19—12,76 48 28,09 + 8,7» _ 18>lg = _ 0>26 3(18,2 1-18^ 7,3 Vse tri mere asimetrije za isto distribucijo so med seboj različne, ker so računane različno. Zaradi tega moremo primerjati za različne pojave le istovrstne koeficiente. V našem primeru so koeficienti asimetrije zelo blizu 0. Iz tega razloga je razumljivo tudi, da je zadnji koeficient pozitiven, prva dva pa negativna. To nesoglasje izvira iz slučajnih vplivov. 42. Mera sploščenosti Kot eno izmed mer sploščenosti bomo navedli koeficient, ki ga izračunavamo iz kvartilov in decilov po obrazcu Spl = (51 ) 2 (A - A) Koeficient sploščenosti je za distribucije, ki so: koničaste. Spl> 0,263 normalne. Spl= 0,263 sploščene. Spl < 0,263 Primer 40. Za test računskih zmožnosti četrtošolcev je Q 1 = 12,76, Q 3 = 23,19; A = 8,79; A= 28,09. Po obrazcu 51 je koeficient sploščenosti distribucije. Spl = 23,19 — 12,76 2 (28,09 — 8,79) = 0,270 Distribucija se izkaže glede na sploščenost kot zelo normalna. 4 — Statistične metode 49 5 NORMALNA DISTRIBUCIJA 50. Pojem Faktorje, ki vplivajo na določen pojav, čigar kvantitativen izraz je statistični znak, delimo na bistvene in slučajne. Bistveni faktorji, ki vplivajo na doseženo število točk pri testu, ki je izraz določene zmožnosti, so na primer starost, spol, šolska izobrazba, kraj bivanja in tako dalje. Slučajni faktorji pa so drobni vzroki, ki jih v posameznem primeru niti ne moremo določiti, povzroče pa, da različni učenci dosežejo različno število točk, kljub temu da so enako stari, istega spola, imajo isto šolsko izobrazbo, so iz istega kraja in tako dalje, skratka se ujemajo v vseh bistvenih faktorjih. Čeprav so za določeno populacijo vsi bistveni faktorji stalni, rezultati zaradi slučajnih faktorjev kljub temu variirajo. Frekvenčne distribucije takih populacij na¬ vadno kažejo tipično simetrično zvonasto obliko, ki se v primeru, da se populacija veča, vse bolj približuje distribuciji, ki je znana pod imenom normalna distribucija. V vseh primerih delovanja samo slučajnih faktorjev ne dobimo normalne distri¬ bucije. Vendar je zaradi pogostosti pojavljanja in zaradi teoretičnih prednosti nor¬ malna distribucija osnovna teoretična distribucija in bazira na njej velik del statistične teorije in prakse. Posebno važna je normalna distribucija v psihološki statistiki, ker predstavlja osnovo za marsikatero hipotezo, ki omogoča meritve na prvi pogled neizmerljivih pojavov. Zaradi tega izjemnega pomena jo bomo v tem. odstavku posebej obravnavali. 51. Normalna distribucija V funkcijski obliki je normalna distribucija izražena v obrazcu 1 (*—my ep (x) = —=r- e 2 0 » (52) y 2n o V tem obrazcu je gostota relativne frekvence normalne distribucije o B \) Slika 11. Normalna distribucija: 0 rž 0 r = + 1 Slika 21. Vrednosti korekcijskega koeficienta r pri različnih razmestitvah točk v korekcijskem grafikonu Jakost korekcije in s tem tudi vrednost korekcijskega koeficienta moremo približno razbrati že iz razmestitve točk v korekcijskem grafikonu. Slika 21 kaže te odnose za nekaj tipičnih primerov. Kadar je vrednost korekcijskega koeficienta ne glede na predznak manjša kot 0,20, govorimo o zelo rahli povezavi, ki jo moremo 73 - v večini primerov praktično zanemariti. Vrednosti korekcijskega koeficienta med 0,20 in 0,40 kažejo nizko, toda določeno korelacijo. Korekcijski koeficienti med 0,40 in 0,70 pomenijo zmerno povezavo, koeficienti med 0,70 in 0,90 so znak visoke povezave. Korekcijski koeficienti od 0,90 naprej pa so znak zelo visoke korekcijske povezanosti. Korekcijski koeficient ima vrednost 1 tedaj, kadar sta pojava v med¬ sebojni funkcijski linearni zvezi. Standardno napako ocene o e moremo za linearno korelacijo pisati v obliki obrazca _ o t =o,Vl—r*„ ( 70 ) Ta obrazec je samo za linearno korekcijo preveden obrazec 64. Vse, kar smo v tem odstavku povedali o korekcijski odvisnosti y od x, moremo tehnično obrniti in iskati odvisnost x od y. Vlogi odvisne in neodvisne spremenljivke se samo zamenjata. V vseh obrazcih od 65 do 70 se v tem primeru x zamenja z y in obratno yzx.lz tega vidimo, da imamo pravzaprav dve regresijski premici, dva regresijska koeficienta in dve standardni napaki ocene. Korelacijski koeficient in determinacijski koeficient pa pri tej zamenjavi ostaneta ista. Vendar pride v poštev analiza obeh primerov le v primeru čistih korekcijskih odvisnosti, v vzročnih pa vedno vzamemo vzrok kot neodvisno x, posledico pa kot odvisno spremenljivko y. 61.2 Izračunavanje pokazateljev linearne korelacije iz negrupiranih podatkov Pokazatelje linearne korelacije moremo praktično izračunati po treh metodah: a) direktni metodi, b) metodi pomožnega znaka in v c) metodi diferenc. 61.21 Direktna metoda. Po direktni metodi izračunavamo pokazatelje linearne korekcije po naslednjih stopnjah: a) Izračunamo aritmetični sredini M x in M y . b) Od individualnih vrednosti x odštejemo M x , od vrednosti y pa M y . Tako dobimo kolone odklonov individualnih vrednosti od aritmetičnih sredin (x — Mf), (y — My). c) Te odklone kvadriramo in pomnožimo med seboj. Dobimo kolone (x — M X Y, (y - M y )\ (x — M x ) (y — M y ). d) Kvadrate in produkte odklonov seštejemo. Tako dobimo K x — 2(x — M X Y; K y = 2(y — M y y ; K xy = 2(x — M x ) (y — M y ) (71) e) Pokazatelje linearne korelacije izračunamo iz teh količin po obrazcih Ih = - ~ ; y' = M + b 1 (x—M x ); r = o e — o y j/1 — r 2 xy (72) K x \/K x K y 74 Čeprav pridemo po tej metodi do rezultatov z direktno uporabo osnovnih obrazcev, je ta način tehnično zelo dolgotrajen, ker so odkloni od aritmetičnih sredin običajno decimalna števila; to pa komplicira kvadriranje in množenje. Ker ta način redko uporabljamo, zanj ne bomo navajali primera. 61.22 Metoda pomožnih znakov u in v. Hibam, ki jih ima direktna me¬ toda, se izognemo z metodo pomožnih znakov u in v. Princip vpeljave pomožnega znaka nam je znan že iz metod izračunavanja variance. V tem primeru je samo prirejen specifičnim potrebam. Stopnje izračunavanja pokazateljev linearne korelacije so v tem primeru naslednje: a) Glede na vrednosti znakov x in y izberemo okrogle vrednosti x„ in y 0 nekje med stvarnimi vrednostmi x in y. b) Poiščemo razlike (x — x 0 ) = u in (y — y 0 ) = v. Te razlike so pomožni znaki u in v. c) Izračunamo kvadrate in produkte u in v. Dobimo kolone « 2 , v 2 in uv. d) Seštejemo kolone vrednosti u, v, u", v 2 in uv. Tako dobimo 2u = U; 2v = V; 2V; 2?v 2 ; Zuv. e) Iz teh količin izračunamo naslednje izraze: U , V M x = x„ H — ; M y = y 0 H — N N H 2 V 2 K x — Zu 2 -; K v = 2 v 2 -; K xy N N 2 uv U■ V N (73) (74) f) Iz njih dobimo kot pri direktni metodi _ *i=—; ?=M,+ b l {x — M x ); r xy =—ŠL=; a e =a y ]/l— (75) K x \ K x K y Opomba: Kadar ni razloga za vpeljavo posebnih vrednosti x 0 in y 0 , vzamemo kot najenostavneje x 0 = 0 in y 0 = 0. V tem primeru je u = x in v = y. Ves nadaljnji postopek ostane isti, le da namesto z h in v vse računske operacije izvajamo z original¬ nimi vrednostmi x in y. Ta način ima prednosti predvsem, kadar računamo s strojem. V primerjavi z direktno metodo je po tej metodi tehnično delo znatno poenostav¬ ljeno, ker skrčimo podatke, s katerimi računamo, na enostavna števila. Edine kom¬ plikacije so zaradi predznakov. Primer 52. Za odvisnost med rezultati testa zmožnosti presojanja mehanskih in spacialnih odnosov tretješolcev klasične gimnazije v Mariboru je računanje poka¬ zateljev korelacije z vpeljavo pomožnih znakov u in v naslednje: 75 Tabela 28. Izračunavanje pokazateljev linearne korelacije med rezultati mehanskega (x) in spacialnega (v) testiranja za 20 tretješolcev mariborske klasične gimnazije po metodi pomožnih znakov »inv Z obrazci 73 dobimo: + 20 , +51 Af,= 40+ - =41 M v =50-1 — - =52,55 20 20 Iz obrazcev 74 dobimo: (+ 20) 2 (+ 51) 2 K x = 968 — —--= 948 K v = 8197—— - -= 8066,95 20 20 K = + 2143 — (+ 2 °) ( + 51) = 4.2092 20 Iz teh količin dobimo z obrazci 75 + 2092 6i=— - =+2,21 y'= 52,55+ 2,21 (x —41) 948 76 , 8066,95 o 2 = -— = 403,3475 20 Oy= 20,1 _L 2092 - r xy = = +0,757 o e = 20,11/1 — 0/757 2 = 13,14 948 • 8066,95 Praktičen pomen regresijske premice je v tem, da moremo iz nje napovedovati y, če poznamo vrednost x. Vzemimo na primer šestnajstega študenta, ki je dosegel pri mehanskem testu jc = 54 točk. Če ta rezultat vnesemo v enačbo regresijske pre¬ mice, dobimo: /= 52,55+ 2,21 (54 — 41) = 81,28 ali zaokroženo 81. Ocena doseženih točk pri spacialnem testu je vnaprej napovedana na 81 točk. Razlika ocene od dejansko doseženega rezultata je samo štiri točke. Ta rezultat je izredno dober, ker glede na velikost standardne napake ocene a e = 13,14 pričakujemo tudi veliko večje odklone. Kot smo že navedli, moremo izračunati tudi drugo regresijsko premico, ki kaže obratno odvisnost mehanskega testa ( x ) od spacialnega (>). Regresijska premica je po pravilu, da simbola x in y samo zamenjamo, enaka x'= M x + b, (y — M ); b % = ; a e = a x j/l — r 2 (76) K y Če vnesemo v obrazce podatke, dobimo: T- 2092 k=—- = +0,26 /= 41+ 0,26 (>- — 52,55) 8066,95 o e = 6,89 l/l — 0',757* = 4,51 61.23 Metoda diferenc. Edina tehnična hiba metode pomožnih znakov u in v je v koloni uv. Medtem ko kvadrate majhnih števil znamo na pamet, večje pa po¬ iščemo v tablicah kvadratov, je treba produkte dobiti z množenjem. Da se izognemo še temu množenju in vse osnovne računske operacije privedemo na kvadriranje, uporabljamo metodo diferenc. Ta metoda se v točkah a in b sklada s prejšnjo metodo. Enako tudi pri tej metodi: a) Izberemo okrogli vrednosti x 0 in y,„ ki ležita med stvarnimi vrednostmi x in y. b) Poiščemo vrednosti pomožnih znakov x —■ x 0 = u; y — y 0 = v. c) Izračunamo diference med u in v: u — v = d. d) Seštejemo kolone u, v in d. Tako dobimo 2u= U, 2v= V, 2d= D. Kontrola: U — V— D. e) Kvadriramo kolone u, v, d. Dobimo kolone kvadratov h 2 , v 2 , d 2 . 77 f) Seštejemo kolone kvadratov. Dobimo 2 u 2 , 2 v 2 , 2 d 2 . g) Iz teh količin izračunamo dalje: M x = x 0 -j - ; M y — y„ -j -- (77) N N U 2 V 2 D 2 K x = 2u 2 - ; K y = 2 v 2 - ; K d = 2 d 2 -- (78) N N N K xy = V« (K x +K y — K d ) (79) h) Enako kot pri prejšnjih metodah dobimo končne rezultate po obrazcih b x ■= — ; y' = M y + b x (x — M x ); r xy = ; o e = o y ]/1 — (76) K x )' dC x Ky Primer 53. Za problem korelacije med rezultati mehanskega in spacialnega testa 20 tretješolcev mariborske klasične gimnazije iz prejšnjega primera je izračunavanje pokazateljev korelacije naslednje: Tabela 29. Izračunavanje pokazateljev korelacije med rezultati mehanskega (*) in spacialnega (y) testa po metodi diferenc 78 Kontrola: (+51) — (+20)= +31 (+20) 2 (+ 51) s r = 968 — - — = 948; K v =8197 — ~—= 8066,95; 20 20 (+ 20) 2 4830,95; K xy = x / 2 (948 + 8066,95 — 4830,95) = 2092; Vidimo, da smo dobili osnovne rezultate M x , M y , K x , K y in K xy enake kot pri metodi pomožnih znakov u in v. Zaradi tega nadaljnjega računa ne bomo nakazovali, ker je popolnoma enak kot pri prejšnjem načinu in dobimo iste rezultate: b x = 2,21; + = 0,757; a e = 13,14. 61.3 Izračunavanje pokazateljev linearne korelacije iz grupiranih podatkov 61.31 Korelacijska tabela. Če je populacija, ki jo proučujemo, obsežna, dosedanji načini izračunavanja pokazateljev korelacije niso prikladni. V tem primeru, podobno kot za en znak sestavimo frekvenčno distribucijo, uredimo dvojice po¬ datkov v kombinacijski tabeli. Ker taka tabela prikazuje povezanost med dvema znakoma, jo imenujemo korelacijsko tabelo. Korelacijsko tabelo sestavimo tako, da za oba korelirana znaka tvorimo razrede z enakimi razrednimi intervali, v posamezna polja pa vpišemo frekvence, ki povedo, koliko enot ima vrednost znaka v določenem razredu po enem in drugem znaku. Iz korelacijskega grafikona, v katerem so vrednosti za posamezne enote vrisane kot točke, dobimo korelacijsko tabelo tako, da koordi¬ natno ravnino razdelimo po abscisi in ordinati v pasove. Ti pasovi razdele koordi¬ natno ravnino v pravokotnike — polja, število točk v posameznih poljih pa so frekvence. Korelacijsko tabelo moremo sestaviti bodisi po metodi črtkanja ali po metodi odlaganja listkov. Primer 54. Ena izmed metod ugotavljanja zanesljivosti testa je metoda enako¬ vrednih polovic. Test je običajno sestavljen iz niza nalog, ki so razvrščene po težav¬ nosti. Zanesljivost testa v tem primeru merimo s korelacijo med dosežki pri lihih in sodih nalogah po vrstnem redu. Prvo skupino nalog predstavljajo naloge z zapo¬ redno številko 1, 3, 5 ..., drugo pa naloge z zaporedno številko 2, 4, 6 ... Več o tem bomo govorili v poglavju o testnih normah. Za testiranje presojanja mehanskih odnosov za 414 dijakov nižjih razredov gimnazij v Ljubljani je korelacijska tabela med dosežki pri lihih in sodih nalogah prikazana v tabeli 30. 79 Tabela 30. Korelacijska tabela dosežkov pri lihih in sodih nalogah pri testu mehanskega presojanja 414 dijakov v Ljubljani Frekvenca 10 v razredu 29 do 31 točk za lihe in 23 do 25 za sode naloge pove, da je od skupno 414 dijakov 10 takih, ki so pri lihih nalogah dosegli 29 do 31 točk, pri sodih pa 23 do 25 točk. Korelacijska tabela namreč ne prikazuje točne vrednosti enot za posamezne enote, temveč enako kot frekvenčna distribucija enači vse enote znotraj polja. Vsem enotam enega polja pripišemo vrednosti sredin ustrezajočih razredov. V primeru našega razreda je to: x= 24, y = 30. Čim večji so razredi, tem bolj je korelacijska tabela nenatančna. Prednost korelacijske tabele je v tem, da nazorno, v skrčeni obliki poda veliko maso dvojic vrednosti. Iz tabele 30 je namreč zelo dobro vidna velika pozitivna korelacija med dosežki sodih in lihih nalog. To vidimo iz tega, ker se frekvence vlečejo iz levega spodnjega kota proti desnemu zgornjemu kotu korelacijske tabele. Pri točnejšem proučevanju te tabele opazimo, da so kot na nekem grebenu frekvence največje, od tega grebena pa se na vse strani manjšajo. Ta oblika je za korelacijsko povezanost tipična. Korelacijska tabela podaja v urejeni obliki zaokrožene vrednosti dvojic xy za vse enote populacije. Zaradi tega obstaja možnost, da iz nje izračunamo ocene pokazateljev linearne korelacije. Te ocene so dobri približki pravih rezultatov, ki bi jih z velikim tehničnim poslom dobili iz negrupiranih podatkov. Navedli bomo dve metodi izračunavanja pokazateljev linearne korelacije iz grupiranih podatkov: a) metodo pomožnih znakov u in v, b) metodo kumulativ. 61.32 Metoda pomožnih znakov u in v. Metoda pomožnih znakov « in v je po svojem principu zelo podobna izračunavanju variance iz frekvenčne distribu¬ cije. Postopek pa je naslednji: 80 a) Korelacijsko tabelo vpišemo tako, da tečejo razredi znaka y po velikosti od spodaj navzgor, razredi znaka x pa od leve proti desni (glej tab. 30!). b) Za grupna znaka jc in y, pripišemo razredoma, ki stojita nekje v sredini, vrednost 0, od te pa navzdol —1, —2, —3, ..., navzgor pa +1, +2, +3, ... To sta znaka u za x in v za y. c) Obe robni frekvenčni distribuciji f u in f v enako kot pri izračunavanju variance pomnožimo z u in u 2 oziroma drugo z v in v 2 . d) Vsote izračunanih produktov po vrstah oziroma kolonah dajo količine 2f u u= U; If v v= V; Zf u ii\ e) Frekvence posamezne vrste /„„ (za določen v) pomnožimo z ustrezajočimi vrednostmi u, vsoto teh produktov za posamezno vrsto (2’/„ v • u — U r ) pa vpisujemo v ustrezajoče vrste v posebno kolono. Kontrola: vsota te kolone je enaka U; 2U V = U f) Posamezne vrednosti v koloni (£/„) pomnožimo z ustrezajočo vrednostjo v, produkte (C/ v ) v vpišemo v posebno kolono in te produkte seštejemo. Tako dobimo 2! 2f uv uv. g) Iz teh količin izračunamo naslednje izraze: U , V M x = x„+ i x —; M y =y„+i y — N N (77) U 2 V 2 „ U ■ V K u = 2f u u 2 -; K v = -; K uv = 2 2f m uv -(78) N N N Pri tem pomeni poleg znanih izrazov: x 0 = sredina razreda x, v katerega smo postavili u= o, y 0 = sredina razreda y, v katerega smo postavili v= 0, i x in i y pa sta razredna intervala znakov x in y. h) Iz teh izrazov dobimo pokazatelje linearne korelacije po obrazcih y = M y + b l (x-M x ) be Ku K„- VKJČv’ = O y ]/i (79) (80) Primer 55. Za podatke iz tabele 30 je po tej metodi izračunavanje pokazateljev korelacije naslednje: 6 — Statistične metode 81 Tabela 31. Izračunavanje pokazateljev linearne korelacije po metodi pomožnih znakov u in v za korelacijsko tabelo lihih in sodih rezul¬ tatov testiranja mehanskih odnosov 414 dijakov ljubljanskih šol Iz teh podatkov dobimo s pomočjo obrazcev 77 in 78 4-135 4-169 M x = 27+ 3 ———- = 27,98; M„ = 27 + 3 4— = 28,22; K u = 981 414 (4- 135)° = 414 K uv = -j- 696 936,98; K v = 1027 (4-135)-(4-) 69) 414 ( + 169) 2 414 414 = -f 640,89 = 958,01; S pomočjo obrazcev 79 in 80 dobimo dalje končne rezultate: 3 4- 640,89 b 1 - 3 958,01 3 2 • 958,01 414 4- 0,669; / = 28,22 4- 0,669 (x — 27,98); 4- 640,89 20,82; (/936.98 • 958,01 0,677; a e = 4,56 j/l — 0,677 2 = 3,40 61.33 Metoda kumulativ. Lastnosti kumulativ, ki smo jih izkoristili pri izra¬ čunavanju varianc iz grupiranih podatkov, moremo s pridom uporabiti tudi pri izračunavanju pokazateljev korelacije iz grupiranih podatkov. Postopek po metodi kumulativ je naslednji: a) Korelacijska tabela mora biti vpisana tako, da grupe x rastejo od leve proti desni, grupe y pa od spodaj navzgor. Robne frekvenčne distribucije imamo vpisane v korelacijski tabeli. b) Poleg robnih frekvenčnih distribucij f x in f y izračunamo še diagonalno frekvenčno distribucijo f d . Diagonalno frekvenčno distribucijo f d dobimo tako, da seštevamo frekvence korelacijske tabele v smeri diagonale korelacijske tabele. Prvi člen diagonalne serije je vsota vseh frekvenc prve linije v smeri diagonale, če začnemo v zgornjem levem kotu. Drugi člen je vsota vseh frekvenc naslednje diagonalne linije in tako dalje. To seštevanje nadaljujemo toliko časa, dokler ne seštejemo frekvence vseh diagonalnih linij in dobimo vse člene serije f d . Formiranje diagonalne serije f d iz korelacijske tabele je nakazano v primeru 56 s puščicami v smeri seštevanja. c) Iz vseh treh distribucij f x , f y in f d na znan način dvojnega kumuliranja iz distribucije f x izračunamo A x in B x , iz distribucije f y A y in B y in iz distribucije f d A d in B d . 83 Prva kontrola: Zadnji člen prvih kumulativ F x , F y in F d je enak številu enot populacije N. Druga kontrola: A x -A y +A d =(r-l)N (81) Poleg znanih količin pomeni: r = kolona, v kateri preseka zadnja diagonalna linija spodnji rob korekcijske tabele (glej primer 56!). Opomba: Ako seštevamo na stroj, adiator ali računalo, moremo pri gornjem postopku eno stopnjo preskočiti. Pri seštevanju frekvenc dobimo namreč z uporabo delnih vsot (subtotalov) prve kumulative za vse tri serije (F x , F y in F d ) neposredno brez predhodnega izračunavanja f x , f y in f d . d) Iz dobljenih vrednosti kumulativ izračunamo pomožne količine K x = 2B X -\- A x — —; K y = 2B y -\- A y -—; K d =2B d + A d — ^ (82) N N N K X y = v. (K x +K y — K d ) ; M x =Xo+i x — ; M y = y 0 + i y ^ (83) N N x 0 = sredina najnižjega razreda x, y 0 = sredina naj nižjega razreda y. e) Iz teh izrazov dobimo pokazatelje linearne korelacije po istih obrazcih kot pri prejšnji metodi. bl =’-Z.^; y'= M y + b l (x-M x ) (84) ix K x O 2 y k y 1 /K x K y . = Oy ]/l — / (85) Primer 56. Za podatke iz tabele 30 je izračunavanje pokazateljev linearne kore¬ lacije po metodi kumulativ naslednje: V tabeli 32 je nakazan proces formiranja distribucije f d in izračunavanja vseh kumulativ. Prva diagonalna frekvenca je torej: 1+2 + 4 + 2+1 = 10; druga: 6+11 + 10 +10 + 1 = 39 itd. zadnja: 3 + 1 + 1 = 5 Prva kontrola pokaže pravilnost računa do izračuna prve kumulative, ker smo kot zadnji člen prve kumulative pri vseh treh serijah dobili N— 414. Druga kontrola, ki naj pokaže pravilnost izračunavanja drugih kumulativ, je naslednja. V tabeli 32 84 mehanskih odnosov 414 dijakov ljubljanskih gimnazij O 2 S je nakazana zadnja diagonalna linija, ki seka spodnji rob korekcijske tabele v četrti koloni, rje torej 4. Iz obrazca 81 sledi: 2205 — 2239 + 1276 = 1242 = (4 — 1) 414 Kontrola je pokazala pravilnost izračuna druge kumulative vseh treh distribucij hkrati. S pomočjo obrazcev 82 in 83 dobimo: 2205 2 2239 2 K x = 2 • 5238 + 2205- = 936,98; K v = 2 • 5414+ 2239 -= 958,01 414 414 197 faz K a = 2-1635+ 1276- = 613,21; K xy = V*(936,98 + 958,01 — 613,21) = 414 = 640,89 2205 2239 „ M x = 12+ 3 -= 27,98; M v = 12 + 3 - =28,22 414 414 Primerjava teh količin pokaže skladnost z rezultati, ki smo jih dobili z metodo pomožnih znakov u in v. Zaradi tega končnega izračuna pokazateljev korelacije ne bomo navedli, ker je enak prejšnjemu. Rezultati so: b, = + 0,669; y' = 28,22 + 0,669 (x — 27,98); r xy = + 0,677; o e = 3,40 Primer je pokazal, da je metoda kumulativ preglednejša in krajša, posebno če računamo s strojem ali drugim pomožnim sredstvom. 62. Biserialni korelacijski koeficient 62.0 Problem Korelacijski koeficient r xy moremo izračunavati le, kadar sta korelirana znaka numerična, njihove vrednosti pa dane vsaj grupno. Pri tem se zavedamo, da je kore¬ lacijski koeficient, izračunan iz grupiranih podatkov, tem manj zanesljiv, čim večje so grupe. Pri majhnem številu grup pa izračunavanje korelacijskega koeficienta po tej metodi izgubi svojo praktično vrednost. Vendar ga moremo oceniti tudi v pri¬ meru, da je po enem znaku število grup reducirano samo na dve grupi, če populacija izpolnjuje določene predpostavke. V tem primeru uporabljamo biserialni korelacijski koeficient, katerega izračunavanje je upravičeno, če je tudi znak, katerega vrednosti so dane v alternativnih dveh grupah, numeričen in distribuiran vsaj približno nor¬ malno, odvisnost med obema pa linearna. Poleg tega je v dobro kvalitete ocene, če obe alternativni grupi po številu enot nista preveč različni. 68 Problemov, ki narekujejo uporabo biserialnega korekcijskega koeficienta, je v praksi veliko. Dostikrat so pri korekcijski analizi podatki za en znak pomanjkljivi ali nezanesljivi, ali pa ima korekcijska tabela po enem znaku odprte razrede itd. V teh primerih je Pearsonov korekcijski koeficient r xy nemogoče izračunati. S po¬ močjo grupiranja podatkov po tem znaku v dve grupi pa ga je mogoče oceniti z bise- rialnim korekcijskim koeficientom. Dostikrat je tudi znak, čeprav v svoji osnovi numeričen, registriran kot atribut. Tako je na primer atribut: uspeh pri izpitu: opravil — padel v svoji osnovi numeričen znak, merjen z obsegom znanja. Določena stopnja znanja pa je meja med: opravil — padel. Tudi osnovna predpostavka, da je stopnja znanja normalno razporejena, je sprejemljiva, ker imamo običajno večino povprečnih študentov, odkloni od tega povprečja pa so tem redkejši, čim večji so odkloni bodisi v eno ali drugo smer. Z biserialnim koeficientom korekcije bi mogli pri tem problemu meriti odvisnost med časom, ki ga je študent porabil za pripravo (ta znak dan numerično), in znanjem (ta znak dan alternativno z uspehom pri izpitu). Podobne narave je tudi znak soglasnost: se strinja — se ne strinja. Tudi ta znak ima numeričen koren, čeprav je stopnjo soglasnosti teže izmeriti in more zaradi tega rabiti kot Osnova za izračunavanje biserialnega korekcijskega koeficienta. 62.1 Izračunavanje r bi iz negrupiranih podatkov Če imamo dane individualne vrednosti numeričnega znaka in grupne vrednosti atributivnega — alternativnega znaka, izračunamo r bi po naslednjem postopku: a) Podatke numeričnega znaka y grupiramo po vrednosti alternativnega znaka v dve grupi. b) Izračunamo aritmetični sredini numeričnega znaka y v prvi in drugi grupi: M p in M q . c) Izračunamo standardni odklon znaka y za celotno populacijo a,. d) Po obrazcih 86 izračunamo strukturni delež enot v prvi in drugi grupi. P= — ; 9=1 —P (86) N e) V tablicah normalne distribucije poiščemo k F= p — 0,5 ustrezajočo vred¬ nost ordinate y. f) Biserialni korekcijski koeficient izračunamo iz dobljenih količin po obrazcu M q — M p o, P ■ 9 y (87) Primer 57. Kot primer vzemimo podatke o rezultatih mehanskega in spacialnega testa 20 dijakov klasične gimnazije v Mariboru iz tabele 26. Podatke preuredimo 87 tako, da grupiramo rezultate mehanskega testa v alternativi: dosegel 45 točk in manj in dosegel 46 in več. Prvo grupo zaznamujmo z a, drugo pa z b\ Podatki iz tabele 26, pisani s to modifikacijo, so takile: Tabela 33. Rezultati testiranja zmožnosti presojanja mehanskih (x : a = 45 točk in manj, 6 = 46 točk in yeč) in spacialnih (y) odnosov dvajsetih tretješolcev klasične gimnazije v Mariboru Iz teh podatkov dobimo: N= 20; %=Ar=13 2> a = 559; ^= 13/20= 0,65; M„ = 559/13 =. 43,0 N q =N b =l ; 2y b = 492; q = 1 — 0,65 = 0,35; M q = 492/7 = 70,3 Iz tablic normalne distribucije dobimo: y= y (F= 0,65 — 0,5 = 0,15) = 0,370, a iz primera 52 a,= 20,1 Iz teh podatkov dobimo biserialni korelacijski koeficient po obrazcu z' r bi¬ lo,3 — 43,0 20,1 0,65 • 0,35 0,370 0,835 Pearsonov korelacijski koeficient za iste podatke smo dobili r xy = 0,757. Če upoštevamo majhno populacijo, razlika med obema ni velika. 62.2 Izračunavanje r bi iz grupiranih podatkov Za večje populacije je numeričen znak običajno dan v dveh frekvenčnih distri¬ bucijah, za vsako grupo alternativnega znaka po eno. V tem primeru računamo biserialni korelacijski koeficient r bi po naslednjih stopnjah: a) Dani imamo frekvenčni distribuciji f p in f q za obe grupi alternativnega znaka in skupno frekvenčno distribucijo /. b) Po znanem postopku kumuliranja izračunamo za serijo f p količino A p , za sumarno distribucijo /pa A in B. c) Izračunamo strukturni delež enot v prvi grupi p = N p /N in poiščemo v tablicah normalne distribucije k F= p — 0,5 ustrezajočo ordinato y. Biserialni korelacijski koeficient r bi izračunamo iz teh količin po obrazcu A-p — A p y j/iV (2B A) — A 2 ( 88 ) 88 Primer 58. Kot primer izračunavanja r bi preuredimo podatke iz tabele 30 tako, da bodo dosežki pri sodih nalogah razdeljeni v dve grupi: p: 28 in manj točk in q : 29 in več točk. Tabela 34. Izračunavanje r bi dosežkov pri lihih in sodih nalogah pri testu mehanskega presojanja 414 ljubljanskih dijakov Iz rezultatov tabele 34 dobimo po obrazcu 88 p= 221/414= 0,534 y (F= 0,534 — 0,5 = 0,034) = 0,3975 2239 • 0,534 — 1026 _ 0,3975 J 414 (2 • 5414 + 2239) — 2239“ = + 0,667 Rezultat r bi = -f- 0,667 se slučajno s Pearsonovim korekcijskim koeficientom r xy — +0,677 presenetljivo sklada. 63. Tetrakorični korelacijski koeficient Če ni samo eden, temveč sta oba korelirana znaka z numerično osnovo grupirana v alternativi, moremo v primeru, da predpostavljamo, da sta oba znaka normalno razporejena in linearno odvisna, izračunavati tetrakorični korelacijski koeficient. Ta koeficient je v primeru, da zgornje predpostavke veljajo, dober približek Pearsonovega koeficienta r xy . V primeru take razdelitve populacije je korekcijska tabela taka kot v tabeli 34. 89 Tabela 34. Tetrakorična frekvenčna tabela Obrazcev za ocenjevanje tetrakoričnega korelacijskega koeficienta je več. Na¬ vajamo samo obrazec cosinus pi, ki je od vseh najenostavnejši, če razpolagamo s tablicami trigonometričnih funkcij. Izračun po tem načinu je razviden iz obrazca r, = cos (89) a, b, c in d so frekvence v posameznih poljih štiripoljne tabele 34. Primer 59. Kot primer smo zgrupirali podatke iz korekcijske tabele 30 po znaku x in y v grupi: do 28 točk in manj in 29 točk in več. Tabela 35. Izračunavanje tetrakoričnega korelacijskega koeficienta r, za dosežke pri sodih in lihih nalogah pri testu mehanskega presojanja 414 ljubljanskih dijakov r. = cos ( 180° — 4 — ^ = cos 48°= 0,669 \ j/l58 ■ 145 + ]/48 ■ 63/ Tudi ta ocena se presenetljivo sklada s Pearsonovim korekcijskim koeficientom r xy za isto populacijo. S tetrakoričnim korekcijskim koeficientom moremo ocenjevati korekcijo ne samo numeričnih podatkov, ki jih z grupiranjem privedemo v štiripoljno tabelo, temveč korelacijo med najrazličnejšimi — na prvi pogled nenumeričnimi in celo abstraktnimi — pojavi. Z r, moremo meriti korelacijo med pridnostjo in uspehom, državljansko zavestjo in mnenjem o določenem ukrepu države in tako dalje. 90 64. Korelacijsko razmerje 64.0 Problem Vse dosedanje metode merjenja odvisnosti so bile vezane na pogoj, da sta kore- lirana znaka numerična ali da imata vsaj numerično osnovo. Vendar moremo že z enostavnim primerom spoznati, da obstaja korekcijska zveza tudi med atributiv- nimi znaki. Zmožnost presojanja mehanskih odnosov je na primer odvisna od spola, ki je atributiven znak. Enako so povezane določene zmožnosti delavcev z njihovimi poklici itd. V teh primerih obravnavanih metod ne moremo uporabiti, ker je en znak numeričen, drug pa atributiven (n. pr. testni rezultat — spol). Moremo pa meriti povezanost in odvisnost numeričnega in atributivnega znaka s korelacijskim razmerjem. Korelacijsko razmerje moremo izračunavati v vseh primerih, če je le vsaj eden izmed znakov numeričen, drugi pa je lahko numeričen ali atributiven. Enako ni pogoj za izračunavanje korekcijskega razmerja linearna povezava med znakoma, kot je to pogoj pri r xy , r bi in r,. Področje proučevanja korekcije se s korekcijskim razmerjem znatno razširi. Korekcijsko razmerje je po svoji osnovi indeks korekcije, pri čemer vzamemo kot regresijsko funkcijo serijo grupnih sredin (glej odstavek 60.322 in 60.4!). Ta postopek da indeks korekcije krivuljčne regresije maksimalne povezanosti. Ker pa moremo tvoriti grupe in izračunavati grupne sredine tudi, če so podatki grupirani po atributivnem znaku, ta metoda ni vezana samo na numerične znake. Korekcijsko, razmerje, ki ga na splošno zaznamujemo z if (eta kvadrat), pove, koliki del skupne variance y izvira iz razlik med aritmetičnimi sredinami grup, torej iz odvisnosti od grupnega znaka. Korekcijsko razmerje moremo računati iz grupi¬ ranih in negrupiranih podatkov. 64.1 Izračunavanje tf iz negrupiranih podatkov Iz negrupiranih podatkov izračunamo korekcijsko razmerje if najracionalneje takole: a) Podatke numeričnega znaka y zberemo po grupah koreliranega znaka (numeričnega ali atributivnega). b) Seštejemo podatke y po posameznih grupah. Dobimo Y k . Grupne vsote Y k seštejemo v skupno vsoto Y= 2 Y k . c) Vse individualne podatke y in pod b dobljene vsote Y k in Y kvadriramo. d) Kvadrate vsot Y\ in Y 2 delimo s številom enot N k in N v ustrezajočih grupah. Dobimo Y*/N k in Y*/N= Q. 91 e) Seštejemo kvadrate vseh individualnih podatkov za celo populacijo. Tako dobimo 2> 2 = Q ki . f) Seštejemo izraze Y k /N k za vse grupe. Dobimo 2 Y k /N k = Q k . g) Iz teh količin dobimo korekcijsko razmerje po obrazcu V i xy Qk-Q Qki — Q (90) Opomba: Če se vrednosti celotne populacije vrte okrog neke določene vred¬ nosti y 0 , moremo originalne vrednosti y za to vrednost zmanjšati. Tako dobimo namesto originalnih vrednosti y — y 0 = v. Vrednost korekcijskega razmerja se ne izpremeni, če po zgornjem postopku računamo z v namesto z y. Primer 60. Kot primer vzemimo odvisnost zmožnosti mehanskega presojanja od spola. Podatki so vzeti iz gradiva DAT testiranja za četrtošolce VIII. gimnazije v Ljubljani. Tabela 36. Izračunavanje korekcijskega razmerja zmožnosti mehanskega presojanja v odvisnosti od spola (DAT Ljubljana) N— 12+ 16= 28; Y= 544 + 350 = 894 2y*= 3136 + ...+ 729 = 34264= Q ki Iz teh podatkov dalje dobimo: Q k = y?/Ni + F 2 2 /27 2 = 544 2 /12 + 350+16 = 32317,69 Q = Y*/N = 894 2 /28 = 28544,14 Če vstavimo te podatke v obrazec 90, dobimo , 32317,69 — 28544,14 „ „ V a, =- = °> 66 34264,00 — 28544,14 64.2 Izračunavanje r f iz frekvenčnih distribucij Če so vrednosti numeričnega znaka grupirane v frekvenčnih distribucijah, izračunamo korekcijsko razmerje rf po naslednjih stopnjah: 92 a) Imamo frekvenčne distribucije numeričnega znaka za posamezne grupe f k in sumarno frekvenčno distribucijo /. Grupe z minimalnim številom enot združimo s sorodnimi grupami. b) Za vsako grupno frekvenčno distribucijo izračunamo s kumuliranjem koli¬ čine A k , za sumarno pa A in B. Kontrola: 2A k = A. c) Iz tako dobljenih količin N, A in B, N k in A k izračunamo korelacijsko raz¬ merje po obrazcu ZA\IN k -A*IN ---= rf 2B + A — A*/N (91) Če je populacija razdeljena samo v dve grupi, se korelacijsko razmerje, izračunano po obrazcih 90 in 91, sklada z determinacijskim koeficientom linearne korelacije, pri čemer vzamemo, da so vrednosti ene grupe 0, druge pa 1. Ta korelacija je znana pod imenom točkovno-biserialna korelacija. Primer 61. Za podatke iz korelacijske tabele 30 je treba izračunati korelacijsko razmerje. Pri tem smatramo sode naloge kot grupe. Kontrola: SA k = 43+ 113 + ...+ 453+ 178= 2239= A ZA 2 JN k = 123,27+ 399,03 + ...+ 2974,04+ 1267,36= 12549,28 12549,28 — 12108,99 = - = 0,459 2-5414 + 2239 — 12108,99 Primerjava korelacijskega razmerja rf- = 0,459 z determinacijskim koeficientom r 2 xy — 0,677 2 = 0,457 pokaže, da je povezava med dosežki pri lihih in sodih nalogah linearna, ker je razlika med tema koeficientoma minimalna. Kot je vidno iz primera, smo v skladu s priporočilom v točki a postopka za izračunavanje rf robni frekvenčni distribuciji zaradi majhnega obsega združili s sosednima. Prednost izračunavanja rf- po zgornjem načinu je tudi v tem, da moremo po potrebi izračunati tudi grupne sredine, ki kažejo tip povezanosti. Grupne sredine moremo izračunati po obrazcu • M k = Zo + i y • A k IN k (92) pri čemer je y 0 sredina najnižjega razreda. Če gre samo za tendenco gibanja grupnih sredin, pa zadostuje, da izračunamo samo izraze m k = A k /N k . 93 1 65. Korelacija ranga V psiholoških raziskavah naletimo na vrsto znakov, ki so take narave, da se njih velikost bodisi ne da ali pa le z zelo zapletenimi načini izraziti numerično, čeprav so v osnovi numerični. Tak pojav je na primer: inteligenca, katere stopnjo je sicer možno z objektivnimi sredstvi testiranja meriti, vendar je ta procedura vezana na obsežno delo. Pedagog, ki razmeroma dolgo dela z določenim kolektivom, si o stopnji inteligence svojih dijakov ustvari sodbo, vendar mu je to stopnjo numerično ne¬ mogoče izraziti. Pač pa more po svoji sodbi dijake razvrstiti v rang glede na stopnjo inteligence, enako kot jih more razvrstiti po velikosti, čeprav ne pozna višine posa¬ meznega dijaka. Razvrstitev je tem lažja, čim večje so razlike med posamezniki in tem težja, čim manjše so razlike. Ako dijakom, razvrščenim po stopnji inteligence, koordiniramo zaporedno številko, ta zaporedna številka kot znak kaže stopnjo inteligence. Višja zaporedna številka namreč kaže na višjo stopnjo inteligence, razlika med rangi more rabiti kot mera razlik v inteligenci in tako dalje. To merilo ima sicer svoje hibe, od katerih je največja ta, da so razmaki rangov enaki, čeprav so razlike v stopnji inteligence od dijaka do dijaka verjetno različne. Enako moremo razporediti dijake po drugih lastnostih: zanimanju za določen predmet, sposobnosti, tovarištvu itd., rang pa vzeti kot numerično merilo stopnje teh lastnosti. Tako razširimo področje kvantitativnega proučevanja tudi na znake, ki ali niso numeričnega značaja ali pa je določanje numerične vrednosti pojava težka, imajo pa lastnost, da jih moremo razvrščati po rangu. Ako prenesemo principe korekcijske analize na znake, katere smo karakterizirali z rangi, moremo zaključiti, da je med dvema pojavoma velika, da ne rečemo funkcio¬ nalna pozitivna povezava, če se rangi posameznih enot po enem in drugem znaku ujemajo. Korelacija pa je obratno negativna, če imajo enote, ki imajo visok rang po enem znaku nizek rang po drugem in obratno. Ce vzamemo rang kot numeričen znak, moremo iz rangov za enote populacije, katere smo razvrstili po dveh znakih, izračunati korekcijski koeficient. Postopek izračunavanja koeficienta korelacije ranga g je v primerjavi z izračunavanjem korekcijskega koeficienta r xy znatno enostavnejši. Izračunavamo ga po naslednjem postopku: a) Pripravimo si za vsako enoto populacije individualni obdelovalni listek. b) Na vsak obdelovalni listek napišemo podatke koreliranih znakov za posa¬ mezno enoto. Ti podatki so bodisi numerični, če izračunavamo korelacijo ranga med numeričnimi znaki, ali imena oziroma oznake enot, če izračunavamo korekcijo ranga pojavov, za katere nimamo numerične vrednosti. 95 c) Listke razporedimo po rangu prvega koreliranega znkka, glede na velikost, če je znak numeričen, oziroma glede na poznavanje lastnosti kolektiva, če lastnost, ki jo proučujemo, ni numerično dana. d) Obdelovalnim listkom, ki smo jih razporedili po rangu prvega znaka, vpi¬ šemo po vrsti rang po prvem znaku. Če sta vrednosti dveh enot, ki ju razporejamo v rang, enaki, ali pa se pri nenumerični lastnosti za dve ali več enot ne moremo odločiti za vrstni red, vzamemo kot skupni rang vseh teh enot aritmetično sredino zaporednih številk teh enot. Če sta to na primer pet^ in šesta enota po vrstnem redu, je skupni rang 1 / 2 (5 + 6) = = 5,5. Če je tak primer pri enajsti, dvanajsti in trinajsti enoti, je skupen rang V 3 (11 -}- + 12+ 13)= 12. e) Ko smo na obdelovalne listke vpisali range po prvem znaku, ravnamo enako z drugim znakom. Enote oziroma obdelovalne listke razvrstimo po velikosti drugega pojava; na urejene obdelovalne listke pa vpišemo rang po drugem znaku. f) Za vsako enoto na posameznih obdelovalnih listkih izračunamo razliko obeh rangov, razliko rangov pa kvadriramo. g) Seštejemo kvadrate diferenc rangov za vse enote. Tako dobimo 2 d 2 . h) Iz vsote kvadratov diferenc rangov 2 d 2 in števila enot populacije N dobimo koeficient korelacije ranga po Spearmanovem obrazcu 62d 2 g = 1 - N (N 2 —-1) (93) Spearmanov koeficient korelacije ranga se obnese le za populacije z razmeroma majhnim številom enot. Razvrščanje enot po rangu je tem teže, čim večja je popu¬ lacija, ker so razlike med zaporednimi enotami v tem primeru vedno manjše. Izračunavanje korelacije ranga pa ne pride v poštev samo v primeru, da za proučevani pojav nimamo numeričnega izraza in ni druge možnosti proučevanja korelacije. S pridom jo moremo uporabiti tudi v primerih, če so korelirani znaki dani numerično, hočemo pa hitro in enostavno priti do orientacijskih podatkov o jakosti korelacije. Posebno je ta metoda prikladna za kompleksno analizo odvisnosti velikega števila pojavov, pri kateri iščemo korekcijske koeficiente vseh možnih kombinacij znakov. V tem primeru ravnamo v praksi tako, da na posa¬ mezen obdelovalni listek na način, ki je nakazan zgoraj, vpišemo range posamezne enote po vseh proučevanjih značilnosti populacije. Za vsako enoto izračunamo diference vseh možnih kombinacij po dva ranga, te diference kvadriramo, za po¬ samezno dvojico pojavov za vse enote seštejemo kvadrate diferenc in po obrazcu 93 96 izračunamo vse možne korelacijske koeficiente. Tako je možno z enostavnim po¬ stopkom kompleksno analizirati korelacijo več pojavov hkrati. S korelacijo ranga moremo reševati najrazličnejše probleme. Zmožnost objektiv¬ nega presojanja določenega ocenjevalca merimo s koeficientom korelacije ranga med subjektivno razvrstitvijo ocenjevalca in razvrstitvijo, ki smo jo dobili na objektiven način. Korelacijo med zanimanjem za dva predmeta ali korelacijo med zanimanjem za dve vrsti športnega udejstvovanja za določen manjši kolektiv more izračunati profesor ali športni trener, če le pozna ta kolektiv toliko, da more vsaj kolikor toliko objektivno razvrstiti člane kolektiva po rangu. Primer 62. Kot primer izračunajmo koeficient korelacije ranga iz podatkov rezultatov testiranja zmožnosti presojanja mehanskih in spacialnih odnosov za 20 dijakov mariborske klasične gimnazije iz tabele 26. V celoti izdelamo torej 20 obdelovalnih listkov. Na vsak listek napišemo po¬ datka x in y za vsako enoto. Z razvrščanjem po znaku x dobimo rang za prvi, z razvrščanjem po znaku y pa rang za drugi znak. Poiščemo razlike rangov, te kvadriramo, seštejemo in vstavimo v obrazec 93. Postopek je prikazan v tabeli 37, v kateri vsaka vrsta ustreza enemu obdelovalnemu listku. Tabela 37. Izračunavanje korelacije ranga med zmožnostjo presojanja mehanskih in spacialnih odnosov 20 dijakov mariborske klasične gimnazije (* = mehanski, v = spacialni) 289,50= 2 d 2 7 — Statistične metode 97 Po Spearmanovem obrazcu dobimo: 6 ■ 289,50 6 = 1 -- 20 • ( 20 2 — 1 ) 0,77 Razlika med Pearsonovim korelacijskim koeficientom r xy = 0,76 in Spearma- novim koeficientom korelacije ranga = 0,77 za iste podatke je minimalna. Pripom¬ niti moramo, da rezultati praviloma niso tako podobni. 66. x 2 (hi kvadrat) 66.0 Problem Do sedaj obravnavani načini merjenja korelacije so bili omejeni na numerične znake, z edino izjemo korelacijskega razmerja. Vendar moremo govoriti tudi o pove¬ zanosti med atributivnimi znaki. Tako na primer obstaja povezava med barvo predmeta, ki je bil pokazan otroku, in njegovo izjavo, ki jo da po določenem času o tem, kakšne barve je predmet. Čim večja je pri otrocih zmožnost razpoznavanja barv, tem večja je korelacija med dejansko barvo predmetov in izjavami otrok. Povezave in odvisnosti med atributivnimi znaki prikazujemo s kontingenčnimi tabelami. Kontingenčna tabela je kombinacijska frekvenčna distribucija dveh kore- liranih atributivnih znakov in je po svoji osnovi podobna korelacijski tabeli za numerične znake. Obe sta kombinacijski frekvenčni distribuciji in obe prikazujeta korelacijo — ena numeričnih, druga pa atributivnih znakov. Kontingenčna tabela je na primer tabela 38, ki prikazuje soročnost izdelave poskusnih ključev 493 delavcev. Tabela 38. Kontingenčna tabela med hitrostjo in kvaliteto izdelave poizkusnih ključev za 493 delavcev kovinske stroke Če kvaliteta dela ne bi bila odvisna od hitrosti, bi bila struktura izdelkov po kvaliteti za vse stopnje hitrosti enaka. Z drugimi besedami: Delež onih, katerih izdelki so nadpovprečni, bi bil enak pri hitrih, zmernih ali počasnih delavcih. Ustrezne 98 strukture, izračunane iz podatkov v tabeli 38, in grafikoni v slikah 6 in 7 pokažejo, da ni tako. Iz tabele 39 vidimo, da je samo 10,9 °/o onih, ki so delali hitro, do¬ seglo nadpovprečno kvaliteto svojih izdelkov. Ta odstotek pa se s počasnejšim tempom dela veča in doseže pri onih, ki so delali počasi, 39,5 %• Očitna je odvisnost kvalitete od hitrosti dela. Tabela 39. Strukture kvalitete izdelave poskusnih ključev po hitrostnih stopnjah za 493 delavcev kovinske stroke v LRS V primeru, da kvaliteta ne bi bila odvisna od hitrosti dela, bi morale biti struk¬ ture kvalitete za posamezne stopnje hitrosti med seboj enake, in sicer identične s skupno strukturo po kvaliteti (pp = 17,0 °/ 0 ; p = 67,7 °/o; np = 15,3 °/o). Kakšne pa bi bile frekvence v primeru neodvisnosti med hitrostjo in kvaliteto, moremo izračunati po splošnem obrazcu izračunavanja teoretičnih frekvenc f t v primeru neodvisnosti f fufj± ( 94 ) N Pri tem pomeni: f t = teoretična frekvenca danega polja kontingenčne tabele; f u = dejanska robna frekvenca kolone, na katero se nanaša f t \ f v = dejanska robna frekvenca vrste, na katero se nanaša /,. Primer 63. Teoretične frekvence f, za kontingenčno tabelo 38 so prikazane v tabeli 40. Tabela 40. Teoretične frekvence kontingenčne tabele med kvaliteto in hitrostjo izdelave poskusnih ključev 493 delavcev kovinske stroke v LRS 99 f t za prvo polje je: 174 • 84 f t za zadnje polje je: ft = 493 29,65 ft = 39 • 75 493 = 5,93 V tabeli 40 je nakazan princip, iz katerih robnih frekvenc izračunamo posamezno teoretično frekvenco. Najenostavneje je, da v prazno kontingenčno tabelo vpišemo najprej robne frekvence, nato pa postopoma izračunavamo in vpisujemo v tabelo teoretične frekvence. Začuditi nas ne sme, da so frekvence f„ čeprav pomenijo število enot, decimalna števila, ker so teoretične frekvence f, izračunane vrednosti. Čim bolj sta pojava med seboj odvisna, tem večje so razlike med stvarnimi — / in teoretičnimi — / ( frekvencami. Zaradi tega izkoriščamo kot merilo povezanosti dveh pojavov ravno razlike med stvarnimi in teoretičnimi frekvencami in z njihovo pomočjo izračunavamo koeficient, ki ga zaznamujemo s y‘ l (hi kvadrat). Osnovni obrazec izračunavanja y' 2 je obrazec X 2 = (95) 66.1 Izračunavanje 66.11 Osnovni obrazec. Izračunavanje po osnovnem obrazcu 95 ima na¬ slednje stopnje: a) Imamo kontingenčno tabelo dveh znakov /. b) Iz robnih frekvenc izračunamo po obrazcu 94 teoretične frekvence f t . c) Izračunamo tabelo diferenc ustrezajočih stvarnih in teoretičnih frekvenc f~ft- d) Dobljene diference kvadriramo in vpišemo v tabelo kvadratov diferenc e) Kvadrate diferenc delimo z ustreznimi teoretičnimi frekvencami: (/ — /,) 2 //,. f) Dobljene izraze seštejemo in dobimo y\ Primer 64. Izračunali bomo y- odvisnosti med kvaliteto in hitrostjo izdelave ključev iz tabele 38. Teoretične frekvence f, smo izračunali že v primeru 63. V na¬ daljevanju ne bomo nakazali praktičnega izračunavanja po zgornjih sistematičnih točkah, temveč samo direkten račun po obrazcu 95. 100 (29 — 29,65) 2 (126—117,88) 2 , , (190— 189,70) 2 , % 2 = - h - + •••H- 29,65 117,88 189,70 (18— 26,42) 2 (15—5,93) 2 26,42 + 5,93 •= 15,41 66.12 Alternativni obrazec. Izračunavanje po osnovnem obrazcu se obi¬ čajno izkaže kot neprikladno. Treba je izračunavati diference decimalnih števil in decimalna števila kvadrirati. Zaradi tega je včasih ugodneje izračunati %- po alterna¬ tivnem obrazcu X'=r*2P!f t — N (96) Izračunavanje po tem obrazcu ima naslednje faze: a) Imamo kontingenčno tabelo /. b) Iz robnih frekvenc izračunamo po obrazcu 94 teoretične frekvence j\. c) Izračunamo tabelo kvadratov stvarnih frekvenc / 2 . d) Izračunamo tabelo kvocientov dobljenih kvadratov / 2 in ustrezajočih teore¬ tičnih frekvenc /,: p//,. e) Izraze p/f t seštejemo, od vsote pa odštejemo N. Tako dobimo y \ Primer 65. Za podatke iz tabele 38 je izračun po tem postopku naslednji: Tabela 41. Izračunavanje + odvisnosti med kvaliteto in hitrostjo pri izdelavi poskusnih ključev za 493 delavcev kovinske stroke v LRS po alternativnem obrazcu 2P!f,= 28,37+ 53,33 + ...+ 39,46+ 37,92= 508,41, po obrazcu 96 dobimo z * = 508,41 —493= 15,41 66.13 Izračunavanje %" brez teoretičnih frekvenc f t . Kadar za druge namene ne potrebujemo teoretičnih frekvenc f„ skrčimo računski posel na najmanjšo mero, če računamo po naslednjem postopku: a) Imamo kontingenčno tabelo /. b) Izračunamo tabelo kvadratov stvarnih frekvenc/ 2 . c) Dobljene kvadrate delimo z ustrezajočimi vrstnimi robnimi frekvencami f v . Kvadrate prve vrste kontingenčne tabele delimo s prvo, kvadrate druge vrste z drugo robno vrstno frekvenco in tako dalje. Dobimo / 2 // v . 101 d) Dobljene kvociente seštejemo po kolonah kontingenčne tabele. Dobimo zpip. e) Te vsote delimo z ustrezajočimi robnimi frekvencami kolon f u . Dobimo izraze (2Plf v )lf u . f) Če te kvociente seštejemo, od vsote pa odštejemo 1, dobimo H. 2 t-S (/7/v)//J — 1= H. g) Če H pomnožimo z JV, dobimo y\ Primer 66. Za podatke iz tabele 38 je račun po tej metodi naslednji: Tabela 42. Izračunavanje y 2 odvisnosti med kvaliteto in hitrostjo pri izdelavi poskusnih ključev za 493 delavcev kovinske stroke v LRS po skrajšani metodi /„ = 84 334 75 (2Plfv)lf u = 0,17059 0,68407 0,17659 H= 2 [(^/7/v)//J - 1 = 0,03125 x 2 = HN= 0,03125 -493 = 15,41 66.14 % 2 12 2 X r tabele. Izračunavanje -p se še dalje poenostavi, če ima kon- tingenčna tabela po enem znaku samo dva razreda. Tako tabelo na kratko zaznamu¬ jemo z 2 X r tabelo, za razliko od splošne, ki jo moremo zaznamovati z r X s tabelo (glede na število polj). Tabela 42. Shema kontingenčne tabele 2 x r /t /, | / Ni - - Pl = — JV, JV, | JV N V shemi v tabeli 42 j e/, frekvenčna distribucija po prvi,/ 2 frekvenčna distribucija po drugi grupi znaka z dvema grupama, / pa skupna frekvenčna distribucija. Enako je Ni število enot v prvi, JV, število enot v drugi grupi, N pa skupno število enot. Pi je strukturni delež prve grupe. Glede na to simboliko izračunavamo za 2 X r distribucijo po treh obrazcih. Obrazec 97 je splošen. Kot grupo 1 vzamemo grupo, ki je po obsegu manjša. Če sta Ni in N s približno enaka, je enostavneje uporabljati obrazec 98, ker zmanjša števila, s katerimi računamo. Če pa sta J^ in JV, enaka, je najprikladnejši obrazec 99. 102 66.141 Splošen obrazec. Po obrazcu 97 izračunamo y 2 po naslednjih stopnjah: a) Imamo kontingenčno tabelo 2 X r. b) Izberemo grupo z manjšim skupnim številom enot N x . c) Frekvence te grupe, vključno N, kvadriramo. Dobimo f \ in N\. d) Dobljene kvadrate delimo z ustrezajočimi skupnimi frekvencami /, enako TV 2 z N. Dobimo izraze /j 2 // in izraz Ni/N. e) Seštejemo izraze / 2 //. Dobimo 2 fl/f. f) Izračunamo p t = NJN. g) Vse dobljene izraze vstavimo v obrazec IfHf-NUN Pi (1 —Pi) (97) Primer 67. Iz študija zaznavanja barv izračunajmo po zgornjem postopku y 2 odvisnosti pravilnega zaznavanja barv za štiriletne dečke. Frekvence pomenijo, v koliko primerih so preizkušani otroci po določenem času pravilno oziroma ne¬ pravilno ocenili barvo pokazanega predmeta. Tabela 43. Izračunavanje / 2 iz 2 X r tabele pravilnega zaznavanja barv za štiriletne otroke Pl = 153/320= 0,478 Iz količine iz tabele 43 dobimo po obrazcu 97 0,478 (1 — 0,478) Kot grupo 1 smo izbrali grupo nepravilnih z Ni — 153, ker je numerus N manjši kot drugi. Računanje z drugo grupo ne bi bilo nepravilno, le podatki, s ka¬ terimi bi računali, bi bili večji. 66.142 N Ra N. Če sta N, in N, v 2X r tabeli med seboj približno enaka , je praktičneje izračunati / 2 po postopku, ki je zgornjemu podoben, vendar v osnovi drugačen. Faze tega postopka so: a) Imamo kontingenčno tabelo 2 X r. b) Izračunamo diference frekvenc f t — / 2 , vključno sumo: N — N 2 . 103 c) Kvadriramo serijo diferenc j\ — / 2 , vključno V. —• V 2 . Tako dobimo Oi — /a) 2 in (Vi — V) 2 . d) Dobljene kvadrate delimo z ustrezajočimi skupnimi frekvencami /, enako (V —• V) 2 z N. Dobimo izraze (/j — / 2 ) 2 // in (V — V) 2 /V e) Seštejemo dobljene izraze. Dobimo: Z (Ti — A) 2 // f) Izračunamo p t = V/V g) Vse zgornje izraze vstavimo v obrazec 98 in dobimo 7 2 . s (/i ~/ 2 ) 3 (V-V) 2 4/>i (1 —Pi) Primer 68. Za iste podatke, kot so v primeru 67, izračunajmo y; po drugem sistemu. Uporaba tega načina je upravičena, ker sta V== 167 in V = 153 malo različna. Tabela 44. Izračunavanje 7 2 iz 2 X r tabele pravilnega zaznavanja barv štiriletnih otrok po metodi diferenc frekvenc Pi = 167/320 = 0,522 Če vstavimo v tabeli dobljene izraze v obrazec 98, dobimo 10,15 — 0,6125 / 2 = -1-—2-= 9,54 4-0,522-(1—0,522) Dobili smo isti rezultat z znatno manjšimi podatki. 66.143 M = V 2 . Če je število enot N v tabeli 2 X r enako: Vi = V 2 , se izračuna¬ vanje še poenostavi z naslednjim postopkom: a) Imamo kontingenčno tabelo 2 X r, v kateri je Vi = V 2 . b) Enako kot pri prejšnji metodi izračunamo diference frekvenc (/j—/ 2 ), kvadrate diferenc (/j — / 2 ) 2 , te kvadrate delimo z ustrezajočimi skupnimi frekven¬ cami /, da dobimo izraze (f — / 2 ) 2 //. Vsota teh izrazov je direktno enaka ker za primer Vi = V 2 velja obrazec Z (/i —/ 2 ) 2 // (99) 104 Ta način je izredno preprost, v praksi pa pride dostikrat v poštev. Pri eksperimental¬ nem delu poleg eksperimentalne grupe dostikrat vzamemo tako imenovano kontrolno grupo z enakim številom enot kot v eksperimentalni grupi. Pogoji ene in druge grupe so različni, s pa merimo odvisnost proučevanega pojava od spremembe pogojev. Primer 69. Iz ankete specialne grupe 58 otrok (eksperimentalna grupa ■— E) smo dobili podatke o nevrotskih simptomih otrok. Da ugotovimo, koliko so ti simptomi karakteristični za to grupo, smo anketirali še 58 otrok, ki izhajajo iz drugega — normalnega okolja (kontrolna grupa — K). % 2 naj pokaže jakost odvisnosti nevrot¬ skih motenj od grupe. Tabela 45. Izračunavanje f iz 2 x r tabele odvisnosti nevrotskih motenj eksperimentalne grupe otrok 66.15 f iz 2X2 tabele. Ako je kontingenčna tabela oblike 2 X 2 (po obeh koreliranih znakih po dve grupi), moremo z obrazcem 100 izračunati direktno N (a d — cbY {a + b) (c d) (a + c) (b + b ) ( 100 ) Pri tem so frekvence kontingenčne tabele zaznamovane tako, kakor je nakazano v tabeli 46. Vendar se izkaže, da je v dosti primerih tudi za tabele 2x2 primerneje računati % 2 po enem izmed obrazcev izračunavanja %" za tabele 2 X r, ki so opisane v odstavku 66.14. Primer 70. Za primer odvisnosti zaznavanja zelene barve od spola za predšolsko mladino je postopek po obrazcu 100 naslednji: Tabela 46. Izračunavanje iz 2 X 2 tabele o odvisnosti zaznavanja zelene barve od spola za predšolske otroke 105 Po obrazcu 100 dobimo 800 (196 • 188 — 212 • 204) 2 408 • 396 • 400 • 400 67.

dostikrat iz njega izračunavamo

-oo n je ta definicija pisana v matematični obliki. Pri tem je P(A) verjetnost, da se dogo¬ dek A zgodi, n A število primerov, v katerih se je dogodek A zgodil, n pa število vseh primerov, v katerih bi se dogodek A mogel zgoditi. Verjetnost, da pri metu kocke vržemo šestico, dobimo po tem principu tako, da kocko mečemo v zrak, štejemo število metov n in registriramo število metov, pri katerih smo vrgli šestico n A . Če bi število metov ponavljali v nedogled, bi razmerje n A /n bilo enako verjetnosti, da vržemo šestico — dobljeni aposteriorno. Jasno je, da tako do vrednosti verjetnosti za konkretne dogodke nikdar ne moremo priti, ker je nemogoče realizirati neomejeno število dogodkov. Vendar pa vemo, da se po zakonu o velikih številih kvocient n A /n vedno bolj približuje vrednosti verjet¬ nosti za dani dogodek, čim večje je število možnih dogodkov. Tako se moremo vrednosti verjetnosti poljubno približati, če število dogodkov večamo. Iz definicije verjetnosti vidimo, da je verjetnost pozitivna količina med 0 in 1. Verjetnost je 0 v primeru, da je dogodek neverjeten, 1 pa v primeru, da je dogodek gotov. Vmesne stopnje kažejo večjo ali manjšo verjetnost. Medtem ko v vsakdanjem življenju stopnjo verjetnosti izražamo z izrazi: neverjeten, malo verjeten, verjeten, zelo verjeten, gotov, v matematičnem smislu verjetnost objektivno merimo z vred¬ nostmi med 0 in 1. 71.3 Apriorna verjetnost Do verjetnosti, da s kocko vržemo šestico, pa moremo priti tudi drugače. Ker poznamo lastnosti kocke, vemo, da je skupno šest različnih možnih dogodkov, če štejemo met vsake izmed šestih številk kocke kot različen dogodek. Če je kocka pravilna (ni obtežena na določenem mestu), pravimo, da je met vsake izmed šestih številk enako možen, ker ni razloga, če je kocka pravilna, da bi imela ena številka večjo možnost kot druga. V velikem številu metov bi se po tem sklepu vsaka številka pojavila približno enako mnogokrat, v limiti pa enakokrat, ali številčno izraženo 109 v Ve vseh primerov. Tako smo prišli do vrednosti verjetnosti, na osnovi poznava¬ nja lastnosti kocke same, ne da bi realizirali neomejeno ali zelo veliko število metov. Ta način določanja verjetnosti imenujemo apriorni način. Po tej definiciji je verjetnost danega dogodka kvocient med številom ugodnih in skupnim številom enakomožnih dogodkov ali relativna frekvenca dogodka v skupnem številu vseh enakomožnih dogodkov. Ta princip pa predpostavlja poznavanje vseh možnih dogodkov in raz¬ stavljanje te mase dogodkov na enakomožne. 71.4 Seštevanje verjetnosti Verjetnostni račun dopušča z verjetnostmi niz računskih operacij, od katerih bomo omenili samo seštevanje verjetnosti, ker ga bomo direktno potrebovali v vzor¬ čenju. Če je verjetnost, da vržemo s pravilno kocko šestico, enaka Ve in verjetnost, da vržemo petico, enaka Ve, je verjetnost, da vržemo petico ali šestico enaka P(5 ali 6) = = P(5) -j- P( 6) = 1/6 + 1/6 = 2/6. Verjetnosti moremo torej seštevati. Vendar moramo biti pri tej operaciji oprezni. Enostaven način seštevanja verjetnosti pride v poštev samo pri dogodkih, ki se izključujejo, kar pomeni, da dogodka ne moreta nastopiti istočasno. Pri kocki je to primer. Če pade petica, ne more namreč istočasno pasti še šestica. Kot nasproten primer vzemimo igralne karte. Imamo 32 igralnih kart in iz njih povlečemo karto. V celoti imamo 32 enakomožnih različnih dogodkov, ker imamo 32 kart, ki niso zaznamovane in ni razloga, da bi bila možnost za posa¬ mezne karte različna. Če skušamo ugotoviti, kakšna je verjetnost, da potegnemo karo, je ta verjetnost enaka P (karo) = 8/32, ker je od vseh 32 enakomožnih do¬ godkov 8 kar, torej osem ugodnih. Verjetnost, da potegnemo as karto, je po istem sklepu P (as) = 4/32, ker so v kartah štirje asi. Po zgornjem principu seštevanja bi morala biti verjetnost, da potegnemo karto, ki je karo ali as, enaka P (karo ali as) = P (karo) + P (as) = 8/32 -f 4/32 = 12/32. Vendar se izkaže, da ni tako. Pregled kart pokaže, da je od 32 kart samo 11 takih, ki so karo ali as, ker karta »karo as« istočasno združuje obe karakteristiki. Verjetnost, da potegnemo karo ali as, je torej 11/32 in ne 12/32, kot smo izračunali zgoraj. Dogodka »izvlačenje kare« in »izvlačenje asa« se ne izključujeta, ker imamo dogodek, ki istočasno spada v prvo in drugo grupo. V primeru dogodkov, ki se ne izključujejo, seštevamo verjetnosti torej po obrazcu P (A ali B) = P (A) + P (B) —P (A in B ) (105) 110 pri čemer pomeni P (A in B) verjetnost, da se zgodi A in B istočasno. Ta obrazec vključuje tudi primer dogodkov, ki se izključujejo, ker je v tem primeru P (A in B) = 0. Primer 71. Kolika je verjetnost, da iz normalno distribuirane populacije na slepo potegnemo enoto, za katero je standardiziran odklon z manjši kot — 1,96 ali večji kot + 1,96. Po načelu apriornega določanja verjetnosti je verjetnost nekega dogodka enaka relativni frekvenci dogodka v populaciji enako možnih. S tem da smo rekli, da izbiramo iz normalne populacije na slepo, je enakomožnost zagotovljena. Ver¬ jetnost, da potegnemo enoto, katere standardiziran odklon je manjši kot — 1,96, je po tablicah relativne frekvence normalne distribucije enaka P(z< — 1,96) = = 0,025. Verjetnost, da potegnemo enoto, ki ima z večji kot + 1 ,96 pa P (z > + + 1,96)= 0,025. Ta dva dogodka se izključujeta, ker ne moremo potegniti enote, za katero bi bil z istočasno manjši od —1,96 in večji kot +1,96. Verjetnost, da potegnemo enoto, za katero je z manjši kot —1,96 ali večji kot +1,96, je enaka navadni vsoti obeh verjetnosti, torej: P (z <2 — 1,96 ali z> + 1,96) = 0,025 + + 0,025 = 0,05. Primer 72. Kolika je verjetnost, da iz normalno distribuirane populacije izvle¬ čemo na slepo enoto, za katero bo z.<+0,45 ali v intervalu 0 < z < + 1,645. Ta dva dogodka se ne izključujeta, ker so vse vrednosti z na intervalu od 0 do + 0,45 take, da istočasno spadajo v prvo in drugo grupo. Zaradi tega je: P (z < + 0,45 ali 0 < z < + 1,645) = P (z < 0,45) + P (0 < z < 1,45) — — P (0 < z < 0,45) = 0,8326 + 0,4500 — 0,3264 = 0,9500 71.5 Princip ocenjevanja Vzemimo da iščemo verjetnost, da iz žare s 5000 anketnimi listi za moške in ženske potegnemo na slepo popisnico za žensko osebo. To verjetnost moremo poiskati na dva načina: apriorno in aposteriorno. Če iščemo verjetnost apriorno moramo prešteti, koliko je v žari popisnic, ki se nanašajo na ženske, in najdemo, da je to število 2000. Ker smatramo zaradi izvlačenja na slepo, da je enaka možnost, da potegnemo katero koli popisnico, je po sistemu apriornega izračunavanja verjetnosti, verjetnost, da potegnemo popisnico za žensko, enaka P(Ž) = 2000/5000 = = 0,40. Ta način se sklada po svoji osnovi s statističnim popisom, pri katerem pre¬ gledamo vse enote populacije, rezultat, ki smo ga dobili, pa je identičen z relativno frekvenco oziroma s strukturnim deležem žensk v celotni populaciji, kar je važen statistični parameter. Do verjetnosti, da potegnemo iz žare popisnico za žensko, če je izvlačenje na slepo, pa moremo priti tudi aposteriorno. Po tem načinu dobimo oceno verjetnosti, če na slepo izvlačimo posamezne popisnice, kot razmerje med številom izvlečenih popisnic, ki so se nanašale na ženske, in skupnim številom na slepo izvlečenih popisnic. n A (n je ocena te verjetnosti in obenem, kot sledi iz apriorne definicije, ocena strukturnega deleža žensk v populaciji. To razmerje je pravi vrednosti strukturnega deleža po zakonu velikih števil tem bliže, čim več popisnic smo izvlekli iz žare. Izkazati pa se more, da smo prišli do zadostno zanesljive 111 ocene z izvlačenjem na slepo laže, ceneje in hitreje, kot pa s celotnim pregle¬ dom vseh enot — popisom, ker nam je bilo treba pregledati le del enot populacije. Ta princip je osnovni princip načina ocenjevanja z vzorčenjem. Iz tega primera moremo zaključiti, kar bomo kasneje poudarjali še na več mestih, da je osnovna naloga uporabe metod vzorčenja, zagotoviti enakomožnost izvlačenja za vse enote. To dosežemo z izborom na slepo ali slučajnim izborom. Le v tem primeru velja mehanizem verjetnostnega računa, ki omogoča, da te rezultate uporabimo kot ocene. 71.6 Distribucije verjetnosti V nadaljevanju bomo imeli veliko opravka z distribucijami verjetnosti najraz¬ ličnejših izrazov. Te distribucije relativnih frekvenc določenih izrazov imenujemo distribucije verjetnosti. To pa zaradi tega, ker pokažejo, s kakšno verjetnostjo mo¬ remo pričakovati določene vrednosti teh izrazov. Ena izmed takih distribucij je normalna distribucija, katero smo že podrobneje obravnavali. Relativna frekvenca vrednosti normalno distribuirane populacije v določenem intervalu se grafično ujema s površino pod normalno distribucijo v tem intervalu. Ta relativna frekvenca je verjetnost, s katero moremo pričakovati, da, ako na slepo potegnemo iz normalne distribucije enoto, vrednost te enote pade v ta interval. V sliki 12 imamo narisane različne površine pod normalno distribucijo. Te površine predstavljajo relativne frekvence v teh intervalih, oziroma verjetnosti, da je vrednost v naznačenih intervalih. Vse izmed naznačenih površin — verjetnosti pridejo v poštev v praksi ocenjevanja z vzorci. Poleg normalne distribucije imamo še distribucije verjetnosti drugih izrazov. Osnova in pomen teh je identičen z osnovo in pomenom normalne verjetnostne distribucije. 71.7 Pojem rizika Z dogodki, ki nastopajo z veliko verjetnostjo, računamo v vsakdanjem življenju kot z gotovimi. Ko prekoračimo cesto, z gotovostjo računamo, da nas ne bo povozil avtomobil, čeprav obstaja določena verjetnost, da se bo to zgodilo. Ta verjetnost pa je tako majhna, da jo praktično zanemarjamo. Vse dogodke, ki nastopajo z veliko verjetnostjo, smatramo praktično kot gotove, čeprav je neka verjetnost, da se dogodek, ki ga z gotovostjo pričakujemo, ne bo zgodil. V vseh teh absolutnih izjavah je določena stopnja rizika, ki je merjen z verjetnostjo, da se dogodek, katerega smatramo za gotovega, ne bo zgodil. Vsi statistični zaključki, ki spadajo v področje ocenjevanja z vzorčenjem, so v bistvu enaki zgornjemu načinu zaključevanja. Vsak zaključek, ki ga napravimo, in 112 rezultat, ki ga damo, ne drži absolutno, temveč z določeno stopnjo rizika. Stopnje rizika, s katerimi delamo zaključke, so različne: 0,10, 0,05, 0,01, 0,001, odvisno od problema. Najpogosteje delamo sklepe s 5°/o rizikom, kar pomeni, da take trditve v povprečju v enem primeru od dvajsetih ne drže. Primer 73. Vse možne vrednosti normalne distribucije leže na intervalu od — co do +oo. Vendar so z verjetnostjo 0,99 na intervalu od M — 2,57 a do M+ 2,57o. Če trdimo: »Vse vrednosti normalne distribuirane populacije so med M — 2,51 o do M+ 2,57a,« je riziko te izjave 1,00 — 0,99 = 0,01. To po¬ meni: če bi nekdo našo izjavo skušal preveriti, bi v povprečju v enem izmed sto preizkusov dokazal, da naša trditev ne velja. Podobno moremo za normalno distribucijo postaviti trditev: standardiziran odklon z za normalno distribucijo je manjši kot + 1,645. Riziko te izjave je 0,05, ker je 0,05 vseh vrednosti populacije nad to mejo. Tabele t, + in F distribucij v dodatku pokažejo — z določeno stopnjo rizika P, ki je v tabelah označen — pod katerimi vrednostmi leže te količine. 72. Veliki vzorci 72.1 Populacija. Vzorec. Populacija vseh vzorcev Kakor že vemo, smatramo kot populacijo v statističnem smislu skupnost vseh sorodnih pojavov, ki zadoščajo danim pogojem in so predmet našega proučevanja. Tako morejo biti populacija vsi učenci tretjega razreda vseh srednjih šol v LR Slo¬ veniji, skupnost vseh delavcev kovinske stroke v Jugoslaviji, skupnost vseh pred¬ metov, ki jih je napravila določena skupina oseb pod določenimi pogoji dela in tako dalje. Statistika z deskriptivnimi metodami opisuje populacije s parametri, kot so: sredine, mere variacije, koeficienti korelacije in tako dalje. Raziskovanja, v katerih iščemo prave vrednosti parametrov, so časovno dolgo¬ trajna, tehnično težko izvedljiva in draga, ker so populacije običajno po številu enot zelo obsežne. Imamo celo primere, da imajo populacije neomejeno število enot. Take populacije so v psihologiji zelo pogoste. Dostikrat namreč formiramo tako imenovane hipotetične populacije, ki so sestavljene iz neomejenega števila umišljenih enot — vseh možnih poskusov, testov, mnenj in tako dalje — ki bi jih dobili, če bi mogli naše poskuse, teste, anketiranja ponavljati pod enakimi pogoji v nedogled. Jasno je, da takih populacij ne moremo realizirati, morejo pa brez nadaljnjega na¬ stopati kot populacije v pravem smislu. Prav iz potrebe raziskav hipotetičnih popu¬ lacij, ki jih s popolnim opazovanjem ne moremo analizirati, je izšlo vprašanje, ali je možno opisovati in analizirati populacijo, če nam je znan samo razmeroma majhen 8 — Statistične metode 113 del enot, ki to populacijo sestavljajo. Izkazalo se je, da je to možno in da je naj- objektivnejši način takega opazovanja, da so enote te delne populacije izbrane na slepo. O ocenjevanju na osnovi slučajno izbrane delne populacije se je razvila po¬ sebna metoda — metoda vzorčenja. Vzorčenje omogoča dosti kompleksno ocenje¬ vanje parametrov in analiziranje populacij. Glavne prednosti te metode pred ostalimi metodami, ki imajo tudi za cilj sklepanje iz dela populacije na celoto, so: a) metoda vzorčenja je objektivna metoda; b) zanesljivost ocen se da izmeriti; c) zanesljivost ocen moremo poljubno regulirati. Skupnost enot, ki smo jih iz populacije izbrali slučajno, imenujemo vzorec. Število enot v vzorcu po pravilu zaznamujemo z n, za razliko od števila enot populacije, ki ga zaznamujemo z N. Iz podatkov vzorca izračunavamo ocene para¬ metrov populacije. Tako je na primer aritmetična sredina vzorca x ocena parametra •— aritmetične sredine populacije M x . Vzemimo, da imamo populacijo, ki sestoji iz N — 1000 oseb. Iz te populacije izberemo po slučajnem načinu vzorec n = 100 oseb. Če teh sto oseb testiramo in iz rezultatov testiranja vzorca izračunamo aritmetično sredino x u je ta sredina karak¬ teristika tega vzorca. Izbor ponovimo in iz populacije izberimo po istem postopku zopet n — 100 oseb, jih testiramo, iz rezultatov pa izračunamo aritmetično sredino x 2 . Zelo verjetno bo novi vzorec vseboval druge osebe kot prvi, izračunana sredina pa bo različna od prve. Iz iste populacije moremo enako izbirati naprej tretji, četrti, peti itd. vzorec po 100 oseb. Število vseh možnih različnih vzorcev po n = 100 enot iz populacije z N = 1000 enotami je ogromno (število s 146 decimalnimi mesti). Jasno, da morejo pri ponovnih izborih iste osebe biti večkrat izbrane, toda v drugi kombinaciji. Za vsak vzorec po n = 100 oseb bi mogli izračunati aritmetično sredino vzorca x. Ako analiziramo skupnost vseh možnih različnih vzorcev in njih aritmetične sredine, spoznamo, da predstavlja skupnost vseh možnih vzorcev populacijo v statističnem smislu. V tej populaciji je posamezen vzorec enota populacije, aritmetična sredina vzorca pa statistični znak. Populacija vseh možnih vzorcev ima vse značilnosti sta¬ tističnih populacij: sestavljena je iz sorodnih enot — vzorcev, ki imajo svoje znake — ■ aritmetične sredine, ki variirajo. 72.2 Ocenjevanje aritmetične sredine 72.21 Vzorčna distribucija sredin. Da bi dobili pregled vseh vrednosti aritmetičnih sredin populacije vseh možnih vzorcev, bi morali realizirati vse možne vzorce, za vsakega izmed njih izračunati aritmetično sredino x, sestaviti frekvenčno distribucijo vseh vrednosti aritmetičnih sredin, iz te pa izračunati parametre populacije 114 vseh možnih vzorcev, kot so: aritmetična sredina sredin vseh vzorcev M-, standardno deviacijo sredin vseh vzorcev o 2 - itd. Po tej poti je seveda zaradi preogromnega števila vseh možnih vzorcev nemogoče priti do cilja. Aritmetično sredino vzorca zaznamujemo na splošno z x (x prečna) za razliko od aritmetične sredine populacije M x . x izračunavamo po obrazcu x = - Sx (106) n Pri tem pomeni S sumiranje v vzorcu, za razliko od 2, ki pomeni sumiranje v populaciji. Teorija vzorčenja pa je indirektno odkrila osnovne zakonistosti distribuiranja aritmetičnih sredin populacije vzorcev. Te zakonitosti so: a) Frekvenčna distribucija aritmetičnih sredin vseh vzorcev je normalna distri¬ bucija. Za populacije, za katere je x normalno distribuiran, velja ta zakonitost na splošno, če se v osnovni populaciji x distribuira drugače, pa le, če vzorec ni premajhen. b) Aritmetična sredina aritmetičnih sredin vseh vzorcev M- je enaka aritme¬ tični sredini x v populaciji M x M-.= M X (107) c) Standardni odklon aritmetičnih sredin vzorcev, ki ga imenujemo standardna pogreška ocene sredine, zaznamujemo pa s SE-, izračunamo po obrazcu SE-=^L (108) /n Standardna pogreška ocene aritmetične sredine je torej odvisna od standardnega odklona v populaciji o x in velikosti vzorca n. Ker je normalna distribucija določena z aritmetično sredino in standardnim odklonom, je, kot vidimo iz točk a, b in c, distribucija sredin vzorcev popolnoma znana, če poznamo M x in o x populacije in velikost vzorca n. 72.22 Ocena. Interval in meje zaupanja. Iz zgornjih zakonitosti moremo napraviti nadaljnje zaključke: Aritmetične sredine vzorcev x se odklanjajo od aritme¬ tične sredine populacije M navzgor in navzdol. Bolj verjetni so manjši in manj verjetni večji odkloni aritmetičnih sredin vzorcev x od aritmetične sredine populacije M x . Zaradi tega moremo smatrati aritmetično sredino posameznega vzorca x kot oceno aritmetične sredine populacije — prave vrednosti aritmetične sredine M x . Standardna pogreška ocen prave aritmetične sredine SE- je povprečen kvadra- tičen odklon x od M x . Zaradi.,tega merimo z njo zanesljivost ocen. Čim manjša je 115 standardna pogreška, tem zanesljivejša je ocena, ker so odkloni ocen v povprečju v tem primeru manjši. Kot vidimo iz obrazca 108, je standardna pogreška ocene aritmetične sredine premo sorazmerna variabilnosti podatkov v populaciji in obratno sorazmerna s kvadratnim korenom iz števila enot v vzorcu n. Zanesljivost ocene moremo torej spreminjati s spreminjanjem velikosti vzorca. Iz obrazca je razvidno, da je treba vzorec povečati štirikratno, če hočemo, da bo standardna pogreška ocene dvakrat manjša, oziroma devetkratno, če hočemo stan¬ dardno pogreško zmanjšati na tretjino, in tako dalje. Iz zakonitosti, ki veljajo za normalno distribuirane populacije, vemo, da se posamezne vrednosti normalno distribuirane populacije zelo poredko (povprečno v petih od sto primerov) odklanjajo od aritmetične sredine za več kot l,96o. Ta stavek pa moremo povedati tudi v obrnjeni obliki: »Zelo poredko (v petih od sto primerov) se aritmetična sredina populacije odklanja od posamezne vrednosti za več kot 1,96o«. Če ta stavek prenesemo na populacijo sredin vzorcev in upoštevamo zakonitosti iz 72.21, dobimo stavek, ki je osnovne važnosti za ocenjevanje: Prava aritmetična sredina populacije M x se z rizikom 0,05 odklanja od ocene aritmetične sredine x, ki smo jo dobili s slučajnim vzorcem, za manj kot 1,96 SE-; ali drugače: Prava aritmetična sredina M x je z rizikom 0,05 v intervalu x — 1,9 6 SE- do 1+ 1,96 SE-. Prava vrednost M x v tem primeru ni ocenjena z eno samo vrednostjo x, temveč z intervalom, v katerem je z določenim rizikom. Ta interval imenujemo interval zaupanja, njegovi meji pa spodnjo in zgornjo mejo zaupanja. Koeficient 1,96 moremo zamenjati z manjšim, na primer 1,645. Tako smo interval zaupanja sicer zmanjšali, povečali pa smo riziko, da prava aritmetična sredina ne leži v mejah zaupanja, na 0,10. Interval zaupanja pa moremo spreminjati tudi s spremembo velikosti vzorca. Čim večji je vzorec, tem ožji je interval zaupanja in zato večja zanesljivost ocene. 72.23 Nepristrana ocena variance. Če hočemo izračunati SE-, moramo po obrazcu 108 poznati pravo vrednost standardnega odklona populacije o x . Ta obrazec nima operativne vrednosti, ker standardnega odklona populacije ne poznamo. Moremo pa ga z obrazcem 7 S (x — x ) 2 K — — (109) oceniti iz podatkov vzorca. Ta obrazec je po svojem sestavu podoben obrazcu izračunavanja variance popu¬ lacije o\, le da vsoto odklonov od aritmetične sredine delimo zn — 1 namesto z n , kot bi pričakovali. Ta sprememba je potrebna zaradi tega, da je s 2 x nepristrana ocena 116 variance populacije o\. Oceno smatramo za nepristrano, ako je aritmetična sredina ocen parametra enaka parametru. Za primer nepristrane ocene variance velja obrazec M s »=0 2 (110) Iz obrazca 107 vidimo, da je tudi x nepristrana ocena od M x . Primer 74. Na ljubljanskih šolah je bilo v letu 1955 testiranih s testom zmožnosti presojanja mehanskih odnosov 342 deklet, ki so bile iz populacije vseh gimnazijk nižjih razredov gimnazij izbrane po slučajnem načinu. Ocena povprečja doseženih točk iz vzorca je x = 22,42, ocena standardnega odklona pa s = 10,08. Kolika je standardna pogreška ocene aritmetične sredine SE- in kolike so meje zaupanja ocene aritmetične sredine s 0,05 rizikom? B Po obrazcu 108 dobimo, daje: SE-=^L = = 0,546; z (G = 0,05) = 1,96 J /n 1/342 Največji možen odklon z rizikom 0,05 e- dobimo enak e- = z ■ SE- = 1,96 • 0,546= 1,07 meje zaupanja pa so: x — e- < M x < x + e- ... 22,42 — \,Q1 Po°l 0 / X ft M, Me Me s SD Q Q As b AS b Spl Spl r r„ rj r/ r bi r bi SE„ SE, SE g = VPo (1 — Po) y n l4v/„(100-jV /o ) 1 r n SEf= ~/np 0 {\ — p 0 ) SE- = a/ / n S EM e = 1,253 o/ l/n ■p‘U SE X ii/MF y V n — Po) SE, SE s — al^ln 0,1861 a _ 1,166Q ]/T J /n SE ASb = 0,5181 CP„ Pio)l]/n SE Spl = 0,28/[/n SE r = (1 — r 1 )/]/n — 1 SE 0 = 1,04(1—£> 2 )/|/«— 1 S£, = (l-^/j/^T SE m = ( — SE rt = I hqp'(i’ yy']/n G l/PoU — ^t.) j/v/o (100 —p 0 °/o «l/Po(l — Po) O 1,253 a iV — l/p o (1 — Po) a/1/2 A 0,7867 a = 1,166(2 IV" 0,5181 (P»o —A«) Al 0,28 «1 —-r 2 A7 «1,04(1-p 1 ) 1 -— »j 2 C**-*). * (V_p25 (m — 15) = + 2,13. 73.3 Ocenjevanje mej zaupanja parametrov 73.31 Ocenjevanje mej zaupanja ocene aritmetične sredine x. Za male vzorce, ki jih izberemo iz normalno distribuirane populacije, se izraz x — M x s X j/ n = t; m = n — 1 (141) ■distribuira v f-distribuciji z m — n — 1 stopinjami prostosti. Pri tem sta x in j 2 ne- pristrani oceni od M in a 2 , n pa število enot v vzorcu. Meje zaupanja za izraz 141 so dane glede na lastnosti /-distribucije v obrazcu 142 139 ( 142 ) x — M x ,, — — t p < - V n < + t p s x iz njega pa moremo dobiti meje zaupanja za pravo vrednost aritmetične sredine po obrazcu x — t n Sy _ , t n Sy. < M x < x + -^4 J/ n p'n (143) Riziko je v tem primeru enak 2 P. Primer 106. S testom mehanskega presojanja smo testirali 20 četrtošolk postojn¬ ske gimnazije in dobili naslednje ocene: x = 22,05; 5 = 9,1. Kolike so meje zaupanja prave aritmetične sredine za hipotetično populacijo (z rizikom 5 %)? Število stopinj prostosti j e m = n — 1 =20 — 1 = 19. Ker je riziko 2 P = 0,05, moramo poiskati v tabeli t-distribucije f 0j0a5 (m = 19) = 2,093. Meje zaupanja so glede na obrazec 143 in zgornje podatke 22,05 — 2,093 -^L 3,29. Razlike so značilne na nivoju 0,001. Z rizikom 0,001 moremo torej trditi, da je dejanski standardni odklon različen od hipotetične vrednosti SD H = 11,0. 152 74.22 Preizkušanje hipotez razlik med parametri. Preizkušanje hipotez razlik med vrednostmi parametra za dve populaciji je samo poseben primer preizku¬ šanja hipotez za velike vzorce. Ker poznamo splošen obrazec za izračunavanje standar¬ dne pogreške razlik dveh neodvisnih ocen, moremo postaviti izraz E v obliki obrazca Sl Sl J* VH V S El + SEl (158) Ničelno hipotezo, da je razlika med parametroma enaka d yH preizkusimo enako kot v prejšnjem primeru. Največkrat preizkušamo, ali razlike sploh obstajajo. V tem primeru kot ničelno hipotezo postavimo: č yH = 0, obrazec 158 pa se spremeni v obrazec ===== z (15V) ]/SEl + SEl Primer 113. Preizkusiti je treba, ali obstajajo razlike v določeni zmožnosti med dečki in deklicami. Kot parameter, s katerim bomo razlike proučevali, vzemimo odstotek dečkov a.li deklic, ki so določeno nalogo, ki to zmožnost zahteva, rešili. Ničelna hipoteza je: razlik po spolu ni; P Hi — P H „. Za ta namen smo izbrali slučajno n 1 = 300 dečkov, od katerih je P 1 = 78 % postavljeno nalogo rešilo pravilno, in « 2 = 200 deklic, od katerih je isto nalogo rešilo P 2 — 68 %• S pomočjo obrazca 159 in tabele 47/3 izračunamo z Pi — Pt 75 — 68 l / 5 (100—A) ^ P,(100 — P,) ni n 2 1 / 75(100- 300 -75) 68(100 — 68) 1,68 = z 200 Ker je |z| = 1,68 < 1,96, se razlike niso pokazale kot značilne. 74.3 Preizkušanje hipotez z malimi vzorci Preizkušanje hipotez z malimi vzorci pride praktično večkrat v poštev kakor preizkušanje hipotez z velikimi vzorci. Za velike vzorce so ocene parametrov običajno toliko zanesljive, da jih moremo dati numerično, ne pa o njih samo sklepati, ali so ali niso različne od dane količine. Za male vzorce pa so ocene dostikrat zelo neza¬ nesljive, kar moremo videti iz primerov 105 do 110, in je včasih nujno, da ugotavljamo samo obstoj razlik. Za male vzorce je sicer princip preizkušanja hipotez podoben postopku za velike vzorce, vendar količine, s katerimi hipoteze preizkušamo, in distribucije, v katerih se te količine distribuirajo, niso enotne. Zaradi tega bomo po vrsti navedli postopek preizkušanja hipotez z majhnimi vzorci za nekaj najvažnejših problemov. 153 74.31 Preizkušanje hipoteze o aritmetični sredini. 74.311 Če izhaja vzorčna aritmetična sredina iz normalne populacije z aritmetično sredino M H , se izraz --J /n= t(m=n —1) (160) s x distribuira v /-distribuciji z m = n —1 stopinjami prostosti. Podobno kot za nor¬ malno distribucijo je kritični interval v mejah — t P do -j- /p (riziko 2P). Pravilo preizkušanja hipoteze o aritmetični sredini moremo postaviti enostavneje, da rečemo, da so razlike med pravo aritmetično sredino M in hipotetično M H značilne na nivoju 2 P, če je j t \ > t P . Primer 114. Preizkusiti je treba, ali so zmožnosti mehanskega presojanja tretje- šolcev mariborske klasične gimnazije značilno različne od splošnega nivoja zmož¬ nosti presojanja mehanskih odnosov tretješolcev v LRS. Ničelna hipoteza: M H = 33,1. Preizkusni vzorec 20 tretješolcev mariborske klasične gimnazije je dal naslednje rezultate: n = 20; x = 41; .s = 7,1. Če poiščemo vrednost t iz obrazca 160, dobimo: -— j/20 = 4,97 = t; kritična vrednost / 00 oi {m= 20 — 1 = 19)== 3,883 7,1 Ker je dobljena vrednost t večja kot kritična vrednost za verjetnost 0,001, moremo sklepati, da so razlike mariborskih tretješolcev od splošnega nivoja zelo značilne. 74.312 Preizkušanje razlik med aritmetičnimi sredinami. Če izhajata vzorca 1 in 2 iz dveh normalno distribuiranih populacij z istim M in SD, se izraz x 2 —■ x x Sd «i + n 2 — t{nv=n x + n % — 2) ( 161 ) distribuira v /-distribuciji z m = n^ + n 2 — 2 stopinjami prostosti. Ta izraz moremo uporabiti za preizkus razlik med aritmetičnimi sredinami dveh populacij. Ničelna hipoteza je: M 1 = M 2 ; razlik v aritmetičnih sredinah ni. s d v obrazcu 161 4 = fa-l (162) Ki + n 2 —2 je isti izraz kot v obrazcu 154, z 1 in 2 pa so zaznamovani podatki prvega in drugega vzorca. Preizkušanje hipoteze gre na povsem enak način kot preizkušanje aritme¬ tičnih sredin. 154 Primer 115. Z vzorcem n, = 10 četrtošolcev in « 2 = 10 četrtošolk skušamo preizkusiti značilnost razlik med spoloma v zmožnostih presojanja ploskovnih odnosov. Ničelna hipoteza: razlik med spoloma ni: M 1 — M 2 . Vzorci so dali naslednje rezultate: četrtošolci . n x = 10; Xi— 44,4; Aj = 394,4 četrtošolke. « 2 = 10; x 2 = 46,8; K 2 = 253,6 Glede na obrazec 154 izračunamo 2 Ki-\~K 2 394,4 + 253,6 _ s d = -- = -= 36; s d = 6 tt\ + n 2 •— 2 10 + 10 — 2 Če vstavimo podatke vzorcev v obrazec 161, dobimo: 46,8 — 44,4 n / JO • 10 6 V 10+10 0,885 =t; m = 10 + 10 — 2 = 18. Iz tabele /-distribucije dobimo kritično vrednost 025 (m = 18) = 2,101. Ker je izračunana vrednost t manjša od kritične vrednosti / 0 , 025 , preizkus ni pokazal značilnih razlik v zmožnostih ploskovnega presojanja med dečki in deklicami. 74.32 Preizkušanje hipoteze o varianci. 74.321 Če izhaja vzorec iz normalne populacije z varianco a 2 H , se izraz (rj 1 ^ e 2 ---— = +(>« = «- 1) (163) °H distribuira v ^-distribuciji z m — n —1 stopinjami prostosti. Kritični interval za + je v mejah 0 do +, (riziko P). Zaradi tega je kritični interval določen kar s kritično vrednostjo +, ki je za posamezne nivoje dana v tabeli % “-distribucije. Pravo vrednost variance smatramo na nivoju P značilno različno od hipotetične <+, če je + > +; 2 - 2 = izračunana vrednost, % 2 P = kritična vrednost. Primer 115. Preizkusiti je treba, ali je učinek individualnih faktorjev, ki vplivajo na zmožnost presojanja mehanskih odnosov pri dijakih klasične gimnazije v Mariboru, značilno različen od splošnega nivoja učinka individualnih faktorjev. Parameter, ki meri jakost učinka individualnih faktorjev, je varianca. Zaradi tega bomo problem rešili s preizkusom variance. Varianca zmožnosti presojanja mehanskih odnosov tretje- šolcev v LRS je <+= 123,8. To vrednost smatramo kot ničelno hipotezo za pre¬ izkus mariborskih dijakov. V vzorec smo vzeli n — 20 tretješolcev mariborske kla¬ sične gimnazije. Iz njega smo ocenili varianco P = 49,9. 155 Iz teh podatkov moremo izračunati X — (n — l)s 2 (20— 1)49,9 123,8 = 7,66 m = n — 1 = 20 — 1 = 19 Iz tablic x 2 — distribucije dobimo pod m = 19 xi.» (m = 19) = 10,117 To pomeni, da z verjetnostjo 0,05 x 2 ni manjši od 10,117. Če kritični interval omejimo v spodnji meji, moremo kot kritični interval smatrati interval od 10,117 do +co. Ker izračunana vrednost = 7,66 pade izven tega intervala, ker je manjša kot 10,117, moremo s 5% rizikom sklepati, da so razlike v variancah značilne. Prava vrednost variance dijakov mariborske klasične gimnazije je značilno manjša od. splošne. To je razumljivo, ker so pogoji teh bolj izenačeni kot pogoji vseh tretješolcev v LRS. 74.322 Preizkušanje razlik med variancami. Če izhajata vzorec 1 in 2 iz dveh normalno distribuiranih populacij z enakima variancama, se izraz — = F (/«!="«!•— 1; m 2 = n 2 — 1) (164) 4 . distribuira v F-distribuciji z m x = n x — 1 in m 2 = n 2 — 1 stopinjami prostosti. S tem izrazom moremo preizkušati značilnost razlik varianc dveh populacij. Ničelna hipoteza je v tem primeru: a\ = a 2 . Da moremo v vsaki situaciji uporabljati v dodatku dane tabele F-distribucije, moramo kot 1 vedno vzeti vzorec z večjo oceno variance, tako da je v vsakem primeru kvocient s 2 js\ večji kot 1. Nadaljnji postopek preizkušanja hipoteze o razliki med variancami izvršimo- tako, da iz vzorcev izračunani izraz 164 primerjamo s kritično vrednostjo F P (m l = = n x — 1; m 2 = k 2 — 1). Če je F> F p , so razlike v variancah značilne, v nasprotnem primeru pa razlike niso značilne. Primer 117. Preizkusiti je treba, ali so razlike v učinku individualnih vplivov med dečki in deklicami v zmožnosti presojanja mehanskih odnosov. Ničelna hipoteza: Oj = a \. Za ta namen smo vzeli vzorec n x — 12 dečkov in « 2 = 16 deklic, zanje z objek¬ tivnim testom merili zmožnost presojanja mehanskih odnosov in iz dobljenih po¬ datkov izračunali sj = 71,5; j* = 68,0. Iz obrazca 164 izračunamo F= s 2 Js 2 2 = 71,5/68,0 = 1,05 Stopinje prostosti so: m x = n x — 1=12 — 1=11; m 2 = n. — 1=16 —1 = 15; tablični F 0>05 (m x = 11; m„ = 15) = 2,51. Ker je F< F P , so razlike v variancah neznačilne. 156 74.33 Preizkušanje hipotez o korelacijskem koeficientu. 74.331 Hipotetično vrednost r# preizkušamo na splošno po naslednjem postopku, ki nam je v principu znan že iz ocenjevanja mej zaupanja korelacijskega koeficienta. a) Iz vzorca izračunamo oceno korelacijskega koeficienta r. b) Iz tabele zvez med r in Fisherjevim koeficientom Z poiščemo r in r H ustreza- jajoči vrednosti Z in Zh- c) Izračunamo izraz , - (Z— Z s ) /n — 3 = z (165) ki se distribuira standardizirano normalno. d) Prava vrednost korelacijskega koeficienta r 0 je na nivoju P značilno različna od hipotetične vrednosti r H , če je absolutna vrednost izračunanega z večja od kritične vrednosti z P . Primer 118. Z vzorcem n = 20 tretješolcev je treba preizkusiti, ali je korekcijski koeficient med zmožnostmi presojanja mehanskih in spacialnih odnosov značilno različen od r H = 0,50. Z vzorcem n = 20 tretješolcev smo dobili oceno korelacijskega koeficienta r= 0,76. Iz tablice r—Z dobimo: za r = 0,76 je Z = 1,00; za r H = 0,50 je Z H = 0,55. S temi podatki izračunamo izraz 165 z= (1,00 — 0,55) 1/20 — 3 = +1,86 Zo.io = 1,645, z 0 ,o 5 = 1,96 zato moremo z rizikom 0,10 sklepati, da je prava vrednost korelacijskega koeficienta r 0 značilno različna od hipotetične vrednosti r H — 0,50. Riziko tega sklepa je velik, in sicer 10 °/o- 74.332 Če dva pojava nista v korelaciji, populacija pa je normalno distribuirana, se izraz n — 2 1 — r s t (m = n — 2) (166) distribuira v /-distribuciji z m — n — 2 stopinjami prostosti. S tem izrazom moremo torej preizkušati eksistenco korelacije, in sicer z ničelno hipotezo r H = 0. Če je dobljeni izraz 166 večji od kritične vrednosti t P , smatramo korelacijo kot značilno različno od r H = 0 na nivoju rizika 2P. Primer 119. Iz vzorca n= 16 četrtošolk smo dobili, daje korekcijski koeficient med zmožnostjo presojanja mehanskih in besednih odnosov ocenjen z r — —0,43. Ali je korekcijski koeficient med tema pojavoma značilno različen od nič, bomo preizkusili z obrazcem 166. 157 Iz danih podatkov dobimo: Kritična vrednost r 0 ,05 (m= 14) = 2,145. Ker je absolutna vrednost izračunanega t manjša od kritične vrednosti t P , kore¬ lacija med tema dvema pojavoma ni značilna. 74.333 Preizkušanje razlik med korelacijskimi koeficienti. Ker se iz r izračunan Fisherjev Z distribuira normalno, se izraz (167) distribuira standardizirano normalno IV (0,1), če sta vzorca 1 in 2 vzeta iz populacij z enakima korelacijama. Ničelna hipoteza: korelacijska koeficienta r m = r m . Pre¬ izkušanje značilnosti gre dalje po običajnem postopku preizkušanja hipotez z izrazi, ki se distribuirajo kot z. Primer 110. Iz vzorca n l = 40 tretješolcev smo ocenili korelacijski koeficient med zmožnostmi presojanja mehanskih in spacialnih odnosov z r x = 0,65, iz vzorca = 60 četrtošolcev pa z r 2 = 0,79. Preizkusiti je treba značilnost razlik med kore¬ kcijskima koeficientoma tretješolcev in četrtošolcev. Iz tabele F dobimo k r x = 0,65 ustrezajočo vrednost Z x = 0,78, k r,= 0,79 pa Z, = 1,07. Iz Z u in Z 2 izračunamo izraz 167 1,07 — 0,78 + 1,37 Ker je absolutna vrednost izračunanega z manjša od kritične vrednosti z P = 1,96, razlike med korekcijskima koeficientoma tretje- in četrtošolcev niso značilne. 74.4 Neparametrično preizkušanje hipotez 74.41 Preizkus yf. V dosedanjih primerih smo preizkušali hipoteze o lastnostih populacij s preizkušanjem hipotez o parametrih, kot so aritmetična sredina, varianca, korelacijski koeficient, strukturni odstotek in podobno. Ta način pa ni vedno možen. Znaki, ki jih proučujemo, niso vedno numerični, kar onemogoča izračunavanje parametra, morejo pa nastopiti tudi drugi vzroki, zaradi katerih uporaba dosedanjih 158 metod ni možna. Za te primere pride v poštev preizkušanje hipotez o frekvenčni distribuciji znaka s preizkusom y\ Če iz populacije, za katero ima frekvenčna distribucija frekvence f H , slučajno izvlečemo vzorec, za katerega so frekvence f se izraz = *•(«= k—\) (168) f H distribuira v x 2 -distribuciji z m = k — 1 stopinjami prostosti, pri čemer pomeni k število razredov frekvenčne distribucije. Kot smo videli v odstavku 66.1, moremo % l izračunati tudi po obrazcu 2 — - n = x 2 (ni — k ■ —1) (169), fH ki je samo preurejen obrazec 168, je pa računsko dostikrat preprostejši. Preizkus značilnosti razlik dejanskih frekvenc / od teoretične — hipotetične distribucije f H izvedemo z običajnim postopkom. Iz podatkov vzorca izračunamo po obrazcu 168 ali 169 x 2 , ki ga primerjamo s kritično vrednostjo y 2 p za riziko P. Če je izračunani večji od kritične vrednosti x 2 p> s0 razlike dejanske distribucije od hipotetične značilno različne, v obratnem primeru pa razlike niso značilne. Kot ničelno hipotezo postavljamo, da je prava frekvenčna distribucija identična s hipo¬ tetično : /o = f H . Ker je y- distribucija dobra aproksimacija dejanske distribucije izraza 168 samo, če so hipotetične frekvence f H zadosti velike, običajno postavljamo omejitev, da nobena izmed hipotetičnih frekvenc ni manjša kot 5. Če se v praktičnem primeru to zgodi, ta razred združimo z najsorodnejšim. Primer 121. Rezultate doseženih točk pri testiranju zmožnosti presojanja me¬ hanskih odnosov četrtošolk v gimnazijah z enim četrtim oddelkom v LR Sloveniji, smo uredili v frekvenčno distribucijo f. Preizkusiti je treba, ali je distribucija teh dosežkov značilno različna od normalne distribucije f H z isto aritmetično sredino M in istim standardnim odklonom SD. Hipotetično frekvenčno distribucijo f H s temi lastnostmi dobimo v tabeli 25. Postopek izračunavanja izraza, ki se distribuira kot % 2 , pa imamo v tabeli 49. Ker imamo skupno A: = 10 grup, je bilo po zgornjem pravilu število stopinj prostosti n = k — 1= 10 — 1 =9. Ker pa sta distribuciji vezani z dvema koli¬ činama ( x , s) se število stopinj prostosti zmanjša za dve: (m = 9 ■ —2 = 7). Sed¬ mim stopinjam prostosti ustrezajoča kritična vrednost pa je: 05 (m = 7) = = 14,07. Ker je izračunana vrednost %°= 3,756 manjša od ustrezajoče kritične vrednosti Xo,oe = 14,07, sklepamo, da stvarna distribucija dosežkov mehanskega testa ni značilno različna od normalne distribucije. 159 Tabela 49. Preizkušanje značilnosti razlik frekvenčne distribucije mehanskega testa od nor¬ malne distribucije (četrtošolci v LRS) Primer 122. Hitrost izdelave poizkusnih ključev 493 delavcev kovinske stroke je bila kategorizirana v tri grupe: počasen, zmeren in hiter. Preizkusiti je treba, ali se dobljena distribucija po hitrosti značilno odklanja od teoretične. Ta je zasnovana na predpostavki, da je hitrost izdelave poizkusnih ključev normalno distribuirana in da so v grupi »zmeren« vsi, ki se od povprečja odklanjajo manj kot SD, v grupi »počasen« oziroma »hiter« pa vsi, ki se odklanjajo v levo oziroma desno za več kot SD. Teoretična oziroma hipotetična distribucija 493 delavcev bi imela po tej predpostavki v grupi »počasen« 15,9 % ali v absolutnem 78,3 delavca, v grupi »zme¬ ren« 68,2 % ali 336,4 delavca in v grupi »hiter« 15,9 % ali 78,3 delavca. Postopek preizkušanja te hipoteze je naslednji: Tabela 50. Preizkušanje značilnosti razlik dejanske distribucije izdelave poizkusnih ključev od teoretične — 493,00 146,14 = m = k — 1 = 3 — 1 = 2. Kritična vrednost %‘ za riziko 0,001 je 70,001 (m = 2) = 13,815. Dejansko upo¬ rabljeni kriterij ocenjevanja hitrosti je zelo visoko značilno različen od teoretičnega kriterija na osnovi hipoteze o normalnosti distribucije. 160 74.42 x 2 preizkus neodvisnosti 74.421 Preizkus x 2 za kontingenčno tabelo k Xg- S x 2 moremo preizkušati tudi značilnost odvisnosti dveh znakov. Pri obravnavanju kontingence smo vzeli kot merilo kontingence x 2 , ki smo ga izračunavali tako, da smo stvarne frekvence primerjali s teoretičnimi. Teoretične frekvence pa smo izračunali pod predpostavko neodvisnosti med proučevanima pojavoma. V tem poglavju smo dali tudi praktične napotke in postopke izračunavanja y\ Zaradi tega na tem mestu teh postopkov ne bomo ponavljali. Izkaže se, da se izraz x 2 , ki smo ga v teh odstavkih izračunavali kot merilo kontingence, distribuira v ^ 2 -distribuciji z m = (/c — 1) • (g — 1) sto¬ pinjami prostosti. Od k ■ g frekvenc v kontingenčni tabeli jih more namreč (k — 1) ■ • (g — 1) svobodno variirati, ostale pa so vezane na robne frekvence. Ostali postopek preizkušanja značilnosti odvisnosti je enak običajnemu postopku preizkušanja hipotez s pomočjo x 2 - Primer 123. Pri proučevanju soročnosti izdelave poizkusnih ključev 493 delavcev smo v primeru 65 izračunali, da je x 2 = 15,41. Kvaliteta izdelkov je bila izkazana v treh grupah: nadpovprečna, povprečna in podpovprečna, hitrost pa v treh grupah: počasen, zmeren in hiter. Število stopinj prostosti je m = (k — 1) ■ (g — 1) = = (3 — 1) • (3 — 1) = 4. Kritična vrednost Xo,oi (m = 4) = 13,277. Iz tega moremo zaključiti, da sta hitrost in kvaliteta izdelave poizkusnih ključev značilno odvisna na nivoju 0,01. Primer 124. V primeru 67 smo izračunali, da je x 2 rned dejansko barvo eksponi- ranih predmetov in izjavami štiriletnih otrok o barvi predmeta x 2 = 9,54. Ker ima¬ mo štiri barve, odgovore o pravilnosti pa dane alternativno: pravilno — nepravilno, je število stopinj prostosti m = {k — 1 ) ■ (g — 1) = (4 — 1) - (2 — 1) = 3. Kritična vrednost Xr J e P° tablici x^distribucije enaka Xo,os (m = 3) = 7,815. Ker je izra¬ čunana vrednost x 2 = 9,54 večja od kritične vrednosti x <>,05 {m = 3) = 7,815, moremo s 5% rizikom sklepati, da je zmožnost zaznavanja posameznih barv pri štiriletnih dečkih različna po barvah. 74.422 Preizkus x 2 za kontingenčno tabelo 2X2. Če je v primerih preizkušanja od¬ visnosti iz 2 X 2 tabele katera koli od teoretičnih — hipotetičnih frekvenc majhna (manjša od 50), je priporočljivo, da uporabimo pri x 2 -preizkusu Yatesovo korekturo za zveznost. Ta obstoji v tem, da absolutne vrednosti vsakega izmed odklonov / — f H pred kvadriranjem zmanjšamo za 0,5. x 2 izračunamo v tej korigirani obliki po obrazcu (|/-/tf|-0,50) 2 X 2 (m = J) (170) |/—/n = absolutna razlika frekvenc kateregakoli polja, ker so med seboj enake. 11 — Statistične metode 161 Primer 125. Pri raziskavi o zmožnosti zaznavanja likov je bila za zaznavanje trikotnika za štiriletne otroke dobljena distribucija, ki je prikazana v tabeli 5la. Tabela 51 b prikazuje hipotetične frekvence v primeru neodvisnosti. Tabela 51. Preizkušanje odvisnosti zaznavanja trikotnika od spola pri štiriletnih otrocih a) Po obrazcu 170 izračunamo Z 2 = (140 — 36,51 — 0,5) ; 1 - + 36,5 Kritična vrednost xl,os (m = 1) = 3,841. Izračunana vrednost % 2 je manjša od kritične vrednosti %]>, razlike v zaznavanju trikotnika po spolu ne moremo smatrati kot značilne. V primeru, da je število enot za en znak za obe grupi enako, moremo % 2 z upošte¬ vanjem Yatesove korekture izračunavati po enostavnejšem obrazcu (k— b\~\y-n (a + b) ■ (c + d) ■f (,m = 1 ) (171) Pri tem so: cd stvarne frekvence, postavljene tako, da je a -f* c = b -j- d. Primer 125. Za podatke iz primera 124 moremo uporabiti ta način, ker je število preizkusov dečkov enako številu preizkusov deklic (n, = n~ — 80). Tabela 52. Preizkušanje odvisnosti zaznavanja trikotnika od spola pri štiriletnih otrocih Po obrazcu 171 je: (|40 — 33 I — l) 2 - 160 t ^ 1 ---= 0,907 73-87 162 Rezultat je isti kot v primeru 124. Nadaljnji postopek je enak kot v primeru 124. 75. Analiza variance 75.1 Princip Dosedanja metoda preizkušanja značilnosti vpliva danega faktorja je obstajala v tem, da smo preizkušali značilnost razlik aritmetičnih sredin dveh grup pod spre¬ menjenimi pogoji. Metoda je torej omejena na medsebojno primerjavo samo dveh grup. Dostikrat pa gre za analizo učinka določenega faktorja na več grup, na primer več starostnih skupin, več socioekonometričnih grup, več tipov šol itd., kadar anali¬ ziramo odvisnost pojava od starosti, od socialnih skupin, vrste šol itd. Z zgornjo metodo je taka analiza možna le s kompleksnim preizkušanjem razlik vseh kombi¬ nacij po dve grupi. Taka analiza pa je zamudna, nepregledna in neizčrpna. Kom¬ pleksno moremo to nalogo rešiti edinole z analizo variance, ki hkrati analizira značilnost razlik vseh možnih kombinacij. Že pri obravnavanju variance kot mere variabilnosti smo ugotovili, da moremo skupno varianco razstaviti na vsoto komponent glede na učinek posameznih faktorjev. Na enako rešitev smo naleteli tudi pri proučevanju korelacije, ko smo celotno varianco koreliranega znaka razdelili v dva dela: varianco, ki izvira iz odvisnosti koreliranega znaka z znakom, s katerim je povezan, in preostalo varianco, ki gre na račun drugih — individualnih in slučajnih faktorjev. Ta princip razstavljanja variance, samo dalje razvit in prilagojen načinu preizkušanja hipotez z vzorci, je osnova analize variance v ožjem smislu. Analiza variance ni omejena na preizkušanje značilnosti učinka enega samega faktorja, temveč moremo z njo istočasno analizirati značilnost učinkov poljubnega števila faktorjev vključno vzajemne učinke — interakcije. Analiza variance v vseh njenih različnih oblikah in modelih je izdelana in upo¬ rabna z osnovno predpostavko, da je učinek slučajnih faktorjev distribuiran normalno z enako variabilnostjo za vse enote proučevanja. 75.2 Analiza variance enega faktorja 75.21 Analizo variance značilnosti vpliva enega samega faktorja izvršimo po naslednjem postopku: a) Iz vsake izmed grup, ki jih analiziramo, slučajno izberemo določeno število enot n x . V tem enostavnem primeru ni nujno, da je število enot v vseh grupah enako, čeprav je to ugodno iz vsebinskih in tehničnih razlogov obračunavanja. Če imamo gradivo, ki ga analiziramo, že dano, pustimo število enot v posameznih grupah tako, kot je. Če pa eksperiment šele planiramo, se bomo v vseh primerih, če le drugi razlogi ne narekujejo drugače, odločili za enako število enot v grupah. 163 b) Od izbranih enot v grupah zberemo osnovne podatke, ki so kvantitativen izraz pojava, ki ga hočemo analizirati (shema 172) Xii (172) c) Podatke po grupah seštejemo, v skupno vsoto X (shema 173) da dobimo grupne vsote X u te pa seštejemo x u -Ti (173) d) Vse individualne podatke x u , vse grupne vsote X y in skupno vsoto X kva¬ driramo in damo v tabeli kvadratov (shema 174) Ai\x? x\ 7 «, I X 2 x 2 ln (174) Hi, e) Kvadrate grupnih vsot delimo z ustrezajočim številom enot v grupah kvadrat skupne vsote pa s skupnim številom enot v celoti — n (shema 174). f) Seštejemo vse kvadrate individualnih podatkov in vse grupne izraze X\jn l iz sheme 174. Tako dobimo količine Q u , Q, in Q (shema 175) 2xj,= Qu \2X\jn l — Q y I X 2 /n = Q (175) g) Analizo variance obračunamo iz teh količin po standardni shemi 176 za analizo variance enega faktorja v tabeli 53. Tabela 53. Shema obračunavanja analize variance enega faktorja h) Če razlik med pravimi grupnimi sredinami ni, je a] = 0; faktor 1 torej ni bistven. V tem primeru se F = s 2 j s 2 distribuira v F-distribuciji z tn 1 = p — 1; m 2 — = n — p stopinjami prostosti, pri čemer pomeni p število grup. Če je faktor 1 bistven, je vj ocena vsote variance aritmetičnih sredin in variance individualnih vplivov, s] pa ocena variance individualnih vplivov. 164 i) Zaradi tega moremo z zgornjim postopkom preizkušati ničelno hipotezo, da faktor 1 ni bistven, daje torej o\ = 0. Da ugotovimo značilnost razlik med sredinami, izračunani F primerjamo s kritično vrednostjo F P (m l = p — I; m 2 = n — p). Če je F> F P , so razlike med aritmetičnimi sredinami z rizikom P značilne, v nasprotnem primeru pa razlike niso značilne na nivoju P. j) V primeru značilnosti razlik so x^ = XJn l ocene grupnih aritmetičnih sredin. Verjeten odklon aritmetične sredine od ocene je z rizikom 2 P enak e- t (po obrazcu 177) e- xx = t P (m = n —p) s J j/ n t (177) verjeten odklon razlike med dvema aritmetičnima sredinama grup pa je dan z rizi¬ kom 2P z obrazcem e A - x = t P (m = n —p) s e V «1 + «2 (178) Primer 127. Preizkusiti je treba značilnost odvisnosti dosežkov z Ravenovimi matricami po starosti (dijaki v starosti od 16 do 19 let). Nalogo bomo rešili z analizo variance. V ta namen imamo za 26 dijakov na razpolago naslednje podatke o do¬ sežkih po starosti. Tabela 54. Tabela osnovnih podatkov o dosežkih dijakov v starosti od 16 do 19 let, ki so jih dosegli z Ravenovimi matricami Tabela 55. Tabela kvadratov analize variance iz tabele 54 X 2 /« = 1595169 : 26 = 61352,7 = Q Iz teh podatkov moremo po shemi 176 obračunati analizo variance. 165 Tabela 56. Analiza variance odvisnosti dosežkov z Ravenovimi matricami po starosti V tablici F-distribucije dobimo F ofi s (nj, = 3; m% = 22) = 3,05. Primerjava izračunanega F — 1,73 s tablično vrednostjo F P — 3,05 pokaže neznačilnost razlik med leti. 75.22 Skrajšan postopek. Čestosepri obračunavanju analize variance obnese postopek, ki znatno skrči računski postopek. Pri izračunavanju variance se končni rezultat ne spremeni, če pred kvadriranjem individualnim vrednostim odštejemo poljubno vrednost (običajno okroglo, ki zmanjša osnovne vrednosti). Isto velja tudi za analizo variance. Ta postopek je posebno koristen, če variacija vrednosti ni pre¬ velika. V tem primeru vpeljemo pomožno vrednost x 0 , ki je tem vrednostim blizu. Postopek obračunavanja variance, kot je dan v 75.21, se spremeni le toliko, da med točko b in c vstavimo novo točko: Individualne podatke moremo brez škode za končni rezultat reducirati tako, da od njih odštejemo okroglo vrednost x 0 , ves ostali postopek pa vršimo z reduciranimi vrednostmi namesto z originalnimi, kot je navedeno v zgornjem postopku. Primer 128. Za podatke primera 127 se ta postopek obnese. Kot vidimo na prvi pogled, variabilnost osnovnih podatkov v tabeli 54 ni velika. Kot ugodna vred¬ nost za reduciranje se izkaže x„= 50. Ne bomo ponavljali osnovnih podatkov, temveč bomo dali kar tabelo reduciranih podatkov. Primerjava dobljenih Ki in K e pokaže enakost rezultatov po obeh postopkih, ker je nadaljnji potek enak zgornjemu. Tabela 57. a) Tabela reduciranih osnovnih podatkov testiranja z Ravenovimi matricami iz tabele 54 X= —-37 166 b) Tabela kvadratov reduciranih podatkov X‘ = 1369:26 = 52,7 = Q K,= Qi — Q= 191,1 — 52,7 =f= 138,4; K e = Q u — Q 1 = 783 — 191,1 = 591,9 75.3 Analiza variance več faktorjev hkrati 75.30 Pojem. Analiza variance ni omejena samo na analizo enega faktorja, ampak moremo z njo analizirati tudi zamotanejše in kompleksnejše probleme o vpli¬ vih več faktorjev. Pri analizah več faktorjev hkrati po pravilu jemljemo število enot v grupah enako (zaznamujemo ga z n). Moremo pa pri faktorialni analizi vzeti v vsaki grupi tudi po en sam podatek (n = 1 ). Računski postopek obračunavanja analize variance se sicer menja s številom faktorjev in komponent, ki jih upoštevamo, vendar veljajo neki splošni principi, ki omogočajo, da moremo v vsakem konkretnem primeru najti primeren model analize variance. Pri analizi več faktorjev nastopi nov pojem interakcije, to je vzajemnega delo¬ vanja dveh ali več faktorjev. Uspeh pri učenju je odvisen od spola in starosti, spre¬ membe uspeha po starosti pa morejo biti različne za dečke in deklice. To vzajemno delovanje obeh faktorjev imenujemo interakcijo. V kompleksnejših analizah moremo govoriti tudi o interakciji več faktorjev. Če vzamemo, da je neki pojav: a) odvisen od enega faktorja 1 , b) odvisen od dveh faktorjev 1 in 2, c) odvisen od treh faktorjev 1, 2 in 3 in slučajnih vplivov e, ki se distribuirajo normalno, moremo x, ki je kvantitativen izraz delovanja vseh faktorjev, pisati v shemah 179 a) Xi — M- f Mi- h e u b) x lti = M + Mi -j- M 2 -(- / 12 + «i 2 i (179) c) x 123i = M-f- Mi-\- M 2 -(- M 3 -j- /ia— (- / 13 + /23 + 7l23 «123/ Pri tem pomeni: M= rezultat splošnih pogojev; M,, M 2 , M 3 = samostojni učinki faktorjev 1 > 2 , 3 1 Ii2, / 13 , / 23 = interakciji dveh faktorjev; / m = inter¬ akcija treh faktorjev; « i; , e 12; , e 12 3,- = učinek slučajnih faktorjev. Seveda ti mo¬ deli veljajo samo za primer aditivne povezave učinkov, kot je nakazano v shemi 179. 167 Ničelne hipoteze, s katerimi preizkušamo značilnost učinka enega ali drugega faktorja ali komponente, so: Afi - - A/2 == A/3 0 5 /12 = /13 = /23 — 05 /123 === 0 Če ničelne hipoteze veljajo, je: a) x u = M -j- e u ; b) x ni = M -\- e ui ; c) x 123i = M + e 133i (180) 75.31 Analiza variance dveh in treh faktorjev. Postopek obračuna analize variance v primeru treh faktorjev je naslednji: a) Zberemo podatke x po kombinaciji vseh grup faktorjev 1, 2 in 3; x 133i b) Če se izkaže kot koristno, reduciramo vse podatke v tabeli osnovnih podatkov tako, da odštejemo od njih primerno okroglo vrednost x 0 . c) Poiščemo vse mogoče grupne vsote reduciranih podatkov: X m , X vi , X 12 , X 2S , X L , X 2 , X 3 , X. To so po vrsti: grupne vsote po kombinaciji treh faktorjev (X i23 ), grupne vsote po vseh kombinacijah po dva faktorja (X 12 , X 13 , X 23 ), grupne vsote po enem faktorju (X u X 2 , X 3 ) in skupna vsota vseh podatkov ( X ). d) Reducirane osnovne podatke in vse pod c) dobljene vsote reduciranih po¬ datkov kvadriramo in vpišemo v tabelo kvadratov, ki je po obliki enaka tabeli redu¬ ciranih podatkov. e) Seštejemo kvadrate reduciranih osnovnih podatkov in kvadrate ustrezajočih grupnih vsot. Tako dobimo naslednje vsote kvadratov: 2 x'\ 3i , 2X\ 23 , 2X\ 2 , 2X\ 3 , 2X1, 2Xl, 2X1, 2X1, X\ f) Iz dobljenih vsot kvadratov izračunamo količine Q. Če z n zaznamujemo število enot v vsaki osnovni grupi, s p število grup po prvem, z d število grup po drugem, s t pa število grup po tretjem faktorju, dobimo količine Q po obrazcih: 0123/— 2 ATM,-; 0123 = 2X\ 23 ln', (181) 0i2 = 2X v Jnt; 0i3 = 2X\ 3 !nd\ 0 23 = 2X\ 3 !np\ 0i = 2X\lhdt; 0, = 2X\!npt ; 0 3 = 2Xl/Hpt ; 0 = 2X^npdt g) Iz 0, ki smo jih dobili z obrazci 181, dobimo dalje K po obrazcih K= 0123 / - 0 K\ — 0i 05 X 2 = 02 0; K 3 = 0 3 — 0 Ku = 012, — 0i — 02 "h 05 Xi 3 = 0 13 — 0! — 03 + 0 5 X 23 = 023— 02— 03+ 0 (182) Xi 23 = 0 123 - 012 - 013 — 023 + 01 + 02 + 03 - 0 K e = K — Ki — Ki — ...— -K m . h) Analizo variance obračunamo po standardni shemi, ki je dana v tabeli 58. 168 o 5 4= C Tl 43 a H o GO O a cd N O M c) Če se izkaže, da je j* za določen samostojen faktor ali interakcijo manjši od sl, vnaprej sklepamo, da ta faktor ali interakcija ni značilna. Varianco teh faktorjev in interakcij vključimo v pogreško tako, da ustrezajoče Kj in nij prištejemo h K e in m e , izračunamo nov sl', na osnovi novih — korigiranih K' e in m' e , F pa s primerjavo z novim s 2 /. Primer 129. Kot primer kompleksne analize variance treh faktorjev vzemimo problem odvisnosti spoznavanja likov pri otrocih v odvisnosti od spola (faktor 1), starosti (faktor 2) in vrste lika (faktor 3). Za ta namen je bil napravljen eksperiment na predšolskih otrocih ljubljanskih vrtcev. Rezultati, ki so dani v tabeli 59, pomenijo, kolikokrat od 80 možnosti je otrok določenega spola in starosti po predpisanem času pravilno ocenil lik, ki ga je opazoval. Računski postopek obračunavanja analize variance je naslednji: Tabela 59. Obračunavanje analize variance o odvisnosti spoznavanja likov za faktorje spol (faktor 1), starost (faktor 2) in lik (faktor 3) a) Tabela osnovnih podatkov Tabela reduciranih (x„ = 50) osnovnih podatkov in njihove vsote (tabela b) in tabela kvadratov (tabela c) sta zaradi obširnosti na strani 171. d) Tabela vsot kvadratov 2xt , 3 2X1, 2X1, 2X1 6084 20614 10842 39008 2394 8468 4598 16900 v v 2 V V 2 V V 2 V Y 2 x-j A 13 A i x2 A z x2 A Kontrola vsot kvadratov: Vse vsote kvadratov morajo biti ali sode ali lihe. e) Tabela za Q: Število grup po posameznih faktorjih: p = 2;rf=5;t = 4 ; ea) eb) 170 b) Tabela reduciranih ( x 0 = 50) osnovnih podatkov in njihove vsote H * •O »O ^ ^ ^ irC VO. O Cfl > rS O jg 'c? 3 > o M 3 "d 0 01 3 ’5 d 4> d > -D cd H N Ct rH iš Iz Q moremo na pregleden način dobiti izraze K (obrazci 182); K = 6084 — 422,5 = 5661,5; Tj = 423,4 — 422,5 = 0,9 K 2 = 4876 — 422,5 = 4453,5; K 2 = 459,8 — 422,5 = 37,3 K n = 5153 —423,4 —4876+ 422,5= 276,1 K a = 478,8 — 423,4 — 459,8 + 422,5 = 18,1 K 23 = 5421 — 4876 — 459,8 + 422,5 = 507,7 K e = 5661,5 — 0,9 — 4453,5 — 37,3 — 276,1 — 18,1 —507,7= 367,9 Iz teh podatkov moremo s pomočjo sheme v tabeli 58 obračunati analizo variance. Tabela 60. Obračun analize variance V novo pogreško e' smo vključili komponente (1), (3), (1 X 3). Razlike v zaznavanju likov po starosti so visoko značilne, razlike v interakciji Ispol-/.starost P a so značilne s 5°/ 0 rizikom; to kaže na to, da so spremembe v za¬ znavanju likov po starosti značilno drugačne za dečke kot za deklice. Iz zgornje analize variance zaključimo, da ima iz podatkov o zaznavanju barv smisel dalje proučevati le odvisnost zmožnosti zaznavanja barv od starosti, vendar ločeno za dečke in deklice. Sliko sprememb v zaznavanju barv po starosti in spolu pokažejo ustrezna povprečja. Ta povprečja izračunamo iz izrazov X, 2 v tabeli reduciranih osnovnih podatkov in njihovih vsot (tabela 59b) po obrazcu Xi 2 = x„ + X l2 /t = 50 + Tj z/4 (184) Tabela 61. Povprečno število pravilno zaznanih likov po starosti in spolu otrok 172 0 let Slika 30. Povprečno število pravilno zaznanih likov po starosti in spolu otrok Standardno pogreško gornjih povprečij izračunamo po obrazcu SE~ X1 = V Či lV&AI l/4 = 2,37 (185) standardno pogreško razlik povprečij pa po obrazcu SE A - Xn = V2?el Vt = l/2.22,4/1/4' = 3,35 (186) Ker je razlika dveh povprečij značilna s 5 % rizikom, če je večja kot verjetni odklon t 0 ,05 c rn = 19) • s A - XIl = 2,09 ■ 3,35 = 7,0 (187) sklepamo iz tabele 61, da so značilna vsa povečanja zmožnosti v zaznavanju barv po starosti z izjemo pri dečkih od starosti pet let in pol do šest let, pri deklicah pa od starosti pet let do pet let in pol. Pokazalo se je tudi, da je zmožnost v zaznavanju likov šestletnih deklic značilno večja kot zmožnost šestletnih dečkov. To je ravno vzrok, da je nastala interakcija med spolom in starostjo značilna. 173 8 TESTNE SKALE IN NORME 81. Problem merjenja nenumeričnih kvalitet Že v uvodu smo omenili, da so statistični znaki izraz kvalitet posameznih enot. Nekateri izmed njih so za statistično proučevanje zelo prikladni, ker so dani nume¬ rično. To omogoča precizno določanje, primerjavo in podrobno analizo. Velikost človeka je karakterizirana v cm višine, ki jo moremo točno določiti, ugotoviti razlike v višini dveh oseb itd. Še bolj drastičen primer numeričnega znaka je starost, ki jo moremo na oko oceniti le na grobo, da se pa objektivno določiti poljubno natančno. Tudi med atributivnimi znaki je veliko takih, katerih vrednost moremo objektivno določiti. Taki znaki so na primer: spol, stan itd. V psiholoških raziskavah pa imamo polno kvalitet, ki niso take absolutne narave in katerih vrednosti niso vnaprej dane numerično. Različne zmožnosti, inteligenca, ubogljivost, agresivnost itd. so kvalitete, za katere za sedaj nimamo numeričnega izraza, če pa imamo atributiven izraz, je ta zelo samovoljen. Enako je z literarno vrednostjo novele, kvaliteto šale ali težavnostjo naloge. Skupna lastnost vseh teh kvalitet pa je možnost primerjave in s tem v zvezi možnost rangiranja, kar sta bistveni lastnosti numeričnih znakov. Zaradi teh lastnosti moremo pod določenimi pred¬ postavkami tem znakom dati numeričen opis. Osnovna predpostavka, ki jo napravimo, da bi dali tem kvalitetam numeričen izraz, je, da se karakteristike, kot so različne zmožnosti, inteligenca, ubogljivost in tako dalje, numeričnega značaja, ki se za populacijo distribuirajo v normalni distri¬ buciji. Ta predpostavka je sprejemljiva, ker je normalna distribucija naravna poraz¬ delitev najrazličnejših kvalitet. Večina ljudi je na primer srednje nadarjenih, odkloni na slabše oziroma na boljše pa so tem redkejši, čim večji so. Do možnosti merjenja teh kvalitet pa pridemo pod to predpostavko z naslednjim sklepanjem. Za veliko homogeno populacijo oseb predpostavljajmo, da se zmožnosti računskega presojanja distribuirajo normalno. Kljub temu da za sedaj še nimamo numeričnega merila te zmožnosti, moremo teoretično uvesti z-skalo zmožnosti 174 računskega presojanja. V skladu z lastnostmi normalne distribucije vemo, kaj posa¬ mezne vrednosti z pomenijo. Vrednosti z okrog 0 pomenijo povprečno zmožnost, pozitivni z nadpovprečno, negativni z podpovprečno zmožnost, s tablicami normalne distribucije moremo dobiti zvezo z s centilnim rangom in tako dalje. Vendar je za sedaj ta skala še abstraktna. Do konkretizacije moremo priti na naslednji način. Vzemimo dano nalogo, ki meri računske zmožnosti, in jo dajmo v reševanje veliki homogeni skupini oseb. Določeni odstotek oseb bo nalogo rešil pravilno. Čim težja je naloga, tem manjši je ta odstotek, in čim lažja je naloga, tem večji je odstotek oseb, ki so nalogo pravilno rešile. Težavnost naloge in odstotek Slika 31. Odnos med odstotkom pravilnih rešitev in težavnostjo naloge oseb populacije, ki naloge ni rešil, sta v premem sorazmerju. Vzemimo, da je dano nalogo A pravilno rešilo 22 % preizkušanih oseb oziroma je ni rešilo 78 °/„. Ker predpostavljamo, da so računske zmožnosti v populaciji distribuirane normalno, moremo poiskati standardiziran odklon z tiste stopnje zmožnosti presojanja računskih odnosov, ki je potrebna, da nalogo A rešimo. V našem konkretnem primeru je z A (F = 0,5 —P = 0,5 — 0,22 = 0,28) = + 0,77. S tem z moremo meriti težavnost naloge A, ki je merjena s standardiziranim odklonom z A tiste zmožnosti, ki je še potrebna, da nalogo A rešimo. Enako pa moremo s tem z meriti zmožnost presojanja računskih odnosov posameznika. Če testirana oseba naloge A ne reši, računamo, da so njene zmožnosti računanja pod -j- 0,77, v nasprotnem primeru pa nad + 0,77, če zmožnost merimo V standardiziranih odklonih z. Razen naloge A vključimo v test še nalogo B, za katero na enak način ugotovimo težavnost naloge z B . Vzemimo, da je standardiziran odklon zmožnosti, ki je še potrebna, da nalogo B 175 rešimo, z B = — 0,12. Vsako osebo, testirano z obema nalogama, moremo katego¬ rizirati po zmožnosti presojanja računskih odnosov v eno izmed treh kategorij. Zmožnost oseb, ki niso rešile nobene izmed obeh nalog, je, merjena v z-enotah, pod z B = — 0,12. Zmožnost oseb, ki so rešile samo lažjo ( B ) nalogo, je, merjena v z-enotah, med z B = —0,12 in z A = +0,77. Zmožnost oseb, ki so rešile obe nalogi, pa je nad z a — +0,77. S tem je nakazana splošna rešitev merjenja zmožnosti. Z dvema nalogama, ki smo ju dali v reševanje testirani osebi, smo mogli testirano osebo kategorizirati v enega izmed treh razredov zmožnosti. Če namesto dveh nalog vzamemo v test večje število po težavnosti različnih nalog, moremo zmožnost testirane osebe določiti veliko bolj natančno, ker je z njimi interval, v katerem variira zmožnost, razdeljen v večje število razredov. V splošnem k nalog razdeli interval zmožnosti v k + 1 razred. Vsaka testirana oseba, katere zmožnost je na primer med z 6 in z 7 , bo rešila prvih šest nalog, za rešitev sedme naloge pa je njena zmožnost premajhna. Če štejemo šest pravilno rešenih nalog kot šest točk, vemo, da so zmožnosti vseh oseb, ki so dosegle šest točk, med z e in z 7 . Večje število pravilno rešenih nalog oziroma doseženih točk pomeni višjo stopnjo zmožnosti. Če so naloge urejene po težavnosti in izbrane tako, da so v težavnosti med nalogami po vrsti enake razlike, je skupno število s testom doseženih točk v linearni zvezi z zmožnostjo. V tem primeru je število s testom doseženih točk direktno in pravilno merilo stopnje zmožnosti. Na način, ki je bil nakazan zgoraj, moremo reševati dva problema: a) Težavnost naloge določamo tako, da damo preizkusno nalogo v reše¬ vanje veliki homogeni skupini oseb. Z odstotkom oseb, ki so nalogo pravilno rešile, pa določimo težavnost naloge, merjeno v z-enotah. b) Zmožnost testirane osebe merimo s številom doseženih točk, ki jih je dosegla pri testu z velikim številom testnih nalog. 176 Popolnoma analogen problem nastopa tudi pri drugih kvalitetah, ki imajo numerično osnovo. Vzemimo kot primer kritičnost pri presojanju vrednosti literar¬ nega dela. Tudi kritičnost presojanja je znak z numeričnim karakterjem, ker govorimo o večji ali manjši kritičnosti posameznih ocenjevalcev. Če predpostavljamo, da se kritičnost presojanja ocenjevalcev distribuira normalno, moremo, enako kot za zmožnosti, reševati dva problema. Z odstotkom ocenjevalcev, ki so ocenili ustreznost nekega literarnega dela, moremo z ustrezajočo vrednostjo z meriti kvaliteto dela. Število ugodno ocenjenih del, ki so bila razvrščena po kvaliteti, ki jih je ocenjevalec ocenil kot ustrezna, pa more meriti rigoroznost presojanja tega ocenjevalca. Zavedati se moramo, da je zgornji postopek idealiziran in da so abstrahirani vsi dodatni faktorji, tako da je rešitev določene naloge odvisna samo od zmožnosti, ne pa od dodatnih faktorjev. V odstavku 82.3 bo govora o posledicah teh dodatnih vplivov na testne rezultate. 82. Testne norme 82.1 Sestavljanje Tablice, s katerimi iz števila točk, doseženih pri določenem testu, razberemo ustrezno mero zmožnosti, imenujemo testne norme. Testne norme sestavljamo po naslednjih stopnjah: 82.11 Testne naloge. Osnovni problem sestavljanja normnih tablic je skupina nalog, ki sestavlja test, ki je orodje preizkušanja kvalitete, ki jo hočemo meriti. Da skupina nalog ustreza svojemu namenu, morajo biti naloge po možnosti take, da so razlike v težavnosti nalog (merjene v z) čimbolj enake in da zavzemajo ves interval zmožnosti. Zaradi tega je treba skupino nalog pred uvedbo analizirati in prečistiti v tem smislu, da izločamo naloge iste stopnje težavnosti in dodajamo naloge drugih težavnostnih stopenj. To delamo toliko časa, da dobimo čimbolj enakomeren register nalog po težavnosti na vsem intervalu zmožnosti. Kakšne posledice ima na testno distribucijo skupina nalog, ki temu pogoju ne ustreza, vidimo iz slike 33. Pri določanju stopnje težavnosti posameznih nalog nastane razen drugih tudi naslednji problem. Dostikrat je testna naloga dana v tej obliki, da testiranec izmed več možnih vpisanih odgovorov izbere pravilni odgovor na dano nalogo oziroma vprašanje. Pri tem sistemu pa se more zgoditi, da tudi oseba, ki brez poznavanja — na slepo —• odgovarja na vprašanja, v določenem številu primerov pravilno reši dano nalogo. V primeru, da sta na dano nalogo postavljena dva odgovora: en pra¬ vilen in en nepravilen, moremo pričakovati, da pri popolnoma nepreudarnem od¬ govarjanju dobimo 50°/ o pravilnihin 50°/o napačnih odgovorov. Ta efekt moti pra- 12 — Statistične metode 177 vilno določanje težavnosti nalog, ker odstotek pravilnih odgovorov ne ustreza stvarni težavnosti naloge. Efekt ugibanja je odvisen od števila možnih odgovorov in je tem manjši, čim večje je število možnih odgovorov. Odstotek pravilno rešenih nalog, ki meri kot centilni rang težavnost naloge, korigiramo po obrazcu Pcor j p — 100 7-1 (188) Pri tem pomeni: p = nekorigiran odstotek pravilnih odgovorov, j = število možnih odgovorov na dano vprašanje oziroma nalogo, p cor = korigirani od¬ stotek pravilnih odgovorov. Primer 130. Preizkušamo težavnost treh nalog. Nalogo A, ki ima dva možna odgovora, je rešilo pravilno p A = 68 °/o preizkušanih oseb, nalogo B, pri kateri so trije možni odgovori, je rešilo p B — 45 °/ 0 , nalogo C, pri kateri je možno 5 odgovorov, pa p c — 22 % oseb. Kolika je težavnost teh treh nalog, če upoštevamo korekturo zaradi ugibanja? Tabela 62. Določanje težavnosti nalog z upoštevanjem korekture zaradi ugibanja p cor smo izračunali po obrazcu 184, ustrezne vrednosti težavnosti z pa iz nor¬ malne distribucije (tabela B) z (F = 0,5 — p cor ). Glede na značaj odgovorov točkujemo nepravilne rešitve z 0 ali —1, pravilne rešitve pa s -f-1. 82.12 Testni vzorec. Ko imamo sestavljeno skupino nalog, ki zadošča zgornjim pogojem, in so te razvrščene po stopnji težavnosti od najlažje do najtežje, s to skupino nalog testiramo populacijo, za katero izdelujemo testne norme. Distribucija dose¬ ženih rezultatov predstavlja distribucijo populacije glede na merjeno zmožnost. Tehnično redkokdaj sestavljamo distribucijo po zmožnostih za populacijo v celoti, temveč iz populacije izberemo slučajen vzorec oseb. Distribucija točk, ki so jih dosegle testirane osebe vzorca, predstavlja oceno distribucije populacije. Vzorec mora biti tako velik in tako izbran, da zadovoljuje zahteve o zanesljivosti podatkov. Če vzorec ni pristran, pričakujemo, da distribucija rezultatov testiranja ne bo značilno različna od normalne. 178 Distribucija doseženih točk pa ni odvisna samo od reprezentativnosti vzorca, ampak bistveno tudi od razmestitve nalog po težavnosti. V sliki 33 imamo nekaj karakterističnih primerov, ki pokažejo nenormalnosti distribucij doseženih točk zaradi nepravilne težavnosti testnih nalog. Te deformacije nastanejo zaradi nelinearne odvisnosti med številom točk testnih rezultatov in z-rezultatov. Enako more nastopiti deformacija distribucije testnih rezultatov tudi v primeru nepravilnega časa testiranja. 82.2 Izražanje testnih rezultatov 82.21 Število doseženih točk. Rezultate testiranja moremo izražati raz¬ lično. Eden od njih je kar število doseženih točk pri testiranju, ki je običajno vsota točk, doseženih pri posameznih .nalogah testa. Če so razlike v težavnosti med 179 zaporednimi nalogami enake, je to merilo objektivno merilo zmožnosti, ker enaka razlika v dosežkih pomeni enako razliko v zmožnostih. Če ta pogoj ni izpolnjen, število točk direktno nima te lastnosti in je zaradi tega slabo merilo zmožnosti. Ta način ima še eno hibo. Število doseženih točk je odvisno razen od zmožnosti tudi od števila testnih nalog. Zaradi tega so testni rezultati različnih testov, dani s številom točk, med seboj neprimerljivi. Zaradi tega število doseženih točk rabi le kot osnovni podatek, ki ga s testnimi normami izrazimo v prikladnejših merilih. 82.22 Centilni rangi. Enotnejše merilo so centilni rangi. Ne glede na to, za kateri test gre, centilni rang pove mesto v populaciji, ki ga določen rezultat zaseda v primerjavi z drugimi vrednostmi. Centilni rang 90 pove na primer, da je rezultat, ki ga je dosegla testirana oseba, tak, da 90 % oseb populacije dosega povprečno slabše, 10 “/o Pa boljše rezultate. Prednost centilnih rangov je v enotnosti izražanja in lahkem razumevanju, ker centilni rang dejansko pove, koliki del populacije ima manjše zmožnosti kot oseba, ki je s tem centilnim rangom karakterizirana. Pomanjkljivost centilnih rangov pa je v tem, da skala centilnih rangov ni v linearni zvezi s stvarno zmožnostjo; to more zavesti do napačnih zaključkov. Razlika v zmožnostih med osebama, od katerih je ena dosegla petdeseti, druga pa petinpetdeseti centilni rang, ni ista kot razlika v zmožnostih med osebama, od katerih je ena dosegla devetdeseti, druga pa petindevetdeseti centilni rang, čeprav je razlika v rangih enaka. Medtem ko je razlika merjena v standardiziranih odklonih z pri prvih dveh enaka 0,13, je razlika drugih dveh, merjena v istih enotah, 0,37, torej skoraj trikratna. Zaradi tega je uporabnost centilnih rangov kljub mnogim odlikam omejena. Primer 131. Centilne norme DAT mladine v LRS so bile tehnično izdelane po naslednjem postopku: a) Iz podatkov vzorčnega testiranja so bile za vsak test posebej sestavljene frekvenčne distribucije dosežkov vzorca. b) Izračunana je bila kumulativna frekvenčna distribucija relativnih frekvenc. c) Kumulativa relativnih frekvenc je bila včrtana na verjetnostni papir. d) Ta krivulja (v bistvu je bila to premica) je bila grafično izravnana. e) lz /zravnane linije so bili odčitani centilni rangi in sestavljena tabela centilnih norm. f) Izdelane so bile centilne normne tablice za tretješolce in četrtošolce, ločeno za dečke in deklice. Primer 132. V tabeli 63 so dane centilne normne tablice DAT za četrtošolce v LR Sloveniji iz leta 1957. Centilne norme dajejo direkten prehod iz števila dose¬ ženih točk na centilne range, in sicer v razmaku po pet, za naslednje teste: Testi zmožnosti presojanja mehanskih, abstraktnih, računskih, besednih odnosov, urnosti in natančnosti, spacialnih in ploskovnih odnosov. 180 Tabela 63. Centilne norme DAT četrtošolcev v LR Sloveniji M = mehanski test; A = abstraktni test; R = računski test; S = besedni test; UN = urnost in natančnost; S = spacialni test; P — ploskovni test; CR = centilni rang R B UN 22 28 56 21 27 55 20 25—26 54 19 24 53 18 23 52 17 22 50— 16 21 49 15 20 48 14 19 47 13 17—18 45—46 12 16 44 10—11 15 42—^43 8—9 13—14 39—41 7 10—12 36—38 5—6 8—9 32—35 0—4 0—7 0—31 18,2 25,6 51,7 7,3 8,3 9,9 Testne norme moremo uporabljati za direktno odčitanje centilnih rangov iz števila doseženih točk pri posameznem testu. Primer 133. Četrtošolci A, B in C VIII. gimnazije v Ljubljani so dosegli pri testi¬ ranju z DAT navedene v tabeli 64. Centilni rangi so bili odčitani iz centilnih norm v tabeli 63. Primerjavo centilnih rangov moremo izvesti tudi med testi, kar z absolutnimi vrednostmi dosežkov ni bilo mogoče. Iz tabele 64 vidimo, da je dijak A najslabši v zmožnosti presojanja besednih, najboljši pa v zmožnosti presojanja mehanskih odnosov, dijak B najslabši v urnosti in natančnosti, najboljši pa v zmožnosti presojanja mehanskih odnosov. Dijak C pa je najslabši v zmožnosti presojanja besednih-, najboljši pa v presojanju mehanskih odnosov. Splošen nivo zmožnosti je najvišji pri učencu A, najnižji pa pri učencu C. 181 Tabela 64. Rezultati testiranja dijakov DAT za dijake A, B, C VIII. gimnazije v Ljubljani x = točke; CR = centilni rang 82.23 Standardizirani odklon — z-rezultati. Če je test konstruiran tako, da je distribucija testnih rezultatov vzorčne skupine normalna, je najboljše sredstvo za merjenje zmožnosti standardizirani odklon testnega rezultata z. z je v tem primeru direktno linearna skala zmožnosti. Zaradi razmeroma enostavne zveze standardi¬ ziranega odklona z normalno distribucijo N (M =0; S D = 1), z nazorno podaja zmožnost. Negativni z pomeni podpovprečno zmožnost, pozitivni z pa nad¬ povprečno zmožnost. S tabelami normalne distribucije pa imamo direktno zvezo z-rezultatov s centilnimi rangi. Problem uporabnosti in pomena nastopi edinole, če distribucija testnih rezultatov ni normalna. V tem primeru z izgubljajo na nazor¬ nosti. Vendar so z-rezultati, če odstopanja od normalnosti niso velika, še vedno zelo uporabno sredstvo za prikazovanje testnih rezultatov. Primerjava testnih rezultatov za različne teste je v primeru abnormalnosti distribucij omejena le na teste, katerih distribucije so med seboj, če že ne enake, vsaj podobne po obliki. Tehnična hiba z-rezultatov pa je v tem, da imajo predznak in decimalke. Pretvarjanje osnovnih testnih rezultatov v z-rezultate izvedemo po obrazcu X -~=2 (189) SD Primer 134. V tabeli 63 imamo v testnih normah dane aritmetične sredine in standardne odklone posameznih testov za četrtošolce. Predpostavljamo normalnost testnih distribucij. Pretvorimo testne rezultate dijakov A, B, C iz primera 132 v tabeli 64 v z-rezultate! z-rezultati so izračunani po obrazcu 189, Na primer: z A ,meh= (56 - 38,4)/10,9 = + 1,61 Iz rezultatov moremo neposredno določiti, v katerih zmožnostih so dijaki A, B in C pod ali nad slovenskim povprečjem in kolik je odklon od povprečja. 182 Tabela 65. Rezultati testiranja z DAT za četrtošolce A, B in C VM. gimnazije v Ljubljani Grafična ponazoritev testnih rezultatov, danih v centilnih rangih ali z-rezuUatih, zelo nazorno pokaže odnose med posameznimi zmožnostmi. Centilne range pri¬ kazujemo na verjetnostnih skalah. Tako dobimo pravilne relacije med posameznimi zmožnostmi, katerih linearna skala centilnih rangov ne da. Primer 135. V sliki 34 so prikazani testni rezultati dijaka A v obliki centilnih rangov (iz tabele 64). Kot je razvidno iz slike, je skala centilnih rangov verjetnostna, Slika 34. Rezultati testiranja DAT za dijaka A, prikazani v centilnih rangih 183 ker bi v nasprotnem primeru ne dobili pravilnih odnosov med dejanskimi zmož¬ nostmi. Slika 35 pa prikazuje psevdokrivulje z-rezultatov dijakov A, B in C iz tabele 65. Slika nazorno prikaže odnose med zmožnostmi za vse tri dijake hkrati. Iz nje vidimo, da je dosežek vseh treh dijakov v besednem testu podpovprečen, v drugih testih pa so razlike med dijaki znatne, razen v računanju, pri katerem so zmožnosti vseh treh okrog povprečja. Primerjava slike 34 s psevdokrivuljo za dijaka A pokaže, da se obe sliki skladata; to je posledica tega, da so centilni rangi na sl. 34 dani v verjetnostni skali. M AR B UN S P Slika 35. Rezultati testiranja DAT za dijake A, B, in C, prikazani v z-rezultatih Medtem ko nima smisla niti povprečje osnovnih podatkov testiranja, niti cen- tilnih rangov, ima povprečje testnih različnih rezultatov za posameznika, izraženih v z-enotah, svoj logični smisel in pokaže splošen nivo zmožnosti testiranca. Enako more povprečen absoluten odklon AD Z z -rezultatov za posameznika rabiti kot merilo razlik med zmožnostmi testiranca. Primer 135. Za dijake iz primera 133 dobimo naslednja povprečja in povprečne absolutne odklone testnih rezultatov. Tabela 66. Aritmetične sredine Mz in povprečni absolutni odkloni rezultatov testiranja z DAT dijakov A, B in C iz primera 133 184 M ZA = 1/7(1,61 + 0,85 +..,+ 0,33) = +0,40 z^ = 1/7 (11,61 — 0,40j + 10,85 — 0,401 +...+ 10,33 — 0,401) = 0,73 Iz rezultatov v tabeli 66 sklepamo, da je splošen nivo zmožnosti najvišji pri dijaku A (M= +0,40), najnižji pa pri dijaku C (M= 0,32), da pa so razlike med zmožnostmi najmanjše pri dijaku C ( AD ZC = 0,37). 82.24 Prevedba z-rezultatov na skale s poljubnim M in SD. F- re¬ zultati. Ena izmed hib standardiziranih z-rezultatov so predznaki in decimalke. Tu si lahko pomagamo z linearno transformacijo z-rezultatov v primernejše količine. Linearna transformacija z-rezultatov ne vpliva na vsebino skale, čeprav je merjena z drugim merilom. Splošen obrazec linearne transformacije rezultatov x„ za katere sta aritmetična sredina M„ standarden odklon pa SD s , v nove rezultate x t , ki imajo aritmetično sredino M, in standardni odklon SD,, je obrazec X, — M, = X ,— M, SD, SD, (190) ki je v razviti obliki dan v obrazcu SD, X,= M,-\ - -(X,-M s ) SD, (191) Dostikrat preračunavamo po zgornjih obrazcih z-rezultate, za katere je M, = 0, SD,= 1, v F-skale z M, = 50 in SD, = 10. Povprečni F-rezultat je torej M = 50,. standardni odklon pa je SD = 10. Enota F-rezultatov je 0,1 SD. S celimi števili od 1 do 100 obsežemo torej interval —5 SD do + 5SD. Ta način izražanja je tehnično’ veliko prikladnejši kot z-rezultati, zveza z z-rezultati pa je očitna. F — 75 pomeni, da je rezultat za 2,5 S D oddaljen od povprečja in tako dalje. Skoraj celotna populacija je v mejah 25 < F < 75. Zaradi tega so običajno testne norme, izražene v F-rezultatih, izdelane na intervalu od 25 do 75 in ne na celem intervalu od 1 do 100, kot je teore¬ tično možno. Če uporabimo splošen obrazec transformiranja 191 za naš konkretni primer, dobimo v obrazcu F= 50 + 10 • z (192) transformacijo z-rezultatov v F rezultate, v obrazcu 10 F =50 H- (x—M x ) (193) SD X pa transformacijo osnovnih testnih ^-rezultatov v F-rezultate. Prevedba z-rezultatov v F-rezultate je zelo preprosta, prevedba A-rezul tatov v F-rezultate pa je malo za- mudnejša. 185 Primer 137. Z -rezultate testiranja z DAT za tri četrtošolce iz primera 133 je treba prevesti v F-rezultate. Tabela 67. z- in F-rezultati testiranja z DAT za četrtošolce A, B in C iz primera 133 F-rezultate smo iz z-rezultatov dobili preprosto tako, da smo z-rezultat po¬ množili z 10, produktu pa prišteli 50. Primer jasno pokaže preprostejše izražanje s F-rezultati. 82.25 F-rezultati. F-rezultate smo iz z -rezultatov dobili z linearno transforma¬ cijo. Zaradi tega imajo F-rezultati vse dobre in slabe lastnosti z-rezultatov. z- in F-re¬ zultati so upravičeni le, če je distribucija testnih rezultatov, ki rabi za osnovo izdelave normnih tablic, normalna. V primeru, da je ta distribucija od normalne različna, pa je njih vrednost omejena, in problematična. Praktično je težko sestaviti serijo nalog, katerih težavnost bi se enakomerno večala. Kakšen vpliv ima to na distribucijo testnih rezultatov, vidimo iz slike 33. Zaradi tega je problem primernega merila testnih rezultatov večkrat pereč. Pomanjkljivosti, ki jih imajo z- in F-rezultati, odpravimo z uvedbo F-rezultatov, ki so idealno sredstvo za merjenje zmožnosti na osnovi testnih rezultatov. Tudi če distribucija testnih rezultatov x zaradi neenakomernosti naraščanja težavnosti testnih nalog ni normalna, moremo iz nje dobiti, kolik odstotek (F) testi¬ rancev je preseglo dano število točk x. Ker predpostavka o normalni porazdelitvi zmožnosti še vedno velja, moremo iz dobljenega P najti mejno zmožnost, ki je po¬ trebna, da dosežemo to število točk. Ta je merjena z vrednostjo z, ki ustreza odstotku P na normalni distribuciji zmožnosti. Ta rezultat, transformiran v skalo z M — 50 in SD = 10, je F-rezultat. Proces je naznačen v sliki 36, kjer je distri¬ bucija testnih rezultatov, dobljena iz vzorca, izrazito asimetrična v levo. F-rezultati zato niso popačeni zaradi morebitne nenormalnosti vzorčnih testnih distribucij, kolikor gre nenormalnost na račun sestava nalog po težavnosti, ne pa na račun pristranosti vzorca. F- in F-rezultati za isti test se skladajo v primeru, da je distribucija osnovnih . testnih rezultatov x normalna. Čim večja pa je nenormalnost distribucije testnih rezultatov jc, tem večje je neskladje med njima. 186 Slika 36. Transformacija ^-rezultatov v T-rezultat Testne norme, izražene v T-rezultatih, dajo direktno zvezo med številom dose¬ ženih točk in ustrezajočim T-rezultatom. Z njimi moremo osnovne rezultate testi¬ ranja prevesti direktno v T-rezultate. Primer 138. Kot primer testnih norm v T-rezultatih dajemo iz testnih norm DAT za testne norme zmožnosti presojanja mehanskih odnosov četrtošolcev. Tabela 68. Testne norme zmožnosti presojanja mehanskih odnosov četrtošolcev v LRS (T-rezultati) T-rezultati v tabeli 68 gredo od 25 do 75, ker zajamemo s tem praktično vse primere (natančno 98,8 %). V tablici 69 so v prvi koloni desetice, v prvi vrsti pa enice števila točk, doseženih pri testu. .Kjer se ustrezajoča kolona desetic in vrsta enic 187 sekata, dobimo ustrezno vrednost 7-rezultata. Na primer: jc = 48 = 40 -f- 8 točkam ustreza T = 59. Primer 139. V tabeli 69 so dani osnovni rezultati x, F-rezultati in T-rezultati DAT za četrtošolce A, B in C iz primera 132. /-rezultati so vzeti iz tabele 67, /'-rezultati pa so odčitani iz testnih norm DAT četrtošolcev v LR Sloveniji. Tabela 69. Osnovni ^-rezultati, F-rezultati in T-rezultati za četrtošolce A, B in C Primerjava 7-rezultatov s F-rezultati pokaže, da so razlike med njimi za nekatere teste minimalne ali jih sploh ni (n. pr. računski), za nekatere pa znatne (n. pr. besedni). To zaradi večje ali manjše stopnje normalnosti distribucij osnovnih testnih rezultatov. 82.26 C-rezultati. Dostikrat so za praktične potrebe T-rezultati prenatančni, ker diferencirajo razlike 0,1 S D. Prevelika natančnost navajanja testnih rezultatov je problematična tudi zaradi tega, ker dostikrat test ni toliko zanesljiv, da bi zmogel tako diferenciacijo. Zato dostikrat uporabljamo bolj grobe skale C-rezultatov, ki diferencirajo razlike 0,5 SD. S C-rezultati klasiramo testne rezultate v 10 grup. Tabela 70 kaže osnovne karakteristike C-rezultatov. Tabela 70. Karakteristike C-rezultatov 188 Tabela 70 omogoča direkten prehod centilnih rangov, z- ali T-rezultatov v C-rezultate. Prehod preko z-rezultatov je možen le, če je distribucija normalna. Primer 140. Za dijake A, B in C, za katere izračunavamo testne rezultate v raz¬ ličnih oblikah, so T-rezultati prevedeni v C-rezultate, dani v tabeli 71. Tabela 71. C-rezultati za dijake A, B in C iz primera 139 C-rezultate smo dobili iz T-rezultatov z uporabo tabele 70. 82.27 Skala petih grup. Še bolj groba skala klasira testne rezultate v pet grup, od katerih je vsaka široka po en standardizirani odklon. Če napravimo za ta primer podobno tabelo kot za C-rezultate v tabeli 70, dobimo tabelo 72. Tabela 72. Karakteristike skale petih razredov Ta razdelitev obseže interval 5 SD ali 98,8 °/ 0 vseh primerov. Primere, ki more¬ biti padejo izven teh meja, vključimo v mejne razrede. Grupe 1 do 5 moremo zaznamovati s prilastki, ki ustrezajo konkretni vsebini pojava, ki ga z njimi klasiramo, n. pr.: 1 — prav slab; 2 — slab; 3 — dober; 4 — prav dober; 5 — odličen, ali drugo zaznamovanje: 1 — zelo podpovprečen; 2 — podpovprečen; 3 — povprečen; 4 ■—■ nadpovprečen; 5 — zelo nadpo¬ vprečen. 82.3 Kvalitete testa 82.31 Zanesljivost testa. 82.311 V dosedanjih poglavjih smo probleme v zvezi s testi idealizirali irr predpostavljali, da je testni rezultat odvisen samo od zmožnosti, ki jo meri, in. od nobenih drugih dodatnih faktorjev. Vendar se temu idealiziranemu primeru moremo samo bolj ali manj približati. Na rezultat, dosežen pri testiranju, vplivajo razen karakteristike, ki jo merimo s testom, še drugi faktorji. Ti faktorji motijo, da testni rezultat ni objektivno merilo zmožnosti, ki jo z njim merimo. V tej situaciji smatramo test kot zanesljivejši instrument merjenja določene zmožnosti ali druge kvalitete, čimbolj je neodvisen od drugih faktorjev. Popolnoma za¬ nesljiv test bi moral dati iste rezultate, če merimo z njim enako zmožnost. Zelo zanesljiv test da v teh primerih, če že ne iste, vsaj zelo podobne rezultate. Čim manjša je zanesljivost testa, tem manjša je odvisnost testnih rezultatov od dejanske zmožnosti oziroma kvalitete, ki naj bi jo test meril. Kot pokazatelj zanesljivosti testa moremo smatrati torej korelacijo med dejansko zmožnostjo in rezultati testiranja. Vendar te ideje ne moremo realizirati, ker zmožnost merimo z rezultati testiranja in običajno nimamo absolutnega merila, s katerim bi primerjali rezultate testa. Zaradi tega vza¬ memo kot merilo zanesljivosti testa korelacijo med rezultati ponovljenega testiranja zmožnosti za isto osebo. V primeru maksimalne zanesljivosti testa bi bil korelacijski koeficient med ponovljenimi podatki enak ena. Čim manjša je zanesljivost testa, tem manjša je tudi korelacija med ponovljenimi testiranji. Da ocenimo oziroma izmerimo to korelacijo, imamo več postopkov. Vsi ti postopki imajo namen, da ustvarijo čimbolj izenačene pogoje koreliranih testiranj. Vsi so zaradi tega izdelani večinoma na osnovi ene ali druge oblike samokorelacije. a) Retestna (ponavljalna) metoda obstoji v tem, da isti test za isto skupino ponovimo in merimo korelacijo med rezultati prvega in drugega testiranja. Po¬ manjkljivost te metode je v tem, da je testirancem pri ponovitvi testa, če razdobje med enim in drugim testom ni relativno dolgo, testno gradivo znano. To dejstvo je dodaten faktor, ki vpliva na odnose. Ponovitev po daljšem času pa ruši princip enakih pogojev. Zmožnosti testiranih oseb se morejo v tem času spremeniti, in sicer v različni jakosti. b) Metoda paralelnih ali alternativnih testov se od zgornje razlikuje v tem, da pri drugem testiranju prvega testa ne ponovimo direktno, temveč vzamemo drug test, ki je prvemu po svojih kvalitetah (meri isto zmožnost, vsebuje enako težke naloge kot prvi) podoben oziroma enak, le da so naloge druge. Ta metoda deloma — ne povsem — eliminira vpliv spomina, ki je pri prvi metodi zelo velik. c) Po metodi enakovrednih polovic razdelimo testne naloge v dve enakovredni grupi. Korelacija med rezultati obeh polovic more rabiti kot merilo zanesljivosti 190 testa. Prednost te metode je v tem, da testa ni treba ponoviti. S tem, da sta obe po¬ lovici testa testirani istočasno, so pogoji koreliranih podatkov izenačeni, kolikor je največ možno. Ugovor, da razdelitev testa na polovici ni enolična, drži le v primeru, če je težavnost nalog enaka oziroma podobna. Če pa so naloge razvrščene po težav¬ nosti, je objektivna razdelitev dana s tem, da v prvo polovico vključimo vse lihe, v drugo pa vse sode naloge. d) Metoda racionalnih ekvivalenc ima nasproti zgornji to prednost, daje razdelitev testa v polovici izvršena tako, da od dvojic ekvivalentnih nalog vključimo v vsako polovico po eno. 82.312 Pri vseh navedenih metodah je merilo zanesljivosti testa determinacijski koeficient med dvema testiranjima oziroma deloma testa r„. Čim večji je r„, tem večja je zanesljivost testa. Vrednost r tt je v mejah od nič do ena. Računamo, da mora biti r„ > 0,90, če hočemo, da test diferencira posameznike. Kot indeks zanesljivosti smatramo r lm , ki ga izračunavamo po obrazcu ru,= j/l— r a (194) Pri tem pomeni /- lco korekcijski koeficient med dejanskim rezultatom testiranja X x in pravo vrednostjo X „. Standardno pogreško ocene prave vrednosti o,„ določamo po obrazcu Oi„ = Oij/l — r n (195) V teh obrazcih pomeni r u koeficient zanesljivosti testa, a, pa S D testnih rezultatov. Ker se učinek individualnih oziroma slučajnih faktorjev v velikem številu meritev po zakonu velikih števil manjša, sklepamo, da je test, sestavljen iz večjega števila nalog, zanesljivejši. Če zaznamujemo z r u koeficient zanesljivosti znane dol¬ žine 1, z r„„ pa koeficient zanesljivosti testa, kije n-krat daljši, je med njima enostavna računska zveza _ nrii _ 1 + (n — 1) r a (196) po Spearman-Brownovi formuli. Če ta obrazec preuredimo, moremo z obrazcem r m (1 — ru) n — - r n (1 — O (197) izračunati, kolikokrat daljši test bi dal zaželeno zanesljivost. S Spearman-Brovvnovim obrazcem 196 moremo izračunati tudi, kakšna je zanesljivost testa, če jo določamo iz razpolovljenega testa. Če z n/ 2 y 2 zaznamujemo determinacijski koeficient, izračunan iz polovic, je r n dejansko koeficient zaneslji- 191 'vosti testa, ker meri korelacijo med testi stvarne dolžine. Iz obrazca 196 moremo •dobiti r n , če poznamo a/ 2 i/ 2 , po obrazcu _ 2n / 2‘/2 '11 - -- 1 + r '/iVi (198) / Primer 141. Koeficient zanesljivosti določenega testa r n = 0,70. Kolik bi bil koeficient zanesljivosti testa, če bi ga trikrat podaljšali (n = 3). Po Spearman-Brow- novi formuli dobimo: 3 • 0,70 r% 3 =- 1 + (3 — 1) ■ 0,70 0,87 Koeficient zanesljivosti trikrat daljšega testa bi bil r 33 = 0,87. Primer 142. Koeficient zanesljivosti določenega testa r xl — 0,60. Kolikokrat daljši test bi dal koeficient zanesljivosti r nn = 0,90? Po obrazcu 197 dobimo: _ 0,90 • (1 — 0,60) ___ 0,60 • (1 — 0,90) Šestkrat daljši test bi dal zaželeno zanesljivost r 66 = 0,90. Primer 143. Z metodo alternativnih testov smo dobili A/ 2 i / 2 = 0,72. Kolik je koeficient zanesljivosti testa r u ? Po obrazcu 193 dobimo: 1 + 0,72 Zanesljivost testa je dana s koeficientom zanesljivosti r n = 0,83. Primer 144. Standardni odklon testa SD — 11,0, koeficient zanesljivosti pa r xl = 0,83. Kolika je standardna pogreška ocene prave vrednosti a lco ? Po obrazcu 195 dobimo: = 11,0 j/l —0,83 = 4,62 Standardna pogreška ocene prave vrednosti je o 100 = 4,62. 82.32 Objektivnost testa. Objektivnost testa moremo meriti s korelacijo rezultatov testiranja grupe oseb, ki je bila testirana dvakrat pri različnih ekspe¬ rimentatorjih. S to korelacijo merimo vpliv eksperimentatorja na rezultat testiranja. 82.33 Občutljivost testa. Test je tem bolj občutljiv, čim manjše diference v zmožnostih registrira. Zaradi tega moremo meriti občutljivost testa s standardnim odklonom testnih rezultatov. Čim večji je SD testnih rezultatov, tem občutljivejši je test. 192 82.34 Veljavnost testa. Veljavnost testa moremo meriti s korelacijo testnih rezultatov, s kakimi od testa neodvisnimi rezultati; n. pr. šolskimi ocenami, pro¬ duktivnostjo dela, rezultati standardnih testov in podobno. Veljavnost baterije testov pa merimo z multiplo korelacijo n. pr. med uspehom v poklicu in baterijo testnih rezultatov. Korelacija med testnimi in od testa neodvisnimi rezultati se zmanjša zaradi slučajnih faktorjev, ki vplivajo tako na testne kot neodvisne rezultate. Korekturo koeficienta veljavnosti moremo izvršiti po obrazcu r 0 ooo = r ‘ r ' ■ — (199) ]/ru r 22 pri čemer pomeni: r 12 — korekcijski koeficient med testnimi in neodvisnimi rezultati, r n = koeficient zanesljivosti testa; r 22 = koeficient zanesljivosti ne¬ odvisnih rezultatov; r xao = korigirani koeficient veljavnosti. Primer 145. Vzemimo, da je korekcijski koeficient med testnimi in neodvisnimi rezultati r 12 = 0,70, koeficient zanesljivosti testnih rezultatov r n = 0,80, koeficient zanesljivosti neodvisnih rezultatov r n = 0,90. Koliki je korigirani koeficient veljav¬ nosti testa r xx l Po obrazcu 199 dobimo: 0,70 r«, a, = _ = 0,82 1/0,80 • 0,90 Enako kot iz koeficienta veljavnosti testa, moremo tudi iz standardnega odklona testa eliminirati vpliv slučajnih faktorjev in dobiti SD »pravih vrednosti«. To korek¬ turo izvedemo z obrazcem o a. = O ]/ r n (200) v katerem pomeni: o x = korigirani S D ; o = izračunani SD ; r lt = koeficient zanesljivosti testa. 83. Drugi problemi skal S podobnimi predpostavkami o normalnosti razporeditve določene kvalitete, kot smo jo uporabili pri sestavljanju normnih tablic, moremo reševati tudi različne druge probleme. 83.1 Prirejanje numeričnih vrednosti atributom Znake z numerično osnovo, kot so na primer poštenje, originalnost, soglasnost, uspeh in podobno, izražamo običajno z atributi, ki opisujejo intenziteto pojava. 13 — Statistične metode 193 Tako je na primer uspeh kategoriziran v pet grup: prav slab, slab, dober, prav dober in odličen; soglasnost v pet grup: se absolutno ne strinja, se ne strinja, indiferenten, se strinja, se popolnoma strinja. Če predpostavljamo, da se kvaliteta z numerično osnovo distribuira v populaciji normalno, moremo za vsako kategorijo znaka, ki je dana kot atribut, določiti njene numerične karakteristike, merjene v standardiziranih odklonih. Za posamezno kategorijo-razred moremo določiti: a) meje razreda, b) povprečno vrednost razreda. Meje razredov atributivnih kategorij dobimo tako, da iz: a) po intenziteti urejene frekvenčne distribucije / izračunamo relativne fre¬ kvence /°, b) iz serije relativnih frekvenc /° izračunamo kumulativo F°, c) da moremo neposredno uporabiti tablice normalne distribucije iz F°, iz¬ računamo F = F° — 0,5, d) v tablicah normalne distribucije poiščemo površinam F ustrezajoče vred¬ nosti z. Te vrednosti so meje razredov atributov. Aritmetične sredine standardiziranih odklonov po kategorijah M z pa dobimo po postopku: a) Iz urejene frekvenčne distribucije po atributu izračunamo enako kot za meje razredov /°, F° in F= F° — 0,5. b) Poiščemo površinam F ustrezajoče vrednosti ordinat normalne distribucije y (iz tablic normalne distribucije). c) Določeni kategoriji atributa izračunamo ustrezajočo aritmetično sredino razreda z M T po obrazcu M z = ( 201 ) /° Pri tem pomeni: y s in y x = spodnji in zgornji meji razreda ustrezajoči vrednosti ordinat normalne distribucije, /°‘= relativna frekvenca te kategorije. Ta posto¬ pek je znan pod imenom Likertova skala. Primer 146. Po uspehu smo klasificirali skupino 178 učencev in dobili distribucijo po ocenah. Posamezne kategorije je treba karakterizirati z mejami in povprečji Likertove skale. Rezultati v tabeli 73 pokažejo, da so razredi posameznih ocen neenako široki (prav slab: i= 0,91; slab: i— 0,89; dober: i = 1,01; prav dober: i— 0,77; odličen: i — 1,42). Idealna širina klasiranja v pet razredov pa bi bila i = 1,00 za vse razrede. Posebno očita je anomalija med prav dobrimi in odličnimi. Smisel postopka za ta primer je nakazan v sliki 37. 194 Tabela 73. Izračunavanje mej in povprečij kategorij atributivnega znaka za Likertovo skalo za razporeditev 178 učencev po uspehu % Slika 37. Prevedba ocen v Likertovo skalo 83.2 Pretvarjanje ranga v »-rezultate Enotam, ki jih moremo razvrstiti po rangu, moremo kot numeričen izraz kvalitete prirediti rang. Rang pa je iz znanih razlogov slabo merilo. Če predpostav¬ ljamo, da se proučevana kvaliteta distribuira v populaciji normalno, moremo kot realnejše merilo kvalitete vzeti standardizirani odklon z, ki je rangu R koordiniran z / R — 0,5 \ z[F= - ! - 0,5} V N J 195 Primer 147. 35 učencev smo razvrstili po pridnosti. Ugotoviti je treba numeričen izraz pridnosti učenca A, ki je dvajseti, in učenca B, ki je osemindvajseti po rangu. Razen tega je treba poiskati rang učenca C, ki je od učenca B enako različen v prid¬ nosti, kot je B od A. Najprej poiščimo z A in z B kot merili pridnosti. z A = z [F= (20 — 0,5)/35 — 0,5] = (z (F= 0,057) = + 0,1434 z* = z [F= (28 — 0,5)/35 — 0,5] = z (F= 0,287) = + 0,7961 z c = Zb + ( Zb — Za ) = -f 0,7961 + (0,7961 — 0,1434) = + 1,4488 Iz tabele normalne distribucije dobimo: F(z c = 1,4488)= 0,432 Iz tega sledi dalje: P= 0,5 + F= 0,5 -j- 0,432 = 0,932. Dalje dobimo po znanem obrazcu R c = NPc + 0,5 = 35 • 0,932 + 0,5 = 33,1 Učenec C, ki se v pridnosti enako razlikuje od B kot B od A, je triintrideseti po rangu. Grafična rešitev tega problema je nakazana v sliki 38. R 83.3 Transformacija ocenjevalnih skal Pri praktičnem ocenjevanju pogosto naletimo na subjektivna ocenjevanja. Zaradi različnih kriterijev, ki jih uporabljamo, so ocene različnih ocenjevalcev neprimerljive. Ocene moremo primerjati med seboj šele, ako jih transformiramo. 196 Vzemimo, da dva ocenjevalca po točkah od 0 do 10 ocenjujeta stopnjo inteli¬ gence istega kolektiva. Distribuciji ocen obeh ocenjevalcev zaradi različnega kriterija ocenjevanja ne bosta isti, kljub temu da sta ocenjevala isto lastnost istega kolektiva. P Slika 39. Transformacija ocenjevalnih skal Ocene ocenjevalca A moremo prevesti v merilo oziroma skalo ocenjevalca B po kumulativnih frekvenčnih distribucijah ocen posameznih ocenjevalcev, kot 'je nakazano na sliki 39. Na tej sliki je razvidno, da ocena »4« ocenjevalca A v skali ocenjevalca B ustreza približno oceni »6«. Oba ocenjevalna sistema moremo po standardizirani normalni distribuciji prevesti tudi v z-sistem ocenjevanja. Tudi ta postopek je nakazan v sliki 39. Iz nje nazorno vidimo, da oceni »4« ustreza različna z ocena za posameznega ocenjevalca. Iz slike je razvidno, da ista ocena »4« pomeni za ocenjevalca A višjo stopnjo inteligence kot za ocenjevalca B. Če sta distribuciji ocen obeh ocenjevalcev normalni, moremo rezultate ocenje¬ valca A prevesti v ocene ocenjevalca B po obrazcu (x a )b = M b + — (x A — M A ) (202) Oa pri čemer pomenijo M A in M B aritmetični sredini ocen obeh ocenjevalcev, a A in o B pa ustrezajoča standardna odklona ocen. x A pomeni oceno ocenje¬ valca A, ( x A ) B pa transformirano oceno. 197 9 TABELE Tabela A. Kvadrati števil 1 — 1000 * 198 Tabela A. Kvadrati števil 1 — 1000 (nadaljevanje) 199 Tabelo kvadratov 1 do 1000 moremo uporabljati za kvadriranje in korenjenje. a) Kvadrati tromestnih števil. Pod A poiščemo prvima dvema mestoma ustrezajočo vrsto in tretjemu mestu ustrezajočo kolono. Kjer se dobljena vrsta in kolona sekata, je v tabeli vpisan ustre¬ zajoč kvadrat. Primer I. 56,8 2 . V čelu tabele pogledamo pod 56, v glavi pa pod 8. Križanje dobljene vrste in kolone da 56,8 2 = 3226,24 A <4 Shema 1. kvadriranje in korenjenje b) Kvadrati štiri- in večmestnih števil. Tabelo moremo uporabiti kot pomožno tabelo tudi za kvadriranje štiri- in večmestnih števil. Tromestni začetek ali konec števila, ki ga kvadriramo, moremo kvadrirati po tabeli, drug račun pa izvedemo na pamet. Primer II. 3672 2 367 2 134689 iz tabele 367-2-2 1468 2 2 _ 4 13483584 200 Primer III. 12876 : 12 2 144 2■ 12 • 876 21024 876 2 767376 iz tabele 165791376 c) 7>/ mesta kvadratnega korena. Od decimalne pike razdelimo število v grupe številk po dve mesti. Če je število mest pred decimalno piko liho, iščemo koren v odseku L tabele kvadratov, če pa je sodo, pa v odseku S tabele kvadratov. V tabeli poiščemo, med kateri dve števili B 0 in B 1 pade število B, za katerega iščemo kvadratni koren. Za število izmed B 0 in B u ki mu je B bližji, poiščemo v ustrezajoči vrsti prvi dve, v ustrezajoči koloni pa tretje mesto kvadratnega korena. Primer IV. j/276542 = 526. 276542 pade med 275625 in 276676. Ker je bliže 276676, vzamemo kot kvadratni koren 526. d) Kvadratni koren, izračunan na več mest. Kvadratni koren, izračunan na več kot tri mesta, moremo dobiti z linearno interpolacijo. Tako dobimo uporabne vrednosti do največ šest mest. Šesto mesto korena, dobljeno z linearno interpolacijo, se razlikuje od prave vrednosti največ za eno. V tabeli kvadratov moremo diference zaporednih kvadratov dobiti z uporabo kolone in vrste D in d. Vsota števil, ki leže v tabeli pod A v ustrezajoči vrsti in vmesni koloni, je diferenca dveh zaporednih kvadratov v tabeli. Kvadratni koren iz B izračunamo takole: V tabeli kvadratov poiščemo, med kateri vrednosti B„ in B, pade prvih pet oziroma šest mest števila B, za katerega iščemo kvadratni koren. Pod x poiščemo B„ ustrezajoča prva tri mesta kvadratnega korena. Nadaljnja tri mesta pa dobimo tako, da B — B 0 delimo z ustrezajočo vrednostjo A. Primer V. j/893. Ker je število tromestno, dodamo dve ničli, da dobimo pet¬ mestno število: 89300. V odseku L tabele kvadratov najdemo, da pade to število med 88804 in 89401. 88804 ustrezajoč korenje 298. Diferenco med zaporednima kva¬ dratoma pa najdemo pod A enako: A = 580+ 17= 597. Razlika 5 — B„ = 89300—- -—88804= 496; 496/597= 0,831. Glede na število decimalnih mest je kvadratni koren iz 893 enak 29,8831. Procedura kvadriranja in korenjenja je razvidna tudi iz sheme 1. 201 Tabela B. Normalna distribucija (standardni odklon —z; površina — F; ordinata — y) 202 Tabela B. Normalna distribucija (nadaljevanje) (standardni odklon — z; površina — F; ordinata — y) 215 4842 0396 216 4846 0387 217 4850 0379 218 4854 0371 219 4857 0363 Da se izognemo decimalkam, so tabelirane vrednosti 10 2 z, 10 1 F in I 0*y, kar je treba pri končnih rezultatih upoštevati. S tablicami moremo iz danega z najti F (z) in v (z) in obratno, iz znanega Fpoiščemo z (F) in y(F). Primer VI. z= 1,79. Iz tablic odčitamo F= 0,4633, y= 0,0804. Primer VII. F = 0,397; z (F) = 1,26; y (F) = 0,179. Tabelirane so površine F v intervalu 0 — z. Druge povr¬ šine, ki pridejo v poštev poleg F, so dane v tabeli I. Tabela I. Površine pod normalno distribucijo Slike teh površin so v sliki 12. 203 Tabela C. t-distribucija G 204 Tabela D. ^-distribucija Za distribucije, ki imajo m > 30, velja: — (j/2w — 1 -f- z p )*, pri če¬ mer je z standardiziran odklon normalne distribucije. Verjetnostim P ustrezajoče vrednosti z so dane v tabeli II. Tabela II. z-vrednosti P | z f Primer Vlil. X 2 (m = 85) = X - ( j /2 • 85 — 1 + 1,6449)*= 107,24 205 Tabela E. F-distribucija (P = 0,05) P 206 Tabela E. F-distribucija (nadaljevanje) (P = 0 , 05 ) / 207 Tabela E. F-distribucija (/>= 0 , 01 ) 208 Tabela E. F-distribucija (nadaljevanje) (/> = 0 , 01 ) 14 Statistične metode 209 Tabela F. Pretvarjanje korelacijskih koeficientov r v Fisherjeve koeficiente Z Tabelo H moremo uporabljati istočasno kot tabelo trigonometričnih funkcij sin.v in cosx za izračunavanje tetrakoričnega korelacijskega koeficienta r, po obraz¬ cu 89 in za izračunavanje koeficienta \ 1 — P, ki ga potrebujemo pri izračunavanju standardne pogreške ocene po obrazcu 70. Primer XI. cos 62° = 0,454 Primer XII. j/1—0,73* = 0,68 210 Tabela H. Tablica slučajnih števil LITERATURA Anderson R. L., Bancroft T. A.: Slatistical Theory in Research; New York; McGraw- Hill; 1952. Cochran W. G. and Cox G. M.: Experimental Design; New York; Wiley; 1956. Edwards A. L.: Experimental Design in Psycological Research; New York; Wiley; 1950. Garret H. E.: Statistic in Psychology and Education; Green and Comp; 1937. Johnson P. O.: Slatistical Methods in Research; New York; Prentice-Hall; 1949. Kelley T. L.: Fundamentals of Statistics; Cambridge Mass.: Harvard Universily Press; 1947. Lindquist E. F.: Statistical Analysis in Educational Research; Boston; Houghton Mifflin; 1940. Siegel S.: Nonparametric Statistics for the Behavioral Sciences; New York; McGraw-Hill; 1956. Snedecor G. W.: Statistical Methods; lowa; The lowa State College Press; 1957. PREGLED VSEBINE 0 Masovni pojavi. 5 01. Masovni pojavi . 5 02. Populacija. Enota . 5 03. Znaki . 6 03.1 Vrste znakov. 7 03.2 Grupiranje vrednosti znakov . 9 1 Urejevanje podatkov . 12 11. Urejevanje numeričnih podatkov. 12 11.0 Frekvenčna distribucija... 12 11.1 Metode sestavljanja frekvenčnih distribucij . 14 11.2 Distribucije relativnih frekvenc . 15 11.3 Grafično prikazovanje frekvenčnih distribucij. 16 11.31 Histogram. Poligon .,.. 16 11.32 Oblike frekvenčnih distribucij . 18 11.4 Kumulativna frekvenčna distribucija . 18 11.5 Grafično prikazovanje kumulativnih serij . 20 12. Urejevanje alributivnih znakov . 20 12.1 Frekvenčne distribucije alributivnih podatkov . 20 12.2 Grafično prikazovanje struktur . 22 13. Kvantih . 24 13.1 Ranžirna vrsta — rang . 24 13.2 Kvantilni rang . 25 13.3 Določanje rangov. 26 13.4 Določanje kvantilov in rangov iz frekvenčnih distribucij . 27 2 Srednje vrednosti . 30 20. Pojem. 30 21. Mediana. 31 22. Modus . 31 23. Aritmetična sredina . 33 23.1 Izračunavanje aritmetične sredine iz individualnih podatkov . 33 23.2 Izračunavanje aritmetične sredine iz frekvenčnih distribucij . 33 23.21 Direktna metoda . 34 23.22 Vpeljava pomožnega znaka u . 35 23.23 Metoda kumulativ. 36 23.3 Aritmetična sredina aritmetičnih sredin in strukturnih odstotkov . 37 23.4 Lastnosti aritmetične sredine . 38 24. Odnos med M, Me in Mo. 38 3. Mere variacije. 39 30. Vrste . 39 31. Variacijski razmak . 39 32. Kvartilni odklon. 39 33. Poprečni absolutni odklon .. 40 34. Varianca, standardni odklon . 41 34.1 Izračunavanje variance iz individualnih podatkov . 42 34.11 Direktni način . 42 34.12 Pomožni znak u. 42 34.2 Izračunavanje variance iz frekvenčnih distribucij. 43 34.21 Direkten način. 43 34.22 Pomožni znak u . 43 34.23 Metoda kumulativ. 45 34.3 Sheppardova korektura . 46 34.4 Varianca iz delnih populacij. 46 34.5 Koeficient variacije . 47 4 Mere asimetrije in sploščenosti . 48 40. Splošno.. 48 41. Mere asimetrije . 48 42. Mera sploščenosti . 49 5 Normalna distribucija . 50 50. Pojem. 50 51. Normalna distribucija . 50 52. Standardizirana normalna distribucija . 51 53. z-rezultat kot pokazatelj mesta v populaciji. 54 54. Kumulativna normalna distribucija. 55 55. Verjetnostni papir. 55 55.1 Verjetnostne skale . 55 55.2 Risanje realnih distribucij . 58 55.3 Ocenjevanje M in SD . 60 56. Prilagoditev normalne distribucije stvarnim distribucijam. 61 6 Korelacija. 64 60. Splošno. 64 60.0 Pojem . 64 60.1 Funkcionalne odvisnosti . 64 60.2 Korelacijske odvisnosti. 66 60.21 Pojem. 66 60.22 Prikazovanje. 66 60.3 Regresijske krivulje . 67 60.31 Problem. 67 60.32 Prostoročno ugotavljanje . 69 60.33 Serija grupnih sredin. 20 60.34 Analitična metoda . 20 60.4 Indeks korelacije . 20 60.5 Standardna napaka ocene. 21 61. Linearna korelacija. 22 61.1 Osnova. 22 61.2 Izračunavanje pokazateljev linearne korelacije iz negrupiranih podatkov 74 61.21 Direktna metoda . 74 61.22 Metoda pomožnih znakov u in v . 75 61.23 Metoda diferenc. 77 61.3 Izračunavanje pokazateljev linearne korelacije iz grupiranih podatkov - 79 61.31 Korekcijska tabela . 79 61.32 Metoda pomožnih znakov u in v . 80 61.33 Metoda kumulativ. 83 62. Biserialni korelacijski koeficient . 86 62.0 Problem . 86 62.1 Izračunavanje r w iz negrupiranih podatkov . 87 62.2 Izračunavanje r w iz grupiranih podatkov . 88 63. TetrakOrični korelacijski koeficient . 89 64. Korelacijsko razmerje . 91 64.0 Problem . 91 64.1 Izračunavanje tj 3 iz negrupiranih podatkov . 91 64.2 Izračunavanje tj 2 iz frekvenčnih distribucij . 92 65. Korelacija ranga . 95 66. x 2 (hi kvadrat). 98 66.0 Problem . 98 66.1 Izračunavanje x 2 . 100 66.11 Osnovni obrazec . 100 66.12 Alternativni obrazec . 101 66.13 Izračunavanje x 2 brez teoretičnih frekvenc f, . 101 66.14 x 2 iz 2 xr tabele . 102 66.141 Splošen obrazec. 103 66.142 N, = N 2 . 103 66.143 N, *= N 2 . 104 66.15 yj iz 2 X 2 tabele. 105 67. 0 2 in C koeficient . 106 68. Multipla in parcialna korelacija. 106 68.1 Multipla korelacija. 106 68.2 Parcialna korelacija. 107 7 Vzorčenje . 108 71. Verjetnost. 108 71.1 Verjetnost v vsakdanjem življenju . 108 71.2 Aposteriorna verjetnost. 109 71.3 Apriorna verjetnost . j.... 109 71.4 Seštevanje verjetnosti . 110 71.5 Princip ocenjevanja . 111 71.6 Distribucije verjetnosti . .. .'. 112 71.7 Pojem rizika . 112 72. Veliki vzorci . 113 72.1 Populacija. Vzorec. Populacija vseh vzorcev . 113 72.2 Ocenjevanje aritmetične sredine. 114 72.21 Vzorčna distribucija sredin . 114 72.22 Ocena. Interval in meje zaupanja . 115 72.23 Nepristrana ocena variance. 116 ' 72.24 Določanje velikosti vzorca . 117 72.3 Ocenjevanje parametrov na splošno . 119 72.31 Ocena. Distribucija ocen. Standardna pogreška. 119 72.32 Velikost vzorcev. 124 72.4 Ocenjevanje diferenc iz dveh neodvisnih vzorcev . 125 72.5 Tehnika slučajnega izbora vzorca . 127 72.51 Loterijski način . 127 72.52 Tablice slučajnih števil . 128 72.53 Sistematičen izbor. 128 72.54 Izbor s pomočjo datuma rojstva . 129 72.55 Vzorec iz hipotetične populacije . 129 72.6 Pristranost ocen . 129 72.61 Pristranost zaradi izbora . 130 72.62 Pristranost zaradi obrazca ocenjevanja . 131 72.63 Pristranosti nevzorčne narave . 132 72.7 Stratificirano vzorčenje . 132 72.70 Problem. 132 72.71 Izračunavanje stratificiranih ocen. 133 72.72 Razmestitev enot stratificiranega vzorca . 134 72.8 Vzorčenje v več stopnjah . 135 73. Mali vzorci . 136 73.1 Stopinje prostosti . 136 73.2 Tri osnove distribucije malih vzorcev . 137 73.3 Ocenjevanje mej zaupanja parametrov . 139 73.31 Ocenjevanje mej zaupanja ocene aritmetične sredine x . 139 73.32 Ocenjevanje mej zaupanja variance . 140 73.33 Ocenjevanje mej zaupanja strukturnega odstotka . 141 73.34 Ocenjevanje mej zaupanja korelacijskega koeficienta . 142 73.4 Ocenjevanje mej zaupanja za primerjavo parametrov . 143 73.41 Meje zaupanja diference sredin dveh vzorcev . 143 73.42 Meje zaupanja razmerja varianc dveh vzorcev. 144 74. Preizkušanje hipotez. 145 74.1 Osnova.. 145 74.10 Problem. 145 74.11 Napaka prve in druge vrste. 147 74.12 Ničelna hipoteza . 149 74.13 Postopek preizkušanja hipotez . 151 74.2 Preizkušanje hipotez z velikimi vzorci . 152 74.21 Preizkušanje hipotez o parametrih . 152 74.22 Preizkušanje hipotez razlik med parametri . 153 74.3 Preizkušanje hipotez z malimi vzorci . 153 74.31 Preizkušanje hipotez o aritmetični sredini . 154 74.311 Preizkušanje hipotez o aritmetični sredini . 154 74.312 Preizkušanje razlik med aritmetičnimi sredinami . 154 74.32 Preizkušanje hipotez o varianci . 155 74.321 Preizkušanje hipotez o varianci. 155 74.322 Preizkušanje hipotez razlik med variancami. 156 74.33 Preizkušanje hipotez o korelacijskem koeficientu . 157 74.331 Preizkušanje hipotez o korelacijskem koeficientu. 157 74.332 Preizkušanje hipotez o neodvisnosti . 157 74.333 Preizkušanje razlik med korelacijskimi koeficienti . 158 74.4 Neparametrično preizkušanje hipotez. 158 74.41 Preizkus/ 2 . 158 74.42 x 2 preizkus neodvisnosti . 161 74.421 Preizkus /_ 2 za kontingenčno tabelo kxg . 161 74.422 Preizkus y* za kontingenčno tabelo 2x2 . 161 75. Analiza variance . 165 75.1 Princip. 163 75.2 Analiza variance enega faktorja. 163 75.21 Postopek. 163 75.22 Skrajšan postopek. 166 75.3 Analiza variance več faktorjev hkrati . 167 75.30 Pojem. 167 75.31 Analiza variance dveh in treh faktorjev. 168 8 Testne skale in norme. 174 81. Problem merjenja nenumeričnih kvalitet . 174 82. Testne norme. 177 82.1 Sestavljanje . 177 82.11 Testne naloge. 177 82.12 Testni vzorec . 178 82.2 Izražanje testnih rezultatov. 179 82.21 Število doseženih točk. 179 82.22 Centilni rangi. 180 82.23 Standardizirani odklon; z-rezultati . 182 82.24 Prevedba z-rezultatov na skale s poljubnim M in SD. F-rezultati . 185 82.25 T-rezultati . 186 82.26 C-rezultati . 188 82.27 Skala petih grup. 189 82.3 Kvalitete testa. 190 82.31 Zanesljivost testa. 190 82.311 Metode merjenja . 190 82.312 Indeks zanesljivosti . 191 82.32 Objektivnost testa . 192 82.33 Občutljivost testa . 192 82.34 Veljavnost testa . 193 83. Drugi problemi skal. 193 83.1 Prirejanje numeričnih vrednosti s tributom. 193 83.2 Pretvarjanje ranga v z-rezultate . 195 83.3 Transformacija ocenjevalnih skal .. 196 9 Tabele Tabela A. Kvadrati števil 1 — 1000 198 Tabela B. Normalna distribucija . 202 Tabela C. t-distribucija . 204 Tabela D. x 2 -distribucija . 205 Tabela E. F-distribucija . 206 Tabela F. Pretvarjanje korelacijskih koeficientov r v Fisherjeve koeficiente Z . 210 Tabela G. sinx, cosx, J^l-r 2 . 210 Tabela H. Tablice slučajnih.števil. 211 NATISNILA TISKARNA ČZP »LJUDSKA PRAVICA« V LJUBLJANI \