MCi-iOGRAK ZA D OLOČANJE INTERV ALNIH OCEN IM ZA_PRESKUŠ ANJE HIPOTE Z O KORE LACI JOKIH KOEFICI ENTIH Dr. HARIJAN BLEJEC INŠTITUT ZA STATISTIKO IN OPERACIJSKO RAZISKOVANJE EKONOMSKA FAKULTETA UNIVERZA V LJUBLJANI NO riOGRAK Z A DOLOČANJ E INTERV ALNIH OCEN IN ZA PRES KUŠANJE HIPOTEZ O K OR E LACIJSKIH KOEFIC I ENTIH Dr. HARIJAN BLEJEC Ur. Marijan BLEJKO Nomogram z a d oločanje interva l n i h ocen in_ za_preskuša nj e hi po tez o Kor e1 acr j skih ko e iicien tih 0. Teoretične osno v e Za določanje mej zaupanja za interval¬ ne ocene korelaeijskih koeiioientov in za preskušanje hipo¬ tez o koreiacijskih koeficientih uporabljano znano lisherjevo t ran s i o r mac i j o Z ^ ~ in /i/ 2 1-r Z se porazdeljuje asimptotično normalno: Z = h .Wr 0 [uzh Z. r Q = prava ^ar(z) - Pri tem je: Z Q = ~ ln ~~ O vrednost korelacijskega koeficienta, n - število enot v vzor¬ cu /če ocenjujemo parcialne korelacijske koeficiente je n število enot v vzorcu zmanjšano za število eliminiranih zna¬ kov/ . Ge upoštevamo zgornje zakonitosti je intervalna ocena za Z s tveganjem cL - dana z neenačbo r, < Z = Z + O N z Z s = Z - 7 =^ < V n-2 a . . . ' v n- č / 2 / Enostranska razmaka zaupanja pa sta s tveganjem eC . P dana z neenačbama Z s = Z in / 3 / Poleg znanih ali že definiranih simbolov pomeni Zp vrednost standardiziranega normalnega znaka za dani P. - 2 - Meje zaupanja za n {r in r ) dobimo iz Z_ in Z z obratno transformacijo. Isto transformacijo 1 uporabljamo tudi za preskušanje ničel¬ ne hipoteze H o :(r^ r.j in vzamemo za osnovo preskušanj* izraz ( 2 - Z H ^ £ A/ Za preskušanje ničelne hipoteze o neodvisnost znakoma H q • (r^=.r 0 i.o) dobi izraz 4 posebno ODliko l mea avema Z ^ J P 4^1 /5/ Ničelno hipotezo o enakosti korelaciJskih koeficientov za dve populaciji ^ 0 -(,r 0 ^ = r p) preskušamo z vzorcema s šte¬ vilom enot n^ in np z obrazcem V posebnem primeru, če sta oba vzorca enako velika ^n^rn^nj pa dobimo iz 6 obrazec ^2_^1__ ^_fp_ / 2 " ^ \/n-3 /?/ 1• Kons trukcija nomo g rama V obrazcih v odstavku 0 so Z(r) in izrazi z p//n-3 vezano aditivno. Zato moremo z njimi konstrui¬ rati nomogram za reševanje problemov o ocenjevanju in presku¬ šanju hipotez o korelacijskih koeficientih. Fiksni del nomo- grama Po ima niz skal n , ki so proporcionalne izrazom ir Zp /Vn-3 za določene verjetnosti P. Skale se nanašajo na na¬ slednje vrednosti za P; P=0,25; P=0,05; P=0,025: P-0,01: Pr0,005-. P-0,001- P=0,0003. S kombiniranjem teh skal dobimo osnovo za ocenjevan,;)e mej zaupanja m preskušanje hipotez za vse konvencionalne stopnje tveganja za enostranske m dvostranske sklepe. Tako npr. s skalo q ^ med drugim ocenjujemo razmak zaupanja PE, v Katerem je prava vrednost z verjetnostjo 1-2P = U.SO. Vse skale n^ uporabljamo za eno¬ stranske zaključke na sedmih nivojih oL = P in na sedmih ni¬ vojih «L -2P. Skale n so od centralne linije za n - c& na- nesene simetrično navzgor m navzdol, tako da moremo določa¬ ti odprte aii zaprte razmake zaupanja ali kritične razmake, da fiksnem delu nomograma FS je vcrtana tudi linearna skala za Z. Iiad centralno črto nomograma n . o© so preko n^ skal vcrtane pod Kotom 4>° pomožne črte, Te upoštevamo pri pre¬ skušanju značilnosti razlik med kor lacijskima koeficiento¬ ma. ce sta izračunana iz različno velikih vzorcev n^/n^. Ob enem robu prema ijivega dela nomograma IS je narisana skala PSr za r v razmerju s transform ranim znakom Z, od drugem roou pa skala PsAr v 'razmerju z Z/ Ta smala je označena z A', ker sluzi za preskušanje značilnosti razlik meo avema korelacijskima Koeficientoma ocenjenima iz enako veiikm vzorcev. V sredini premakljivega dela nomograma PS je shema¬ tično prikazano reševanje standardnih problemov ocenjevanja m preskušanja Hipotez o korelacijskm koeficientin z nomo- gramom. Primeri uporabe nomograma v' nadaljevanju so v devetih primerni prikazani standardni problemi, ki jih moremo reši¬ ti z nomogramom. 4 problem _i Določanje dvostranskih mej zaupanja s tveganjem Ji- 2P za oceno kore Iacijskega koeficienta r iz vzorca z n enotand. Rešitev Oceno korelacijskega koeficienta r na premakljiva skali Prir postavimo ob fiksno skalo PSn za ustrezni Ji = 2P tako, da se sklada zn o° . Za dano velikost vzorca n na zgornjem m spodnjem delu skale PSn odberemo na PSr spodnjo zgornjo (r^ mejo zaupanja za r . Primer, Iz vzorca n - 50 enot smo dobili oceno r - 0,75. Do¬ ločiti je tieoa meje zaupanja s tveganjem c4. = 2P ^ 0,05 za interval co oceno korelacijskega koeficienta. Dvostranskemu razmaku zaupanja s tveganjem oL= 2P * 0,05 ustreza tretja okala Fbn.-C. Ako r=0,75 na P8r vskladimo z n -o o na JTSn-C, dooimo za n=5o na zgornjem m spodnjem delu Pbr ustrezni meji zaupanja r =0,60 in r = 0.85. 2 Določanje enostranskih razmakov zaupanja za r Q . Re itev Spodnjo ali zgornjo mejo enostranskih razmakov zaupa¬ nja iz oren r iz vzorcev velikosti n s tveganjem cC = P oobimo podobno kot v proolemu i. le da vzamemo v poštev P8n za Ji r P in da odberemo ustrezno prooiemu samo spoanjo ali zgornjo mejo Primer: Iz vzorca z n r ju enot smo dobiii oceno r r 0,55* Nad katero vrednostjo s tveganjem oi = P r 0,05 ni r ?. r=0,55 na trSr postavimo ob n oo na skali Pbn-b za cL - P = 0,05. Ob n r '50 na spodnjem delu Pbn-b odberemo r = 0 58. Z Problem o preskus značilnosti razlik ocene r od hipotetične vrednosti r u . fl Rešitev. Značilnost razlike testiramo z dvostranskim presmusom b - Začo na P£r postavimo ob n =oo na skali Fttn za oL- 2P. ako iz vzorca ocenjena vrednost r lezi v razmaku med ustrez¬ nim n na zgornjem j n spodnjem delu FSn. je r na nivoju dL- 2P neznačilno različen oo r^. Ako pa r lezi izven tega razmaka, je r od značilno različen s eganjem c L= 2 P. Ako dobimo, da je r na določenem nivoju značilno različen, postopek ponovimo na ostrejšem nivoju, dokler ne izpaae raz¬ lika kot neznačilna. Primer. Z vzorcem n = 60 enot preskušamo značilnost razlik korelacijskega koeficienta od r^ = 0,8b* Z vzorcem dobimo r = 0,70. Po zgornjem postopku izpade r = 0,70 kot značilno različen od r H - 0,8b na nivoju dL - 2P - 0,0b. Ako po zgor¬ njem pravilu postopamo dalje in na enak način poskušamo na strožjih nivojih, se izkaže, da moremo smatrati razlike kot značilno različno na nivoju o(.=2P=0,01, ker na nivoju cL - ^P •- 0,001 ocenjeni r ne pade več v kritični razmak. P r 2.k.L e 3E. ih Preskuse ie značilnosti odvisnosti med znakoma Rešitev; Rešitev tega problema je poseben primer problema 5» ce vzamemo r^ = 0. Primer: vzorcem z n 2^ enot smo dobili r = 0,20. Ali ka¬ že ta rezultat na značilno odvisnost med proučevanima poja¬ voma’ Ker za r H =0 nomogram na skali F£ -C za tL - pP = 0,0> nakaže, da je r ^ 0,20 iz vzorca n _ 26 neznačilen, sklepamo na splošno, da je odvisnost neznačilna. žroblem 6. Enostransko preskušanje značilnosti korelacijskih koeficientov. Rešitev: Enostransko preskušamo značilnosti o korelacijskih 6 koeficientih enako kot dvostransko, le da se, glede na zna¬ čaj problema, ozir mo le na spodnjo ali zgornjo kritično me¬ jo, hipoteze pa preskušamo s tveganjem = P. Primer: Preskušamo hipotezo, da je korelacijski koeficient večji kot r H =0,bO. % ( r 0 / rr H = 0>50). Z vzorcem, ki ima n = 100 enot, smo dobili oceno r = 0 6% Nomogram pokaže, da je r jt 0,,63 značilno večji od r^ = 0,50 s tveganjem aC = Pr0,05 /preskus z FSn-B/ neznačilno večji s tveganjem JL . P = 0,01 /preskus na FSn- /. Zaključimo zato, da je r značilno večji od r^ s 0,50 s tveganjem JL - P = 0,05. mblem 6 Preskušanje hipoteze, da je korelacijski koefici¬ ent pozitiven ali negativen. Rešitev; Rešitev tega problema je poseben primer problema 5, le da je r R = 0. Primer- Z vzorcem n = 15 enot smo dobili r - -0,40. Preskusi¬ ti je treba, ali je dobljeni r značilno negativen. Ta primer je identičen s preskusom, ali je r = +0,40 značilno pozitiven. Ge namestimo P5r(r^=0) ob Pon-B (n = c©) za c L - r =. 0,05. dobimo da je r » 0,40 neznačilen, ker je nad n s 15 na skali FSn-B. Problem 2. Preskus o značilnosti razlik med korelacijskima koeficientoma iz enako velikih vzorcev ("n^sn^-n). Rešitev Ta problem rešujemo s skalami FSn in premakljivo ska¬ lo PSAr enako kot problema 3 m 5» z edino razliko, da vlogo r^ prevzame ena izmed ocen (_r^ ali r^) , vlogo skale PSr a skala PSAr ob drugem robu premične skale. Analogna je tudi problematika dvostranosti /preskus različnosti/ ali enostra- nosti /preskus ali je r^ značilno večji ali manjši oo r-/testov. - 7 - Primer- Iz vzorca z n - 50 enot iz populacije A smo dobili ^=■0,4-5, iz; vzorca n = 50 enot iz populacije B pa r^ •= 0,77. Ali in s kaksr im tveganjem sta dobljeni oceni zračiino raz¬ lični? Postopek, ki je po tehniki sličen reševanju zgornjih problemov, le da uporabljamo Pb r, pokaže, da so razlike med zgornjima ocenama značilno različne s tveganjem 2P = 0,G;.<. Problem 8 Značilnost razlik med ocenama korelacijskm koefi¬ cientov iz vzorcev, ki nista enako velika £n^ / . Rešitev: Ta problem rešimo s skalami FSn in skalo Pbr. Ce iz¬ koristimo zvezo iz obrazca 6, dobimo z danim tveganjem «L r 2P za dvostranske in s tveganjem dl= P, za enostranske preskuse odgovor o zračilnosti razlik med r^ in r^, e namestimo skale tako, da se večji r na PSr sklada z manjšim n na FSn za ustrez¬ no tveganje, manjši r na PSr pa s centralno črto za n =©o . Če gremo od sečišča t-Sr s centralno črto v smeri pomožnih črt pod kotom 4-5° do ustrezne skale Fbn, dobimo kritično velikost n fc drugega vzorca. Ge je drugi vzorec manjši od n^., so razlike neznačilne, v nasprotnem primeru pa značilne. Ce so med n^ in n^j večje razlike, ni potrebno iskati točne vrednosti za n^ temveč moremo sklep o značilnosti napraviti že iz medsebojne¬ ga položaja n ^ in n^. Problem 9 Določanje funkcijskih vrednosti Z (V) in Hz). Rešitev: Ako PSr pomaknemo ob skalo FSZ tako, da se r = 0 sklada z Z - 0, aobimo nomogram za odvisnost med r m Z. Primer: Iz treh vzorcev, ki so enako veliki, smo dobili na¬ slednje ocene korelacijskin koeficientov- r 1 - 0,4-2: r^=0,66i r^ - 0,058* Kolike so ustrezne vrednosti transformiranih Z? - 8 - Ge upoštevamo zg e navodilo, dobimo iz skal r in Z nasled¬ nje rezultate: Z-^ -= 0,4-5; Z^ « 0,79; Z^ = 0,63* Primer: Koliki Y ustreza Z - 2,37* Iz skal r in Z dobimo, da je vrednost ustreznega korelacijskega koeficienta r-0,982. 3. Shematičen prikaz rešitev pr oble mov 1-9 . V premakljivem delu nomograma PS so v sredini za operativno uporabo nakaza¬ ne rešitve standardnih, problemov, ki jih moremo reševati z nomogramom. Za ponazoritev konkretnih problemov 1-9 iz odstav¬ ka 2 pa so v sliki shematično prikazane njihove rešitve. 0 1 o n n i» 5 I ~i o u c P 4 H i o C Z £ => N E m Xl © LU Lij n i o > TJ CL II to O J-** > WT 7 LU h- O 'tk 1? ^ 3 > š}o 2 § iZ .S io to o c Q_ II C. to © o? o M 0 IM C to u. © 8 m a. i c © C >1/ ,., WT <^—<1 —^ t_N © C i © Lij 12 o "3; s: ec o Li- tO Z o UJ o o co TJ c OJ O) 0> -S D -x a °> o o -* c 10 o E e: U) Q_ c r*** II II 'g § 5 £=? § S N>U 8-gl ,fc> O L. T'--§ O t» >o C * o --•= c >o 8 g f V o 0~ N II ^ 'Hs.ik }LO Bi* E S' •‘=s E > »tT O £ c •* >G c O rE E »O S g i +1 AV + CD S UJ —J en o £ :> UJ >čo UJ Or So LU NI NI N CO U. O NJ S NI OJ to C.I to CL 7 V" © Ki < er en o 2 h** - >o e ^ E 2 d) N S i- o ^ L. Lij £L h- nomogram za ocenjevanje IN PRESKUŠANJE HIPOTEZ O KORELACIJSKIH KOEFICIENTIH FSn •001 •Wio 0005 001 ‘lO ■005 01 “'10 ■01 •02 •05 ’Ao o< = P oj = i P *25 •50 / E / ;38&> -v5000 • -SOOO : -20 ; £0 O. - P HlO --30 ‘25 TO 20 - -15 +20 -30 ' / (+50 . 100 ' +oo •025 •05 T10 10 20 +30 • • 100 / II / ”1000 --GO — -1000 li-iooo tL, -100 I- 500 W. H-200 -60 * 50 / / .100 / +200 500 / .100 ~ -20 - -15 LL10 05 ooo y-5ooo ■1000 500 TO .-15 20 I / -30 / U 40 / 50 200 +100 - -50 - -30 ; -20 - -15 Lio ■025 15 (+20 /■ 1+30 / 10 H-200 / +500 -1000 +5000 - GO — 5000 +1000 500 200 1+100 -100 / / --200, 30 20 15 110 '01 15 --20 / J+ 30 ■40 60/ / / - .+00 v / / +500 +1000 +5000 = 6000 +1000 500 - -200 +100 .50 +40 -30 +20 15 lio 005 / / / +200 / 600 ■1000 / +5000 +5000 .1000 500 +200 -100 ••50 -40 - -30 - -2 0 15 + 20 / / / / / / / / 30 / / / / 40 / (+50 X / / / / / / .100 / / / / 20 o / = ■50 6 / +1000 / / £000 ■15 10 001 --•1 '2 -- '3 -.■7 + '8 •9 10 •1 •2 5000 + 1000 500 ■200 1+100 • 50 40 30 --20 15 INSTITUT ZA STATISTIKO IN OPERACIJSKO RAZISKOVANJE PRI EKONOMSKI FAKULTETI V LJUBLJANI 110 '0005 FS * 2-0 --•7 L'8 - - 66 . p s r NOMOGRAM ZA OCENJEVAN JE IN PRESKUŠANJE HIPOTEZ 0 KORELACIJSKIH KOEFICIENTIH ‘104- 366. >66. 486 . 16. -+96. - -S6. PREISKUŠANJE HIPOTEZ a. s 2P r F4 'h r - » r. r+*=(■„ b. enostransko Ho’-fo> r H '9! 06. 03. I OZ. dvostransko H, r Q1 * r oz 09. = OS, ^o^e •96 •97- - •995 'im *j l J t - Z J d 2 = lo u = e u = 'u lOj ^ l-Oj |, H ajajodiM 3 rNVsnussad •998 Ljubljana j vV*