$ \ DR. MARIJAN BLEJEC STATISTIČNE METODE Z UPORABO V TEHNIKI (Skripta) / / Izdala In založila Ekonomska fakulieia v Ljubljani Inštitut za statistiko in operacijsko raziskovanje Ljubljana 1967 DR. MARIJAN BLEJEC STATISTIČNE METODE Z UPORABO V TEHNIKI Skripta po predavanjih na seminarju iz Statističnih.metod v Železarni Jesenice v zimskem semestru 1966/1967 Izdala in založila Ekonomska fakulteta v Ljubljani Institut za statistiko in operacijsko raziskovanje r, 111977 '/ 7 O £ I. KAZALO Stran 0» ELEMENTI STATISTIČNEGA PROUČEVANJA o * 1 » Statistika 1 o, 2. Populacija, enota,znak,parameter 2 o* 3* Statistične enote 2 o* 4. Statistični znaki 3 o« 5« Numerični in atributivni znaki 3 o* 6, Intervalen,ordinalen in nominalen značaj znakov 5 o» 7» Populacija . 5 o* 8* Subpopulacija 7 o, 9» Parametri 7 1* FREKVENČNE PORAZDELITVE 1* 1-, Frekvenčna porazdelitev 1. 2* Histogram 1* 3» Frekvenčni poligon 1» 4* Oblike frekvenčnih porazdelitev 1. 5* Kumulativne frekvenčne porazdelitve 1. 6. Grafični prikaz kumulativnih frekvenčnih porazdelitev 8 8 r 12 v 13 14 15 16 2 s KVANTIH 2« 1« Rang in ranžirna vrsta 17 2, 2» Vezan rang 18 2, 3, Kvantilni rang 18 2,- 4* Kvantili 19 2* 5« Določanje kvantilov iz frekvenčnih porazdelitev 2o 2. 6, Določanje kvantiinih rangov iz frekvenčnih porazdelitev 21 n II 3, RELATIVNA ŠTEVILA 3« 1« Vrste relativnih števil 3» 2« Strukturni pokazovalci 3. 3 C Statistični koeficienti 3. 4. Indeksi 4. SREDNJE VREDNOSTI 26 J 4. 1* Mere centralne tendence 26 4. 2. Mediana 26 4. 3« Modus 27 4» 4. Aritmetična sredina 29 4. 5. Izračunavanje skupne aritmetične sredine iz grupnih aritmetičnih sredin 3o 4. 6. Izračunavanje aritmetične sredine iz frekvenčne porazdelitve 31 4. 7. Izračunavanje aritmetične sredine iz frek¬ venčne porazdelitve po direktnem obrazcu 31 4. 8. Izračunavanje aritmetične sredine iz frek¬ venčnih porazdelitev po metodi pomožnega znaka u 32 4, 9. Izračunavanje aritmetične sredine iz frek¬ venčnih porazdelitev z metodo kumulativ 33 4.1o. Harmonična sredina 34 4*11* Poprečja iz relativnih števil 35 4.12. Geometrijska sredina 36 Stran 22 22 23 24 24 5. MERE VARIACIJA 5« 1. Variabilnost 5* 2. Variacijski odklon 5« 3. Poprečen absoluten odklon 5. 4. Varianca 5. 5. Metoda pomožnega znaka u za izračunavanje variance 36 vi 36 37 37 38 39 III« Stran 5» 6, Metoda kumulativ za izračunavanje variance 41 5« 7» Sheppardova korektura 42 5« 8. Standardni odklon 42 5« 9* Koeficient variacije 44 o« MERE ASIMETRIJE IN SPLOŠČENOSTI 44 A 6. 1« Centralni momenti 44 6. 2» Pomožni momenti 45 6« 3. Charlierjev preskus 46 6. 4-, Sheppardova korektura centralnih momentov 46 6. 5. Mera asimetrije 47 6, 6, Sploščenost porazdelitve 48 7. NORMALNA PORAZDELITEV 51 7« 1« Normalna porazdelitev 51 7. 2. Gostota relativne frekvence za normalno porazdelitev 51 7. 3® Kumulativna normalna porazdelitev 52 7. 4. Standardiziran odklon 54 7. 5« Standardizirana normalna porazdelitev 54 7. 6. Zveza standardizirane normalne porazde¬ litve s splošno normalno porazdelitvijo 55 7. 7. Tablica ordinat in površin za N(o,l) 56 7. 8. Prilagoditev normalne porazdelitve stvarni porazdelitvi 6o 7. 9* Metoda površin za prilagoditev normalne porazdelitve stvarni frekvenčni poraude- litvi 6o 7»lo« Verjetnostna skala 61 7.11« Linearno verjetnostna mreža in linearno verjetnostni grafikon 62 7«12» Kumulative relativnih frekvenc stvarnih porazdelitev v verjetnostnem grafikonu 63 IV. Stran 7.13. Logaritemsko normalna porazdelitev 66 7.14. Logaritemsko-verjetnostni grafikon 66 8. VZORČENJE 68 8. 1. Vzorčenje 68 S, 2, Tveganje 68 3 e 3. Slučajnostni vzorec 68 8, 4. Vzorčna populacija 69 8, 5. Vzorčne porazdelitve To 8. 6, Varianca in standardna pogreška vzorčnih izrazov 7o 8. 7, Zakonitosti ocen aritmetičnih sredin iz vzor¬ cev iz normalno porazdeljenih populacij 71 8, 8, Zakonitosti za ocene sredin pri vzorčenju brez ponavljanja 71 8. 9. Centralni limitni teorem 73 8<,lo. Tehnika slučajnostnega izbora 73 8.11. Tablice slučajnostnih številk 74 8.12, Točkovna ocena 78 8.13» Intervalna ocena 79 8.14. Ocenjevanje aritmetične sredine z velikimi vzorci 79 8.15. Ocena razlik med aritmetičnima sredinama 8o 8.16. Ocenjevanje strukturnega deleža z enostavnim slučajnostnim vzorcem 81 8.17. Ocena razlik med strukturnima deležema 82 3.18. Velikost vzorca za oceno pri dani natančnosti 83 8.19. Standardne pogreške za standardni odklon in koeficient variacije 85 9. MALI VZORCI 86 9. 1. Teoretične porazdelitve 86 9. 2. Stopn-je prostosti 87 9. 3. Porazdelitev 87 v. Stran 9. 4. Študentova t-porazdelitev 9o 9 . 5 . P-pcrazdelitev 94 3. 6. Zakonitosti aritmetičnih sredin za male vzorce loo 9« 7. Ocenitev aritmetične sredine z malim vzorcefeoo vzorcem - ■ 9» 8» Ocene razlik med asimetričnima sredinama z malimi vzorci lol 9» 9® Zakonitosti ocen varianc za male vzorce lo2 9®lo, Ocenjevanje variance iz standardnega odklo¬ na za male vzorce lo3 10. PRESKUŠANJE HIPOTEZ lo4 lOol. Statistično preskušanje hipotez lo4 lo«2. Ničelna hipoteza lo4 10.3. Kritična vrednost lo4 10.4. Kritično območje lo5 10.5. Napaka prve vrste lo5 lo*6. Napaka druge vrste lo5 lo.7® Moč preskusa lo6 10.8. Operativna karakteristična krivulja lo6 10.9. Preskušanje hipotez o aritmetični sredini lo8 10.10. Preskušanj e razlik med aritmetičnima sredinama lo9 10.11. Preskušanje hipotez o varianci llo 10.12. Preskušanje hipoteze o razlikah med variancama 111 10.13. Preskušanje hipotez o frekvenčnih porazdelitvah 111 10.14. Preskušanje hipoteze o normalnosti frekvenčne porazdelitve 112 2 10.15. Alternativni obrazec za izračunavanje X 113 10.16. Analiza variance ! 114 10.17. Enostavna analiza variance 114 VI, Stran 11. STATISTIČNO Pii HIRANJE EKSPERIMENTOV 117 11. 1. Cilj 117 11® 2, Osnovni elementi statističnega plana eksperimentov 118 11. 3. Linearni modeli plana eksperimentov 118 11. 4. Slučajnostni bloki 119 11. 5» Metoda parov j 123 11. 6. Paktorialni poskusi fAyr V‘iW( , 124 11. 8. Interakcija 125 11. 9. Paktorialni poskus pxq 126 11.10. Drugi plani eksperimentov 131 12. STATISTIČNA KONTROLA KVALITETE 131 12. 1, Osnova 131 12. 2. Vrste SKK 132 12. 3. Kontrola proizvodnega procesa 132 12. 4. Kontrolne karte ali grafikoni 133 12. 5. Kontrolna karta za aritmetično sredino 134 12. 6. Normalna in poostrena kontrola 136 12. 7. Druge kontrolne karte za numerične znake 138 12. 8, Obrazci in tabele za izračunavanje kontrol¬ nih linij za x, me, s in R karte 141 12. 9. Kombinirane karte 143 12.10. Kontrolne karte za atributivne znake 145 12.11. Uporaba kart p, d in c 147 12.12. Statistična kontrola prevzema 149 12.13. Enojni, dvojni, trojni, sekvencialni plan 15o 12.14. 133* PROUČEVANJE KORELACIJSKIH ODVISNOSTI 153 13. 1. Funkcijske in korelacijske odvisnosti 153 13. 2, Prikazovanje korelacijskih odvisnosti 153 13. 3. Korelacijska tabela 154 13. 4. Korelacijski grafikon 156 VTIe Stran 13«, 5® Regresijska krivulja 158 13® b, Mere jakosti odvisnosti 158 13* 7» linearna regresija l6o 13« 8* Korelacij skl koeficient 162 13« 9o Ocena parametrov za linearno korelacijo odvisnosti pri fiksnih x 164 13.10. Preskušanje hipotez o regresijskih koeficientih 166 13.11. Proučitev linearne regresije in korelaci- je iz podatkov, ki so grupirani v korela¬ cij aki tabeli 16? 13.12. Vzorčne poi*azdelitve korelacij skih koeficientov iz vzorcev 17o 13.13« Fisherjeva tr ansformacija Z ,172 13*14. Ocenjevanje korelaciiškega koeficienta 173 13.15« Preskušanje značilnosti linearne odvisnosti 174 13.16« Preskušanje hipoteze o korelacijskem koeficientu 174 13.17« Preskušanje razlik med korelacijskimi koeficienti 175 13.13. Krivuljčna regresija in korelacija 1?6 13.19* Indeks korelacije in determinacijski koeficient za krivuljčno korelacijo 176 13.20. Poseben model regresijske odvisnosti 177 13.21. Določanje regresijskih krivulj po metodi najmanjših kvadratov 177 13.22. Standardna napaka ocene za krivuljčno regresijo standardnega tipa 179 13.23. Regresijski model g(y) = A + B,f(x) + e 179 13.24. Polinom y = a 0 + a^x + a 2 X 2 + a r x r kot regresijska funkcija 181 13.25. Multipla regresija 182 13.26. Multipla linearna regresija 183 13*27« Določitev parametrov linearne regresije po metodi najmanjših kvadratov 184 VIII. Stran 13*28. Leterminacijski koeficient za multiplo linearno korelacijo 186 13.29. Multipla regresija in linearna korelacija za odvisnost y od dveh faktorjev 186 13.30. Muptipla parabolična regresija in korelacija 187 13.31. Parcialna korelacija. 189 13*32, Linearni parcialni korelacijski koeficient 189 13.33. Zveza med multiplim linearnim koeficien¬ tom R 19 _ in parcialnimi korela- cijskimi koeficienti 19o - 0. KLEMENTI STATISTIČNEGA PROUČEVANJA 0. 1* Statistika Statistika opredelimo kot vedo, ki s kvantitativnim pro¬ učevanjem množičnih pojavov* a specifičnimi metodami od¬ kriva zakonitosti množičnega pojavljanja in podaja kvali¬ tativno sliko pojava. Po tej definiciji so področje statističnega proučevanja - množični pojavi,, Množični pojavi so vsi pojavi* ki v'|čs.su in prostoru množično nastopajo. Tako je množičen pojžtv ar tikel, proizvajan na določenem stroju* ker nastaja v ve¬ likem Številu, Enako je množičen pojav okvara v določenem sistemu proizvodnje, ker more okvara v daljšem razdobju nastopiti večkrat. Pojavov, ki v času in prostoru množič¬ no nastopajo, moremo na najrazličnejših področjih najti obilo, zato je tudi s statistiko možno proučevati naj¬ različnejše pojave. Tipičen primer, v katerem umetno, u- -> stvarimo pogoje množičnosti in s tem pogoje za statistič¬ no proučevanje pa je eksperimentiranje, kjer po samem planu poskuse pod danimi pogoji ponavljamo, da dobimo s tem osnovo za upravičenost in možnost uporabe statisti¬ ke pri eksperimentiranju. Statistika s svojstvenimi me¬ todami, ki v glavnem bazirajo na kvantitativnem prouče¬ vanju analizira množične pojave, V kakšni obliki s sta¬ tistiko kvantitativno podajamo kvalitativno sliko pojava naj služi najenostavnejši kazalec kvalitete - delež iz¬ meta. Delež izmeta dobimo z enostavnim kvantitativnim pristopom, sortiranjem in preštevanjem defektnih artiklov Kljub temu, da je ta kazalec kvantitativen, pa podaja kvalitativno stran proizvodnje - kakovost proizvodnje na določenem stroju. Enako daje kazalec o poprečni pro¬ duktivnosti ali o variabilnosti produktivnosti zelo po¬ membne kvalitativne podatke o produktivnosti dela. ( Statistične metode bazirajo na kvantitativnem proučeva¬ nju specifičnih kazalcev, ki jih izračunamo iz osnov¬ nih podatkov za posamezne elemente oziroma enote množič¬ nega pojava. Zato se statistične metode v mnog o če m os- .tv lanjajo na matematiko ali na prenos določenih pojmov izdF matematike, ki so modificirani za proučevanje množičnih pojavov in manifestacij, ki se pojavljajo pri množičnih pojavih. f 0. 2, Populacija* enota« znak« parameter srsr' ~:.r.Z2££rz ':a=-^c=r=»<^a CTBiAB g J: .s35J.'==r-gss.-^s =T i .:tsg» ca arjng rtj, ’ a rra &^rg&ji3 - -g sy-=B «gaca;.s irK&uesrtrza« Statistika proučuje množičn* pj&ve« Ve«.:., el^mat fc prou- Se vari ja apr« artikel, poskus, nesreča pri de in itd., ki je predmet statističnega proučevanja imenujemo s skupnim imenom enota. Skupnost enot, ki so v konkretnem primeru predmet proučevanja oziroma raziskave imenujemo po pula- cija. Populacijo sestavlja npr, skupnost vs>h a t- v - enot proizvedenih v določenem času na določenem stroju. Enote se razlikujejo med seboj po nebroj značilnostih. Značilnosti;, ki so pomembne v določenem statističnem pro¬ učevanja in jih opazujemo, imenujemo statistične znake. Tako je statistični znak kvaliteta artikla, vsebnost ogljika v jeklu v posameznih š ar žali, žilavoat preizkuša¬ mo za kotlovsko pločevino, temperaturo pri ohlajanju šarž ipd. Znaki sc značilnosti enot, značilnosti popula¬ cij pa so parametri. Parametri sc običajno izvede .1 Iz znakov za enote populacije. Tako je npr. poprečen odsto¬ tek izmeta v proizvodnji določenega artikla parametrer, ki je izveden iz znaka? uporaboat za posamezne artikla. Enako je kazalec o variabilnosti vsebnosti po laržah pa¬ rameter za populacijo šarž iz ene peči in je izveden Iz vsebnosti ogljika za posamezne šarže. Statistična des¬ kripcija in analiza se ukvarja z izračunavanjem, primer¬ janjem in analiziranjem parametrov za različne populacije. 0. 3. Statistične enote V industriji in tehniki na splošno so artikli predmet masovnega pojavljanja. Zato je eden izmed najpogostejših enot proučevanja v industriji proizveden artikel. Ker so v proizvodnem procesu možni izredni dogodki, k: vpli¬ vajo na proizvodni proces, so dostikrat enote proučeva¬ nja dogodki, kot so npr. prekinitev dela stroja zaradi določene okvare. Vse okvare na določenem stroju ali na skupini strojev moremo združiti v skupnost enot vseh okvar v določenem razdobju. Pri proučevanju delov in pro¬ cesov, pri katerem proučujemo strukture dela v določenih razdobjih je posebno enota časoven moment, ki se združu¬ jejo v populacijo časovni razmak, za katerega proučujemo strukturo časa. V preskusništvu je običjana enoti opazo¬ vanja dogodek ali proces, ki ga sestavimo umetno za po- - 3 - trebe določene raziskave. Te enote imenujemo eksperiment ali poskus, 0. 4. Statistični znaki Enotam dajo vsebino značilnosti, ki so opisane z znaki. Znaki so po vsebini: faktorialni in rezultativnl . Pri vzročni odvisnosti imajo faktorialni znaki vlogo neodvis¬ nih spremenljivk, rezultat ivni pa vlogo odvisne spremen¬ ljivke. Pri statističnih raziskavah s področja eksperimen¬ tiranja, vrednosti faktorialnih znakov navadno vnaprej do¬ ločamo ali kontrolirano variiramo in proučujemo vpliv fak¬ torjev ali njihovih sprememb na rezultativen znak. Faktorialne znake ločimo v eksperimentalnem delu na tri tehnično pomembne ftcupe: Medtem ko so eni faktorji opre¬ deljivi in j ž no' % j i ho ve vrednosti točno bodisi zavest- . no določiti ali pa ugotoviti, je druga grupa faktorjev ne opredeljiva in nedoločljiva in se manifestira v skupini slučajnostnih vplivov. Opredeljive faktorje nabore: limo na opredeljive pomembne in opredeljive nepomembne , medtem ko Bo Opredeljivi bistveni faktorji predmet raziskovanja in razlikujemo njihov vpliv na rezultativne znake, opre¬ deljivi nepomembni znaki v bistvu motijo raziskovanje, Za¬ to skušamo po možnosti njihov vpliv, če že ne eliminirati vsaj držati na stalnem nivoju, da je njih vpliv konstanten. 0. 5. Numerični im, atributivni znaki '' -*• — " . . . . » Tehnično znake <|e.limo na nu merion e m atri butivn e. nosti numeričnih znakov izražamo številčno, vrednos atributivnih pa opisno. Tako je atributiven znak v m posameznih elementov v šaržah, če izražamo vsebnost od¬ stotkih. Numeričen znak je tudi časovna produktivno., sameznih šarž itd. Numerični znaki so ali zvezni al ni, glede na to, kako so izrazljive vrednosti znake je npr. vsebnost posameznih elementov zvezen znak- teoretično zavzeti delež elementa v šarži vse vredno. 1 . določenem razmaku. Nezvezen znak pa je npr. števil n; na izdelku, število pulzacij preskušanca do preloma., vilo možnih vrednosti za zvezne znake je neomejeno, da praktične potrebe pa jih določamo in merimo le do do.o ... natančnosti 9 sate sorodna vrednosti združujemo v razrede. Raz¬ red ima svojo spodnjo in zgornjo ms j© ? svojo Širino razreda in sredino razreda. Spodnja meja razreda je vrednost, pod katero ni nobena vrednosti iz razreda, Zgornja meja pa je vrednost, nad katero ni nobene vrednosti iz razreda. Če zaznamujemo z *y min in x v ,mas spodnjo m zgornjo mejo razreda, t$?sta širina ralrada 1 k in srednja razreda x dani z obrazcema . ^k,'Meji ^KtVKCCC ~ k,OhjC^ j ^K~ ' ’ */j~* (-0 Osnovne podatke zaokrožujemo na dva načina: na najbližjo ir na najnižje zaokroževanj vrednost. Tako vsebuje trdnost v kp/a.m2 zaok.fo&šena n& 15o po prvem načina vse vrednosti v razmaku od 1593,^0 160,5, po drugem načinu pa vse vrednosti od 16o,o do liSi^ Od jasčslna osnovnega zaokroževanja js odvisno nadaljnje formiranje razredov, če tvorimo razrede višje stopnje pc pet zaokroženih vrednosti, dobimo pq prvem načinu razred 159,5 do 164,5 & sredino razreda 162» po dragem načinu pe razred 16o»o dc 2 , 65,0 s sredino 152,5. V prvem primeru meje niso cele vred¬ nosti, je pa cela vrednost sredina razreda, v drugam pa obrat¬ no. V splošnem pa je drugi način zaokroževanja in formiranja razredov boljši in logične jši, čeprav ni neke vsebinske raz¬ like med obema. Paziti moramo samo, da je znar. uporabljeni na¬ čin zaokroževanja zaradi nadaljnje interpretacije m računov. Vrednosti atributivnih znakov 3e dejo izraziti samo opisno. £ipi 4a*j. atributi ven znak je kvaliteta artikla: uporaben, neu¬ poraben J ravnanje žice: ročno, strojno; barve, artikla itd., vrednosti za atributivne znake mere^biti najmanj avg. Navzgor pa število vrednosti ni omejeno.. Za atributi ven znak: vrsta artikla, je število raznovrstnih artiklov, ki jih more proiz¬ vajati eno podjetje, vrsta industrije ali cela industrija, zelo veliko. Vrednosti atributivrlh znakov po sorodnosti grupiramo - klasi¬ ficiramo v grupe. Tehnično zelo uporabna je decimalna klasifi¬ kacija, kateri v grupe višje vrste združujemo po največ deset grup nižje vrste, da. jih. moremo obeležiti s ciframi od o do 9. Decimalna klasifikacija zelo nazorno prikaže pripadnost posa¬ meznih vrednosti (artiklov, surovin) itd. v grupe posameznih stopenj. - 5 - Vrednostih atributivnih znakov s samo dvema vrednostima, dosti¬ krat za uporabo določenih metod, ki so prirejene le za analizo numeričnih znakov, pripišemo numerični vrednosti o, drugi pa 1« Tako znaku: za kvaliteto artiklov vrednosti znaka neuporaben, pripišemo vrednost 1, vrednosti uporaben pa vrednost o« 0. 6«, Intervalen, ordinalen in nominalen značaj znakov Za statistično analizo je zelo pomemben intervalen , ordi - nalen in nominalen značaj znakov.Intervalno lastnost imajo zna¬ ki, za katere je možno izračunati razliko med dvema vrednostima znakov = d. Ordinalno lastnost imajo znaki, za katere je možno ugotoviti po določenem logičnem kriteriju vrstni red vrednosti oziroma enot, tako da je za dve poljubni vrednosti možno ugotoviti, katera je v tem logičnem redu pred drugo-, Ordi nalnost znakov s simboli nakažemo x > X.. Nominalen značaj zna ka je še za eno stopnjo nižji od ordinalnega. Nominalen značaj znakov zagotavlja le možnost razlikovanja vrednosti -x.Jry>« Ta lastnost daje možnost, da enote razdelimo v grupe. Medtem, ko imajo znaki z intervalnim značajem (tak značaj imajo numerični znaki) implicitno tudi ordinalen in nominalni značaj, imajo znaki, ki imajo ordinalni značaj implicitno tudi nominalen zna¬ čaj. Samo nominalni značaj imajo v splošnem atributivni znaki. Poznamo pa znake, ki imajo ordinalen, nimajo pa intervalnega značaja, Tako moremo artikle razporediti po lepoti obdelave, lesku ipd., čeprav lesk in lepoto obdelave ne moremo numerično izraziti. 0. 7. Populacija Skupnost enot, ki sestavljajo statistično populacijo in je predmet statistične analize, mora biti nedvoumno opredelje¬ na z opredeljujočimi pogQ_ji . ki določajo, kateri pojavi - enote spadajo v populacijo in kateri ne spadajo. Enote, ki zadoščajo opredeljujočim pogojem, so predmet opazovanja, medtem ko enote, ki tem pogojem ne zadoščajo, ne spadajo v populacijo. Populacijo je treba opredeliti iz dveh razlogov. Z opredeljujo¬ čimi pogoji je določeno, katere enote sestavljajo populacijo, obenem pa pojasnjujemo, kaj populacija vsebuje# Opredeljujoči pogoji so do neke mere že parametri populacije, ker so informa¬ cija o populaciji, ne pa o posameznih enotah. Tako opredeljujo¬ či pogo j^spada jo v populacijo^>« ingoti, proizvedeni v dolo¬ čenem razdobju na določeni peči pod določenimi pogoji, na eni strani opredeljujejo populacijo, po drugi strani pa dajejo ka¬ rakteristike - parametre populacije.. Popula Limo && populacije realnih enot in po pulacije dogodkov . Tako sestavlja populacijo skupnost pod določenimi pogoji proizvedenih artiklov, ali skupnost nesreč pri delu v določenem razdobju, skupnost prekinitev delovnega procesa itd«. Za raziskovalno delo so pomembne hipotetične populacije« Dvesto artiklov, ki smo jih proizvedli na določenem stroju v danem dnev^predstavija populacijo dnevne proizvodnje« Pod do¬ ločenimi predpostavkami pa smatramo dnevno proizvodnje za del artiklov iz hipotetične populacije vseh možnih artiklov, pro¬ izvedenimi pod enakimi pogoji-, Hipotetične populacije ne mo¬ remo nikdar ostvariti, ker je miselna konstrukcija. Če hočemo s procentom izmeta dvesto artiklov izraziti kvaliteto proiz¬ vedene partije, je ta rezultat parameter populacije 2oo ar¬ tiklov. Ta procent izmeta pa je samo ocena za pravi delež izmeta v hipotetični populaciji vseh aožnth artiklov, proiz¬ vedenih pod enakimi pogoji in je ocena karakteristike stroja. Še jasneje je koncept hipotetične populacije razumljiv na pri¬ meru eksperimentiranja. Trideset poskusov, ki jih izvedemo pod enakimi pogoji, sami zase ne pomenijo mnego, dokler dobljenih rezultatov ne posplošimo, t.j. prenesemo na hipotetično popu¬ lacijo vseh možnih poskusov pod enakimi pogoji. Populacije so lahko zvezne in nezvezne . Kolobar žice moremo smatrati za populacijo. Ta populacija je zvezna in enote po¬ pulacije niso vnaprej dane. Za zveze populacije je treba eno¬ te šele definirati. Kolobar žice moremo razstaviti v popula¬ cijo s končnim številom enot, če ga razrežemo na 5 centimetrov dolge koščke žice, ki v nadaljnjem predstavljajo enoto in se¬ stavljajo nezvezno populacijo. Moremo pa vzeti, da je kolobar sestavljen iz neomejenega števila enot, če definiramo enoto tako, da je na enodimenzionalnem traku oziroma daljici dolži¬ ne kolobarja vsaka točka lahko začetek petcentimeterskega ko¬ ščka žice. Posamezne enote tako formirane populacije so defi¬ nirane s točkami žice na kolobarju. V praksi proučujemo veliko zveznih populacij, za katere je seveda treba pred proučevanjem definirati enote. Ena izmed tipičnih zveznih populacij, ki je sicer nenavadna, vendar v raziskavah struktur procesov^ fundamentalna popula¬ cija, je časovni razmak. Časovni razmak delovnega časa v raz¬ dobju enega meseca predstavlja populacijo momentov. Znaki ob posameznih momentih so produktivno delo stroja ali delavca, faza dela ipd. - 7 - Za razliho od zveznih populacij za katere je treba šele de¬ finira.- proučevanja, so enote nezveznih populacij se¬ stavljena iz diskretnih enot ali dogodkov. Tako je nezvezna populacija populacija artiklov, šarž, delavcev itd. 0. 8. Subpopulacija Populacija je opredeljena z opredeljujočimi pogoji, s katerimi je določeno, katere pojavi so enote populacije, ki jo proučujemo in katere ne. Se opredeljujočim pogojem popula¬ cije dodamo še nov pogoj, skupnost enot, ki zadošča temu nove¬ mu pogojU/po definiciji sestavlja novo populacijo. Ker pa so vse enote nove populacije istočasno enote prvotne populacije, jo imenujemo subpopulacijo. Če je dodatni pogoj tak, da nobe¬ na enota osnovne populacije ne zadošča temu pogoju, je subpo¬ pulacija prazna. Če po različnih vrednostih določenega znaka razdelimo populacijo v več subpopulacij tako, da je vsaka eno¬ ta osnovne populacije istočasno enota ene izmed subpopulacij pravimo, da je razdelitev na subpopulacije kompletna. Vzemimo kot primer dnevno proizvodnjo določenega artikla. Če oprede¬ ljujočim pogojem, da gre za proizvodnjo določenega artikla dane tovarne za določen dan pridamo nov pogoj, da je artikel uporabe*} je nova populacija, ki sestoji iz uporabnih artiklov, subpopulacija osnovne populacije vseh proizve-denih artiklov. V določeni raziskavi izvedeni poskusi pod enakimi pogoji so subpopulacija iz hipotetične populacije vseh možnih poskusov, ki bi jih izvedli pod enakimi pogoji. Stvarno izvedeni posku¬ si so subpopulacija hipotetične populacije, ker je osnovnim pogojem: poskusi izvedeni pod enakimi pogoji, dodan nov pogoj} stvarno izvedeni poskusi, kateremu pa vse enote hipotetične populacije ne ustrezajo. Stvarno realizirane enote iz hipote¬ tičnih populacij so v vsakem in ne samo v tem primeru subpo¬ pulaci je. 0. 9. Parametri S parametri opisujemo značilnosti populacij. Z njimi kvantitativno podajamo kvantitativne in kvalitativne značil¬ nosti in zakonitosti populacij. Najenostavnejše parametre do¬ bimo z preštevanjem enot (strukture), s seštevanjem vrednosti znakov (agregati). Kot skupni kazalec, dobimo tako obseg po¬ pulacije npr. število artiklov proizvedenih na stroju ali s seštevanjem vrednosti proizvodnje v danem mesecu ipd. S pre- - a - lttWR?-sm i a sag te vanj® m po delnih populacijah? ki jih dobi¬ mo? 8 n 'ariell-io populacijo po določenih znakih? dobimo vpo¬ gled %■ populacije® Sako <36 npr. seštevanje po grapah uporabnosti artiklov vpogled v sestav proizvodnje po kvali¬ teti. Iz osnovnih vrednosti s& posamezne enote ali iz števila enot in agregatov za delne populacije izračunavarno najrazličnejše parametre? ki kažejo ne jakost individualnih vplivo (mere centralne tendence) jakost individualnih vplivov (mere vari¬ acije) jakost in zakonitosti neodvisnosti (regresijska in korelacijska analiza) in podobno, S primerjavo teh paramet¬ rov za različne populacije ali dele populacij? analiziramo odnose in vplive? ki so važni za množične pojave. 1. FREKVENČNE PORAZDELITVE 1. 1. Frekvenčna porazdelitev Z raziskavo dobljeni podatki so nepregledni, zato jih moramo urediti. Za populacije z večjim številom enot zato urejamo vrednosti numeričnih znakov frekvenčne porazdelitve. V frekvenčni porazdelitvi so vrednosti numeričnega znaka grupirane v razrede, za vsak razred pa je v frekvenčni po¬ razdelitvi dana frekvenca - število enot v razredu. Frekven¬ čna porazdelitev daje siikft^takrat, če so širine razredov v frekvenčni porazdelitvi enake. # Frekvenčna porazdelitev je statistična vrsta, ki sestoji iz zaporedja razredov in ustreznih frekvenc. Vsak razred ima svojo spodnjo X k> in svojo zgornjo 0( H ^^ mejo, širino razreda ^k,***uc ~ C 1 )’ sredino razreda <•*., w < 2 ’) ki 3® reprezentant vrednosti v razredu, frekvenco f s , ki po- ve, koliko enot iz populacije ima vrednosti v danem razredu k, Relativna frekvenca -T* <-&/*• ( 3 ), pokaže koliki del celotne populacije ima vrednosti v razredu k. x o v«ri?bilnosti proučevsneg-*; oj_\ . H-jbolj neposredn je ^ ta slika (4) -9- Relativno frekvenco izražamo tudi v odstotkih 400.&/JV Gostota relativne frekvence K/* (5) pove» koliki delež celotne populacije odpade na enotin razmak znaka x. Iz obrazca 5 dobimo, da je tk. — l>n . ( 6 ) frekvenca v danem razredu odvisna od velikosti populacije, ši¬ rine razreda, ki je tehničen faktor in gostote razreda, ki je povezana z zakonitostjo pojavljanja frekvence. V frekvenčni porazdelitvi z ozkimi razredi, je število enot v posameznih razredih majhno, na frekvence pa zato močno vpliva¬ jo slučajnostni vplivi. Zato taka frekvenčna porazdelitev, kljub temu, da dd podrobno sliko o pojavljanju posameznih vred¬ nosti, ni pregledna. Za frekvenčne porazdelitve s širokimi razredi je število raz¬ redov majhno, značilnosti gostitve pa zabrisane. Zato je treba pri sestavljanju frekvenčne porazdelitve paziti, da je širina in z njo število razredov v skladu z velikostjo populacije in razmakom, v katerem variirajo vrednosti populacije. Eno izmed pravil nakazuje, da je primerno število razredov K približno enako kvadratnemu korenu iz obsega populacije N k./t (7) a) Osnovni podatki za Si v surovem železu na II. visoki pe¬ či (Vir: Zec, Behmen Razrada sistema stat. pračenja kvaliteta u željezarama: IMIZ) vzorci po n= 5 meritev v 26 dneh v danem mesecu lo Za primer formiranja frekvenčne porazdelitve vzemimo ^ Si v surovem železu na določeni visoki peči. Iz N = 13o vzorcev smo dobili naslednje osnovne podatke o odstotku Si: 5 r/č/a> Ker so podatki zaokroženi na eno decimalno mesto, je najmanj¬ ša širina razreda o,l, drage možne širine pa mnogokratniki od o,l 36 . 5e po obrazcu izračunamo optimalno število razredov za N = 13o je K = fI 3 o = 11 Vrednosti variirajo med 0,4 ^ do 2,o zato dobimo pri raz¬ ličnih širinah naslednje število razredov: Najbolj se približamo optimalnemu številu razredov 11, če vza¬ memo i = o,2 j£. Zaradi primerjave so izdelane vse tri frekvenčne porazdelitve z i = o,l, i - o,2, i = o,4. Za z i = o,l je nakazano se¬ stavljanje frekvenčne porazdelitve s črtkanjem y r Resnično dobimo pričakovano sliko. Frekvenčna porazdelitev z i = o,l je še preveč pod vplivom slučajnih odstopanj in frek¬ vence še ne kažejo v dcvoljni meri značilnosti gostitve, frek¬ venčna porazdelitev z i = 0,4 pa ima preširoke razrede in je zato zakonitost zabrisana. Najugodnejšo od vseh treh porazdeli¬ tev daje frekvenčna porazdelitev s širino razredov i = o,2 ki nakazuje sistematično večanje frekvenc do določenega maksi¬ muma v razredu 1,2 - 1,3 nato pa zakonito manjšanje frek¬ venc. Zanjo so razen frekvenc izračunane še relativne frekven¬ ce prikazani z deleži in odstotnimi deleži. / ~ 11 b) Formiranje frekvenčne*.'porazdelitve za i - o,lji s črtkan jem * Si f k o,4 II 2 o,5 o,6 o,7 +H+IUI 9 0,8 i ~tH' I 6 0,9 ++H- -H4++W lil 18 1.0 -H+4— +H+fl 11 1.1 trn- Hf+- +mi 16 1.2 H+f W-4Hf 14 1.3 ttff -HH- ti| 18 1.4 -mm 9 1.5 -t+H-tHtil 12 1.6 -»m-ll 7 1.7 Ul 3 1.8 lil • 3 1.9 I 1 2,o I 1 n = 13o c) Frekvenčne porazdelitve z i = o,2 ^ in i = o,4 ^ - 12 1. 2. Histpgr&a Frekvenčne porazdelitve prikazujemo s histogrami ali po¬ ligoni. 3 histogramom prikazujemo frekvenčno porazdelitev z nizom stolpcev tako, da frekvenco za vsak razred ponazorimo s stolpcem, ki je visok v sorazmerju s frekvenco v razredu. Ploščina pod stopničasto linijo, ki je dana s konturami stolp¬ cev in abscisno osjo, je v sorazmerju z obsegom populacije. Za primer so v slikah a, b, c prikazani histogrami za vse tri variante vsebnosti Si v 13o šaržah. Slika 1. Vsebnost Si v odstotkih v surovem železu v 13o šaržah 2 f a f / -ho iO -Zo 10 to 1 i 3 f --to -JO ) -Uo - o T—io vr ro oh 7 • 8 C t'i t l 1’S - 16 13 - Iz histogramov za različne širine razredov je bolj kot iz same frekvenca® porazdelitve opazno, da najboljše oriše za¬ konitost pojavljanja frekvenčne porazdelitve z i = o,2 i». Višine stolpcev so proporcionalne frekvenci v posameznih raz¬ redih le 9 če so širine razredov enake«, V drugih primerih pa je potrebno, da rišemo širine stolpcev v sorazmerju s širino razredov, višine stolpcev pa v sorazmerju z gostoto frekven¬ ce gjj. Ploščine teh stolpcev « pravokotnikov so glede na zvezo fk = ijj-gj, proporcionalne frekvencam v razredih. V zgor¬ njih slikah so sicer zaradi enake širine razredov v posameznih frekvenčnih porazdelitvah višine stolpcev proporcionalne frek¬ vencam, moremo jih pa risati na enotno skalo gostot frekvenc. S histogrami prikazujemo frekvenčne porazdelitve absolutnih frekvenc in frekvenčne porazdelitve relativnih frekvenc. 1. 3. Frekvenčni poligon Frekvenčno porazdelitev prikazujemo tudi s frekvenčnim poligonom. Gostote frekvence v posameznih razredih ponazorimo s točkami, ki imajo za absciso sredino razreda, ordinata pa je sorazmerna gostoti frekvence ali gostoti z abscisno osjo zaključen tako, da v razredih izven porazdelitve vzamemo, da je gostota enaka o, dobimo celo boljšo sliko in predstavo o razporeditvi vrednosti kot s histogramom. Medtem ko v histo¬ gramu predpostavljamo, da je gostota frekvence v razmaku po¬ sameznega razreda konstantna, poligon realneje ponazarja stvar¬ no gostoto na posameznih odsekih razredov. Če so razredi enaki, moremo namesto gostote frekvence upošte¬ vati frekvence, ker sta si proporcionalni. Enako kot histograme, moremo tudi poligone risati za absolut¬ ne in relativne frekvenčne porazdelitve. ? sliki 1 sta prikazani s poligonom frekvenčni porazdelitvi frekvenc za časovno produktivnost doseženo z domačimi in Unitherm gorilniki na isti peči iz tabele v 1. 6. Da odstra¬ nimo vpliv različnega števila šarž za oba gorilnika so za primerjavo poligonov primernejši poligoni relativnih frekvenc. 't - 14 - slika 1. Prek venčni poligoni relativnih, frekvenc za časovno proizvodnost domačega in Unitherm gorilnika. 1. 4. Oblike frekvenčnih porazdelitev Zaradi različnih zakonitosti vplivanja faktorjev dobimo v konkretnih primerih različne oblike frekvenčnih porazdelitev. Tako ločimo glede na simetrijo simetrične porazdelitve od asi¬ metričnih v levo in desno, koničaste od sploščenih, uminodalne od j*M modalni h in pol iryvoc(TAjdAA Ou^ M- pU<&W b') b) U- Y^a^djilUbw C,J (Wi/v\^i^w (UA/<ž. 'V - £jL/\) a) s/Jose uoa. b) VbOTH^^^K^ c) loo-vu^ C.Qs}£oo 1. 5. Kumulativne frekvenčne porazdelitve S postopnim prištevanjem frekvenc dobimo po obrazcu + /k ^ 1 ^ iz vrste frekvenc f^» vrsto kumulativnih frekvenc oziroma kumulativno frekvenčno porazdelitev. Pri tem vzamemo, da je po definiciji vrednost kumulativne frekvence v prvem razredu j?! = o. - 16 Ker imajo relativne frekvence fg oziroma enake lastnosti kot absolutne frekvence, moremo izračunavati tudi kumulative relativnih frekvenc oziroma F-^.# in to po obrazcih n ■ V+t .*« ; £*- 5 *+ 4 * (2) Za primer vzemimo časovno proizvodnost za šarže, proizvede¬ ne z domačim in Unitherm gorilnikom na isti peči. Y tabeli imamo dane frekvence relativne frekvence fj^ in kumula¬ tive relativnih frekvenc F^JS za domači in Unitherm gorilnik. časovna gorilnik domači Unitherm 1.6« G-rafični prikaz kumulativnih frekvenčnih porazdelitev Kumulativno porazdelitev absolutnih ali relativnih frek¬ venc prikažemo s točkami nad mejami razredov v oddaljenosti, ki je proporcionalna F^ ali F^jž. Se te točke povežemo, dobimo na¬ raščajočo črto, ki ponazarja kumulativno porazdelitev. Za primer sta prikazani kamulativi relativnih frekvenc iz ta¬ bele. Sim večja je variabilnost pojava, tem položnejša je čr¬ ta za kumulativo relativnih frekvenc in čim manjša je varia¬ bilnost, tem strmejša je črta. Za unimodalne zvonaste poraz¬ delitve je kumulativa podobna idealizirani črki S. } - 17 - /o slika. Kumulativni porazdelitvi časovnih proizvodnosti za do¬ mači in Unitherm gorilnik. 2. KVANTILI 2. 1. Rang in ranžirna vrsta Množico numeričnih podatkov za določeno populacijo ali vzorec, urejeno po velikosti od najmanjšega do največjega, imenujemo ranžirno vrsto. Vsakemu členu v ranžirni vrsti pri¬ redimo zaporedno številko od 1 do N. Ta nov znak imenujemo rang. Če vzamemo za primer vsebnost ogljika v N = 15 ploščah, je iz neurejenih podatkov 083 I03 ol3 132 o21 16o 119 06I 137 o7o 130 134 o99 153 118 sestav¬ ljena ranžirna vrsta vsebnosti - 18 - H 1 2 3 4 5 6 T 8 9 lo 11 12 13 14 15 x ol 3 o 21 o 61 q 7 o 083 o99 I03 118 119 130 132 134 137 153 16o Rang vnese kot znak v populacijo novo značilnost in povezan z obsegom populacije nakaže mesto enote oziroma vrednosti v populaciji. Te kvalitete sama vrednost znaka nima. Tako vemo, da je v zgornji populaciji vsebnost 153 velika, ker je zanjo R = 14 od skupno N = 15 enot v populaciji. Rang je torej nov znak enot, ki je izveden iz osnovnega znaka x* Značilno za ranžirno vrsto in rang je, da moremo rangirati tu¬ di vrednosti, ki nimajo numeričnega značaja, ampak le ordina- len značaj. Tako moremo artikle rangirati in jim pripisati ustrezen rang po zunanjem izgledu, hrapavosti itd. 2.2. Vezan rang 5e imata dve ali več enot isto vrednost znaka, vzamemo kot vrednosti ranga za to skupino vrednosti povprečno vred¬ nost ranga. V ranžirni vrsti x 15 17 17 18 2o 22 22 22 na primer pripišemo vrednosti 17 vezan rang 2,5, ker je vred¬ nost 17 na mestu z rangoma 2 in 3, vrednosti 22 vezan rang R = (č+7+8 )/3 = 7, ker je vrednost 22 na mestu z rangi 6, 7, 8 . 2.3. Kvantilni rang Nazorneje kot rang, katerega moramo vezati s skupnim številom enot v populaciji, nakaže mesto enote v populaciji relativen rang, ki ga imenujemo kvantilni rang. Z njim raz¬ mak, na katerem se razvrste rangi, omejimo na razmak od o do 1. Zveza med rangom in kvantilnim rangom je dana prek obrazca (D Tako je npr. za vsebnost ogljika 134 iz tabele v 2. 1, za 19 - katero je rang R = 12 kvantilni rang p = .°iž = 0f767 kar pomeni ? da ima o,767 ali 76,7 & enot populacije manjšo vsebnost, kot ta enota. 2, 4. Kvantili Medtem ko kvantilni rang P x pove, koliki del celotne po pulacije ima vrednost manjše kot neka določena vrednost x, obratno kvantil x p pove, pod katero vrednostjo je P-ti del ce lotne populacije. Kvantili so parametri populacije in osvetljujejo značilnosti razporeditve vrednosti v populaciji. Pomemben kvantil je mediana X-p^o‘50 ( 1 ) ki pomeni vrednost, od katere je polovica enot populacije manjših kot x p = o,5o - mediana. Podobno s kvartili Xp*0'25 ' @2 = ; #3 " ( 2 ) razdelimo populacijo v štiri po obsegu enake dele. Pod Q-l leži 25 populacije, med Q]_ in Q 2 in in nad pa enako po ena četrtina celotne populacije. Z decili » ^ 2 * . 9 k ••••••*• ^<2 D** razdelimo celotno populacijo v deset po obsegu enakih delov. Še finejša pa razdelimo populacijo s centili C k ^2 .* • ♦ • c 99 Ck 5 ^P-co-/. k (4) na sto po obsegu enakih delov. Kvantili pomagajo opisovati značilnosti porazdelitev populaci 2o Meje določena srednja vrednost, kvartili opisujemo varia¬ bilnost in asimetrijo porazdelitev. Podobno vlogo imajo tu¬ di decili. V posebne namene služi podrobna razdelitev na eentile, ki igra vlogo kvantilnlh rangov za vrednotenje in¬ dividualnih vrednosti. 2. 5. Določanje kvantilov iz frekvenčnih porazdelitev Čeprav moremo kvantile in kvantilne range določati tu¬ di iz negrupiranih podatkov, jih v praksi največkrat določamo iz frekvenčnih porazdelitev. Frekvenčna porazdelitev je že sama na sebi neke vrste ran¬ žirna vrsta, ki sicer ne rangira posameznih vrednosti, temveč večje skupine vrednosti. Iz frekvenčne porazdelitve določimo kvantilemu rang P ustrez¬ no vrednost kvantila x p po naslednjem postopku: a) Za frekvenčno porazdelitev izračunamo iz frekvenc f^ ku- mulativo F k b) Iz obsega populacije N in P izračunamo ustrezen rang 7Z P Rp - N P + 0'5 (D c) V frekvenčni porazdelitvi poiščemo med kateri vrednosti v kumulativni vrsti vrsti Fk pade vrednost ranga Rp 5 < *, < f, (2) Razred z F Q imenujemo kvantilni razred o d) Za kvantilni razred poiščemo spodnjo mejo razreda x 0 min, frekvenco f 0 , kumulativo F 0 in širino razreda i 0 . e) Iz teh podatkov izračunamo kvantil xp po obrazcu: N/ V/ ' J(p - JCo p \ -3 J TO Po zgornjem postopku izračunana vrednost kvantilov je le pri¬ bližna vrednost, ki jo dobimo z linearno interapolacijo, če predpostavljamo enakomerno razporeditev frekvence v kvantilnem razredu. Pomembno je, da postopek ni vezan na frekvenčno porazdelitev z enakimi širinami razredov, temveč morejo biti širine razre¬ dov poljubne. Za primer kvanti le za frekvenčno porazdelitev za trdnost patentirane jeseniške žice H* o,25 = N.o,25 + o,5o = 153.0,25 + o,5o = 38,75 Rp= o,5o = N.o,5o + o,5 = 153.o,5 + o,5 = 77 Rp= o,75 = F.o,75 + o,5o = 153.o,75 + o,5o = 115,25 če napišemo posameznim kvartilnim rangom ustrezne vrednosti v tabeli Če nakažemo izračun kvartila dobimo iz obrazca (3) in prve kolone v zgornji tabeli Ql = * p = o,25 » 155,5 + 2. A-7^- = 157,2 o 2. 6. Določanje kvantilnih rangov iz frekvenčnih porazdelitev Kvantilni rangi, ki ustrezajo določeni vrednosti x, do¬ ločimo podobno kot kvantile z linearno interpolacijo po na¬ slednjem postopku: - 22 - a) V frekvenčni porazdelitvi poiščemo razred, v katerem je vrednost x, sa katero iščemo kvantiIni rang -^o, ^ X ^ »X c t V* ČUC b) Če upoštevamo spodnjo mejo ^Osmin* širino i 0 , frekvenco in kumulativno frekvenco F 0 za dobljeni kvantilni razred, izračunamo kvantilnemu rangu ustrezen rang R^ po obrazcu 0 c) Iz R^, ki ga dobimo iz obrazca (2) pa izračunamo kvan¬ tilni rang po znanem obrazcu %.- j ' d-i+oi +/ , Za primer frekvenčne porazdelitve trdnosti patentirane jeseniške žice dobimo, da je modalni razred 6o-61 ker je zanj frekvenca največja f = 46. Spodnja meja modalnega razreda. x 0 , = 159,5» f_i = 41 in f 41 = 21. Iz tega sle¬ di, da je ’ x d_i = 46-41 = 5» d +1 = 46-21 = 25, ocena modusa pa po zgornjem obrazcu M 0 = 159,5 + 2 5 - 7-25 = 159,83 kp/mm2 Grafično določimo modus iz frekvenčne krivulje tako, da poiščemo projekcijo na abscisno os iz mesta, kjer je - 28 - gostota frekvence največja (slika l) iz histograma pa tako, kot kaže slika 2) slikah Določitev modusa iz histograma Histogram more imeti višjo frekvenco kot je v sosednjih razredih na več mestih. To je bodisi izraz.slučajnostnih vplivov, ker je obseg populacije ali širina razreda pre¬ majhna. V tem primeru z združevanjem razredov v širše razrede dosežemo, da se slučajnostni vplivi eliminirajo ali pa, če gre za vzorčne podatke vzorce povečati, da dobimo stabilne frekvence. - 29 Več lokalnih mest večje gostitve pa dobimo tudi v prime¬ ru, če je populacija, katero prikazuje frekvenčna poraz¬ delitev heterogena. Potem je več modusov povezano z vse¬ bino populacije in je polimodaina distribucija izraz he¬ terogenosti osnovne populacije. 4. 4. Aritmetična sredina Aritmetična sredina ali poprečje je M po definici ji kvocient med vsoto podatkov in številom podatkov N ■+X N )--rZ.Xi = X/V (D /-/ pri čemer zaznamujemo aritmetično sredino z M individual¬ ne vrednosti z Število enot z N in vsoto podatkov z X. Aritmetična sredina ponazarja rezultat splošnih vplivov. Če predpostavljamo, da so v individualni vrednosti rezul¬ tat splošnih vplivov M in rezultat individualnih vplivov povezani aditivno *i = M + QZ) t A in če predpostavljamo, da se v sumi ali v poprečju rezultat individualnih vplivov uniči, predstavlja aritmetična sredi¬ na rezultat splošnih vplivov. Definicija aritmetične sredine že nakazuje kako jo izra¬ čunavamo. Poprečje pokaže tudi, kakšna bi morala biti kon¬ stantna vrednost za posamezno enoto, če bi naj vsota kon¬ stantnih vrednosti bila enaka vsoti stvarnih vrednosti. Če vzamemo za primer raztezek lo za 6 preskušancev in so njihove meritve enake: 6,45 6,2o -6,4o 6,oo 5,95 5,9o, je aritmetična sredina za teh šest preskušancev enaka = 6,15. M 6,45 + 6 t 2o 4-. + 5.95 + 5»9o 6 36,9o/6 Za aritmetično sredico velja, da je vsota odklonov indivi¬ dualnih vrednosti od aritmetične sredine enaka nič in da je vsota kvadratov odklonov individualnih vrednosti od neke konstante najmanjša, če je ta konstanta enaka aritmetični - 3o sredini. £(x-m}»o ; 2 ($-^ ^ 4-^1 (3) 4. 5. Izračunavanje skupne aritmetične sredine iz grupnih ari tmetičnih sredin Iz grupnih aritmetičnih sredin za delne populacije katerih vsaka sestoji iz enot, izračunamo skupno arit¬ metično sredino kot tehtano eritmetično sredino po obrazcu N, M j _ _/_ X ^ ^ N 4 ^ H\ -h - - +- // r N’ h- , * (D Pri tem je število enot po posameznih skupinah ponder. Če imamo za posamezne skupina namesto števila enot znane strukturne deleže števila enot od celotne populacije P^ izračunamo tehtano aritmetično sredino po obrazcu M - Z V%„M k (Oo Ker je strukturni delež števila enot z dano značilnostjo (.npr. strukturni delež izmeta) aritmetična sredina atribu- tivnega znaka, pri čemer pripišemo enoti, ki ima dano zna¬ čilnost vrednost 1 , enotam, ki xe značilnosti nimajo pa vrednost c, izračunamo skupen poprečen delež anot z dano značilnostjo enako po obrazcu 1 , le da = pJ^ . VJ'= -Z Z HkT&k ( 3 ) Če imamo npr. tri skupine z po Ni = looo, N 2 = 2ooo in N 3 = 4ogo artiklov, odstotek izmeta po posameznih skupi¬ nah pa je Pi$ = 2,3 P 2 = 4,1 P^ = 5,6 , je poprečen odstotek izmeta Pjž = ii:££L£i;L+_2ooo : 4 1 l_i_i£o° 1 5 1 6 _ 4>7 ^ looo + 2 ooo + 4 ooo Nepravilen rezultat dobimo, če ne upoštevamo različne ve¬ likosti skupin in izračunamo enostavno aritmetično sredino = 31 = Pjt = 2»3 + 4 j 1 + 5 » 6 4 s o £ 4. 6. Izračunavanje aritmetične sredine iz frekvenčne po¬ razdelitve Poseben primer izračunavanja tehtane aritmetične sredine je izračun aritmetične sredine iz frekvenčnih po¬ razdelitev, V frekvenčni porazdelitvi za vsak posamezen razred poznamo število enot, ne poznamo pa individualnih vrednosti niti grupne sredine razredov. Zato grupne arit¬ metične sredine ocenimo s sredino razreda Če te vred¬ nosti vnesemo v obrazec 1) dobimo, da je M Tako dobljeno poprečje je le ocena pravega poprečja, ki bi ga dobili, če bi izračunali poprečje iz individualnih vrednosti, ali če bi upoštevali prave razredne sredine. Vendar je ta ocena zelo blizu pravega poprečja, če je po¬ razdelitev simetrična ali ne preveč asimetrična. Pri zelo asimetričnih posebno pa pri J - porazdelitvah pa istosmer- na sistematična pogreška v grupnih sredinah bistveno vpli¬ va na rezultat. 4. 7. Izračunavanje aritmetične sredine iz frekvenčne po¬ razdelitve po direktnem obrazcu Obrazec nakazuje, kako iz frekvenčne porazdelitve izračunamo aritmetično sredino. Vsoto produktov frekvenc fjt s sredinami razredov delimo s številom enot v po¬ pulaciji. Kolikor je ta metoda računsko neprikladna, je splošna in jo moremo uporabiti tudi za frekvenčne porazde¬ litve z neenako širokimi razredi. Za primer izračuna aritmetične sredine po direktni metodi vzemimo trdnost jeseniške patentirane žice. 32 N 153 Ker je porazdelitev unimodalna ne preveč asimetrična iz frekvenčne porazdelitve izračunana vrednost nebistveno od¬ stopa od prave aritmetične sredine M = 158>78 kp/mm2, ki jo dobimo iz individualnih podatkov. 4. 8. Izračunavanje aritmetične sredine iz frekvenčnih po¬ razdelitev po metodi pomožnega znaka u 5e so podatki grupirani v frekvenčni porazdelitvi z enako širokimi razredi, aritmetično sredino izračunamo eno¬ stavnejše, če sredine razredov transformiramo po obrazcu *v - * 0 u k =- --- ( 1 ) i pri čemer je x 0 sredina poljubnega razreda nekje v sredini porazdelitve pri najve5jih frekv icah. Pri zgornjih pogojih so u enostavne vrednosti -5 -4 -3 -2 -1 o +1 +2 +3 +4...... Ker velja, da je aritmetična sredina linearne zveze enaka linearni zvezi aritmetičnih sredin znakov, izračunamo naj¬ prej M u iz tega pa po obrazcu -3 3 - . "^^k u k /riN M s s 3 Eq + 1 — 3Cq + i •■ “ ) Za primer vzamemo isto frekvenčno porazdelitev, kot pri direktnem izračunu. Po metodi pomožnega znaka u dobimo N = 153 2fk u k * + 172 M = x 0 + i = 156,5 + 2 i-il| = 158,75 kp/mm2 4. 9. Izračunan.le aritmetične sredine iz frekvenčnih poraz delitev z metodo kumulativ Zaradi posebnih lastnosti kumulativnih vrst za frek¬ venčne porazdelitve z enako Širokimi razredi izračunati arit metično sredino s kumulativnimi vrstami brez masovnega mno¬ ženja. Iz frekvenčne porazdelitve izračunamo po znanem postopku pr¬ vo kumulativo in seštejemo člene prve kumulative, (brez člena, ki je pod črto in pomeni N) vsota Členov kumulativne vrste zaznamujemo s S^. = F-j_ + P 2 +. + F k b) Iz teh količin izračunamo aritmetično sredino po obrazcu S 1 M* - x o " (i) pri tem je razen že pojasnjenih vrednosti x 0 =sredina najviš¬ jega razreda v frekvenčni porazdelitvi. 34 4. le. Harmonična sredina Harmonična sredina H je po definiciji recipročna vrednost is aritmetične sredine recipročnih vrednosti. H = . N - __JL t + tt:: +T" ” 7 " (i) XI X 2 ^ Če posamezne vrednosti nastopajo z različnimi utežmi izračunamo harmoničmo sredino po obrazcu H = ž (2) Harmonično sredino izračunavamo redkeje kot aritmetično. Dobro pa pokaže centralno tendenco takrat, če je porazde¬ litev asimetrična in se recipročne vrednosti porazdeljuje jo simetrično pri poprečjih iz relativnih števil. 593 35 - 4o lio Popre čja iz relativnih števil Pri izračunavanju sumarnih relativnih števil iz grupnih podatkov nastopajo glede na razpoložljive podatke različne situacije. Če je grupno relativno število definirano s kvocientom dveh ekstenzivnih količin Y k in X k r i( (D je sumarno relativno število r, ki je po definiciji = X . lik £*k r k _ -3T - * “ŽTT” ' '7S' ( 2 ) kvocient med vsotama grupnih vrednosti Y k in X k ali tehtana aritmetična sredina grupnih relativnih števil r^, če razen z grupnimi relativnimi števili razpolagamo še z vrednostmi, ki v relativnem številu nastopajo v imenovalcu. Kot tehtano harmonično sredino relativnih števil r k izračunamo?, če ra¬ zen z r^ razpolagamo še z vrednostmi Y k , ki v relativnih številih nastopajo v števcu. Za primer vzemimo poprečno hi¬ trost žerjavov na liniji, ki sestoji iz treh odsekov. Od teh je eden dolg = 2o m, hitrost na tem odseku pa v = llm/sek, drugi odsek je dolg Y 2 = 3o m, hitrost na tem odseku pa vp * 1,5 m/sek, tretji odsek ima dolžino = 15 m, hitrost na tem odseku pa je v, = o,5 m/sek. Ker je hitrost po definiciji razmerje med potjo in časom, razpolagamo pa razen s hitrostmi še z dolžino odsekov, izračunamo poprečno hitrost s harmonično sredino, ker so ponderi količine, ki nastopajo v števcu *"*1 s 3 S 1 s 2 >— + —• + — Vi V2 v 3 2o + 3o + 15 2o 30 15 r + 175 + o75 v o,929 m/sek - 36 4 , 12 , Geometrijska sredina »i- G = v 3^. » 2 « x 3 (1) je koren stopnje N iz produkta individualnih podatkov. Geometrijska sredina je definirana tudi tako: logaritem iz geometrijske sredine je enak aritmetični sredini iz logaritmov iz individualnih vrednosti log G = i ( Z log ^i) (2) K Podobno kot za aritmetično in harmonično sredino, more bi¬ ti tudi geometrijska sredina tehtana, Če vsaki individualni vrednosti pripišemo nek ponder wi. Tako dobimo G = ~~y m JI 0 Sg W2 •*••••••• w = w l + w 2. +W N (3) Podobno velja tudi za logaritme Z^i logs log G ----■ 2 w i (4) Geometrijska sredina bolje kot drige srednje vrednosti po¬ kaže mesto centralne tendence, če so važnejši relativni kot absolutni odnosi med vrednostmi. Tak primer so posebno zelo asimetrične porazdelitve. Relativna razlika med 1 in 2 je enaka kot med loo in 2oo,medtem ko to ne velja za absolutne razlike. Razen tega geometrijsko sredino uporabljamo za izračun po¬ prečnega koeficienta dinamike. 5. MERE VARIACIJS 5. 1. Variabilnost Pri kvantitativnem proučevanju pojavov naletimo na ti¬ pično lastnost numeričnih pojavov^ na variabilnost podatkov. - 37 - Tako v proizvod;?.JI ugotavljamo,, da se karakteristike proiz¬ vodnje razlikujejo od artikla do artikla. Te razlike so iz¬ vor spreminjajočih faktorjev* ki vplivajo na proizvodnjo. Večje ^spremembe faktorjev se pokažejo v večji variabil¬ nosti podatkov. Medtem ko je centralna tendenca rezultat splošnih* opredeljujočih pogojev* je variabilnost izraz delovanja individualnih vplivov* in kot so srednje vredno¬ sti mere centralne tendence* so mere variacije numeričen izraz variabilnosti. Od vsehTvariacij so za uporabo v teh¬ niki posebej pomembne naslednje mere variacije: variacijski razmak* poprečen absoluten odklon* varianci in standardni odklon. 5. 2. Variacijski odklon Variacijski razmak je razlika mod največjo in najmanjšo vrednostjo v opazovani populaciji. Je najenostavnejše mera variacije in ga uporablja¬ mo v primerih* ko je treba hitro in enostavno izmeriti varia¬ bilnost nekega pojava. Variacijski razmak je zato posebno primerna mere variacije pri kontroli kvalitete proizvodnega procesa. 5. 3. Poprečen absoluten odklon Mera variacije, za katero je definicija dana s samim imenom. 13 je poprečen absolutebuodklon individualnih podat¬ kov od ustrezne srednje vrednosti. Računamo ga po obrazcu kot poprečen absoluten odklon od aritmetične sredine, pogo¬ steje pa kot poprečen odklon od mediane. ADj,| e je vsebinsko bolj upravičen, ker velja, da je poprečen absoluten odklon najmanjši, če od¬ klona računamo od mediane. Neglede na to je AD^- tudi računsko enostavno izračunati po obrazcu s = ^max “ s min co ( 1 ) ( 2 ) - 36 - ( 3 ) ki so urejene v ranžirno vrsto 5»9o 5*95 6»oo S,2c 6,4o 6*45 je za prve tri meritve, ki so pod mediano,vsota ž — 17,85 za druge tri meritve, za katere so vrednosti nad mediano pa 2 = 19,o5. Varianca je mara variacije, ki je definirana kot po¬ prečen kvadratičen odklon od aritmetične sredine Varianca je najpomembnejša mera variacije, predvsem iz teo¬ retičnih ozirov. Zato ima velike prednosti pred vsemi drugimi merami variacije, ki so predvsem opisnega značaja. Izračunan.ie variance iz individualnih podatkov Izračunanje variance po zgornjem obrazcu je neprikladno, ker je aritmetična sredina običajno decimalno število. Enostavneje izračunavamo varianco iz negrupiranih podatkov po obrazcu ?o zgornjem obrazcu je A%e = | (19»o5 - 17,85) = o»2o 5o 4. Varianca (D z ( 2 ) - 39 - pri čemer je « s* - x 0 odkloni od poljubne vrednosti, K pa izraz ..U- 2 « 2 - (ZuS N (3) variance za neto čas deset 7,75, 6,75 7,5o 6,67 = 18,528 = 18,4164 - 0 ,1116 18,4164 K _ 18,4164 " N lo = 1,8416 Če računamo varianco na računski stroj se izkaže, da je naj- prikladnejše, da vzamemo x 0 = o, da ni treba izračunavati Uj_. V tem primeru preide obrazec (2) v (4) Vsoto kvadratov in vsoto osnovnih podatkov dobimo na računskem stroju v tem primeru neposredno. 5. 5. Metoda pomožnega znaka u za izračunavanje variance Če imamo podatke grupirane v frekvenčni porazdelitvi z enakimi razredi izračunamo varianco po naslednjem postopku: 4o a) Nekje v sredini frekvenčne porazdelitve vnesemo vrednost o pomožnega znaka u„ Za druge razrede pa po vrsti navzdol - 1» -2» -> 3 ...in navzgor + 1» + 2» +3........ b) izračunamo vrsto produktov fu in izračunamo vsoto jffu c) izračunamo vrsto produktov fu" po postopku (fu)u in vsoto £fu2$ d) vsoto kvadratov odklonov K izračunamo po obrazcu e) varianco izračunamo po obrazcu '2 /Y K ( 2 ) Primer: Za 153 preskusov trdnosti patentirane jeseniške ži¬ ce je izračun variance po nakazani metodi naslednji +172 59o ^ fu Z fu^ 153 N - 41 - E = 59o (+172)«* 153 = lo,3684 2 ,&4 - '10,1684 5. 6» Metoda kumulativ za izračunavanje variance Če imamo podatke grupirane v frekvenčni porazdelitvi z enakimi razredi, enostavno izračunamo varianco tudi po naslednjih stopnjah: a) Iz frekvenčne porazdelitve izračunamo prvo kumulativo, iz prve pa drugo kumulativo b) izračunamo vsoti in S 2 iz členov prve in druge kumula tive (S-^ se pojavi kot člen pod črto v drugi kumulativi) c) Iz N, in S£ izračunamo izraz K po obrazcu K- -2 $2 * S,- £ (1) d) Varianco izračunamo iz dobljenih količin po obrazcu ( 2 ) Primer: Za N= 153 preskusov trdnosti patentirane jeseniške žice izračunamo po metodi kumulativ varianco po naslednjem postopku: z 2^396 r 64 lo, 3684 5. 7. Sheppardova korektura Frekvenčna porazdelitev da le približno sliko o vred¬ nostih v populaciji. Zato je varianca, izračunana iz frek¬ venčnih porazdelitev le ocena prave vrednosti. Sistematična napaka, ki izvira iz tega, da so podatki grupirani, je od¬ visna od velikosti razreda. Korektura variance zaradi širine razreda je dana s Sheppardov© korekturo po obrazcu ^čor ' 2 Z_ M (D Za primer N = 153 preskusov trdnosti patentirane jeseniške žice je po tem obrazcu korigirana varianca Op cor = lo,3684 2 12 = lo,o352 5, 8, Standardni odklon Standardni odklon je kvadratni koren iz variance ^ “ (si Oj Izračunavamo ga kot opisni parameter variabilnosti pojava. - 43 - Kazen tega je standardni odklon eden izmed bistvenih pa¬ rametrov, ki so osnova za ocenjevanje s slučajncstnim vzor¬ cem. Standardni odklon ima isto enoto mere kot znak, za katerega ga računamo« Pravo predstavo o pomenu in velikosti standar¬ dnega odklona dobimo šele, če ga obravnavamo v zvezi z os¬ novno teoretično porazdelitvijo, t.j« normalno porazdelit¬ vijo. Velja namreč, da se v razmaku od M -x. ' / J T J 'U' ( 4 ) Se pa jih izračunavamo iz frekvenčnih porazdelitev, pa je 6» 3„ Gharlierjev preskus Izračunanje pomožnih momentov iz frekvenčnih porazde¬ litev je računsko precej zahtevno. Da se izognemo možnim na¬ pakam, preiskusimo pravilnost izračuna izrazov fuP š Char lierjevim preskusom. 5e razvijemo četrto potenco biroma 6. k. Sheonerdova korektura centralnih momentov Ge izračunamo centralne momente iz frekvenčnih porazde¬ litev, so po obrazcih izračunane vrednosti za centralne.momen¬ te ocene pravih vrednosti, ki bi jih dobili iz negrupiranih podatkov. Vsaj delno to napako omilimo s Sheppardovo korekturo, Ta. je: ( 5 ) (1+u) 4 = 1 + 4u + 5u c + 4u^ + u 4 (D sledi dalje - 47 - /^2u, /^u, /^U» c or cor cor = / i 2u = /*3u = ^4u 1 12 1 | 7 2p2u + 240 6. 5. Mera asimetrije Asimetrijo porazdelitve merimo z normiranim tretjim centralnim momentom. Jk 3 u cj>r Y/4u co/ ( 4 J če je porazdelitev simetrična, je ^ enak nič, če je poraz¬ delitev asimetrična v desno, je ^ večji, če pa je asimetri na v levo pa manjši od 1. teo 48 - Če na pojav vplivajo samo slučajnostni faktorji in je po¬ pulacija homogena, variabilnost pa ni omejena v nobeni sme¬ ri, dobimo simetrično porazdelitev. Vzrokov za asimetrijo je lahko več, ali individualni vplivi niso samo slučajnostni, če populacija ni homogena, temveč sestavljena iz več homoge¬ nih populacij, ali da ima. variabilnost v eno smer omejitev. Porazdelitev določenih karakteristik proizvodnje je asimetrič na, če izvira iz proizvodnje pod različnimi pogoji, ali če je poprečje tako blizu neke naravne omejitve (npr. o), da je variabilnost v eni smeri dušena. 6. 6. Sploščenost porazdelitve Na frekvenčnih porazdelitvah opazujemo tudi pojav splo¬ ščenosti oziroma koničavosti porazdelitev. Za simetrične po¬ razdelitve je stopnja asimetrije nič. Pri sploščenosti tega ni. Zato vzamemo kot osnovo za primerjavo sploščenosti po¬ razdelitev normalno porazdelitev. Idealno sploščenost pri¬ pisujemo tej porazdelitvi. Vse druge porazdelitve so glede na normalno porazdelitev sploščene ali koničaste. Določena karakteristika se porazdeljuje v normalni porazde¬ litvi pri idealnih pogojih, da na pojav vplivajo samo slu¬ čajnostni vplivi in ti niso dušeni v nobeno smer. Vzrok splo¬ ščenosti pa morata, biti heterogenost populaci je^pri čemer se populacija sestoji iz dveh normalnih populacij z različnima sredinama, vzrok koničavosti pa heterogenost, pri Čemer po¬ pulacija sestoji iz dveh ali več populacij z enakimi sredi¬ nami a različnimi variabilnostmi. Vzrok sploščenosti more bi¬ ti tudi omejitev variiranja v dveh smereh. Za mero sploščenosti služi četrti normirani moment (D 49 - Ker je četrti normiran moment za normalno porazdelitev enak 3* dostikrat uporabljamo za mero sploščenosti koefi¬ cient U 2. ^ ^ ” '3 ( 2 ) Če je porazdelitev normalno sploščena, je fa.-o , za sploščene porazdelitve je f L negativen za koničaste pa pozitiven. Za primer izračunanja mere asimetrije in mere sploščenosti vzemimo frekvenčno porazdelitev časovne proizvodnosti za do¬ mači gorilnik za 29o šarž. V nakazanem primeru so izračunane vse pomožne količine , vključen Charlierjev preskus za vso¬ te potenc in upoštevana je Sheppardova korektura. Rezultati pokažejo, da je porazdelitev asimetrična v levo, ( = -o,43o) glede na stopnjo sploščenosti pa je porazdelitev v primerjavi z normalno koničasta ( « +o,5o9). — iro — Izračuna nje M, 0 9 'p. in za časovno proizvodnost domačega gorilnika “ ' kp/h f. f u Charlijev preskus (u+1) 2 f(u+l) 4 o,1931o o,o3729 o,oo72o o,ool39 4£fu 8 = 32 6žfu 2 = 3526 4£fu cr 224 i - looo : 2 = 95oo N - 29o p° 7926 1*2 ~ ^2 ~ V i = 2 »°758 - o,o3729 = 1,99o29 P2cor = P2 " °’° 8333 = l,9o696 pu = V- - 3 V ? V+ 2 V 3 = o,o2759 - 3 .2,o2758.o,1931o +2 e o,o72o = ' J 8 = - 1,13259 p. = ?. - 4V - 3V^ = 13,28276 - 4.o,oo72o.o, 1931o + + 6.2,02758 . o,o3729 - 3,o,ool39 = = 13,72668 f4cor * |V IPs - 13 ' 72668 - 1-1.99029 ^ = 12,76o71 x = +i ^i = 95oo + looo.o,1931o = 9693,lo °* 00T “ 1 VŽTor KV* « loo -=2- 2 = X G O O • 14,25* N1,9o696 = 138o,93 ^3 _ _ -1,13299 _ Ji 2cor )j1,9o696- o,43o ^4. cor 2 12,76071 _ l,9o696 2 + o,5o9 - 51 - 7. NORMALNA PORAZDELITEV 7. 1. Normalna porazdelitev V statistični teoriji in praksi najpomembnejša teoretič na porazdelitev je normalna porazdelitev. Se na pojav razen splošnih faktorjev vplivajo le slučajnostni faktorji, ki v no beno smer niso dušeni, se znak porazdljuje v unimod$$ni, sime¬ trični porazdelitvi - zvonasti porazdelitvi, ki so značilnosti normalne porazdelitve. Normalna porazdelitev je osnova vzorčenja, porazdelitev, ki je osnova za različne druge teoretične porazdelitve in v njo pod določenimi pogoji prehaja večina drugih teoretičnih poraz delitev. Normalna porazdelitev je odvisna od dveh parametrov: aritme¬ tične sredine^ki je rezultat splošnih vplivov in standard¬ nega odklona 67 ki je merilo individualnih - slučajnostnih vplivov. Je zvezna porazdelitev, simetrična, zvonasta in je zanjo M = M 0 = M Q , 7. 2. Gostota relativne frekvence za normalno porazdelitev Ordinata normalne porazdelitve, ki pokaže gostoto re¬ lativne frekvence pri posamezni vrednosti x, je dana z obraz¬ cem CX- h ) pri čemer so: e = baza naravnega logaritma, K = Ludolfovo število, M aritmetična sredina, € pa standardni odklon. Normalne porazdelitve z različnimi M, a enakim standardnim odklonom so skladne, vendar pomeknjene v levo ali desno, med¬ tem ko so'normalne porazdelitve z različnimi standg&nimi od¬ kloni med seboj podobne. Na. sliki je prikazano za primerjavo nekaj normalnih porazdelitev z različnimi M in cT . - 52 - slika. Normalna porazdelitev 7. 3. Kumulativna normalna porazdelitev Integral Ti, - X V) je funkcija zgornje meje. Geometrijsko ponazarja ploščino lika, ki je omejen z abscisno osjo, ustreznim delom normalne krivulje in ordinato normalne porazdelitve za vrednost x. Vsebinsko zgornji integral nakazuje kumulativo relativne frekvence za normalno porazdelitev. - 53 - Iz definicje» gostote relativnih frekvenc in njenih značil¬ nosti za normalno porazdelitev sledi, da je F(x = + oo) = 1 F(x = M) = o,5o K±J V sliki 1 je nakazana krivulja kumulative relativnih frek¬ venc za normalno porazdelitev, ki ima značilno obliko črke S„ - 54 Idealna 8 krivulja je za normalne porazdelitve z različnimi M pomaknjena v desno ali levo, za porazdelitve z manjšim, stan¬ dardnim odklonom pa je strmejša kot za porazdelitve, za katere je standardni odklon večji«, 7. 4. Standardiziran odklon Standardiziran odklon z je odklon vrednosti x od ustrez¬ ne asimetrične sredine, merjen v standardnih odklonih. cr Standardiziran znak z je nov znak, ki je izpeljan iz osnovne¬ ga znaka x. Aritmetična sredina standardiziranega znaka je M z =o, standardni odklon = 1, za katerikoli znak oziroma porazdelitev. Za unimodalne / ne preveč asimetrične porazdelitve se vrednost standardiziranih odklonov giblje v določenih mejah med pri¬ bližno -- 3 do + 3. Ker je z pozitiven, če je x večji od aj&d£■ metrične sredine M in obratno negativen, če je x manjši kot aritmetična sredina po absolutni vrednosti pa manjši, čim bliže je a^rmet/ični sredini, standardiziran odklon kaže na. mesto enote v populaciji. Če je npr. za določeno ploščo stan¬ dardiziran odklon za žilavost plošče določene proizvodnje z = + 2,5, iz tega neposredno sklepamo, da je za to ploščo žilavost nadpovprečna in zelo velika. Nasprotno pa je produk¬ tivnost delavca, za katerega je izračun standardiziranega od¬ klona pokazal, da je z = o,2o sicer podpovprečna, vendar bli¬ zu povprečja. 7. 5. Standardizirana, normalna porazdelitev Normalno porazdelitev $(0,1*"), ki ima parametre aritme¬ tično sredino enako o, standardni'odklon pa 1, imenujemo nor¬ malno porazdelitev, ker je znak. x s temi parametri standardi¬ ziran. G-ostota relativne frekvence za standardizirano normalno porazdelitev (SNO) je glede na zgornje parametre - 55 L (D kumulativna relativnih frekvenc pa o T&. j f(ZJ d Z ( 2 ) 7. 6. Zveza standardizirane normalne porazdelitev s splošno normalno porazdelitvi,jo Standardizirana normalna porazdelitev sama zase še ne bi bila tako pomembna, če ne bi bilo enostavne zveze med N(o,l) in N(M,* <5 Z ). Za gostoto relativnih frekvenc in za kumulativi velja Iz obrazca sledi, da moremo dobiti vrednost gostote relativne frekvence za poljuben normalno porazdeljen x, če poznamo go¬ stoto relativne frekvence za N(o,l). Ker imamovo ^2) kot f(z) tabelirane, dobimo ustrezne vrednosti ordinat ali povr¬ šin pod poljubno normalno razdelitvijo enostavno tako, da za dani x in znanega M in 6 ~izračunamo ustrezen zapreko tega pa najdemo v tablicah za N(o,l) z ustrezno vrednost. TQ<) = (D & -h (x = M ( 2 ) 56 7. 7. Tablice ordinat in površin za N(o,l) 7 tabeli 1 imamo danih nekaj karakterističnih odnosov med z in različnimi površinami pod normalno porazdelitvijo . Tabela 1. Odnosi med z in karakterističnimi površinami h G C V Zgornja tabela vsebuje odnose med površinami in s za najznačil¬ nejše vrednosti. Ti odnosi so važni kor orientacija in kot kri¬ tične vrednosti za sklepanje na osnovi vzorčenja. Zveze med N(o,l) in poljubnimi normalnimi porazdelitvami pa da¬ je podrobnejša tabela, za z v razmakih o,oi vrednosti ordinat in površin H (v razmaku od o .do z). Tabela 2: Normalna distribucija (standardni odklon - z; površina - H; ordinata - (p ) - 58 Tabela 2(nadaljevanje) 2 A Da se izognemo decimalkam, so tabelarne vrednosti lo z, lo 4 H in lo 4 ^> , kar je treba pri končnih rezultatih upoštevati. S tablicami moremo iz danega z najti H(z) in ^(z) in obratno - 6o iz znanega H poiščemo z(H) in ^(H). PrimerVI. z = 1,79. Iz tablic odčitamo H = o,4633» C£ = 0,0804. Primer VII. H = o,397; z(H) = 1,26; so razlike v frekvencah znatne kljub temu, da se stvarna in te¬ oretična porazdelitev ujemata v treh osnovnih parametrih: N, M, oT . 7. 9. Metoda površin za. prilagoditev normalne porazdelitve stvarni frekvenčni porazdelitvi Po metodi površin prilagodimo stvarni frekvenčni poraz¬ delitvi normalno porazdelitev po naslednjem postopku: a) za stvarno porazdelitev izračunamo ali ocenimo N, M in čT b) za meje razredov x^,min izračunamo po obrazcu U> standardizirane odklone c) iz tablic za normalno porazdelitev poiščemo z k ustrezne površine H(z). Pri tem upoštevamo, da. je H(-z) =*-H(z) d) da dobimo kumulativo relativnih frekvenc za prilagojeno normalno porazdelitev, dobljenim vrednostim H(z) prištejemo o,5: P°(z) = o,5o + H(z) e) vrsto P°(z) pomnožimo z N. Tako dobimo vrsto kumulativnih - 61- frekvene F{s kjlT!in )| f} če poiSSemo razlike med dvema zaporednima členoma v vr¬ sti kumulativnih frekvenc, dobimo vrsto frekvenc prilagoje¬ ne normalne frekvenčne porazdelitve f’. Za primer vzemimo frekvenčno porazdelitev premerov 5oo glav zakovic. Zanjo je X = 13,426 mm, s = o,115 mm, i = n = 5oo 7. lo. Verjetnostna skala o,o5 mm. P = f’ o>3 o,7 2,7 7.4 1.8.0 34,5 57.4 75,8 87.0 79.1 61.4 4o,3 21.1 9.5 3,4 1,1 o,3 5oo Ob linearno skalo za standardiziran z odklon nanesene vrednosti oziroma skala za kumulativo relativnih frekvenc P°(z) imenujemo verjetnostno skalo. Kot je razvidno, je ver¬ jetnostna skala ni linearna, temveč je okrog z = o najgostej- sa, razmak pa tem sirsi čim bolj se oddaljujemo od z = o v eno ali drugo smer. V ostalem je verjetnostna skala zaradi sime¬ tričnosti normalne porazdelitve simetrična na vrednost z = o. - 62 T 'i '5 1 io u> T 3o so \ 6o 70 "T ’ l" 90 ■ ) ' 9-r 99 99'7 99\9 slika. Verjetnostna skala 7. 11o Linearno verjetnostna mr e ža in linearno verjetnostni grafikon Če na absciso nanesemo linearno skalo za znak x, na ordinato pa verjetnostno skalo, dobimo linearno verjetnostno mrežo, (glej sliko). Ker je verjetnostna skala linearna v znaku z, je zaradi linearne zveze med z in x z M G' (D za vsako normalno porazdelitev grafična slika za normalno porazdelitev premica, ki gre skozi točko (ivl,o) in ima smerni koeficient 1/& . Premica je torej tembolj strma, čim manjši je standardni odklon in tembolj položna čim večji je stan¬ dardni odklon. Ker je linearni z - skali prirejena verjetnostna skala F°, je iz verjetnostnega grafikona za normalno porazdelitev, za katero je vrisana ustrezna premica, možna direktna zveza med vrednostmi x in kumulativo relativnih frekvenc (glej sliko v 7. 12. 7. 12, Kumulative relativnih frekvenc stvarnih porazdelitev J. v erjetnostnem grafikonu Če narišemo kumelativo reletivnih frekvenc za stvar¬ no frekvenčno porazdelitev v verjetnostni grafikon, je nari sana lomljena črta tem bolj približana premici ali potekaj linearno, čimbolj je stvarna porazdelitev podobna normalni. Taki grafikoni torej služijo za analizo podobnosti oziroma odklonov stvarnih porazdelitev od normalnosti. Ko imamo v verjetnostnem grafikonu vrisano stvarno porazde¬ litev moremo vrisati premico, za katero smatramo, da se stvar¬ ni črti najbolj prilagaja, ta premica predstavlja oceno slike stvarni porazdelitvi prilagojene normalne porazdelitve. Eer je normalna porazdelitev ponazorjena v verjetnostnem gra¬ fikonu s premico, odklone od normalnosti (asimetrija, sploš¬ čenost) iz verjetnostnega grafikona lažje analiziramo, kot iz drugih prikazov. Slika kaže č<**te v verjetnostnem gra¬ fikonu za asimetrične in sploščene porazdelitve. A B = normalna = asimetrična v levo = asimetrična v desno = koničasta Slika . Normalna, asimetrične in sploščene porazdelitve na verjetnostnem grafikonu. Za primer "uporabe verjetnostnega grafikona vzemimo frekven no porazdelitev N = 5oc zakovic po premeru glave: zanje je - 64 - frekvenčna porazdelitev f^, kumulativa F^in kumulativa re lativnih frekvenc Fk^» izražena v odstotkih* naslednja: nrvm, i/e«,/re*u_ e/e. pJo-v ^v> l'* •J-Zgk.V QMC l*JL- /UDfir^ ^ 1> vW 64 - 66 - 7. 13. Logaritemsko normalna porazdelitev Če se porazdeljujejo v normalni porazdelitvi logx ali log(x-a) pravimo, da ae x porazdeljuje logaritemsko normalno. Za tako porazdelitev je parameter M v normalni porazdelitvi enak M = logG, pri čemer je G- geometrijska sredina iz x ali (x-a) varianca < 3 - 2 * p a j e G*) (* ) Veliko pojavov se pod vplivom samo slučajnostnih faktorjev ne porazdeljujejo normalno, temveč logaritemsko normalno, Če je v pojavu določena naravna omejitev, ki duši variira¬ nje v eno ali v drugo smer, se asimetrična porazdelitev iz¬ kaže kot logaritemsko normalna. Ena izmed takih naravnih ba- rier je vsekakor vrednost o, Dosti je namreč količin, ki mo¬ rejo biti le pozitivne. Če je poprečje za take količine maj¬ hno, je navzdol variabilnost dušena in dobimo asimetrične, včasih celo J porazdelitve, njihovi logaritmi pa se porazde¬ ljujejo normalno. 7 . 14. Logaritemsko-verjetnostni grafikon Ali se proučevani pojav'porazdelju je logaritemsko nor¬ malno, najenostavneje preskusimo z logaritemsko verjetnostnim grafikonom. V njem je abscisna skala logaritemska, ordinata pa normalno verjetnostna. Če v to mrežo narisana vrsta kumula¬ tivnih relativnih frekvenc poteka linearno, sklepamo, da je porazdelite ' pojava logaritemsko normalna, če spreminjamo konstanto a v log(x-a) moremo celo špekulativno ugotoviti ba- rierno oziroma skrajno vrednost a. Če spreminjamo a, se spre¬ minjajo tudi črte na verjetnostnem grafikonu. Za barierno vred¬ nost a is črta logaritemsko verjetnostnem grafikonu linearno tendenco. Za primer logaritemsko normalne porazdelitve in prikaz loga¬ ritemsko verjetnostne skale in grafikona vzemimo pora z d e.!, tev industrijskih podjetij po številu zaposlenih v SFRJ v letu 1965K - 67 - r % '■ '■'j-t-l j 1 C Vco ~ V-t/Lj eJČ CooJJtu CL^i ko 14, * fft 1 ' ^A° -fevilot ZLcyvoUeouX 4A4 ctu^^y-jj JrA-u( fLQ čtf ' rJ ~ - 68 - 8. VZORČENJE 8. 1. Vzorčenje Vzorčenje je metoda statistične _induk cl-ie-sklepanj a iz dela na celoto. Z vzorčenjem ocenjujemo parametre popu¬ lacije ali preskušamo hipoteze o populacijah. Objektivna metoda ocenjevanja je slučajnostno vzorčenje, ki ima za osnovo verjetnostni račun. Pri slučajnostnem vzorčenju je običajno verjetnost izbora za vse enote enaka. 8. 2. Tveganje Pri statističnem sklepanju z vzorci, rezultati oziro¬ ma sklepi ne veljajo stoodstotno, ampak le z večjimi ali manjšim tveganjem. Kot tveganje definiramo verjetnost , da se napovedani dogodek ne bo zgodil. Cim manjše je tvega¬ nje sklepa, tem večja je njegova zanesljivost. Statistične sklepe dajemo običajno na treh stopnjah tveganja. Najmanj zanesljivi so rezultati na stopnji tveganja « o,o5. Na¬ slednji stopnji tveganja, ki jih uporabljamo v praksi pa sta = o,ol in = o,ool. Stopnja tveganja = o,o5 po¬ meni, da s preskusom dokazani sklep ne drži v enem od 2o pri¬ merov. Stopnja tveganja = o,ol pomeni, da napravljeni sklep v enem od loo, tveganje = o,ool pa, da napravljeni sklep ne drži v enem od tisoč primerov. 8. 3. V statističnem smislu imenujemo vzorec vsak na slučaj- nosten način izbrano določen del enot proučevane populacije z namenom, da iz te delne populacije sklepamo na celoto. Slučajnost izia^ra je eden izmed osnovnih postavk, ki omogoča objektivno ocenjevanje ali preskušanje hipotez. Slučajnostni vzorec je vzore^C s ponavljanjem, če ima vsaka enota možnost, da je večkrat izbrana v vzorec in brez ponav¬ ljanja, če more biti vsaka enota enkrat samkrat izbrana v vzorec. Po obsegu so vzorci mali, če število enot v vzorcu ne presega par desetin enot (ne več kot loo) in veliki, če ima vzorec - 69 - nekaj sto ali tudi tisoč enot. Stroge meje med malimi, in velikimi vzorci ni možno potegniti in je ta prehod zvezen. Čim večji je vzorec, tembolj veljajo zakonitosti za velike vzorce. Čim manjši je vzorec, tembolj pridejo do izraza o- mejitve in značilnosti malih vzorcev. Kot vzorec moremo npr. vzeti skupnost n = 5o na slučajno- sten način izbranih artiklov iz proizvodnje na' nekem stroju, ki smo jih izbrali zato, da na osnovi njih preskusimo, ali celotna proizvodnja ustreza pogojem, ki jih stavljamo nanjo. Enako moremo kot vzorec vzeti n = 2o enakovrstnih poskusov, ki jih izvedemo pod enakimi pogoji, da bi preskusili hipo¬ tezo o vplivu določenega faktorja. V tem primeru smatramo n = 2o poskusov kot vzorec iz hipotetične populacije vseh možnih poskusov pod enakimi pogoji. Kot vzorec moremo smatrati npr. tudi skupnost na slučajno- sten način izbranih n = looomomentov v razmaku delovnega ča¬ sa v določenem tednu. S takim vzorcem ocenjujemo strukturo izrabe delovnega časa delavce v,strojev itd. 8. 4» Vzorčna populacija Iz osnovne populacije, na katero skušamo posplošiti rezultate vzorca, moremo izbrati ne samo en vzorec z dolo¬ čenim obsegom, temveč veliko število vzorcev. Če gre za vzorce s ponavljanjem, je število vseh možnih vzor¬ cev z obsegom n iz osnovne populacije z obsegom N enako šte¬ vilu vseh možnih kombinacij s ponavljanjem. To je možno iz¬ raziti s simbolom f M+n -A K. (N+l). (N+2). (N+3 (N+n-1) v VI / 1. 2. 3. 4. „ ..... n število vseh možnih vzorcev brez ponavljanja je manjša in je enako številu vseh možnih kombinacij s ponavljanjem po n ele¬ mentov iz populacije z N elementi. Izraženo s simbolom je to število - 7o /NA N, (N-l). (N-2).(N-n+1) (*) ~ 1. 2 0 3. n Tako število vseh možnih vzorcev s ponavljanjem kot brez ponavljanja je že razmeroma majhne populacije in vzorcev zelo veliko, V praktičnih situacijah, kjer je populacija običajno obsežna, pa tudi vzorci imajo razmeroma veliko število enot, pa je število vseh možnih vzorcev praktično neomejeno. Za vsak vzorec je možno za določen znak izračunati različ¬ ne parametre - statistike. Tako moremo iz vzorcev po n = 5o enot izračunati odstotek defektnih artiklov, poprečen pre¬ mer, poprečno žilavost plošč itd. Ker so v vsakem vzorcu izbrane različne enote, pa so tu izračunani parametri od vzorca do vzorca različni t.j. variirajO> .Skupnost vseh vzorcev pa tudi skupnost vseh vrednosti določenega para¬ metra za posamezne vzorce imenujemo vzorčno populacijo. Jasno je, da je nemogoče praktično skonstruirati vse možne vzorce in-zanje izračunati določene parametre - statistike. Vendar verjetnostni račun in teorija vzorčenja dajeta zako¬ nitosti o vzorčnih populacijah neposredno. 8„ 5. Vzorčne porazdelitve Porazdelitev določenih vrednosti vzorcev v populaciji vseh možnih vzorcev imenujemo vzorčno porazdelitev. Tako bi dobili vzorčno porazdelitev a rTi; Jtičhih sredin vzorcev, če bi sestavili iz aritmetičnih sredin za vse vzorce frekvenčno porazdelitev. Direktno sestavljanje vzorčnih porazdelitev je praktično neizvedljivo. Vzorčne porazdelitve marsikaterih vzorčnih izrazov pa je možno dobiti z uporabo verjetnostnega računa. 8. 6. Varianca in standardna pogreška vzorčnih izrazov Za vsako vzorčno porazdelitev, ki jo poznamo, moremo izračunati varianco - Var-g . 71 - Standardni odklon vzorčnega izraza g, ki je kvadratni ko¬ ren iz variance, imenujemo standardna pogreška in jo zazna¬ mujemo z SE(g)„ Standardna pogreška ocene je osnovni poka¬ zatelj zanesljivosti ocen in osnova za izračun ocen za veli¬ ke vzorce. 8. 7. Zakonitosti ocen aritmetičnih sredin iz vzorcev iz normalno porazdeljenih populacij Če se znak x v osnovni populaciji porazdeljuje normal¬ no N(M,ff 2 ), se aritmetične sredine x v populaciji vseh možnih vzorcev porazdeljujejo normalno s parametri E(x) = M in Var? = (f/n ali če napišemo v standardni simboliki x = N (M; (^ 2 /n). Iz zgornjih zakonitosti spoznamo, da se aritmetične sredine iz vzorcev porazdeljujejo okrog prave vrednosti aritmetične sredine in da je variabilnost teh sredin tem manjša, čim manj¬ ši je standardni odklon v osnovni populaciji in čim večji je vzorec. Če je npr. aritmetična sredina za določen znak M =5o varianca v osnovni populaciji 0^ = loo, vzorec pa ima n = loo enot, je varjanca za porazdelitev ocen vzorcev, Varx = lo 2 /loo = 1. Z verjetnostjo 1 - oc =0,95 leži ocena v razmaku M - 1,56 SE(x) = 5o - 1,96.1 = 48 do M + 1,968 E(JT) = 5o + 1,96.1 = 52. Iz numeričnega primera spoznamo, da je variabilnost že pri aritmetični sredini že pri vzorcih z n = loo zelo majhna.. Iz zakonitosti, ki slede iz verjetnostnega računa, povzamemo, da je zelo velika verjetnost, da bo iz vzorca ocenjena arit¬ metična sredina ležala v neposredni okolici prave aritmetične sredine. 8. 8. Zakonitosti za ocene sredin pri vzorčenju brez ponavlja¬ nja Za enostaven slučajnosten vzorec brez ponavljanja, velja¬ jo za porazdelitev sredin vzorcev x vse zakonitosti, kot za vzorec s ponavljanjem, le da varianca Var x ni enaka (j/n temveč - 72 - . s j;o - n) Var x = - n. N (D 2 ■Pri tena je S^, ki je mera variacije v osnovni populaciji, definirana z izrazom s 2 = ( 2 ) N - 1 Razlika med in je praktično nepomembna, ker je že za ne preveč velike N je razlika med N in N-l nepomembna, pač pa je ta razlika teoretično utemeljena, če primerjamo Var x za vzorec s ponavljanjem opazimo, da je bistvena razlika le v faktorju (K-u)/jV . Ta faktor je tembolj različen od 1, čim večji je vzorčni delež f. Vzorčni delež f = n/N pove, kakšen del celotne populacije je vključen v vzorec. Za neo¬ mejene populacije(N = oo) je korekturni faktor 1. Vzemimo za primer skupino N = 2ooo plošč,za katero poznamo aritmetično sredino M = 15 mm. Zanjo poznamo tudi S x = 2. Za vzorčno populacijo aritmetičnih sredin, ki jih izračunamo iz vzorcev brez ponavljanja, na osnovi vzorcev z n = 2oo eno¬ tami, je po zgornjih zakonitostih = 15 in ir - 2,2 Var X = -*- 2oo 2ooo - 2oo 2ooo~" = o,ool8 Kvadratni koren iz Var, SE pa je enak: SE(x) = J~o7ool8 = o,o425 Če upoštevamo zakonitosti normalne porazdelitve in zakonitosti verjetnostnega računa, z verjetnostjo o,95 pričakujemo, da bo s slučajnostnira vzorčenjem brez ponavljanja izračunana ocena od prave poprečne debeline M = 15 oddaljenja manj kot D(x) « 1,96,o,o425=o,o83 mm, ali relativno manj kot o, 55 Aritme¬ tična sredina, izračunana iz vzorca n = 2oo artiklov je torej razmeroma dobra ocena prave vrednosti poprečnega premera. - 73 - 8« 9» Centralni lim i tni teorem Ne glede na to? kako se znak x v osnovni populaciji porazdeljuje? se aritmetične sredine, izračunane iz vzor¬ cev, z večanjem obsega'vzorca porazdeljujejo asimptotično normalno« To pomeni, da je distribucija sredin vzorcev po¬ razdeljena v porazdelitvi, ki je normalni tembolj podobna, čimve 5 ji je vzorec« Aritmetične sredine slučajnostnih vzor¬ cev s ponavljanjem ali za vzorce iz hipotetičnih populacij porazdeljujejo asimptotično t , M : -A "4 x =: N (MJ $/n) za aritmetične n ja pa sredine slučajnostnih vzorcev brez ponavlja- x =;N(lvI; N-n x TT ; 8. lo« Tehnika slučajnostnega izbora Osnova vzorčenja so zakonitosti verjetnostnega ra¬ čuna« Te pa veljajo le pod predpostavko, da je vzorec izbran na slučajnosten način. Zato je treba pri vzorčenju zagotovi¬ ti slučajnost izbora. Ta se v večini primerov vzorčenja redu¬ cira na enako možnost izbora za vsako enoto. To enako mož¬ nost izobra moremo zagotoviti z loterijskim izborom. Iz žare, v kateri je toliko listkov, kolikor ima populacija enot izbi¬ ramo listke na slepo. Listi so oštevilčeni z zaporednimi šte¬ vilkami, ki ustrezajo zaporednim številkam enot v okvirju vzorčenja. V vzorec vključujemo enote, ki imajo zaporedne ste vilke, ki so napisane na izbranih listkih. Izbor delno poenostavimo, Če namesto N listkov imamo v žari lo listkov,kock ali kroglic, ki so oštevilčene s številkami od o do 9. Štirimestno slučajnostno število npr. sestavimo če iz žare z desetimi kroglicami štirikrat zapovrstjo s po¬ navljan jejp izberemo kroglico in zapovrstjo zapišemo številke, ki smo jih izbrali. Ta način je že toliko praktičen, da pride v poštev pri operativnem delu. Loterijski način nadomeste ta¬ blice slučajnostnih številk. - 74 - 8. 11. Tablice slugajnostnih Številk Loterijski način slučajnostnega izbora nadomesti tablica slučajnostnih številk, V tablicah slučajnostnih številk so zapovrstjo zapisane številke, kot so bile npr. iz žare ali na kak drug način, ki zagotavlja slučajnost izbrane. Enkrat izbrane slučajnostne številke moremo to¬ rej uporabljati večkrat. Iz slu jačnostnih številk dobimo večmestno število slučajnostno Število, ki ustreza zapored¬ nemu številu izbrane enote tako, da zgrupiramo skupine slučajnostnih številk. Če je nrp. N = 78oo enot, moramo iz tablic slučajnostnih številk sestaviti skupine po štiri slučajnostne številke. Tako moremo iz v nadaljevanju dane ilustrativnega dela sestavljene skupine po štiri zaporedne številke takole: 5354 9142 o847 5353 5418 65o5 itd. Od teh številk ne pride v poštev druga, ker je prva šte¬ vilka. večja od 7 oziroma celotno število večje kot je šte¬ vilo enot v populaciji. Štirimestne grupe slučajnostnih številk moremo sestaviti tudi tako, da se pomikamo v seriji slučajnostnih števil za eno po eno:tako dobimo vrsto štirimestnih slučajnostnih številk 5354 3549 5491 4514 yl42 142o 42o8 itd. Tako povečano bolje izkoristimo tablico slučajnostnih številk, ker moremo iz tablice enakega obsega dobiti več slučajnostnih številk. Tablico slučajnostnih številk moremo brati tudi od zadaj naprej, po kolonah od zgoraj navzdol ali od spodaj navzgor, v diagonali ali po kakšnem drugem vnaprej določenem sistematičnem redu, ki ne moti slučajnosti. Poseben problem nastopi, če je število enot v populaciji ta¬ ko, de je prvo v številu enot 1, 2, 3 ali 4. V tem primeru so tablice slabo izkoriščene, ker more odpasti tudi od 5o do 9o formiranih sluča jnostnih številk. Če je npr. N = I8oo, odpadejo vsa tista štirimestna Števila, ki so večja kot l8oo ali z drugimi besedami, to je vsa tista, ki imajo prvo števil¬ ko v štirimestni grupi večjo kot 1. Oe izdelamo pravilo, da so vsa slučajnostne števila, ki imajo prvo številko sodo šte¬ jemo kot o za tiste, ki imajo liho pa 1, se slučajnostnemu principu nismo odrekli, uporabnost tablice pa smo povečali, ker so uporabne vse, tudi številke, ki se začnejo z drugimi številkami in ne samo z o in 1. 0 - 76 - iz operativnih številk, ki jih dobimo iz tablice slu- čsjnostnih številk pridemo do slučajnostnih številk za zgor¬ nji primer: op. št. o912 9124 1249 4964 964o 64o5 4o5o sl. št. o912 1124 1249 o964 164o o4o5 oo5o t Tako ^d uporabnih vseh sedem slučajnostnih številk, medtem ko /itaiz nekorigiranih uporabni samo dve. Če je število enot v populaciji število, ki se začne z dve, delamo po sistemu, da za prvo številko v slučajnostnem šte¬ vilu vzamemo ostanek, če prvo številko delimo s 3* Tako po¬ menijo o številke o 3 6, 1 številke 1 4 7 in 2 številke 258. Številka devet odpade, ker drugače nima vsaka šte¬ vilka enake možnosti, da bi bila vključena v izbor. Za zgornjih 7 operativnih številk bi v tem primeru bile slu¬ ča jnostne številke naslednje: op. št. o912 9124 1249 4964 964o 64o5 4o5o sl. št. o912 izp. 1248 1964 izp. o4o5 lo5o Če je prva številka obsega populacije 3;POdobno^ vzamemo ostanke deljenja s 4» o 4, 1,5, 26, 37. Iz istih razlogov kot zgoraj pa 8 in 9 odpadeta. Če je prva številka 4, pa po enakem postopku z deljenjem s 5 velja: o in 5 dasta o, 1 in 6 dasta 1,2 in 7 dasta 2, 3 in 8 dasta 3 in 4 in 9 dasta 4. 77 - - 78 - 8. 12. Točkovna ocena Točkovna ocena parametra je dana z eno samo vrednostjo, ki jo dobimo iz podatkov slučajnostnega vzorca. Točkovna oce¬ na g je nepristranska ocena, če je aritmetična sredina ocen M(g), izračunanih iz vseh možnih vzrocev, enaka ocenjevanemu parametru G. V terminologiji verjetnostnega računa izraženo pomeni, da je g nepristranska ocena parametra G, če je ma¬ tematično upanje ocen #(g$, ki je slučajnostna spremenljivka, enako ocenjevanemu parametru G. V drugem primeru pa je c cena pristranska. Pristranske ocene, ki imajo lastnost, da so asimptotično nepristranske, imenujemo dosledne ocene. Asimj(- ptotična nepristranskost pomeni, da je stopnja pristranosti tem manjša, čim večji je vzorec.Ocena, je torej nepristranska, če velja E(g) = G pristranska pa je, če je d = E (g) — G pL (orutrcirLo Cj 81 - Primer. Iz oififeh partij proizvodnje ocenjujemo razlike v trdnosti. Iz prve partije smo na vzorcu n]_ = 2oo presku- šancev dobili xi = 158 in a-^ = 3 » 18 iz druge partije pa iz vzorca n .2 = 4oo preskušancev 5?2 = 143 in = 6,12. Kolika je z cK= o,o5 najmanjša razlika v trdnosti med o- bema. partijama. Ker vprašujemo po najmanjši razlikuje interval zaupanja enostranski in pri danem tveganju enak M = - Xn - z A seAA d 1 o»o 5 Ker je seAx = \fvar A x = 0,380 Am = 158 - 143 - 1,645 . 0,380 = 14,37 ^ 'tvolruujvfcl ’ /lAlA-SLcC 0-&-e^l^ASL O, oj- /)if t '3^ 'JLp/'?>l r n< !L 8 . 16. Ocenjevanje strukturnega deleža z enostavnim slučaj- nostnim vzorcem Za. velike vzorce velja centralni limitni teorem tudi za strukturne deleže. Tako je pjt = loo n Oj n (D nepristranska ocena za strukturni delež P& v populaciji. f%ae porazdeljuje normalno s parametri E(p*) = Var p^- P^(loo-P^) n ( 2 ) Za vzorce brez ponavljanja iz končnih populacij pa je - 82 - C Var(p^) N - n n N 2 N Pri tem je S a = P$ž(loo-P?ž) ^-j- Če varianco ocen strukturnih deležev ocenjujemo velja n A\ /&q. = p^(loo-p^) -~ T var(p^) = -- n- j. n ( 3 ) (4) iz vzorca, N-n '"n" (5) Intervalna ocena za strukturni delež je v tem primeru s tve¬ ganjem (K - o,o5 p?* 1,dse(pjž) ^ P?t> 2 kp/mm2. Ocena za koeficient vari¬ acije je - 1 6 kvjž. = loo 3 2 3o, velja: čemer je £ standardiziran odklon normalne •5,41 7,82 9,84 11,67 13,39 15,o3 16,62 18,17 19,68 21,16 22,62 24,o5 25,47 26,87 28,28 29,63 31,oo 32,35 33.69 35, o2 36,34 37,66 38,97 4o,27 41,57 42,86 44,14 45,42 46.69 47,96 5o,89 59,7o * \{ + »vf > distribucije. Verjetnostim. P ustrezajoče vrednosti z so dane v tabeli II Tabela II. z-vrednosti P z P Primer £ 2 (m=85) = -( ^2.85-1+1»6449) 2 =1o7 »24 2 V tabeli 1 so za nekatere P in stopnje m od 1 do 3C podane kritične vrednosti za % 2 porazdelitev. Pod posameznimi ^tabeli- ranimi vrednostmi pa so v zadnji vrsti dane ustrezne vrednosti z, ki omogočajo izračun kritičnih vrednosti za m 3o po obraz¬ cu 3. 9o 4. Študentova t-porazdelitev Za med seboj neodvisni slučajnostni spremenljivki z =.' N(o,l) in'^C =: X^m) od katerih se /z, porazdeljuje standardi¬ zirano normalno, pa v A 2 porazdelitvi z m stopinjami pro¬ stosti, se izraz (D porazdeljuje v porazdelitvi, ki jo imenujemo t-porazdelitev - 91 - Zanjo je število stopinj prostosti m, gostota relativne frek¬ vence pa je dana s funkcijo ( 2 ) Kot kaže funkcija za gostoto verjetnosti c£>(t) in slika^ je t-porazdelitev simetrična unimodalna zvonasta porazdelitev, ki se z večanjem števila stopinj prostostjp&simptoti čno pribli¬ žuje standardizirano normalni porazdelitvi. Slika 1, Študentova t-porazdelitev z vrisano asimptotično t-porazdelitvijo za m = o©, ki sovpada z normalno porazdelit¬ vijo. V tabeli so dane kritične vrednost.i za t-porazdel:.tev, Kri¬ tične vrednosti za t se z večanjem števila stopinj prostosti bolj in bolj približujejo ustreznim vrednostim za standardi- zirano normalno porazdelitev, čim večje je Število stopinj prostosti. Tab®la 1| t^porazdelitev 94 Tabela 1: t-porazdelitev (nadaljevanje) P 0,25 o s o5 o,o25 o,o! o,qo5 o*goo5 9 . 5 . F-porazdelitev 2 o Se s® slučajnostna spremenljivka Xl porazdeljuje v % porazdelitvi z m^ stopinjami prostosti in ^X~ v ^ porazdelitvi z m 2 stopinjami prostosti in sta med seboj neodvisni, se P = ^3/S jpZ, (D porazdeljuje v porazdelitvi, ki jo imenujemo P-porazdelitev. . , f it, ** Gost-ota relativne frekvence za F-porazdelitev je m-i j-Jt m ^(?) - C p ,F ? (l +-~ p) 2 (2) Iz obrazca vidimo, da F-porazdelitev zavisi od dveh stopinj prostosti F-porazdelitev je asimetrična porazdelitev, za katero pa se stopnja asimetrije manjša, Če se Število stopinj prostosti ve ča. Slika F-porazdelitev Ker zavisi F-porazdelitev od dveh stopinj prostosti m! in m 2 » je tabela kritičnih vrednosti kompleksnejša in dobimo za vsako nivo svojo tabelo. porazdelitev = o s o5) 96 I 97 oo o o o r-TCMPO-tJ-AVOp-COCn O H CM 't o ■=*- o o o o o o o o o HHHrlHOJCNJ^^iAN o iA o o o H H CM -=J- O «• I— I s 0 - 98 - d" CO d" rH OO CO CM rH O OmCncOOOaOC— C—C^-lH-r-COCOCOCOCOCO Cn co OJ H H H i—I H H HOl^^lO^OO-tO^ OHOJ-^O- O O O O O O O O O o HHHrlHOlN^^lOhOlOOOO (\ H rl N >t O ■porazdelitev (P = o,ol) - 99 i Ih o c IT> O o OJ o o LT» P- O ITi MO O C\l 'O t\j mo m h «e- o en », a* «. ih MO OV MO en Cn 8 39?8 4o,3 4o»7 strojno Jesenice; 42,9 43»o 43,8 44,5 44,3 45,c Iz teh podatkov ocenimo, da je 2 %2_ ~ 41,o5 3^ = 1,268 » 2 = 43»92 © = o,71o Iz teh podatkov dobimo dalje, da je 2 (6-1)1,268 + (6-l)o,71o J s d = ^ 2 -“ = o,989 s d = ^0,989 = o,994 Če želimo oceniti interval zaupanja, v katerem prava vrednost razlik leži s tveganjem o( = o,o5, dobimo iz tablic za kritične vrednosti za t-porazdelitev, da je t ( “ - 6 t 6 - 2 - 10) . 2,23 o, o5 Razmak zaupanja pa je 6 + 6 43»92 - 41, o5 - 2,23 . o, 994 \j ° J- ° / Mg -3^ < 43.92 - 41,o5 + + 2,23 . 0,994 J / 1»59 ^ M 2 - M x < 4.155Ž 9. 9. Zakonitosti ocen varianc za male vzorce X SO v, ^ Ce osnovna populacij«? porazdeljuje normalno varianco odvisna od prave vred¬ nosti parametra, imenujemo operativno karakteristično krivu¬ ljo. - lo7 - Ojatr&h'4ooo Ustrezna ničelna hi¬ poteza je H 0 : = 4ooo. Dano ničelno hipotezo preskušamo z vzorcem n = 12 preskušancev in dobimo, da je iz vzor a oce njena varianca = 11116. Če dobljene podatke vstavimo v obrazec 1 dobimo -y2 _ (12-D. 111X6 _ ■ 4000 33,35 2 Ker je kritična vrednost za X(m=ll) = 32,91 (glej tablico kritičnih vrednosti v 9.3) sklepamo, da je varianca za šte¬ vilo pulzacij značilno večja od hipotetične s tveganjem Oi = o,ool. - m - lo. 12. Preskušanje hipoteze o razlikah med variancama Ničelno hipotezo, da je variabilnost v dveh populacijah ena ka K 0 : dq_ = @2 preskušamo z dvema neodvisnima vzorcema iz dveh normalno porazdeljenih populacij z vzorčnim izrazom — =:F(mi=n-l ;m2^2 “ (1) s 2 2 . 2 ki sledi iz obrazca 2 v 9.9, če je ^ o V razmerju v obrazcu vzamemo kot sj_ vedno večjo oceno. Za primer vzemimo proučevanje variabilnosti števila pulzacij pri različnih pritiskih. Za vzorec n = 8 preskušancev pod prvim pritiskom smo dobili s| = 12545, za vzorec n = 8 preskušancev pod drugim pritiskom pa s| = 8169. Se predpostavimo normalnost obeh populacij in vstavimo dob¬ ljene rezultate v obrazec 1^dobimo 12545 ~ 8169 1,535 Iz tabele o kritičnih vrednostih za F porazdelitev v 9,5 ^‘irti^ns^z^e^r-'&sxs^T je kritična vrednost F(m 1 =7;m 2 =7) = 3,79 oi^o, o5 Ker je iz podatkov vzorca izračunani F manjši kot kritična vrednost za F na stopnji tveganja oC = o,o5> smatramo, da so razlike med variancama neznačilne. To pomeni, da razlik z izvedenim preskusom nismo odkrili. 1 o,lj . Preskušanje hipotez o frekvenčnih porazdelitvah p Hipoteze o frekvenčnih porazdelitvah preskušamo s % testom. Izraz 112 - d) pri čemer pomenijo f stvarne, f s pa hipotetične frekvence se namreč porazdeljuj^ v I 2 porazdelitvi z a = k - p stopinja¬ mi prostosti, pri J čemer je k število razredov v frekvenčni porazdelitvi, p pa število omejitev, ki vežejo stvarne in teoretične frekvence. Primer: V treh partijah je bilo proizvedeno po vrsti: n^ = 3ooo, ng = 4ooo in = 5ooo artiklov, v posameznih par¬ tijah pa je bilo: d^ = 6o» dj = 5o, dc = 7o defektnih artiklov. Se hočemo preskusiti homogenost v kvaliteti teh treh partij, je pri ničelni hipotezi enaki kvaliteti partij od skupno d = l8o defektnih artiklov: d^ = 45, dg = 6o in d q =75. Iz teh podatkov in stvarnih frekvenc izračunani % 2 je 2 160.-.45}f (60 - 6 o ) 2 (70 - 75) g _ _ 45 6 o + 75 ' ' ,0 ° Števila stopinj prostosti je m = 3 - 1 = 2, ker so skupno tri frekvence v frekvenčni porazdelitvi vezane na skupno število defektnih artiklov d = l8o. Kritična vrednost za (m=2) = 5,99» X 2 (m=2) = 9,21, iz če- oc="o,o5 <*-o,ol sar sklepamo, da so razlike v kvaliteti med tremi partijami značilno različne in sicer na nivoju = o,o5. 10.1 , Preskušanje hipoteze o normalnosti frekvenčne porazde¬ litve S*)# preskusom preskušamo tudi eno izmed zelo pomemb¬ nih hipotez: hipotezo o normalnosti frekvenčne porazdelitve. S tem preskusom preskušamo ničelno hipotezo, da je znak x v osnovi populaciji, iz katere smo na slučajnosten način iz¬ brali vzorec, normalno porazdeljen. Ker je stvarni porazdelitvi prilagojena normalna porazdeli¬ tev vezana na enak obseg, aritmetično sredino in standardni odklon, imamo tri omejitve, ki vežejo stvarne in teoretične frekvence. Število stopenj prostosti, ki pride v poštev pri preskušanju značilnosti razlik distribucij od normalne je torej m = k-p = k-3. Za primer vzemimo frekvenčno porazdelitev trdnosti patenti¬ rane jeseniške žice za n - 153 preskušancev. To je porazde¬ litev, za katero smo že izračunali aritmetično sredino in varianco v odstavkih o izračunavanju teh parametrov. X k f k 4f k C4f k ) 2 /f£ 2 Ker aproksimaci ja s }(, velja le* Če so teoretične frekvence večje kot 5* smo skrajne frekvence združili v širše razrede, da. je temu pogoju zadoščeno. Po združevanju ostane še k = 7 razredov. Število stopinj prostosti je po zgornjem pravilu m = k-3 = 7-3 = 4. 2 V tablicah za kritične vrednosti za \ -porazdelitev dobimo X 2 (4) = 11,67, a (4) = 13,28. Iz tega zaključimo, da je o-^o , o 2 o, o 1 porazdelitev o trdnosti za patentirano jeseniško žico zna¬ čilno različna od normalne in sicer s tveganjem (X = o,o2. Vsebinska analiza tega zaključka pa mora odkriti vzroke ne¬ normalnosti. 2 1°. 15. Alternativni obrazec za. izračunavanje X~~ Z enostavnim preračunom iz definicijskega obrazca za izpeljemo obrazec 114 - X 2 =f p - n (A) ki je v nekaterih primerih računsko prikladnejši kot defini¬ cijski. lo. 16. Analiza variance Analiza variance je metoda kompleksnega preskušanja hipoteze o razlikah med aritmetičnimi sredinami za več vzor¬ cev oziroma grup hkrati. Pri analizi variance primerjamo dve neodvisni oceni za varianco. Od teh je ena-s^ ocenjena iz ocen grupnih aritmetičnih sredin, druga-s| pa je ocenjena kot aritmetična sredina grupnih varianc, če se x pc grupah porazdeljuje normalno z enakimi variancami <5/- in če velja ničelna hipoteza, da so prave aritmetične sredine med seboj enake (M^ = M 2 = se P = sf/s^ 0 ) porazdeljuje v P porazdelitvi z m^ = k-1 in m .2 = n-k stopi¬ njami prostosti. Če ne velja ničelna hipoteza o enakosti aritmetičnih sredin se P značilno poveča (prekorači kritično vrednost za P), kar smatramo za znak značilnih razlik med grupnimi aritmetičnimi sredinami. Analiza variance je osnova za preskušanje hipotez o vplivih različnih faktorjev in je podlaga za posebno statistično di¬ sciplino in sicer planiranje eksperimentov. lo. 17. Enostavna analiza variance Kadar preskušamo značilnost razlik v učinku enega sa¬ mega faktorja, govorimo o enostavni analizi variance. Vpliv enega samega faktorja obračunamo z metodo analize vari¬ ance na splošno po naslednjem postopku: a) s ponovitvami na posameznih nivojih faktorja K in ustrez¬ nimi meritvami dobimo osnovno numerično gradivo za enostav¬ no analizo variance j^i = meritev za. preskušanec i pod pogojem k, - 115 b) Iz izračunamo vsote za posamezne nivoje faktorja = Szjj.^ in skupno vsoto X = SX}c i k c) Iz podatkov iz b izračunamo; OKI = SSzj^ Iz dobljenih podatkov obračunamo analizo variance po nasled¬ nji shemi: Če je izračunani P večji od kritične vrednosti za P £ m-^ = = (k-i); m 2 = (n-k)D iz tablic, so razlike v učinku faktorja K značilne. V tem primeru je smiselno analizirati diference v učinku faktorja na različnih nivojih po obrazcu Primer; Na platiščih iz treh različnih šarž smo izvedli merit¬ ve trdnosti in dobili naslednje rezultate; 116 Šarža Is 13 79 27 64 59 4o 48 25 51 59 73 69 58 Šarža 2: 71 91 43 45 73 49 114 54 84 67 98 81 85 59 65 66 66 6o 61 Šarža 3: 69 71 12 42 55 62 77 36 56 52 48 91 44 58 Iz teh osnovnih podatkov dobimo dalje Iz zgornjih podatkov izračunamo po točki c sheme s Q ki = = 19+79+27+ .....+44+58 = l86ol4 Q = X 2 /n 2 2 671 ^ 1332^ "13” 19” = 17o695 2776 2 "46"' 167526 Iz teh podatkov pa dobimo po osnovni shemi: Vir variacije Vsota kvadratov Stopinje Ocena prostosti variance Med šaržami 17o695-167526=3169 3-1=2 1584 4,45* Znotraj šarž 186 o14-17o695=15319 46-3=43 356 l,oo Skupno 18488 45 Ker je dobljena vrednost P =4,45 večja kot pa je kritična vrednost za F(2,43 = 3,2 in manjša kot je F(2,43) = 5,2, o,o5 o,ol sklepamo, da so razlike v trdnosti plastišč med šaržami zna- - 117 _ Čilne na nivoju oi = o,o5. Točkovne ocene aritmetičnih sre¬ din so: X 1 = 2 l /n l = 671/13 =51,7 X 2 = V n 2 = 1332/19 = 7o,l X 3 = X / n 3 = 773/14 = 55 » 2 Iz ocen poprečij vidimo, da je drugi postopek dal bistveno boljšo trdnost od postopka 1 in 3^in značilnost razlik med postopki izvira iz tega dejstva. Če izračunamo še interval¬ no oceno za razliko med prvim in drugim postopkom, dobimo po obrazcu M 2 - M x . 70,1 - 51,7 + 2,02 .^3 56 j 1 intervalno oceno s tveganjem = o,o5> ker je t(m=n-k = 43) 11. Statistično planiranje eksperimentov 11. 1. Cilj Osnovni cilj eksperimentiranja je ugotavljanje učin¬ kov različnih faktorjev na proučevani pojav. Izraz faktorjev so vrednosti faktorialnih znakov, TTi mor&jo biti bodisi atribu¬ ti vni ali faktorialni. Proučevani pojav je rezultativen znak, ki pa je po pravilu numeričen. Cilj statistične analize ekspe- rimetna je preskušanje značilnosti vpliva posameznih faktorjev na rezultativen znak, orodje preskušanja hipotez pa je analiza variance. Statistični plan eksperimetna omogoča na eni strani odstraniti iz obračuna vpliv določljivih a nepomembnih faktor¬ jev, ki motijo in zamegljujejo vpliv vsebinsko pomembnih fak¬ torjev. Razen tega pa skupni učinek večih faktorjev razstavlja¬ mo na vplive posameznih faktorjev kot njihovega vzajemnega učinka. - 118 - llo 2o Osnovni el ementi statističnega plena eksperimentov Učinek določenega faktorja ali kompleksa faktorjev na določen pojav je tem bolj jasen* čim manjši je vpliv slučajaostnih ali drugih individualnih vplivov, ki motijo poskus. Pri statistično pravilno planiranem eksperimentu upoštevamo opredeljivega za eksperiment nepomembne faktor- je in jih s pravilno izvedenim eksperimentom izločimo iz obračuna. Medtem ko vpliv opredeljivih^a vsebinsko nepomembnih fak¬ torjev izločimo s pravilno planiranim eksperimentom, vpliv slučajnostnih faktorjev zmanjšamo s ponavljanjem poskusa pri enakih pogojih. Sumarni vpliv slučajnostnih faktorjev je za povprečja manjši, ker je varianca poprečja iz n po¬ navljanj enaka 6'/'vi' Prav tako je razdružitev učinka večjega števila faktorjev naloga pravilnega plana eksperimenta. Tretji bistveni element statističnega plana eksperimenta je slučajnost razporeda. S slučajnostnim razporedom fak¬ torje , ki so sicer opredeljivi, a jih s planom ne izloči¬ mo, vključimo v sklop sluča jnostnih faktorjev in s tem omO' gočimo nepristranske in objektivne zaključke. 11. 3. Linearni modeli plana eksperimentov Teoretični izraz statističnega plana eksperimenta je model. Ta nakazuje, kako je rezultativen znak odvisen od vseh faktorjev, splošnih pomembnih ali nepomembnih opre¬ deljivih faktorjev in slučajnostnih. Za računsko analizo so najprimernejši linerani modeli. V njih so učinki posa¬ meznih faktorjev vezani linearno. Vzemimo, da na pojav, ka¬ terega zunanji izraz je numerični znak, vplivajo splošni vplivi (za vse eksperimentalne enote isti) nebistveni, a opredeljiv faktor B, opredeljiva in pomembna faktorja K in L in slučajnostni vplivi e. Linearni model, ki kaže, kako je rezultativen znak odvisen od posameznih komponent, je x bkli = M + (B) + (K) + (L) + e bkli (D pri čemer je : jc, = vrednost karakteristike, M = rezultat * okli splošnih vplivov, (i ') - rezultat opredel jivega^ nepomemb¬ nega faktorja 3, (K) in (1) faktorja, katerih vj)liv razisku¬ jemo, e >] s3 “ P a u ^inek slucejnostnih faktorjev pri individual¬ nem poskusu-, Če vsebina pojava ne nakazuje linearne zveze med faktorji, jih skušamo na linearni model prinesti s transformacijo. Če je vse¬ binsko upravičena multiplikativna zveza med komponentami, tak model privedemo na z logaritmiranjem. 11. 4. Slučajnostni bloki Najenostavnejši plan eksperimenta, pri katerem izklju¬ čimo en opredeljiv, a vsebinsko nepomemben faktor, so slučaj- nostni bloki. S slučajnostnimi bloki odstranimo vpliv hetero¬ genosti v eksperimentalnem materialu, heterogenosti v izvedbi poskusov, heterogenosti v produktivnosti med delavci ipd. Ta prijem v mnogih primerih doprinese k uspešnejšim rezultatom in k temu, da se standardna pogreška ocen in s tem kvaliteta zaključkov zviša, ne da bi povečali število ponovitev posku¬ sov in s tem podražili izvedbo poskusa. Pri čisto slučajnostnih blokih iz eksperimentalnega gradiva tvorimo skupine s čimbolj enotnimi pogoji. Število enot v skupini je enakor' številu nivojev pomembnega faktorja. Na vsa¬ ki taki homogeni skupini - bloku, apliciramo po en nivo fak¬ torja, katerega raziskujemo. Te faktorje apliciramo na eks¬ perimentalne enote na slučajnosten način, da se eventualna nehomogenost pri sistematični uporabi ne vmeša v učinek fak¬ torja, ampak preide v elučajnostno komponento. V tako pla¬ niranem poskusu/nehomogenost med bloki eliminirana iz obraču¬ na rezultatov poskusa, kar je cilj slučajnostnih blokov. Model eksperimenta za slučajnostne bloke enega faktorja je: x bp = M + (B) + (P) + e bp (1) Obračun analize variance pri slučajnostnih blokih pa je na¬ slednji : Po izvedenem poskusu, ki smo ga izvedli v skladu z zgornjimi - 12o navodili, razpolagamo za vsak blok b, za vsak nivo faktor¬ ja s po enim podatkom b) Iz osnovnih podatkov izračunamo vsote: = S x^ X = S X.; X = S a u b p b bp c) Iz dobljenih vsot po standardnem načinu za analizo varian¬ ce izračunamo količine q bp - f *bp » S ■ ; ? x b » Sp ■ £ 3 x p ! Q * bT l2 <2) op D p d) Iz teh količin obračunamo analizo variance po shemi: Stopinje Ocena Vir variacije Vsota kvadratov prostosti variance ( 3 ) Bloki faktor P S Ss - Q K = Qp - Q m =b-l b m = p-1 P S 2 = XI./fe P=s 2 /s 2 e P' e P e ex.pogreška K q = Q fb ~Q b ~Q f +Q m e =(b-l) (p-l) S g = K g /m g Skupno K - Q-gp - Q m = bp-1 Če se izkažejo razlike med postopki za značilne, naprej anali¬ ziramo aritmetične ocene sredin x = X /p P P Zanje je ocena standardne pogreške s£- = s / |Tp, ocena stan- p dardne pogreške ocen razlik med dvema aritmetičnima sredinama pa _. se. - = Ax 2s Te standardne pogreške služijo bodosi za preskušanje hipotez ali za Izračunavanje intervalnih ocen poprečij ali razlik 121 med poprečji* Za primer poskusa s slučajnostnimi bloki V 2 emimo analizo vzdržnosti platišč, obdelovanih pri različnih žarilnih tem¬ peraturah« Kot kazalec vzdržljivosti je vzeto število pulzacij do zloma. Poskus je predvideval tri nivoje žarilne temperatu¬ re t 1 = 45 o°; t 2 = 55© ; t = 65 o . Poskus je bil izveden v petih ponovitvah na po treh platiščih iz petih šarž, ki so vzete kot bloki. S tem skušamo elimini¬ rati vpliv šarž na vzdržljivost in tako eliminirati en dolo¬ čljiv, a nepomemben faktor iz obračuna. Iz vsake šarže so bila vzeta po tri platišča, na njih pa na slučajnostno izbranih platiščih aplicirane posamezne temperature. Hezultati poskusa so naslednji: Šarža • 1 2 3 4 5 1494 979 734 1364 1153 X A = 1536 X. = 2891 X. = 1297 5724 = X t - Nadalje dobimo: Q B3 = SS = 27oo4o6 bt Q B = ” S X B = 6919138/3 = 23o6379 Q m = r S xf = 12399386/5 = 2479877 T 5 t Q = 7 ^ X 2 = 32764176/15 = 2184278 122 , p Iz teh obračunano varianco po shemi za obračun slučajno stnih blokov Ker je kritična vrednost P(2,8) = 8,65 manjša, F(2,8) = 18,49 o,ol o,ool pa večja kot izračunani P, smaramo razlike v številu pulza- cij kot značilne v odvisnosti od žarilne temperature na nivo¬ ju oC= o,ol. To opravičuje nadaljnjo analizo razlik med po¬ sameznimi temperaturami. Iz vsot 3Cj- dobimo poprečno število pulzacij pri posameznih ža- rilnih temperaturah je: x = 3o7j x = 964i x =259 t l t 2 t 3 Maksimalni verjetnostni odklon ocen od pravih aritmetičnih sredin je d- = t ( 8 ) 3 e / (^ X t oC = o,o5 ali v našem primeru d- = 2,306 = loo x t Če želimo preskusiti značilnost razlik med x^ bimoetaf-arec, po katerem je preskusni izraz 2 in x. upora- t = x 2 -x H b _ 259 -3o7 , (/ 5 2 " llo,9 o,685 - 12 3 - Že brez tablic za kritične vrednosti sklepamo? da razlike niso značilne. 11. 5. Metoda parov Poseben primer slučajnostnih blokov je metoda parov. Po tej metodi preskušamo hipoteze in ocenjujemo razlike med postopki? kadar sta v blokih samo dva postopka. Iz splošnega linearnega modela za slučajnostne bloke * bp = M + (B) + (P) + % dobimo za prvi in drugi postopek za vsak blok x, .. = M + (B) + P. + ebp bi ± x fe2 = M + (B) + P 2 + e b2 (2) d b " x b2 “ x bl *^ P 2 " P l) + ( e b2 " * * * * S bl") Razlika vrednosti obeh postopkov v blokih d^ vsebuje razliko med postopki P 2 .-P 1 ? razlike med bloki pa iz diference izgi¬ nejo. Tako smo z diferencami en opredeljiv, a nepomemben fak¬ tor izločili in s tem dobili osnovo za preciznejše sklepe. Iz d^ moremo po znanih pravilih skonstruirati izraz S - AP ki ga uporabljamo ali za ocenjevanje razlik med postopki ali za preskušanje ničelne hipoteze H Q : A? = Pg - P^ = o. Za primer vzemimo proučevanje značilnosti razlik števila pulzacij do porušitve pri dveh različnih obtežah. V ta namen smo sedem delov plamtišč (bloki) razdelili v dva enaka dela ]j b = t (m = b -1); Ti 2 S(d b -d) s d = b -1 (3) - 124 in iz vsakega bloka za en del preskušali število pulzacij do porušitve pri eni, za drugega pa pri drugi obtežitvi. Rezultati preskusov in preskus značilnosti je naslednji: Sd b = 595 Sd b =68773 — 2 Iz zgornjih podatkov dobimo, da je d = 595:8 = 74,4, s = 35o3 in s = 59,2. d Se preskušamo hipotezo o razlikah med poprečnim številom pul- zacij pri različnih obtežbah, postavimo za ničelno hipotezo, da je Ap = o» Tako dobimo Ker je izračunani t večji kot t£m s= b - 1 ) = 3,5o in manjši kot je !;(m=7) = 5,4o zaključimo, ’da je poprečno število pul- o, ool zacij pri obeh preskušanih obtežbah s tveganjem + e t si (2) Shematično moremo v sliki nakazati interakcijo med dvema fak¬ torjema A in B v sliki - 126 - Med faktorjema A in B ni interakcije Med faktorjema A in B je interakcija 11, 9o Faktorialni poskus pxq Poskus, v katerem proučujemo dva faktorja, enega na p nivojih, drugega na q nivojih, imenujemo faktorialni po¬ skus pxq, Analiza faktorialnega poskusa pxq in faktorialnih poskusov nasploh je najenostavnejša, če je število ponovitev za vsako kombinacijo nivojev faktorjev enaka. Linearni model faktorialnega poskusa z dvema faktorjema P in Q z i ponovitvami je: x . = M + (P) + (Q) + (PQ) + e pqi pqi (D - 127 - Za tak poskus potrebujemo za vsako kombinacijo PQ*i ponovi¬ tev. Iz podatkov poskusa Xpqi z analizo variance analiziramo vpliv faktorjev po naslednjem postopku: a) Iz osnovnih podatkov eksperimenta *pqi izračunamo vsote: S X X = S X X = 3 X q P<1 <1 p P q p M S X (2) „ P<1 b) Iz osnovnih podatkov in vsot izračunamo pomožne količine: «PQI - ™ - T “ v h SX P ; q q - k c) Iz dobijenilikoličin Q analiziramo varianco po naslednji standardni shemi za analizo variance za poskus pxq ^po¬ novitvami : - 128 če ss razen čistih efektov posameznih faktorjev (P) in (Q) izkaže značilna tudi interakcija (PQ), naprej analiziramo poprečja x = - S j po. i t pqi Maksimalni vei'jetnostni odklon teh poprečij je d~ = t (m=m ) s x at e e M w maksimalni verjetnostni odklon razlike dveh poprečij pa d AJ = V PO e T Če pa je interakcija neznačilna, z njo v nadaljnem ne računa¬ mo in analiziramo poprečja x = — S X in J = ~ S X P <1 q PO. <1 P p PO. Za te ocene so ocene maksimalnih verjetnih odklonov d- = t „ (m=m ) e " d — — t v m —m ) .... ^ i. q ol e ^i.p maksimalni verjetni o#$loni dveh poprečij pa: & xp x ' s r e o u namo pomožne količine, dobimo: q t5i - ss f'ta - 68461 q t 8 - I ss 4 - 66884 tči fJ T = U SI t = 63460 Q S= TT ? 4 = 61675 « ■ T« x2 - 59254 Po shemi za analizo variance za faktorialni poskus z dvema faktorjema sledi: Če primerjamo izračunane vrednosti za P s kritičnimi vrednost¬ mi, zaključimo, da sta faktorja temperatura in čas visoko zna¬ čilna, ker so kritične vrednosti: P(3»16) = 3,24 F(3,16) = 5,29 in P(3,16) = 9,oo. c,o 5 o,ol o,ool Iz tega sledi, da se je učinek temperature pokazal značilen na nivoju O? = o,ool, učinek časa obdelave pa na nivoju £*= - o,o5. Ker je P(9,16) = 2,54 znatno večji od izračunanega P o,o5 - 131 - iz preskusa^ni razloga za trditev, da je interakcija značil¬ na, Zato v tem okviru smatramo, da je učinek temperature in časa na trdnost aditiven in da velja model X = M + (P) + (Q) Pii + e pqi 11. lo. Drugi plani eksperimentov Nakazani plani so najenostavnejši plani, ki se uporab¬ ljajo pri eksperimentiranju. Razen teh imamo še druge plane, s katerimi izločujemo več opredeljivima nepomembnih faktorjev (latinski kvadrat, grško-latinski kvadrat, changS.’o v da aritmetična sredina preskusnega vzorca le¬ ži v kritičnem območju, če bi M ustrezal osnovnim pogojem, sprejmemo hipotezo, da je M različen od osnovnih pogojev in da je do razlike prišlo zaradi bistvenega vzroka. V tem pri¬ meru proizvodnjo ustavimo, da ugotovimo vzrok izjemnega od¬ klona. V prikazani kontrolni karti so vnešeni podatki za deset kon¬ trolnih vzorcev. Od teh kontrolna karta kaže za sedmi kontrol- - 136 - ni vzorec značilno razliko in je bilo treba po sedmem vzor¬ cu odpraviti napako. Dokler so x med SKČ in ZKČ po principu preskušn ja. hipotez, ni razloga da bi sumili, da je M ^M^in zato proizvodni proces nadaljujemo. 12. 6. Normalna in poostrena kontrola Kritične meje v kontrolnih kartah postavljamo v skla¬ du z namenom kontrole z različnimi stopnjami tveganja. Pri ameriških standardih se je ustalila praksa, da iščemo kriti¬ čna področja za z = 3. Napaka prve vrste je v tem primeru 2 P = o,oo27. Včasih postavljamo meje za drugačne vrednosti , včasih pa celo kontrolne karte za različne stopnje ck hkrati. Tako h kontrolnim me jam fcTohimo ožji paa~\ M t 3<5/fu. 3 SVČ = M - in ZVČ = M + 2č/v»l , za katerega vel ja ustrezno z = 2, •X = 2P = o,c454, napaka prve vrste je torej ca 4,5 V taki karti imamo namesto dveh področij ^področja 2 .KČ Ur XV C r - 137 - Kl iy>*roš\i (J Vto S^K-O [yodrOČ(£ ^c,oW OČ /*- /fiati 6^00 ^' ^A-OC^O- 4 -!-L i-b i-h f\ 2- ^ e 7 # 9 A(<3 U 12- [% svc SKC jjoAvOojt sEcJa^*^' jv^c^j, ^ \lO-~f vCO.f 4**_0 ^CtcOvocjC- L 1,1 ^o'VA-~tvolijo \j- 5e #e para¬ meter ocenjen s povprečnim številom pojavov v preskusni proizvodnji. Primerov za porabo c-karte je veliko. Običajno kontrolni vzor¬ ci niti niso vzorci v pravem smislu (na slučajnosten način izbrano določeno število artiklov iz tekoče proizvodnje), tem¬ več more biti kot vzorec opazovanje določenega časa proizvod¬ nje, za katerega registriramo npr. število pretrgov ali napak na stroju, včasih na slučajnosten način izbrana stran teksta in je c število napak, ali določena površina tkanine in je c število napačnih vozlov, ali kompliciran mehanizem in je c število drobnih napak, ki jih najdemo na artiklih itd. 12. 12. Statistična kontrola prevzema Statistična kontrola prevzema je direktna uporaba statističnih metod preskušanja hipotez brez posebnih sprememb. Pri tem običajno preskušamo hipoteze o aritmetični sredini določenih karakteristik proizvodnje M, o variabilnosti teh ka¬ rakteristik C? in hipoteze o strukturi proizvodnje T^po kva¬ liteti, uporabnosti itd.). Te vrste kontrole vršimo v različnih fazah proizvodnje; pri prevzemanju surovin, prehodu polizdelkov iz oddelka v odde¬ lek v istem podjetju in pri kontroli gotovega blaga. Ker običajno kontroliramo, ali proizvodnja ustreza pogojem, ki jih stavlja kupec oziroma potrošnik, Imenujemo pri kon¬ troli kvalitete napako prve vrste, ki je v tem, da ustrezno proizvodnjo zavrnemo, tveganje proizvajalca , napako druge vrste, ki je v tem, da sprejmemo proizvodnjo, ki ne ustreza določenim pogojem pa tveganje kupca. Kontrolo prevzema uporabljamo pri kontroli množične proiz¬ vodnja / te jle obliki« Celotno proizvodnjo razdelimo &■.&&&& ma. pogoje proizvodnje (dnevna proizvodnja; proizvodnja- proizvede¬ na na posameznih strojih itd.) v skupine artiklov Po ' naprej določanem planu kontrole iz posamezne skupine izberemo slučaj- nostno določeno število artiklov. Glede na kvaliteto teh ar¬ tiklov posamezno skupino sprejmemo ali zavrnemo. Zavrnjene skupine prekontroliramo v celoti in v njih defektne artikle nadomestimo z dobrimi. Tako stvaren odstotek izmeta zmanjša¬ mo, ker so defektni artikli v zavrnjeni skupini nadomeščeni z dobrimi. Posamezni plani statistične kontrole prevzema ima¬ jo za osnove različne količine. Ena izmed najpogostejših je povprečen odstotek izmeta na opravljeni kontroli. Ta pa je odvisflfc/ cd kvalitete proizvodov pred kontrolo. Ce je kvali¬ teta pred kontrolo dobra, je odstotek izmeta po kontroli tudi nizek. Enako je odstotek izmeta nizek, če je kvaliteta proiz¬ vodnje pred kontrolo zelo slaba, ker v tem primeru zavrnemo razmeroma veliko število skupin, in v njih nadomestimo slabe artikle z dobrimi. Pri neki določeni kvaliteti proizvodnje pred kontrolo pa je odstotek izmeta po kontroli maksimalen. Pri vzorčnih planih je žarno razen povprečnega odstotka iz¬ meta po kontroli pomemben tudi maksimalen povprečen odstotek izmeta, ki ga dobimo pri kontroli proizvodnje, v kateri od¬ stotek izmeta srednje velik. 12 . 13„ Enojni, dvojni, trojni, sekvenoialr.i plan Pri dani velikosti kontroliranih skupin in povpreč¬ nem odstotku izmeta po opravljeni kontroli moremo najti, pri zadostni velikosti vzorca neko celo število tako, da sku¬ pino sprejmemo, če je število defektnih artiklov v vzorcu manjše ali enako C3 in zavrnemo, če je število slabih artiklov v vzorcu večje kot Cl„ Tak plan imenujemo enojni vzorčni plan. Pri velikih razlikah med stvarno in hipotetično kvaliteto od¬ krijemo razlike tudi z manjšimi vzorci. Zato se včasih obnese d vojni plan. Po tem planu v prvi fazi izberemo vzorec nj_ enot. Če je število slabih artiklov v tem vzorcu manjše ali enako C-^ skupino sprejmemo. Če je število slabih 1 9 rti ki 6 v večje ali enako C 2 skupino zavrnemo. Če pa je število slabih artiklov večje kot C]_ in manjša kot C 2 , izberemo do|>Ol'niini vzorec z, n 2 enotami. Ta vzorec je osnova za zavrnitev hi1 spre jom kot pri enostavnem planu. Če število slabih artiklov V skupngm : - 151 - vzorcu z ni + H2 enotami enako ali manjše kot skupino sprejmemo, v nasprotnem primeru pa jo zavrnemo. Če pričaku¬ jemo da so med skupinami velike razlike^je ta plan bolj eko¬ nomičen kot enojni, ker slabe skupine navadno izločimo že pri prvem vzorcu. Podobne moremo sestaviti trojni plan , pri katerem pridemo pri nekaterih vzorcih do dokončne odločitve šele pri tretjem, vzor¬ cu. Pri tem planu vzorec np enot povečamo na np + n2 enot, če ne dosežemo odločitve pri prvem vzorcu, na np + n 2 + n^ enot pa v primeru, če tudi z drugim vzorcem ne moremo skupine niti zavreči niti sprejeti. Razširitev te ideje je sekvencialni plan, pri katerem večamo preskusni vzorec za en ali za majhno število artiklov. Pri sekvencialnem planu dodajamo nove preskusne artikle toliko časa, da pridemo do odločitve, da skupino sprejmemo ali zavr¬ nemo-. Dokler pa je število slabih artiklov tolikšno, da je situacija nedoločena, nadaljujemo z večanjem vzorca. Po dolo¬ čenem številu postopkov pridemo do cilja, in sicer tem prej, čim večje so razlike med stvarnim in hipotetičnim odstotkom. Sekvencialni plan je bolj zamotan kot navaden ali dvojen, ima pa to dobro lastnost, da dovede do rezultata v povprečju z manj¬ šim številom preskusov. Zato ga uporabljamo predvsem za kon¬ trolo proizvodov, za katere je preskus predrag. 12. 14. Kot primer vzemimo tabelo iz knjige: Freeman, Friedman, Mosteller, Wallis: Sampling Inspection. Iz priroč¬ nika je vzeta tabela za kontrole skupin s 5oo-8oo enotami za primer, da pričakujemo povprečni odstotek defektnih artiklov po kontroli od 1,2$ do 2,2$, zgornjo limito povprečja defek¬ tnih artiklov po kontroli pa 2,5$ do 3,5$. 152 Tabela. Plan kontrole skupin s 5oo do 800 enotami s pov¬ prečnim odstotkom defektnih artiklov po kontroli 1 , 2 $ do 2,2$ in zgornje limito povprečja defektnih artiklov 2 do 3,5$ Skupino sprejmemo, če je število defektnih artiklov v vzor¬ cu x < Ch in zavrnemo, če je x >^C 2 . Vzorec nadaljujemo, če je Cp ^ x c C 2 . + pomeni: skupine ne moremo sprejeti pri prvem vzorcu. Če npr, iz skupine s 300 enotami po dvojnem planu izberemo np = 25 artiklov in med njimi najdemo 3 defektne, moramo vzo¬ rec glede na prejšnjo tabelo povečati ža n 2 = 5 o, ker je 1 3 4! Če najdemo v skupnem vzorcu np + n 2 =75 enot 7 defektnih artiklov, skupino glede na prejšnjo tabelo zavrnemo. Podobno je pri sekvencionalnem planu, Če iz skupine s N = 300 enotami izberemo najprej lo artiklov in izmed teh ne ajdemo nobenega defektnega, moramo vzeti nadaljnjih lo enot. če v skupnem vzorcu z 2 o enotami dobimo dva defektna artikla, mora¬ mo postopek ponoviti in vzorec povečati še za lo enot, ker je 0 <2 < 3 . Če v skupnem vzorcu s 30 enotami dobimo 3 defekt¬ ne artikle pa skupino po tretjem vzorcu zavrnemo, ker je 3 ^ 3 » Podobne tabele, kot je tabela v 12. 14 so sestavljene za raz¬ lične kombinacije povprečnega odstotka defektnih artiklov po kontroli in za različne velikosti skupin, tako da morfimo najti tabelo za vsako kombinacijo, ki je praktično potrebna. - 153 - 13. PROUČEV A NJE korelacijskih odvisnosti 13 . 1. Funkcijsfciln korelaci.iske odvisnosti Pri funkcijskih odvisnostih med x in y vsaki vred¬ nosti x ustreza ena ali nekaj točno določenih vrednosti od¬ visne spremenljivke y. Pri proučevanju množičnih pojavov tu¬ di zasledimo odvisnosti, ki pa so po svoji naravi različne od funkcijskih odvisnosti. Žilavost jekla je npr. odvisna od vsebnosti ogljika, časovna proizvodnost je odvisna od vlagal- nega časa ipd. Vendar opazimo, da te odvisnosti niso funkcij¬ ske in more biti žilavost posameznih plošč pri isti vsebno¬ sti ogljika različna. Enako je tudi s časovno produktivnostjo v odvisnosti od vlagalnega časa in z vsemi podobnimi primeri. Za take slučaje sicer opazimo zakonitost odvisnosti določene karakteristike od določenega faktorja, vendar to zakonitost opazimo le pri množičnem opazovanju, ker velja na splošno, ne pa. v individualnih primerih. Vzrok za to je stalno prisoten vpliv individualnih faktorjev, ki jih dostikrat združimo v skupen efekt vpliva slučajnostnih faktorjev. S tem, da dodat¬ ne faktorje, ki bi motili odvisnost med proučevanima znakoma držimo na istem nivoju, sicer odstranimo vpliv nekaj faktor¬ jev, ki so združeni v splošne pogoje poskusa. Vendar ni pri proučevanju nikdar mogoče docela odstraniti vpliv vseh fak¬ torjev. Zato moremo za razliko od funkcijske odvisnosti, ki jo zapišemo simbolično J = f U) (1) pisati korelacijsko odvisnost med x in y simbolično kot y = f(x,ie) (2) pri čemer pomeni e individualne ali v posebnem slučajnostne vplive. 13. 2. Prikazovanje korelacijskih odvisnosti Funkcijske odvisnosti podajamo na tri načine: a) s pravilom y = f(x), ki nakazuje, kako dobimo iz vrednosti neodvisne spremenljivke x vrednost odvisne spremenljivke y - 154 b) z nizom dvojic ustreznih vrednosti n in y, iz katerega nap:srečno dobimo vrednost y> ki ustreza dani vrednosti x c j s krivuljo v koordinatnem sistemu * v katerem vsaka točka krivulje predstavlja ustrezno dvojico vrednosti x in y. Korelacijske odvisnosti prikazujemo podobno, čeprav je njiho va narava drugačna kot narava funkcijske odvisnosti« Tako os novne podatke prikažemo z nizom, dvojic ustreznih podatkov x in y, ki se nanašata na isve enote. Pri korelaoijski odvisnosti sta namreč vrednost s in y zdru¬ ženi v dvojici vrednosti px’eko enote, na katero se nanašata. Tako imamo npr« za povezanost med vlegainim in neto časom za 5o šarž na peči V naslednje podatke; x = vlagalni čas, y = neto čas. Če je število enot veliko, pri proučevanju enega sa¬ mega znaka, sestavimo frekvenčno porazdelitev. Ta sicer sa¬ mo približno, vendar nazorno pokaže ponašanje vrednosti. Podobno je tudi pri korelaciji. Množica dvojic vrednosti je nepregledna., če je število enot veliko. Pri večjem šte¬ vilu enot je nepregleden rudi korelacijski grafikon. Kot pri proučevanju enega samega znaka, tudi pri proučevanju dveh znakov korelacijske odvisnost nazorneje prikažemo, če 155 namesto individualnih vrednosti za x in j vpeljemo razrede. Če preštejemo, koliko enot ima vrednost v posamezni kombi¬ naciji razredov za znak x in y in podatke podamo v kombina¬ cijski tabeli? dobimo korelaeijsko tabelo, Korelaeijska ta¬ bela ima vse prednosti in pomanjkljivosti frekvenčnih poraz¬ delitev enega samega znaka. S širokimi razredi zabrišemo za¬ konitosti? ozki razredi pa pove dajo obseg tabele, ki je zato nepregledna, razen tega pa se zaradi večjega vpliva indivi¬ dualnih faktorjev zabrišejo zakonitosti. Zato je izbira opti¬ malne širine razredov za analizo zelo pomembna. Da je možno v nadaljnji računski analizi uporabiti izdelane metode analize je priporočljivo, da so razredi za posamezen znak enako široki. Za primer podajamo v korelaeijski tabeli odnos med \o in ^ za jeseniško patentirano žico. 4o Odnos med in X^ Q za patentirano jeseniško žico za n = 98 preskušancev «156 \ Iz zgornje korelaeijske tabele ;]e ^^sno v&dna pozitivna in linearne, odvisnost med 3fc lo in %^ Q za jeseniško patentirano žico. Megli .20 točk iz korelacijskega grafikona v tem prime m nadomesti skupnost frekvenc, ki se pomikajo v smeri po¬ zitivna korelacije. 13® 4® Korelacija ki gr afi kon -*xv=iar**^fC--cza^n~xn.K i i. -z i1&ixc- -v ama rm n> T< » m m BiKiT.«TP »ri r.iarg-i' Iz množice parov podatkov, ki so osnova za kcrelaci sko analizo, ne moremo neposredno zaznati ali in kolika je korelacijaka odvisnost in kakšen je potek regresijske kri¬ vulje® Boljši pregled nad to množico podatkov dobimo s ko- relacijskim grafikonom? v katerem je vsak par vrednosti (x, y) prikazan s točke v pravokotnem koordinatnem sistemu Idr.ošica točk, od katerih vsaka predstavlja podatka za eno enoto, en poskus ali podobno, že določnejše nakazuje zako¬ nitosti odvisnosti od x„ V shematičnem prikazu iz slike a sklepamo, da med x in y ni odvisnosti, v sliki b je naka¬ zana med x in j š3bka linearna pozitivna odvisnost, v sli¬ ki c je razvidna tesnejša linearna odvisnost med x in y, slika d pe nakazuje krivuljčno korelacijsko odvisnost. Slika. Korelacijski grafikoni - 157 - Y naslednji sliki je prikazan korelacijski grafikon za korelacijsko odvisnost tned vlagalnim časom, in neto časom y za 5o šarž iz peči V. 9 1 S — 7- ,3 3 o s? 1 I « ja _•_ i • » i a • (o~*- -1- J_L A ^ K-ol ajcdru, Čas 3 JL 4 / / Slika. Odvisnost med vlagalnim in neto časom za 5o šarž peči V. 158 - 13 . 5. Begreaijska krivulja Za korelacijsko odvisnost smo nakazali, da jo mo¬ remo pisati simbolično y = f (x,e) (1) pri čemer pomeni y odvisen, x pa neodvisen znak, e pa re¬ zultat individualnih vplivov. Poseben primer, ki pa je zelo primeren za teoretične in praktične raziskave, je zveza y = f(x) + e ( 2 ) f Ta zveza odstopa od zgornje v tem, da. je y sestavljen iz dveh delov: f(x) in e^,od katerih f(xf) kaže učinek faktorja e pa učinek individualnih ali v $jpsebnem slučajnostnih faktorjev,, Tipično za ta primer je, da sta učinka faktorja x in individualnih faktorjev povezana aditivno. Iz te zve¬ ze moremo zaključiti, da kaže funkcija y* = fQO (3) zvezo med x in y v idealnem primeru, da ne bi bilo vpliva individualnih faktorjev. To funkcijo imenujemo regresi jako funkcijo. Če pa y’ prikažemo grafično, dobimo regresijsko krivuljo. Ena izmed osnovnih nalog regresijske oziroma ko- relacijske analize je poiskati regresijsko funkcijo. 13. 6. Mere jakosti odvisnosti Če pogledamo model kiorelacijske odvisnosti 2 v od¬ stavku 13 , 5, opazimo, da je odvisnost med x in y tem jas¬ neje razvidna, čim menjši je učinek individualnih faktor¬ jev e. V primeru korelaci jskdL odvisnosti moremo torej go¬ voriti o večji oziroma manjši odvisnosti znaka y od x, glede na razmerje jakosti vplivov proučevanega faktorja x in individualnih vplivov na y. Sumarno jakost vplivov merimo z varianco odvisnega znaka y, - 159 - ki jo moremo smatrati kot 4 (Tg_ 2 (D vsoto variance zaradi »vpliva x - <3 y / K in variance zaradi in¬ dividualnih vplivov 6k- . Čimbolj je y odvisen od x, temveč ji del skupine variance ($y je pojasnjene z odvisnostjo y od x. V ekstremnem primeru, da je med y in x funkcijska odvisnost, velja — CTy/ x - Zato moremo kot merilo jakosti odvisnosti smatrati razmerje med pojasnjeno in skupno varianco ki ga imenujemo determinacijski koeficient. Determinacijski koeficient pove,,kolikšen del skupne variance je pojasnjen z odvisnostjo y od x. Determinaci jski koeficient Ty tX leži v razmaku in je o, če y ni odvisen od x, in 1 če je odvisnost funkcijska, in je tem večji, Čim večja je odvisnost. Kot merilo odvisnosti uporabljamo tudi I x , ki je kvadratni koren iz determinaci jskega koef icienta/ul 'ect, Iz zvez 1 in 2 sledi, da je 2 ( 2 ) i O ^ Jy,* ^ 'i (3) ( 4 ) in - 16o si - o 7 '/7- ;; x ( 5 ) ^ standardni odklon "zaradi individualnih vplivov imenujemo standardno pobreško ocene , ker podaja, kvaliteto napovedi y iz regresijske krivulje y' j . 13. 7. Linearna regresija Kadar je zveza med y in x dana z modelom y c ČV + k 4 e. (D govorimo o linearni odvisnosti med x in y, ker je regresijska funkcija ( 2 ) dana z linearno zvezo med x in y. Za dan sistem dvojic vrednost x^ y. i = 1, 2 ......N, običaj¬ no vzamemo kot regresijsko premIco~tisto, za katero je vsota kvadratov odklonov stvarnih vrednosti y od vrednosti na re~ gresijski premici najmanjša ■č?Cy~y / ')*' ~ ^ a ~ b *) ~ ( 3 ) Zgornji izraz je funkcija parametrov a in b in je najmanjši, če sta parcialna odvoda po a in b enaka 0. Iz tega pogoja dobimo po metodi najmanjših kvadratov sisteme normalnih enačb ž y - N <5L -t b 2. X ^ ^ 2 - -i kvocient med kovarianco (6) e* x - >o (7) in varianco za x e *- £ ?(x- x / (8) Linearno regresijo obračunamo po standardni shemi: : L ‘- -f y x >* 4 t/, 162 Za primer odvisnosti med vlagalnim Sasom x in neto časom y dobimo po zgornji shemi: x = 13o.o9 y = 394,17 x = | = 2,6o2 y = ~ "z y = 7,883 :< 2 = 35o,4953 ~.'fx) 2 * -338,4682 - 12,o271 = o,24o542 8, * = l»o64 1 fC^ + PCx‘x;;6 t *[u + š£“jy*. ) (5) y=://[ b ocena parametra $ , y* = ocena vrednosti y na regresijski premici pri dani vrednosti x» y ocena vrednosti y v regresijskem grafikonu pri dani vrednosti x, Z )/>*- M--z ) 6 'z v _ _ ^y,\ = V /w~ 1 Po znanih odnosih in zvezah t^z in X” porazaelit^JTsledi da¬ lje ( 7 ) &xy*Sxy - Sx Sy ( 8 ) —|/ S(>^x9 v —' ^ (f^u. ® /k.~£ ") /e (9) in za dva vzorca iz dveh populacij z različnima A /V za katera je ^ e ' < ' - 166 - bartf-fe. P J \l ^/ z /A —' £ (_^ a hz-4J (lo) 2 ky,y Z & - Kf + k\ & yz yyz Ad ~ Xxz fa-4 + Ai z. ~ J T t ( 11 ) *« Pomožni izrazi K K K so znani izrazi, izračunani za vzorca 1 in 2. ^ 13 . lo. Preskušanje hipotez o regresijskih koeficientih Iz 13. S. privzeti izraz b~ fin M k (D uporabljamo za preskušanje značilnosti razlik stvarnega re- gresijskega koeficienta od hipotetične vrednosti Podobno uporabljamo obrazec lo iz 13. 8 za preskušanje zna¬ čilnosti razlik med dvema populacijama, za kateri imamo vzorca z n^ in n 2 enotami |/ Ik/,, k/i j r <■» $ri ničelni hipotezi, da ni razlik med regresijskima koefici¬ entoma namreč velja (4 0 ' a_ Po enakih principih uporabljamo tudi druge obrazce iz 13. 8 za preskušanje hipotez o parametrih za linearno regresijo in - 167 - sa določanj® intervalnih ocen. 13, 11. Proučitev linearne regresije in korelacije iz podat- fcov,"ki bo grupirani v korelacijski tabeli Podobno kot pri izračunanju aritmetične sredine in va¬ riance, tudi pri preučevanju korelacije iz grupiranih podatkov uporabljamo metodo pomožnih znakov. Ker pri korelaciji nasto - pata dva znaka (x in y), uvedemo tudi dva pomožna znaka (u in v). Pri regresijskih premicah ig merah linearne korelacije nasto¬ pajo količine x y> <5* y in C . Zato je količina, ki je po metodi u in v še ne znamo izračunati c . Ker je K = T k f uv - ~— UV UV U V K je nov/izraz % f uv. Ta izraz pa moremo izračunati dva načina U V UV (D na ( 2 f tc)v = v T J-y ali ^ v)u = z - uV v - 4 =- Cm tu fof< jv h.. «g“ j, j! v> *t* v> 'j *j ve- ve v *® *» v» }.- . ’ C l. ~ ~ H p' «3 4 * Co N 03 IV) Cm H I ! O VB -P» i.3 (-* A3| j I + ! 1 j-j H CM C/J Cm j . V)1 Vi M (O N K im ro O -P» O O 03 S Cm Cm H H H ~j yi ui vn H H , ■33 ec ro C3 cm | ro ^ H W H -f 1 '! CM » CTi C' M Cm Cm 03 CD fO co ro so ro ui cn c? H i j-M J\5 g «_J O -P> ro CD 'D CD 03 IV) CD (M c! ro jv, m C CD H IV H H H lili VT -P» Cm M i~> O H fO Cm H H H Cm H bj-ruiUl^^CDDHlM M H Cm Cm Cm i H I I CJI 03 CD O -P* O 03 fO Cm -P- -J 03 H 03 CM fO 1-» V)3 .'V*. «0 O O 03 CD 03 + I i I (— 1 I—‘ H M H I HI I ro H 03 cm o vn cd ro -p- -p* I 03 -P* -P- ro IV) H H* 0-^00030 <& CD -P- K) 03 h-’ v o v-m V „1 •p* i- c - -f 00 C IO ro ro v 0 > o-» V 9 O CM 4 * Lv V* CO -p- v» ro -p- v* 03 VI o (V) H c; c; Odnos med x n in x. za patentirano .jeseniško žico - 17o - N U 2 U I uv 98 -22 lo9 246 199 4o5 - 4,9388 + 24,4694 -121,2347 241,o612 223,4694 283,7653 L = 2,4598 C^r 2,28o3 6 =2,8877 r = o,732o xy r = o,856 *y b„ = C i K ~2Z = JiZ i K x « 0,6 233,4694 o,4 241,o612 = l,3o95 n -22 x 0 + 1 X N = 2 ’ 8 + °’ 4 # = 2 ’ 71 ° V y = y +1 — J o y n 5,1 + c,6 5, 767 y’ = y + b 1 (x - x) = 5,767 + l,39o5 (x - 2,71o) = 1,999 + 1,39 o5 t 13. 12. Vzorčne porazdelitve korelaci.jskih koeficientov iz vzorcev Za primer, da je med x in y v osnovni populaciji li' nearna regresija, s korelacijakim koeficientom ^ , je vzorčna porazdelitev korelacijskih koeficientov iz vzorcev z obsegom n precej zapletena. V splošnem so vzorčne poraz¬ delitve za ocene korelacijskih koeficientov unimodalne, - 171 - a simetrične. Simetrična je porazdelitev vzorčnih Jt le v primeru, da je ^ = o, v vseh drugih primerih pa je asimetrična. Stopnja asimetrije je tem večja, čim večji je ^ . Vzorčne porazdelitve za r iz vzorcev za nekaj vrednosti <® so prikazane v sliki Slika. Vzorčne porazdelitve za r pri populaciji z različ¬ nimi P - 172 - Za velike vzorce (n > 2oo) velja, da se r iz vzorcev poraz¬ deljuje okrog pzave vrednosti P približno v normalni poraz¬ delitvi r r •= S N(f ; L °~~ry~) (D 13» 13. Fisherjeva transformacija Z Vzoi*ena porazdelitev za r je razmeroma zapletena. R„ A, Fisher pa je dokazal, da se transformirani izraz „ ^ 1 + r Z = g*5. ± n ——— r 1 - r (D i$ r porazdeljuje v normalni porazdelitvi = * U (z p ; — ~) r * \ n - 3 ( 2 ) EZ„ = Z p„ ali AJ = o b) iz podatkov vzorca za prvo populacijo izračunamo iz vzorca z n., enotami korelaci jeki koeficient iu, iz podatkov vzorca za drugo populacijo z n 2 enotami pa kcrelacijski koeficinet c) Iz tablice r-Z noiščemo r- in r 2 ustrezni vrednosti Z in V d) dobljene vrednosti vnesemo v obrazec (D e) Če velja ničelna hipoteza, da ni razlik med korelacijskima koeficientoma, se porazdeljuje standardizirano normalne, zna¬ čilnost razlik pa preskušamo po pravilih za preskušanje zna¬ čilnosti razlik za standardizirano normalno porazdeljene ko¬ ličine. - 176 - Primero Preskušamo, ali je stopnja odvisnosti med karakte¬ ristikama JL, in C za proizvodnjo pod pogojema A in E značilno različna. V ta viamen smo izvedli meritve za j in y za n^ = lo preskušance pod pogoji A in za n-g = 53 preskušancev pod pogo¬ ji B. Dobili smo r A » o,7o = o,8o A 13 Iz tablic r-Z dobimo, da je Z. - o,87 in Z = l»lo. 5e vnesemo AJ ustrezne podatke v obrazec 1 dobimo ■Uo - o,87 = 1,33 z = lo3-3 53-3 Ker je izračunani z manjši kot kritična vrednost 1,96 smatra¬ mo, da so razlike v korelacijakih koeficientih neznačilne. 13» 18. Krivuljčna regresija in korelacija Za razliko od linerane regresije go-vorimo o krivuljčni regresiji takrat, kadar regresijska zveza med z in y ni line¬ arna ampak krivuljčna. V tem primeru na splošno regresijsko odvisnost podamo z zvezo y = g(0>O&-/^ V tej splošni funkcijski obliki je x neodvisna y odvisna spre¬ menljivka, so parametri regresijske zveze, kot sta pri linearni regresiji parametra OL in , ki določata kon¬ kretno regresijsko premico izmed vseh možnih premic, če je namesto y v regresijski funkciji n&štopa g(y)„ £ 7 x * 13. 2o. Poseben model regresijske odvisnosti Zaradi tehničnih in teoretičnih prednosti, so posebej primerne za proučevanje regresije funkcije oblike g(y) = a f (x) + a f (x) + a_f (x) + ... + a f (x) + e (1) oo li c d rr ali funkcije, ki jih je možno z ustrezno transformacijo pre¬ nesti nanjo. Posebnost te funkcije je v tem, da so parametri med seboj v linearni zvezi in da je rezultat slučajnostnih individualnih vplivov vezan z regresijsko funkcijo aditivno. Model linearne regresije je poseben primer zgornjega modela: v y = a + b(x-x) + e je g(y) = j . a 0 = a = 1 a i = b > f x ( x ) = (x-x) 13. 21. Določanje regresi .iških krivulj po metodi najmanjših kvadratov Po določitvi tipa krivulje, ki pride v poštev pri re¬ gresijski analizi konkretnih podatkov, je treba določiti nu¬ merične vrednosti parametrov regresijske funkcije. Iz vsebinskega vidika smatramo za regresijsko krivuljo tisto, ki se stvarnim vrednostim najbolj prilega. Kot kriterij za - 178 - prilagoditev je iz teoretičnih in praktičnih aspektov najpri¬ merneje vzeti pogoj, da smatramo kot regresijsko krivuljo tisto, za katero je j s(y) - Z a i f i (j) J * F ;,. s tandardnega tipa Varianco odklonov stvarnih vrednosti g(y) ■ regres, j- skih vrednosti g(y*} dobimo 7 ,e standardni tip krivulje po obrazcu CT = »o ^ gf o " *l^ gf l ' •••• a J et r) (1) parametri a, so izračunani po metodi najmanjših kvadratov. Če gre za vzorec n enot, dobimo nepristransko oceno varianc , če namesto K vstavimo število stopinj prostosti, ki ;je v tem primeru n - r — 1 , ker je n vrednosti vezanih na r + 1 zvez. Tako je ocena rezidualne variance af = ——(Sg 2 - a Sgf - a 3gf - .... - a Sgf ) (2) e n»r~l o o i x r r i standardna napaka ocene pa je kvadratni koren iz zgornjih va¬ rianc« Standardna napaka ocene ima velik pomen že samostojno kot merilo individualnih, včasih slučajnostnih vplivov, ob¬ enem pa tudi kot kazalec zanesljivosti ocen, ki jih delamo iz regresijske krivulje o g(y) ali o j na osnovi poznavanja x. 13« 23. Regresi .iški model g(y) = A + B.f(x) + e Regresijski medel, ki je poseben primer splošnega modela ( 13 , 2 o) dobimo, če vzamemoi f 0 (x) = 1 f^(x) •= f(x) jf X p «0 i — ,®«o ® ® ®« r g(y) = a + b(f(z) + e ( 1 ) V tem modelu postavimo g(y) = Y in f(x) je X. Krivuljčno re¬ gresijo med x in y obravnavamo kot linearno regresijo med X in Y, ker je Y = a + BX + e (2) Za ta primer velja vse, kar velja za linearno regresijo, tako za izračun parametrov, kot za izračun mere odvisnosti. - 18 o - Vendar koreiacijeki koeficient r^,, linearne korelacije med X in Y ni koreiacijski koeficient krivuljčne povezanosti med x in y in ga navadno pišemo kot T f( x )g(y) * Nakažimo nekaj primerov regresi jskih funkcij zgornjega tipa ali pa funkcij, ki se dajo privesti na zgornji tip funkcije , logaritemska funkcija; y* = a + blogx (3) Na linearno privedejo funkcijo s transformacijo X = logx; y = y parabola; y* = a + b \fx~ transformacija; X = x Y = y (4) hiperbola; y’ = a + b^ transformacijah = ^ Y = y (5) Razen teh funkcij, ki so dane v standardni obliki direktno, moremo nekatere pomembne funkcije privesti v tako obliko. Na primer; ekspon^lfžio funkcijo y* = a.b X (6) prevedemo z logaritmiranjem v obliko logy' = log a + xlogb (7) b Parabolieno funkcijo y = ax (8) prevedemo z logaritmiranjem v obliko logy* = log a + blogx (9) funkcijo y = -—— (lo) J a + bx prevedemo v standardno obliko, če vzamemo recipročne vrednosti ( 11 ) - 181 - Parabola oblik® y* = (a+bx) dobišgf standardno oblikoče izračunamo na levi in desni strani enačbe kvadratni koren Razen navedenih so jasno še drage funkcije* ki so bodisi že same na sebi dan® v standardni obliki ali pa jih. preve¬ demo z ustrezno transformacijo v standardno obliko,, Če rezimiramo, za take primer® proučimo regresijo in kore¬ lacijo po naslednjih stopinjah: a) Za določene tipe regresi jske funkcije se odločimo bodisi na osnovi vsebinske analize ali na osnovi analize korelacij- skega grafikonac b) Če je potrebne, regresijsko funkcijo transformiramo v ob¬ liko g(y) = A(a, b) + 3 (a,b).f(x) c) Glede na funkciji g(y) in f(r) prevedemo osnovne podatke v nove vrednosti X = f(x) in Y = g(y) d) Iz dobljenih transformiranih vrednosti X in 7 določimo regresijsko premico Y 9 = A + BX in izračunamo korelacijski koeficient d) Z obratno transformacijo iz A(ab) in £{ab) poiščemo Astrež¬ ne vrednosti osnovnih parametrov a in b in vstavimo Y’ = g(,y) in X = f(x)* Tako dobimo regresijsko krivuljo izraženo v os¬ novnih parametrih a in b in osnovnic, spremenljivkah z in y e) Korelacijski koeficient linearne korelacije med X in Y je korelacijski koeficient krivuijčne korelacije med x in y in ga pišemo r„, , , v. f(x)g(y) 2 2 ?- 13* 24» Polinom y = + a, x + a ? x + .. „ + a, v x“ kot regre- (13) sijska funkcija Pogosto vzamemo kot regresijsko funkcijo kar polinom I - 182 - stepnjs r» v katerem so funkcij« iz prejšnjega splošnega modela c«le potence spremenljivke x. f^ = X 1 . Regresi jskl model za ta primer Je 2 2 <^1 v = a + a_,x + a_x + eoo . + a x + e (1) v 0 1 2 r Sistem normalnih enačb se v tem primeru poenostavi in dobimo 2 r S = Na + a_ 8x + a„Sx + ...... + a Sx y o 1 2 r 2 r+1 (2) J o 1 2 r 2 2^4 r+2 3yx s a Sx " + a.Sx ^ + a n Sx +. . .. + a Sx J o x 2 r ■ * * ii.ii m ——■—— -— -- ■ ■ — •r p T+l 7*4.9 9 7 * Syx = a Sx + a, Sx + a„Sx~ +. + a Sx J o 1 2 r o 2r Vsote potenc od Sx do reda Sx tvori jo simetrično matriko. Če je x spremenljivka, za katero so dane vrednosti v enakih razmakih, dosežemo^transformacijo, s katero postavimo izhodi¬ šče za x v sredino, da so vse vsote lihih potenc Sx^k+1 # Tako sistem normalnih enačb znatno poenostavimo: Sy = a N a Sx*" +. a Sx r J o 2 r O - 2 Syx = a^3x ( 3 ) ker sistem razpade v dva sistema linearnih enačb, ki sta med seboj neodvisna in eden vsebuje ene, drugi pa druge parametre. 13. 25» Multipla regresija Osnovna značilnost korelacijskih odvisnosti je, da na do ločen pojav ne vpliva en sam faktor, ampak da je število teh <1 - 183 - faktorjev veliko, Keki #4 t.*'j so opredeljivi in : ' --ov vpliv zaateo, dragi pa oprede"'..,,;:: in njihov vpV ; opa 2 ii jemo kot rezultat Jžlttta&jnostnlh faktorjev, Pri prou¬ čevanju odvisnosti enega pojava od določenega faktorja, druge opredeljive faktorje držimo konstantne, Tzrck v va¬ riiranju rezultativnega snfcka je v tem primeru le prouče¬ vani faktor .-sc in slučajnostni vplivi, Te pa je dostikrat zaradi tehničnih ozirov težko, V tem primeru opredeljive, a nekontrolirane' in neevidentirane faktorje združimo skup¬ no s slučajnostnimi vplivi v individualne vplive, Jasno je, da je v takem primeru zakonitost povezanosti med x in y bolj zabrisana, ker na negotov rezultat vplivajo že dodatni - nekontrolirani vplivi. Bazen tega pa je analiza odvisnosti od enega samega faktorja v kompleksnosti delovanja različnih faktorjev, ki morejo nastopiti, omejenega pomena. Zato z multiplo regresijo proučujemo odvisnost rezultativnega znaka y od več faktorjev oziroma faktorialnih znakov hkrati. Mul¬ tiplo regresi jako odvisnost moremo napisati v splošni obliki y - F(x,, (1) V tej obliki je zapisana korelacijska odvisnost y od x 1# xg .. Cd funkcijske odvisnosti se zgornji izraz razliku¬ je v tem, da vsebuje še rezultat slučajnostnih vplivov e. Pogosto predpostavljamo, da so vplivi opredeljenih faktorjev in individualni vplivi vezani aditivno. 7 tem primeru je me¬ del multiple regresije y — F (x.j») + e (2) 13. 26. Mu ltipla linearna regresija Linearno odvisnost enega faktorja moremo poslošiti na več faktorjev. Muitipli linearni regresijski model je: + b x + e P P (U ^ - *o + Vi + b 2*2 + - 184 - regresijska ravnina v p + 1 v dimenzionalnem prostora pa je y 9 = a o 4- 4 4 4 a s P Obravnavanje multiple linearne regresije je enostavnejša, če namesto osnovnih znakov y, uvedemo standardizirane znake z = y i = 1 , 2 ....p (2) Regresijska ravnina je v tem primeru z y = a o + Vi + V 2 + . + Vp (3) Opomba: parametri a Q v 3 so drugi kot v 1. 13. 27. Položitev parametrov linearne regresije po metodi najmanjših kvadratov Kot pri krivuljčni regresiji, tudi pri multipli re¬ gresiji uporabljamo za kriterij prilagoditve vsoto kvadratov odklonov sttt*rnih vrednosti y od vrednosti y’, ki jih dobimo z regresijsko funkcijo S(y - y* ) 2 (1) in vzamemo za regresijsko ravnino tisto, ki se danim podatkom najbolje prilega. Če upoštevamo, da za standardizirane znake na splošno velja: 2 —— z = o ; z =1 in z. z. = r. . 1 j ij dobimo po metodi najmanjših kvadratov naslednji sistem nor¬ malnih enačb: 185 - a ■ o ( 2 ) Če zadnjim p normalnim enačbam (prva je degenerirana in sa¬ mo nakaže, da gre regresijska ravnina skozi izhodišče koor¬ dinatnega sietema standardiziranih odklonov ali skozi točko, ki ima za koordinate aritmetične sredine (y» 5^ , x ), dodamo še enačbo za regresijsko ravnino ^ p z = b. z, + b.z_ + b .z + y 1 1 2 2 3 3 + b z P P dobimo, da je homogen sistem p + 1 linearnih enačb netrivi- alno rešljiv, če velja, da je determinanta -O enaka nič.Tako je na splošno napisana v obliki determinante regresijska ravnina. Če z D zaznamujemo poddeterminante prve vrste, je enačba regresi jske ravnine z’ D + z. D_+z 0 D 0 -f,. < ,.t-zD y yy 1 yl 2 y2 f P yp = 0 A*- \ \ er; - 186 - ali eksplicitne D v? 1 z D z i yy fzi 3 ) yy D .JLE z D p yy regresi jaki koeficientih,. so torej enaki koeficientom pod« determinant -D 4 b = D i D TJ 13. 28„ Determinacijski koeficient za multiplo linearno korelacijo Z determinantami moremo izraziti determinacijski koe¬ ficient za multiplo linearno korelacijo z naslednjo zvezo R y.12...p = 1 - D pri čemer je D D yy D ^ pa poddeterminanta, ki ustreza prvemu členu v prvi vrsti v*determinanti D. Kvadratni koren iz determinacijskega koefi¬ cienta R pa je multipli korelacijski koeficient. 13. 29. Multipla regresija in linearna korelacija za odvis¬ nost y od dveh faktorjev 5e upoštevamo splošne zakonitosti, je multipla regre- - 187 - si jaka ravnina za odvisnost y od dveh faktorjev dana s funkcijo v — v 1 1 2 2 eL ~—= b , _ - + b čt; y4*2 y2.1 (D pri čemer so b yl.2 ~ 4- & . r v2 “ r yl r 12 ( 2 ) 1 - r 12 Determinacijaki koeficient Ry e i2 3 e P° splošnem obrazcu enak R y.i2 2 2 r . + r 0 - 2.r _r 0 r-. Q vi v 2 _ yl y2 12 1 - r 12 ( 3 ) standardna napaka ocene za y pa je dr. y.i2 = (T V 1 “ R '7 y. 12 (4) Za multiple regresije in linearne korelacije z več neodvis¬ nimi spremenljivkami pa je najbolje izračunati ustrezne ko¬ ličine prek determinant. 13. 3o. Multipla parabolična regresija in korelacija Podobno kot pri proučevanju enega znaka moremo tudi pri multipli regresiji razširiti proučevanje na nelinearne odvisnosti. Najnavadnejša je razširitev na kvadratično funk¬ cijo. Ta ima za primer odvisnosti rezultativnega znaka y od dveh faktorialnih znakov in naslednji model y ‘ a + Vi + V2 + Vi + 20 l'A*2 + C 22*2 * e (1) Ta model ima šest parametrov. Se si geometrijsko ponazorimo - 188 regresijake ploskev (ge v zgornjem modelu izpustimo a.)» je to ploskev drugega reda* Matrika količin, ki so potrebne za izračun parametrov kva¬ drati Sne regresi jske funkcije po metodi najmanjših kvadra¬ tov preko normalnih enačb je V tej matriki so vsi nepodčrtani izrazi ponovljeni in zato ni treba izračunati 6.7 = 42 členov matrike, ampak jih je med seboj različnih le polovica t.j. 21. Analogno multipli ali krivuljčni regresiji moremo izračunati multipli determinacijski koeficient bodisi preko ustreznih determinant ali preko obrazca ^y,12 “ N - C i2 Syx l x 2 Sy 2 - aSy - " ° 22 Sy *2 ] -C- Ll Syx 2 1 ( 3 ) Se gre za ocenjevanje z vzorcem, nadomestimo v obrazcu N s stopinjami prostosti n - 6. Za kvadratično krivuljSno regre¬ si jsko ploskev pogosto nastopi vprašanje vrednosti faktorjev X]_ in Xg» ki dajo ekstremno (minimalno ali maksimalno vred¬ nost) za odvisno spremenljivko. - 189 - Z oddajanjem regresijske krivulje dobimo, da morata za ta primer in x 0 zadoščati pogojema b l * * 11*1 * c 12*2 = ° b 2 + ° 12 X 1 * 2 o 22 I 2 = 0 ki jih dobimo tako, da postavimo prve parcialne odvode po in enake o. 3-3. 31. Parcialna korelacija Korelacijske odvisnosti nastopajo kompleksno. Pri analizi korelacijskih odvisnosti zato opazimo, da ni nujno, da sta med seboj v odvisnosti zaradi tega, ker vplivata eden na drugega neposredno, temveč se dostikrat zgodi, da se po¬ kaže odvisnost med pojavoma 1 in 2 zaradi tega, ker isti faktor o ali celo sklop istih faktorjev, katere zaznamujemo kar s skupnim simbolom A, vplivajo tako na pojav 1 kot na pojav 2 in se zaradi tega pokaže posredno korelacijska odvis¬ nost med 1 in 2. Korelacijo med pojavoma 1 in 2 brez posred¬ nega učinka vzajemnega faktorja o imenujemo parcialno kore¬ lacijo. Parcialno korelacijo proučujemo tako, da predhodno iz učin¬ kov pojava 1 in 2 in *2 izločimo vpliv faktorja o in pro»- učujemo korelacijo med znakoma x^ >0 in o’ i z katerih smo vpliv posrednega faktorja eliminirali. Podobno je v primeru,, če eliminiramo posreden vpliv spleta faktorjev "A"^roučujemo korelacijo med x liA in x 2A , t0 iz P odatkov » iz katerih smo izločili vpliv kompleksa vzajemnih faktorjev A. 13. 32. Linearni parcialni korelacijski koeficient Ker je eliminacija vplivov razmeroma zamotana, se pri proučevanju parcialne korelacije običajno omejimo na elimina- cijo*učinka faktorjev. Če iz pojavov 1 in 2, katerih numeri¬ čni izraz sta znaka x^ in x 2 ^eliminiramo linearen vpliv vza¬ jemnega faktorja o, katerega numerični izraz je znak x Q , do¬ bimo parcialni korelacijski koeficient med 1 in 2, iz katerih je eliminiran linearni učinek pojava o. livua/L^ - 19o - Za c s.*: primer j« možno izračunati parcialni korelaci ;jski koeficient 2 % _ ^ po obrazcu 12 o 0 ^ iz navadnih korelacijakih koeficientov. Po obrazcu '12. A r ol.A r o2.A 12 o pA 1 - r ol.A* 1 - r o2. A ( 2 ) izračunamo parcialni korelacijski koeficient med pojavoma 1 ir. 2, iz katerih smo eliminirali faktor o in kompleks faktorjev A, če poznamo parcialne korelacijske koeficiente r l2 A* r ol A r o A iz ka ' fcerih eliminiran samo kompleks A, Jako moremo pr?H postopno do parcialnih korelaci jskih koeficientov, iz katerih eliminiramo poljubno število posred nih faktorjev iz navadnih korelacijskih koeficientov. 13« 33» Zveza med multiplim linearnim koeficientom H y. 12... p in parcialnimi korelaci.iškimi koeficienti Analitično pomembna je zveza med multiplim linearnim korelacijakim koeficientom Ry.l2. ro „p in parcialnimi korela¬ ci jakimi koeficienti r yl , r y2 "i**III.. r yp>123# ..( p _i) 000 P )»(1-r 2 y2.l ^ 1-r yp.l2... (p-1) ^ Delež nepojasnjene variance pri multipli korelaciji je enak produktu deležev nepojasnjene variance s parcialnimi korela¬ ci jskimi koeficienti. NARODNA IN UNIVERZITETNA KNJIŽNICA 00000033332 ^w<