Boštjan Rode, dipl. inž. Železarna Ravne DK: 519.28 : 681.142 ASM/SLA: S12; U4k Analiza statistične porazdelitve na elektronskem računalniku Članek obravnava normalno porazdelitev. Pri testiranju normalnosti je podana praktična metoda za izračun količine x2. Metoda je uporabna za izračun na elektronskem računalniku. V članku se opis priprave podatkov in tolmačenje rezultatov nanaša na program za analizo porazdelitve, izdelan na računalniku Zuse Z-23. UVOD Metode matematične statistike so namenjene objektivnemu prikazovanju in tolmačenju raznih pojavov, ki so izpostavljeni številnim vplivom. Ti vplivi so v zvezi s surovinami, stroji, napravami, z ljudmi itd. Zaradi teh vplivov je vsak proces, vsak izdelek s svojimi lastnostmi in vsako merjenje izpostavljeno nihanju, ki je v odvisnosti od jakosti vplivov — ustaljenosti ali točnosti — večje ali manjše. Absolutne točnosti — npr. izdelave delov s točno enakimi merami brez razlik — sploh ni mogoče doseči, četudi pri meritvi ugotovimo enake mere, bi nam natančnejše merjenje pokazalo razlike. Nekatere od teh vplivov, ki povzročajo nihanja, smatramo za dovoljene, druge pa za nedovoljene. Naloga analize porazdelitve je prav to, da nam pove, kakšne so lastnosti procesa ali izdelka, s kakšnim povprečjem lahko računamo in kakšna nihanja moramo normalno pričakovati. Pri tej analizi moramo ugotoviti, ali so nihanja normalna — dovoljena ali nenormalna — nedovoljena. Normalna nihanja so tista, ki jih povzročajo vplivi, katerih ne moremo poznati in kontrolirati. Take vplive imenujemo slučajne in torej tudi nihanja, ki jih ti vplivi povzročajo, pripisujemo slučaju. Z analizo porazdelitve želimo nihanja le podrobneje spoznati in ugotoviti njihove meje — prirodne tolerance. Če ugotovimo, da je porazdelitev nenormalna, pravimo, da nihanje povzročajo nedovoljeni — neslučajni vplivi. To so vsi tisti, ki jih na kakršen koli način lahko identificiramo (in jih tudi moramo identificirati!), kontroliramo, odpravimo in v bodoče preprečimo, ali pa vsaj zmanjšamo jakost njihovega vpliva. Nekatere vplive bi lahko ugotavljali in merili, pa bi včasih bilo to predrago ali zaradi določenih vzrokov neizvedljivo. V takih primerih nočemo podrobno poznati in kontrolirati teh vplivov in jih želimo pripisati kar slučajnim vplivom ter jih s tekočo statistično kontrolo držati v nekih razumnih in dovoljenih mejah. Naloga statistične analize porazdelitve je le v tem, da s primernimi metodami ugotavlja normalnost porazdelitve, da opozarja na pojave nedovoljenih nihanj pod vplivom nedovoljenih faktorjev ter da ugotavlja vse karakteristike porazdelitve. Naloga strokovnjaka pa je, da rezultate statistične analize izkoristi in pravilno ukrepa. Iz zbranih podatkov najlaže naredimo analizo porazdelitve s pomočjo elektronskega računalnika. Za to pa je treba sestaviti poseben program, po katerem računalnik računa. V železarni Ravne smo tak program razvili ob podatkih za različne mešanice livarskih peskov. Praktično uporabo rezultatov tega programa podaja članek inž. Lenasija: Statistična analiza livarskih surovin. Glavni namen članka je na primeru analize porazdelitve pokazati uporabnost računalnika pri reševanju praktičnih problemov. Zato so podana podrobna navodila za pripravo podatkov in tolmačenje rezultatov. Za razumevanje programa so v članku na praktičnih primerih razloženi osnovni statistični parametri in lastnosti normalne porazdelitve. OSNOVNI STATISTIČNI PARAMETRI Vzemimo 2 primera, od katerih je vsak značilen za eno metodo statistične obravnave. 1. Primer: Pri raztržnem preizkusu desetih žic smo ugotovili ob porušitvi sledeče sile v kp; 262 259,5 258,5 258 259,5 258,5 258,5 259,5 270 265 Vrednosti označimo po vrsti s črkami Xi, X2____Xio, pri čemer naj X; pomeni poljubno od desetih vrednosti. 2. Primer: Izmerili smo po Rockvvellu trdote za 203 probe brzoreznega jekla v popuščenem stanju. Natančnost meritev je 0,5 HRC. Zato je npr. vrednost 64,5 HRC v resnici ena od vrednosti v razredu od 64,25 do 64,75 HRC in predstavlja v tem primeru sredino razreda oz. območja. Pri meritvah beležimo s frekvenco f; pogostost pojavljanja posameznih vrednosti, ki pripadajo določenemu območju — razredu. Meje razredov, sredine razredov in frekvence so za primer podane v tabeli 1. Tabela 1 i Razred (HRC) Sredina razreda fi Kfi f«% Kfi % 1 62,75—63,25 63 3 3 1,5 1,5 2 63,25—63,75 63,5 10 13 5 6,5 3 63,75—64,25 64 59 72 29 35,5 4 64,25—64,75 64,5 63 135 31 66,5 5 64,75—65,25 65 46 181 22,5 89,0 6 65,25—65,75 65,5 19 200 9,5 98,5 7 65,75—66,25 66 3 203 1,5 100 Izračunajmo za naša dva primera osnovne statistične parametre: Aritmetična srednja vrednost V statistiki nas najprej zanima aritmetična srednja vrednost množice števil. Za 1. primer to izračunamo po obrazcu za aritmetično sredino n števil Xi, X2.....Xn X = Xi + X2 + .... + X„ n [2.1.1] V našem prvem primeru je n = 10 in je aritmetična srednja vrednost X = 262 + 259,5 265 10 260,9 (kp) V praksi X imenujemo kar srednja vrednost. Obrazec [2.1.1] lahko pišemo še v drugi, skrajšani obliki: X = 1 n X; [2.1.2] i = I V 2. primeru srednjo vrednost izračunamo po obrazcu X = fi X, + f2 X2 + .... + fk xfc n [2.1.3] k = število razredov, v našem drugem primeru 7 n = število vseh meritev, v našem drugem primeru 203 Xi, X:----Xk so sredine razredov 63; 63,5;____66 fi.fi----fk so frekvence posameznih razredov f i + f2 + .... + fk = n [2.1.4] V našem drugem primeru so to števila 3, 10,----, 3, ki so navedena v tretji koloni tabele 1. Za 2. primer dobimo 3 . 63 + 10 . 63,5 + .... + 3 . 66 X = 203 = 64,5 Obrazec (2.1. 3) lahko pišemo tudi v obliki k X = > f,X.. [2.1.5] k = n 5 ** i = 1 Za računanje brez strojev so še drugi obrazci, ki pa jih ne bomo navedli, ker imamo skoraj vedno na razpolago računske stroje. Posebno pripraven je olivetti — divisuma 24, ki po obrazcu [2.1.3] računa brez prekinitve. Standardna deviacija Poleg aritmetične sredine nas v statistiki zanima še odstopanje od te aritmetične sredine oz. srednje vrednosti. Naj bo X aritmetična srednja vrednost števil Xi, X2,.... Xn Izračunajmo razlike X —Xzai = 1,2 ... .n in jih kvadrirajmo (X; —X)2zai = 1,2____n Aritmetično srednjo vrednost množice kvadratov razlik označimo s a2 in jo imenujemo varianca. ff2 =(Xi — X)*+ (X2-X)2+ .... + (X„ - X)2 _ n n 1 n (X, —X)* [2.2.1] i = 1 Za 1. primer je po vstavljanju vrednosti X; in izračunane vrednosti X , 1,P + 1,42 + .... + 4,P ff2 =-^--= 13,24 (kp2) Bolj zanimiva je vrednost a, ker ima enako dimenzijo kakor X. Vrednost imenujemo standardna deviacija ali povprečni odklon. Iz obrazca (2.2.1) sledi obrazec za a <7 = 1 n (X;-X)2 [2.2.2] i = I Za naš 1. primer je tr = V 13,24 = 3,64 (kp) V 2. primeru, ko nastopajo frekvence, imamo obrazec T2 = f, (X, —X)2 + f2 (X2—X)2 + ... + fk (Xk—X)2 Za standardno deviacijo dobimo obrazec [2.2.3] kjer imajo k, n, f; in X; isti pomen kot v obrazcu [2.1.3] cr - 1 n f; (Xj— X)2 [2. 2.4] i = 1 3.(63- aL = Izračunajmo najprej za 2. primer - 64,5)2 + 10 . (63,5 — 64,5)2 + ... + 3 . (66 — 64,5)2 3 . 1,52 + 10 .12 + . 203 + 3 . 1,52 203 cr = V 0,314 = 0,56 (Rc) Hitro lahko dokažemo, da lahko varianco <72 in zato tudi Frekvenca fi f> % Kumulativna frekvenca Kfi Kfi % 1 156,5—159,5 158 1 0,6 1 0,6 2 159,5—162,5 161 3 1,9 4 2,5 3 162,5—165,5 164 4 2,5 8 5,0 4 165,5—168,5 167 21 13,1 29 18,1 5 168,5—171,5 170 16 10,0 45 28,1 6 171,5—174,5 173 29 18,1 74 46,2 7 174,5—177,5 176 31 19,4 105 65,5 8 177,5—180,5 179 21 13,1 126 78,7 9 180,5—183,5 182 18 11,3 144 90,0 10 183,5—186,5 185 9 5,6 153 95,6 11 186,5—189,5 188 5 3,1 158 98,7 12 189,5—192,5 191 2 1,3 160 100,0 Vsota 160 100,0 X = — (158 . 1 + 161 .3 + 160 (0,01 mm) 191 .2) = 175,12 158 16! 164 167 170 173 176 179 182 185 188 191 X [0,0] mm7 Slika 2 Iz tega diagrama ugotovimo, koliko odstotkov izmerjenih vrednosti je manjših od določene vrednosti. Npr. 28,1 lo/o izmerjenih debelin je manjših od 1,715 mm. Po obrazcu [2. 2. 6] bi najlažje izračunali standardno deviacijo s pomočjo računskega stroja (npr. Olivetti divisuma 24), ker že poznamo X. cr = 6,49 (0,01 mm) Pri histogramu našega primera opazimo neko posebno obliko stopnic. Z večjim številom meritev bi dobili še bolj simetrično obliko histograma, še bolj bi se stopnice ujemale s črtkasto krivuljo. Podobno obliko histograma dobimo tudi pri drugih meritvah neke fizikalne količine proizvodov iz istega proizvodnega procesa. V drugem primeru, ko smo izbrali podatke trdot za 203 probe brzoreznega jekla v popuščenem stanju, bi iz tabele 1 dobili histogram na sliki 4, kjer je vrisana tudi poligonska krivulja. 159.5 162J5 165,5 168,5 171,5 174,5 177,5 I8Q5 183,5 186,5 1895 192,5 x[Q01mm] Slika 3 Po formuli [2.1.3] izračunamo za ta primer srednjo vrednost s podatki iz tabele 3. Tabela 3 T- \ -V 63 63,5 64 64.5 65 655 66 -- Trdota [rc] Slika 4 Normalna krivulja Ordinate normalne krivulje Slavni matematik K. F. Gauss je odkril krivuljo, ki se stopnicam oz. poligonski krivulji v praktičnih primerih najbolj približa. To krivuljo imenujemo Gaussovo ali normalno. V koordinatnem sistemu x, y ima krivulja naslednjo obliko: (T V 2iz . e [3.2.1] •n = 3,14159......število iz geometrije e = 2,71828 ......osnova naravnih logaritmov X = srednja vrednost a = standardna deviacija Enačba [3.2.1] v splošnem zavisi od X in (t) t ,00 ,01 ,02 ,03 ,04 ,05 ,06 ,07 ,08 ,09 0,0 0,3989 3989 3989 3988 3986 3984 3982 3980 3977 3973 0,1 0,3970 3965 3961 3956 3951 3945 3939 3932 3925 3918 0,2 0,3910 3902 3894 3885 3876 3867 3857 3847 3836 3825 0,3 0,3814 3802 3790 3778 3765 3752 3739 3725 3712 3697 0,4 0,3683 3868 3653 3637 3621 3605 3589 3572 3555 3538 0,5 0,3521 3503 3485 3467 3448 3429 3410 3391 3372 3352 0,6 0,3332 3312 3292 3271 3251 3230 3209 3187 3166 3144 0,7 0,3123 3101 3079 3156 3034 3011 2989 2966 2943 2920 0,8 0,2897 2874 2850 2827 2903 2780 2756 2732 2709 2685 0,9 0,2661 2637 2613 2589 2565 2541 2516 2492 2468 2444 1,0 0,2420 2396 2371 2347 2323 2299 2275 2251 2227 2203 1,1 0,2179 2155 2131 2107 2093 2059 2036 2012 1989 1965 1,2 0,1942 1919 1895 1872 1849 1826 1804 1781 1758 1736 1,3 0,1714 1691 1669 1647 1626 1604 1582 1561 1539 1518 1,4 0,1497 1476 1456 1435 1415 1394 1374 1354 1334 1315 1,5 0,1295 1276 1257 1238 1219 1200 1182 1163 1145 1127 1,6 0,1109 1092 1074 1057 1040 1023 1006 0989 0973 0957 1,7 0,0940 925 909 893 878 863 848 833 818 804 1,8 0,0790 775 761 748 734 721 707 694 681 669 1,9 0,0656 644 632 620 608 596 584 573 562 551 2,0 0,0540 529 519 508 498 488 478 468 459 449 2,1 0,0440 431 422 413 404 396 387 379 371 363 2,2 0,0355 347 339 332 325 317 310 303 297 290 2,3 0,0283 277 270 264 258 252 246 241 235 229 2,4 0,0224 219 213 208 203 198 194 189 184 180 2,5 0,0175 171 167 163 158 154 151 147 143 139 2,6 0,0136 132 129 126 122 199 116 113 110 107 2,7 0,0104 101 99 96 93 91 88 86 84 81 2,8 0,0079 77 75 73 71 69 67 65 63 61 2,9 0,0060 58 56 55 53 51 50 48 47 46 3,0 0,0044 43 42 40 39 38 37 36 35 34 3,1 0,0033 32 31 30 29 28 27 26 25 25 3,2 0,0024 23 22 22 21 20 20 19 18 18 3,3 0,0017 17 16 16 15 15 14 14 13 13 3,4 0,0012 12 12 11 11 10 10 10 9 9 3,5 0,0009 4,0 0,0001 Tabela 5 Sredina razreda Xi Xi —X Xi —X ----=t a (—t,). Argument — ti smo vzeli zato, ker je funkcija $ tabelirana le za pozitivne vrednosti. Ce bi bila tudi točka ti na desni strani od 0, potem sprememba znaka ne bi bila potrebna, pač pa bi morali vrednost $ (ti) odšteti od vrednosti O (t2). Najbolje si to predstavljamo na sliki 6. Sedaj nas zanimajo ploščine, ki so simetrične na os skozi t = o in je ti negativen, t2 pozitiven, po velikosti pa sta enaka. Ploščina ima vrednost 2 0(t2). Za t2 je 1, 2, 3 narišemo ustrezne ploščine 2 (t2). Na sliki 8 smo namesto 2 O (t2) pisali vrednosti v odstotkih, to je 2 (p (t2) . 100 «/0. Slika 8 Ploščina pod normalno krivuljo med ordinatama za Xi in X2 nam pove odstotke vseh vrednosti populacije, ki leže v imejah med Xi in X2. Naredimo tabelo, ko so meje Xi in X2 simetrične na vrednost X in imajo medsebojno razdaljo 2 cr, 4 a in 6 cr. Vrednosti t za te meje so ±1, ± 2 in ± 3. V tabeli 6 podajamo teoretični odstotek vseh vrednosti populacije, ki leže v določenih mejah, in pa odstotek vseh vrednosti, ki leže v istih mejah, v našem drugem in tretjem primeru. Tabela 7 nam za meje X ± a pove, da v povprečju lahko med 1000 slučajno izračunanimi vrednostmi iz populacije pričakujemo 683 vrednosti znotraj mej X ± cr in 317 zunaj teh mej. Ali ,05 ,06 ,07 ,08 ,09 0,0 0,0000 0040 0080 0120 0,1 0,0398 0438 0478 0517 0,2 0,0793 0832 0871 0910 0,3 0,1179 1217 1255 1293 0,4 0,1554 1591 1628 1664 0,5 0,1915 1950 1985 2019 0,6 0,2257 2291 2324 2357 0,7 0,2580 2611 2642 2673 0,8 0,2881 2910 2939 2967 0,9 0,3159 3186 3212 3238 1,0 0,3413 3438 3461 3485 1,1 0,3643 3665 3686 3708 1,2 0,3849 3869 3888 3907 1,3 0,4032 4049 4066 4082 1,4 0,4192 4207 4222 4236 1,5 0,4332 4345 4357 4370 1,6 0,4452 4463 4474 4484 1,7 0,4554 4564 4573 4582 1,8 0,4641 4649 4656 4664 1,9 0,4713 4719 4726 4732 2,0 0,4772 4778 4783 4788 2,1 0,4821 4826 4830 4834 2,2 0,4861 4864 4868 4871 2,3 0,4893 4896 4898 4901 2,4 0,4918 4920 4922 4925 2,5 0,4938 4940 4941 4943 2,6 0,4953 4955 4956 4957 2,7 0,4965 4966 4967 4968 2,8 0,4974 4975 4976 4977 2,9 0,4981 4982 4982 4983 3,0 0,4987 4987 4987 4988 3,1 0,4990 4991 4991 4991 3,2 0,4993 4993 4994 4994 3,3 0,4995 4995 4996 4996 3,4 0,4997 4997 4997 4997 3,5 0,4998 4,0 0,49997 4,5 0,499997 5,0 0,4999997 Tabela 7 t Meje X ± ter Teoretično 2 (t) . 100 2. primer % od n = 203 3. primer % od n = 160 1 2 3 X ± £7 X ± 2cr X ± 3 cr 68,3 «/0 95,44% 99,73 «/0 80 »/o 97 % 100 o/o 65 Vo 95,6 »/o 100 »/o Odstotek je za tretji primer izračunan iz tabele 2' pred združitvijo v razrede. drugače povedano, da je verjetnost, s kakršno neka vrednost iz populacije leži v mejah X ± cr, enaka 683: 317, kar je več kot 2:1. Tako za meje X ± 3 cr dobimo verjetnost 27 : 10.000, da leži vrednost iz populacije zunaj mej X ± 3 cr. To tudi 0160 0199 0239 0279 0319 0359 0557 0596 0636 0675 0714 0753 0948 0987 1026 1046 1103 1141 1331 1368 1406 1443 1480 1517 1700 1736 1772 1808 1844 1879 2054 2088 2123 2157 2190 2224 2389 2422 2454 2486 2517 2549 2704 2734 2764 2794 2823 2852 2995 3023 3051 3078 2106 3133 3264 3289 3315 3340 3365 3389 3508 3531 3554 3577 3599 3621 3729 3749 3770 3790 3810 3830 3925 3944 3962 3980 3997 4015 4099 4115 4131 4147 4162 4177 4251 4265 4279 4292 4306 4319 4382 4394 4406 4418 4429 4441 4495 4505 4515 4525 4535 4545 4591 4599 4608 4616 4625 4633 4671 4678 4686 4693 4699 4706 4738 4744 4750 4756 4761 4767 4793 4798 4803 4808 4812 4817 4838 4842 4846 4850 4854 4857 4875 4878 4881 4884 4887 4890 4904 4906 4909 4911 4913 4916 4927 4929 4931 4932 4934 4936 4945 4946 4948 4949 4951 4952 4959 4960 4961 4962 4963 4964 4969 4970 4971 4972 4973 4974 4977 4978 4979 4979 4980 4981 4984 4984 4985 4985 4986 4986 4988 4989 4989 4989 4990 4990 4992 4992 4992 4992 4993 4993 4994 4994 4994 4995 4995 4995 4996 4996 4996 4996 4996 4997 4997 4997 4997 4997 4997 4998 pomeni, da le eno vrednost od 370 vrednosti lahko pričakujemo zunaj mej X ± 3 a. Odstopanje za ± 3 cr od srednje vrednosti zato imenujemo pri-rodna toleranca. Lastnosti populacije, ki ima normalno porazdelitev, so naslednje: — Majhna odstopanja od srednje vrednosti se pojavljajo pogosteje kot večja, ker ima normalna krivulja zvonasto obliko. — Zelo velika odstopanja se pojavljajo redko ali z majhno verjetnostjo, ker se krivulja tesno prilega osi x že pri malo večjem t. — Pozitivni in negativni odkloni iste velikosti se pojavljajo enako pogosto, ker je krivulja simetrična. Kumulativna krivulja in verjetnostna mreža V koordinatnem sistemu naj bodo na osi X spet pozitivne in negativne vrednosti spremenljivke t. Na osi y pa bomo merili ploščino pod normalno krivuljo v odstotkih. Tako dobimo kumulativno krivuljo normalne porazdelitve. (Slika 9) Slika 9 Vrednost ordinate kumulativne krivulje v točki t je enaka ploščini pod normalno krivuljo od — °o do t. Zaradi nepraktičnega risanja kumulativne krivulje sta Daeves in Beckel izdelala grafičen postopek, ki prevede kumulativno krivuljo v premico, če skalo na osi y spremenimo na sledeč način: Skozi izhodišče potegnemo premico, ki seka kumulativno krivuljo v točki za t = 0. Ordinate s krivulje vertikalno prenesemo na premico in tako dobimo novo skalo na osi y. Le vrednost 50 ostane na svojem mestu, (slika 10) Konstrukcija mreže verjetnosti Slika 10 Tako nastalo mrežo imenujemo verjetnostna mreža. Vidimo, da je verjetnostna mreža v sredi bolj gosta, proti vrhu in navzdol pa se razširi. (Verjetnostno mrežo izdelujejo v inozemstvu prav kot logaritemsko mrežo ali milimetrski papir. Pri nas je še ne tiskajo, zato je Železarna Ravne za svoje potrebe naročila posebno tiskanje verjetnostne mreže pri Mariborski tiskarni.) Na levi strani mreže je označena skala v odstotkih, na desni pa so vrednosti, imenovane probit (t + 5), ki jih izračunamo iz tabele 7, tako da vrednost v procentih iz tabele delimo z 2 in prištejemo 50 %. Na primer: t = 2, Probit t + 5 = 7 95,44 : 2 = 47,72 + 50 = 97,72 °/0. Probit 7 ima to ordinato. (Glej sliko 11.) Na os x nanesemo vrednosti, ki v dani populaciji nastopajo, tako da skala obsega vse možne vrednosti. S pomočjo verjetnostne mreže je mogoče: a) ugotoviti, ali je opazovana porazdelitev normalna, ali pa se vsaj dovolj približuje normalni, b) na grafični način določiti srednjo vrednost in standardno deviacijo, c) rešiti probleme določanja ali ocenjevanja toleranc. Uporabimo verjetnostno mrežo: Najprej na spodnjem robu mreže označimo vrednosti, ki določajo sredine razredov. Na zgornjih mejah razredov nanesemo vrednosti za kumulativne frekvence v odstotkih iz tabele 3. Dobimo točke, katerih razpored se da še kar dobro zvezati s premico. Pri tem je važno, da se točke ujemajo s premico predvsem v sredini mreže, medtem ko so odstopanja točk od premice na zgornjem in spodnjem koncu manj pomembne zaradi razvlečenosti mreže. Iz tako dobljene premice bomo dobili vse ostalo, kar nas pri analizi porazdelitve zanima. Najprej določimo srednjo vrednost. Iz točke na premici z ordinato 50 %> potegnemo navpičnico na os x, kjer odčitamo srednjo vrednost X = 175,2 (0,01 mm) Standardno deviacijo pa določimo takole: Iz vrednosti probit 4 na desnem robu mreže potegnemo vodoravno črto do premice, od tod pa navpičnico do osi x. Razlika med X in tako odčitano vrednostjo X je standardna deviacija. V našem primeru 6,5 (0,01 mm) Iz tega načina za določitev standardne devia-cije ugotovimo, da se pri vsaki spremembi potegnemo vodoravno črto do premice in od tod navpično na os x. V našem primeru dobimo vrednost 192 za zgornjo mejo. Enako izhajamo iz kumulativne frekvence 0,5 % in dobimo vrednost za spodnjo mejo 158,3. Torej ima 99'% pločevin debelino med 1,583 mm in 1,92 mm. Ker imamo na desnem robu skalo t + 5, lahko neposredno in hitro določimo meje X ± t cr. Za t = = 2 izhajamo iz točk probit 3 in 7 do premice in nato na os x, kjer v našem primeru dobimo vrednosti Xi = 162,1 in X2 = 188,1. To so meje intervala širine 4cr. Podobno bi določili meje prirodne tolerance X ± 3 cr. TEST x2 Za populacijo lahko predpostavimo določeno teoretično porazdelitev. Tako smo v 3. primeru predpostavili, da so debeline pločevin normalno porazdeljene. Teoretične in stvarne frekvence se v tem primeru res malo razlikujejo (tabela 5.). Razlike lahko smatramo za slučajne. V splošnem je seveda težko reči, kdaj so razlike le slučajne in kdaj pomembne. Za to imamo poseben kriterij, ki ga imenujemo test x2 (hi kvadrat). Pri tem testu izračunamo vse razlike med teoretičnimi in stvarnimi frekvencami, ki jih kvadri-ramo, kvadrate delimo s pripadajočimi teoretičnimi frekvencami in vse skupaj seštejemo. Dobljeno vrednost imenujemo x2- Tabela 8 Vrednosti »x2« L ('fi —fi)2 % [4.1] i = i 'fi so teoretične frekvence fi so stvarne frekvence Ker je to vsota k sumandov, pravimo, da ima X2 k — 1 prostostnih stopenj. Lahko se zgodi, da moramo teoretične frekvence izračunati iz ne-teoretičnih parametrov, zato je število prostostnih stopenj za toliko manjše, kolikor parametrov smo pri izračunu upoštevali. V tabeli 8 najdemo za različne nivoje verjetnosti in za različno število prostostnih stopenj teoretične vrednosti za x2- Če se odločimo za 95 % gotovost in je izračunana vrednost x2 manjša od vrednosti v tabeli za P = 95 %, v praksi lahko zaključimo, da ima populacija porazdelitev, ki smo jo predpostavili. Obratno, če je izračunana vrednost večja od tabelarične vrednosti iz kolone za P = 95 %>, lahko s 95 %-no gotovostjo trdimo, da populacija nima predpostavljene porazdelitve. Test x2 za normalno porazdelitev V primeru, ko predpostavimo normalno porazdelitev, je praktična metoda za izračun x2 sledeča: C/J d) Verjetnost P o & 8 s PH C/l 0,5 % 2,5 % 95% 97,5% 99% 99,5 % 1 0,393 . 10- -4 0,982.10- -3 3,84 5,02 6,36 7,88 2 0,0100 0,0506 5,99 7,38 9,21 10,6 3 0,0717 0,216 7,81 9,35 11,3 12,8 4 0,207 0,484 9,49 11,1 13,3 14,9 5 0,412 0,831 11,1 12,8 15,1 16,7 6 0,676 1,24 12,6 14,4 16,8 18,5 7 0,989 1,69 14,1 16,0 18,5 20,3 8 1,34 2,18 15,5 17,5 20,1 22,0 9 1,73 2,70 16,9 19,0 21,7 23,6 10 2,16 3,25 18,3 20,5 23,2 25,2 11 2,60 3,82 19,7 21,9 24,7 26,8 12 3,07 4,40 21,0 23,3 26,2 28,3 13 3,57 5,01 22,4 24,7 27,7 29,8 14 4,07 5,63 23,7 26,1 29,1 31,3 15 4,60 6,26 25,0 27,5 30,6 32,8 16 5,14 6,91 26,3 28,8 32,0 34,3 17 5,70 7,56 27,6 30,2 33,4 35,7 18 6,26 8,23 28,9 31,5 34,8 37,2 19 6,84 8,91 30,1 32,9 36,2 38,6 20 7,43 9,59 31,4 34,2 37,6 40,0 21 8,03 10,3 32,7 35,5 38,9 41,4 22 8,64 11,0 37,9 36,8 40,3 42,8 23 9,26 11,7 35,2 38,1 41,6 44,2 24 9,89 12,4 36,4 39,4 43,0 45,6 25 10,5 13,1 37,7 40,6 44,3 46,9 26 11,2 13,8 38,9 41,9 45,6 48,3 27 11,8 14,6 40,1 43,2 47,0 49,6 28 12,5 15,3 41,3 44,5 48,3 51,0 29 13,1 16,0 42,6 45,7 49,6 52,3 30 13,8 16,8 43,8 47,0 50,9 53,7 *Up i — — 1,64 1,96 2,33 2,58 Za v>30 se uporablja približna formula: (V2v- •1+Up)2 Iz danih vrednosti izračunamo srednjo vrednost X po obrazcu [2.1.1]. Standardno deviacijo pa ocenimo z vrednostjo S, ki jo izračunamo po obrazcu: 4 (Xi —X)2+ (X2 —X)2 + ....+ (Xn —X)2 n—1 [4.1.1] Nato vse vrednosti razdelimo v 16 razredov. V 1. razredu so vse vrednosti manjše od X — 3,5 S. V 16. razredu pa vse vrednosti večje od X + 3,5 S. Vmes je 14 razredov z enako širino po 0,5 S. Imamo 15 mej 16 razredov. X — 3,5 S; X — 3 S; X — 2,5 S; X — 2 S; X — — 1,5 S; X —S; X — 0,5 S; X; X + 0,5 S; X + S; X + 1,5 S; X + 2 S; X 4- 2,5 S; X + 3 S; X + 3,5 S. Določimo stvarne frekvence, ki povedo, koliko vrednosti leži v vsakem razredu, in jih označimo z fi, h.....fi6 Da določimo teoretične frekvence, uvedemo novo spremenljivko na znan način X —X t = Dobimo naslednje meje razredov za t: — 3,5; —3; —2,5; —2; —1,5; —1; —0,5; 0; 0,5; 1; 1,5; 2; 2,5; 3; 3,5 Iz tabele za ploščino pod normalno krivuljo dobimo ploščine nad vsakim od 16 razredov. To so vrednosti: 0,0002 0,0011 0,0049 0,0166 0,0440 0,0919 0,1498 0,1915 0,1915 0,1498 0,0919 0,0440 0,0166 0,0049 0,0011 0,0002 Vzemimo, da imamo danih n vrednosti, iz katerih smo izračunali X in S. Teoretično frekvenco razreda dobimo tako, da pripadajočo ploščino pomnožimo z n. Le tako je tudi vsota vseh teoretičnih frekvenc enaka številu danih vrednosti n. Teoretične frekvence označimo z fi, h, .... f« Recimo, da je danih 167 vrednosti. Potem je npr.: fs = 0,044.167 = 7,348 vrednosti. Razreda, ki sta enako oddaljena od srednje vrednosti, imata enaki teoretični frekvenci. To pa ne velja za stvarne frekvence. Začetni razredi (in zaradi simetrije tudi končni) imajo teoretične frekvence zelo majhne. To bi zaradi obrazca [4.1], kjer so f, v imenovalcu, naredilo x2 prevelik. Zato združimo toliko začetnih (in ustreznih končnih) razredov v en razred, da je vsota pripadajočih frekvenc večja od naprej izbranega števila H, ki je večje od 5. število sumandov k v obrazcu [4.1] je tako vedno manjše od 16. Ker pri računu vrednosti x2 upoštevamo X in S, izračunana iz podatkov, pri tem izgubimo 2 prostostni stopnji, zato je število pro-stostnih stopenj le še k-3. Oglejmo si vse to na primeru iz livarne: V februarju 1967 smo za določeno mešanico livarskega peska izmerili naslednjih 19 vrednosti za propustnost; 120 100 115 110 105 120 120 70 130 125 135 95 145 140 165 140 145 140 130 Srednja vrednost: X = 123,7. Ocena za standardno deviacijo: S = 21,78. Za n = 19 je 16 teoretičnih frekvenc 0,004 0,021 0,093 0,315 0,836 1,746 2,850 3,638 3,638 2,850 1,746 0,836 0,315 0,093 0,021 0,004 Recimo, da smo si izbrali H = 5,01. Združiti moramo prvih 7 razredov, da je vsota frekvenc večja od H. Frekvenca tako nastalega razreda je 0,004 + 0,021 + 0,093 +0,315 + 0,836 + 1,746 + + 2,850 = 5,865 Prav tako združimo zadnjih 7 razredov v en razred s frekvenco 5,865. Ostaneta nam še 2 razreda v sredini. V celoti imamo tako 4 razrede s teoretičnimi frekvencami 'f, = 5,865 'f2 = 3,638 'f3 = 3,638 'f4 = 5,865 Meje 4- razredov so: X— 0,5. S = 112,8 X = 123,7 X + 0,5 . S = 134,6 Določimo še stvarne frekvence za 4 razrede. V 1. razredu ali manjših od 112,8 je 5 od danih vrednosti. V 2. razredu med 112,8 in 123,7 so 4 vrednosti. V 3. razredu med 123,7 in 134,6 so 3 vrednosti in v 4. razredu ali večjih od 134,6 je 7 vrednosti. Torej je fi = 5 f2 = 4 f3 = 3 f4 = 7 Izračunajmo x2 po obrazcu [4.1] (3,638 — 3)2 (5,865 — 5)2 (3,638 — 4)2 + 5,865 3,638 3,638 + (5,865 — 7)2 + = °'496 Ker je k = 4 ima x2 k — 3 = 1 prostostno stopnjo. Poglejmo tabelo 8 za x2- V praksi navadno primerjamo izračunano vrednost z vrednostjo iz tabele za P = 95 ®/o. Če je izračunana vrednost Verjetnostna mreža Slika 11 večja od tabelarične, smatramo porazdelitev za nenormalno, v nasprotnem primeru pa kar za normalno. Po tem kriteriju je porazdelitev v našem primeru normalna, čeprav tega ne moremo trditi z veliko gotovostjo. (Če bi za primerjavo uporabili podrobnejšo tabelo še za druge verjetnosti P, bi ugotovili, da ima naša trditev v tem primeru komaj nekaj več kot 50'°/o gotovost.) Uporaba računalnika zuse Z-23 za analizo porazdelitve, priprava podatkov in tolmačenje rezultatov Za računalnik Z — 23 smo izdelali program, ki za dane podatke izračuna vrednost x2, kot smo to storili za propustnost livarskega peska na strani 200. Podatke natipkamo na teleprinterski trak v naslednjem vrstem redu in obliki: ; MEŠANICA S-2 JULIJ 1966 PROPUSTNOST V SVEŽEM; 130 130 125 120125115135 118 120 105115110130 118 118125 115 120 115 115 125 115 120 100 125 120120118 125 135 130 125 130120118 120 130 125120125 128 130 125115120 98115118105 ; MEŠANICA S-2 AVGUST 1966 PROPUSTNOST V SVEŽEM; 110110112 125128125130125120120135135 130130 110 118 110 115 125 120 115 130 118 115110 130 125 120 ; MEŠANICA R-l OKTOBER 1966 VLAGA; 6,5 7,6 9,5 7,25 7,75 Zo + 1 E V začetku podatkov med dve podpičji napišemo naslov analize, na katero se podatki nanašajo npr.: ; Mešanica S-2 julij 1966 propustnost v svežem; Paziti moramo, da je pred tem tekstom natančno eno podpičje in za tekstom natančno eno podpičje. Takoj za 2. podpičjem moramo narediti presledek ali novo vrsto in nato sledijo števila. Na koncu podatkov imamo dve možnosti: — nadaljujemo s tekstom (spet med dvema podpičjema) za naslednji primer in nato s števili za ta primer, ali pa — končamo z zapisom Zo + 1 E (Z nič plus ena E), ko nimamo več nobenega primera za izračun. Oglejmo si najprej rezultate za primer: »Mešanica S-2 JULIJ 1966 propustnost v svežem«: ; MEŠANICA S-2 JULIJ 1966 PROPUSTNOST V SVEŽEM; N = 50' X = 120.280 S = 8.104 V = 6.738 X + 3 S = 144.592 — 3 S = 95.968 5. = 3' HI KV. = 16.181 87.864 91.916 0 91.916 95.968 0 95.968 100.020 4.000 100.020 104.072 0 104.072 108.124 4.000 108.124 112,176 4.000 112.176 116.228 16.000 116.228 120.280 32.000 120.280 124.332 0 124.332 128.384 22.000 128.384 132.436 14.000 132.436 136.488 4.000 136.488 140.540 0 140.540 144.592 0 144.592 148.644 0 148.644 152.696 0 ; MEŠANICA S-2 AVGUST 1966 PROPUSTNOST V SVEŽEM; N = 33' X = 121.091 S = 7.899 V = 6.523 X + 3 S = 144.789 X — 3 S = 97.393 PS. = 3' HI KV. = 7.373 NORMAL ; MEŠANICA R-l OKTOBER 1966 VLAGA; N = 5' X = 1.720 S = 1.106 V = 14.327 X + 3S= 11.038 X — 3 S = 4.402 Takoj za tekstom sledi N = 50'. To pomeni, da je vseh vrednosti 50. Ker je število celo, ga je računalnik opremil z apostro-fom za razliko od decimalnih števil. Nato slede vrednosti statističnih parametrov X (označeno le z X), S, V, zgornje meje X + 3 S in spodnje meje X — 3 S. Nato računalnik izpiše vse vrednosti, ki so manjše od spodnje meje X — 3 S in vse vrednosti, ki so večje od zgornje meje X + 3 S. V tem primeru ni bilo takih vrednosti. Za tem sledi število prostostnih stopenj (oznaka PS.). Vrednost X2 (oznaka HI KV.) računalnik izračuna po obrazcu [4.1], pri tem pa prej združi razrede z majh- nimi teoretičnimi frekvencami, kot smo to storili v primeru na strani 200. Izračun x2 = 16,181 primerja računalnik s teoretičnim x2 za 3 prostostne stopnje pri nivoju P = 95 %,. če je izračunana vrednost večja od tabelarične, to pomeni, da s 95 % gotovostjo lahko trdimo, da je predpostavka o normalni porazdelitvi populacije napačna. V našem primeru torej vrednosti propustnosti v svežem niso normalno porazdeljene. Zato računalnik izpiše meje za 16 razredov in pripadajoče stvarne frekvence v odstotkih. Spodnja meja prvega razreda je sicer — <*>, a jo računalnik izpiše kot X — 4 S, ker mu je to lažje storiti. Upošteva pa za 1. razred res vse vrednosti, manjše od X — 3,5 S, ne glede na vrednost X — 4 S. Podobno računalnik izpiše tudi zgornjo mejo 16. razreda kot X + 4S namesto oo. Upošteva pa v 16. razredu tudi vse vrednosti, ki so večje od X + 4 S. Po teh rezultatih je lahko narisati histogram frekvenc v odstotkih za razrede s podanimi mejami. Tak histogram nam da zelo nazorno sliko porazdelitve (slika 12.). 35 25 20 -— Propustnost Slika 12 Primer prikazovanja normalne distribucije z verjetnostno mrežo Mešanica S-2. avgust 1966.propustnost v cn / K 4 /i a / / / / - J » / 1 / | / | / j- / 1 ij t H/ > -4_ tJ Slika 13 Ce je izračunani x2 manjši od tabelaričnega za p = 95 «/0> računalnik izpiše besedo NORMAL, kakor v primeru za »mešanico S-2 avgust 1966 propustnost v svežem«. V takem primeru je priporočljivo porazdelitev prikazati v verjetnostni mreži. To lahko hitro narišemo, tako da v mrežo vnesemo pri probit = 8 vrednost zgornje meje X + 3 S in pri probit = 2 vrednost spodnje meje X — 3 S. Obe točki povežemo s premico (glej sliko 13). V primeru, ko imamo manj kot 17 podatkov, ne moremo izvršiti testa normalnosti. Računalnik v tem primeru izpiše le vrednosti za osnovne statistične parametre. To vidimo v tretjem primeru rezultatov za mešanico R-l, ko je bilo v oktobru 1966 zbranih 5 podatkov. Literatura 1. J. Rodič: Matematična statistika — Metode I., II. — Priročnik za praktično uporabo I., II. Metalbiro Zagreb 1964 2. A. Zanella: Programi di calcolo automatico nel controllo della qualita e nella programmazione degli esperimenti, AICQM maj 1962, str. 10, 11. ZUSAMMENFASSUNG Im Artikel ist die statistische Methode der Verteilungs-analyse beschrieben. An praktischen Beispielen ist das Wesen der statistischen Grundparameter angefiihrt. Be-sonders ausfuhrlich ist das Wesen der normalen Verteilung und ihre Vervvendung ausgelegt. Beschrieben ist der Test x2 fiir beliebige Verteilung und die besondere Methode zur Berechnung des x2, wenn wir die Normalverteilung testieren wollen. Diese Methode ist zur Berechnung auf der elektronischen Rechenmaschine verwendbar. Fiir das Programm auf der elektronischen Rechenmaschine ZUSE Z-23 die alle statistischen Parameter aus-rechnet und den Test x2 durchfiihrt, ist im Artikel die ausflihrliche Beschreibung der Datenvorbereitung und Auslegung der Resultate — alles auf praktischen Beispielen der Železarna Ravne. SUMMARY Statistical distribution analysis is described. Terms of basic statistical parameters are introduced on the basis of practical cases. The use and essentiality of normal distribution is especially described in detail. Test X2 for random distribution and special method for x2 computation, when testing the normality on digital computer is described. For program to be run on digital computer Zuse Z - 23 which computes ali statistical parameters and tests x2 the data preparation and results interpretation is described in detail. Ali the practical cases are taken from Ravne Steel Mili.