Boštjan Rode dipl. inž. Železarna Ravne DK: 519.3 ASM/SLA: S 12 k Statistično planiranje in vrednotenje metalurških raziskav LATINSKI KVADRAT S PROGRAMOM NA RAČUNALNIKU ZUSE- Z 23 Latinski kvadrat je statistična metoda s področja analize variance. V članku je podrobno opisano, kako to metodo uporabljamo od zbiranja podatkov pa do tolmačenja rezultatov pri uporabi elektronskega računalnika. Značilno za latinski kvadrat je, da potrebujemo majhno število zbranih podatkov, čeprav opazujemo kar tri vplive hkrati. Zato pa morajo biti zbrani podatki čisto na poseben način v skladu z določenim modelom. Praktičen primer je vzet iz raziskovalnega arhiva železarne Ravne. Programa pa sta bila izdelana za računalnik Zuse Z-23 in računalnik IBM sy-stem/ 360 model 30. UVOD Latinski kvadrat je poseben primer analize variance. Z njim primerjamo hkrati različna stanja treh vplivnih faktorjev. Prednost latinskega kvadrata je v tem, da nam je treba zbrati le malo število podatkov. Ni potrebno zbrati podatkov za vse možne kombinacije stanj treh vplivnih faktorjev. Zberemo le toliko podatkov, kolikor je kombinacij stanj dveh vplivnih faktorjev. Seveda pa mora biti zato zbiranje podatkov točno vnaprej določeno. Vsi trije vplivni faktorji pa morajo imeti enako število stanj. Recimo, da je stanj vsakega vplivnega faktorja m (m je poljubno naravno število), potem bi bilo vseh kombinacij stanj treh vplivnih faktorjev m X m X m (ali m3). V resnici pa potrebujemo za latinski kvadrat le podatke za m X m (ali m2) kombinacij stanj. Če je na primer m = 8, potrebujemo namesto 512 le 64 podatkov. To pa je velika razlika v stroških in času preiskave. V tem članku si bomo ogledali zbiranje podatkov in tolmačenje rezultatov latinskega kvadrata za program, ki smo ga izdelali na računalniku ZUSE Z-23. Program za latinski kvadrat je bil izdelan tudi za računalnik IBM/360 v jeziku Fortran. Rezultati tega programa so popolnoma isti kot po programu za računalnik Z-23. Zato tolmačenje rezultatov, ki ga dobimo v tem članku, lahko uporabimo tudi za rezultate iz računalnika IBM/360. Priprava podatkov za računalnik IBM/360 pa se seveda razlikuje, ker uporabimo tam luknjane kartice, pri Z-23 pa teleprinterski trak. Program smo uvedli pri raziskavah na področju luženja jekla pri ugotavljanju vplivov luženja na stanje površine. Zato se v nadaljevanju pri razlagi programa poslužujemo praktičnih podatkov te raziskave luženja. PLAN ZBIRANJA PODATKOV Za primer si vzemimo luženje določene vrste jekla. Predpostavimo, da vpliva na izgled površine po luženju čas in temperatura luženja ter vrsta lužila. To so trije vplivni faktorji. Takoj je dobro, da se domenimo za vrstni red vplivnih faktorjev. Prvi naj bo čas, drugi temperatura in tretji vrsta lužila. Ker imamo na razpolago osem vrst lužila, pravimo, da ima tretji vplivni faktor 8 stanj. Določeno stanje tretjega vplivnega faktorja pomeni uporabo določene vrste lužila. Ker mora biti pri latinskem kvadratu število stanj vseh treh vplivnih faktorjev enako, si moramo izbrati 8 časov in 8 temperatur, pri katerih bomo lužili. Za čase si izberimo: 1' 10 min. 2' 20 min. 3' 30 min. 4' 40 min. 5' 60 min. 6' 1 uro 15 min. T 1 uro 30 min. 8' 2 uri Za temperature si izberimo: 1' 10° C 2' 20° C 3' 30° C 4' 40° C 5' 50° C 6' 60° C T 70° C 8' 80° C Napišimo zaradi popolnosti še stanja tretjega vplivnega faktorja, to je sestava lužil, ki jih uporabimo pri poskusih: 1' 225 ml HCL conc. 25 ml HN03 conc. 250 ml vode 2' 90 ml H,S04 25 ml nasičene NaN03 385 ml vode 3' 30 ml H2S04 30 ml HF 90 ml HCL 350 mil vode 4' 25 ml H2S04 conc. 50 ml HN03 50 ml HF 375 ml vode 5' 20 ml HNOj 5 ml H3P04 25 ml CHjCOOH 5 ml HCL 425 ml vode 6' 100 ml H3P04 15 ml HNOj 15 ml HCL 350 ml vode 7' 33 g FeS04 10 g HF 500 g vode 8' 50 g HNOj 2,5 g HF 450 g vode Podatke za izgled površine zberemo tako, da naredimo 64 prob, ki jih po poizkusu luženja med seboj primerjamo in določimo range, to je števila, ki nam po vrstnem redu ocene merijo izgled. To seveda nima zveze z metodo latinskega kvadrata. Tako dobimo le številčne podatke, ki jih potem med seboj primerjamo po metodi latinskega kvadrata. 8 5 6 7 4 3 7 2 7 4 5 6 3 2 7 8 3 7 1 2 8 4 6 5 7 2 7 6 5 8 3 2 8 3 5 7 6 4 7 4 6 8 3 5 7 2 7 5 7 4 7 2 8 3 6 6 3 2 8 7 7 5 4 ® © © ©©©©©©©© Stanje 2. vplivnega faktorja Slika 1 Primer latinskega kvadrata za določevanje vplivov luženja Kako izberemo kombinacije treh vplivnih faktorjev za 64 prob? Naredimo shemo, ki je tipična za latinski kvadrat, (slika 1) Vsak od 64 kvadratov v shemi na sliki 1 pripada eni kombinaciji treh vplivnih faktorjev: časa, temperature luženja in uporabi lužila. Na koncu vrste, v kateri opazovani kvadratek leži, nam obkroženo število pove, za katero stanje 1. vplivnega faktorja gre. Na koncu stolpca, v katerem opazovani kvadratek leži, nam obkroženo število pove, za katero stanje 2. vplivnega faktorja gre. V opazovanem kvadratku samem pa je napisano stanje 3. vplivnega faktorja. Vzemimo za primer v tretji vrsti sedmi kvadratek. Ker leži v tretji vrsti, gre za stanje 3 1. vplivnega faktorja. To je, kakor vidimo iz prejšnjega seznama stanj, čas 30 minut. Ker leži kvadratek v sedmem stolpcu, gre za stanje 7 2. vplivnega faktorja. To je temperatura 70° C. Ker pa v opazovanem kvadratku piše 6, to pomeni, da gre za šesto stanje 3. vplivnega faktorja, ki je v našem praktičnem primeru lužilo s sestavo: 100 ml H3P04, 15 ml HN03, 15 ml HCL in 350 ml vode. Vedno se moramo držati pravila, da se z vrsticami menjajo stanja 1. vplivnega faktorja, s stolpci pa stanja 2. vplivnega faktorja, ker je program za računalnik tako narejen. Iz sheme na sliki 1 vidimo, da so števila, ki določajo stanja 3. vplivnega faktorja, v kvadratkih zapisana tako, da niti v isti vrsti niti v isti koloni ne dobimo nikjer dveh enakih številk. To je princip sheme latinskega kvadrata. Ko zvemo za število stanj vplivnih faktorjev, ki ga splošno označimo z m (glej uvod), narišemo najprej m x m kvadratov in vanje vpišemo števila od 1 do m, tako da nikoli ni v isti vrsti ali koloni dveh enakih števil. V začetku vpisovanja števil v kvadratke imamo precej svobode, nato pa moramo vedno bolj paziti, da se držimo omenjenega pravila. Vpisovanje števil v kvadratke naj bo čisto slučajno, me da bi se pri tem držali kakega vrstnega reda. Obstajajo posebna pravila, kako shemo latinskega kvadrata čisto slučajnostno izberemo, vendar le do m = 6. Pri pisanju sheme ne smemo nikoli misliti na to, kako bomo določili probo za izbrana stanja vplivnih faktorjev, potem preizkusili in ali bo rezultat ugoden. Zato je najbolje, da shemo izberemo čisto neodvisno od narave poizkusa. Kot podatek je le število m. Vzemimo npr., da je m = 5. Nekdo bi čisto enostavno narisal 25 kvadratov in vanje napisal števila od 1 do 5 kakor kaže slika 2. šele potem bi vsaki vrstici pripisali eno stanje prvega vplivnega faktorja, vsaki koloni eno stanje drugega vplivnega faktorja in vsakemu številu od 1 do 5 eno stanje tretjega vplivnega faktorja. Vrnimo se na naš primer luženja. Po shemi na sliki 1 preizkusimo vseh 64 prob. Rezultate za izgled površine, izvrednotene s števili od 1 do 64 (rangi), vpišemo v kvadratke, ki jim ustrezajo, če ima več prob enako površino, dodelimo vsem enako število 4 3 2 5 1 1 5 4 2 3 5 4 3 1 2 3 2 1 4 5 2 1 5 3 4 Slika 2 Latinski kvadrat 5X5 ranga — to je sredina zasedenega območja rangov. Npr.: Ce tri probe zasedajo z enako oceno mesta od 3—5, imajo vse tri probe rang 4, če pa zasedajo mesta od 3—6, imajo rang 4,5. Tako dobimo shemo za latinski kvadrat na sliki 3. Temperatura 0 aC J — 20 30 40_50 60 70 10 8 28 5 10,5 6 10,5 7 20 4 36.5 3 10.5 7 10,5 2 43 .c E 20 u 7 10,5 4 51 5 20 6 20 3 20 2 <3 7 62 8 36.5 x. 30 3 10,5 7 3,5 7 26 2 3,5 8 36,5 4 43 6 28 5 60 40 1 20 2 36,5 7 10,5 4 51 6 20 5 51 8 36,5 3 60 60 2 32 8 57 3 20 5 36,5 7 32 6 43 4 51 7 28 lh15 4 57 6 20 8 51 3 20 5 51 7 3.5 2 43 1 64 lh30 5 20 7 28 4 57 7 10.5 2 3,5 8 43 3 43 6 51 2h 6 3,5 3 3,5 2 51 8 32 7 20 1 63 5 60 51 Slika 3 Male številke pomenijo oceno izgleda površine v rangih. Iz izpolnjene sheme latinskega kvadrata prepišemo podatke na teleprinter. Protokol podatkov vidimo na sliki 4. 8' 28 5' 10,5 6' 10,5 1' 20 4' 36,5 3' 10,5 T 10,5 2' 43 T 10,5 4' 51 5' 20 6' 20 3' 20 2' 43 V 62 8' 36,5 3' 10,5 T 3,5 V 28 2' 3,5 8' 36,5 4' 43 6' 28 5' 60 V 20 2' 36,5 7' 10,5 4' 51 6' 20 5' 51 8' 36,5 3' 60 2' 32 s' 57 3' 20 5' 36,5 V 32 6' 43 4' 51 T 28 4' 57 6' 20 8' 51 3' 20 5' 51 7' 3,5 2' 43 1' 64 5' 20 r 28 4' 57 T 10,5 2' 3,5 8' 43 3' 43 & 51 & 3,5 3' 3,5 2' 51,0 8' 32 7' 20 1' 63 5' 60 4' 51 3' 10 1,865 5 2,24 1 3,1 Slika 4 Protokol podatkov za latinski kvadrat Najprej samo stoji število 8', ki pomeni, da gre za latinski kvadrat 8x8. Nato je točno prepisana izpolnjena shema s slike 3, in sicer tako, da najprej napišemo za vsak kvadratek število, ki pomeni stanje tretjega vplivnega faktorja (velike številke na sliki 3) in nato šele vrednost podatka (male številke na sliki 3). Najprej napišemo prvo vrsto, nato drugo itd. Ko smo celo izpolnjeno shemo s slike 3 prepisali, slede še podatki za F test1. Najprej število 3', ki pomeni, da bomo testirali pomembnost razlik na treh nivojih Za tretji vplivni faktor je ostala le še razlika 4' 7' 31.5625 med stanji 4' in 7'. Torej lahko trdimo z 99 % go- tovostjo, da se sestavi lužil 4' in 7' razlikujeta po Slika 5 vplivu na izgled površine. Protokol rezultatov računalnika 8' 4■ 25.0000 3' V T 27.5000 4' 3' 26.2500 4' & 25.1875 4' T 37.5625 5' T 26.5000 8' T 27.9375 ALFA = 5.0 2' 8' 1' 26.5000 8' 4' 25.0000 3' V T 27.5000 4' 3' 26.2500 4' 6' 25.1875 4' T 37.5625 5' 7' 26.5000 8' 7' 27.9375 ALFA = 1.0 Za srednjimi vrednostmi v rezultatih sledi standardna shema za analizo variance z izračunanimi vrednostmi F v zadnji koloni. Cela števila v drugi koloni so ustrezne prostostne stopnje. Vsak F ima Literatura 1. Ing. B. Rode, Ing. J. Rodič, Statistično planiranje in vrednotenje metalurških raziskav, Železarski zbornik; II./1968 št. 2, str. 99—111 ZUSAMMENFASSUNG Das lateinische Ouadrat i&t eine statistische Methode der Varianzen Analyse. Im Artikel ist die Amvendung dieser Methode, von der Sammlung der Daten, bis zu der Erlauterung der Ergebnisse, beim Gebrauch einer Elek-tronnenrechenmaschine, ausfiihrlich beschrieben. Charakte-ristisch fiir das lateinische Ouadrat ist, dass vvir eine nur geringe Zahl der Daten gebrauchen, wenn wir auch drei verschiedene Einfliisse zugleich beobachten. Die Gesammelten Daten mtissen aber auf eine ganz besondere Art mit dem bestimmten Modeli ubereinstimmen. Dieser praktische Beispiel ist aus dem Archiv der Versuchs-abteilung des Hiittemverkes Ravne entnommen worden. Die beiden Programme wurden mittels der Elektronnen-rechenmaschinen Zuse Z-23 und IBM/360 Modeli 30 aus-gefertigt. SUMMARY Latin square is a statistical method from the field of ana-lysis of variance. In the paper the use of this method, is de-tailedly described from collecting of data to the interpreta-tion of results using a computer. Characteristic of the latin square is that a small number of collected data is necessary though simu!taneously three trends are observed. Therefore the data must be collected in a special way, corresponding to a certain model. An example is taken from experimental records of Ravne Ironworks. The programs were made for the computer Zuse Z-23 and the computer IBM system 360 model 30. 3AKAIOTEHHE AaTHHCKHll KBaApaT 3to CTaTHCTiraecKHH MeTOA h3 oSAaCTH aHaAH3a perpeccHH. B CTaTbe noApoSno onHcaHo KaK ynoTpe0HTb 3tot MeTOA Ha^HHaa ot c6opa AaHHBix ao o6bacHeHHa pe3yAbTaT0B npH ynoTpe5AeHH« 3AeKTpoHHora creTOHKa. XapaKTepHo AAa AaTHHCKora KBaApaTa to, ito A^a nero AOCTaTOino HeSoAtiuoe KOAH