Narodna in univerzitetna knjižnica v Ljubljani 2701 28 N Narodna in univerzitetna knjižnica v Ljubljani >' "70128 VISOKA EKONOMSKO KOMERCIALNA ŠOLA MARIBOR Dr, MARfJAN BLEJEC GOSPODARSKA STATISTIKA MARIBOR, 1974 VISOKA EKONOMSKO KOMERCIALNA ŠOLA MARIBOR dr. MARIJAN BLEJEC GrOSI ODARSKA STATISTIKA Maribor 1974 7 p !! 2701 28 Izdajo tega učbenika je odobril Pedagoško znanstveni svet šole na svoji 8. redni seji dne 11. maja 1973* Učbenik je prirejen-vsebini predmeta na ,VEKŠ. Nova so poglavja od 1 . do 6. in poglavje. Poglavja od 6. do 13 . so ponatisnjena nespremenjeno po 1 učbeniku dr. M. Blejca: Statistične metode za ekonomiste, II, predelana in popravljena izdaja, Ljubljana 1961 z upoštevanjem popravkov v izdaji iz leta 1971 . VSEBINA 1. UVOD 1 Kaj je statistika? 1 Socialno-ekonomska statistika 1 2. PROUČEVANJE MNOŽIČNIH POJAVOV 3 Množični pojavi 3 Statistične enote 4 Statistični znaki 5 Statistične populacije 7 Statistični parametri 9 3. STATISTIČNO PROUČEVANJE 10 Vrste statističnih opazovanj 10 4. UREJEVANJE STATISTIČNEGA GRADIVA 13 Razvrščanje vrednosti znakov 13 5. Prikazovanje statističnih podatkov 21 Statistične vrste 21 Statistične tabele 25 6. RELATIVNA ŠTEVILA 26 Strukture ali razčlenitvena števila 27 Grafično prikazovanje struktur 30 Statistični koeficienti in gostote 43 Izračunavanje statističnih koeficientov 43 Grafično prikazovanje statističnih koeficientov 52 Enostavni indeksi 57 Stvarni in krajevni indeksi 58 Časovni indeksi 60 7. FREKVENČNE DISTRIBUCIJE 66 Sestavljanje frekvenčne distribucije 66 Frekvenčne distribucije z neenakimi razredi 69 Grafično prikazovanje frekvenčnih distribucij 73 Kumulativna frekvenčna distribucija 79 Lorenzov grafikon 81 8. KVANTILI 84 Ranžirna vrsta. Rang 84 Kvantilni rang 85 Izračunavanje kvantilov iz negrupiranih podatkov 87 -Izračunavanje kvantilnih rangov in kvanti¬ lov iz frekvenčnih distribucij 90 9 . SREDNJE VREDNOSTI 93 Vrste srednjih vrednosti 95 II Mediana gg Lastnosti, mediane 96 Modus g-j Izračunavanje modusa iz frekvenčnih distribucij 97 Lastnosti modusa 100 Aritmetična sredina 100 Lastnosti aritmetične sredine 101 Izračunavanje aritmetične sredine iz negru— piranih podatkov 103 Izračunavanje aritmetične sredine iz frek¬ venčnih distribucij 103 Direktna metoda 103 Pomožni znak u 105 Metoda kumulativ 107 Modificirana aritmetična sredina 108 Aritmetična sredina aritmetičnih sredin 108 Harmonična sredina 110 Povprečja iz relativnih števil 112 Odvisnost sumarnega relativnega števila od strukture 114 Standardizirani pokazatelji 115 Geometrijska sredina 117 Odnosi med različnimi vrstami srednjih vrednosti 121 10. MERE VARIACIJE ASIMETRIJE IN SPLOŠČENOSTI 123 Mere variacije 123 Vrste mer variacije 123 Variacijski razmak 124 Kvartilni odklon * 124 Povprečen absolutni odklon 126 Varianca. Standardni odklon 128 Izračunavanje iz negrupiranih podatkov 128 Izračunavanje iz grupiranih podatkov 130 Skupna varianca 134 Zveza standardnega odklona z normalno distribucijo 136 Razmerje med Q, AD in SD za normalno distribucijo 137 Relativne mere variacije 137 Mere asimetrije in sploščenosti 140 Mere asimetrije 140 Mera sploščenosti 142 11. INDEKSI 143 Povprečni indeks cen 143 Agregatni indeksi cen 144 Izbira ponderov pri izračunavanju agregatnega indeksa cen 145 Verižni indeks cen 149 Nadomeščanje artiklov in spremembe v ponderaciji 152 Reprezentativni indeksi cen 154 Agregatni indeksi količin 158 Testi o agregatnih indeksih 160 Drugi agregatni indeksi 161 III 12, ČASOVNE VRSTE 164 Oblike časovnih vrst I64 Izvedene časovne vrste 165 Kumulativna časovna vrsta 165 Vrsta sredin 166 Vrsta drsečih vsot 168 Časovna vrsta drsečih sredin 170 Grafično prikazovanje časovnih vrst 174 Logaritemski grafikoni 177 Polarni grafikon 180 Z-diagram 182 Brunsmanov grafikon 184 Ganttov grafikon 186 Analiza časovnih vrst 189 Primerljivost podatkov v časovni vrsti 189 Elementarni pokazatelji dinamike 193 Komponente gibanja v časovnih vrstah I96 Osnovni modeli časovnih vrst 198 Vloga povprečij za analizo časovnih vrst 199 Trend 200 3 Prostoročna metoda 204 Metoda drsečih sredin ' 206 Metoda sredin med najnižjimi in najvišjimi točkami 206 Metoda izbranih točk 208 Metoda delnih sredin 210 x Metoda delnih vsot 212 Metoda najmanjših kvadratov 214 Sezonske in periodične variacije 221 Metoda vsot 222 Metoda kvocientov na trend 225 Metoda kvocientov na vrsto drsečih Bredin 225 Metoda verižnih kvocientov 228 Metoda grafičnega približka 232 Ciklična nihanja 234 13. KORELACIJA 238 Funkcijske odvisnosti 236 Korelacijske odvisnosti 238 Prikazovanje korelacijskih odvisnosti 238 Regresijeka krivulja 243 Metode določanja regresijekih krivulj 245 Indeks korelacije 251 Standardna napaka ocene 253 Linearna korelacija 254 Izračunavanje pokazateljev linearne korelacije 256 Negrupirani podatki 256 Izračunavanje pokazateljev linearne korelacije iz grupiranih podatkov 262 Krivuljena korelacija 267 Anal. 1 t.i y n metoda za določanje regresi jakih krivulj 26? Transformacija znakov 268 zračunavanje krivuljčne korelacije s polinomi 276 IV. Korelacijsko razmerje 280 Korelacija ranga 285 Asociacija in kontingenca 288 Asociacija 288 Kontingenca 292 Parcialna korelacija 295 Multipla korelacija 296 linearna multipla korelacija 297 14. VZORČENJE 300 Osnove vzorčenja 300 Prednosti in pomanjkljivosti metode vzorčenja 301 Uporaba vzorčenja pri statističnem opazovanju 302 Opis normalne distribucije 303 Standardizirana normalna distribucija 305 Osnovna populacija. Vzorec. Populacija vseh vzorcev 310 Zakonitosti v populaciji vseh vzorcev 313 Enostavno slučajnostno vzorčenje 314 Tehnika enostavnega slučajnega izbora 319 15. PREIZKUŠANJE DOMNEV 321 Preizkušanje domnev 321 Osnovna in ničelna domneva 321 Enostavne in sestavljene domneve 321 Preizkušanje enostavnih domnev 321 Napaka I. vrste in napaka II. vrste 323 Značilnost In neznačilnost razlik in vzorčnih izrazov 325 Stopnje značilnosti 325 Vzorčni izrazi 325 UVOD KAJ JE STATISTIKA? 1.1 Statistiko opredelimo kot vedo, ki s številčnim prou¬ čevanjem množičnih pojavov, z metodami, ki so njej la¬ stne, odkriva zakonitosti množičnega pojavljanja in podaja ka¬ kovostno analizo pojavov. Iz te opredelitve spoznamo, da ima statistika svoje področje - množične pojave - in svojo metodo, da s kvantitativ¬ nim proučevanjem analizira kvalitativne odnose množičnih poja¬ vov. Tako na primer količina proizvodnje, proizvedene v enoti časa, pokaže produktivnost dela, višina hektarskega pridelka uspeh agrotehnih mer v kmetijstvu, koeficient umrljivosti zdrav¬ stveni standard itd. Ker je v statističnem proučevanju pojavov vedno pouda¬ rek na metodi proučevanja, je v uporabi teh metod statistična metoda v ozki povezave z znanostjo, v katero spada proučevani pojav. ,Zato bi mogli imeti statistiko le za eno izmed metod za proučevanje pojavov. Vendar statistična metoda, razen v ne¬ katerih posebnih primerih, ni bistveno vezana na določeno pod¬ ročje, marveč veljajo njene metode in zakonitosti neodvisno od predmeta za vse množične pojave. Statistiko moramo ločiti od evidence, ker bi mogla v nekaterih področjih nastati zmeda v razmejitvi med statiko in evidenco. Kakor knjigovodstvo ni statistika, tako tudi eviden¬ ca na splošno ni statistika, čeprav se knjigovodstvo in evi¬ denca ukvarjata z množičnimi pojavi. Knjigovodstvo sistematič¬ no registrira pojave, ki so množični. To pa je edina stična točka s statistiko. Namen zbiranja podatkov v knjigovodstvu in evidenci je predvsem registrirati posamezne dogodke ali stvari, brez težnje, da bi iz teh podatkov dali sliko ali ana¬ lizo celote, t statistiki pa je registracija samo sredstvo, ki omogoča, da s statističnimi metodami analiziramo pojav in mno¬ žico podatkov kot celoto. SOCIALNO EKONOMSKA STATISTIKA 1,2 Ker so statistiko razvojno dolgo časa uporabljali iz¬ ključno v socialno-ekonomskih znanostih, je prevlado¬ valo dolgo časa mišljenje, da s statistiko proučujemo le so- cialno-ekonomske pojave in da se zato vtaplja v socialno-eko¬ nomskih znanostih. Vendar je statistika osvajala vedno nova področja upo¬ rabe, Na prelomu med devetnajstim in dvajsetim stoletjem opa¬ zimo velikansko povečanje uporabe statistike v vseh področjih in silen' razvoj v statistični metodologiji. Statistika je po¬ stala ena izmed osnovnih metod za proučevanje v najrazličnej¬ ših znanostih. Da so statistiko začeli uporabljati najprej za prou¬ čevanje socialno-ekonomskih pojavov je izzvala razmeroma ve¬ lika potreba po teh podatkih in razmeroma jasno opredeljen predmet proučevanja. Medtem ko ima v drugih znanostih stati¬ stika za predmet množične pojave, ki so bolj ali manj umiš¬ ljeni in je njihovo število neomejeno, proučujemo v social- no-ekonomskih področjih množice realnih pojavov, ki so v ča¬ su in prostoru v končnem številu. Splošne metode statističnega proučevanja moremo upo¬ rabiti v vseh področjih, kjer naletimo na množične pojave. Vendar so se v socialno-ekonomskih znanostih razen splošnih metod zaradi specifičnih lastnosti pojavov v teh področjih razvile metode, ki so tipične za proučevanje socialno-ekonom¬ skih pojavov in jih v splošnem ne uporabljamo v drugih zna¬ nostih. Medtem ko so nekatere metode statistike, ki jih upo¬ rabljamo v socialno-ekonomskih področjih, splošnega značaja (srednje vrednosti, mere variacije, korelacija itd.), so druge take, da jih uporabljamo samo ali pretežno za proučevanje so~ cialno-ekonomskih pojavov. Med temi so na primer analiza ča¬ sovnih vrst, teorija indeksov in konjunkturna statistika. V tej knjigi obravnavamo splošne metode statistične¬ ga proučevanja socialno-ekonomskih pojavov. Posamezne metode obravnavamo na zgledih iz socialno-ekonomskih področij, ven- bar samo ilustrativno. Te metode na splošno uporabljamo za proučevanje katerega koli socialno-ekonomskega pojava. Tako z istimi statističnimi metodami za proučevanje časovnih vrst proučujemo dinamiko pojavov v demografiji, industriji, kmetij¬ stvu, prometu itd. Enako je s srednjimi vrednostmi, merami variacije, korelacijo in drugimi statističnimi metodami. 1.3 Vendar so kljub nekim splošnim načelom in metodam analize v posameznih socialno-ekonomskih področjih posebnosti, ki se jim mora statistično proučevanje prilagodi¬ ti. Zato imamo razen splošne statistike tudi metode statistič¬ nega proučevanja, ki so ozko povezane z vsebino posameznih so¬ cialno-ekonomskih vej. Tako imamo posebej: Demografsko statistiko ; ta obravnava posebnosti prou¬ čevanja pojavov prebivalstva s statističnimi metodami. Kmetijska statistika se ukvarja s posebnimi problemi statističnega proučevanja v kmetijstvu. Industrijska statistika ima tudi svoje posebne prije¬ me in probleme, ki jih rešujemo s specifičnimi metodami. Analogno imamo nadalje gozdarsko statistiko , stati¬ stiko obrti , gradbeništva , prometa , trgovine , statistiko go ¬ stinstva, turizma , financ , statistiko cen , kul turno'-prosvetno 3 statistiko t statistiko zdravstva , sodno statistiko itd. Vsaka izmed teh statistik se ukvarja z vsebinsko pro¬ blematiko iz svojega področja in je z njimi v ozki povezanosti. Navedene posebne statistike se pečajo s specifično problemati¬ ko opredelitve, zbiranja in analize pojavov na svojih področ¬ jih. DRUGO POGLAVJE PROUČEVANJE MNOŽIČNIH POJAVOV MNOŽIČNI POJAVI 2.1 V naravi in družbi pojavi ne nastopajo posamič, marveč v v velikem številu, ne izolirano, marveč povezani med seboj. Če opazujemo te pojave individualno in izolirano, se zdi njihovo pojavljanje brez reda. V resnici pa veljajo zanje določene zakonitosti. Te odkrijemo šele, če opazujemo ne samo posamezen pojav, temveč skupnosti pojavov. Omenili smo že, da statistika opazuje in analizira množične pojave. Množičen pa je vsak pojav, ki se v času in prostoru pojavlja v velikem šte vilu. Na take pojave naletimo v različnih področjih, med drugimi tudi v socialno-ekonomskih znanostih. Tako je na pri¬ mer množičen pojav industrijsko podjetje, kupoprodaja, oseba, predmet, ki ga proizvajamo v množični proizvodnji itd. Če analiziramo pojave, ki množično nastopajo, odkrije¬ mo, da ti pojavi niso med seboj enaki, marveč se v svojih zna¬ čilnostih razlikujejo. Podjetja imajo različno število delavcev, različno me¬ sečno proizvodnjo, različno porabo surovin, so iz različnih strok itd. Kupoprodaje se med seboj razlikujejo po času, pro¬ dajalcu, kupcu, ceni, količini, kakovosti prodanega blaga itd. Osebe so različnega spola, starosti, stanu, zaposlitve, imajo različno šolsko izobrazbo, mesečne prejemke, število otrok itd. Izdelki so različnih dimenzij, imajo različno kakovost, upo¬ rabnost itd., čeprav se zde na oko med seboj enaki. 2.2 Če natančneje proučimo možnosti za analiziranje mno¬ žičnih pojavov, spoznamo, da je treba področje prouče¬ vanja opredeliti. Če na primer opazujemo prebivalstvo, ne mo¬ remo hkrati opazovati vsega človeštva v vseh časih, ker je to neizvedljivo, niti ni v posebnem v dani raziskavi zanimivo. Zato se omejimo samo na del prebivalstva, tako da opredelimo, katerim pogojem morajo ustrezati osebe, ki so predmet konkret¬ ne raziskave. 4 Z opredeljujočimi pogoji razmejimo pojave, ki jih pro¬ učujemo, od pojavov, ki v konkretnem primeru niso predmet pro¬ učevanja. Skupnost pojavov, ki lih opredelimo zato, da .iih nro- , učimo, ime mnemn s tatistično množico _ _al_i popu lacijo.. Čeprav je beseda populacija privzeta iz pojma prebivalstva, uporabljamo ta izraz za vse vrste statističnih množic. Populacija v stati¬ stičnem smislu ni samo prebivalstvo, temveč tudi skupnost indu¬ strijskih podjetij v Jugoslaviji na določen datum, skupnost iz¬ delkov, proizvedenih na določenem stroju v določenem času itd. Vsak posamezen pojav pnpule nije imenu j_emo statistična enota . Tako je v zgornjih populacijah enota posamezen prebiva¬ lec, posamezno industrijsko podjetje, posamezen artikel. Vsaka enota populacjje ima valikn. značilnostih Izmed teh pa so samo nekatere predmet konkretnega proučevanja. Zna =- čilnosti, ki nn v posa m eznem primeru predmet proučevanja, ime¬ nujemo statistične znake, ali kratko znake . Vsak znak ima za posamezne enote različne vrednosti . Tako niso vsi ljudje enako stari, vsa podjetja nimajo enako Število delavcev, vsi izdelki niso enako uporabni itd. Medtem ko je spol enak za posamezno enoto, je število oseb v populaciji, ki so moškega spola, značilnost za celotno populacijo, čeprav je ta podatek odvisen od tega, kakšnega spola so posamezni prebivalci v populaciji. Enako je odstotek neuporabnih izdelkov v proizvodnji za določen dan značilnost o celotni proizvodnji, ne pa značilnost za posamezen izdelek, čeprav smo ta podatek izvedli iz podatkov o uporabnosti posa¬ meznih artiklov. Značilnosti oooulaci.ie. kot s o npr. — šiezilo_ moških v prebivalstvu, odstotek neuporabnih izdelkov v dnevni proizvodnji, poprečen dohodek delavcev v neki stroki, poprečen hektarski pridelek pšenice v socialističnih kmetijskih obra¬ tih itd.. imenujemo p ar ametre p o pulacij e. Jg note sestavljajo populacije. Znači ln ost i.en o t .....imenu - jemo znake^ značilnosti"populacTT~pa parametre« Statistične enote 2.3 Po gornjem uvodu opredelimo statistično enoto takole: pta txs^tA4na-~i&no±a je vsak po;i av f ki v čarni.. in prost &ru. množično nastop a in je predme t, statističnega prou čevajrija^ Po tej opmdelitvi more biti enota v statističnem smislu: a) oseba (prebivalec, delavec, študent), b) žival (konj, krava, prašič itd.), c) stvar (avto, motor, izdelek), d) pravna tvorba (zadruga, društvo), e) administrativna enota (občina, okraj) f) gospodarska tvorba (industrijsko podjetje, trgovi¬ na, kmetijsko gospodarstvo), g) dogodek (kupoprodaja, smrt, nesreča itd.), h) poskus (poskusna obdelava parcele, cepljenje živali) i) trenutek (v katerem opazujemo pojav). Formalno je važna _delitev enot na: a) realne enote, 1) dogodke in c) dogajanja . . so na primer II MIel. podjetja, živina itd., ker v Sasu in prostoru JbDgočU- ,ki so pojavi, ki ss v času dovode. Med d.ogodke""^ejemonpr. : smrt, rojstvo, nesrečo, kupoprodajo. Dogodek se zgodi praktično vzeto v trenutku ali v zelo kratkem času. Vmesna stonn.ia med realnimi enotami, ki obstajajo, in dogodki., k j _ se dogode tre- ^£0 7'Te-^ogeianie. ki traia, riali časa. D o ga j an je^e^m^prTi mer gradnja hiše, proizvodnja izdelka itd. Gornja delitev enot je posebno važna pri opredelitvi populacij. Od tega, ali prou¬ čujemo populacijo realnih enot, dogodkov ali dogajanja, je nam¬ reč odvisna časovna opredelitev populacije. Statistične enote so bodisi enostavne enote ali pa agregati - skupinice enot . Tako štejemo posameznega človeka za enostavno enoto. Družina, občina, društvo itd. pa so agregati, ker so sestavljeni iz enostavnih enot: članov družine, prebi¬ valcev občine, članov društva itd. Združevanje enostavnih enot v enote višje stopnje - agregate, je za statistično proufSevanje vsebinsko in tehnično izredno pomembno. Statistični znaki 2,4 Statistični znaki dajo enot am vsebino, ^naki sc tiste značilnosti statističnih enot, ki so predmet proučeva¬ nja. Statistične enote oziroma množični pojavi na splošno ima¬ jo namreč veliko najrazličnejših značilnosti. V konkretni raz¬ iskavi pa podobno kakor iz množice pojavov izločimo populacijo, iz množice vseh možnih značilnosti izločimo tiste, ki so važne za proučevanje in te imenujemo znake. Katere značilnosti so v posebnem primeru znaki, je odvisno od namena proučevanja. Atributivni so znaki , za katere vrprlnnRti i žamn 0 - pisno z besedami. Tako je .na primer atributiven znak .spol, ker so njegove vrednosti: moški, ženski, izražene z besedami. Iz istega vzroka je atributiven znak tudi zapnsl i tev., panoga de¬ javnosti, vrsta zgradbe, vzrok smrti itd. Numerični so znaki. katerih vrednost i izražamo številč- . ^o, Po tem, katere vrednosti morejo za v zet i. ~d e JLimc—nume v i č_ngj jz nake v: (aj nezvezne - diskontinuirne in(^ zvezne - kontinuir- ne. Nezvezen znak je na primer število članov v gospodinjstvu, število otrok, ki jih ima mati, število delavcev itd. znaki maxfi4-o-. i me t i kamo n eke, običajno cele vrednos ti na dolo¬ čenem razmiku. Tako ne more imeti gospodinjstvo 3 l/2 članov, mati 1 1/4 otrok, podjetje 86 1/2 zaposlenih itd. Zvezni znaki so tisti numerični znaki, ki morejo teoretično imeti vsako iz¬ med vrednosti v določenem razmiku. Zvezni znaki sc p a_p-pimo r starost,-teža izdelka, premer profila. ^ - 6 - 2.6 Vr ednosti časovnih in numeričnih znakov se daj o uredi¬ ti po velikosti po nedvoumnem vrstnem redu ^ Ts lastno¬ sti krajevni in atributivni znaki v splošnem nimajo*. M ožnost. .... da lahko uredimo vrednosti z nak ov po veliko sti, je velika pred ¬ nost č asov nih in nu meri čnlh znakov, o mogoča nam rec poglobijeno~ anali zn t ki je za g engnafske in atribufivne znake ne moremo iz- zasli. Možnost analize atribut ivniiPznakov" v - primer Ja. vT~ž~ "nu¬ meričnimi je torej okrnjena. Medtem ko moremo vse metode za analizo atributivnih znakov uporabiti tudi za numerične znake, obratno niso vse metode za numerične znake uporabne za atribu- tivne. 2.7. . Numerične znake delimo po drugem merilu na: a).eksten¬ zivne in bT~intenzivne. Ekstenzivni, zr aki nakamja^n— količino, intenzivni pa kakovost. Tako so ekstenzivni znaki npr. vrednost proizvodnJe^ocTjeTja v določenem razdobju, šte¬ vilo delavcev po podjetjih, količina določenega blaga na trgu itd. Intenzivni znaki pa so na primer cena izdelka, produktiv¬ nost dela, merjena z vrednostjo proizvoda na enoto časa, hek¬ tarski pridelek itd. 2.8 Pomembna je delitev znakov po vlogi ., ki jo imajo pri proučevanju množičnih pojavov. V tej zvezi razde limo znake na: a ) faktorialne in b) rezultativne.^ _E aktorialni znaki __ so izraz fakt or.iev-dejavnikbv TVKl vplivaj o na poja v, Rezulta - tivni znaki pa~so rezultat vpliva dejavnikov, ki nanje'vpiiva¬ jo:" Tako 'je na primer količina uporabljenega umetnega gnojila faktorialen, hektarski donos pa rezultativen znak. Enako je število delavcev v podjetju faktorialen, vrednost proizvodnje pa rezultativen znak. Količina blaga na trgu je faktorialen, cena blaga pa je rezultativen znak. Zveze med faktorialnimi in rezultativnimi znaki kažejo, kako se spreminja vrednost rezul- tativnega znaka, če se spreminjajo vrednosti faktorialnih zna¬ kov. Proučevanje teh zvez je ena izmed važnih metod v stati¬ stični analizi. 2.9 Variiranje statističnih znakov. Zn ači ln o za zna ke—la-, da ima j o posamezne enote r a zlične vredno s ti znako v. Temu pojavu~hravimo variiranje statističnih znakov. Stalistič¬ ni znaki so torej variabilni. D a imajo nekatere enote tudi i- ste vrednosti enega in istega znaka, ni v nasprotju z oprede¬ litvijo variabilnosti. Vsaka oseba v dani populaciji namreč ne more biti različnega spola, če ima jznak spol samo dve vredno- J žanskl. ~~ Variabilnost statističnih znakov je ena izmed temelj¬ nih lastnosti množičnih pojavov. Statistika se predvsem in v najrazličnejših oblikah ukvarja z variabilnostjo pojavov. Ce množični pojavi ne bi bili variabilni, pojavov sploh ne bi proučevali s statističnimi metodami. Zato smo tudi navedli, - 7 - da ima statistični znak najmanj dve vrednosti, saj značilnost z eno samo vrednostjo ne more biti statistični znak, ker ne variira. Posebno važna je variabilnost numeričnih znakov. Kakor bomo videli kasneje, je variabilnost numeričnih g naVmr npnny ff za najpodrobnejše proučevanje numeri č nih p n j -avov. Statistične populacije 2 •10 Opredelitev statistične populacije . Statistična, popula¬ cija je množica vseh istovrstnih ;oG_iavQV_- statističnih w enot, ki izpolnjujejo opredeljujoče pogoje, s katerimi je opre¬ deljena. Statistično populacijo opredelimo tako, da navedemo, "Kakšne vrednosti znakov, ki so opredeljujoči pogoji, morajo i- m eti enote, da so enote populacije. V znakih, ki opredeljujejo Populacijo, je torej variacija okpnjena. Za populacijo ne velja samo množica vseh statističnih enot v gornjem smislu, marveč je populacija tudi množica podat¬ kov za neki znak. Tako je populacija v tem smislu tudi množica vseh podatkov o starosti poročenih zaposlenih žena v SRS po stanju 31.12.1972. 2 • 11 Populacija mora biti nedvomno opredeljena: a.) časovno. 3) krajevno in c) stvarno! v V splošnem krajevna opredelitev ne dela posebnih te- 2a -v. Običajno pri krajevni op redglitvi..,upprabimo obsto ječo, .u pravno r azriel i tev teritorija.. To olajša krajevno opredelitev. Razen tega pa imajo večjo" operativno vrednost podatki, ki so ^ani za območja, skladna z upravno razdelitvijo. Časovna opredelitev je b olj problematična in je odvis¬ na od. narave populacije, ki jo proučujemo. G-om.io populacijo žena k—s m o -o pr a delidi s trenutkom. 3?P u lacije realnih enot im enujemo tudi momehtne ali t renutrie 3p puPa clje. Momentnrir~15opulacij imamo veliko. Vse čaiovrio fiiinPi. . liČno o predelimo z momen tom, v katerem morajo posamezne enote Populacije“~žač^scatirvšeTTPdrugim pogojem, da so enote popula¬ cije. Časovna opredelitev populacij dogodkov z momentom ni smiselna. V določenem momenta se more zgoditi in se zgodi sa¬ mo omejeno in slučajno število dogodkov. Tako nima smisla is¬ kati populacijo rojstev, nesreč, smrti, proizvodnje itd., ob določenem- momentu, i opulacijo dogodkov opredelimo z razfinhjo m vanjo štejemo vse d ogodke, Ki so se zgodili v določenem . razgoipju m zadoščajo vs~em~ drugim pogoje m._ Te-Pomdaei-jfi -4 ^ p- -H u.iemo intervalne ali razmične populacije, ker sn nprerioi jpno J 5 ča sovn dmi razmiki. Intervalne populacije so npr. proizvodnja. v ' ro j 3 l v a, nesreče , prodaja itd. 8 2.12 Homogene in heterogene populacije . Po sorodnosti enot so populacije Homogene - istorodne in heterogene - raznorodne. V homogenih populacijah enote med seboj niso pre¬ več različne, medtem ko so heterogene populacije sestavljene iz raznorodnih enot. Homogenos t populacije dosežemo , če jo o- prede limo po čim več faktorialnih znakih! Delitev populacij - na homogeneTrnieterogene ni ostra in imamo bolj ali manj ho¬ mogene in bolj ali manj heterogene populacije. Tako je popula¬ cija obrtnih podjetij za določeno stroko, v katerih obrtnik razen sebe zaposluje enega samega delavca, bolj homogena kot populacija obrtnih podjetij za isto stroko ne glede na števi¬ lo zaposlenih. Čeprav druga populacija ni heterogena, je ven¬ dar manj homogena kot prva. Homogenost populacij je sicer po¬ gojena z opredeljujočimi pogoji, ni pa istovetna. Opredelitev v faktorialnih znakih ima za posledico manjše variiranje ozi¬ roma večjo sorodnost ne samo v opredeljujočih temveč tudi v rezultativnih znakih, ki niso opredeljujoči. Krajevna oprede¬ litev kmetijskih gospodarstev pogojuje homogeno populacijo glede na strukturo proizvodnje, način gospodarjenja ipd. 2.13 Delne populacije. Če v populaciji zaposlenih poroče¬ nih zena v Sloveniji konec leta 1972 dodamo pogoj, daT~ kot delavka; Tž prve populacf jnhXž 3 .- b cime—n o v o lpo- __ "oZJTTjrEUcTTo^iTnemrn^mo'' delno populacijo prvot ne.. zato ker je~xsaka enota druge~populacije hkrati enota prve zaposTena Tb"" je -PulacijoT populacije, Populacijo moremo po nekem znaku razdeliti v popoln sistem delnih populacij, če jo razdelimo v delne populacije po vseh vrednostih nekega znaka. Tako moremo populacijo vseh obrtnih obratov v Sloveniji konec leta 1972 razdeliti po stro¬ kah v popoln sistem delnih populacij. Delne populacije so bolj homogene kot osnovna populacija, ker se enote delnih populacij ujemajo še v dodatnem' pogojirr~Če populacijo razdelimo v popoln sistem delnih populacij po nadaljnjih faktorialnih znakih, he¬ terogeno populacijo razdelimb v sistem homogenih populacij, To metodo večkrat uporabljamo pri analizi množičnih pojavov. 2.14- Korespondirujoče populacije . Med nekaterimi momentnimi in intervalnimi populacijami je zveza, ki je nakazana z naslednjim zgledom. Če vzamemo momentno populacijo - prebi¬ valcev v začetku leta 1968 v SRS, smrt vsakega izmed teh pre¬ bivalcev vpliva na momentno populacijo - prebivalstvo konec leta 1968 tako, da se populacija za eno enoto zmanjša. Vsako rojstvo pa ima obraten učinek in se populacija prebivalcev za eno enoto zveča. Vsa rojstva v letu 1968 so intervalna popula¬ cija rojstev, vse smrti v tem letu pa intervalna populacija smrti. Iz zgleda vidimo, da sta dve momentni populaciji (pre¬ bivalstvo v začetku in prebivalstvo na koncu leta) odvisni od dveh intervalnih populacij (populacije smrti in populacije rojstev v letu). Število enot v posameznih populacijah pa je v tejle zvezi da ima statistični znak najmanj dve vrednosti, saj značilnost z eno samo vrednostjo ne more biti statistični znak, ker ne variira. Posebno važna je variabilnost numeričnih znakov. Kakor bomo videli kasneje, je variabilnost^numeričnih znakov osnova za najpodrobnej še proučevanje numeričnih pojavov. Statistične populacije 2 * 10 Opredelitev statistične populacije. Statistična p°Pala¬ cija je množica vseh istovrstnih pojavov - Bta tis-tični^ enot, ki izpolnjujejo opredeljujoče po^o,l_> ■- navedemo deljena. Statistično populacijo opredelimo tako da navedemo,_ kakšne vrednosti znakov, ki so oprede J D P ooredeljujejo meti enote, da so enote populacije. V enakih, ki opredeljujejo populacijo, je torej variacija okrnjena. Za populacijo ne velja samo množica vseh statistični^ enot v gornjem smislu, marveč je pop 1 3 smislu tudi mno žica kov za neki znak. Tako je populacija ^ v SRS no vseh podatkov o starosti poročenih zap stanju 31.12.1972. 2.11 Populacija mora biti nedvomno opredeljena: a) časovno, b) krajevno in c) stvarno. upravno razdelitev ter jh oŽehtivSo Odnosi podatki, ki so R a zen tega pa imajo večjo operativno v« £ dani za območja, skladna z upravno razdelitvijo. na eovne opredelitev je bolj problematična m je odvis¬ na od narave populacije, m jo proučuje . Po .Somjo populacijo žensk^smo^opr edelili^ sjrenutkom^ Populacije realnih e-ot o mam0 veliko. Vse časovno eno- populaci je. Momentnih populacij imamo ve 10^ posamezne'enote lično opredelimo z momentom ,J katerem mo ^ ^ Populacije zadoščati vsem axu to xm r & j * Časovna opredelitev populacij dogodkov z momentom ni^ smiselna. V določenem momentu se more zgoditi ins. ^ is _ mo omejeno m slučajno števno . , . * th dol i “ P°Pula C i j o r0 j ® aci i ^ d c •' r odkov * oprede iimo z razdobjem in^~"ysrS ! ki so se zgodili v določenem me _ razdobju in zadoščajo vsem drugim P°g 3 • p onredeliene nujemo intervalne ali razmicne populac 2_ , - Proizvodnja s časovnimi razmiki. Intervalne populacije so npr. proizvodnja, rojstva, nesreče, prodaja itd. 8 2.12 Homogene in heterogene populacije . Po sorodnosti enot so populacije homogene - istorodne in heterogene - raznorodne. V homogenih populacijah enote med seboj niso pre¬ več različne, medtem ko so heterogene populacije sestavljene iz raznorodnih enot. Homogenost populacije dosežemo, če jo o- predelimo po čim več faktorialnih znakih. Delitev populacij na homogene in heterogene ni ostra in imamo b.olj ali manj ho¬ mogene in bolj ali manj heterogene populacije. Tako je popula¬ cija obrtnih podjetij za določeno stroko, v katerih obrtnik razen sebe zaposluje enega samega delavca, bolj homogena kot populacija obrtnih podjetij za isto stroko ne glede na števi¬ lo zaposlenih. Čeprav druga populacija ni heterogena, je ven¬ dar manj homogena kot prva. Homogenost populacij je sicer po¬ gojena z opredeljujočimi pogoji, ni pa istovetna. Opredelitev v faktorialnih znakih ima za posledico manjše variiranje ozi¬ roma večjo sorodnost ne samo v opredeljujočih temveč tudi v rezultativnih znakih, ki niso opredeljujoči. Krajevna oprede¬ litev kmetijskih gospodarstev pogojuje homogeno populacijo glede na strukturo proizvodnje, način gospodarjenja ipd. 2.13 Delne populacije . Če v populaciji zaposlenih poroče¬ nih zena v Sloveniji konec leta 1972 dodamo pogoj, da je zaposlena kot delavka, iz prve populacije izločimo novo po¬ pulacijo. To populacijo imenujemo delno populacijo prvotne, zato ker je vsaka enota druge populacije hkrati enota prve populacije. Populacijo moremo po nekem znaku razdeliti v popoln sistem delnih populacij, če jo razdelimo v delne populacije po vseh vrednostih nekega znaka. Tako moremo populacijo vseh obrtnih obratov v Sloveniji konec leta 1972 razdeliti po stro¬ kah v popoln sistem delnih populacij. Delne populacije so bolj homogene kot osnovna populacija, ker se enote delnih populacij ujemajo še v dodatnem pogoju. Če populacijo razdelimo v popoln sistem delnih populacij po nadaljnjih faktorialnih znakih, he¬ terogeno populacijo razdelimo v sistem homogenih populacij. To metodo večkrat uporabljamo pri analizi množičnih pojavov. 2.14 Korespondirujoče populacije . Med nekaterimi momentnimi in intervalnimi populacijami je zveza, ki je nakazana z naslednjim zgledom. Če vzamemo momentno populacijo - prebi¬ valcev v začetku leta 1968 v SRS, smrt vsakega izmed teh pre¬ bivalcev vpliva na momentno populacijo - prebivalstvo konec leta 1968 tako, da se populacija za eno enoto zmanjša. Vsako rojstvo pa ima obraten učinek in se populacija prebivalcev za eno enoto zveča. Vsa rojstva v letu 1968 so intervalna popula¬ cija rojstev, vse smrti v tem letu pa intervalna populacija smrti. Iz zgleda vidimo, da sta dve momentni populaciji (pre¬ bivalstvo v začetku in prebivalstvo na koncu leta) odvisni od dveh intervalnih populacij (populacije smrti in populacije rojstev v letu). Število enot v posameznih populacijah pa je v tejle zvezi ( 2 . 1 ) - 9 - P ! = P + R - o Pri tem pomeni: = število prebivalcev konec leta; P Q = število prebivalcev v začetku leta; R = letno število rojstev; S = letno število smrti. Podobno so korespondiruj oče populacije tudi druge po¬ pulacije. Enako se vežejo na primer: začetna^zaloga-nabavlje- uo-porabljeno-končna zaloga; delavstvo na začetku meseca: na novo prišli-odšli-delavstvo na koncu meseca itd. Statistični parametri 2.15 S statističnimi P^^^g^o^sraž^nteTilSne^n kak ovostne 8 ^?i^b Z iS 3 r c S e popu^cii. Ne.atere^etne populacij dobimo s preprostim;I"aUsti5ni parameter datkov za vse enote populac 1 ^®* t v število kmetijskih gospo za populacijo kmetijskih ^ emo vse enote populacije, darstev N. ki ga dobimo, ce preštejemo vb^ kmeti;jskih gospo _ Parameter "skupna vrednost proi J proizvodnje vseh kme- darstev" dobimo, če seštejemo vrednost proizvocn^^ vsota tijskih gospodarstev v populacij * i parametre z anali- podatkov za populacijo ~*p m t n ™števanjem in seštevanjem v del ticno vrednostjo dobimo ze s P preštevanjem po delnih po- nih populacijah. Tako dobimo piu proizvodn; je, veliko- pulacijah število gospodarste P podatkov pa vrednost pro¬ sti gospodarstev itd., s sea nrt L s tvih po vrsti proizvodnje, izvodnje v vseh kmetijskih gospodarstvih po velikosti gospodarstev itd. D r ugi parametri, kot so relativna števila, srednje ve¬ likosti, mere variacije, mere koncentracije, mere sploščenosti m merp a o “i m H —*•-» -i a r\ ~r~\ o -r» o m O +-r.-i « Vatcrimi opisujemo in ana- analizo več mere asimetrije, so P^f 11 ® ^lackje^S^orelacijsko liziramo predvsem posameaterimi analiziramo odnose med pa dobimo parametre, s Kaxex r azlig n i m r statističnimi populacijami. 10 TRETJE POGLAVJE Statistično proučevanje 3.1 Statistično proučevanje socialnoekonomskih pojavov se¬ stoji v celoti iz več etap. Te so po svojem značaju in vlogi bistveno različne, vse pa so med seboj tesno povezane in odvisne druga od druge. Statistično proučevanje obsega nasled¬ nje etape: a) določitev vsebine in namena statističnega proučevanja, b) izdelava splošnega načrta proučevanja, c) opazovanje v ožjem smislu, d) urejevanje in osnovna obdelava, e) analitična obdelava in analiza podatkov. Medtem ko je določitev vsebine in namena opazovanja v najožji povezanosti s predmetom opazovanja in ustreznim podro¬ čjem, je splošen načrt več ali manj delo onih, ki statistično proučevanje izvajajo. Vrste statističnih opazovanj 3.2 Statistično opazovanje v ožjem smislu obsega zbiranje osnovnih podatkov od enot opazovanja. Glede na vrsto populacije, ki jo proučujemo, imamo več vrst statističnih opa¬ zovanj . Podatke o populacijah realnih enot, kot so npr. prebi¬ valstvo, kmetijska gospodarstva, industrijska podjetja ipd. zbiramo s popisom . S popisom zajamemo vse enote populacije, ki obstajajo ob določenem trenutku - kritičnem trenutku. Izvedba popisa je specifična glede na velikost populacije in glede na premikanje populacije. Velike populacije narekujejo posebno organizacijo dela, da v razmeroma kratkem času po kritičnem trenutku popišemo vse enote populacije. Veliko gibanje popula¬ cije (npr. prebivalstva) pa narekuje tako izbiro kritičnega trenutka, da je populacijo možno zajeti in da je stanje popu¬ lacije čimbolj normalno. Iz obeh razlogov npr. popisi prebival stva v poletnem času niso primerni. Populacije dogodkov časovno opredelimo s časovnim raz¬ mikom. Temu primemo je tudi opazovanje. Medtem ko opazujemo dogodek neposredno, ko se zgodi ali v razmeroma kratkem času po njem, populacijo dogodkov sestavljajo vsi dogodki, ki so se zgodili v enem mesecu, enem letu ipd. Podatke o dogodkih zbi¬ ramo s statističnimi poročili , ki obsegajo podatke o dogodkih v določenem časovnem razdobju. Značilno za nakazana opazovanja je, da zbiramo podatke za vse enote populacij. Dostikrat pa se zadovoljimo z ocenami 11 o populacijah, ki jih dobimo z delnim opazovanjem samo nekate¬ rih enot. P 0 sebno mesto med načini delnega opazovanja ima vzorčenje, ki je zasnovano na slučajnostnem izboru opazovanih enot. Ker je vzorčenje najpomembnejša metoda delnega opazova¬ nja, jo bomo obravnavali v posebnem poglavju. Z opazovanjem zbrani podatki so podani v izpolnjenih statističnih obrazcih, Z urejevanjem in osnovno obdelavo prevedemo te podatke v os¬ novne statistične vrste, ki so dane v obdelovalnih tabelah. Te obdelovalne tabele pa so osnova za analitično obdelavo in analizo podatkov. 3.3 Ker je celotna izvedba statističnega proučevanja dolg in drag posel in zahteva sodelovanje velikega števila najrazličnejših strokovnjakov, je delo pri statističnem prou¬ čevanju običajno deljeno. Specializirane ustanove - statistič¬ ni organi, ki so za to pooblaščeni, izvajajo statistična opa¬ zovanja in osnovno obdelavo podatkov za najrazličnejša podro¬ čja in te podatke publicirajo v publikacijah. Te publikacije so osnova za vsebinsko analitično obdelavo in analizo. Zaradi tega se s statističnim opazovanjem v ožjem smislu ne bomo podrobneje ukvarjali, pač pa bomo navedli nekaj osnovnih republiških in zveznih publikacij, ki jih izdajata Zavod SR Slovenije in Zvezni statistični zavod. Mesečni statistični publikaciji Zavoda SRS za Slove¬ nijo sta: Mesečni statistični pregled SR Slovenije in Družbeni razvoj SR Slovenije, ki daje kratko analizo podatkov. Redna publikacija pa je Statistični letopis, ki pa daje podatke o ozemlju in podnebju, družbeno politični ureditvi, prebivalstvu, zaposlenosti, druž¬ benem produktu in narodnem dohodku, splošni gospodarski pregled in letne podatke o dejavnosti posameznih panog in podatke po občinah. V samostojnih publikacijah izdaja zavod SR Slovenije podatke statističnih opazovanj, ki jih zavod izvaja. Razen te¬ ga v sistematičnih publikacijah izdaja: Statistične podatke po občinah, v Metodološkem gradivu pa šifrante, sezname, nomen¬ klature in navodila za izvajanje posameznih statističnih opa¬ zovanj. Podobni zvezni zavod za statistiko izdaja mesečne sta¬ tistične podatke v reviji Indeks. Od leta 1954 izhaja Statistični godišnjak SFRJ, ki po¬ dobno kot .statistični letopis daje kompleksen pregled stati¬ stičnih podatkov iz različnih področij. Popularna izdaja zveznega statističnega zavoda je: Statistički kalendar SFRJ, ki izhaja v vseh nacionalnih jezi¬ kih Jugoslavije in v štirih tujih jezikih. V kalendarju najde¬ mo osnovne statistične podatke za republike in SFRJ. 12 Redna letna publikacija je Demografska statistika, ki izhaja od leta 1950, Statistika spoljne trgovine, ki izhaja letno od 1946. Mesečni pregled medjunarodne statistike izhaja od leta 1968. Občasne, a stalne publikacije so: Statistički bilteni, ki vsebujejo rezultate iz vseh dejavnosti statistike. Metodo¬ loški materiali vsebujejo metodološke osnove in navodila za izvajanje statističnih opazovanj.* Študije, analize i prikazi prinašajo analitične obde¬ lave in prikaze posameznih gibanj in pojavov. Razen tega izdaja Zvezni zavod za statistiko Stati- stičko revijo, ki je trimesečni teoretični časopis. Statisti ka revija je organ JSD. j R a zen teh izdajaj.o mednarodne organizacije niz stati¬ stičnih publikacij, ki so vir, podatkov« Te publikacije so po¬ dobne kot naše publikacije, bodisi mesečne, letne ali občasne in prinašajo 'podatke iz mednarodne statistike. / ■ >0 13 ČETRTO POGLAVJE UREJEVANJE STATISTIČNEGA GRADIVA 4.1 Ko z opazovanjem zberemo podatke o populaciji, ki jo proučujemo, je populacija dana v nepregledni množici posamičnih obrazcev. Ta množica obrazcev in podatkov nadome¬ sti populacijo v obliki, ki je primerna za obdelavo. Zbrani obrazci so surovina, ki v nadaljnji obdelavi da končni proiz¬ vod - statistične tabele, grafikone, preglede in parametre, s katerimi analiziramo pojav. , Osnovna obdelava statističnih podatkov je urejevanje . Urejevanje sestoji iz razvrščanja v skupine, preštevanja in seštevanja statističnih enot in podatkov. Namen urejevanja so absolutni podatki o statistični populaciji, ki jih je z analitičnimi metodami možno obdelati in analizirati. Pri po¬ pisu prebivalstva npr. z urejevanjem ugotovimo sestavo pre¬ bivalstva po spolu, stanu, starosti, šolski izobrazbi, pokli¬ cu itd., skratka po vseh znakih in kombinacijah znakov, ki smo jih zbrali s popisom. Rezultate urejevanja prikazujemo s statističnimi vrstami v statističnih tabelah. Statistična vr¬ sta je osnovni način prikazovanja statističnih podatkov, tabe¬ la pa eden izmed načinov za prikazovanje statističnih vrst. Osnovni podatki, ki jih dobimo z urejevanjem, so osnova za preračunavanja in analizo. Razvrščanje vrednosti znakov 4.2 Grupne značilnosti uporabljamo že v vsakdanjem izra¬ žanju. Tako starost zaokrožujemo v starost v letih. Ce zaokrožujemo starost na izpolnjena leta, vzamemo za 26 let stare vse, ki so stari več kot 26 in manj kot 27 let. Če pa zaokrožujemo starost na najbližje leto, štejemo za 26 let stare vse, ki so stari od 25 in pol do 26 in pol let. Vse, katerih starost je v navedenem razmiku, štejemo da so stari enako - 26 let. Prav tako tudi osebne dohodke ne navajamo v parah, marveč v dinarjih. V vsakdanjem življenju ne zaokrožujemo samo numerič¬ nih, ampak na splošno vse znake. V kako velikih grupah se iz¬ ražamo, je odvisno od potreb in razmer, v katerih smo. Včasih ni dovolj,., če kdo reče, da je uslužbenec, zato je treba poklic natančneje določiti. Enako je s krajem stalnega bivališča. Če vas v Ameriki nekdo vpraša, odkod ste, je dovolj, da rečete, da ste iz Jugoslavije, čeprav je to razmeroma širok pojem. Ce vas pa nekdo, ki ve, da ste Ljubljančan, v Ljubljani vpraša, kje ste doma, morate navesti ulico, torej niti opredelitev, da ste Ljubljančan, ni zadostna. 14 - 4.4 V "bistvu iz istega razloga in po istih načelih kakor v vsakdanjem življenju grupiramo znake v skupine tudi v statistične namene . Natančne vrednosti dostikrat niso potrebne. Število vseh možnih vrednosti znaka je za nekatere znake veliko ali celo neomejeno. Zato je običajno prikladne je, da sorodne vrednosti združimo v skupinske vrednosti. Tako sicer izgubimo pri natančnosti, pridobimo pa pri' preglednosti. Se en razlog, ki ga pri grupiranju v vsakdanjem življenju ni, je odločilen za grupiranje znakov v statistiki. Šele pri grupnih znakih se za večino znakov pokaže množičnost pojavljanja, ki je ena iz¬ med bistvenih lastnosti množičnih pojavov. 4.5. Preden bomo obravnavali grupiranje posameznih vrst znakov v skupine, navedimo nekaj splošnih načel, ki veljajo za grupiranje vseh znakov. Grupiranje mora biti izvedeno pri vseh znakih opazova¬ nja enolično. Vse vrednosti znaka grupiramo v grupni znak tako, da vsaka osnovna vrednost znaka spada v eno in samo eno- grupo. Napačno bi bilo grupiranje, pri kaberem bi bila določena vred¬ nost v dveh ali več grupah istočasno ali' pa v nobeni grupi. To načelo zahteva, da smo posebno pazljivi pri mejnih vrednostih. Tako je pri časovnih grupah za dneve vprašanje, kam spada tre¬ nutek ob koncu enega dne in v začetku drugega dne. Pri geo¬ grafskih grupah more biti sporno, kam spadajo točke, ki so te¬ oretično na meji med dvema geografskima območjema. Grupe vseh znakov imajo tudi tole lastnost: grupe zna¬ kov moremo grupirati v grupe višje vrste enako kakor grupiramo osnovne vrednosti znakov. Tako moremo občine, ki so grupe prve stopnje, grupirati v rajone, ki so grupe druge stopnje, te v republike kot grupe tretje stopnje itd. Enako moremo ure zdru¬ ževati v dneve, te v mesece, mesece v leta, v petletja. Podob¬ no je tudi s stvarnimi znaki. Posamezne poklice grupiramo v najožje grupe poklicev, te grupe v širše 'grupe itd. Ta posto¬ pek ponavljamo, dokler grupiranje ne dovede do najširših grup oziroma do grupe, ki obseže vse vrednosti. Vsaka podrobnejša grupacija v tem stopnjevanju grup podrobneje določa poklice. Enako grupiramo predmete porabe, vzroke smrti itd. Vrednosti enega in istega znaka moremo grupirati po različnih načelih, tako da za isti znak dobimo več različnih grupacij. Ker posamezne vrednosti združujemo v grupe po sorod¬ nosti, daje načelo grupiranja merilo o sorodnosti. Načelo gru¬ piranja je v tesni zvezi s predmetom opazovanja, namenom in potrebami proučevanja pojava. Razen tega pri grupiranju vs,aka grupa običajno dobi neko ime - novo vrednost , ki pojmovno združuje vse vrednosti znakov za ustrezno grupo. Grupe dobe posebna imena: geografske grupe npr. imena občin, republik itd., časovne grupe datume, mesece, leta itd., stvarne grupe nazive grup poklicev itd. - 15 Razen skupnih načel in lastnosti grupiranja in grup, ki smo jih navedli, imajo posamezne vrste znakov svoje poseb¬ ne probleme. Te bomo obravnavali ločeno za vsako vrsto posebej. 4.6 Krajevne znake običajno grupiramo v področja po uprav¬ no političnem "vidiku . Ta grupacija je upravičena iz dveh razlogov. Porabnik statističnih podatkov, če ne gre za ne¬ ke posebne raziskave, potrebuje za svojo uporabo podatke po upravno-politični razdelitvi. Razen tega so upravno politične enote prikladne grupe, ker so že izdelane v druge namene. Za potrebe posebnega proučevanja se samo naslonimo na to razdeli¬ tev terena. Hiba upravno-politične razdelitve pa je v tem, da se ta razdelitev časovno menja. Zato je krajevno proučevanje dinamike pojavov otežkočeno ter zahteva razmeroma težavna pre¬ računavanja. Hiba pri grupiranju podatkov po upravno-politični teritorialni razdelitvi je tudi, da je načelo tega grupiranja za večino proučevanj formalno in ima zato omejeno analitično uporabnost. Marsikatera značilnost se namreč pri tem zabriše. Za proučevanje pojava je vsekakor bolje grupiranje po načelu, ki je v vsebinski zvezi s pojavom, ki ga proučujemo. Če upoštevamo to načelo, razdelimo teritorij v vsebinske geo¬ grafske grupe - rajone . Geografske rajone izdelujemo po različ¬ nih merilih in za različne potrebe. Rajonizacijo pa spremljajo tehnične težave. Izvesti rajonizacijo po nekem vsebinskem na¬ čelu je običajno zelo težko, ker moramo teritorij in razmesti¬ tev pojava, ki ga proučujemo, zelo dobro poznati. 4.7. Za časovne znake je sorodnost momentov običajno dana s časovnim razmikom med momenti. Po tem načelu dobimo na¬ ravne enote: minute, ure, dneve, tedne, mesece, leta. Izmed teh grup so najbolj problematični meseci, ker so različno dolgi (od 28 do 31 dni). Razlika med najkrajšim in najdaljšim mesecem je tri dni ali približno deset odstotkov. Še večje so razlike, če namesto koledarskih dni upoštevamo samo delovne dni. S posebni¬ mi prijemi reduciramo podatke tako, da lahko mesečne podatke primerjamo med seboj. Za proučevanje nekaterih pojavov uporabljamo drugačna načela grupiranja časa. Za proučevanje sezonskih vplivov so si sorodnejši vsi januarji, vsi februarji, vsi marci za vsa leta v določenem razdobju kakor pa januar, februar, marec itd. iste¬ ga leta, čeprav so prvi časovno bolj oddaljeni. Če proučujemo na primer turizem, gradbeništvo, poljedelstvo, je takoj razum¬ ljivo, da je res tako. Okoliščine za vsako od teh dejavnosti so v istih mesecih v zaporednih letih bolj sorodne kot v raz¬ ličnih mesecih istega leta. Enak problem je z grupiranjem dni v tednu, če proučujemo promet, prometne nesreče, porabo pijač itd. V tem' primeru tvorimo grupe vseh ponedeljkov, vseh torkov itd. Enako sestavljamo grupe iz določenih ur iz zaporednih dni, Če proučujemo nihanje v dnevni porabi električne energije ali vode v lokalnem prometu itd. \ 16 - 4.8 Grupiranje stvarnih znakov je bistveno različno za atributivne in za numerične znake. 4.9 Atributivne znake z velikim številom vrednosti običaj¬ no grupiramo tehnično po decimalni klasifikaciji . Osno¬ va decimalne klasifikacije je v tem, da največ po deset osnov¬ nih pojmov združimo v grupe prve stopnje, največ po deset grup prve stopnje v grupe druge stopnje itd. To grupiranje v grupe višjih stopenj ponavljamo toliko časa, da imamo največ deset grup zadnje stopnje. To načelo ni vsebinsko, temveč tehnično. Vsak pojem moremo namreč po decimalni klasifikaciji označiti s številom, ki ima toliko mest, kolikor stopenj ima grupiranje. To je zelo prikladno. Prva številka označbe po decimal¬ ni klasifikaciji pove, v kateri najširši grupi je določen po¬ jem, prvi dve mesti opredelita grupo po naslednji razdelitvi in tako dalje. Čim večmestno^pPzamemo, tem bolj je pojem določen. Za zgled podajamo prvo razdelitev blaga v statistiki zunanje trgovine (Vir: Nomenklatura statistike spoljne trgovi¬ ne SFR Jugoslavije, ki jo je v letu 1957 izdal Zvezni zavod za statistiko): 5 0. Prehrambeni proizvodi, 1. Pijače in tobak, a 2. Surovine, ki niso prehrambeni (razen goriv) proizvodi, 3. Mineralna goriva, maziva in sorodni proizvodi, 4. Živilska in rastlinska olja in maščobe, 5. Kmetijski pridelki, 6. Izdelki, klasificirani pretežno po materialu. 7. Stroji in transportne priprave. 8. Razni gotovi izdelki. 9. Razne transakcije in nikjer omenjeno blago. Izsek iz te nomenklature za izdelke iz lesa in plute pa je takle: 63 Izdelki iz lesa in plute (razen pohištva). 631 Furnir, vezane plošče, deske, umetno ali rekonstruiran in drugi les, obdelan neomejeno. Iz zgleda vidimo smisel in pomen decimalne klasifikaci¬ je. Prva številka v oznaki 631-01-11, s katero je zaznamovan normalen bukov furnir (6) pove, da normalen bukov furnir spada po klasifikaciji v grupo izdelkov, klasificiranih pretežno po materialu. Prvi dve številki (63) pomenita, da spada ta izdelek - 17 - v podgrupo izdelkov iz lesa in plute ("brez pohištva). Prve tri številke (631) oznake pomenijo, da spada navedeni izdelek v nadaljnjo podgrupo furnirjev, vezanih plošč, desk itd. Decimalna klasifikacija je zelo prikladna, ker številč¬ ne oznake nazorno pokažejo, v katero grupo po katerikoli grupa¬ ciji sodi posamezen pojav. 4.10 Pri grupiranju stvarno atributivnih znakov včasih vred¬ nosti, ki jih ne moremo grupirati v grupe ali pa za proučevanje niso bistvene, združimo v grupo "drugo". Seveda mo¬ ramo to grupo tvoriti tako, da ni preobširna. Včasih tvorimo tudi grupo "neznano", v katero zaradi popolnosti pregledov vključimo vse enote, za katere iz kateregakoli vzroka nimamo po¬ datkov. 4.11 Grupiranje za vrednosti stvarno-numerionih znakov mora ustrezati vsebinskim in tehničnim okoliščinam.Ker je analiza numeričnih znakov najbolj razvita, se pri grupiranju numeričnih znakov oziramo na formalno-tehnična načela grupira¬ nja, če le niso nedopustna iz vsebinskih razlogov. Za zgled grupiranja zveznega numeričnega znaka vzemimo skupno površino privatnih kmetijskih gospodarstev. V "Stati¬ stičnem godišnjaku 1972" imamo naslednje grupe: - 2 ha; nad 2 ha - 3 ha; nad 3 ha - 5 ha; nad 5 ha - 8 ha in nad 8 ha in več. 4.12 Grupe numeričnega znaka, ki jih imenujemo razrede, so določene s spodnj o mejo in z zgornjo mejo max « Nobena vrednost v razredu ni manjša od spodnje meje razreda in nobena ni večja od zgornje meje razreda. V posamezni razred spadajo vse vrednosti med spodnjo in zgornjo mejo razreda.Vsak razred ima svojo širino razreda i^, ki je razlika med zgornjo in spodnjo mejo razreda. x k ~ x k,max ~ x k,min (4.1) in sredino razreda x k , ki je polovica vsote mej razreda X + X k,min k,max x k - 2 (4.2) Kot smo navedli, ima na splošno vsaka grupa neko svo¬ jo vrednost. Tako vzamemo, da je pri numeričnih znakih sredi¬ na razreda reprezentant vseh vrednosti za razred - torej grup- na vrednost. Iz gornjega zgleda vidimo, da niso vsi razredi omejeni s spodnjo in zgornjo mejo. Zadnji razred v našem zgledu ima le 18 sponjo mejo (8 ha). Take razrede, ki so omejeni samo navzdol ali samo navzgor, imenujemo odprte razrede . Odprte razrede tvorimo, če je število enot, ki imajo vrednost nad ali pod neko mejo, majhno, podatki pa so med seboj zelo različni. Za gornjo grupacijo površin so širine razredov po vr¬ sti: 2 ha, 1 ha, 2 ha, 3 ha. Za zadnji razred ne moremo izra¬ čunati širine, ker je odprt. Sredine razredov pa so tele: 1 ha, 2,5 ha, 4 ha, 6,5 ha. Za zadnji odprt razred tudi sredi¬ ne razreda ne moremo izračunati. G-ornji razredi ustrezajo načelu enoličnosti in popol¬ nosti grupacije, ker vsaka vrednost spada v en in samo en raz¬ red. Pri gornjem grupiranju štejemo vrednosti, ki so na meji razredov, v spodnji razred, ker je spodnja meja razredov ozna¬ čena z nad, kar pomeni, da spodnja meja ni vključena v razred. Če hočemo meje razredov vključiti v zgornji razred, pa opišemo razrede takole: do pod 2 ha 2 ha do pod 3 ha 3 ha do pod 5 ha 5 ha do pod 8 ha 8 ha in več Ote gornji grupaciji sta enolični in kompletni. - 2 ha 2 ha - 3 ha; 3 ha - 5 ha; 5 ha - 8 ha; 8 ha - pa ni enolična, ker mejne vrednosti spadajo v dva razreda. v v 2 4.13 Površine gospodarstev ne merimo natančno do mm , mar¬ več jih običajno zaokrožujemo na are. Kot smo že ome¬ nili, pa je zaokroževanje numeričnih znakov dvojno: zaokrožu¬ jemo jih na najbližjo celo vrednost ali pa na največjo celo vrednost v enoti, v kateri navajamo podatek. Tako gospodarstvo ki ima 3 ha 27 a 58 m , po prvem načinu zaokrožimo na 3 ha 28 a, ker je stvarna površina bliže 3 ha 28 a kakor površini 3 ha 27 a, po drugem načinu pa je zaokrožena vrednost 3 ha27a, ker je 3 ha 27 a največja površina, navedena v arih, ki je manjša kakor stvarna površina gospodarstva. Če upoštevamo zaokroževanje podatkov na are, pišemo gornjo grupacijo površin takole: - 1,99 ha 2.00 ha - 2,99 ha 3.00 ha - 4,99 ha 5.00 .ha - 7,99 ha 8.00 ha - V gornjem zgledu smo iz vsebinskih razlogov vzeli raz¬ lične širine razredov. Iz tehničnih razlogov primernosti grupacije za nadalj¬ njo statistično obdelavo pa težimo, da so razredi enako široki in da grupacije nimajo odprtih razredov. - 19 - Tako na primer mesečne osebne dohodke grupiramo v grupe. - 799 din 800 - 999 " 1000 - 1199 " 1200 - 1399 " 1400 - 1599 " 1600 - 1799 " 1800 - 1999 " Širina razreda je v tej grupaciji enaka 200 din. Zato se tudi sredine razredov 900, 1100, 1300, 1500, 1700, 1900 ve¬ čajo v aritmetični postopici. 4.14 Grupiranje nezveznih znakov je podobno kakor grupira¬ nje zveznih znakov, le da vprašanje mej za nezvezne znake v praksi ni tako pereče kakor pri zveznih znakih. Če gru¬ piramo število zaposlenih v trgovinskih podjetjih v grupe po tri zaposlene, dobimo grupacijo nezveznega znaka po številu za¬ poslenih: 1-3, 4-6, 7-9, 10-12, 13-15, 16-18. Pri nezveznih znakih moramo paziti, katere vrednosti so meje razredov. Zgor¬ nja grupacija kaže, kot da ni popolna, ker se en razred konča s 3, drugi pa začne s 4. Vendar to ni res, ker more biti števi¬ lo zaposlenih samo celo število in med 3 in 5 ni vrednosti. Ta¬ ko navajanje razredov pa moti pri izračunavanju širine razre¬ dov. Razlike med tri in ena je dva, v razredu so pa tri vredno¬ sti: 1, 2, 3. Širina razreda je tri, ne pa dva. Vsem zmedam se izognemo, če obravnavamo tudi nezvezne znake kot zvezne in vsaki vrednosti priredimo enotin razmik tako, da je ustrezna vrednost sredi tega razmika. Vrednosti 1 priredimo razmik od 0,5 do 1,5, vrednosti 2 razmik od 1,5 do 2,5 itd. Tako sta meji prvega razreda ne 1 in 3, ampak 0,50 in 3,5. Razlika teh mej pa je resnična širina razreda (3,5 - 0,5 = 3,0). T a ko grupiranje in obravnavanje nezveznih znakov izenačimo z zveznimi. Pri zveznih znakih razmikom pripišemo kot reprezentatna sredino razreda, pri nezveznih pa posamezni vrednosti priredimo enotin razmik. 2000 - 2199 din 2200 - 2399 " 2400 - 2599 " 2600 - 2799 " 2800 - 2999 " 3000 - " 4.15 Sorodnost dveh numeričnih vrednosti merimo z razliko med vrednostima. Po tem merilu sta dohodka 800 in 850 din enako različna kot dohodka 2000 in 2050 din. Na prvi po¬ gled pa spoznamo, da je razlika med dohodkoma 800 din in 850 din večja kot med dohodkoma 2000 in 2050 dinarjev, čeprav je v absolutnem razlika v obeh primerih 50 din. Za merilo razlik in sorodnosti ni vedno ugodna absolutna razlika, temveč je boljša relativna razlika. Kadar so možne velike razlike med vrednostmi znaka, so za merilo o sorodnosti vrednosti primer¬ nejše relativne kakor pa absolutne razlike. Za take primere se¬ stavljamo razrede, za katere niso razlike, ampak kvocienti mej, konstante. Meje razredov za tako grupacijo so geometrično zapo ¬ redje. 20 Zgled za tako grupacijo v naši statistiki je grupira¬ nje industrijskih podjetij po številu delavcev. Podjetja so po številu delavcev grupirana v tele grupe: Kvocienti med mejami so stalni (2,00), razen v razredu 61 do 125, v katerem je 2,08, zato da so meje naslednjih raz¬ redov lahko prešle na naravnejše meje. 21 PETO POGLAVJE PRIKAZOVANJE STATISTIČNIH PODATKOV 5.1 Statistične podatke redkokdaj navajamo posamič, ker je bistvo statističnega proučevanja pojavov v primerjavi med podatki. Sorodne statistične podatke združujemo v stati ¬ stične vrste . te pa prikazujemo v tabelah ali grafikonih . Ta¬ belarični in grafični prikaz sta izvirna načina prikazovanja statističnih podatkov. Tabelarično in grafično prikazovanje statističnih podatkov se po svojih sredstvih med seboj razli¬ kujeta. Imata pa isti namen: čim nazorneje in pregledneje pri¬ kazati proučevano populacijo, tako da je analiza pojava čim lažja. Sredstva, s katerimi to dosežeta, pa so različna. Zato grafično prikazovanje ni enakovredno tabelaričnemu prikazova¬ nju statističnih podatkov ali narobe. Vsak način ima svoje prednosti in pomanjkljivosti. Neredko se tabelarični in gra¬ fični prikaz istih podatkov medsebojno dopolnjujeta in skupno pripomoreta k čim boljši sliki in analizi proučevanega pojava. Prednosti tabelaričnega prikaza statističnih podatkov so predvsem: a) v tabeli moremo prikazati po potrebi razmeroma veliko po¬ datkov; b) v tabeli prikažemo podatke s poljubno natančnostjo; c) tabelarični način je enostavnejši kakor grafični, ker so na¬ čela za sestavljanje dobrega tabelaričnega prikaza enotnej¬ ša kakor pri grafičnem prikazovanju, pri katerem za različ¬ ne statistične vrste in v različne namene uporabljamo raz¬ lične metode grafičnega prikazovanja. Prednost grafičnega prikazovanja v primerjavi s tabela¬ ričnim prikazom pa je predvsem v tem: a) v grafikonu nazorno odkrijemo zveze in odnose za več podatkov hkrati, to pa v tabe¬ laričnem prikazu ni možno; b) grafikon, s katerim hočemo popu¬ larizirati določen pojav, je bolj privlačen in neposreden kakor tabelaričen prikaz; c) z analitičnimi grafikoni statističnih podatkov uspemo včasih analizirati pojav neposredno brez dodat¬ ne analitične obdelave. Dostikrat pa da grafikon smernice za podrobno statistično obdelavo, kot je to npr. pri proučevanju odvisnosti med pojavi, proučevanju dinamike ekonomskih pojavov itd. Statistične vrste 5.2 Statistična vrsta je niz sorodnih statističnih podatkov, od katerih se vsak nanaša na eno izmed vrednosti ali na skupino določenega znaka. 22 Glede na to, po kakšnem znaku se razlikujejo med seboj posamezni členi statistične vrste, razlikujemo krajevne, časov¬ ne in stvarne statistične vrste. Stvarne statistične vrste pa dalje delimo v atributivne in numerične vrste, glede na to, ali statistična vrsta prikazuje podatke porazdeljene po atribu- tivnem ali numeričnem znaku. Iz opredelitve statistične vrste sledi, da se posamezni členi vrste nanašajo na vrednosti osnov¬ nega znaka. 5.3 V tabeli 5.1 je prikazana kot zgled krajevne ali geo¬ grafske vrste porazdelitev narodnega dohodka v SFRJ v letu 1965 po socialističnih republikah. Tabela 5.1 Narodni dohodek v SFRJ v letu 1965 po so¬ cialističnih republikah v mlj din (Vir: SGJ-67) Narodni dohodek v mlj din 5.4 je Časovna vrsta je npr. proizvodnja električne energije v SFRJ v razdobju 1952-1971 v tabeli 5.2, ki prikazu- dinamiko v proizvodnji električne energije v tem razdobju. Tabela 5.2 Proizvodnja eleketrične energije v SFRJ v razdobju 1952-1966 v mlj kWh (Vir: SGJ-72) Leto 1952 1955 1954 1955 1956 1957 1958 1959 1960 1961 1962 vodnja 2700 2982 3440 4340 5048 6252 7356 8106 8928 9924 11275 leto 1965 1964 1965 1966 1967 1968 1969 1970 1971 vodnja 15555 14189 15523 17174 18702 20641 23375 26023 29509 Statistična vrsta proizvodnje električne energije v ta beli 5.2 je intervalna časovna vrsta , ker prikazuje intervalne - 23 - podatke. Momentna časovna vrsta pa: je npr. število zaposlenih v družbenem sektorju na dan 30. septembra v razdobju 1957-1971 v SFRJ v tabeli 5.3. Tabela 5.3 Število zaposlenih dne 30. septembra v razdobju 1957-1971 v SFRJ (Vir: SGJ-72) Statistična vrsta v tabeli 5.3 je momentna časovna vr¬ sta, ker prikazuje število zaposlenih,v določenem momentu v vsakem letu. 5.5 Stvarno atributivna statistična vrsta je, npr. število zaposlenih v družbenem sektorju dne 30. septembra 1966 po gospodarskih dejavnostih, ki je prikazana v tabeli 5.4 T a bela 5.4 Število zaposlenih v družbenem in privat¬ nem sektorju v gospodarstvu v SFRJ na dan 30. septembra 1966 po panogah dejavnosti (Vir: SB 515) 5.6 Zgled za zve.zno numerično vrsto so poprečni skupni iz¬ datki za hrano na eho gospodinjstvo za štiričlanska delavska gospodinjstva z enim zaposlenim po višini skupnih razpoložljivih sredstev. - 24 - Tabela 5.5 Poprečni skupni izdatki za hrano na eno gospodinj¬ stvo v SFRJ za gospodinjstva s štirimi člani, a enim zaposlenim po višini skupnih razpoložljivih sredstev v letu 1963 (Vir: SB 429) Skupna letna razpoložljiva Poprečni skupni letni izdatki sredstva v tisočih din za hrano v tisočih din 5.7 Nezvezna numerična statistična vrsta pa je število an¬ ketiranih kmetijskih gospodarstev v kmetijski anketi v letu 1956 v Sloveniji po številu članov. Tabela 5.6 Število gospodarstev v kmetijski anketi v Sloveniji v letu 1956 po številu članov v gospodinjstvu (Vir: SB 113). Prikazane statistične vrste so po svojem značaju med seboj različne tudi po drugih lastnostih in ne samo po tem, da imajo za osnovo različne vrste znakov. Tabela 5.1 prikazuje se ¬ stavo skupnega narodnega dohodka v SFRJ po republikah. Enak značaj ima tudi statistična vrsta v tabeli 5.4, ki prikazuje sestavo števila zaposlenih po panogah dejavnosti. Prav poseben pomen imajo statistične vrste, kakršna je n pr. število kmetijskih gospodarstev po številu članov v tabe¬ li 5.6. Ta statistična vrsta prikazuje variabilnost števila elanov za anketirana gospodarstva. Take statistične vrste ime¬ nujemo frekvenčne distribucije . Ker so za analizo populacij o- snovne važnosti, jih bomo podrobneje poručevali v posebnem po¬ glavju. ^•8 Statistične tabele . Statistične vrste v zgledih iz od¬ stavka 5.7 so prikazane v tabelah. Statistične podatke n ajpogosteje prikazujemo v statističnih tabelah ali razpredel- n icah, ker je tabela najpreglednejši in najracionalnejši prikaz Podatkov. Tabela je s sistemom vrst in stolpcev razdeljena v po- v katera vpisujemo po določenem sistemu statistične po¬ datke. Dogovorno velja, da imajo vsa polja v isti vrsti isto vsebinsko oznako, ki je naznačena za vsako vrsto posebej v po¬ sebnem tekstualnem delu - čelu tabele. Enako imajo vsa polja v astem stolpcu enako vsebinsko oznako, ki je ustrezno naznačena v tekstualnem delu - glavi tabele. Pomen podatka v določenem P°lju dobimo, če križamo pomen ustrezne vrste s pomenom ustrez- ne ga stolpca, v katerem je polje oziroma podatek. Vsi ti pojmi so shematično nakazani v tabeli 5.7. Polje A v tabeli 5.7 je Polje za podatek o vzdrževanih ženskah v starosti izpolnjenih treh let. Tabela 5.7 Tabela 1 za obdelavo vzorca predhodnih rezultatov za popis prebivalstva 31.5.1953 v SPRJ 26 - ŠESTO POGLAVJE RELATIVNA ŠTEVILA 6.1 Že v poglavju o prikazovanju statističnih podatkov smo opozorili, da en sam statistični podatek, čeprav pomemben, dobi pravo vrednost šele tedaj, ko ga primerjamo z drugimi sorodnimi ali vsebinsko povezanimi podatki. Zaradi tega že v tabelah prikazujemo sorodne podatke tako, da je primerjava čim boljša. Vendar za proučevanje statističnih podatkov ni za¬ dostna le površna primerjava, kakršno dobimo iz statistične tabele osnovnih podatkov. Primerjavo podatkov zelo poglobimo in olajšamo z relativnimi števili. Veliko boljšo predstavo o številu prebivalstva v Sloveniji v primerjavi s številom pre¬ bivalstva Jugoslavije dobimo, če rečemo, da je v Sloveniji 8,66 io od skupnega števila prebivalstva Jugoslavije, kakor pa če navedemo, da je bilo v Sloveniji po popisu 31.3.1953 1,466.425 prebivalcev od skupnega števila 16,936.573 prebi¬ valcev v Jugoslaviji. Enako dobimo najboljši pregled o pri¬ rastku števila, prebivalstva v Sloveniji, če ga izrazimo re¬ lativno in rečemo, da se je število prebivalstva v razdobju med obema popisom 15.3.1948 in 31.3.1953 povečalo v Sloveni¬ ji za 5,36 io. Tako določenega in hitrega vtisa o povečanju niti ne dobimo, če povemo, da je bilo število prebivalstva 15.3.1948 1,391.873, 31.3.1953 pa 1,466.425 prebivalcev, ni¬ ti če povemo, da se je število prebivalstva v petih letih po¬ večalo za 74.552 prebivalcev. Tudi cena pri proizvajalcu je relativno število, ker je razmerje med proizvodnimi stroški in proizvedeno količino. Relativno število iz dveh podatkov, ki ju primerjamo, je v splošnem kvocient med primerjanima podatkoma. Jasno je, da enako kakor med seboj primerjamo le podatke, za katere je primerjava smiselna, izračunavamo tudi relativna števila le iz podatkov, ki so v medsebojni vsebinski povezavi. Te kvo¬ ciente izražamo v oblikah, ki so prikladnej še za prikazova¬ nje in analizo (npr. v procentih, indeksih itd.). Po tem, v kakšni zvezi sta si podatka, iz katerih iz¬ računamo relativno število, imamo: a) strukture ali razčlenitvena števila, kadar primer¬ jamo del s celoto (npr. od skupnega števila prebivalstva v Jugoslaviji je bilo v letu 1953 8,7 i v Sloveniji); b) koeficiente in gostote, kadar primerjamo raznovr¬ stne podatke, ki so v medsebojni zvezi (npr. proizvodnja je¬ kla na 1 prebivalca je bila v letu 1957 v FLRJ 54,7 kg/pre¬ bivalca) ; c) indekse, kadar primerjamo prirejene istovrstne po¬ datke (npr. indeks spremembe števila prebivalstva v Sloveniji od popisa 1948 do popisa 1953 je 105,4, že vzamemo število prebivalstva v letu 1948 kot 100,0). STRUKTURE ALI RAZČLENITVENA ŠTEVILA 6.2 Enostavne strukture . Volilne rezultate običajno ne objavljamo z absolutnim številom glasov, marveč z od¬ stotkom glasov, ki jih je kandidat dobil v primerjavi s skup¬ nim številom oddanih glasov. Šele odstotek dobljenih glasov namreč pokaže stvaren uspeh kandidata v določenem volilnem okolišu ali okraju. Število oddanih glasov za nekega kandidata ne pokaže uspeha zato, ker je bistveno odvisno od skupnega števila od¬ danih glasov. Isto število glasov, oddano za določenega kan¬ didata, pomeni uspeh, če je volilni okoliš majhen, in neuspeh če je volilni okoliš velik. Z odstotki dobljenih glasov pa ve likosti obeh okolišev računsko izenačimo. Odstotki namreč po¬ kažejo, koliko od skupno sto oddanih glasov je v povprečju do til kandidat N.N. v prvem in drugem okolišu. Zaradi tega le odstotek glasov meri uspeh kandidata in ne absolutno število oddanih glasov. Ta princip na splošno uporabljamo vselej, kadar hoče¬ mo pregledno in primerljivo prikazati notranji sestav stati¬ stičnih populacij. Največkrat ne izračunavamo samo enega strukturnega pokazatelja, temveč cele vrste struktur, ki na¬ zorno prikažejo sestav populacij. Strukture običajno izraža¬ mo v delih od celote ali v odstotkih. Če pa so deli izjemno majhni, izražamo strukture tudi v promilih. Strukturni koeficient y° dobimo, da delni podatek delimo s celoto. Strukturni odstotek dobimo tako, da delni podatek delimo s skupnim, kvocient pa pomnožimo s 100. Če izražamo strukturni delež v promilih, pa kvocient pomnožimo s 1000. Računski postopek moremo nakazati tudi z obrazci: Y - 100. h; 7^0 = 1000 . m (6.1) Pri tem pomeni: y^ = podatek za del populacije, y = podatek za populacijo, y^ = strukturni kvocient, y- [ $ = strukturni odstotek, y 1 $o = strukturni delež, izražen v promilih. 6.3 Uporabnost enostavnih strukturnih serij za statistič¬ no analizo moremo prikazati na primeru izvoza iz FLRS razdobju 19-34-1957 po stopnji obdelave izvoženih artiklov. 28 Tabela 6.1 Vrednost izvoza iz FLRJ po stopnji ob¬ delave izvoznih proizvodov v razdobju 1954-1957 (Vir SG 58) Spremembe v sestavu izvoza po stopnji obdelave za izvožene pro¬ izvode iz absolutnih podatkov ne vidimo neposredno, ker je sku¬ pen obseg izvoza od leta do leta različen. Če primerjamo abso¬ lutne vrednosti izvoza po posameznih stopnjah obdelave, opazi¬ mo, da se vse tri komponente v absolutnem časovno večajo. Šele časovne vrste struktur izvoza odkrijejo spremembe v strukturi izvoza. Analiza struktur pokaže, da je delež visoko obdelanih proizvodov v našem izvozu od leta do leta večji, kar je rezul¬ tat industrializacije. 6.4 Večkratne strukture . 0 e je populacija razdeljena po več znakih hkrati, moremo zanjo izračunati več vrst struktur. Vsaka od njih po svoje osvetli prikazano populacijo. Vzemimo kot primer razdelitev družbenega produkta v FLRJ v le¬ tu 1956 po elementih in gospodarskih sektorjih. Tabela 6.2 Družbeni produkt v FLRJ v letu 1956 po elementih in gospodarskih sektorjih v 10^ dinarjev (Vir: SG 58) - 29 - V tej tabeli moremo vzeti kot celoto najprej skupen družbeni produkt (1.612 milijard dinarjev) in izračunati v odstotkih, kakšen delež te celote je vsak izmed podatkov. Plače v sploš¬ no družbenem sektorju predstavljajo po tem principu 100 mi = U ' 4 f ° od skupnega družbenega produkta. Vsi odstotki, izračunani na tej osnovi, so dani v tabeli 6.3. Tabela 6.3 Struktura družbenega produkta v FLRJ v letu 1956 po elementih in gospodar¬ skih sektorjih Ta tabela struktur po svoje osvetli notranji sestav družbene¬ ga produkta. Z njo je možno primerjati sestav družbenega pro¬ dukta za druga leta, posamezne republike itd. Iz tabele 6.2 o sestavu družbenega produkta pa moremo izračunati tudi druge vrste struktur. Plače v splošno družbe¬ nem sektorju so del skupnega družbenega produkta, so pa isto¬ časno del družbenega produkta v splošno družbenem sektorju (1101 milijard din) in del skupnih plač (617 milijard din). Zaradi tega moremo razen zgornje tabele o sestavu izračunati še dve tabeli struktur. Tabela 6.4 Struktura družbenega produkta posamez¬ nih gospodarskih sektorjev po elementih - 30 - Tabela 6,5 Struktura elementov družbenega produkta po gospodarskih sektorjih V tabeli 6,4 vidimo velike razlike v sestavu družbenega pro¬ dukta po gospodarskih sektorjih. Medtem ko so na primer v splošnem sektorju plače samo 21,o $ družbenega produkta, pome¬ nijo plače v zadružnem sektorju 59,2 #, v privatnem pa celo 79,6 % od skupnega družbenega produkta. Analogno so velike razlike tudi v drugih elementih. Tudi tabela 6.5 je zelo poučna. Udeležba posameznega sektorja v vsakem izmed treh elementov je zelo različna in po svoje osvetli sestav družbenega produkta. Medtem ko je udelež¬ ba posameznega sektorja v skupni akumulaciji, fondih in amor¬ tizaciji razmeroma podobna, je udeležba v skupnih plačah bi¬ stveno različna. Grafično prikazovanje struktur Vpogled v sestav populacije dobimo zelo nazorno z gra¬ fikoni. Strukture moremo grafično prikazovati z vsemi vrstami grafikonov: s stolpci, krogi, linijami, figurami itd. 6.5 Strukturni stolpci . Z navadnim stolpcem prikažemo en sam podatek. Višina stolpca je v sorazmerju z veliko¬ stjo podatka, ki ga stolpec ponazarja. Če pa stolpec, ki pred¬ stavlja celoto, razdelimo v sorazmerju s sestavom populacije, dobimo strukturni stolpec, ki prikaže strukturo populacije. V e č sorodnih strukturnih stolpcev pa nazorno pokaže spremembe oziroma razlike v strukturi. Vzemimo kot primer vrednost izvoza iz Jugoslavije po stopnji obdelave v razdobju 1954-1957 iz tabele 6.1, Struk¬ turni stolpci iz absolutnih podatkov v tej tabeli so prikaza¬ ni v sliki 6,la. Primerjavo sprememb v strukturi izvoza motijo različno visoki stolpci. Razlike v velikosti populacij tudi v grafikonu motijo vpogled v razlike v sestavu, čeprav so iz grafikona spremembe v strukturi le bolj vidne kakor iz tabele absolutnih podatkov. Veliko bolj neposredno je sprememba strukture izvoza vidna iz slike 6.Ib, v kateri je struktura izvoza v posameznih letih prikazana v odstotkih z enako visokimi stolpci. Pri tem sicer izgubimo pregled o spremembah v skupni vrednosti izvoza, vendar boljši pregled o spremembah v sestavu izvoza odtehta to pomanjkljivost. To pomanjkljivost včasih odpravimo tako, da v isti sliki z linijskim grafikonom ponazoi'imo gibanje skupne vrednosti. 6.6 Strukturni stolpci večkratnih struktur. Širina struk- turnih stolpcev iz prejšnjega primera je enaka za vsa leta. Moremo pa stolpce risati široke v sorazmerju z obsegom Populacije. Vrsta takih strukturnih stolpcev pokaže spremembe v skupni velikosti pojava. Kljub temu pa so vsi strukturni stolpci enako visoki, da je iz njih neposredno vidna spremem¬ ba v strukturi. Ta postopek s pridom izkoriščamo za prikazova¬ nje večkratnih struktur. a) h) Slika 6.1 Struktura vrednosti izvoza iz SFRJ po stopnji obdelave izvoženih pro¬ izvodov (Vir: Tabela 6.1) Vzemimo za primer strukturo družbenega produkta v SFRJ v letu 1956 po gospodarskih sektorjih in elementih iz tabela 6.2. Celoten družbeni produkt ponazorimo s kvadratom. - 32 - Strukturo družbenega produkta pa prikažemo tako, da kvadrat razdelimo v sorazmerju z deležem posameznega sektorja v ce¬ lotnem družbenem produktu. Celoten družbeni produkt je tako razdeljen v tri navpične stolpce, katerih širina je v soraz¬ merju z deležem posameznega sektorja. Če vsakega izmed teh treh stolpcev razdelimo v navpični smeri v sorazmerju s se¬ stavom družbenega produkta za posamezni sektor po elementih, dobimo sliko 6.2a. Ta je fotografija tabele 6.4. Iz tega gra¬ fikona je zelo nazorno vidna struktura družbenega produkta po sektorjih, predvsem pa razlike v sestavu, med sektorji. Poleg tega je ploščina posameznega pravokotnika v kvadratu sorazmerna z absolutno velikostjo določenega elementa oziro¬ ma s strukturnimi odstotki iz tabele 6,4. Če kvadrat, ki je okvir grafikona, razdelimo najprej v sorazmerju s sestavom skupnega družbenega produkta po ele¬ mentih, dobljene delne stolpce pa, podobno kakor v prejšnjem primeru, v sorazmerju s sestavom posameznega elementa po sek¬ torjih, dobimo sliko 6.2b; ta grafično pove isto kakor tabe¬ la 6.5. la £ a) ‘ b) Slika 6.2 . Struktura družbenega produkta v SFRJ v letu 1956 po elementih in gospodarskih sektorjih 6.7 Li nijski gr af ikoni struktur, Vrste struktur moremo prikazati tudi z linijskimi grafikoni, če se vrste med seboj razlikujejo v numeričnem ali časovnem znaku. Kot primer vzemimo dinamiko strukture socializacije trgovine na malo v razdobju 1947-1956 v SFRJ, - 33 Tabela 6.6 Število trgovin po sektorju lastništva v razdobju 1947-1956 v SFRJ (Vir: SG- 57) Podatki iz tabele 6.6 so prikazani v sliki 6.3 tako, da so podatki za posamezne sektorje naneseni drug nad drugega. Za leto 1947 npr. s točkami vnesemo podatek 6464, podatek 6464+ + 3510 = 9974, nadalje 9974 + 12128 = 22102 in končno 22102+ 26452 = 48554. Če enako vrišemo strukturo za ostala leta in zvežemo ustrezne točke, dobimo linijski grafikon, v katerem posamezni pasovi ponazarjajo dinamiko števila trgovin v posa¬ meznem sektorju lastništva. Ker je leto 1939 odtrgano od zvez¬ nega razdobja 1947-1956, je struktura za leto 1939 vrisana v stolpcu. Iz grafikona moremo lepo slediti socializacijo v tr¬ govini in dinamiko strukture v socialističnem sektorju. Kot vidimo, se je struktura v letih 1952-1956 zelo stabilizirala. Enako kakor smo prikazali strukturo z linijskim gra¬ fikonom absolutnih podatkov, moremo prikazati tudi vrste strukturnih odstotkov. Ta slika še nazorneje pokaže dinamiko strukture kot slika absolutnih podatkov, izgubimo pa sliko o spremembah skupnega števila trgovin. V sliki 6.4 je z linijskim grafikonom prikazana struktura števila trgovin na malo iz tabele 6.7. - 34 - 10 trg«vn *> So So 3« 2o 1o - 1737 11*7 1-71** 17*7 < 75 o 1751 i7r» 47« <7S> ^rr <9« družbene. Slika 6.3 Struktura števila trgovin na malo v SFRJ v razdobju 1947-1956 po sektorjih last¬ ništva * »7- ‘ f ■ * ■ v - i " r i w ' w i v ^ w r ' w y n --*—n*-1 1717 *T *7 « 7 *»* <«in 17« 4 7 r ^ *l rH < 7 Jrf ^ f6 Slika 6.4 Struktura števila trgovin na malo v SFRJ v razdobju 1947-1956 po sektorju lastni¬ štva 35 Tabela 6.7 Struktura števila trgovin na malo v razdobju 1947-1956 v SFRJ po sektor¬ ju lastništva 6.8 Strukturni krogi . Za prikazovanje struktur se izkaže primeren tudi krog, ker krog nazorno prikazuje celoto. Za strukturne dele celote vzamemo krogove izseke, kot posamez¬ nega izseka pa je v sorazmerju z velikostjo strukturnega dele¬ ža. Ker četrtina kroga ponazarja 25 polovica kroga pa 50 $, moremo s pogledom enostavno oceniti strukturne deleže. Ker imamo običajno kotomere z ločnimi stopinjami, mo¬ ramo strukturne deleže Y pred risanjem preračunati po obraz¬ cu Y® t = 3y6.Y 1 ^> (6.2) v ločne stopinje Y®" t . Kot primer bomo prikazali strukturo osebne potrošnje materialnih dobrin in proizvodnih uslug za prebivalstvo v SFRJ v letu 1956. - 36 - Tabela 6.8 Struktura osebne potrošnje materialnih dobrin in proizvodnih uslug prebivalstva v SFRJ v letu 1956 (Vir: SG 58) Ločne stopinje smo izračunali: 3,6 . 52,0 = 187° Posamezne postavke so zaradi preglednosti v tabeli in grafikonu nanizane po velikosti,. To olajša in izboljša pregled. V sliki so v ustreznih izsekih vpisani odstotki in shematično ponazorjena vsebina podatka, kar olajša čitanje grafikona. Po¬ sebnost tega grafikona je tudi v tem, da so izseki kroga za manjše postavke povečani. Tako izboljšamo preglednost teh po¬ datkov. Če imamo več strukturnih vrst, ki jih med seboj pri¬ merjamo, strukturni krogi običajno niso prikladni. Primerlji¬ vost med strukturami, če so prikazane s krogi, je namreč ve¬ liko slabša, kakor če uporabimo stolpce ali linije. Kljub te¬ mu včasih kroge uporabljamo za prikazovanje struktur. Uporab¬ ni so npr. za prikazovanje regionalnih sprememb struktur. Strukturne kroge v tem primeru vnašamo v ustrezna področja v mreži geografske karte. Ta način je razmeroma ugoden zaradi primerne oblike kroga. Razen tega pa tudi strukturni stolpci v tem primeru niso neposredno primerljivi. 6.9 Tudi strukture dveh populacij, ki sta si v zvezi, ta¬ ko kakor npr. uvoz in izvoz, nabavljeno in prodano, dohodki in izdatki, dostikrat prikazujemo s krogi tako, da po¬ samezno populacijo prikažemo s polovico kroga. Strukturne od¬ stotke Y-j$ v tem primeru izračunamo v ločne stopinje Y| t po obrazcu Y® t = 1,8 . Y 1 5t (6.3) ker celoto predstavlja le 180°. Ce ne upoštevamo absolutno velikost pojava, imata obe polovici kroga isti radij. Zaželeno pa je, da z velikostjo . kroga nakažemo velikost pojava. Ker mora biti ploščina, ne pa radij kroga ali polkroga, proporcionalne velikosti pojava, - 37 - Slika 6.5 Struktura osebne potrošnje materialnih dobrin in materialnih uslug za prebi¬ valstvo SFRJ v letu 1956 (Vir: tabela 6.8) , radije krogov, za katere želimo, da so njihove ploščine v so¬ razmerju z velikostjo pojava, izračunavamo po obrazcu r 1 ( 6 . 4 ) Pri tem pomeni: r = znan radij kroga, ki ustreza podatku Y Q , r^ = radij kroga, za podatek Y-^. Običajno vnaprej določimo radij kroga za največji podatek, radije vseh drugih krogov pa izračunamo po obrazcu 6.4, Za primer vzemimo strukturo vrednosti izvoza in uvo¬ za SFRJ v letu 1956. I - 38 - Tabela 6.9 Struktura vrednosti izvoza in uvoza SFRJ v letu 1956 IZVOZ Slika 6.6 Struktura vrednosti izvoza in uvoza SFRJ v letu 1956 (Vir: tabela 6.9) - 39 - Ker smo se odločili, da bo radij večjega polkroga (za izvoz) enak 4 cm, izračunamo radij polkroga za uvoz po obrazcu Iz grafikona sklepamo poleg strukture tudi na razmerje med uvozom in izvozom, kar je razvidno iz različnih velikosti polkrogov. Razen tega je absolutni iznos vpisan sredi pol¬ krogov. Struktura med izvozom in uvozom pa ni neposredno primerljiva. 6.10 Primerjava strukture izvoza s strukturo uvoza pa je veliko bolj neposredna v sliki 6.7. V tej sliki si mislimo, da je strukturni krog za izvoz (manjši krog) položen koncentrično na strukturni krog za uvoz (večji krog). Ker so izseki kroga za ustrezne skupine proizvodov blizu skupaj, je primerjava struktur veliko boljša. Da še izboljšamo primerja¬ vo ustreznih krogovih izsekov, je krožnica manjšega kroga na mestih, kjer se stikata ustrezni skupini, nepoudarjena. legend*, pri st. 4.6 Slika 6.7 Struktura vrednosti izvoza in uvoza SFRJ v letu 1956 (Vir: tabela 6.9) 40 - 6.11 Strukture v trikotniku. Ker je vsota vseh strukturnih odstotkov za vsako populacijo enaka 100 moremo strukture populacij, ki so razdeljene v tri dele, prikazati s točko v tako imenovani trikotniški mreži oziroma koordinatnem sistemu. Ta način je za strukture s tremi členi zelo prikla¬ den. Več sorodnih strukturnih vrst po tri člene moremo v njem enostavno prikazati s toliko točkami, kolikor imamo struktur¬ nih vrst. V sliki 6.8 je prikazana struktura števila trgovin po sektorju lastništva v razdobju 1947-1956 iz tabele 6.7. Iz grafikona vidimo, da je na vsaki stranici enakostraničnega trikotnika skala odstotkov za enega izmed sektorjev lastništva. Trikotnik je razdeljen z mrežo vzporednic k posameznim osem. V sliki 6.8 je za leto 1947 nakazano, kako odčitamo na posa¬ meznih skalah odstotke za posamezen sektor. Črte za 50 f> so odebeljene. Tako je trikotnik razdeljen v štiri manjše enako¬ stranične trikotnike. Točka v notranjem trikotniku nakaže strukturo, v kateri noben izmed treh odstotkov ni večji kot 50 točke v drugih trikotnikih pa nakazujejo strukture, v katerih je ustrezni odstotek večji kot 50 y>. Tako dobimo nepo¬ sredno grobo orientacijo o strukturi že iz razdelitve na te štiri dele. V našem primeru sta točki za leti 1939 in 1947 v trikotniku, v katerem je privatni sektor nad 50 $>, od leta 1948 dalje pa so vse točke v trikotniku, v katerem je odsto¬ tek državnega sektorja nad 50 Iz slike 6.8 nazorno vidimo velike spremembe v struk¬ turi trgovine na malo od leta 1948, ko je bil iz trgovine na malo elimiran privatni sektor, od tega leta dalje pa je vidno napredovanje državnega sektorja in nazadovanje zadružnega sek- Slika. 6.8 Struktura števila trgovin na malo po sektorju lastništva v SFRJ v razdobju 1947-1956 41 - 6.12 Druge metode prikazovanja struktur, Ker si moremo' predstavljati bilančne podatke kot tok, ki na eni strani doteka, na drugi pa odteka, strukturo bilanc nazorno prikažemo po metodi, ki je nakazana s v sliki 6.-9.' .Grafikon ponazarja izvoz in razdelitev' bruto■ .investicij' v',letu 1956 v SFRJ. Posamezni deli izvora in*razdelitve so risani shema¬ tično kot kanali, kar vzbuja vtis o dotoku -in odtoku. Slika 6.9 Struktura izvora sredstev in razdelitve bruto investicij v SFRJ v letu 1956 (Vir: SG 58) 6.13 Zelo nazoren je tudi grafikon v sliki 6.10. V njem je prikazano, kolikšen del od skupnega števila posa¬ meznih vrst živine so imela po popisu zemljiških gospodarstev v letu 1947 gospodarstva pod oziroma nad 4,7 ha skupne povr¬ šine. Ta površina je mediana za velikost gospodarstev, ali površina, od katere je polovica gospodarstev manjših, polovi¬ ca pa večjih. Iz grafikona vidimo, da so ti odstotki za posa¬ mezne vrste živine zelo različni. 50 tfo malih gospodarstev je imelo v letu 1947 v Sloveniji samo 15 i° od skupnega števila konj, 24 io ovac, 32 c fo govedi, 37 $ prašičev, 46 $ perutnine in 77 io koz. Iz tega moremo sklepati, da imajo konje predvsem večja gospodarstva, da pa je koza tipično domača žival malih gospodarstev, da perutnino precej enako rede mala in velika gospodarstva itd. Struktura je prikazana za vsako vrsto živine z deseti¬ mi shematičnimi figurami, ki so pomaknjene glede na strukturo na levo ali desno od črte, ki razmeji grupo manjših gospodar¬ stev od grupe večjih gospodarstev. 42 •H Šiita 6.10 Struktura Števila živine v malih in velikih zemljiških gospodarstvih v Sloveniji v letu 1947 (Viri Fopis zemljiških gospodarstev v Sj. 0 ven.i 3 leta 1947 - 43 - STATISTIČNI KOEFICIENTI IN GOSTOTE Izračunavanje statističnih koeficientov 6.14 Strukturne odstotke dobimo,- če primerjamo del s celo¬ to. Primerjana podatka sta torej istovrstna, rezultat, ki ga dobimo, pa je neimenovano število. Običajno ga izražamo v odstotkih. Smiselna pa je tudi primerjava raznovrstnih po¬ datkov, če zadoščajo nekim osnovnim pogojem primerljivosti. Primerjana podatka morata biti namreč v vsebinski zvezi in ena ko opredeljena. Primerjati moremo število prebivalstva s skup¬ no površino. Ta primerjava pokaže gostoto prebivalstva. Pri¬ merjava proizvodnje s številom ur, ki so bile potrebne za iz¬ delavo te proizvodnje, pokaže produktivnost dela itd. Nima pa smisla primerjati npr. vrednosti proizvodnje na nekem območ¬ ju s številom tifusnih obolenj na istem območju, ker ta dva pojava nista v vsebinski zvezi. Promet v trgovini na drobno v Sloveniji v decembru 1958 pa je smiselno primerjati le s številom prebivalstva v SRS in ne v SR Hrvatski in le s sred¬ njim številom prebivalstva v decembru 1958 in ne za kako dru¬ go razdobje, le tako je koeficient smiseln. Osnovni pogoj, da moremo iz dveh podatkov izračunati statistični koeficient je torej, da je primerjava umestna, primerjani podatki pa enako opredeljeni. Smiselnost primerjave je dostikrat zvezana z oprede¬ litvijo primerjanih populacij. Če izračunavamo npr. koefici¬ ent nepismenih, ne vzamemo v primerjavo vsega prebivalstva, temveč se omejimo samo na prebivalstvo, staro nad deset let, da tako izključimo iz primerjave otroke. Enako ravnamo pri izračunavanju drugih pokazateljev, npr. pri izračunavanju porabe alkoholnih pijač na prebivalca itd. Ker koeficiente izračunavamo iz raznovrstnih podat¬ kov, tako da primerjana raznovrstna podatka med seboj deli¬ mo, statistični koeficienti niso neimenovana števila, temveč imajo svojo enoto mere; ta je izpeljana iz enot mere primer¬ janih podatkov. Če npr. primerjamo število prebivalstva v Sloveniji po popisu 31.3.1953 (1,466.425 prebivalcev) s površino Slo¬ venije ob istem popisu (19992 km ), dobimo gostoto prebival¬ stva v Sloveniji 31.3.1953. gostota prebivalstva 1466425 prebivalcev 19992 km 2 73,4 prebi¬ valcev /km 2 Gostota prebivalastva v Sloveniji je torej bila 73,4 prebi¬ valcev na kvadratni kilometer. Ta podatek je računska fikcija in pomeni, da bi bilo ob popisu na vsak kvadratni kilometer 73,4 prebivalca, če bi bilo prebivalstvo enakomerno razpore¬ jeno po teritoriju Slovenije. Kljub temu pa ima ta koeficient 44 - svojo analitično vrednost, ker pokaže večjo ali manjšo nase¬ ljenost na določenem teritoriju. Ob istem popisu je bila gostota prebivalstva v dru¬ gih republikah:^v Srbiji 79,0, Hrvatski 69,7. BiH 55,7, Ma¬ kedoniji 50,7, Črni gori 30,4 prebivalcev/km^. Vidimo, da je gostota prebivalstva po republikah zelo različna in da je bila najmanjša v Črni gori (.30,4 preb./km^), največja pa v Srbiji (79,0 preb./km 2 ). 6.15 Koeficienti iz intervalnega in momentnega podatka. Ker izhajata primerjana podatka, iz katerih izraču¬ navamo koeficiente, iz različnih populacij, naletimo na te¬ žavo pri opredelitvi, če je ena od primerjanih populacij intervalna, druga pa momentna. Pogoj za izračunavanje koefi¬ cienta je namreč, da sta obe populaciji enako opredeljeni. To pa na pogled ni možno, če je ena populacija momentna, druga pa intervalna, ker je prva opredeljena z momentom, druga pa z razmakom. Zato se zdi, da ne moremo primerjati število umrlih (intervalna populacija) s številom prebival¬ stva (momemtna populacija), ker se število umrlih nanaša na določeno razdobje, npr. leto, število prebivalstva pa moremo ugotoviti samo za določen moment. V takih primerih si poma¬ gamo s tem, da momenten podatek spremenimov intervalen tako, da izračunamo povprečje. Medtem ko ne moremo izraziti, kolik¬ šno je število prebivalstva v določenem razdobju, moremo za to razdobje izračunati povprečno število prebivalstva. Da moremo za določeno razdobje izračunati povprečje za momentni podatek, je potrebno, da poznamo podatek vsaj za nekaj momentov v tem razdobju. Tako moremo izračunati povprečno število delavcev v nekem podjetju v letu 1958, če poznamo število delavcev v začetku ali v sredini posameznih mesecev v tem letu. Povprečno število prebivalstva v petlet¬ nem razdobju moremo izračunati, če poznamo število prebival¬ stva v začetku vsakega leta ali v sredini leta za vsa leta petletja. Povprečno zalogo v letu pa dobimo, če poznamo sta¬ nje zalog ob koncu vsakega črtrtletja itd. 6.16 Povprečja momentnih podatkov izračunavamo glede na to, s kakšnimi podatki razpolagamo, na dva načina: a) če imamo razdobje, za katerega izračunavamo pov¬ prečje, razdeljeno na r enakih razmakov (leto na 12 mesecev, četrtletje na 3 mesece, mesec na 3 dekade, petletje na 5 let itd.), za vsak tak delen razmak pa dan momenten podatek za sredino razmaka (sredine mesecev, sredine dekad, sredine let itd.), izračunavamo povprečje po obrazcu 'Y = ~ (Yi + Y 2 + . + Y r _ x + Y r ) (6.5) tako, da seštejemo vse podatke, vsoto pa delimo s številom osnovnih razmakov r. - 45 - Po tem obrazcu izračunavamo npr, povprečno število delavcev, če poznamo število delavstva sredi meseca, povpreč¬ no število prebivalstva v petletki, če poznamo število prebi¬ valstva sredi posameznih let itd. b) Če pa Je razdobje, za katerega izračunavamo povpreč¬ ja, razdeljeno na r enakih razmakov, razpolagamo pa s podat¬ ki za začetke oziroma konce teh razmakov, izračunamo povprečje po obrazcu tako, da vsoto polovičnih vrednosti podatkov na začetku in koncu celotnega intervala (Y in Y ) in celih vrednosti osta¬ lih podatkov na začetku ali koncih delnih razmakov delimo s številom osnovnih razmakov r. Če imamo npr. število delavstva na začetku oziroma na koncu posameznih mesecev, izračunati pa je treba povprečno število delavstva v letu, vzamemo polovico števila delavstva 1. januarja, število delavstva 1. februarja, 1. marca, 1. aprila itd. do 1. decembra in polovično število delavca 31. decembra. Vsoto vseh teh vrednosti pa delimo z 12. Če vzamemo, da je razdobje, za katerega hočemo izra¬ čunati povprečje, sestavljeno iz enega samega osnovnega in¬ tervala (r = 1), dobimo po obrazcu 6.5, da je Y = Y^. Iz te¬ ga sledi, da moremo povprečje nadomestiti s stanjem v sredi¬ ni intervala. Tako npr. nadomeščamo povprečno število prebi¬ valstva s "srednjim številom prebivalstva", to je s številom prebivalstva sredi leta (30. junija). Če je r = 1 obrazec 6.6 degenerira v 1 - <1 y 0 + ? * 5 {y 0 + n 5 - To pomeni, da mo-remo povprečje nadomestiti s polovično vred¬ nostjo med začetnim in končnim stanjem v osnovnem razmaku. 6.17 Ko imamo izračunano povprečje iz moraentnih podatkov, izračunamo koeficient po obrazcu K = (6.7) ? . i pri čemer pomeni: K = koeficient, X = intervalni podatek, 7 » povprečje momentnegi podatka, i ** dolčina časovnega raz¬ dobja, za kaverega izračunavamo koeficient, E = 100, 1000, 10000, odvisno od tega, na koliko enot momentnega podatka izračunavamo koeficient. 46 - 6.18 Ker je npr. koeficient natalitete Število rojenih v enem letu na 1000 prebivalcev, i ■ačunamo koeficien¬ te natalitete za SFRJ v razdobju 1951-1955 takole: Povprečno število prebivalstva v tem razdobju je 7 = 17067000, število rojenih X = 2395816, razdobje i = 5 let, koeficient pa je računan na E - 1000 prebivalcev. Is teh podat¬ kov dobimo K a '^170^700075° 0 rojstev na leto na 1000 prebivalcev. Podobno izračunavamo vse druge koeficiente, ki imajo za osnovo primerjavo intervalnega podatka z momentnim. Po tem obrazcu moremo izračunati koeficiente tudi za razdobja, ki so krajša od enotinega razdobja. Tako npr. koe¬ ficient mortalitete, ki je po definiciji število umrlih v le¬ tu na 1000 prebivalcev, za Slovenijo v januarju 1958 izraču¬ namo takole: Ker je bilo srednje število prebivalstva v janu¬ arju 1958 7 = 1,556.578, število umrlih v januarju 1958 X = 1464, E = 1000, i = 31/365, je koeficient mortalitete enak v 1464 . 1000 * 0 1556578 , 31/365 11,1 umrlih na leto na 1000 prebivalcev. To pomeni: Če bi bila v Sloveniji leto dni umrljivost taka kakor v januarju 1958, bi v enem letu umrlo n? 1000 prebi¬ valcev 11,1 oseb. 6.19 Koeficient obračanja zalog pove, kolikokrat oe zaloga blaga ali surovin obrne, v enoti časa. Izračunavamo ga tako, da primerjamo promet določenega blaga ali porabo surovin z ustreznimi povprečnim.! zalogami. Iz mesečne industrijske službo SZ SRS imamo za podjet¬ je A iz nekovinske stroke podatke o porabi in zalogah kremeno¬ vega peska v prvem polletju 1958 po mesecih. Taoela 6*10 Mesečna zaloga in poraba kremenovega peska v podjetju A iz nekovinske stroke v prvem polletju 1°58» (Vir: ZS SRS) Izračunati Je treta koeficient obračanja zalog kreme¬ novega peska v prvem polletju 1958, izražen s številom obratov zalog v enem mesecu. Po postopku za izračunavanje koeficientov moramo iz podatkov v tabeli 6.10 izračunati skupno porabo kremenovega peska v prvem polletju 1958 in povprečno zalogo v tem razdob¬ ju. Skupna poraba v polletju Je vsota mesečne porabe za ustre¬ znih šest mesecev. X = 494 + 489 + 562 + 468 + 465 + 544 = 3 022 t Povprečno zalogo Y pa izračunamo po obrazcu 6.6, ker imamo podatke za konec mesecev. + 774 + 888 + 789 + 546 + 568 + ^ Y = —-g-— = 710 t Povprečna zaloga Je torej 710 t. Ker Je koeficient merjen s številom obratov v enem me¬ secu, naš interval pa obsega pol leta, Je i = 6. Iz teh podat¬ kov izračunamo, da Je koeficient obračanja zalog K kremenove moke v prvem polletju 1958 enak X E Y i 3022 . 1 710 . 6 0,71 Koeficient obračanja zalog K = 0,71. To pomeni, da zaloge kre¬ menovega peska v podjetju A napravijo mesečno 0,71 obrata. Z analognim računom smo dobili koeficiente obračanja zalog za isto podjetje za rjavi premog K = 12,0, pepeliko K = = 0,50, kalcinirano sodo K = 2,78. Kakor vidimo, so koefici¬ enti obračanja zalog, ki so tudi operativno zelo pomemben po¬ kazatelj, za posamezne surovine in goriva zelo različni. Obračanje zalog pa moremo izraziti tudi z dolžino ene¬ ga obrata. Ta koeficient, ki je recipročni pokazatelj zgornje¬ ga pokazatelja, izračunamo po obrazcu K ( 6 . 8 ) Če dolžino enega obrata izrazimo v delovnih dneh, je za zgornji primer i = 151, koeficient obračanja zalog za kreme¬ nov pesek v podjetju A, izražen z dolžino enega obrata pa je enak K 710 . 151 3022 = 35,4 dni Po navedenem postopku izračunavamo še niz drugih koeficientov iz ekonomskih statistik. Tako je npr. proizvodnja na enega delavca pokazatelj produktivnosti dela, proizvodnja določenih - 48 ~ proizvodov na prebivalca, npr. jekla, pokazatelj industriali¬ zacije, poraba določenega proizvoda na prebivalca pokazatelj standarda, ražmerje med prometom in zalogami pokazatelj obra¬ čanja zalog, število prodanih knjig na leto na 1000 prebival¬ cev pokazatelj kulturne ravni itd. 6.20 Kot primer kompleksne analize s koeficienti vzemimo trgovino na malo v letu 1967 po republikah. V tabeli 6.11 imamo osnovne podatke, iz katerih bomo izračunali koefi¬ ciente. Tabela 6.11 Trgovina na malo v SFRJ v letu 1957 po republikah (Vir: SG- 58) Iz tabele vidimo, da so prvi trije podatki momentni, drugi pa intervalni. Ker imamo srednje število prebivalstva, ta podatek vzamemo za povprečno število prebivalstva. Za šte¬ vilo trgovin in število zaposlenih pa imamo stanje v začetku In na koncu leta 1957* Zaradi tega najprej izračunamo povpreč¬ ja, da bomo mogli število trgovin in število zaposlenih primer¬ jati s prometom, ki je intervalnega značaja. z a število trgovin v SFRJ je npr. iz zgornjih podatkov ' ovprečno število trgovin enako polovici vsote števila trgovin po stanju 31.12.1956 in 31.12.1957. 49 - Y = \ (36257 + 37651) = 36954 Podobno izračunamo vsa ostala povprečja. Tako dobimo vrsti za povprečno število trgovin in zaposleno osebje v tr¬ govini na malo po republikah. Tabela 6.12 Povprečno število trgovin in zaposle¬ nega osebja v trgovini na malo v letu 1957 po republikah Iz podatkov v tabeli 6.11 in 6.12 izračunamo niz koe¬ ficientov, ki osvetljujejo trgovino na drobno v SPRJ. Tako mo¬ remo s številom prebivalstva primerjati vse druge podatke. Število prebivalstva na eno trgovino meri gostoto trgovinske mreže, število prebivalstva na enega zaposlenega preskrblje¬ nost s trgovskim kadrom itd. Ne da bi se spuščali v globljo analizo prometa na glavo prebivalstva, ki je bistveno odvi¬ sen razen od kupne moči tudi od drugih faktorjev, npr. od so¬ cialne strukture prebivalstva, merimo s temi koeficienti kup¬ no moč prebivalstva. Primerjava števila trgovin s številom zaposlenih ali s skupnim prometom prikaže velikost trgovinskih obratov. Pri¬ merjava skupnega števila zaposlenih s skupnim prometom pokaže produktivnost dela v trgovini na malo, razmerje med prometom z industrijskimi in prehrambenimi proizvodi pa da vpogled v strukturo prometa, ki je odvisna od socialnega sestava pre¬ bivalstva, življenjske ravni itd. Vprašanje je, ali je možno vse te koeficiente'izra¬ čunati iz zgornjih podatkov. Primerjava števila trgovin in zaposlenega osebja s številom prebivalstva iz osnovnih podatkov ni možna, ker ima¬ mo število prebivalstva na dan 30.6.1957, podatke o številu trgovin in številu zaposlenih pa na dan 31.12.1956 in 31.12. 1957. Primerjani momentni populaciji nista časovno enako o- predeljeni. Ker pa moremo imeti srednje število prebivalstva za povprečje v letu 1957, smo upravičeni, da primerjamo sred¬ nje število prebivalstva s povprečnim številom trgovin in za¬ poslenih v letu 1957, ker se vsi ti podatki nanašajo na leto 1957. Število zaposlenih moremo primerjati s številom trgo¬ vin po stanju 31.12.1956 ali 31.12.1957, ker imamo za te da- 50 - turne podatke o številu trgovin in številu zaposlenih. Moremo pa primerjati tudi povprečno število zaposlenih s povprečnim številom trgovin, ker veljata oba podatka za isto razdobje. V tabeli 6.13 so izračunani vsi navedeni koeficienti. Tabela 6.13 Koeficienti trgovine na malo v SFRJ v letu 1957 po republikah (Vir: SG 58) Tabela koeficientov v trgovini na malo ilustrativno pokaže razlike v trgovini na drobno po republikah. Najmanj prebivalcev odpade na eno trgovino v Sloveniji (337), največ 51 pa v BiH (670), Enako velja za število prebivalstva, ki odpa¬ de na enega zaposlenega (Slovenija 114, BiH 221). Ti podatki kažejo gostoto trgovinske mreže. Tudi skupni promet na enega prebivalca kaže velike razlike med republikami (od 28,4 tisoč dinarjev za BiH do 69,7 za Slovenijo). Vendar ta koeficient nima polne analitične veljave, ker je njegova vrednost odvis¬ na od velikega števila faktorjev (socialne strukture prebival¬ stva, kupne moči itd.). Promet s prehrambenimi artikli na pre¬ bivalca je precej odvisen od odstotka nekmečkega prebivalstva, promet z industrijskimi proizvodi na prebivalca pa moremo ime¬ ti bolj za pokazatelj kupne moči in standarda prebivalstva. Tudi ta koeficient kaže velike razlike med republikami.Medtem ko je za BiH, Črno goro in Makedonijo izredno nizek, je za druge republike, posebno za Slovenijo, znatno večji. Velikost trgovinskih obratov, ki je razvidna iz pov¬ prečnega števila zaposlenih na eno trgovino, med republikami malo variira. Iz tega sklepamo, da je tip trgovin po republi¬ kah precej enoten. Enako težnjo kaže tudi skupen promet na e- no trgovino in so znatnejše razlike edino le za Slovenijo in Makedonijo. Promet na enega zaposlenega, ki ga štejemo za po¬ kazatelja produktivnosti dela v trgovini, kaže znatna odstopa¬ nja navzgor za Slovenijo in znatno odstopanje navzdol za Make¬ donijo. Razmerje med prometom z industrijskimi proizvodi in prometom s prehrambenimi artikli kaže med republikami velike razlike. Največji koeficient dobimo za Srbijo (267 din za 100 dinarjev prometa s prehrambenimi artikli), najmanjši pa za Črno goro (120 din na 100 din prometa s prehrambenimi arti¬ kli). Razlike izvirajo iz različnega sestava kmečkega in ne¬ kmečkega prebivalstva in različne kupne moči prebivalstva. Zato koeficient nima polne analitične vrednosti. Iz primera iz trgovinske statistike vidimo, kako so statistični koeficienti uporabni za kompleksno analizo sta¬ tističnih podatkov. Podobno moremo analizirati podatke za najrazličnejša druga socialno-ekonomska področja. 6.21 Recipročni koeficienti . Medtem ko izračunavamo struk¬ turne odstotke vedno tako, da del primerjamo s celoto, ne pa obratno, so statistični koeficienti smiselni tudi, če izračunamo recipročne vrednosti. Tako moremo pokazatelj go¬ stote trgovinske mreže, ki je dan s številom prebivalstva na eno trgovino, izraziti tudi z recipročnim koeficientom števi¬ lom trgovin na 1000 prebivalcev. Medtem ko pri prvotnem koe¬ ficientu primerjamo število prebivalstva s številom trgovin, z drugim primerjamo število trgovin s številom prebivalstva. Koeficient 493 prebivalca na eno trgovino v SFRJ moremo torej izraziti tudi z 2.15 trgovin na 1000 prebivalcev. Kateri iz¬ med obeh možnih koeficientov, ki jih moremo izračunati v vsa¬ kem primeru, je boljši, je odvisno od namena izračunavanja in predstave koeficienta. V mnogih primerih sta oba koeficienta enako uporabljiva in vsak po svoje pokaže isto značilnost. 52 Tako merimo produktivnost dela s količino, proizvedeno v eno¬ ti časa, ali s časom, v katerem je bila proizvedena enota proizvodnje. Obračanje zalog merimo s številom obratov zalog v enoti časa ali s časom, v katerem so se zaloge enkrat obr¬ nile. Obremenjenost učiteljstva merimo s številom učencev na enega učitelja ali s številom učiteljev na 100 ali 1000 učen¬ cev itd. Grafično prikazovanje statističnih koeficientov 6.22 Pravokotniki. Za koeficiente nimamo nekih posebnih metod grafičnega prikazovanja, kakor za strukture. Vrste koeficientov prikazujemo z običajnimi metodami grafič¬ nega prikazovanja: s stolpci, linijskimi grafikoni, figurami itd. Vendar imamo nekaj specifičnih metod, ki jih moremo s pridom uporabiti ravno za prikazovanje koeficientov. Tako so za grafično prikazovanje koeficientov posebno primerni pravo¬ kotniki, ker imata stranici in ploščina pravokotnika podobno algebrajsko zvezo kakor koeficient in oba podatka, iz katerih je koeficient izračunan. Za pravokotnik velja p = a . b. Pri tem pomeni p ploščino, a in b stranici, med K, X in I pa ve¬ lja podobna zveza K = X/Y ali X = K.Y. Stranici pravokotnika moremo uporabiti za prikaz koeficienta in enega absolutnega podatka, ploščina pravokotnika pa je zaradi lastnosti pravo¬ kotnika proporcionalna absolutni velikosti drugega podatka. Uporabnost teh, zvez bomo videli na praktičnem prime¬ ru. Za pet zapadnih držav imamo v tabeli 6.14 podatke o šte¬ vilu prebivalstva in številu osebnih in tovornih avtomobilov in avtobusov. Iz teh podatkov moremo za vsako državo posebej izračunati koeficiente o številu motornih vozil na 1000 pre¬ bivalcev - koeficiente motorizacije. Ti podatki so po zgor¬ njem načinu prikazani v sliki 6.11. Tabela 6.14 Število prebivalstva in število motornih vozil za pet zapadnih . držav v letu 1955 (Vir: SG 58) 53 V grafikonu nazorno primerjamo tri vrste podatkov hkrati. Ker je najvažnejša meddržavna primerjava o številu motornih vozil na prebivalca, so pravokotniki postavljeni tako, da je primerjava teh podatkov najboljša. Razen tega je iz slike razvidno število prebivalstva in čeprav s plo¬ ščino tudi skupno število motornih vozil. Pravo! i.ki so razdeljeni še v proporcu s strukturo po vrsti mo'ornega vo¬ zila. Ta način moremo uporabiti za prikazovanje statistič¬ nih vrst za koeficiente iz najrazličnejših podatkov. 6.23 Strukturni stolpci . Posredno moremo koeficiente od- brati tudi iz grafikona strukturnih vrst. Ta metoda da kompleksno sliko odnosov med elementi, ki jih proučujemo. Zaradi tega je predvsem sredstvo za prikazovanje relativnih odnosov med raznovrstnimi podatki, Čeprav prikazuje v osnovi strukture. Če hočemo preizkusiti to metodo na podatkih o trgovi¬ ni na drobno iz tabel 6.11 in 6.12, moramo najprej izračunati strukture po republikah za vsak podatek posebej. V tabeli 6.15 so prikazani strukturni odstotki posameznih podatkov, pri če¬ mer so podatki za SFRJ celota. Če bi bili koeficienti: število prebivalcev na eno tr¬ govino in enega zaposlenega, promet na enega prebivalca, zapo¬ slenega ali trgovino, za vse republike enaki, bi bila struktu¬ ra po republikah za vse podatke enaka. Razlike v strukturi iz¬ virajo ravno iz razlik v odnosih. Če je za neko republiko pro¬ met na prebivalca sorazmerno majhen, siciepamo, da mora biti odstotek prometa od skupnega prometa za SFRJ za to republiko manjši kot je ustrezni odstotek za prebivalstvo in obra.tno. Primerjana odstotka sta med seboj enaka le, če je za to repub¬ liko koeficient iz primerjanih podatkov enak povprečnemu" koe¬ ficientu za SFRJ. To izvira iz značaja primerjave. Ge z zaznamujemo prvi podatek za i’epubliko, z X ustrezni skupni podatek za SFRJ, ( z Y 1 drugi podatek za republiko, z Y pa ustrezni skupni podatek za SFRJ, pomeni X-j/X strukturni de¬ lež za prvi podatek, Yj/Y pa strukturni delež za drugi poda¬ tek. Če ju primerjamo, dobimo, da je X 1 /X : Y 1 /Y = X- 1 /Y 1 : X/Y - 54 - ZDA FRANCIJA Število 0 1 _' motornih volil n*. 1000 prebivale«v too i 200 —0 - 2>oo Uoo V£L. BRITANIJA ITALIJA Le^and«.: P « prebivalstvo O * število osebnih avtomobilov O v iHvilo osebnih avtomobilov na. 4oo<> pr« bi vateev • RA« število kamionov in avtobusov ko. « Število Kamionov m avtobusov no«. too» prebivalcev. Slika 6,11 Motorizacija petih zapadnih držav v letu 1955 Tabela 6.15 Strukture podatkov o trgovini na malo v SFRJ v letu 1947 po repub¬ likah Primerjava strukturnih deležev X^/X z 1^/Y ustreza primerjavi republiškega koeficienta X 1 /Y 1 s ustreznim koeficien tom za SFRJ X/Y. Če sta primerjana strukturna odstotka med se¬ boj zelo različna, pomeni, da je ustrezni koeficient med podat¬ koma zelo različen od koeficienta za celoto in obratno. Ker mo¬ remo strukturne odstotke raznovrstnih podatkov zlahka grafično prikazati, saj so neimenovana števila, razberemo vse te odnose kompleksno iz razlik v stolpcih. Relativni odnosi se pravilno pokažejo šele na logari¬ temski skali. Zato za risanje stolpcev v sliki 6.12 uporabimo logaritemske skale namesto anmetmetičnih skal. Zaradi pregled¬ nosti so včrtani samo obrisi stolpcev, odstotki pa so zaznamo¬ vani z začetnimi črkami posameznih podatkov. Grafikon je se¬ stavljen iz šestih samostojnih republiških grafikonov. Nazornost odnosov in možnost analize je očita. Za Srbijo vidimo izrazito razliko v strukturi prometa, za Hrvat- sko so vsi koeficienti na prebivalca nad povprečjem za SFRJ, ker je stolpec za prebivalstvo najnižji. Produktivnost dela je malo višja od povprečne, kar sklepamo iz tega, ker sta stolpca Z in P približno enako visoka. Grafikon za Slovenijo kaže, da so za Slovenijo propor¬ ci zelo različni od povprečnega stanja za SFRJ. Stolpec za od¬ stotek prebivalstva je v primerjavi z drugimi zelo majhen. Iz. tega sklepamo, da so vsi koeficienti na prebivalca veliko viš¬ ji od povprečnega za SFRJ. Število zaposlenih na trgovino je malenkostno manjše kot povprečno; pač pa je proizvodnost dela znatno večja kot povprečna (primerjava Z s P). Struktura pro¬ meta pokaže'" večji delež prehrambenih artiklov. To izvira iz tipične strukture prebivalstva v Sloveniji, Posebno sliko pokaže Bosna in Hercegovina. Zanjo more¬ mo sklepati, da je preskrbljenost v sektorju trgovin na malo sorazmerno slaba, ker je stolpec za prebivalstvo znatno nad trugimi. Produktivnost dela je podpovčrena (stolpec promet P manjši kot zaposleni Z). - 56 - Slika 6*12 Struktura trgovine na malo v SFRJ v letu 1957 po republikah 57 - Enako moremo analizirati tudi grafikone za ostali re¬ publiki. V Makedoniji število trgovin in zaposlenega osebja niti ni tako slabo v primerjavi s SFRJ, paš pa je promet so¬ razmerno majhen; to kaže, da je kupna moč majhna, produktiv¬ nost dela v trgovini pa nizka. Črna gora kaže precej podobno sliko o trgovinski mre¬ ži kot Srbija, ker so stolpci za prve štiri podatke (prebival- sto P, število trgovin T, število zaposlenih Z in skupni pro¬ met P) zelo podobni. Pač pa je očitna velika sprememba v strukturi prometa (promet s prehrambenimi artikli - Ž visoko nad industrijskimi - I). ENOSTAVNI INDEKSI 6.24 0 indeksih govorimo, kadar z relativnimi števili pri¬ merjamo istovrstne, prirejene podatke. Strukture in koeficiente izračunavamo iz absolutnih podatkov. Indekse pa moremo izračunavati iz vseh vrst statističnih podatkov, ne pa samo iz absolutnih. Tako moremo z indeksi primerjati med seboj različne koeficiente, strukturne odstotke in druge iz¬ vedene pokazatelje. Indeks vedno izračunavamo po osnovnem obrazcu I l/o = 100 . Y 1 /Y q (6.9) Pri tem pomeni: Y^ = podatek, ki ga primerjamo s podatkom Y q . Y = podatek, na katerega primerjamo. Podatek, na katerega primerjamo, imenujemo bazo ali osnovo indeksa. I]y 0 = indeks. Z indeksom izražamo tekoči podatek, v stotinkah od baze Y Q . Indeks pod 100 pomeni, da je pojav manjši od baze, indeks 100 pomeni, da sta primerjani podatek in baza enaka. Indeks pa je nad 100, če je podatek večji od baze. Ker so indeksi neimenovana števila in imajo enoten merski sistem, iz njih zelo nazorno dobimo vtis o velikosti sprememb oziroma raz¬ lik. Razen tega moremo med seboj primerjati indekse razno¬ vrstnih podatkov, ki drugače ne bi bili neposredno primer¬ ljivi. 6.25 Po podatkih mednarodnega pregleda v SG 1958 je imela Jugoslavija v letu 1955 narodnega dohodka 1298,3 mi¬ lijard dinarjev, v letu 1956 pa 1444,1 milijard dinarjev. Italija je imela v letu 1955 10814 milijard lir, v letu 1956 pa 11503 milijard lir narodnega dohodka. Iz absolutnih podat¬ kov si ne moremo ustvariti slike, v kateri državi je bilo po¬ večanje narodnega dohodka večje. Podatki za Italijo in Jugo- 58 - slavijo niso med seboj neposredno^primerijivi, ker so eni da ni v dinarjih, drugi pa v lirah. Če pa izračunamo indekse, dobimo, da je za Jugoslavijo indeks enak ■S6/55 " 100 * Y 56 //Y 55 ~ 100 . 1444,1 no 1298,3 ’ za Italijo pa 1 5 6/5 5 " 100 . 11504 10814 106,4 Indeksa pa sta primerljiva in sicer kažeta, da je bil porast v narodnem dohodku relativno v Jugoslaviji večji kakor v Italiji. Če so spremembe, ki jih izražamo z indeksi, velike, indekse izračunavamo na cele, na eno decimalko pa jih raču¬ namo le, če prikazujemo majhne spremembe. Nikdar pa ne izra¬ čunavamo indeksov n9. več decimalk, ker tako indeks izgubi svojo osnovno kvaliteto - nazornost. Stvarni in krajevni indeksi 6.26 Ker se podatka, ki smo ju primerjali med seboj v zgornjem primeru, razlikujeta v času (leto 1955 in leto 1956), imenujemo ta indeks časovni indeks. Ker pa se moreta primerjana podatka razlikovati tudi v krajevnem ali stvarnem znaku, imamo tudi krajevne in stvarne indekse. Obi¬ čajno izračunavamo indekse za cele vrste podatkov. V teh primerih vzamemo običajno za bazo vseh indeksov en in isti člen. Kot primer krajevnih indeksov vzemimo koeficient raz vezanih zakonov na 1000 sklenjenih zakonov v letu 1955 v glavnih mestih ljudskih republik. Tabela 6.16 Število razvezanih zakonov na 1000 sklenjenih zakonov v letu 1955 v glav¬ nih mestih ljudskih republik . (Vir: Vitalna statistika 1955) 59 - Za bazo vzamemo člen, za katerega najbolje poznamo razmere. Ker kot Slovenci najbolje poznamo razmere v Ljublja¬ ni, zato za bazo primerjave vzamemo Ljubljano in nanjo izra¬ čunamo vse indekse. Iz tabele 6.16 vidimo, da je problem raz¬ vez zakonov posebno pereč v Zagrebu in Beogradu. Tu je koefi¬ cient za 76$oziroma za 65$ večji kot za Ljubljano. V primer¬ javi z Ljubljano ima majhen koeficient Titograd (indeks 68). Indekse smo izračunali po osnovnem obrazcu 6.9. npr.: za Beograd 100. 287/170 = 169. 6.27 Za primer indeksov iz stvarnih vrst vzemimo skupne po¬ prečne mesečne dohodke za tekstilno, prehrambeno in grafično industrijo v SFRJ v I. trimesečju 1958 po kvalifika¬ cijah. Tabela 6.17 Povprečni skupni mesečni prejemki de¬ lavcev po kvalifikacijah v I. trime¬ sečju 1958 v SFRJ v dinarjih (Vir: SB 1923) Primerijivejšo sliko teh podatkov dobimo, če vzamemo povprečne delavske prejemke za bazo in izračunamo indekse za vsako stroko. Ti indeksi so prikazani v tabeli 6.18. Tabela 6.18 Indeksi skupnih mesečnih prejemkov delavcev po kvalifikaciji v I. trime¬ sečju 1958 v SFRJ. (Baza: povprečna delavska plača = 100) Indekse smo izračunali po osnovnem obrazcu za izraču¬ navanje indeksov, npr. 2a vi3oko kvalificirane delavce v tekst, stroki I 7/f = 100 . 20070/10910 - 184 Indeksi dajo boljši pregled razlik v plačah po kvalifi¬ kacijah, Iz tabele vidimo, da imajo visoko kvalificirani delav¬ ci v tekstilni industriji povprečno za 84 i» višjo plačo kakor je povprečna delavska plača. V grafični stroki imajo nekvalifi¬ cirani delavci samo 63 od povprečne plače itd, Iz tabele in¬ deksov vidimo, da so odnosi med plačami po kvalifikacijah po strokah zelo različni. Časovni indeksi 8.28 Indeksi s stalno bazo. Največkrat izračunavamo indekse za časovne vrste, ker moremo z njimi zelo dobro prou¬ čevati dinamiko pojavov. Časovna vrsta podatkov sicer že sama prikazuje dinamiko, vendar jo razmeroma težko sledimo, ker so posamezni pojavi različno veliki, imajo različne enote mere itd. Preračunanje take vrste v indeksno vrsto s pravilno iz¬ brano bazo pa pokaže spremembe od baze, ki je v vsakem prime¬ ru 100, v stalnem merilu - stotinkah. Za primer vzemimo proizvodnjo elekuroenergije SFRJ in njenih sosedov v razdobju 1951-1957. Tabela 6.19 Proizvodnja elektroenergije SFRJ in sosednih držav v razdobju 1951-1956 v milijon KWh (Vir: SG 58) V tabeli 6.19 težko proučimo in primerjamo dinamiko proizvodnje elektroenergije med državami. Posamezne države imajo zelo različno proizvodnjo, to pa zamegli primerljivost dinamike. To hibo absolutnih podatkov odpravimo z indeksnimi vrstami. Če se odločimo, da vzamemo za bazo leto 1951, ker je začetno leto, dobimo naslednjo tabelo indeksov: Tabela 6.20 Indeksi proizvodnje elektroenergije v SFRJ in sosednih državah v razdob¬ ju 1951-1956 (baza 1951 = 100) ^52/51 Za Avstrijo izračunamo takole: I / - 100 v /Y - 1?°- * Qfj = 109 52/51 " lbU * r 52 /x 51 " 7575 Enako izračunamo vse druge indekse. Indeksne vrste veliko nazorneje pokažejo dinamiko proizvodnje električne energije v navedenih sedmih državah kakor vrste absolutnih podatkov. Ker je pri vseh časovnih vrstah vzeta ista basa, je možna tudi primerjava indeksov med državami. Tako moremo neposredno sklepati, v katerih državah je bil razvoj hitrej¬ ši i.n v katerih počasnejši. Take analize iz tabele absolut¬ nih podatkov ne moremo napraviti neposredno. Grafikon indeks¬ nih vrst v sliki 6.15 nazorno pokaže dinamiko za proizvodnjo električne energije za zgornjih sedem držav. 6.29 Indeksi s premično bazo. V zgornjem primeru smo za posamezno državo primerjali proizvodnjo vsakega le¬ ta s proizvodnjo istega leta 1951. Tako indeksno vrsto ime¬ nujemo indeksno vrsto s stalno bazo. Večkrat pa izračunavamo indekse tudi tako, da v isti časovni vrsti menjamo osnovo ali bazo primerjave. Take in¬ deksne vrste imenujemo indeksne vrste s premično bazo. Izmed indeksnih vrst s premično bazo najpogosteje uporabljamo ve¬ rižne indekse. Za dano časovno vrsto izračunavamo vrsto ve¬ rižnih indeksov tako, da za vsak podatek, za katerega izra¬ čunamo verižni indeks, vzamemo za bazo predhodni člen. Tako dobimo vrsto verižnih indeksov, ki pokažejo relativne spre¬ membe od člena do člena. Verižne indekse torej izračunavamo po splošnem obrazcu 100 V 1 k-l tem pomeni: = tekoči podatek, Yj__^ nega člena, I, verižni indeks. ( 6 . 10 ) = podatek predhod- 62 - Slika 6.13 Indeksi proizvodnje električne energije za SFRJ in sosedne države v razdobju 1951-1956 Ce vzamemo iz tabele 6.19 podatke o proizvodnji električne energije v Jugoslaviji v letih 1951-1956, je vr¬ sta verižnih indeksov takale: Tabela 6.21 Verižni indekai za proizvodnjo elek¬ trične energije v SFRJ v letih .1951-1956 Iz primera vidimo, da verižnega indeksa za prvi člen časovne vrste ne moremo izračunati, ker ne poznamo predhodne¬ ga člena. Vrsta verižnih indeksov Kaže, da je zvečanje proiz¬ vodnje električne energije v SFRJ od leta do leta večje, z izjemo v letu 1956 . 6.30 Preračunavanje indeksov na drugo bazo . V navedenih primerih smo izračunavali indekse is vrst osnovnih podatkov. Dostikrat pa imamo indeksne vrste, iz katerih že¬ limo izračunati indeksne vrste z novo hazo, nimamo pa osnov¬ nih podatkov. V takih primerih preračunamo staro indeksno vr¬ sto v indeksno vrsto z novo bazo 1 tako, kakor iz osnovne vr¬ ste I 2/l = 100 ^Z° L l/o ( 6 . 11 ) Velja namreč: Ir, 100 j/o 'l/o = 100 100.Y 2 /Y o 100. iyTJ = 100. i 2 / i 1 = i 2 /i 6.31 Vzemimo kot primer iz tabele 6.16 indeksno vrsto koeficientov razvezanih zakonov na 1000 sklenjenih zakonov. Baza te indeksne vrste je Ljubljana, želimo pa iz računati novo indeksno vi-sto, v kateri je baza mesto z naj računati novo indeksno vrsto, v kateri višjim indeksom (Zagreb). Po obrazcu 6 . mesto primerjano z bazičnim indeksom je ..11 ( b baza mesto s naj- indeks za vsako 1 76 j Tabela 6.22 Indeksi koeficientov razvezanih zakonov na 1000 sklenjenih zakonov za glavni mesti republik Za Beograd srno indeks z novo bazo izračuna3.i: - 64 Enako moremo preračunati na novo bazo tudi vrste ča¬ sovnih indeksov. Tako dobimo po zgornjem pravilu iz indeksne vrste za proizvodnjo električne energije v Jugoslaviji iz ta¬ bele 6.20 novo indeksno vrsto z bazo 1956 = 100, tako da vsal člen indeksne vrste delimo z indeksom za leto 1956 (199) in kvociente pomnožimo s 100. Podobno kakor iz absolutnih podatkov moremo izračuna¬ vati iz časovnih indeksnih vrst tudi vrste verižnih indeksov. Iz vrste verižnih indeksov pa dobimo indeksne vrste s poljub¬ no stalno bazo s postopnim množenjem oziroma deljenjem veriž¬ nih indeksov. Tabela 6.25 Indeksna vrsta za proizvodnjo elek¬ trične energije v Jugoslaviji v razdobju 1951-1956 6.32 Izbira baze ali osnove. Formalno moremo vzeti za bazo izračunavanja indeksov katerikoli člen v vrsti, za ka¬ tero izračunavamo indekse, ali tudi vrednost izven nje. Vse¬ binsko pa je odločitev o bazi primerjave odvisna od namena, primernosti in smiselnosti primerjave. Zaradi tega je za izbi¬ ro baze nemogoče dati enotno pravilo, marveč samo nekaj sploš¬ nih načel, ki pomagajo pri pravilni izbiri baze. Pri stvarnih in geografskih indeksih vzamemo za bazo po pravilu pojav oziroma območje, ki si ga najbolje predstav¬ ljamo oziroma ga najbolje poznamo. Tako v medrepubliški pri¬ merjavi vzamemo npr. za bazo Slovenijo, v meddržavni primer¬ javi SFRJ itd. Če primerjamo z indeksi relativna števila ali druge izvedene pokazatelje za posamezne dele populacije, je najprimerneje in najenostavneje, da vzamemo za bazo sumarni pokazatelj za celoto. Taki indeksi pokažejo odklone od nekega povprečnega stanja. Zaradi tega smo za vrsto indeksov meseč¬ nih prejemkov po vrstah zaposleniu vzeli za bazo povp ;ečne pre¬ jemke v stroki itd. Tako vrste indeksov najobjektivneje poka¬ žejo razlike po grupah. Poseben problem je izbira baze pri časovnih indeksih. Za časovne indekse velja splošno pravilo, da vzamemo za bazo čas, ko je pojav normalen in ustaljen. Kdaj pa je pojav nor¬ malen, je težko določiti. Vendar moremo iz tega pravila vsaj zaključiti, katere člene ne smemo vzeti za bazo, ker je laže ugotoviti, kdaj pojav ni normalen. Zaradi tega za primerjavo večine pojavov ne vzamemo vojna leta, leta gospodarskih kriz in tako dalje. Enako v zdravstveni statistiki ne vzamemo za - 65 - bazo leta epidemij. Večja verjetnost je, da je pojav normalen v daljšem razdobju kot v krajšem. Zaradi tega običajno ne jem¬ ljemo za bazo kratka razdobja, npr. mesece pri indeksih proiz¬ vodnje, marveč vzamemo za bazo leto. Težko je tudi npr. reči v kmetijstvu, katero leto je normalno, ali je to leto ugodne ali neugodne vegetacije. Zato v kmetijstvu dostikrat vzamemo za bazo večletno (petletno ali desetletno) povprečje. Povojni razvoj običajno primerjamo s stanjem pred voj¬ no. Za bazo primerjave vzamemo čim kasnejše leto pred vojno, vendar tako, da nanj še ne vplivajo priprave na vojno. V SFRJ vzamemo za primerjavo s predvojnim stanjem za bazo leto 1939, OZN pa leto 1937. Vendar moramo paziti, kdaj so primerjave pred in povojnega stanja vsebinsko utemeljene in smiselne. Za zelo dolga razdobja in v primeru velikih sprememb, primerjava na določeno staro stanje nima smisla. Če je bila nekaj let po drugi svetovni vojni primer¬ java s predvojnim stanjem upravičena, ker smo tako približno dobili vtis o pojavih in spremembah, je primerjava s predvoj¬ nim stanjem sedaj nepomembna, ker nas zanima povojni razvoj, ne pa primerjava s predvojnim stanjem, ki je že razmeroma ze¬ lo odmaknjeno. Vendar ne vzamemo za bazo povojnega razvoja prvo povojno leto, ko so bile razmere še neustaljene, temveč kasnejše razdobje normaliziranega stanja. Včasih vzamemo za bazo indeksov tudi zadnje - tekoče leto. Taka indeksna vrsta primerja preteklo stanje s podat¬ kom, ki je časovno najbližji in tudi naj zanimive jši, ker pred¬ stavlja trenutno stanje. Velikih sprememb tudi ne kaže prikazovati z indeksi. Tako nima smisla npr. izračunati indeksa proizvodnje valjanih aluminijevih proizvodov na bazo 1939, ko je bila proizvodnja 15 ton, s proizvodnjo v letu 1957, ko smo proizvedli 4527 ton valjanih aluminijevih proizvodov. Indeks, ki ga izračunamo iz teh podatkov, je 30180 in nenazoren. Kljub temu, da indeksi v splošnem izboljšajo primerjavo, ta indeks nima smisla, ker je nepredstavljiv. 66 - SEDMO POGLAVJE FREKVENČNE DISTRIBUCIJE Sestavljanje frekvenčne distribucije 7.1 Med statističnimi vrstami imajo posebno mesto vrste, ki prikazujejo razporeditev vrednosti za numerične znake. Take vrste imenujemo frekvenčne distribucije ali po- gostnostne razdelitve. Za dano populacijo dobimo frekvenčno distribucijo, če za posamezne razrede znaka poiščemo, koli¬ ko enot ima vrednost znaka v ustreznem razredu. Tehnično do¬ bimo frekvenčno distribucijo preprosto s črtkanjem ali odla¬ ganjem listov. Vzemimo za primer porabo lesa v letu 1953 v 149 kme¬ tijskih gospodarstvih v takratnem okraju Novo mesto. Ta go¬ spodarstva so bila anketirana v anketi o porabi lesa leta 1953. Osnovni podatki o porabi lesa v posameznih anketiranih gospodarstvih so navedeni v tabeli 7.1. * 3 Tabela 7.1 Poraba lesa v m v 149 kmetijskih go¬ spodarstvih v letu 1953 v okraju Novo mesto (Vir: Anketa o porabi lesa v letu 1953) Uredimo zgornjo nepregledno množico podatkov v frek¬ venčno distribucijo, v kateri vzemimo po 1 m^ 1 široke_razrede! V tabeli 7.2 pomeni npr. 3 porabo od 3,0 uk do 3»9 ek. Število enot v posameznem razredu imenujemo frekvenca. Po pravilu frekvence vedno zaznamujemo s črko f. - 67 - Frekvenčna distribucija v tabeli 7.2 kaže veliko pregledneje porabo lesa v gospodarstvih kakor individualni podatki v tabeli 7.1. Vendar frekvenčna distribucija ne da natančnih vrednosti. Iz nje npr. vidimo, da je eno gospo¬ darstvo porabilo lesa od 2,0 do 2,9 m3, ne vemo pa, koliko so natančno porabili lesa v tem gospodarstvu. Enako vidimo, da je 14 gospodarstev porabilo 10,0 do 10,9 m3, ne vemo pa natančne porabe lesa. S frekvenčno distribucijo se je pre¬ glednost povečala, natančnost informacij pa zmanjšala. Tabela 7.2 Frekvenčna distribucija 149 kmetij¬ skih gospodarstev v Novem mestu po porabi lesa v letu 1953 Iz frekvenčne distribucije dobimo nekatere zelo ko¬ ristne ugotovitve. Predvsem je frekvenčna distribucija sli¬ ka o variiran.ju znaka. Iz tabele 7.2 vidimo, da so npr. po¬ rabili v kmetijskih gospodarstvih od 2 m3 do 34 m3 lesa.Ra¬ zen tega si iz frekvenčne distribucije ustvarimo sliko o po¬ rabi lesa znotraj teh meja. Bežen pogled pokaže, da je go¬ spodarstev z majhno porabo malo, medtem ko se število gospo¬ darstev v posameznih razredih do neke porabe v glavnem veča, od tu naprej pa so frekvence vedno manjše. Frekvenčna dis¬ tribucija nakazuje zakonitost, ki jo opazimo pri večini po¬ pulacij. V dani populaciji se vrednosti najbolj goste okrog nekega središča, od katerega so odkloni tem redkejši, čim večji so. Vendar se ta zakonitost v fbekvenčni distribuciji v tabeli 7.2 ne kaže popolnoma. Imamo veliko odklonov od tega pravila. Frekvence v sosednih razredih so včasih več¬ je, včasih manjše. Število enot v posameznih razredih je namreč razmeroma majhno, zato prevladujejo še slučajni vpli¬ vi. Če bi bilo število enot v posameznih razredih večje, slučajni vplivi ne bi bili tako močni in bi se zgornja za¬ konitost izražala močneje. Frekvence v razredih moremo po- 63 - večati na dva načina. Če bi namesto 149 gospodarstev imeli desetkrat večjo populacijo s 1490 gospodarstvi, bi bile tu¬ di frekvence večje. Zakonitost bi se izražala močneje. Ven¬ dar tako večanje frekvenc običajno ne moremo uporabiti.Fre¬ kvence pa povečamo tudi, če vzamemo širše razrede, 3 tem se sicer zmanjša natančnost prikaza, zakonitost, po kateri va¬ riira vrednost, pa je prikazana bolje, ker so slučajni vpli¬ vi manjši. Če v tabeli 7.2 združimo'po štiri razrede, dobimo novo frekvenčno distribucijo; ta je prikazana v tabeli 7.3. Frekvenčna distribucija v tabeli 7.3 je preglednej¬ ša, ker je število razredov manjše. Razen tega pa je zaradi razmeroma velikih frekvenc dobro vidna zakonitost gostitve. Frekvence se sprva večajo, dokler ne dosežejo največjo go¬ stitev v razredu 12,0 - 15,9 m3, od tu pa stalno padajo. Tabela 7.3 Frekvenčna distribucija za porabo lesa v letu 1953 za 149 kmetijskih gospodarstev v okraju Novo mesto Seveda pa ne smejo biti razredi preširoki. S širje¬ njem razredov se natančnost bolj in bolj manjša. Tudi zake- nisto gostitve je vedno manj vidna. Če v zgornji frekvenčni distribuciji združimo po dva razreda, dobimo skrčeno distri¬ bucijo, ki je prikazana v tabeli 7.4. Tabela 7*4 Frekvenčna distribucija porabe lesa v letu 1953 v 149 kmetijskih gospo¬ darstvih v okraju Novo mesto - 69 - Ta frekvenčna distribucija sicer se vedno nakazuje osnovno zakonitost, vendar daje pregrobo sliko, ker so v istem razredu gospodarstva, ki imajo do 8 m3 razlik v porabi. Zato je pri sestavljanju frekvenčnih distribucij važno število in velikost razredov. Če vzamemo premajhne razrede, na frekvence preveč vplivajo slučajni vplivi in za¬ brišejo osnovno zakonitost gostitve, preveliki razredi pa dado pregrobo sliko. Nimamo splošnega pravila, kakšne in ko¬ liko razredov naj ima frekvenčna distribucija; pač pa je praksa pokazala tole: razredi, ki razdele razmak med najmanj¬ šo in največjo vrednostjo v populaciji na osem od šestnajst razredov, dado običajno dosti dobro sliko gostitve. Število razredov se ravna po velikosti populacije. Za manjše popula¬ cije vzamemo manj, za večje pa več razredov. V našem primeru smo resnično dobili s štiridesetimi razredi nepregledno, s petimi razredi pregrobo sliko o variiranju znaka, medtem ko je frekvenčna distribucija z desetimi razredi pokazala vse značilnosti gostitve. Frekvenčne distribucije z neenakimi razredi 7.2 Čeprav je iz tehničnih razlogov najbolje, da so vsi razredi v frekvenčni distribuciji enako široki, vča¬ sih iz vsebinskih razlogov sestavljamo frekvenčne distribu¬ cije, v katerih so razredi različno široki. Vzemimo za pri¬ mer industrijska podjetja! Če ima eno 10, drugo pa 50 zapo¬ slenih, je med njima večja vsebinska razlika kakor pa med podjetjema s 1000 in 104-0 delavci, čeprav je v obeh primerih razlika 40 delavcev. Zato industrijska podjetja po številu delavstva prikazujemo v frekvenčni distribuciji z različni¬ mi širinami razredov. Tabela 7.5 Industrijska podjetja v SFRJ ob koncu leta 1957 po številu zaposlenih (Vir: SG- 58) 2525 N 70 - Iz tabele 7.5 vidimo, da se meje razredov vrste v približni geometrijski postopici; to pa je v skladu z rela¬ tivno primerljivostjo števila delavstva po podjetjih. 7.3 V frekvenčni distribuciji z enakimi razredi se fre kvence spreminjajo samo zaradi različne stopnje go¬ stitve v posameznih razredih, V frekvenčni distribuciji z neenakimi razredi pa je frekvenca v danem razredu odvisna razen od gostitve tudi od širine razreda. Pri isti stopnji gostitve imajo širši razredi večjo, ožji razredi pa manjšo frekvenco. Da iz frekvence odstranimo vpliv različne širi¬ ne in prikažemo samo stopnjo gostitve, izračunavamo po ob¬ razcu - V*k (7 - 1) gostoto frekvence g^; ta pokaže, koliko frekvence v razre¬ du odpade na enotin razmak. Za vsako frekvenčno distribucijo moremo izračunati strukturne deleže; ti pokažejo, koliki del celotne popula¬ cije je v posameznem razredu. Strukturne deleže, ki jih do¬ bimo, če frekvenco f delimo z obsegom populacije N, imenu- 0 o jemo relativne frekvence f^. f£ - i k / N (7.2) Kakor smo iz frekvenc izračunali gostoto frekvence, tako moremo po obrazcu 9* - Ig/l* - V* . 1* (7.3) izračunati tudi gostoto relativne frekvence *y k , če relativ¬ no frekvenco delimo 3 širino razreda. Iz obrazca 7.3 zlahka dobimo, da je f k « N . i k . <5> k (7.4) Frekvenca v danem razredu je torej premo sorazmerna z obse¬ gom populacije N, s širino razreda i^ in gostoto relativne frekvence ^> k , ki je povezana z vsebino pojava. 7.4 Z a frekvenčno distribucijo industrijskih podjetij v SFRJ konec leta 1957 so zgornje količine izračunane v tabeli 7.6. 71 - Tabela 7.6 Industrijska podjetja v SFRJ konec leta 1957 po številu zaposlenih V tabeli 7.6 smo za odprt razred - 15 zaposlenih vze¬ li spodnjo mejo 8 zaposlenih; ker predpostavljamo, da ni industrijskih podjetij, ki imajo manj kot 8 zaposlenih. Zadnji razred je odprt navzgor in zanj ne poznamo širine razreda. Zato zanj nismo mogli izračunati ustreznih go¬ stot. Absolutnih frekvenc med seboj ni mogoče primerjati. , Pač pa je smiselna primerjava gostot frekvenc ali gostot relativnih frekvenc. Za naš primer ti vrsti kažeta zakoni¬ tost, kako stalno pada gostota frekvenc. Ta zakonitost je značilna tudi za nekatere druge socialno-ekonomske po¬ jave. Slika 7.1 (glej nadaljevanje na naslednji strani) 72 4 Novo mesto - 73 - Grafično prikazovanje frekvenčnih distribucij 7.5 Histogram , Frekvenčne distribucije grafično prika¬ zujemo na dva načina: s histogrami in poligoni. Frekvenčne distribucije z enakimi razredi v histo¬ gramu prikažemo z enako širokimi stolpci, katerih višina je v sorazmerju z ustreznimi frekvencami. Površina vseh stolpcev je zato sorazmerna z obsegom populacije. Običajno ne črtamo celih stolpcev, temveč rišemo samo obrise. V sli¬ ki 7.1 je na skali za porabo lesa prikazana najprej razme¬ stitev individualnih vrednosti porabe lesa za 149 kmetij¬ skih gospodarstev v Novem mestu iz tabele 7.1» nato pa vse tri frekvenčne distribucije iz tabel 7.2, 7.3, 7.4. V prvi je širina razreda 1 m3, v drugi 4 m3, v tretji pa 8 m3. Iz histogramov še nazorneje kot iz tabel vidimo, da najbolj ustreza širina razreda 4 m3. 7.6 Če prikazujemo s histogramom frekvenčne distribucije z različnimi širinami razredov, rišemo frekvence v razredih s pravokotniki, v katerih so širine sorazmerne s širinami razredov i^, višine pa sorazmerne z gostoto fre¬ kvence g^ . Ker je po obrazcu 7.1 frekvenca zmnožek širine 9 Slika 7.2 Histogram industrijskih podjetij po številu zaposlenih v SFRJ konec leta 1957 74 - razreda in gostote frekvence, so ploščine stolpcev v soraz¬ merju z ustrezno frekvenco f^, ploščina vseh stolpcev pa v sorazmerju z obsegom populacije N. Edino tako dobimo pravilno sliko o razmestitvi pojava. V sliki 7.2 je s histogramom prikazana frekvenčna distribuci¬ ja industrijskih podjetij v SFRJ konec leta 1957 po številu delavcev iz tabele 7.6. Histogram pravilno pokaže, da gosti¬ tev podjetij pada, če se število podjetij veča. 7.7 Poligon . Frekvenčni poligon za vrste z enakimi razre- di narišemo tako, da nad sredine razmakov za posamez¬ ne razrede nanesemo točke, ki so od abscisne osi oddaljene v sorazmerju z velikostjo frekvence. Dobljene točke po vrsti zvežemo z daljicami. Ce vzamemo, da je frekvenca v razredu pred prvim razredom in po zadnjem razredu enaka nič in da u- strezni točki ležita na abscisni osi, je poligon zaključen. Poligon bolje prikazuje stvarno razmestitev vrednosti, ker z njim nakažemo verjetnejšo razmestitev vrednosti znotraj raz¬ redov, kot s histogramom, ki nakazuje enakomerno razmestitev znotraj razredov. Logično je namreč, da je znotraj razredov na straneh, ki teže proti maksimalni gostitvi, gostota večja kakor na zunanjih straneh razredov. V sliki 7.3 je s poligonom prikazana frekvenčna dis¬ tribucija o porabi lesa iz tabele 7.3. Poligon zelo lepo po¬ kaže, kako je razmeščena poraba lesa. Slika 7.3 Frekvenčni poligon za porabo lesa v letu 1953 v 149 kmetijskih gospodarstvih v okraju Novo mesto 75 - 7.8 Frekvenčno distribucijo z različnimi širinami razre¬ dov pa prikažemo s poligonom tako, da nad sredine razredov, ki so risani v sorazmerju s širinami razredov, na¬ nesemo točke, ki go od absoise oddaljene v sorazmerju z go¬ stoto frekvence. Če točke med seboj povežemo, dobimo lomlje¬ no črto, ki zelo dobro ponazarja razmestitev vrednosti. Fre¬ kvenčna distribucija industrijskih podjetij v SFRJ po števi¬ lu zaposlenih je s poligonom narisana v sliki 7.4-. Poligon še nazorneje kakor histogram kaže, kako upada gostitev pod¬ jetij, če se število zaposlenih veča. Slika 7.4 Frekvenčni poligon za industrijska pod¬ jetja v SFRJ po številu zaposlenih konec leta 1957 7.9 Oblike frekvenčnih distribucij . Poligona frekvenčnih distribucij za kmetijska gospodarstva po porabi lesa v sliki 7.3 in industrijskih podjetij po številu zaposlenih v sliki 7.4 kažeta različni zakonitosti gostitve. Potrošnja lesa ima neko središče največje gostitve, od katerega gosti¬ tev pada v obe smeri. Take distribucije zaradi enega sredi¬ šča gostitve imenujemo unimodalne, za razliko od .frekvenčnih distribucij, ki imajo več središč gostitve. Take frekvenčne - 76 - distribucije dobimo, če je populacija nehomogena, torej se¬ stavljena iz več homogenih populacij. Te vrste distribucij imenujemo bimodalne, če imajo dva vrha, in polimodalne, če imajo več vrhov. Z dvema vrhovoma je v sliki 7.5 prikazana frekvenčna distribucija umrlih žensk po starosti v letu 1956 v Sloveniji. V grafikonu opazimo izredno veliko število umr¬ lih otrok do enega leta. Število umrlih se zaradi majhne umrljivosti v nadaljnjih letih znatno zmanjša. V starejših letih se zaradi povečane umrljivosti zelo poveča in doseže največje število umrlih v starosti 75-79 let. Od te staro¬ sti dalje zopet pada zaradi vedno manjšega števila prebival¬ stva v starosti nad 80 let. Slika 7.5 Število umrlih žensk v letu 1956 v Sloveniji po starosti ob smrti 7.10 Poligon frekvenčne distribucije porabe lesa v kme¬ tijskih gospodarstvih kaže bolj ali manj enako upa¬ danje gostitve od središča gostitve. Frekvenčne distribuci¬ je, ki kažejo enako upadanje frekvenc na levo in desno od središča gostitve, imenujemo simetrične distribucije, za razliko od asimetričnih distribucij, pri katerih je upada¬ nje gostitve na eno ali drugo stran hitrejše. Če je upada¬ nje gostitve počasnejše na levo od središča gostitve, pra¬ vimo, da je frekvenčna distribucija asimetrična v levo, če pa je upadanje gostitve počasnejše desno od središča, govo- - 77 - rimo o asimetriji v desno. Simetrično distribucijo dobimo navadno za homogene populacije. Če je populacija popolnoma homogena in so razlike re¬ zultat samo slučajnih vplivov, variiranje pa ni omejeno v nobeno stran, se vrednosti distribuirajo v frekvenčni distri¬ buciji, ki je simetrična in zvonaste oblike. Do distribucijo imenujemo normalno distribucijo. Normalna distribucija je na¬ risana v sliki 7.9a. Slika 7.6 Frekvenčna distribucija rezultatov pri testiranju računskih zmožnosti za 1518 tretješolcev v SRS (Po podatkih DAT za Slovenijo v 1957) i Slika 7.7 Frekvenčna distribucija o trdnosti za patentirano 5-mm jeseniško žico v kg/min (Po podatkih Zavoda za raziskavo materiala in konstrukcij SRS) Normalni distribuciji je precej podobna frekvenčna distribucija rezultatov testiranja računskih zmožnosti za 1518 tretješolcev v SRS v letu 1957. Asimetrijo povzročajo različni vzroki. Vir asimetri¬ je more biti heterogenost populacije ali pa tudi naravna ome¬ jitev variiranja. Tako imamo v sliki 7.7 narisano frekvenčno distribucijo za 153 meritev trdnosti 5-mm jeseniške patenti¬ rane žice. Ta distribucija ne kaže tendence asimetrije v le¬ vo zaradi nehomogenosti populacije, temveč zato, ker je v zvezi z lastnostmi materiala podana zgornja meja, čez katero trdnost žice ne more iti. Variacija k znižanju je svobodnej¬ ša in imamo zato asimetrijo v levo. Asimetrija na desno pa je vidna iz distribucije nevest v letu 1956 v Sloveniji po starosti. i starost iet Slika 7.8 Frekvenčna distribucija za starost nevest v letu 1956 v Sloveniji (Vir: SL SRS 57) 7.11 Frekvenčna distribucija industrijskih podjetij po številu zaposlenih kaže stalno upadanje gostitve, čim večje je podjetje. Zaradi značilne oblike imenujemo te vrste frekvenčnih distribucij J-distribucije, ker imajo bolj ali manj obliko črke J. V J-distribuciji se distribuira veliko socialno-ekonomskih pojavov. Tako ima podobno obliko frekvenčna distribucija za kmetijska gospodarstva v SRS. - 79 - J-distribucijo dobimo, kadar je središče gostitve zelo blizu naravne omejitve. Za trdnost žice iz primera v sliki 7.8 bi dobili tipično sliko J-distribucije, če bi se splošna kvaliteta žice približala maksimalni trdnosti. Če imamo normalno distribucijo za idealno, so neka¬ tere distribucije v primerjavo z njo koničaste, druge pa sploščene (glej sliko 7.9 h, i). d)a.cimetn'čnA. v levo {) J - krivulj*. h) Koničasta. e)AumoTridn*. v des.no $) U- krivulj*. i) SfloioenA. Slika 7.9 Oblike frekvenčnih distribucij KUMULATIVNA FREKVENČNA DISTRIBUCIJA 7.12. Ker frekvenčne distribucije prikazujejo število enot (ekstenziven podatek) po grupah numeričnega znaka, Moremo zanje izračunati kumulativne frekvenčne distribucije \ po splošnem pravilu za izračunavanje kumulativnih vrat. Kumulativno frekvenčno distribucijo F k dobimo, če postopoma Oštevamo frekvence F k v frekvenčni distribuciji. Člene ku¬ mulativne frekvenčne distribucije dobimo torej po obrazcu F k+1 + f, (7.5) v 80 Če za frekvenčno distribucijo o porabi lesa iz tabe¬ le 7.3 izračunamio kumulativno distribucijo, dobimo kumula¬ tivno vrsto v tabeli 7.7. Posamezni členi v kumulativni frekvenčni distribuciji F^ pomenijo, koliko enot ima vrednosti pod stopnjo mejo ustreznega razreda m ^ n « Tako pomeni npr. šesti člen kumu¬ lativne vrste, da je F^ = 124 gospodarstev, ki so v letu 1953 porabila manj lesa kakor x^ = 20 m3 lesa. Tabela 7.7 Kumulativna frekvenčna distribucija o porabi lesa v letu 1953 za 149 kmetij¬ skih gospodarstev v okraju. Novo mesto 149 = 147 + 2 *= N Kumulativno vrsto moremo izračunati tudi tako, da začnemo z večjim členom in postopoma prištevamo frekvence v obratni smeri. Členi te kumulativne vrste pomenijo, ko¬ liko enot ima vrednosti nad 'zgornjo mejo ustreznih razre¬ dov. Vendar to kumulativno vrsto uporabljamo redkeje kakor zgornjo. Enako izračunavamo kumulativne vrste tudi za frek¬ venčne distribucije z različnimi širinami razredov. Tudi pomen členov je isti kakor zgoraj. Kumulativne frekvenčne distribucije moremo izračunati tudi iz vrst relativnih fre¬ kvenc (glej tabelo 7.3). 7.13 če je frekvenčna distribucija unimodalna, ima gra¬ fični prikaz kumulativne frekvenčne distribucije značilno obliko črke S. 0 tem se moremo prepričati tudi v grafikonu za kumulativno frekvenčno distribucijo o porabi lesa v kmetijskih gospodarstvih v sliki 7.10, ki je 81 % F Slika 7.10 Kumulativna frekvenčna distribucija o porabi lesa v letu 1953 v 149 kme¬ tijskih gospodarstvih v okraju Novo mesto Začrtana po podatkih iz tabele 7.7. Opomniti moramo, da ^rednosti kumulativnih frekvenc v grafikonu nanašamo nad s podnjo mejo ustreznih razredov na abscisi, V grafikonu 7.10 imamo na ordinatni osi dve skali: skalo kumulativnih *a,bsojlutnih in relativnih frekvenc, da Moremo iz njega o"6oje odbrati. Lorenzov grafikon 7*14 Ce imamo za frekvenčno distribucijo razen frekvenc Se vsote vrednosti v ustreznih razredih, moremo konstrui¬ rati Lorenzov grafikon; ta pokaže koncentriranost pojava, ga prikazuje frekvenčna distribucija. Lorenzov grafikon sestavimo po temle postopku: a) Dano imamo frekvenčno distribucijo f^ in vsoto bednosti znaka y^v ustreznih razredih. b) Izračunamo vrsto relativnih frekvenc f^jž in vr- s to relativnih vsot 82 c) Iz vrst relativnih, frekvenc f$> in relativnih vsot izračunamo kumulativni vrsti F$ in Y$. d) V mreži grafikona, ki ima obliko kvadrata, je ab¬ scisna os skala za kumulativo relativnih frekvenc F%, ordi- natna os pa skala za kumulativo relativnih vsot Y$. V grafi¬ konu narišemo točke, ki imajo za abscise vrednosti kumula¬ tivne vrste relativnih frekvenc F#, za ordinate pa ustrez¬ ne vrednosti kumulative Y$. Če po vrsti povežemo dobljene točke, dobimo lomljeno črto, ki v loku veže spodnji levi kot grafikona z zgornjim desnim kotom grafikona. Cim večje so razlike po razredih, tem večja je koncentriranost pojava in tembolj je lok Lorenzove krivulje ukrivljen. Pri maksimalni koncentraciji preide lok v spodnjo in desno stranico kvadra¬ ta. Čim manjše so razlike po razredih, tem manjša je koncen¬ triranost pojava in tembolj je lok izravnan. Če ni koncen¬ tracije pojava, lok preide v diagonalo. 7.15 Vzemimo.za primer razdelitev števila industrijskih podjetij v SFRJ konec leta 1957 po številu zaposle¬ nih. Postopek za izračunavanje potrebnih kumulativ je naka¬ zan v tabeli 7.8. V tabeli 7.8 izračunani podatki (F$ in Y$) so vnese¬ ni v Lorenzov grafikon v sliki 7.11. Razen krivulje za celotno industrijo so v grafikonu vrisane še lorenzove krivulje za industrijo gradbenega ma¬ teriala in proizvodnjo in predelavo premoga. Primerjava vseh treh krivulj pokaže očitno manjšo koncentracijo zapo¬ slenega osebja v podjetju industrije gradbenega materiala in večjo koncentracijo v podjetjih proizvodnje in predela¬ ve premoga. Iz grafikona lahko odberemo tudi druge važne podatke. Iz njega vidimo, da ima npr. polovica (manjša pod¬ jetja) podjetij v SFRJ nekaj manj kot 10 $£ od vseh zaposle¬ nih, medtem ko ima druga polovica (večja podjetja) drugih 90 zaposlenih. V industriji gradbenega materiala je zara¬ di manjše koncentracije v polovici manjših podjetij pribli¬ žno 19 io vseh zaposlenih v tej stroki. Enako moremo odbira¬ ti druge podobne odnose. lorenzov grafikon ima tudi druge tehnične prednosti. Sestavljanje lorenzovih krivulj ni vezano na ustaljeno gru¬ pacijo in moremo v istem grafikonu včrtati lorenzove krivu¬ lje iz različno grupiranih podatkov. To posebno olajša med¬ narodne primerjave, ker ima vsaka država grupacije prilago¬ jene svojim pogojem in potrebam. 83 - Tabela 7.8 Izračunavanje kumulativ na Lorenzov grafikon za industrijska podjetja v SFRJ po številu zaposlenih konec le¬ ta 1957 (Vir: SG 58) % Slika 7.11 lorenzov grafikon za industrijska podjet¬ ja po številu zaposlenih v SFRJ za vsa in¬ dustrijska podjetja (£), za industrijo gradbenega materiala (IGM) in proizvodnjo in predelavo premoga (PPP; - 84 - OSMO POGLAVJE KVANTILI RAHŽIRNA VRSTA, RANG 8.1 Osnovni statistični podatki, ki smo jih. zbrali s statističnim opazovanjem, so dani v neurejeni mno¬ žici podatkov. Te podatke običajno uredimo v frekvenčno distribucijo. Moremo pa jih pregledno prikazati tudi v ranžirni vrsti, urejene po velikosti od najmanjšega do naj večjega. V tabeli 8.1 so prikazani osnovni podatki za mno¬ žino padavin v mm v juniju 1954 za 23 meteoroloških postaj v Sloveniji. Tabela 8.1 Množina padavin v mm v juniju 1954 za 23 meteoroloških postaj v Sloveniji (Vir: SG LRS 1956) 179 127 199 229 219 190 207 46 293 146 222 111 252 280 158 149 290 201 220 187 214 193 87 Vrsta podatkov v tabeli 8.1 ne,da dobrega pregleda o velikosti padavin, ker je neurejena. Ce iz teh podatkov se¬ stavimo ranžirno vrsto, dobimo tabelo 8.2. Tabela 8.2 Ranžirna vrsta podatkov o množini pa¬ davin v juniju 1954 za 23 meteorološ¬ kih postaj v Sloveniji 85 - Iz ranžirne vrste pa moremo napraviti več zaključ¬ kov o prikazanem pojavu. Iz nje podobno kakor iz frekvenč¬ ne distribucije neposredno vidimo, v kakšnih mejah variira populacija, ker kaže podatek, ki je prvi po rangu, najmanj¬ šo (46 mm), podatek, ki je poslednji po rangu, pa največjo množino padavin (293 mm). Razen tega vsaki enoti dodamo n.av znak - ;Xaag.-finat.£ v ranžirni vrsti. Rang daje o posamezni enoti dodatno in¬ formacijo, ki ,je osnovna vrednost znaka, - v našem primeru množina padavin - ne daje. Ce namreč za določeno meteoro¬ loško postajo, vemo, da je v juniju 1953 izkazala 252 mm pa¬ davin, iz tega podatka ne moremo sklepati, ali je to za Slovenijo za to razdobje malo ali veliko. Ce pa dodatno po¬ vemo, da je v ranžirni vrsti 23 postaj, ta postaja pa dvaj¬ seta po rangu, sklepamo, da.je ta množina padavin za Slove¬ nijo razmeroma velika, ker imajo od 23 postaj samo tri postaje večjo množino padavin kot 252* mm, devetnajst postaj pa manj¬ šo. KVANTILNI RANG 8.2 Hiba ranga je v tem, da moramo poleg ranga navesti še skupno število enot populacije, če hočemo, da rang pokaže mesto enote v populaciji. Postaja, ki je po padavinah dvajseta po rangu, je npr. za populacijo s 23 enotami, posta¬ ja z veliko padavinami, ker ima od 23 postaj 19 postaj manj¬ šo, samo 3 pa večjo količino padavin. Ce pa bi imeli npr. sto postaj, bi bila množina padavin za postajo, ki je dvaj¬ seta po rangu, razmeroma majhna,- ker bi imelo samo 19 postaj manj, 80 postaj pa več padavin. Rang R pokaže torej mesto ’ enote v populaciji šejle, če ga primerjamo z obsegom popula-. cije N. Zato je primerneje, da izračunamo mesto enote v po¬ pulaciji namesto z rangom R s kvantilnim rangom i&U Tega dobi¬ jo, če primerj amo rang R_z obsegom populacije N. Kvantilni rang v relativnem številu pove, na katerem delu celotnega ranžirnega razmaka leži določena enota, oziroma koliki del celote ima manjše vrednosti kakor je dana vrednost. 8.3 Teoretično vzamemo, da je ranžirni razmak zvezen in vsakemu rangu pripišemo razmak polovico enote na le¬ vo in desno. Po tej predpostavki se ranžirni razmak začne z 0,5 (spodnja meja razmaka, ki ustreza rangu 1) in konča z N + 0,5 (zgornja meja razmaka, ki ustreza rangu N). Ker .Skala kvantilnih rangov P začne z 0 in konča z 1, je zveza med rangom R in kvantilnim rangom P dana z obrazcem R = NP + 0,5 ( 8 . 1 ) - 86 - 1 Če je P * O, je R ■ 0,5, če pa je P « 1, je R = N + 0,5. Iz zgornje zveze dobimo, da velja tudi Če vzamemo zgornji primer meteorološke postaje z rangom R « 20 in N =23, dobimo po obrazcu P 20 - 0,5 — 0,85 Kvantilni rang P *= 0,85 pove, da ima 0,85 del celot¬ ne populacije manj padavin kakor je R ■ 20 ustrezna količi¬ na padavin (252 mm). Iz primera vidimo, da kvantil ni. rangr -P sam zase - ne da bi navajali obseg populacije - nazorno pri¬ kaže mesto določene enote v populaciji. *“ S = ■ 7 KVANTILI 8.4 Z obrazcema 8.1 in 8.2 moremo reševati dva, po svo¬ jem bistvu različna problema. Za posamezno enoto populacije moremo določiti mesto enote v populaciji, če izračunamo vrednosti x ustrezni kvan¬ tilni rang P x » Kva ntilni rangi so torej- karakteristike posa^ meznih enot. Moremo pa analogno reševati tudi drug problem. Če se vprašamo, kakšna vrednost x p ustreza npr. kvantilnemu rangu P m 0,50, vrednost, ki jo dobimo, ne označuje posamezne eno¬ te, marveč populacijo. x^, ki ustreza danemu kvantilnemu rangu P, imenujemo kvantil, Kvantil x Q je npr. vrednost, od katere ima polovica enot populacije manjše, polovica pa vefije vrednosti. Ta vrednost je vsekakor važen parameter po¬ pulacije in ga imenujemo mediana. Kvantili oc , x in op so vrednosti, ki razde- o,25 o,5o o,75 le populacijo v štiri dele tako, da je pod x o 25 » med x 0 25 in x _ med x^ - in x^ in nad x^ --po četrtina po ve- o,5o, o,5o o,75 o,T5 likosti urejenih vrednosti populacije. Te vrednosti, ki raz¬ dela populacijo v štiri po obsegu enake dele, imenujemo kvartile in zaznamujemo z «1 x o,75 x o,25 ; Q 2 (8.3) Analogno z decili D- k o,l.o» D, = x o,2o = X n o,9o (8.4) razdelimo celotno populacijo v deset po obsegu enakih, delov s centili: °l = x o,ol' C 2 = x o,o2. C 98 = x o,98 in °99 = X o,99 (8.5) pa v sto po obsegu enakih delov. Izračunavanje kvantilov iz negrupiranih podatkov 8.5 Ker predpostavljamo, da je rang zvezna količina, mo¬ remo določiti range za vsako vrednost med najmanjšo in največjo vrednostjo v populaciji in ne samo za podatke, navedene v ranžirni vrsti. Za vmesne vrednosti uporabimo linearno interpolacijo. Tako npr. menimo, da ustreza v zgornjem primeru rangu 12,5 sredina med 199 mm in 201 mm padavin, torej 200 mm padavin. Če predpostavljamo zveznost rangov, izračunavamo iz ranžirne vrste za poljubno vrednost x med najmanjšo in naj¬ večjo vrednostjo populacije ustrezni kvantilni rang P x po naslednjem postopku: a) Imamo ranžirno vrsto vrednosti enot populacije. b) V ranžirni vrsti poiščemo, med kateri vrednosti x q in x 1 pade vrednost x; za katero iščemo P x , tako da velja: x x 1# Vrednosti x Q naj ustreza rang R Q . no c) R ang R , interpolacijo ki ustreza vrednosti x, po obrazcu x - x R, dobimo z linear- ( 8 . 6 ) d) Kvantilni rang P izračunamo iz ranga R x in obse¬ ga populacije po obrazcu x (8.7) Če iščemo, kakšen kvantilni rang ustreza npr. padavinam x « 150 mm, dobimo po zgornjem postopku x » 150 leži v ranžirni vrsti med vrednostima x Q = 149, za ka¬ tero je rang R Q = 6, in vrednostjo x 1 = 158. - 88 - Iz teh podatkov izračunamo rang R , ki ustreza x - 150 mm, po obrazcu 8.6. Po obrazcu 8.7 pa dobimo dalje: P^« „ 0,244 Kvantilni rang kraja, ki je imel v juniju 1953 x » 150 mm padavin, je 0,244 ali izraženo v centilih: kraj z x * 150 mm padavin je v 24. centilu. Obratni problem, da k danemu kvantilnemu rangu P poiščemo ustrezni kvantil x p , pa rešimo takole: a) Za populacijo imamo ranžirno vrsto. b) Iz danega P po obrazcu R_ «= NP + 0,5 P ( 8 . 8 ) izračunamo ustrezni rang R. c) V ranžirni vreti poiščemo, med katera cela ranga pade izračunani R p tako, da velja: R 0 *^ R p ^ R^. Rangoma R„ in R n ustrezata vrednosti x^ in z n , o 1 o ± d) Iz teh podatkov izračunamo z linearno interpola¬ cijo Xp po obrazcut ■ x 0 + • (R p- R 0 ) (®- 9 > Kako iz podatkov o množini padavin v juniju 1953 izračuna¬ mo kvantile, če upoštevamo tabelo 8.2, je nakazano V tabe¬ li 8.3. Tabela 8.3 Izračunavanje kvartilov za množino padavin v juniju 1953 v Sloveniji Za prvi kvartil izračunamo rang R » 23.0,25+ 0,5 ■ ■ 6,25 in analogno ostala dva. - 89 - Poseben primer je drugi jcvartii. Zanj je iiVai/uine- mu rangu ustrezni rang celo število. Zato je .nadaljnji po¬ stopek nepotreben, ker je kvantil kar vrednost, ki ustreza temu rangu. V našem primeru je to 199 mm. Kvartili razmeroma dobro označujejo populacijo. Če¬ trtina postaj je imela pod 151,25 mm padavin, polovica pod 199 mm, in četrtina nad 221,5 mm. 8.7 V sliki 8.1 imamo v grafikonu za primer padavin iz tabele 8.2 vrisano ranžirno vrsto tako, da je absci¬ sa vrednost podatka, ordinata pa ustrezni rang. Točke pred¬ stavljajo osnovno ranžirno vrsto, lomljena črta, ki veže točke, pa linearno interpolacijo za vmesne vrednosti. V grafikonu je razen skale rangov vrisana tudi skala kvantil- nih rangov P, za katero je nazorno vidno, da se na skali rangov začne z 0,5 in konča z N+0,5. Na grafikonu je tudi nakazano, kako moremo grafično najti dani vrednosti x u- strezen kvantilni rang P in danim kvantilnim rangom P u- strezne kvantile x . Grafično so rešeni problemi, ki smo jih zgoraj rešili Računsko. P -R Zveza med kvantili, rangi in kvantilni- mi rangi za množino padavin za 25 mete¬ oroloških postaj v Sloveniji v juniju 1953. oxiKu 8.r 90 - Izračunavanje kvantilnih rangov in kvantilov iz frekvenčnih distribucij 8.8 Če je populacija, ki jo proučujemo, obsežna, je raz¬ vrščanje vrednosti v ranžirno vrsto neprikladno. Za obsežne populacije pa moremo izračunati približne vrednosti kvantilnih rangov in kvantilov iz kumulativnih frekvenčnih distribucij. Če vemo, kaj pomenijo členi kumulativne vrste, spoznamo, da je kumulativna frekvenčna distribucija v zvezi z rangi. Proučimo frekvenčno distribucijo o porabi lesa v 149 kmetijskih gospodarstvih v Novem mestu iz tabele 7.3. Iz nje vidimo, da ima frekvenčna distribucija nekatere lastnosti ranžirne vrste. V ranžirni vrsti so vrednosti, ki leže levo od dane vrednosti, manjše, desno pa večje. V frekvenčni dis¬ tribuciji pa so vse vrednosti enot v danem razredu večje od vrednosti v vseh spodnjih razredih in manjše od vrednosti v vseh zgornjih razredih. Tudi v frekvenčni distribuciji so torej vrednosti razporejene po velikosti, le da je rangira- nje izvedeno med razredi, ne pa znotraj razredov. Iz kumulativne frekvenčne distribucije moremo celo 1 približno ugotoviti, katere vrednosti ustrezajo določenim rangom. Če pogledamo kumulativno frekvenčno distribucijo v tabeli 8.4, moremo iz nje sklepati tole: Tabela 8.4 Kumulativna distribucija o porabi lesa v letu 1953 za 149 kmetijskih gospodar¬ stev v okraju Novo mesto Dvoje kmetijskih gospodarstev je porabilo manj kot 4,0 m3 lesa. Če vzamemo, da ima gospodarstvo z največjo po¬ rabo v tem razredu vpribližku porabo enako tej meji, je go¬ spodarstvo, ki ima rang 2, porabilo 4,0 m3. Iz kumulative dalje izvemo, da je 18 gospodarstev porabilo pod 8,0 m3. Če vzamemo, da je največja poraba v teh 18 gospodarstvih enaka tej meji, dobimo, da ima gospodarstvo, ki je porabilo 8,0 m3 lesa, rang 18 itd. Iz frekvenčne distribucije sklepamo, da imajo gospodarstva, ki so porabila toliko, kot so spodnje meje razredov, range enake ustreznim vrednostim kumulativne serije. Iz tega moremo sestaviti tabelo, ki je zelo podobna ranžirni vrsti, le da so rangi dani samo za meje razredov. Tabela 8.5 Okrnjena ranžirna vrsta za porabo lesa v 149 kmetijskih gospodarstvih v okra¬ ju Novo mesto (dobljena iz kumulativne vrste v tabeli 8.4) Ker za druge enote v ranžirni vrsti ne poznamo vred¬ nosti, predpostavljamo, da so vrednosti znotraj razredov razmeščene enakomerno. Tako dobimo vrednosti drugih enot v ranžirni vrsti z linearno interpolacijo. Grafikon kumula¬ tivne frekvenčne distribucije v sliki 8.2 ponazarja približen odnos med rangom R in vrednostjo znaka x, Ker tudi pri gra¬ fičnem prikazu predpostavljamo enakomerno razporeditev vred¬ nosti znotraj razredov, so točke zvezane z daljicami. Ker je kumulativna frekvenčna distribucija nadomestek za ranžirno vrsto, iz nje izračunamo kvantilne range in kvan- tile podobno kakor iz ranžirne vrste. 8.9. Oceno kvantilnega ranga P izračunamo po naslednjem postopku:- a) Iz frekvenčne distribucije izračunamo kumulativno frekvenčno distribucijo F^. b) Poiščemo, v kateri razred pade vrednost x, za ka¬ tero iščemo kvantilni rang P . Ta razred imenujemo kvantil- ni razred in ga zaznamujemo z o. Zanj izpišemo iz frekvenčne distribucije ustrezne vrednosti: x . , i , f , F . O f lil .L XI O O O c) Iz zgornjih, vrednosti izračunamo vrednosti x ustrezni rang R po obrazcu A F + o x-^ .min (8.lo) sr d) Iz dobljenega ranga R pa izračunamo kvantilni X rang P po obrazcu A P x R x - 0,50 N ( 8 . 11 ) Če je obseg populacije N velik, iz obrazca 8.11 običajno izpuščamo 0,5, ker je ta količina za velike popu¬ lacije nebistvena. Postopek velja tudi za frekvenčne distribucije, ki imajo različne širine razredov. 8.10 Če za populacijo o porabi lesa iz tabele 8.4 iščemo kvantilni rang za gospodarstvo, ki je v letu 1953 porabilo x = 13,8 m3 lesa, izračunamo P po zgornjem postop ku takole: x Poraba lesa x = 13,8 m3 pade v razred 12,0-15,9. Iz tabele 8.4 moremo odbrati: x o ,min 12,0 Ce vstavimo te podatke v obrazec 8.10, dobimo R x = 54 + 41 . - 1 ' 3 -*' 8 - 72,4 in dalje po obrazcu 8.11: _ 22x1_r_o^ x = 13,8 ~ 149 0,482 Gospodarstvo s p.orabo x = 13,8 rn5 lesa je v 48, centilu. 8.11 Analogno moremo iz frekvenčne distribucijo izračuna- I I ti tudi kvantile. Postopek je naslednji: 1 a) Iz frekvenčne distribucije izračunamo kumulativno frekvenčno distribucijo P, . b) Iz danega P izračunamo ustrezni rang R po obrazcu R » NP + 0,5 (8.12) Ge je populacija velika, v obrazcu 8.12 izpustimo 0,5. l/ 93 c) V kumulativni frekvenčni distribuciji poišče¬ mo, med kateri vrednosti kumulativne serije pade R, tako da je: E q < R p < E-^. k Q ustrezen razred je kvantilni razred. Zanj poiščemo v frekvenčni distribuciji količine: x . . i . f in Ti 1 . o,mm po d) Iz obrazcu: teh količin izračunamo ustrezni kvantil x P x o,min + 1 o (8.13) Enako kot za kvantilne range velja ta postopek tudi za fre¬ kvenčne distribucije z različnimi širinami razredov. 8.12 (Je hočemo za naš primer izračunati kvartile, je naj¬ bolje, da sistematično izračunamo v računski tabeli vse tri kvartile hkrati. Tabela 8.6 Izračunavanje kvartilov za porabo lesa v 149 kmetijskih gospodarstvih v okraju Novo mesto 8.13 Podobno kakor v sliki 8.1 za negrupirane podatke more¬ mo grafično oceniti vse zgornje količine iz grafikona kumulativne serije. V sliki 8.2 je nakazano, kako dani vred¬ nosti x = 13,8 m3 poiščemo ustrezni kvantilni rang, in obrat¬ no: kako moremo grafično oceniti kvartile. - 94 - Slika 8.2 Grafično ocenjevanje kvantilnih rangov in kvantilov iz slike kumulativnih frekvenčnih distribucij za porabo lesa v 149 kmetijskih gospodarstvih v Novem mestu v letu 1953 8.14 V praksi večkrat izdelujemo decilne ali centilne nor¬ me, s katerimi dobimo neposredno zvezo vrednosti z decili oziroma, pri podrobnejših normnih tablicah, s centi- li. Centilne norme s pridom uporabijamo*v psihologiji, more¬ mo pa jih izdelati tudi za določene soclalno-ekonomske pro¬ bleme. Tako tablica decilnih ali centilnih norm o produktiv¬ nosti dela pomaga presoditi, kakšna je produktivnost dela za posameznega delavca v razmerju s celotnim kolektivom itd. 95 .DEVETO TO Gl A V JE SREDNJE VREDNOSTI 9.1 Frekvenčne distribucije za homogene populacije (glej slike 7.3, 7.6, 7.7) kažejo, kako so razpo¬ rejene vrednosti populacije. Vrednosti se za te populaci¬ je grupirajo okrog nekega središča, od katerega se odkla¬ njajo navzgor in navzdol. Odkloni od tega središča so najpogosteje majhni. To središče, ki reprezentira vrednosti populacije, je značilno za populacijo in ne za posamezne enote in se me¬ nja, če menjamo pogoje, ki opredeljujejo populacijo, če primerjamo za določeno stroko frekvenčne distribucije plač za visoko kvalificirane, kvalificirane in priučene delav¬ ce, opazimo, da se središča - srednje vrednosti za posamez¬ ne populacije menjajo. Tako se goste plače visoko kvalifi¬ ciranih delavcev okrog najvišje, plače kvalificiranih de¬ lavcev okrog nižje in plače priučenih delavcev okrog naj¬ nižje srednje vrednosti. To središče je torej določeno z opredeljujočimi pogoji populacije, ti pa so za vse enote enaki, ce bi na plačo za posameznega delavca vplivala sa¬ mo kvalifikacija, bi imeli vsi delavci z enako kvalifika¬ cijo enake plače. Zaradi drugih, individualnih vplivov, ki so za vsakega delavca različni, pa se plače, od plače, ki je pogojena s kvalifikacijo, odklanjajo navzgor in nav¬ zdol. Cim manjši so individualni vplivi, tem bolje srednja vrednost reprezentira vrednosti populacije in obratno: čim večji so individualni vplivi, tem slabše srednja vrednost reprezentira vrednosti populacije. Zato je srednja vred¬ nost reprezentant vrednosti v populaciji le, če je popula¬ cija homogena. Vrste srednjih vrednosti 9.2 Parametrov, ki pokažejo centralno tendenco vredno¬ sti populacije, imamo več. Od teh so v socialno¬ ekonomski statistiki pomembne naslednje srednje vrednosti: a) mediana, b) modus, c) aritmetična sredina, d) harmonična sredina, e) geometrijska sredina. Medtem ko sta mediana in modus dana z lego vrednosti, šte¬ jemo ostale tri: aritmetično, harmonično in geometrijsko sredino med izračunane srednje vrednosti. 96 - MEDIANA 9.3 Za srednjo vrednost more dobro rabiti mediana, ki jo poznamo že iz poglavja o kvantilih. Mediana je vred¬ nost, ki ustreza kvantilnemu rangu P = 0,50, Me = x (P = 0,50) Mediana je uporabljiva srednja vrednost, ker nujno le¬ ži sredi individualnih vrednosti. Po definiciji ima namreč po¬ lovica enot manjše, polovica pa večje vrednosti, kakor je me¬ diana. Določanje mediane ne bomo obravnavali posebej, ker se sklada z določanjem kvantilov na splošno. Te pa smo obravna¬ vali že v odstavku o kvantilih. Na primerih iz tega odstavka smo izračunali mediano iz ranžirne vrste, če podatki niso grupirani, in iz kumulativne frekvenčne distribucije, če so podatki grupirani v frekvenč¬ ni distribuciji. Iz teh primerov smo dobili, da je mediana množine padavin, določena iz podatkov o padavinah v juniju 1953 za 23 meteoroloških postaj v Sloveniji, enaka Me = 199 mm Za porabo lesa v letu r 1953 v kmetijskih gospodarstvih v No¬ vem mestu pa smo iz frekvenčne distribucije o porabi lesa izračunali, da je mediana enaka Me = 14,05 m3 lesa. 9.4 lastnosti mediane . Prednost mediane je predvsem v tem, da je lahko razumljiva in zato kot opisni parameter pripo¬ ročljiva. Velika prednost mediane pred izračunanimi sredina¬ mi je tudi ta, da za določanje mediane ni nujno, da poznamo vrednosti za vse enote populacije. Zadosti je, da poznamo vrednosti za enote, ki leže okoli sredine v ranžirni vrsti. Ta lastnost mediane pride posebno prav, če izračunavamo sred¬ njo vrednost iz frekvenčne distribucije, ki ima odprte razre¬ de. Za odprte razrede namreč dostikrat niti približno ne ve¬ mo, kakšne vrednosti vsebujejo, ker so omejeni samo navzgor ali navzdol. Mediana je vselej primerna srednja vrednost tu¬ di takrat, če so ekstremne vrednosti take, da sumimo, ali sploh sodijo v homogeno populacijo, ali niso mogoče izraz nekih drugih kvalitet. Pomanjkljivost mediane pa je v tem, da je le preveč neobčutljiva za spremembe vrednosti in se njena vrednost ne spremeni vse dotlej, dokler so spremembe take, da vrednosti ne preidejo iz ene polovice v drugo. Vsota absolutnih odklo¬ nov posameznih vrednosti od neke vrednosti je najmanjša, če odklone računamo od mediane. Mediana je torej sorazmerno do¬ ber reprezentant posameznih vrednosti. 97 - MODUS 9.5 Mediana pa ni vedno vrednost, ki dobro reprezentira vrednosti populacije. Za asimetrične ali polimodal- ne distribucije je mediana vrednost, ki je različna od ve¬ čine vrednosti v populaciji. Če naj bo srednja vrednost reprezentant populacije, je v takih primerih veliko primer¬ neje, da vzamemo za sredino vrednost, okrog katere se vred¬ nosti populacije najbolj goste. Če pogledamo poligone fre¬ kvenčnih distribucij, moremo za vsako frekvenčno distribu¬ cijo zlahka ugotoviti približno mesto največje gostitve. Vrednost, okrog katere se najbolj goste vrednosti populaci¬ je, imenujemo modus ali najpogostejšo vrednost. Modus moremo ugotoviti samo za razmeroma obsežne po¬ pulacije, ki so grupirane v frekvenčni distribuciji. Iz in¬ dividualnih podatkov je modus nemogoče ugotoviti. če imamo namesto frekvenčne distribucije frekvenčno krivuljo, modus poiščemo enostavno. V tem primeru je modus abscisa tiste točke na 'frekvenčni krivulji, za katero je ordinata (gostota frekvence) največja. To je lepo razvidno iz slike 9.2. Izračunavanje modusa iz frekvenčnih distribucij 9.6 V praktičnih primerih za populacije nimamo frekvenčnih krivulj, temveč frekvenčne distribucije, ki jih moremo narisati v histogramu. Vendar moremo tudi iz frekvenčne dis¬ tribucije oziroma histograma sklepati, kje je gostota fre¬ kvence največja, - ker histogram nakaže približno obliko fre¬ kvenčne krivulje. Iz histograma sklepamo, da je modus v raz¬ redu, v katerem je frekvenca največja. V primeru za porabo lesa v 149 kmetijskih gospodarstvih v letu 1953 v Novem me¬ stu iz tabele 7.3 sklepamo, da je najpogostejša vrednost v razredu od 12,0 do 16,0 m3 lesa. Kot prvi približek modusa vzamemo kar sredino razreda z največjo frekvenco - modalne¬ ga razreda. V našem primeru je prva ocena modusa za porabo lesa 14 m3. Sredina razreda pa je prava vrednost modusa le, Se je distribucija simetrična. Drugače leži modus nad sre¬ dino razreda ali pod njo, kar je odvisno od tega, kakšna je frekvenčna distribucija. Natančnejšo oceno modusa dobimo, če upoštevamo tudi frekvence v sosednih razredih. Iz histograma o porabi lesa v sliki 7.1 moremo sklepati, da je modus za porabo lesa verjetno pod sredino modalnega razreda s sredino 14 m3. Ker je frekvenca pred modalnim razredom večja kot frekvenca za mo¬ dalnim razredom, bi bila frekvenčna krivulja, ki bi jo na¬ vrtali med stolpce histograma, nagnjena proti sosednemu raz- - 98 - redu z višjo frekvenco. Predpostavimo, da je v okolici modu¬ sa frekvenčna krivulja v približku parabola druge stopnje, ki gre skozi točke s koordinatama (x_^, f_^) > tx Q * f ) in (x , f . Pri tem pomenijo x , x in x, n sredine modalne- ga razreda in njegovih sosedov, f_^, f in f + ^ pa ustrezne frekvence. Pri tej predpostavki izračunamo modus po nasled¬ njem postopku: a) Podatke imamo grupirane v frekvenčni distribuciji z raz¬ redi enake širine i. Razredi morajo biti tako veliki, da frekvenčna distribucija izraža zakonitost gostitve frekvenc. b) V frekvenčni distribuciji poiščemo razred 0, ki ima naj¬ večjo frekvenco f ^ f > f . Razred z največjo frekvenco imenujemo modalni razred. c) Iz modalne frekvence f in frekvenc obeh sosednih razre- o dov f , in f,-, izračunamo d , = f - f in d, 1 = f - f, n . -1 +1 -1 o -1 +i o +1 d) Modus izračunamo po obrazcu M . x + i _ t=l _ (9-D 1 o o,min d -^ + ^+1 Pri tem pomeni razen že navedenih izrazov: x^ m ^ n = spodnja meja modalnega razreda. * 9.7 pogledamo primer o porabi lesa v 149 kmetijskih go¬ spodarstvih v letu 1953 v Novem mestu, vidimo, da je od treh distribucij, ki smo jih sestavili za izračunavanje modusa, prikladna distribucija, v kateri je razredna širina i=4 m3. V distribuciji v tabeli 7.2 se zakonitost gostitve še ne ka¬ že, v distribuciji v tabeli 7.4 pa je zaradi prevelike širi¬ ne razredov zakonitost gostitve že zabrisana. Iz frekvenčne distribucije v tabeli 7.3 sklepamo, da je modalni razred razred 12,0 - 15,9 m3, ker ima največjo frekvenco (f Q = 41). Ker je za to distribucijo f_ 1 = 36, in f +1 = 29, velja dalje: Ul = U - f -l = 41-36=5! d +1 =f 0 -f +1 =41-29 - 12. i = 4; x o,min 12 , 0 . Iz teh podatkov je modus po obrazcu 9.1 M o 12,0 + 4 5 5 + 12 = 13,17 m3 - 99 - Druga ocena modusa M = 13,17 m3 je stvarno pod prvo oceno 14,0 m3. 9.8 Modus pa moremo z istimi predpostavkami zelo enostav¬ no oceniti tudi iz histograma frekvenčne distribucije. Kakor kaže slika 9.1, zvežemo v histogramu oglišče A s C, oglišče B z D, Projekcija sečišča obeh veznic E je ocena mo¬ dusa M q . Slika pokaže, da grafičen način da v načem primeru praktično isti rezultat kakor račun. Slika 9.1 Grafičen način določanja modusa iz frekvenčne distribucije za porabo lesa v 149 kmetijskih gospodarstvih v Novem mestu 100 Lastnosti modusa 9.9 Modus je srednja vrednost, ki dobro reprezentira vred¬ nosti populacije, ker je že po definiciji vrednost, ki se v populaciji najpogosteje pojavlja. Enako kakor mediana je tudi modus srednja vrednost, ki je dana z lego vrednosti populacije. Zato je tudi modus neobčutljiv za spremembe vrednosti posameznih enot vse dotlej, dokler gostitev na ne¬ kem drugem mestu ne prekorači stopnje gostitve v modusu. To more biti dobra lastnost modusa, ker ni odvisen od vredno¬ sti, ki za populacijo niso tipične, more pa biti tudi hiba, ker je le premalo odvisen od vrednosti, ki niso najpogostej¬ še. Frekvenčna distribucija, ki ni homogena, more imeti tudi več mest gostitve. Tako imajo bimodalne distribucije dva, polimodalne distribucije pa celo več središč gostitve. T‘ake distribucije imajo torej dva ali več relativnih - lokalnih modusov. Od teh pa je absoluten modus tisti, za katerega je gostitev največja. Relativne - lokalne moduse ocenjujemo ena¬ ko kot modus za unimodalne distribucije. Pojem modusa uporabljamo včasih že pri zbiranju stati¬ stičnih podatkov in ne samo pri obdelavi. Tako pri registri¬ ranju cen na tržišču, registriramo modus cene, to je ceno, po kateri je na tržišču naprodaj največ blaga. ARITMETIČNA SREDINA 9.10 Izmed vseh srednjih vrednosti je najbolj znana in upo¬ rabljana aritmetična sredina ali povprečje. Aritmetič¬ no sredino M dobimo, če delimo vsoto vrednosti x vseh enot v populaciji z obsegom populacije N. Z obrazcem moremo to izra¬ ziti M x = x = 1 r (x 1 + V - _ 1 _ N Ix = X/N (9.2) , . , ^ - = aritmetična sredina. Znak M včasih -tri tem pomeni: M = x x zamenjamo z znakom x (x prečna); £x = X = vsota vseh vredno¬ sti v populaciji; 1EL = splošen znak za seštevanje izraza, ki stoji za njim; x = individualne vrednosti. Te oznake so splošne in jih bo¬ mo uporabljali tudi v drugih primerih. 9.11 Aritmetična sredina je izpeljana iz predpostavke, da je vrednost x za posamezno enoto vsota rezultatov splošnih (M) in individualnih vplivov (e) 101 x = M + e Nadaljnja predpostavka pa je, da se rezultati indivi¬ dualnih vplivov v vsoti uničijo. £e = 0. Ce upoštevamo zgornje predpostavke in seštejemo vred¬ nosti x za celo populacijo, dobimo Ix = ffi + Ee = NM. iz te enačbe zaključimo, da je rezultat splošnih vplivov M = X/l'I. To pa je po definiciji aritmetična sredina. Lastnosti aritmetične sredine 9.12 Iz definicije aritmetične sredine izvirajo različne lastnosti, ki so zelo važne za prakso in teorijo. a) A r itmetična sredina za linearno zvezo z = a+bx+cy med znaki x in y za isto populacijo, je enaka linearni zvezi aritmetičnih sredin. Z obrazcem moremo ta stavek napisati: ž = a + bx + cy = a + bx + cy (9.3) la stavek moremo zlalika dokazati. Za posamezno enoto in za vsoto velja: z 1 = a + bx 1 + cy 1 z ? = a + bx 9 + cy 2 z H = a -f bx N + cy N £z = Na + blx + cly Ker je po definiciji Iz = Nž, Ix = Nx in Ly = Ny, ve¬ lja dalje za vsoto: Nž = Na + bNx + cNy 9e to enačbo delimo z N, dobimo x = a + bx + cy 102 Ta sestavek ni omejen samo na linearno zvezo dveh znakov in ga moremo po potrebi razširiti. Iz gornjega stavka sledita neposredno nova stavka: Aritmetična sredina konstante je konstanta a = a (9.4) Aritmetična sredina produkta znaka s konstanto je enaka produktu konstante in aritmetične sredine znaka Trx = b . x (9.5) b) Vsota odklonov individualnih vrednosti od aritme¬ tične sredine je enaka 0. £(x - x) = 0 (9.6) Dokaz je preprost: Z(x-x) = £x-Nx = X-X = 0. c) Vsota kvadratov odklonov individualnih vrednosti od neke konstante A je najmanjša, če je A enak aritmetični sredini x. K = 2T(x-A)^= Min, če je A = x ' • dK Dokaz: Ce naj bo K minimalen, mora biti = 0 (9.7) dK dA = -2 2L(x-A)=0; r(x-A)=Zx-NA = 0; . 1 N Zx Ta lastnost aritmetičnih sredin je zelo važna za nadaljnje proučevanje populacij. Iz vsote kvadratov odklonov od aritme tične sredine je namreč izpeljan poseben parameter, varianca ki je najvažnejša mera jakosti individualnih vplivov. d) Sumarno aritmetično sredino populacije izračunamo iz aritmetičnih sredin delnih populacij po obrazcu x = N i x i + 1 $ 2 x 2 * Vr 1 + N 2 +. .. + N ^ N k X k (9.8) Ta način za izračunavanje aritmetične sredine imenujemo tehtano izračunavanje za razliko od enostavnega načina izra čunavanja po obrazcu 9.2. 105 Dokaz: Skupna vsota X je enaka vsoti delnih vsot X k za x X = X x + Xg + •.• + X k + ... + x r Ker velja tale o za skupno kot za dele X = Nx, je dalje: Nx = N 1 x- ] + N 2 x 2 + ... + N k x k + ... + N x Oe delimo to enačbo z N, dobimo obrazec 9.8. Izračunavanje aritmetične sredine iz negrupi- ranih podatkov 9.13 Iz individualnih podatkov izračunamo aritmetično sre¬ dino po osnovnem obrazcu 9.2 tako, da vsoto podatkov delimo z obsegom populacije N. Se po obrazcu 9.2 izračunamo aritmetično sredino za množino padavin v juniju 1953 za 23 meteoroloških postaj iz tabele 9.1, dobimo M x 179 + 127 + 199 + ... + 214 + 195 + 87 23 4399 23 191,3 mm Povprečno je odpadlo na eno postajo 191,3 mm padavin. Arit¬ metična sredina pokaže, na kakšni ravni so bile padavine v Sloveniji v juniju 1953 in je izraz splošnega stanja padavin v tem razdobju. Dobljeno povprečje pomeni: če bi bila celot¬ na množina padavin v vseh 23 postajah enakomerno porazdelje¬ na po posameznih postajah, bi na eno postajo odpadlo 191,3 mm padavin. Izračunavanje aritmetične sredine iz frek¬ venčnih distribucij 1-9.14 Direktna metoda. Izračunavanje aritmetične sredine po obrazcu 9.2 je za velike populacije zaradi velikega števila sumandov zamudno. Ker daje frekvenčna distribucija Približno sliko vseh vrednosti populacije, moremo aritmetič¬ no sredino oceniti iz frekvenčne distribucije. Če predpostavljamo, da sredina razreda x, v frekvenc- ni distribuciji reprezentira vrednosti v posameznem razredu, dobimo oceno za vsoto vrednosti v tem razredu, če sredino razreda pomnožimo s frekvenco f, . Vsoto vrednosti za celo populacijo pa dobimo, če produkte f ^x^ za vse razrede sešte¬ jemo. Če izkoristimo to lastnost frekvenčnih distribucij,iz¬ računamo oceno aritmetične sredine iz frekvenčne distribuci¬ je po obrazcu x f l x l + f 2 x 2 + ••• + f r x r f+ fp + ... + f Zf k x k fJZ 1 = ir If k x k (9.9) Ta obrazec je samo posebna oblika splošnega obrazca 9.8. Ta aritmetična sredina je tehtana aritmetična sredina. Pri tem pa so frekvence teže ali ponderi. Oceno aritmetične sredine izračunavamo po tem obrazcu v naslednjih točkah: a) Za frekvenčno distribucijo poiščemo frekvencam ustrez¬ ne sredine razredov x, , i£ b) Izračunamo produkte frekvenc f^. z ustreznimi sredinami razredov x^. c) Če vsoto produktov Zf^^. delimo z obsegom populacije N, dobimo oceno aritmetične sredine x. T a ocena je tem boljša, čim manjši so razredi, vendar tudi pri razmeroma velikih razredih dobimo še vedno zadovo¬ ljive rezultate, če je frekvenčna distribucija unimodalna in ne preveč asimetrična. Z a selo asimetrične distribucije, po¬ sebno za distribucije tipa J, pa daje tako izračunavanje si¬ stematično napačne ocene. Če je distribucija asimetrična v desno, dobimo sistematično prevelike ocene, pri asimetriji v levo pa sistematično premajhne ocene. Izračunavanje aritmetične sredine po obrazcu 9.9 velja za distribucije z enakimi in z neenakimi razredi. Ne moremo pa po tem obrazcu ocenjevati aritmetične sredine za frekvenč¬ ne distribucije z odprtimi razredi, ker zanje ne moremo izra¬ čunati sredine razredov. Edino če za odprt razred poznamo ra¬ zen frekvence f še vsoto vrednosti v odprtem razredu X , mo¬ remo izračunati oceno aritmetične sredine, če upoštevamo obra zec 9.8, po obrazcu f -,x -» + X r-1 r-1 r f l X l + ^2 X 2 + x N (9.10) - io5 - 9.15 izračunavanje ocene aritmetične sredine po direktni metodi je v tabeli 9.1 nakazano za frekvenčno distribu¬ cijo za porabo lesa v letu 1953 za kmetijska gospodarstva v Novem mestu. Tabela 9.1 Izračunavanje ocene aritmetične sredine potrošnje lesa v 149 kmetijskih gospo¬ darstvih v okraju Novo mesto v letu 1953 po direktni metodi ko obrazcu 9.9 je x = 2190/149 = 14,70 m3. če primerjamo dobljeni rezultat s pravo aritmetično sredimo 5 = 2182,1/149 = 14,34 m3, ki smo jo izračunali iz osnovnih podatkov v tabeli 8.1, vidimo, da je razlika mini¬ malna. 9.16 lomozni znak u, Ža frekvenčne distribucije, ki imajo enake razrede, moremo izračunavanje aritmetične sre¬ dine poenostaviti, če vpeljemo namesto sredin razredov pomož¬ ni znak u, , ki je z osnovnim znakom x, v naslednji linearni zvezi: x x k = x o + i* u k (9.11) kri tem pomeni: x q = sredina razreda, ki je približno v sre¬ dini frekvenčne distribucije ali blizu razreda z največjo frekvenco, i = širina razreda. Če natančneje proučimo vrednosti znaka u, spoznamo, da sredinam razredov v posameznih razredih ustrezajo u ... -3, -2, -1,0, +1, +2, +5 ... Pri tem je vrednost u = 0 v razredu, ki mu ustreza x . 106 - Zaradi obrazca 9.11 in stavka 9.3 pa velja i = x Q + iu (9.12) Ta postopek se običajno pokaže prikladnejši kakor di¬ rektna metoda, ker poenostavi množenje. Po tem postopku iz¬ računavamo aritmetično sredino po tehle točkah: a) V dani frekvenčni distribuciji izberemo nekje v sredini ali v razredu, okoli katerega so frekvence največje, iz¬ hodišče pomožnega znaka u. Glede na to poljubno izhodišče postavimo v posamezne razrede ustrezne vrednosti pomožnega znaka u. ... — 3 , — 2 , — 1 , 0 , + 1 , + 2 , +3 ... b) Pomnožimo frekvence f^ z ustreznimi vrednostmi u,. Tako dobimo produkte f^u^.. c) Seštejemo dobljene produkte in vsoto £f,u, vnesemo v obrazec x X h — Zf,.u k k (9.13) 9.17 Za porabo lesa v Novem mestu je izračunavanje aritme¬ tične sredine po metodi pomožnega znaka u nakazano v tabeli 9.2. T a bela 9.2 Izračunavanje ocene aritmetične sredine za porabo lesa v 149 kmetijskih gospo¬ darstvih v okraju Novo mesto po metodi pomožnega znaka u 107 - Ker je x q = 14,0, i = 4, N = 149 in Efu = + 26, dobimo po obrazcu 9.13 x = 14,0 + 4 y|| = 14,70 m? Rezultat se sklada z rezultatom, ki srno ga dobili po direkt¬ ni metodi. 9.18 Metoda kumulativ . če so podatki grupirani v frekvenčni distribuciji z enakimi razredi, moremo aritmetično sre¬ dino izračunati s kumulativami. Ta postopek je običajno še prikladnejši, kakor če vpeljemo pomožni znak u. Pri tej me¬ todi odpade vmesno množenje. Razen tega pa imamo kot postran¬ ski rezultat izra unano kumulativno frekvenčno distribucijo; ta je važna sama zase ali pa za izračunavanje kvantilov. Po metodi kumulativ izračunamo aritmetično sredino po naslednjem postopku: a) Iz frekvenčne distribucije f izračunamo kumulativno frek¬ venčno distribucijo P. b) beštejemo člene v kumulativni vrsti, razen zadnjega, ki leži pod črto, ki pomeni obseg populacije IT. Vsoto členov kumulativne vrste zaznamujemo z A. c) Aritmetično sredino x izračunamo iz dobljenih izrazov po obrazcu x = x p - i A/IT (9.14) Pri tem pomeni: x 0 = sredina zadnjega razreda v frekvenčni distribuciji, i = širina razreda, A = vsota členov v kumu¬ lativni vrsti; IT = obseg populacije. 9.19 Aritmetična sredina za porabo lesa v letu 1953 v Novem mestu je izračunana po metodi kumulativ v tabeli 9.3. Tabela 9.3 Izračunavanje aritmetične sredine za po¬ rabo lesa v 149 kmetijskih gospodarstvih v letu 1953 po metodi kumulativ N = 149 2 + 18+54+«. = 719 = A. +143+147 - 108 Ker je sredina zadnjega razreda x = 34, dobimo po obrazcu 9.14 ' 0 x = 34,0 - 4.719/149 = 14,70 m3. Dobljeni rezultat se sklada z rezultatoma, ki smo ju dobili po prejšnjih metodah. Modificirana aritmetična sredina 9.20 Kakor smo videli, je aritmetična sredina odvisna od vseh vrednosti populacije. Zato nanjo vplivajo tudi ekstremne vrednosti, ki so včasih rezultat izjemnih pogo¬ jev in jih ne moremo šteti, da sodijo v prikazano populaci¬ jo. Te vrednosti pačijo sliko populacije in tudi aritmetič¬ no sredino populacije. Zato za take primere izračunavamo sredino, ki je nekak kompromis med aritmetično sredino in mediano. Iz ranžirne vrste dobimo mediano, če sukcesivno izpu¬ ščamo po en spodnji in en zgornji člen v ranžirni vrsti. Na koncu tega postopka ostane samo en člen - mediana, ali dva člena, katerih sredina je mediana. Kompromisna rešitev pa je v tem, da izpuščamo po en zgornji in spodnji člen le to¬ liko časa, dokler ne izključimo vse netipične vrednosti, iz ostanka pa izračunamo aritmetično sredino. Tako odstranimo vpliv ekstremnih - izjemnih vrednosti, ki včasih občutno vplivajo na aritmetično sredino. Kljub vsemu pa je ta sre¬ dina izračunana iz večine vrednosti populacije. Modificira¬ no aritmetično sredino dobimo torej tako, da iz serije in¬ dividualnih vrednosti odstranimo pc en, dva ali več parov skrajnih - izjemnih vrednosti, iz ostalih pa izračunavamo povprečje. Ta postopek uporabljamo na primer pri analizi časovnih serij. Zaradi izjemnih razmer v določenih razdob¬ jih nekateri podatki pačijo tipičnost aritmetične sredine. Ce pa te ekstreme ne upoštevamo in uporabimo modificirano povprečje, dobimo realnejšo sliko. Aritmetična sredina aritmetičnih sredin 9.21 Če poznamo aritmetične sredine in obsege N^. za del¬ ne populacije, ki sestavljajo populacijo, moremo iz teh po¬ datkov izračunati aritmetično sredino x za populacijo po obrazcu £H k i k EN, x (9.15) 109 - Ta obrazec smo dokazali v odstavku o lastnostih aritmetič¬ nih sredin. lastnosti, da moremo izračunati skupno srednjo vrednost, če poznamo ustrezne srednje vrednosti za delne populacije, nimata niti mediana niti modus. Pri obeh je treba iz delnih populacij sestaviti skupno populacijo in iz nje poiskati mediano ali modus. Zgornji način izračunavanja aritmetične sredine ime¬ nujemo tehtan ali ponderiran način, ker je iz delnih sredin izračunana skupna sredina tako, da upoštevamo velikost - težo ali ponder - za posamezno delno aritmetično sredino. Obrazec 9.15 je poseben primer splošnega obrazca za izra¬ čunavanje tehtane aritmetične sredine r ^ w k r k £W k (9.16) tri tem pomeni: r = tehtana aritmetična sredina količin r^, w k = ponder za posamezne vrednosti r^. 9.22 V tabeli 9.4 je nakazano izračunavanje skupnih pov¬ prečnih mesečnih prejemkov delavcev v poljedelstvu, če poznamo povprečne mesečne prejemke in skupno število delavstva po kvalifikaciji v letu 1956. Tabela 9.4 Izračunavanje skupnih povprečnih mesečnih prejemkov delavcev v po¬ ljedelstvu v SFRJ v septembru le¬ ta 1957 (Vir: SB 114) 130210 1186576070 x 1186576070 1362id 9113 din 110 Popolnoma nepravilno bi bilo, če bi izračunali navadno aritmetično sredino iz podatkov o mesečnih prejemkih po kva¬ lifikaciji. Rezultat, ki bi ga dobili, s naV = 1/4 (14140 + + 12470 + 9280 + 7700) = 10900, je seveda različen od zgor¬ njega in brez logičnega smisla, medtem ko pravo sumarno pov¬ prečje pove, kakšni bi bili prejemki delavcev v kmetijstvu, če bi imeli vsi enake prejemke pri istem fondu plač. Sumarna povprečja pa moramo uporabljati zelo previdno. V splošnem sumame aritmetične sredine ne reprezentirajo vrednosti v populaciji. Sumarno povprečje more biti celo vrednost, ki jo ima malo število enot. Vendar kljub tem hi¬ bam dostikrat izračunavamo sumarna povprečja, ki so, če jih pravilno tolmačimo, dobro sredstvo analize. HARMONIČNA SREDINA 9.23 Med izračunane srednje vrednosti štejemo tudi harmonič¬ no sredino, ki je po definiciji recipročna vrednost a- ritmetične sredine reciprokov iz osnovnih podatkov. Po tej definiciji je harmonična sredina H enaka (9.17) tehtana harmonična sredina pa analogno H (9.18) 9.24 Če iz istih podatkov izračunamo aritmetično sredino in harmonično sredino, dobimo različne rezultate. Za podatke 1, 2, 4, 7, 9 je aritmetična sredina enaka x 1 + 2 + 4+ 7 + 9 5 4,6 harmonična sredina pa 111 Iz shematičnega primera vidimo, da so razlike znatne. Harmonično sredino izračunavamo redkeje kakor aritme¬ tično. Kadar se vrednosti populacije distribuirajo v asime¬ trični distribuciji, a tako, da je distribucija recipročnih vrednosti simetrična, pa harmonična sredina bolje kaže cen¬ tralno tendenco kakor aritmetična sredina«, Zato v Lakih pri- merih dajemo prednost harmonični si’edini pred aritmetično. 9.25 S harmonično sredino izračunavamo včasih tudi povpreč¬ je iz relativnih števil, Vzemimo, da je pet delavcev dela.lo po eno uro. Pri tem so dosegli naslednjo proizvodnost dela: 4, 5, 2, 6, 3 minute 2a en artikel. Proizvodnost dela merimo s časom, ki so ga Potrebovali za izdelavo enega artikla. Sumarni pokazatelj o produktivnosti dela za vseh pet delavcev dobimo, če skupno porabljen čas delimo s številom Proizvedenih artiklov. Vseh pet delavcev je delalo skupno 5.60 = 300 minut, btevilo artiklov, ki jih je proizvedel po¬ samezni delavec, dobimo, če za vsakega delavca čas (60 minut) delimo s časom, ki ga je potreboval za izdelavo enega artikla (pokazatelj produktivnosti dela). Za posamezne delavce dobimo Po vrsti: 60/4 = 15; 60/5 = 12; 60/2 = 30; 60/6 = 10? 60/3 = 20. Skupno število proizvedenih artiklov pa dobimo, če te podat¬ ke seštejemo. Povprečna produktivnost dela je torej 66/5 h. go /2 + 60/6 ♦ so yi - st - hki,.' Iz računa vidimo, da smo izračunali povpreono^proiz- vednost dela s harmonično sredino, ~-e - 1 * 6 0 izpustimo ponder 60, dobimo __ 5 _ — = 3,45 minut za artikel i/T“+ 1/5 + 1/2 + 1/6 +1/3 Ker so ponderi med seboj enaki dobimo ista rezultat, Se Vzamemo tehtano ali netehtano oblico. če iz zgornjih podatkov izračunamo aritmetično sre 1 - ho, pa dobimo i=I(4 + 5 + 2 + 6 + 5 ^ " Ire^kua pokaže, da harmonična sredina ^ Pravi^rezuitat.^ izvodnootj o dela 5,« minut za artikel, o- ena 112 - 300/3,45^= 87 artiklov. To pa je v skladu z definicijo pov¬ prečja. Če bi vseh pet delavcev delalo z enotno produktivno¬ stjo dela, 4 minute za kos, ki smo jo dobili z aritmetično sredino, pa bi v skupno 300 minutah izdelali le 75 artiklov in ne 87, kolikor so jih v resnici. Podrobneje o uporabi harmonične sredine pri izračuna¬ vanju povprečnih relativnih števil bomo zvedeli v naslednjem odstavku. POVPREČJA IZ RELATIVNIH ŠTEVIL 9.28 Problem izračunavanja povprečij iz relativnih števil je za socialno-ekonomsko statistiko tako osnoven in važen, da mu bomo posvetili poseben odstavek. Relativna števila so v splošnem kvocienti primerjanih količin. Če vzamemo, da je grupno relativno število r^ raz¬ merje dveh absolutnih podatkov in Y k moremo ta obrazec pisati da je in - W v več oblikah. Vk (9.19) Iz njega dobimo, ( 9 . 20 ) ( 9 . 21 ) Če upoštevamo te zveze, moremo izračunavati sumarno relativno število r na tri načine: a) Sumarno' relativno število je razmerje med vsotami absolutnih grupnih vrednosti za X^ in Y^.. Po tej definiciji je sumarno relativno število r enako r f^k ^ Y k ( 9 . 22 ) S tem obrazcem izračunavamo sumarno relativno število, kadar imamo po grupah absolutne podatke za X^ in b) Če upoštevamo obrazec 9.20, je sumarno relativno število * Y k r k £ Y, (9.23) 113 tehtana artimetična sredina grupnih relativnih števil r k . Pri tem so vrednosti, ki so v imenovalcu relativnega šte¬ vila, ponderi. Tako izračunavamo povprečno relativno štev vilo, kadar razpolagamo z grupnimi relativnimi števili in vrednostmi, ki nastopajo v imenovalcu relativnih števil, oziroma kadar je smiseln produkt pondera z relativnim šte¬ vilom I k r k . c) Ce upoštevamo obrazec 9.21, pa je sumarno relativ¬ no število enako r rx k (9.24) To pa je tehtana harmonična sredina grupnih relativ¬ nih števil r,. Pri tem so ponderi količine, ki nastopajo v relativnem šrevilu v števcu. Po tem obrazcu izračunavamo su¬ marno relativno število, kadar razpolagamo z grupnimi rela¬ tivnimi vrednostmi r, in grupnimi količinami X, , ki nasto¬ pajo v relativnem številu v števcu, oziroma kaaar je smiseln kvocient pondera in relativnega števila X k /r k# Obrazci 9.22, 9.23 in 9.24 oziroma zgornja pravila ne veljajo samo za relativna števila v ožjem smislu, temveč tu¬ di za izračunavanje sumarnih aritmetičnih sredin, saj so aritmetične sredine tudi relativna števila, ker so razmerja med vsoto vrednosti in številom enot. 9.27 Po zgornjih pravilih ugotovimo, kdaj uporabimo za izra¬ čunavanje sumarnih relativnih števil tehtano aritmetič¬ no ali harmonično sredino. Po teh pravilih ugotovimo, da je treba v primeru pro¬ duktivnosti dela, ki smo ga navedli v odstavku 9.25, izra¬ čunati harmonično sredino. Produktivnost dela je merjena z relativnim številom "čas, porabljen za proizvodnjo enega artikla", ki ga dobimo, če porabljen čas delimo s številom proizvedenih artiklov. Ker razpolagamo s časom, kolikor so posamezni delavci delali (60 minut), so ponderi količine, ki v relativnem številu nastopajo v števcu. Po zgornjem pravilu je treba za sumarno relativno število uporabiti harmonično sredino. Če poznamo površine in povprečne gostote prebivalstva po republikah, izračunamo gostoto prebivalstva za SFRJ po obrazcu za tehtano aritmetično sredino, ker so ponderi po¬ vršine v koeficientu "gostota prebivalstva" v imenovalcu. Če imamo po podjetjih dano število zaposlenih žensk in odstotek zaposlenih žensk od skupnega števila zaposlenih, izračunamo povprečen odstotek zaposlenih žensk za celo stro¬ ko po obrazcu za izračunavanje harmonične sredine. Relativno število odstotek zaposlenih žensk je kvocient med številom zaposlenih žensk in številom skupno zaposlenih v podjetju. - 114 - Ponder - število zaposlenih žensk je v tem primeru v števcu relativnega števila. Za podjetje imamo koeficiente o obračanju zalog posa¬ meznih vrst surovin (merjeno s časom enega obrata za posa¬ mezno vrsto surovine) in ustrezne vrednosti porabljenih su¬ rovin. Sumami koeficient obračanja zalog izračunamo po o- brazcu za izračunavanje tehtane aritmetične sredine. Poka¬ zatelj o obračanju zalog "čas enega obrata" je namreč kvo¬ cient med povprečnimi zalogami in vrednostjo porabljenih su¬ rovin. Ponder-vrednost porabljenih surovin - pa je v rela¬ tivnem številu v imenovalcu. Če imamo po okrajih podatke o površini in skupnem pri¬ delku pšenice v določenem letu, izračunamo povprečen hektar¬ ski donos pšenice po obrazcu 9.22 tako, da vsoto pridelkov po okrajih delimo z vsoto površin. Odvisnost sumamega relativnega š t e vi ]aod s t ruk ture 9.28 Če preuredimo obrazec 9.23, dobimo r £ Vk tY°rk (9.25) Podobno dobimo iz obrazca 9.24 r 1 k (9.26) Pri tem pomeni: x9 = X k /X strukturni delež za grupni poda¬ tek X^; = Yj c /Y strukturni delež za podatek Y k . To je ena izmed osnovnih hib sumamih relativnih šte¬ vil, zaradi katere imamo včasih zelo resre pomisleke o upo¬ rabnosti sumarnih pokazateljev. Za dve populaciji, ki imata ista grupna relativna števila, sta sumarni relativni števi¬ li med seboj različni, če sta strukturi ponderov različni. Se več. Razlike v strukturi ponderov morejo povzročiti, da je sumarno relativno število za populacijo A večje kot za populacijo B, čeprav so vsa grupna relativna števila za po¬ pulacijo A manjša kot za populacijo R. 9.29 Vzemimo za primer povprečne mesečne prejemke delavcev v kmetijstvu in gradbeništvu po kvalifikaciji. 115 Tabela 9.5 Povprečni prejemki delavcev v kmetij¬ stva in gradbeništvu po kvalifikaciji v letu 1957 v SFRJ (Vir: SB 114) Iz tabele 9.5 vidimo, da so povprečni prejemki delavcev v kmetijstvu za vse kvalifikacije višji kot v gradbeništvu. Kljub temu pa so sumarni povprečni prejemki v kmetijstvu niž¬ ji kot v gradbeništvu. Vzrok je različna struktura števila delavstva v kmetijstvu in gradbeništvu. Iz zadnjih dveh stolp¬ cev v tabeli 9.5 vidimo, da je sestav delavstva po kvalifika¬ ciji v poljedelstvu znatno nižji kot v gradbeništvu. Ta raz¬ lika v sestavu delavstva po kvalifikaciji ima tako močan vpliv na sumarno povprečje, da izpadejo povprečni prejemki delav¬ stva v celoti v kmetijstvu nižji kot v gradbeništvu, čeprav je za posamezne kvalifikacije situacija prav obratna. Standardizirani pokazatelji 9.30 Omenjena lastnost sumarnih pokazateljev je tako značil¬ na, da se vprašamo, ali imajo sumarni pokazatelji sploh analitičen pomen in smisel, ker je primerljivost sumarnih po¬ kazateljev zelo dvomljiva in meglena, če ne vemo, ali izvira razlika iz razlik v grupnih pokazateljih ali iz razlik v strukturi ponderov. Sumarni koeficient mortalitete je po tem odvisen od umrljivosti po posameznih starostnih skupinah za ženske in moške in spolne in starostne strukture prebivalstva. Prebival¬ stvo z razmeroma nizko stopnjo umrljivosti po posameznih sta¬ rostnih skupinah more imeti visok sumarni koeficient umrlji¬ vosti, če so v populaciji predvsem stari ljudje. Prebivalstvo z razmeroma visoko stopnjo umrljivosti po posameznih starost¬ nih skupinah pa more imeti nizek sumarni koeficient umrljivo¬ sti, če sestoji predvsem iz mladih ljudi. Podjetje more izkazati visok sumarni koeficient produk- tinosti dela, če proizvaja predvsem artikle, za katere je splošna produktivnost dela visoka, čeprav je produktivnost 116 dela za posamezen artikel v podjetju razmeroma nizka in obratno. Primerljivost tako izračunanih sumarnih pokazateljev motijo razlike v strukturi. Da izločimo vpliv razlik v struk¬ turi, izračunavamo standardizirane pokazatelje tako, da vza¬ memo za vse sumarne pokazatelje, ki jih primerjamo, stalno - standardno strukturo za pondere. Tako je standardiziran koe¬ ficient urmljivosti ponderirana sredina specifičnih koefici¬ entov umrljivosti po starosti, pri tem pa vzamemo enotno standardno starostno strukturo za vse države, za katere pri¬ merjamo podatke. Ti koeficienti imajo večjo analitično vred¬ nost kot navadni koeficienti umrljivosti, ker razlike med standardiziranimi koeficienti kažejo samo razliko v umrlji¬ vosti, ne pa v starostni in spolni strukturi. Standardna struktura, ki jo vzamemo za osnovo za izračunavanje sumarnih koeficientov, mora biti seveda taka, da čim bolje ustreza stvarnim strukturam za posamezne populacije, katere med se¬ boj primerjamo. Standardna struktura je zato včasih povpreč¬ na struktura vseh populacij, ki jih primerjamo, včasih ide¬ alna struktura, ki je pogojena z analizo pojava in podobno. 9.31 Izračunajmo za prejemke delavcevpo kvalifikaciji za kmetijstvo in gradbeništvo iz tabele 9.5 standardizi¬ rane povprečne prejemke delavcev za obe panogi. Za standard¬ no strukturo vzemimo povprečno strukturo delavstva v SFRJ po kvalifikaciji v vseh panogah. Ker za izračunavanje sumarnih povprečnih prejemkov vzamemo za standardno strukturo - strukturo delavstva po kvalifikaciji v SFRJ - dobimo v kmetijstvu povprečne meseč¬ ne prejemke večje (10576 din) kakor v gradbeništvu. (9855 din). Standardizirana povprečja resnično pokažejo, da je raven plač v kmetijstvu višja kot v gradbeništvu, ker razlike v sumarnih prejemkih izvirajo samo iz razlik v nivoju plač po kvalifika¬ cijah, ne pa tudi iz razlik v strukturi. Seveda so standardi¬ zirana povprečja različna od povprečij, ki smo jih dobili v tabeli 9.5. Te razlike so rezultat tega, da je stvarna struk¬ tura v posamezni panogi različna od povprečne strukture za vse panoge. - 117 - Tabela 9,6 Izračunavanje standardiziranih mesečnih prejemkov v kmetijstvu in gradbeništvu v letu 1957 v SFRJ Povprečni meseč- Standar- Standar- dna .. ni prejemki v din dna Irm a 4- i -i" jrraHhp- .c? kmetij- gradbe- struktu- struktu- (1)>({5) (2)>(J) stvo ništvo ra ' '' ' w ' v ^* v m rrr I m m m Visoko kvali¬ ficirani Kvalificirani Priučeni Nekvalificirani 15310 15200 0,075 1148,25 1140,00 12430 11920 0,365 4536,95 4350,80 9530 8950 0,263 2506,39 2353,85 8030 6770 0,297 2384,91 2010.69 1,000 10576,50 9855,34 GEOMETRIJSKA SREDINA 9.32 Geometrijska sredina G iz N vrednosti x., x 2 , x,, ... x^ je N koren iz produkta vseh vrednosti Iz te definicije sklepamo, da ima smisel izračunavati geome¬ trijsko sredino le tedaj, če noben izmed členov ni negativen ali nič. Tehtana geometrijska sredina je za razliko od navadne geometrijske sredine, ki je dana v obrazcu 9*27 enaka 9.33 Direktno izračunavanje geometrijske sredine^po zgornjih osnovnih obrazcih je razen za najenostavnejše primere neizvedljivo. Pač pa moremo geometrijsko sredino razmeroma enostavno izračunati z logaritmi. Če namreč obrazca 9.27 in 9.28 logaritmiramo, dobimo l°gG = t = Y k.k.. .k = Y k JN o ° N (9.31) Ge namreč Y postopoma množimo s k-^, k p ... k N , dobimo žara di pomena koeficientov dinamike postopana vrednosti členov časovne serije in končno zadnji člen Y^. Glede na definicijo srednjega koeficienta dinamike k pa dobimo Y^ tudi, če začet¬ no vrednost Y Q N-krat pomnožimo s k, ali če jo pomnožimo s k . Iz zveze v obrazcu 9.31 moremo izpeljati dva obrazca. k * k^.k£ N (9.32) in k (9.33) 120 Srednji koeficient dinamike je po obrazcu 9.32 geome¬ trijska sredina iz posameznih koeficientov dinamike. Po drugem obrazcu pa izračunamo srednji koeficient dinamike, če poznamo za razmak, za katerega izračunavamo srednji koeficient dinamike, začetno in končno vrednost po¬ java. Srednji koeficient dinamike je v tem primeru koren iz kvocienta končnega in začetnega člena časovne serije. Stop¬ nja korena pa je določena s časovnim razmakom, za katerega iščemo srednji koeficient dinamike. Zato ni nujno, da je N celo število, ampak more biti katerikoli časovni razmak. 9.37 Pri obravnavanju verižnih indeksov v odstavku o eno¬ stavnih indeksih smo izračunali vrsto verižnih indek¬ sov za proizvodnjo električne energije v SPRJ v letih 1951- 1956. Verižni indeksi v teh letih so: 105,9; 110,4; 115,4; 126,1; 117,1. Srednji verižni indeks v tem razdobju je po obrazcu 9.32 enak geometrijski sredini iz individualnih verižnih indeksov Z logaritmi izračunamo srednji verižni indeks po obrazcu 9.29 log 1 = ^(logl05,9 + logll0,4 + logll5,4 + logl26,l+ logll7,l) = = i ( 2,02490 + 2,04297 + 2 , 06221 + 2,10106 + 2 , 06856 ) = = 2,05994 Z antilogaritmiranjem dobimo, da je srednji verižni indeks 'I = 114,8. Da bi bilo zvečanje proizvodnje električne energije v razdobju 1951-1956 enako stvarnemu, bi se morala proizvodnja električne energije večati s srednjim verižnim indeksom 114,8. Isti rezultat dobimo, če računamo srednji verižni in¬ deks po obrazcu 10.33 iz začetne in končne proizvodnje elek¬ trične energije. Po podatkih iz tabele 6.19 je bila proizvod- : nja električne energije v letu 1951 v SPRJ = 2550, v letu 1956 pa = 5084 milijonov kWh. •Po obrazcu 10.33 pa je I = (/iLO5,9 . 110,4 . 115,4 . 126,1. 117,1 r Z logaritmiranjem dobimo i. log k = l Q £ 5Ub4-l0p- 2550 = 3 1 _70621 -3,40654 = 0<05993 z antilogaritmiranjem pa k = 1,148. ODNOSI HDD RAZLIČNIMI VRSTAMI SRLDNJIH VREDNOSTI 9.38 (Je vzamemo ilustrativen primer in iz 1 in 4 izračuna¬ mo harmonično H, geometrijsko G in aritmetično M sre¬ dino, dobimo, da je Iz teh rezultatov vidimo, da je harmonična sredina, če jo izračunamo iz istih podatkov, najmanjša, aritmetična sredi¬ na največja, geometrijska sredina pa lezi med obema. To ne velja samo za ta primer, ampak velja splošno pravilo: har¬ monična sredina je manjša kakor geometrijska, ta pa manjša kakor aritmetična sredina, če jih izračunamo iz istih po- 9.39 Tudi med vrednostmi modusa Mo, mediane Me m aritme¬ tične sredine M opazimo neke stalne odnose. Za unimo- dalne simetrične distribucije so vrednosti modusa, mediane in aritmetične sredine enake(Mo = Me = M). Za unimodalne distribucije, ki so asimetrične v desno, je modus manjši, aritmetična sredina pa večja kot mediana (.Mo AD = J Z - |x-M| (10.5) 128 Podobno kakor ori aritmetični sredini moremo tudi za izra¬ čunavanje AD uporabiti pomožni znak u, da si olajšamo iz¬ računavanje, vendar zaradi razmeroma majhne uporabe AD te¬ ga postopka ne bomo dalje razvijali. Varianca. Standardni odklon 10.9 Podobno osnovo kakor povprečen absolutni odklon ima tudi varianca 6^, ki je po definiciji povprečje kva¬ dratov odklonov od aritmetične sredine 6 2 = ^ £(x - M) 2 ( 10 . 6 ) Pri AD odpravimo predznake doklonov tako, da vzamemo abso¬ lutne odklone, pri <5 2 pa tako, da odklone kvadriramo. Podobno kot AD je tudi €> izračunana mera variacije .in je odvisna od vsake izmed vrednosti populacije. Vendar so druge lastnosti variance osnovne važnosti za statistič¬ no analizo. Zaradi tega je, enako kakor je aritmetična sre¬ dina osnovna srednja vrednost, varianca osnovna mera varia¬ cije, čeprav je njeno izračunavanje zaradi kvadriranja raz¬ meroma zamudno. Ker je varianca povprečje kvadratov odklonov, je iz¬ ražena v neprikladni enoti mere - kvadratu osnovne enote. Temu se ognemo tako, da izračunamo kvadratni koren iz vari¬ ance. To mero variacije imenujemo standardni odklon SD ali Varianca in standardni odklon sta torej v enostavni zvezi SD = (10.7) 10.10 Izračunavanje iz negrupiranih podatkov. Direktna metoda. Varianco in standardni odklon moremo po zgor¬ nji definiciji oziroma obrazcih izračunavati tako, da a) iz osnovnih podatkov izračunamo aritmetično sredino M; b) izračunamo odklone posameznih vrednosti od aritmetične sredine x - M; 2 c) posamezne odklone kvadriramo (x - M) ; d) varianco dobimo, če kvadrate odklonov seštejemo, doblje¬ no vsoto pa delimo z obsegom populacije N; 2 e) kvadratni koren iz variance 6 je standardni odklon SD. - 129 - 10.11 Za ceno mleka v marcu 1958 za glavna mesta republik izračunamo varianco, kakor je nakazano v tabeli 10.2. Tabela 10.2 Izračunavanje standardnega odklona za ceno mleka v glavnih mestih re¬ publik v mesecu marcu 1958 po di¬ rektni metodi X £(x-M) Z(x-M) 2 M = 263/6 = 32,83 ko obrazcu 10,6 dobimo S 2 = 362,8334/6 = 60,4722; Standardni odklon SD pa je po obrazcu 10.7 enak SD = ^60,4722 = 7,76 dinarjev. 10.12 Metoda pomožnega znaka u. Ker so odkloni od povprečja navadno decimalna števila, to komplicira kvadriran j e. Zato je izračunavanje variance in standardnega odklona po direktni metodi neprikladno. S pomožnim znakom u pa moremo v večini primerov s postopkom, ki smo ga spoznali ze pri izračunavanju aritmetične sredine, izračunati varianco znatno krajše. Po tej metodi: a) Izberemo poljubno okroglo vrednost x Q tako, da se stvarne vrednosti x od nje čim manj razlikujejo, b) Izračunamo odklone stvarnih vrednosti od x Q ; tako dobi¬ mo vrednosti u = x - x q ; c) Kvadriramo posamezne vrednosti u; ^ d) Seštejemo vrednosti za u in kvadrate u ; tak:o dobimo £u = U in 5_u 2 ; e) Iz teh količin izračunamo varianco in standardni odklon po obrazcih 130 - K Iu 2 -u 2 /N; 6 2 K/N; ( 10 . 8 ) 10.13 Če izračunamo po tej metodi varianco za ceno mleka iz zgornjega primera, vidimo, da je skrčenje računa znat¬ no. Po pregledu podatkov sodimo, da je primerna vrednost za računanje vrednosti u, x q = 45. Glede na to je potek računa nakazan v tabeli 10.3. Tabela 10.3 Izračunavanje variance za ceno mleka za glavna mesta republik v SFRJ v marcu 1958 po metodi pomožnega znaka u U lu 2 K = lu 2 - U 2 /N = 371 - (-7) 2 /6 = 362,8333 č 2 = k/N = 362,8333/6 = 60,4722; \f6 0.4722 = 7,76 din. Dobili smo torej iste rezultate kakor po direktni me¬ todi. Če se ne moremo odločiti za nobeno vrednost x , ali če izračunavamo variance z računskih strojem, vzamemo-x = ° Tako odpade izračunavanje u. Varianco v tem primeru izraču narno po obrazcih K = £ x 2 - X 2 /N; S 2 = K/N; SD = V^ 2 " (10.9) 10.14 Izračunavanje iz grupiranih -podatkov, 7 Direktna metoda , ba velike populacije je izračunavanje variance iz ne- grupiranih podatkov še zamudne je kakor izračunavanje arit¬ metične sredine. Zaradi tega za velike^populacije tudi va¬ riance ocenjujemo iz podatkov, ki so grupirani v frekvenč¬ ne distribucije. Ocena variance iz frekvenčne distribucije je direktno = ^ Ef k (x k “' x)2 ( 10 . 10 ) - 131 - tehtana aritmetična sredina kvadratov odklonov sredin raz¬ redov od aritmetične sredine X. Vendar se ta postopek izkaže v primerjavi z drugima postopkoma, s katerima more¬ mo tudi izračunavati varianco iz frekvenčnih distribucij, ne prikladen. Zato zanj ne navajamo primera, ker v sploš¬ nem te metode ne uporabljamo. 10.15 Metoda pomožnega znaka u. Varianco moremo ocenjevati iz frekvenčne distribucije z metodo pomožnega znaka u, ki je samo razširitev metode pomožnega znaka u za izra¬ čunavanje aritmetične sredine iz grupiranih podatkov. Po tej metodi izračunamo varianco tako, da: 1) enako kakor za aritmetično sredino izberemo razred, ki je nekje sredi frekvenčne distribucije. Vanj postavimo novo izhodišče znaka u = C, v druge razrede pa navzdol in navzgor od izhodišča ustrezne vrednosti pomožnega znaka u: ... -3, -2, -1, 0, +1, +2, +3, ... b) knako kakor za aritmetično sredino izračunamo produkte frekvenc f z ustreznimi vrednostmi znaka u, da dobimo fu. c) Produkte fu ponovno pomnožimo z ustreznimi vrednostmi znaka u; tako dobimo vrednosti fu^. d) Seštejemo frekvence f, produkte fu in produkte fu . Tako dobimo Zf = N, Efu = U in £fu . e) Iz teh količin izračunamo varianco po obrazcih K =£fu 2 -U 2 /N; <3 2 = i 2 K/N; SD = ^š 2 " (10.11) Pri tem je: i = širina razreda. 10.16 Za porabo lesa v 149 kmetijskih gospodarstvih v okra¬ ju Novo mesto je prikazan izračun, variance po tej me¬ todi v tabeli 10.4. - 132 - ' 2 Tabela 10,4 Izračunavanje variance 6 in stan¬ dardnega odklona 6 za porabo lesa v 149 kmetijskih gospodarstvih v okraju Novo mesto po metodi pomožnega znaka u Po obrazcih 10.11 dobimo dalje K = 372 - (+26) 2 /l49 = 367,4631 6 2 = 4 2 . 367,4631/149 = 39,4591 6= ^39,4591 = 6,28 m 3 10.17 Metoda kuraulativ. Tudi za izračunavanje variance more mo koristno uporabiti lastnosti kumulativnih vrst. Ta metoda je enako kakor metoda pomožnih znakov u samo razširi tev iste metode pri izračunavanju aritmetične sredine. Po metodi kumulativ izračunavamo varianco tako, da: a) Enako kakor pri izračunavanju aritmetične sredine iz frekvenčne distribucije f izračunamo kumulativno vrsto F. Zadnji člen kumulativne vrste (pod ali nad črto) je obseg populacije N. b) Po enakem postopku kumuliranja izračunamo iz prve kumu¬ lativne vrste F drugo kumulativno vrsto FF. Zadnji člen druge kumulativne vrste FF (pod ali nad črto) je A. c) Seštejemo vrednosti členov druge kumulativne vrste (brez člena pod ali nad črto). To vsoto zaznamujemo z B. d) Iz teh količin izračunamo varianco po obrazcih K = 2B + A - A 2 /N; 6 2 = i 2 K/N; SD =\f^ ( 10 . 12 ) 133 e) Kumulativne vrste moremo izračunavati od zgoraj navzdol ali obratno od spodaj navzgor. Za asimetrične distribu¬ cij 6 j e prikladneje začeti izračunavati kumulative na strani asimetrije. 10.18 V tabeli 10,5 je postopek nakazan za porabo lesa v Novem mestu. Tabela 10.5 Izračunavanje variance za porabo lesa v 149 kmetijskih gospodarstvih v okra¬ ju Novo mesto po metodi kumulativ 1559 = 2+20+, N A B K = 2.1559 + 719 - 719 2 /149 = 367,4631. +429+572 Kumuliranje frekvenčne distribucije v obratni smeri je naka¬ zano v tabeli 10.6 Tabela 10.6 Izračunavanje variance za porabo lesa v 149 kmetijskih gospodarstvih v okra¬ ju Novo mesto po metodi kumulativ ® • • + 8+2 - 134 - Ne glede na smer kumuliranja smo po metodi kumulativ dolili enake rezultate za K kot pri metodi pomožnega znaka u. Zgor¬ nja postopka sta pokazala, da je v našem primeru kumuliranje od spodaj navzgor prikladnejše, ker da manjše vmesne rezul¬ tate. Kot smo omenili zgoraj, je to zaradi tega, ker je dis¬ tribucija asimetrična v desno. 10.19 Sheppardov popravek. Varianca, ki jo izračunamo po zgornjih postopkih, je samo ocena prave vrednosti va¬ riance, ki bi jo dobili, če bi jo izračunali iz individual¬ nih podatkov. Analiza te ocene pa pokaže, da dobimo za uni- modalne, ne preveč asimetrične distribucije za zvezne znake po tej metodi sistematično prevelike vrednosti za varianco. Ta napaka je tem večja, čim večji so razredi. Varianco, iz¬ računano po prejšnjih metodah, moremo popraviti po obrazcu S 2 = (S 2 _ i 2 / 12 (10.13) cor tako, da od prvotne ocene variance, ki jo dobimo po metodi znaka u ali po metodi kumulativ, odštejemo dvanajstino kva¬ drata širine razreda. Ta popravek imenujemo Sheppardov popravek. Za frekvenčno distribucijo o potrošnji lesa v Novem mestu v letu 1933 je popravljena varianca enaka ^cor = - 4 2 /l2 = 38,1258 6 cor = \j 38,1258 = 6,17 m 3 Skupna varianca 10.20 Enako kakor sumarno aritmetično sredino moremo tudi skupno varianco izračunati iz grupnih podatkov. če poznamo po grupah število enot I'h_, aritmetične sredine in grupne variance <5^, izračunamo skupno varian¬ co za celo populacijo po obrazcu S 2 =M s2+ g£ (10.14) Pri tem je = ! £N k 6 k (10.15) 135 tehtana aritmetična sredina grupnih varianc, <*m = ir s H k (M k - M)2 ( 10 - 16 ) pa tehtana varianca med grupnimi aritmetičnimi sredinami M^. 10.21 Vzemimo kot primer stroške za kulturno in družbeno živ¬ ljenje v novembru 1957 za 36 delavskih družin v Maribo¬ ru. V tabeli 10.7 so navedeni N, W k in <3, po višini dohodkov. Tabela 10.7 Podatki za in^ za stroške za kulturo in družbeno življenje za 36 delavskih družin v novembru 1957 v Mariboru po grupah dohodkov Iz teh podatkov dobimo = JE C 12 (479-819) 2 + ... + 3(1703-819) 2 ] - 140709 M 1. Za porabo lesa v 149 kmetijskih gospodarstvih v Novem mestu smo dobili, da je Q-^ = 10,19; = 18,38; D-^ = 7,33; Dg = 23,53. Iz teh podatkov dobimo, da je KS 1,9 18,38 - 10,19 23,53 - 7,33 0,96 Distribucija je po sploščenosti zelo podobna normalni, ker je koeficient KS zelo blizu 1. - 143 ~ ENAJSTO POGLAVJE INDEKSI 11.1 V poglavju o relativnih številih smo kot eno izmed treh vrst relativnih števil obravnavali tudi enostav¬ ne indekse. Z enostavnimi indeksi primerjamo spremembo do¬ ločene količine v času, kraju in podobno. Tako z enostavni¬ mi indeksi primerjamo za določen artikel ceni v dveh različ¬ nih momentih, porabo v dveh različnih razdobjih, gostoto prebivalstva za dve republiki itd. Zelo važni pa so v eko¬ nomski statistiki indeksi cen. Povprečni indeks cen 11.2 Problem o primerjanju cen je precej enostaven, če pro¬ učujemo spremembe v cenah za posamezen artikel. Vendar enostavni indeksi v praksi ne zadovoljijo vseh potreb po pro¬ učevanju sprememb pri ekonomskih pojavih. Merjenje in prouče¬ vanje sprememb cen za posamezne artikle se izkaže za zelo ne- prikladno, ker je njih število veliko in je proučevanje spre¬ memb individualnih cen zaradi velikega števila razdrobljenih podatkov nepregledno in neučinkovito. V praktičnih primerih je zadosti, če poznamo, kako se spreminja raven cen, ne pa, kakšne so spremembe cen za posamezne artikle. To nas navede na misel, da prikažemo spremembe v ravni cen za skupino ar¬ tiklov s povprečnim indeksom, ki ga izračunamo iz individu¬ alnih indeksov cen za vsak artikel. Povprečni indeks iz in¬ dividualnih indeksov moremo izraziti z obrazcem l ( 11 . 1 ) Pri tem pomeni: P Q = cena v bazičnem trenutku, p-^ = cena v tekočem trenutku, N = število artiklov, I = povprečni indeks. Povprečni indeks, izračunan po obrazcu 11.1, pa je raz¬ meroma slabo merilo sprememb. Njegova hiba je v tem, da v njem ne upoštevamo važnosti posameznega artikla. 'Važnost za po¬ samezen artike.l je dana s proizvodnjo, če gre za indeks cen pri proizvajalcu, ali s porabo, če gre za cene v trgovini na malo. Iz vsakdanje prakse vemo, da so spremembe v ceni za artikle, ki jih množično porabljamo (npr. moka, kruh, mleko, meso itd.) za potrošnika veliko pomembnejše, kot spremembe za cene artiklov, za katere je poraba majhna (npr. televizij- - 144 - ski aparati, avtomobili, različni specialni električni apa¬ rati itd.). Zato povprečne indekse po obrazcu 11.1 razmero¬ ma redko izračunavamo, pač pa namesto njih uporabljamo agre¬ gatne indekse, ki upoštevajo različno težo za posamezne ar¬ tikle. AGREGATNI INDEKSI CEN 11.3 Če proučimo skupno vrednost določene skupnosti različ¬ nih artiklov, ugotovimo, da je skupna vrednost vsota produktov količin in cen za posamezne artikle. ( 11 . 2 ) Pri tem pomeni: V = skupna vrednost, p = cena za posamezen artikel, q = količina za posamezen artikel. Če vzamemo, da pomenijo q količine, ki so jih prodali v trgovini na drobno, p pa ustrezajoče cene v trgovini na drobno, pomeni V skupen promet v trgovini na drobno. Če pa so na primer q količine, proizvedene v določenem podjetju, p pa ustrezajoče cene pri proizvajalcu, pomeni V skupno vrednost gotove proizvodnje za to podjetje itd. Če z 0, 1, 2, 3, ... zaznamujemo, da podatki veljajo za posamezna različna razdobja 0,1,2,3 ...» moremo skupno vrednost za posamezno razdobje pisati V o =I )W T l= E Pl pri tem pa so vrednosti za posa¬ mezne artikle po cenah v bazičnem razdobju p q ponderi. Indeks cen, izračunan po obrazcu 11.7 kaže spremembe v ravni cen posredno prek sprememb v skupni vrednosti, pri predpostavki, da se količine ne menjajo. Tako izračunavanje indeksov imenujemo agregatno izračunavanje indeksov, ker ta indeks pokaže spremembe v cenah prek sprememb v agrega¬ tu - skupni vrednosti. Izbira ponderov.pri izračunavanju agregatnega indeksa cen Stalne količine q v obrazcu 11.6 za izračunavanje agre¬ gatnega indeksa cen morejo biti teoretično katerekoli količi¬ ne. Vsebinsko pa je jasno, da indeks cen tem bolje prikaže resnične odnose, čim bolj količine, ki jih vzamemo za ponde- re, ustrezajo stvarnosti. Zato po možnosti vzamemo za izraču¬ navanje agregatnega indeksa cen količine, ki so čimbolj po¬ dobne stvarni porabi ali proizvodnji v proučevanem razdobju. Pri tem pa imamo različne možnosti. 11.5 Laspevresov obrazec. Pogosto jemljemo pri izračunavanju agregatnega indeksa cen za pondere količine iz bazične¬ ga razdobja ( 11 . 8 ) - 146 - T a ko dobimo iz obrazca 11.6 konkreten obrazec za iz¬ računavanje agregatnega indeksa cen 1 P *Mo (11.9) Metodo, po kateri pri izračunavanju agregatnih indek¬ sov vzamemo za pondere stvarne podatke iz bazičnega razdob¬ ja, imenujemo Laspeyresovo metodo za izračunavanje agregat¬ nih indeksov, obrazec pa Laspeyresov obrazec za izračunava¬ nje agregatnega indeksa. Ta obrazec ima prednost, da so ponderi za katerokoli razdobje isti, Ta prednost, ki je nekatere druge metode ni¬ majo, daje Laspeyresovi metodi pri praktičnem izračunavanju agregatnih indeksov posebno ceno. Če uporabimo za izračunavanje indeksa cen laspeyresov obrazec, da indeks pristrane rezultate. Ta pristranost iz¬ vira iz tega, ker sta cena in prodana ali porabljena koli¬ čina med seboj odvisni. Če vzamemo, da je cena nekega arti¬ kla v tekočem razdobju večja kakor v bazičnem P 1 >P Q , ima ta podražitev za rezultat zmanjšanje porabe tega artikla: q-^ q . Ker v Laspeyresovem obrazcu vzamemo za pondere koli¬ čine Sz bazičnega razdobja, so ponderi pri artiklih, ki so se podražili, preveliki, pri artiklih, ki so se pocenili, pa premajhni. Skupen učinek teh razlik je sistematična pristra¬ nost navzgor, ker so ponderi za artikle, ki se podražijo, preveliki, ponderi za artikle, ki se pocenijo, pa premajhni. 11.6 Vzemimo kot primer za izračunavanje agregatnega indek¬ sa cen po Laspeyresovem obrazcu indeks cen mesa v raz¬ dobju 1954-1957 v SRS. V obračun vzemimo artikle, ki jih v skupini "surovo in prekajeno meso” vsebuje splošni indeks cen na malo za Slovenijo. Izključili smo le kokoš, ker je zanjo ponder minimalen. Podatki so vzeti iz censke in trgo¬ vinske statistike ZS SR Slovenije. Tabela 11.1 Izračunavali je agregatnega indeksa cen za surovo in prekajeno meso v splošnem indeksu cen na malo v SR Sloveniji po laspeyresovem obrazcu (cene v dinarjih količine v tisočih tonah) 147 148 - 11.7 Paaschejev obrazec . Po Paaschejevi metodi pa vzamemo za pondere pri indeksu cen tekoče količine q-^. Po tem osnutku izračunavamo indeks cen po obrazcu Z Po 1 *! ( 11 . 10 ) Če pogledamo obrazec 11.10, vidimo, da je treba po njem od primera do primera izračunavati tako števce kot ime novalce indeksa, medtem ko pri Laspeyresovi metodi imenova¬ lec Zp o q Q ostane pri vseh indeksih isti. Razen tega moramo pri Paaschejevi metodi poznati pondere - količine za vsa tekoča razdobja, za katera izračunavamo indekse. S praktič¬ nega vidika je torej izračunavanje po Paaschejevi metodi bolj zamotano kakor po Laspeyresovi. Prednost Paaschejeve metode pa je v tem, da je indeks bližji stvarnim razmeram kot indeks, izračunan po Laspeyresovi metodi. Vendar imamo pri indeksih cen po Paaschejevern obrazcu iz istega razloga kot pri Laspeyresovem obrazcu pristranost z obratnim učin¬ kom, ker stoji umetno sestavljena količina (^p Q q^) v ime¬ novalcu indeksa. Zato pričakujemo, da da Paaschejeva meto¬ da premajhne rezultate. 11.8 Če izračunamo za skupino surovo in prekajeno meso in¬ deks še po Paaschejevi metodi, dobimo rezultate, ki so dani v tabeli 11.2. Primerjava indeksov cen, ki smo jih dobili po Laspey- resu, z ustreznimi indeksi cen, ki smo jih dobili po Paa¬ sche ju, kaže, da so resnično indeksi cen, izračunani z Laspeyresovim obrazcem višji kot indeksi cen, izračunani s Paaschejevim obrazcem. To pa je skladno z učinkom, ki iz¬ vira iz odvisnosti potrošene količine od cene. 11.9 Fischerjev idealni obrazec. Pa omilimo pri indeksih cen učinke, ki izvirajo iz tega, da pri Laspeyresovi formuli vzamemo za pondere q = q Q bazične, pri Paaschejevi pa q = q.^ tekoče količine, vzamemo včasih za pondere pov¬ prečje iz tekočih in bazičnih količin q = l/2(q Q + q-^), včasih pa povprečne količine v celotnem razdobju, za kate¬ rega proučujemo gibanje cen. Ker pa daje Laspeyresova formula sistematično preve¬ like, Paaschejeva pa sistematično premajhne indekse cen, me nimo, da je pravi indeks nekje med obema. Zato vzamemo za pravilnejšo vrednost srednjo vrednost med L in P . Zaradi Jr ir drugih kvalitet, ki jih ima tako izračunavanje indeksov cen je Fischer vzel v ta namen geometrijsko sredino med 1^ in P ( 11 . 11 ) p p = J V E P ■ L .P P P l p l q 0 ^ p l q -l ZP 0 1 0 * IP^ kot pravo vrednost indeksa cen, in jo imenoval idealno. Za¬ to imenujemo ta obrazec Fischerjev idealni obrazec. Indeks, izračunan s Fischerjevim idealnim obrazcem, nima istega logičnega smisla kot Laspeyresov ali Paasche- jev, je pa nekak kompromis med obema. V tabeli 11.4 so pri¬ kazane indeksne vrste za primer skupinskega indeksa za su¬ rovo in prekajeno meso, izračunane po vseh treh obrazcih: iaspejrešovem, Paaschejevem in Fischerjevem. Iz tabele vi- vimo, da je učinek ponderacije tem večji, čim večje je raz¬ dobje med bazičnim in tekočim razdobjem. Verižni indeks cen 11.10 Vpliv ponderacije na indeks je tem večji, čim daljše je razdobje med bazo ali osnovo indeksa in tekočim časom. Zato je pristranost verižnih indeksov razmeroma majh¬ na, ker se osnova razlikuje od tekočega Časa le za enoto ča¬ sa. Iz verižnih indeksov pa moremo izračunati indekse s stalno osnovo, s postopnim množenjem verižnih indeksov 1 l/o ~ 1 1’ I 2/o “ I l/o * I 2 ; I 3/o ~ I 2/o * T V ** ( 11 . 12 ) Čeprav nakazani postopek velja sicer le za enostavne indekse, ga moremo uporabiti kot dober približek tudi za agregatne indekse. Prek verižnih indeksov izračunamo indeksno vrsto s stalno osnovo v naslednjih stopnjah: a) Najprej izračunamo po Laspeyresovem obrazcu vrsto veriž¬ nih indeksov £>W Upp O. - ] z P 5 1 2 I 3 = IP 2 q 2 (11.13) b) Iz vrste verižnih indeksov dobimo indeksno vrsto s stal¬ no osnovo tako, da verižne indekse postopoma kumulativno množimo: h/o - h' h/o ■ h/o • h' h/o - h/o • h itd - (11 - 14) Pri tem pomenijo I-, / , I 2 / 0 * ^3/o *** indekse s stal¬ no osnovo 0. / / / - 150 - Tabela 11.3 Izračunavanje skupinskih indeksov cen za surovo kajeno meso v razdobju 1954-1957 v Sloveniji po verižnih indeksov - 151 - zi maensa le ra do ako se na po- - 156 - trošni koš stalen, če izračunamo, kolikšni so strošk: -a preživljanje, ako hočemo zadostiti porahi po teoretski li¬ sti, dobimo absoluten iznos; ta je fiktiven in ga ne upo¬ rabljamo za analizo. Indeksi, ki jih izračunamo iz teh ab¬ solutnih - fiktivnih stroškov, pa zelo dobro kažejo, kako se giblje raven stvarnih življenjskih stroškov, če je po- trošni koš po svoji strukturi in izbiri artiklov primeren. 11.*17 V tabeli 11.6 je nakazan primer, kako je izračunan indeks življenjskih stroškov za štiričlansko delav¬ sko družino za Slovenijo za november 195«. Za osem osnov¬ nih srupin stroškov so vpisani stroški, skupinski indeksi in skupni indeks življenjskih stroškov. Za osnovo smo vze¬ li povprečne cene v letu 1957. Tabela 11.6 Indeks življenjskih stroškov za novem¬ ber 1958 za štiričlansko delavsko dru¬ žino v Sloveniji (podatki ZS SR Slove¬ nije) V tabeli 11.7 je za ilustracijo, kako izračunavamo in kakšna je struktura indeksa življenjskih stroškov, nakazan podroben izračun indeksa življenjskih stroškov za prehrano. Količine, ki so vzete za osnovo izračunavanja, so po izbiri in količi¬ ni enotne za vso Jugoslavijo. Zanimivo je v indeksu stroškov za hrano rešen problem mesa, tolšč, povrtnine in sadja, ki so sezonskega značaja. Stalne artikle za celo leto je za te skupine težko, če ne ce lo nemogoče določiti. Zato je v indeksu za te grupe predpisa na le s u >n: količina mesa, tolšč, povrtnine in sadja na splošno. Slede na posebnosti sezone pa za vsak mesec po do¬ datni listi izračunavamo povprečno ceno za vsako izmed teh Tabela 11.7 Indeks življenjskih stroškov ; Sloveniji. Izračunavanje skupinskega indeksa za h na: v mesecu novembru 1953 (Podatki Z3 - i Slovenije) - 158 - skupin iz artiklov, ki so v tem mesecu naprodaj. Tako se veliko "bolj približamo stvarnosti, kakor pa da iščemo o te skupine neke reprezentante, ki se prodajajo vse leto. Za povrtnino je bila izračunana povprečna cena v no¬ vembru po shemi v tabeli 11.8. V tabeli 11.8 je prikazana lista vseh artiklov, ki pridejo v poštev v katerem koli me¬ secu v letu. Od teh so v novembru vzeti v poštev le tisti, ki so v tem mesecu na trgu. Povprečna cena je ponderirana sredina; pri tem pa so ponderi vzeti skladno z dejansko po¬ rabo. Tabela 11.8 Izračunavanje povprečne skupinske cene za povrtnino za indeks življenjskih stroškov za mesec november 1957 Povprečna cena povrtnine v novembru je za indeks živ¬ ljenjskih stroškov 62,5 din. Ta povprečna cena je vnesena za ceno povrtnine v indeks življenjskih stroškov za prehrano. aGRPGATHI INDmkbl hOl/ICIn 11.18 Dosedaj smo obravnavali le agregatne indekse cen. Vendar enako - le da pomen cen in količin zamenjamo - izračunavamo tudi agregatne indekse količin, tako da spremi¬ njano količine in vzamemo cene za stalne. Tako dobimo, ana¬ logno indeksom cen, indeks količin po Laspeyresovem obrazcu, če vzamemo v agregatnem indeksu L 27 P ° q l i ~ z p 0 i 0 (11.17) - 159 - za pondere cene v osnovnem razdobju in Paaschejev obrazec za izračunavanje indeksa količin,, če v obrazcu vzamemo p rp A 1 " (11.18) za pondere cen iz tekočega razdobja. Enako je geometrijska sredina med Laspeyresovim in Paaschejevim obrazcem Fischerjev idealni obrazec za izračuna¬ vanje agregatnega indeksa količin V E Ml EPo^O E Ml E Mo (11.19) Z agregatnimi indeksi za količine v praksi izračunava¬ mo fizični obseg proizvodnje v industrijskih podjetjih in ra¬ čunamo vrednost proizvodnje po stalnih, bazičnih cenah. Enako kot so pri izračunavanju indeksa cen sčasoma stalne količine, ki jih vzamemo za pondere, problematične, so pri indeksih ob¬ sega proizvodnje za daljša razdobja problematični ponderi tu¬ di stare, stalne cene. V bistvu se pri izračunavanju indeksov količin borimo z enakimi težavami kot pri agregatnih Indeksih cen. 11.19 Če izračunamo za primer indeks obsega potrošnje za po¬ rabo mesa v Sloveniji v tabelah 11.1 in 11.2, je in¬ deks obsega porabe v letu 1957, če vzamemo za osnovo leto 1954 po iaspeyresovem obrazcu *-’ p o 5 3 7076.3 ,,, , PA = 5W - 131 ’ 3 po Paasche je vem obrazcu E p 3 q 3 = 8386,8 £P 5 9 0 = ^4547^ 129»9 po Fischerjevem obrazcu ^ 131 , 3~7 129,9 « =131,1 11.20 Ko izračunavamo indeks obsega proizvodnje ali obseg prometa v trgovini na drobno ali na debelo, naletimo dostikrat na hude težave. Izračunavanje reprezentativnih in¬ deksov obsega nima istega logičnega ozadja kakor reprezenta- - 160 - tivni indeksi cen. Zato smo navezani le na kompletno izraču¬ navanje in preračunavanje vrednosti po stalnih cenah. To pa je sila težavno, če agregat sestavlja veliko število različ¬ nih predmetov. Dostikrat si pomagamo pri ocenjevanju vredno¬ sti proizvodnje, prometa ali porabe po enotnih - stalnih ce¬ nah z enostavnim sklepom. Če je stvarna vrednost proizvodnje, porabe ali prometa v tekočem razdobju V-^ * Zp-^q^, moremo vred¬ nost proizvodnje reducirati na cene v bazičnem razdobju *= = Zp cu, če jo delimo z ustreznim reprezentativnim indeksom cen Xp J q' L - *o 4 o ( 11 . 20 ) Pri cenah in količinah so napravljene črtice, ker so to cene in količine za reprezentativne artikle te grupe, ne pa za vse artikle grupe, kakor je to v izrazih T. i n ^P 0 q l* Če je dana vrednost po tekočih cenah, moremo torej oce¬ niti vrednost po bazičnih cenah, če stvarno vrednost V-^ = = Zp^q^ delimo z ustreznim indeksom cen P^, vrednost prome¬ ta v trgovini na drobno z indeksom cen v trgovini na drobno, promet v trgovini na debelo z indeksom cen v trgovini na de¬ belo itd. Če ocenjujemo vrednost samo za določeno skupino, reduciramo vrednost z ustreznim grupnim indeksom cen itd. Testi o agregatnih indeksih 11.21 Test o zamenljivosti blaga. Če v individualnem indek¬ su cen i7 77 = p-j/ P 0 zamenjamo osnovo in tekoče razdo- produkt obeh indeksov 'l/o " bje i o/1 = Po / Pl , je i l/o * i o/l - ( 11 . 21 ) enak ena. Te lastnosti pa nimajo vsi agregatni indeksi in je po¬ sebna odlika le nekaterih vrst agregatnih indeksov. Če vzame¬ mo npr. Laspeyresov obrazec za izračunavanje agregatnega in¬ deksa cen, zanj ta zveza ne velja, ker je L l/o ‘ L o/l ^¥o rp o q l t sp^l ( 11 . 22 ) 161 - Zgornja zveza ne velja niti za Paaschejev obrazec cen niti količin. Pač pa velja za Fischerjev obrazec. Tako dobi¬ mo, da je za indeks cen po Fischerjevem obrazcu F l/o • Vi x £ p o q l £ p l q l ' ^ p l q o = 1 (11.23) 11.22 Test o zamenljivosti količin, če v individualnem in¬ deksu' cen i = P]_/p o zamenjamo simbol za ceno p s simbolom za količino q n , dobimo tale indeks količin i = a,/q ^•1 ’ q u l' V da je produkt obeh enak indeksu vrednosti I v = V-,/V 0 (11.24) Te lastnosti laspeyresov indeks cen nima. Če zamenjamo faktorje in pomnožimo oba indeksa, dobimo L . L zp l q o rq l p o = rp l q l = I q ^P o q o ‘ ^q 0 P 0 rp Q q 0 V (11.25) Te lastnosti tudi drugi agregatni indeksi nimajo, ra¬ zen Fischerjevega idealnega obrazca. Zanj velja | * P l q o * p o q o XI r Mi \ * q l P 0 * q o p o ^ q l p l = £ p l q l eq 0 P x ZP o q o I v ( 11 . 26 ) Zaradi teh dveh lastnosti, ki enačijo operacije agre¬ gatnih indeksov z operacijami, ki jih moremo izvesti z indi¬ vidualnimi indeksi, imajo Fischerjev obrazev za idealen. Drugi agregatni indeksi 11.23 Z agregatnimi indeksi ne obravnavamo samo gibanja cen in obsega proizvodnje. Z njimi proučujemo dinamiko najrazličnejših drugih ekonomskih pojavov. Praktično z agre¬ gatnimi indeksi proučujemo dinamiko vseh pojavov, ki se dajo numerično prikazati v obliki agregata kpq kot vsota produktov dveh količin. 162 11.24 Eden izmed važnih problemov, ki ga rešujemo z agre¬ gatnimi indeksi, je indeks produktivnosti dela. Pro¬ duktivnost dela za posamezen artikel v merimo z vrednostjo proizvodnje na enoto časa v = V T (11.27) Skupna vrednost proizvodnje za celo podjetje je V = iTv (11.28) vsota produktov porabljenega časa in individualnih produktiv¬ nosti dela za posamezne artikle, torej agregat. Agregatni in¬ deks produktivnosti dela dobimo po istem načelu kot indeks cen. Laspeyresov obrazec za izračunavanje indeksa o produktiv¬ nosti dela je na primer I v IT v o IT v o 1 o (11.29) Ta obrazec za izračunavanje indeksov o produktivnosti dela poznamo pod imenom indeks produktivnosti dela pri stalni strukturi časa. Če pa vzamemo za posamezen artikel za merilo produk¬ tivnosti dela čas t, ki ga porabimo za proizvodnjo enote pro¬ dukta, + _ T X " Q (11.50) je skupno porabljen čas za celotno proizvodnjo v podjetju agregat T = £Qt (11.31) Pri tem pomenijo: T = čas, porabljen za proizvodnjo posameznega artikla, Q = proizvedena količina za posamezen artikel, t = proizvodnost dela za posamezen artikel. Podobno kakor pri drugih problemih, moremo iz tega agregata izračunati agregatni indeks o produktivnosti- dela po obrazcu IQ t ^o o rn t ul ( 11 . 32 ) V tem indeksu je agregat v imenovalcu, £Q Q t o pa v števcu zato, ker je t recipročen pokazatelj produktiv- 163 nos t CciS f i dela. Cin večja je produktivnost dela, ten manjši je porabljen na izdelavo enote proizvoda. Ker so v obrazcu 11.32 ponderi stalne količine, imenujemo ta indeks indeks produktivnosti dela pri stalni strukturi količin. Podobno izračunamo agrevatne indekse plač po kval P = fikaciji, ker je skupni plačni fond vsota produktov delavcev in povprečnih plač po kvalifikaciji najrazličnejše druge agregatne indekse iz vseh n c ;r. sni h statistik. n ? tevila in področij eko- 11.23 V dosedanjih obrazcih smo obravnavali indekse s sta¬ lišča proučevanja, dinamike pojavov. Pri tem smo vze- cznako 0 za bazično razdobje, 1 pa za tekoče razdobje, dar moremo brez težav, vse, kar smo povedali o agregatnih ii ~ r y p]' nju.s. , uporabiti tudi za primerja' ne 4 - čur del; -e, ki niso časovne. Tako produktivnosti dela primer - tji iste stroke, Pri tem z 0 'ačunavanju indeksov a podatke 3. g regatne o izpopolnjenju plana, p uma jemo stvarne, z 0 pa planske podatke. Prav za drugo podjetje, indekse uporabiti pr ii tem z 1 tale o izra- .avamo indekse oU poučni j o prihranka v materialu. u a talce primere v m- normirane količine porabljenih surovin, q. >a stvarne količine porabljenih surovin. Seveda v analizah te vrste odpadejo določene metode, ki so umestne le pri časovnih agregatnih indeksih. Ena izmed njih je npr. metoda verižnih indeksov itd. V glavnem pa ce¬ lotno teorijo indeksov, ki srno jo nakazali v tem poglavju, uporabijamo v različnih primerih in ni omejena le na prouče¬ vanje dinamike pojavov. - 164 - DVANAJSTO POGLAVJE ČASOVNE VRSTE 12.1 Socialno-ekonomski pojavi niso nespremenljivi. Spre¬ membe so rezultat delovanja najrazličnejših faktor¬ jev, ki v tej ali oni obliki vplivajo na pojav. Sliko dina¬ mike pojavov dobimo s časovnimi vrstami. Ena slika daje sta¬ tični prikaz. Niz slik, ki si slede na filmskem platnu, pa daje videz gibanja. Enako da en sam podatek statično sliko pojava, niz istovrstnih podatkov v enakih časovnih razmakih pa daje dinamiko pojava. Časovna vrsta je niz istovrstnih po¬ datkov, ki se nanašajo na sukcesivne časovne razmake ali mo¬ mente. Z njimi proučujemo časovni razvoj pojavov, ker prika¬ zujejo spremembe pojavov v odvisnosti od časa. Po namenu in načinu proučevanja se povsem razlikujejo od ostalih vrst sta¬ tističnih vrst. Osnovni namen proučevanja časovnih vrst je opazovati časovni razvoj socialno-ekonomskih pojavov, iskati njegove zakonitosti in napovedati nadaljnji razvoj. V pogojih planskega gospodarstva je proučevanje časovnih vrst važno ta¬ ko pri sestavljanju plana kot pri kontroli izvajanja plana. Predvidevanje in napovedovanje razvoja ekonomskih pojavov, če poznamo zakonitosti in sedanje stanje, se je razvilo v po¬ sebno disciplino vede o konjunkturah, ki s proučevanjem ča¬ sovnih vrst najvažnejših ekonomskih pokazateljev skuša skle¬ pati na nadaljnji ekonomski razvoj. Seveda to napovedovanje ne more biti popolnoma zanesljivo, ker je nemogoče vnaprej napovedati in upoštevati vse faktorje, ki vplivajo na eko¬ nomski razvoj. Napoved bi veljala strogo le v primeru, če bi bile izpolnjene predpostavke, pod katerimi je napoved izde¬ lana. OBLIKE ČASOVNIH VRST 12.2 Homentne in intervalne časovne vrste . Časovne vrste po značaju podatkov, ki jih prikazujejo, delimo na momentne in intervalne. Momemtne časovne vrste prikazujejo časovni razvoj pojavov, ki veljajo za posamezne momente, in¬ tervalne časovne vrste pa časovni razvoj pojavov, ki so in¬ tervalnega značaja. Homemtna časovna vrsta so npr. podatki o številu delavstva konec posameznega meseca, primer inter¬ valne časovne vrste pa je proizvodnja določenega podjetja pc mesecih. Enako je v tabeli 12.1 število prebivalstva v SFRJ po letih sredi leta momentna, naravni prirastek po letih pa intervalna časovna vrsta. - 165 - Tabela 12.1 Število prebivalstva in naravni pri¬ rastek prebivalstva v SFRJ Izvedene časovne vrste 12.3 Iz osnovnih časovnih vrst moremo izračunati več iz¬ vedenih časovnih vrst, ki pripomorejo k analizi di¬ namike pojavov. Izmed teh bomo navedli: kumulativno časovno vrsto, časovno vrsto sredin, časovno vrsto drsečih vrednosti in časovno vrsto drsečih sredin. Kumulativna časovna vrsta 12.4 Kumulativno časovno vrsto izračunavamo samo za inter¬ valne vrste ekstenzivnih podatkov, ker ima samo zanje kumuliranje oziroma seštevanje členov smisel. Kumulativno ča¬ sovno vrsto dobimo po znanem principu postopnega seštevanja členov osnovne vrste. Členi kumulativne vrste pomenijo vred¬ nosti v razmaku od začetka proučevanega razdobja do določene¬ ga trenutka, ki se od člena do člena menja. Kumulativno časov no vrsto izračunavamo običajno za zaključene časovne razmake, kot so mesečne vrednosti v razdobju enega leta, dnevne vredno sti v razdobju enega meseca, letne vrednosti v razdobju ene petletko itd. Kumulativne vrste se v teh primerih nanašajo na začetek petletke, začetek leta, začetek meseca. Kumulativno časovno vrsto dobimo tako, da vzamemo vrednost prvega člena kumulativne vrste enako K^ = 0, nadalj¬ nje člene kumulativne vrste pa izračunamo po znanem obrazcu 166 K k+1 K, + Y, k k ( 12 . 1 ; K^. = kumulativa; = vrednost v tekočem razdobju. 12.5 Za primer izračunavanja kumulativne časovne vrste vzemimo mesečno vsoto proizvodnje krogličnih leža¬ jev v SFRJ. Tabela 12.2 Izračunavanje kumulativne časovne vrste za proizvodnjo krogličnih le¬ žajev v SFRJ v letu 1957 (Vir: Indeks) Sesti člen kumulativne serije 95 ton pomeni, da je bilo'od začetka leta 1957 do začetka meseca junija v SFRJ pro¬ izvedeno 95 ton krogličnih ležajev. Podoben pomen imajo drugi členi kumulativnih vrst. Vrsta sredin 12.6 Časovne vrste z velikim številom členov so dostikrat nepregledne in je osnovna dinamika zaradi prevelike dolžine zabrisana. Za take vrste zmanjšamo število členov z združevanjem členov v vsote ali povprečja. Iz časovne vrste o številu tujih gostov po mesecih v razdobju 1946-1957, ki ima 144 členov, dobimo časovno vrsto z 12 členi, če sešte¬ jemo število tujih gostov po mesecih v letne vsote. Seveda - 167 - ta časovna vrsta ne podaja tako natančno gibanje proučevane¬ ga pojava kot osnovna vrsta. S tem zabrišemo marsikatero zna¬ čilnost pojava. Medtem ko ima vrsta vsot smisel le, če je vrsta, ki jo prikazujemo, ekstenzivna, moremo z grupnimi povprečji skr¬ čiti število členov za vsako časovno vrsto, neglede na značaj členov. Člene osnovne časovne vrste združujemo po naravnih časovnih enotah. Tako združujemo mesečne podatke v četrtletne ali letne, dnevne podatke v tedenske ali mesečne, letne podat¬ ke pa običajno v petletja tako, da iz njih dobimo zaokrožena petletja ali desetletja, nor. 1901-1904, 1905~1909 s 1910-1914 ... 1945-1949, 1950-1954. 12.7 Če izračunamo časovno vrsto povprečij, je treba pazi¬ ti, na katere momente se nanašajo osnovne vrednosti časovne vrste. Od tega je namreč odvisno, kako izračunavamo sredine. Ce se nanašajo vrednosti na sredino elementarnega raz¬ maka, kot je primer pri intervalnih časovnih vrstah in pri ne¬ katerih momentih, izračunavamo povprečja po obrazcu ^ = ~ (y x + y2 + *’* + ^r^ (12.2) Za momente časovne vrste, za katere se vrednosti na¬ našajo na začetek ali konec osnovnih intervalov, pa izračuna¬ vamo sredine po obrazcu 7 1 r o h + k + + I r-l + l Y r ) (12 ’ 3) Po obrazcu 12.2 izračunavamo na primer povprečno mesečno pro¬ izvodnjo po letih, če imamo mesečne podatke o proizvodnji ali povprečno število prebivalstva po petletjih, če razpolagamo s Številom prebivalstva po letih sredi leta. Obrazec 12.3 pa u- poštevamo, če izračunavamo na primer povprečno število delav¬ stva po letih, če imamo podatke o številu delavstva v začetku vsakega meseca itd, r;a to moramo paziti zato, da se povprečja nanašajo na zaokrožena koledarska razdobja: tedne, mesece,le¬ ta, petletja. 168 - Vrsta drsečih vsot 12.8 Iz mesečnih podatkov o proizvodnji s seštevanjem do¬ bimo časovno vrsto za letno proizvodnjo. Ti letni podatki se nanašajo na letne razmake koledarskih let od janu¬ arja do decembra. Za neke analize pa so pole ; teh važni tu¬ di drugi letni razmaki, na primer od februarja danega leta do januarja naslednjega leta, od marca do februarja nasled¬ njega leta itd. Ti letni razmaki se med seboj delno prekri¬ vajo tako, da je vsak razmak, če ga primerjamo s predhodnim, pomaknjen za en mesec, letni razmaki tako rekoč drsijo od^ člena do člena za en mesec. Odtod tudi ime drseče vsote. Ča¬ sovna vrsta drsečih vsot v bistvu ni krajša od osnovne ča¬ sovne vrste, ima pa niz lastnosti, ki ji dajo posebno anali¬ tično vrednost. Ena izmed teh je ta, da se v časovni vrsti drsečih vsot izravnavajo slučajni in periodični vplivi, če obsega vsota časovno periodo. 0 tem bomo podrobneje slišali v naslednjih poglavjih. Zaradi zveze med zaporednimi členi časovne vrste dr¬ sečih vsot izračunavamo časovno vrsto drsečih vrednosti raz¬ meroma enostavno. Če imamo izračunan prvi člen časovne vrste drsečih vsot (dobimo ga tako, da seštejemo vrednosti od ja¬ nuarja do decembra za prvo leto v časovni vrsti), dobimo na¬ slednji člen v časovni vrsti drsečih sredin tako, da januar¬ sko vrednost od prve letne vsote odštejemo, prištejemo pa vrednost za januar naslednjega leta. Iz tako dobljenega dru¬ gega člena dobimo tretji člen časovne vrste drsečih vsot, če prištejemo februarski člen prihodnjega in odštejemo februar¬ ski člen prejšnjega leta iz osnovne časovne vrste. Posamezni členi vrste drsečih vsot pomenijo letno proizvodnjo v prete¬ klem letu od začetka januarja, od začetka februarja itd. Nakazano izračunavanje vrste drsečih vsot ne velja sa¬ mo za mesečne podatke, marveč na splošno za katerokoli vrsto ekstenzivnih intervalnih podatkov. Enako iz dnevnih podatkov izračunavamo časovno vrsto tedenskih drsečih vrednosti o šte¬ vilu prevoženih potnikov. Iz letnih podatkov o številu živo¬ rojenih pa moremo sestaviti petletno vrsto drsečih vsot za število živorojenih itd. Drseče vrednosti v vseh primerih izračunavamo po splošnem obrazcu: c _ q k+1 " k + Y k - Y k-r = S k + d, r k (12.4) Pri tem pomeni: in S k+1 = ustrezne vrednosti v vrsti drse¬ čih vsot; = člen k v osnovni vrsti; Y^_ r = člen osnovne vrste, ki je za r členov pred Y^; r = število členov, iz ko¬ likor so računane vsote; r d k = Y k - Y k _ r = razlika ustreznih vrednosti za Y. - 169 - 12.9 vsot Za število potnikov v zračnem prometu v SFRJ v razdo¬ bju 1955-1950 je izračunavanje časovne vrste drsečih nakazano v tabeli 12.3. Tabela 12.3 Izračunavanje časovne vrste drsečih vsot za število potnikov v zračnem prometu po Četrtletjih v SFRJ v raz¬ dobju 1955-1958 (Vir: Indeks) Iz nrimera je jasno razviden postonek 8,2 + 23,1 + + 38,0 + 14,7 = 104,0; 104,0 + (+0,1) = 104,1; 104,1 + + (-3,2) = 100,9 ... Če računamo časovno vrsto drsečih vsot z računskih strojem, ki ima registrirni trak, ni treba izračunavati vmesnih diferenc. Oasovno vrsto drsečih vsot dobimo nepo¬ sredno, če uporabi j ara o subtotale. Ta postopek je nakazan v sliki 12.1. 170 Slika 12.1 Registrirni trak iz seštevalnega stro¬ ja. Izračunavanje časovne vrste drse¬ čih vsot Časovna vrsta drsečih sredin 12.10 Vrednosti členov v časovni vrsti sredin priredimo sredini razmakov, na katere se povprečja nanašajo (npr. sredini let pri letnih povprečjih, tretjemu letu pet¬ letke pri petletnih povprečjih itd.). Členi v časovni vrsti sredin so torej prirejeni samo nekaterim členom osnovne ča¬ sovne vrste. Za analizo pa je dostikrat potrebno, da imamo prirejena povprečja vsem, ne pa samo nekaterim členom v o- snovni časovni vrsti. To dosežemo s časovno vrsto drsečih sredin, ki jo izračunavamo podobno kot vrsto drsečih vsot. Ker se morajo posamezni členi vrste drsečih sredin nanašati na iste momente kot členi osnovne vrste, izračuna¬ vamo člene vrste drsečih vsot glede na osnovno časovno vrsto na dva načina: a) Če imajo razmaki, na katere se nanašajo sredine, liho število osnovnih razmakov: r = 2i + 1, izračunavamo ča¬ sovno vrsto drsečih sredin po obrazcu 1 r Y k-i + Y k-i+l + + Y k + Y k+i-l + Y k+i' ) " Tak primer je izračunavanje tedenskih ali petletnih povpre¬ čij . 171 - 12.11 Vzemimo časovno vrsto o številu umrlih na 1000 pre¬ bivalcev v b. Jugoslaviji v letih 1921-1939 in zanjo izračunajmo časovno vrsto petletnih sredin? Ker izračunavamo povprečje iz lihega števila osnovnih razmakov, uporabimo ob¬ razec 12.5. Iz obrazca 12.5 zaključimo, da je najbolje, če po po¬ stopku, ki smo ja že navedli, izračunamo vrsto drsečih pet¬ letnih vsot S, , petletne vsote pa delimo s pet. Tabela 12.4 Izračunavanje časovne vrste petletnih drsečih sredin za število umrlih na tisoč prebivalcev v b. Jugoslaviji v letih 1921-1939. (Vir: SG 57) 12.12 b) Če pa sredine veljajo za sodo število osnovnih razmakov (r = 2i), drseče sredine izračunavamo po ob¬ razcu: Y -I (I Y k r ( '2 i k- + Y lc~i+l + Y k + ( 12 . 6 ) Tak primer imamo pri letnih povprečjih iz mesečnih (r=12) a.li četrtletnih (r = 4) podatkih. 172 Če je število osnovnih razmakov sodo (r = 2i), j najprikladne je obrazec 12.6 preurediti v obliko 2r 2Y k-i + i + 2Y k + 2Y + ^ I k+i-l Y k+i) = _ 1 _ " 2r (12.7) Po tem obrazcu izračunavamo vrsto drsečih sredin, če je r = 2i po naslednjem postopku: a) Osnovno časovno vrsto Y, pišemo dvojno tako, da je drugič premaknjena za r členov. Tako dobimo časovni vrsti Y^ in Moremo pa osnovno časovno vrsto pisati tudi enkrat, v odsekih po r členov (glej primer v tabeli 12.5). b) Izračunamo razlike ustreznih zaporednih členov r d k “ Y k - Y k-r* c) Izračunamo prvo vrsto + ^ = Y p + 2Y 2 + ... 2Y^ + -^ + + ••• +2Y r + Y r+1* d) Druge vsote dobimo postopno po obrazcu S' , = S' + d, . + d, . k+1 k r k+i r k+i+1 ( 12 . 8 ) e) razcu 12.7 Iz vsot S-j7 dobimo vsoto drsečih sredin, vsote S/ delimo z 2r. če po ob- 12.13 Če imamo vrsto mesečnih podatkov, po pravilu izraču¬ navamo vrsto drsečih sredin za letna razdobja. Za ta primer je po zgornjih obrazcih: r = 2i = 12; i = 6. Ker začne¬ mo z Sf +1 = Sg + -^ = S^, se prvi člen vrste drsečih sredin nana¬ ša na 7. mesec - julij prvega leta. Zanj izračunamo po ob¬ razcu 12.7 S' = (Yp + 2Y 2 + ... + 2Y ? + ... + 2Y 12 + ); ^13 ~ ' )0( ^ a ^ e ' lc za januar drugega leta. Po obrazcu 12.8 pa do¬ bimo dalje Og = > j rj + 2.2^13 12^14’ = ^8 12*^14 "** 12^15 ... 12 d 15 = Y 15 - 12 d i4 = Y i4 “ Y 2 ltd * Kot primer vzemimo indeks industrije gradbenega mate¬ riala v SPRJ. Tabela 12,5 Izračunavanje časovne vrste drsečih sredin za indeks industri je gradbenega materiala v SFRJ (0 = 100) (Vir: SB 108) - 173 - 174 Razlike med ustreznimi meseci zaporednih let sme iz¬ računali takole: Prva možna razlika je v mesecu januarju 1932; 12 d 13 = Y J,52 " f J,51 = 51 - 38 = -7; 12 d 14 = Y P,52 _ Y P,51 = 2 7 - 37 = -10 itd. Prvo vsoto (za julij 1931) smo izračunali v celoti: S J,51 = 53 + 2.37 + 2.49 + ... + 2.84 + 2.71 + 2.58 + 31 = 1707. Nadaljnje vsota pa so izračunane, kot kaže trak na sestevalnem stroju na sliki 12.2. Iz obeh primerov vidimo, da je časovna vrsta drsečih sredin krajša od osnovne časovne vrste in da začetnim in konč¬ nim i členom v osnovni časovni vrsti ne moremo prirediti dr¬ seče sredine. To je hiba časovne vrste drsečih sredin, katere ne moremo odpraviti. -vv\\ 1707 - 7 + -10 + 1690 O -10 + -13 1667 -13 - 6 1648 - 6 + 0 + + O + V \\ \ v Slika 12.2 Registrirni trak na sestevalnem stroju pri izračunavanju vrste drsečih vsot ST GRAFIČNO PRIKAZOVANJE ČASOVNIH VRST 12.14 Kompleksen vpogled v dinamiko pojavov dobimo z gra¬ fični.- prikazom časovnih vrst. Tabelarični prikaz ča¬ sovnih vrst je nenazoren, ker imajo časovne vrste običajno ve¬ liko členov. Razen tega je iz tabele izredno težko primerjati več časovnih vrst istočasno. umrlih n*. <000 p r»biv*.lcev 175 Slika 12.3 Število umrlih na tisoč prebivalcev v b. Jugoslaviji - 176 - TPJtflS Slika 12.4 Odnosi med časovnimi vrstami v aritmetičnih in logaritemskih grafikonih - 177 časovne vrste prikazujemo pretežno z linijskimi gra¬ fikoni. Stolpce ali cruge načine prikazovanja uporabljamo " če prikazujemo krajše časovne vrste. Najenostavnejši prikaz časovne vrste je navaden li¬ nijski grafikon, V njem je količinska skala navadna aritme¬ tična skala. Te vrste grafikonov imamo največ. Eden izmed njih je grafikon v sliki 12.3 Na navadni aritmetični skali daljice med podatki pri¬ kazujejo absolutne diference med dvema podatkoma. Na linijskih grafikonih z arimetično skalo pa moremo prikazovati samo isto¬ vrstne časovne vrste. Pri prikazovanju raznovrstnih' časovnih vrst na istem grafikonu je namreč problematično razmerje med skalami. Logaritemski grafikoni 12.15 Za prikazovanje dinamike pojavov je posebno prikla¬ den grafikon, ki ima namesto aritmetične količinske skale logaritemsko skalo. Ker je diferenca logaritmov enaka logaritmu kvocienta, je na logaritmičnem grafikonu navpična razdalja med dvema podatkoma v razmerju z logaritmom kvocien¬ ta med podatkoma. Zate moremo iz logaritemskega grafikona od- brati relativne odnose med podatki. Ker so relativna števila vagno orodje pri statistični analizi dinamike pojavov, so ti grafikoni zelo prikladni za prikazovanje in analizo časovnih vrst. Prednost logaritemskih grafikonov je tudi v tem, da mo¬ remo na njih prikazovati raznovrstne vrste, ker ostane loga¬ ritemska skala za vse časovne vrste ista. Ker je logaritemska skala v sorazmerju z logaritmi, so oblike krivulj drugačne kot na navadni skali. Iz slike r2„4 vidimo, da je pojav, ki je na aritmetični skali prikazan s premico (A),^na logaritemski skali prikazan z logaritemsko krivuljo (A), Če pa je smer razvoja eksponencialna funkcija (B), je na logaritemskem grafikonu prikazana s premico (B). Časovna vrsta, ki ima stalen koeficient dinamike, je na loga- ritemsicem grafikonu prikazana s premico. Prednost logaritem¬ skih grafikonov je tudi v tem, da podajajo pravilno in pri¬ merljivo sliko relativnih odnosov ne glede na velikost podat¬ kov. V sliki 12,4 imamo prikazana tudi dva pojava, ki se ena¬ ko razvijata, le da je za pojav C podatek petkrat večji kot za pojav .D, Na aritmetični skali dobimo vtis, da je dinamika za pojav B milejša kakor za pojav C, logaritemski grafikon pa pravilno pokaže enako dinamiko za obe časovni vrsti, C e sta na aritmetičnem grafikonu dve časovni vrsti vzporedni,^pome¬ ni, da je razlika med obema časovnima vrstama stalna. Ce pa sta časovni vrsti na logaritemskem grafikonu vzporedni, pome¬ ni, da je stalno razmerje med obema vrstama. - 178 - 12.16 Na logaritemskem grafikonu je v sliki 12.5 prikazi razvoj proizvodnje električne energije v SFRJ in SRS. Logaritemska skala na grafikonu v sliki 12.5 je neime¬ novana in velja za vse prikazane časovne vrste ne glede na velikost in vrsto podatka. Za vsako vrsto posebej pa v grafi¬ konu vpišemo decimalni faktor; z njim je treba vrednost, ki jo odberemo no. skali, pomnožiti, da dobimo vrednost količine v enoti mere, ki je naznačena za decimalnim faktorjem. Iz grafi¬ kona 12.5 tako odberemo, da je bila skupna proizvodnja elek¬ trične energije leta 1948 2,06.109 KWh ali 2,06 milijard KWh. Ker je logaritemsko skalo teže brati kakor aritmetično, loga¬ ritemske grafikone običajno proučujemo s pomožno premično ska¬ lo, ki je vrisana na robu pasu papirja. To pomožno skalo upo¬ rabljamo predvsem za določanje relativnih števil (indeksov, koeficientov in struktur. Na sliki 12.5 je na treh primerih naznačeno, kako s po¬ možno skalo odberemo relativna števila. V primeru, ki je ozna¬ čen z a, odberemo indeks skupne proizvodnje električne energi¬ je za SFRJ za leto 1954 na bazo 1948 tako, da izhodišče pomož¬ ne skale 100 naravnamo na osnovo 1948. Na pomožni skali odbe¬ remo tam, kjer linija preseka skalo, indeks ca. 165 (nantančna vrednost je 167). V primeru, ki je označen z b-, , določimo koeficient pro¬ izvodnje električne energije na enega prebivalca v SFRJ v letu 1955. Ta koeficient odberemo tako, da izhodišče 1 na pomožni ska¬ li naravnamo na linijo števila prebivalstva, na skali pa pri liniji proizvodnje odčitamo ustrezno vrednost 2,47. Vrednost koeficienta pa dobimo, če to vrednost pomnožimo s kvocientom 1CP KV/h/lO^ prebivalcev; tega dobimo iz decimalnih faktorjev, ki so vpisani ob ustreznih linijah za proizvodnjo in število prebivalstva. Koeficient je torej 247 KWh/prebiv, Analogen koe¬ ficient za isto leto za SR Slovenijo dobimo, če premaknemo iz¬ hodišče na pomožni skali na linijo prebivalstva za Slovenijo, ob liniji proizvodnje pa na pomožni skali odberemo vrednost 1,C2. Po istem načelu kot prej to vrednost pomnožimo s kvoci¬ entom 10*9 KWh/lO° prebivalcev. Iz grafikona ocenjeni koeficient je torej 1020 KV/h/preb. v letu 1955 v SR Sloveniji. Kako s pomožno logaritemsko skalo odčitamo strukturne odstotke, je nakazano v primeru C. Ker iščemo strukturne dele¬ že skupne proizvodnje v SFRJ, izhodišče 100 na premični skali naravnamo v letu 1957 na skupno proizvodnjo SFRJ. Ob linijah proizvodnje pa za dele skupne proizvodnje odberemo, da je bi¬ lo od skupne proizvodnje v SFRJ v letu 1955 približno 56 a /o skupne proizvodnje hidroelektrike in približno 44 i° proizvod¬ nje termoelektrike. Proizvodnja Slovenije pa je približno 37 1° od skupne jugoslovanske proizvodnje. Iz teh tren primerov vidimo, kako iz logaritmičnih grafikonov odberemo vse vrste relativnih števil. - 179 - Slika 12.5 Proizvodnja električne energije in število prebivalstva v SFRJ in SRS v razdobju 1946 - 1957 180 Tabela 12.6 Proizvodnja električne energije in število prebivalstva v 3PRJ in SRS v razdobju 1946-1957 (Vir: SO 57-58) Čitanje logaritemskih grafikonov je podobno računanju z logaritmičnim računalom in ima vse njegove prednosti (hitrost, enostavnost) in pomanjkljivosti (nenatančnost). Brez uporabe pomožne skale moremo iz logaritemskega grafikona opazovati splošne tendence dinamike. Tako vidimo, da je v letih 1948-1952 koeficient dinamike v proizvodnji skupne električne energije precej stalen, se v nadaljnjih letih pove¬ čuje, v razdobju 1954-1957 pa ima zopet precej stalno vrednost. Ker se razlike med linijo za skupno proizvodnjo in linijo pro¬ izvodnje hidroelektrarn vedno manjšajo, sklepamo, da delež hi- droelektrike v skupni proizvodnji nevzdržema narašča. Delež proizvodnje Slovenije v skupni jugoslovanski proizvodnji je do¬ kaj stabilen, ker sta obe liniji precej vzporedni. Iz grafikona moremo sklepati podobno tudi za druge odnose med prikazanimi podatki. Polarni grafikon 12.17 Časovne vrste, ki imajo periodično komponento, včasih prikazujemo v polarnem koordinatnem sistemu. Za perio¬ dične časovne vrste je namreč pomembnejša in bolj smiselna pri¬ merjava med ustreznimi deli za različne periode, kakor pa pri¬ merjava med zaporednimi členi v časovni vrsti. 3 polarnim gra¬ fikonom najbolje primerjamo ustrezne člene v različnih perio¬ dah, Osnova polarnega grafikona je polarni koordinatni sistem; 181 - - 4956 - <957 Slika 12,6 Indeksi proizvodnje gradbenega materiala v SRRJ v razdobju 1955-1957- (Vir: tabela 12.5) 182 ta zamenja pravokotni koordinatni sistem. V polarnem grafiko¬ nu je čas znotraj ene periode nakazan s smerjo, podatek pa z oddaljenostjo točke od izhodišča polarnega koordinatnega si¬ stema. Ce imamo mesečno časovno vrsto s sezonsko variacijo, krog razdelimo v dvanajst enakih delov. Vsak izmed teh pomeni po en mesec. Če se podatki nanašajo na konce ali začetke me¬ seca, rišemo podatke na mejah posameznih krogovih izsekov, če pa se nanašajo na cele mesece ali na sredine mesecev, pa v sredino krogovih izsekov. Za časovne vrste s izrazito sezonsko komponento ka¬ že polarni grafikon tipično ekscentrično sliko. Če pojav na¬ rašča, dobimo na polarnem grafikonu spiralo, ki se odvija.Za pojave, ki padajo, pa se spirala zavija proti izhodišču. Se¬ veda polarne grafikone ne uporabljamo samo za mesečne vrste s sezonsko variacijo, temveč tudi za prikazovanje časovnih vrsts kakršnokoli periodo, npr.: tedensko periodo v dnevni časovni vrsti itd. V teh primerih moramo seveda razdeliti krog na ustrezno število odsekov (za tedenske periode na se¬ dem;. Hiba polarnega grafikona pa je v tem, da je nepregle¬ den, če je časovna vrsta predolga ali če nima izrazitega tren¬ da. 12.18. V sliki 12.6 je prikazana s polarnim grafikonom ča¬ sovna vrsta indeksov proizvodnje za gradbeni materi¬ al v SPRJ v letih 1955-1957. Časovna skala je krožna, medtem ko je skala za inde¬ kse naznačena s koncentričnimi krogi. Za vsako leto so podat¬ ki včrtani drugače, da se leta ne pomešajo med seboj. Grafi¬ kon kaže izrazit sezonski značaj proizvodnje gradbenega mate¬ riala, ker so linije za posamezna leta ekscentrične. Razen te¬ ga pa kaže, da pojav narašča, ker se spirala odvija. Iz grafi¬ kona vidimo, da je primerjava posameznih mesecev v različnih letih zelo dobra, ker podatki za isti mesec v različnih letih leže v isti smeri. Z- diagram 12.19 Dinamiko elementov proizvodnje moremo dobro ponazoriti z grafikonom, v katerem so istočasno prikazane: osnov¬ na časovna vrsta, kumulativna časovna vrsta in vrsta drsečih vsot. Te časovne vrste se med seboj prepletajo v obliki črke Z. Zato imenujemo te vrste grafikone Z-diagrame. Z-diagram je ope¬ rativno sredstvo za prikazovanje in analiziranje dinamike eko¬ nomskih pojavov. Zanj je tipična standardna oblika, ki ima na¬ slednje značilnosti: Z-diagram je kartoteka enotnega formata, — o> Slika 12.7 Z-diagram za proizvodnjo piva v SRS v letu 1957 - 184 - na kateri je en del namenjen za tekoče vpisovanje podatkov za vse tri časovne vrste, na drugem delu pa je, potisnjen na rob, grafikon za vse tri časovne vrste (osnovno, kumulativno in vr¬ sto drsečih vsot). Grafikon obsega zaključeno obdobje (dvanajst mesecev za mesečne podatke ali 31 dni za dnevne podatke). Ska¬ la za osnovne podatke je običajno v drugem merilu kakor skala za kumulativo in vrsto drsečih vsot. Za podatke o proizvodnji piva v SRS v letu 1957 je Z-diagram prikazan v sliki 12.7. Z-diagram je zelo prikladen in priljubljen v operativ¬ ni evidenci in statistiki v podjetju. Sistem Z-diagramov za najrazličnejše količinske in vrednostne elemente proizvodnje za daljša razdobja omogoča elastično prikazovanje in analizira¬ nje dinamike in povezave med različnimi elementi proizvodnje. Ker je grafikon namenoma potisnjen v kot, moremo s polaganjem kartonov za več let drugega poleg drugega dobiti sliko dinamike za posamezni element za daljše razdobje. Če po¬ lagamo kartone za različna leta drugega nad drugega, moremo proučiti sezonsko variiranje pojava. Ce pa polagamo kartone za različne elemente, ki so v vsebinski zvezi, drugega čez drugega, pa analiziramo povezave in. odnose med posameznimi elementi. Brunsmanov grafikon 12.20 časovne vrste, ki se vežejo po metodi salda (kore- spondirajoče populacije), prikazujemo z Brunsmano- vim grafikonom, časovnih vrst korespondirajooih populacij je veliko: število delavcev v začetku meseca + na. novo došli - odšli = število delavcev konec meseca; zaloge v za.četku meseca + nabavljeno - prodano = zaloga ko¬ nec meseca; zaloga surovin + nabavljeno - predelano = zaloga surovin ko¬ nec dekade; število prebivalstva v začetku leta + število rojenih + šte¬ vilo doseljenih - število umrlih - število izseljenih = šte¬ vilo prebivalstva konec leta. V Brunsmanovem grafikonu momentne vrste (število de¬ lavstva, zaloge, število prebivalcev itd.) prikažemo z linij¬ skim grafikonom, intervalne (na novo došli delavci, porablje¬ ne zaloge, število izseljenih itd.) pa s stolpci. Stolpci in linije so kombinirani tako, da se vežejo med seboj. 12.21 Z Brun smanovim grafikonom prikažimo mesečne podat¬ ke o gibanju delavstva v podjetju A (podatki izmi¬ šljeni). Tabela 12.7 Gibanje števila delavstva v podjetju A Iz grafikona v sliki 12.8 nazorno proučimo ‘‘dinamiko stanja števila delavstva i!n fluktuacijo števila delavstva. Brunsmanov grafikon kaže, da je bila fluktuacija delavstva v prvem polletju znatno večja kor v drugem. Dodatno je v grafi¬ konu,prikazana še struktura odišlih delavcev po vzroku odho¬ da. Stolpce- v Brunsmanovem grafikonu uporabljamo za prikazo¬ vanje struktur tudi za druge pojave. Pri prebivalstvu stolpec za povečanje prebivalstva razdelimo na novorojene in priselje ne, stolpec zmanjšanja prebivalstva na umrle in izseljene itd 186 - Število delavcev delavstva v podjetju A Ganttov grafikon 12.22 Kumulativna časovna vrsta ima za osnovo Ganttov grafi¬ kon, ki ga uporabljamo pri kontroli plana. Z njim kom¬ pleksno analiziramo in kontroliramo izpolnjenje plana za naj¬ različnejša področja. Osnovno pri Ganttovem grafikonu je to, da dejansko iz¬ vršeno količino v razdobju od začetka planskega razdobja do do¬ ločenega momenta merimo s časom, v katerem bi bila ta količina proizvedena, če bi proces potekal ves čas po planu. Ta čas je večji kot dejanski, če je plan prekoračen; se ujema z dejanskim, če je plan izpolnjen in je manjši kakor dejanski, če plan ni izpolnjen. - 187 - S shematičnim primerom v tabeli 12 # . 8 je pokazano, kako izračunavamo Ganttov odstotek o izpolnjenju plana, v sliki 12.9 pa je narisan Ganttov grafikon za ta primer. Tabela 12.8 Izračunavanje Ganttovega odstotka o izpolnjenju plana Ganttov odstotek izračunamo po naslednjih stopnjah: a) Zraven časovne vrste o planu izračunamo kumulativno vrsto plana. b) V isto tabelo vpisujemo postopoma, kakor dobivamo podatke, dejansko doseženo in kumulativo teh podatkov. c) Za tekočo vrednost kumulative iz dejanskih količin v kumulativi za plan odredimo, med kateri vrednosti planske kumulative pade vrednost dejanske kumulative. Do začetka tret¬ jega četrtletja smo npr. dejansko proizvedli 390 enot. Ta vrednost pade v planski kumulativi med 200 in 450. Iz tega sklepamo; če bi delali po planu, bi 390 enot delali vse prvo Četrtletje, ostanek 190 enot pa bi izdelovali 190/250 del drugega četrtletja ali v odstotkih 76 # drugega četrtletja. Ganttov odstotek napišemo za ta primer v troštevilčnem števi¬ lu 176. Pri tem pomeni prvo mesto število polnih razdobij, zadnji dve mesti pa odstotek naslednjega razdobja. Iz tabele 12.8 vidimo dalje, da smo do začetka četr¬ tega četrtletja, za katerega je Ganttov odstotek 307, izdela¬ li količino, predvideno po planu v prvih treh četrtletjih in i % količine, predvidene za četrto četrtletje. Ako s p v zaznamujemo člene časovne vrste za plan, s 1^ njegove kumulative, z d^ člene v časovni vrsti za dejansko opravljeno z D^ pa kumulativo te časovne vrste, v simbolih iz¬ razimo izračunavanje Ganttovega odstotka takole: 188 a) poiščemo, med katera člena in v planski ku- mulativi pade vrednost dejanske kumulative D r , < k+1 (12.9) b) Ganttov odstotek izračunamo po obrazcu: prvo mesto G-anttovega odstotka je k - 1. Naslednji dve mesti pa izračunamo po obrazcu 2 ( 12 . 10 ) Slika 12.9 Ganttov grafikon Ganttovi odstotki pa so samo vmesni rezultat za Ganttov grafikon. Te odstotke namreč rišemo v grafikon, ki ima za vsak element svoj pas. Ganttov odstotek včrtujemo v grafikon z vodo¬ ravnim stolpcem. Pas se vleče skozi Ganttovemu odstotku ustrez¬ no število celih razmakov in skozi ustrezni del načetega razma¬ ka. Običajno razen Ganttovega odstotka rišemo v grafikone tudi navadne odstotke o izpolnjenju plana v posameznem razdobju. Ti nakazujejo izpolnjenje plana v osnovnih razdobjih. V sliki 12.9 so prikazani rezultati za naš primer v standardni obliki Gant¬ tovega grafikona. Vanj postopma vrisujemo od razdobja do raz¬ dobja navaden odstotek izpolnjenja plana in Ganttov odstotek. Kot vidimo iz slike 12.9, so v grafikon vpisani podatki o pla¬ nu in kumulativi plana. Tako dobimo predstavo o velikosti po¬ datkov. Razen tega so posamezni elementarni časovni razmaki (meseci, četrtletja itd.) razdeljeni na pet enakih delov. Vsak od njih pomeni 20 i<> od osnovnega razdobja. Tako si olajšamo ri¬ sanje in branje grafikona. Konec stolpca za Ganttov odstotek za določen razmak zaznamujemo s črto in postopoma dorisujemo stolpec. - 189 - Prednost Ganttovega grafikona je predvsem v tem, da so podatki za vsak element naneseni v pasu. Zato moremo na isto sliko^nanesti niz elementov: en element za več podjetij, ali različne elemente za isto podjetje. Tako moremo kompleksno analizirati izpolnjenje plana tudi v odnosih med elementi pro¬ izvodnje, ne pa samo izolirano za posamezne elemente proizvod¬ nje. ANALIZA ČASOVNIH VRST 12.23 Dinamiko po javov analiziramo tako, da opazujemo spremi¬ njanje vrednosti členov v časovnih vrstah in iščemo za¬ konitosti tega spreminjanja. Naloga enostavne analize časovnih vrst je enostavna primerjava med členi v isti časovni vrsti. Cpene v časovni vrsti primerjamo lahko na več načinov. Vsak iz¬ med njih po svoje osvetli dinamiko pojava. Z metodami, ki so specifične za analizo časovnih vrst, pa analiziramo zakonitosti dinamike ene same vrste.ali, s korelacijsko analizo zakonitosti odvisnosti v dinamiki več pojavov, ki 30 med seboj v zvezi. Primerljivost podatkov v časovni vrsti 12.24 Kljub temu, da 30 členi v isti časovni vrsti istovrst¬ ne količine, dostikrat med seboj niso neposredno pri¬ merljivi, kot bi se to zdelo na prvi pogled. Da jih moremo pri¬ merjati, morajo izpolniti določene pogoje. Če jih ne izpolnju¬ jejo, je treba časovno vrsto pred analizo preurediti tako, da tem pogojem zadošča. Osnovni pogoj za primerljivost členov v isti časovni vrsti je pravilna in nedvoumna opredelitev pojava, katerega časovna vrsta prikazuje. Ta opredelitev mora biti vso dobo opa¬ zovanja enaka in se ne sme spreminjati. 12.23 Ker so spremembe pojava, ki ga časovna vrsta prikazuje, bistveno odvisne od časa, je zelo koristno, če so ča¬ sovni razmaki med posameznimi členi enaki. Tako dosežemo, da je pri enakem delovanju faktorjev, sprememba pojava od člena do člena enaka; tega v nasprotnem primeru ne bi bilo. Zato ima¬ mo popise prebivalstva v razdobjih pet ali deset let, popise živine vsako leto na isti,datum itd. Kljub temu-, da ta pogoj na prvi pogled ni težko izpol¬ niti, naletimo v določenih primerih na težave. Problem so nam¬ reč cenovne vrste, za katere se členi nanašajo na krajša raz¬ dobja, mesece, dekade, tedne itd. Število rojstev po mesecih ne moremo neposredno primerjati, ker se število koledarskih 190 - dni v mesecu spreminja od 28 do 31 dni. Razlika med najkrajšim in najdaljšim mesecem je torej tri dni ali približno 10 c /o. Če bi bili vsi ostali faktorji, ki vplivajo.na število rojstev, stalni, bi bilo število rojstev od meseca do meseca različno tudi za več kot 10 J /o zaradi vzroka, ki nima nobene zveze z rod¬ nostjo. Te razlike so še večje pri pojavih, ki so, kakor na primer proizvodnja, odvisni ne od koledarskih, temveč od delov¬ nih dni, ker so med meseci zaradi različnega števila nedelj in praznikov še večje variacije v številu delovnih dni. Koledar vpliva tudi na pojave, ki imajo tedensko periodičnost. Ker je na primer število prevoženih potnikov, prometnih nesreč ali nočnin v tujskem prometu naj večje okrog nedelje, je številč¬ nost teh pojavov v mesecu bistveno odvisna od števila nedelj in praznikov v mesecu. Razlike med posameznimi meseci zaradi tega vzroka so tudi do 50 jo. 12.26. Za momentne časovne vrste si pomagamo tako, da si pri¬ zadevamo, da so časovni intervali med posameznimi čle¬ ni čim bolj enaki. Kakor smo že navedli, so popisi prebivalstva na enaka razdobja - vsakih pet ali deset let na isti datum, po¬ pisi živine vsako leto na isti datum. Le tako iz časovne vrste dobimo hiter pregled o dinamiki enega in drugega pojava. Vendar enakost razmakov med posameznimi členi še ni za dosten pogoj za primerljivost med členi. Vzemimo, da popisi ži¬ vine ne bi bili na letne, temveč na primer sedem-mesečne razma¬ ke. Popis živine bi bil na primer januarja, avgusta, marca na¬ slednjega leta, oktobra naslednjega leta itd. Kljub temu, da so razmaki med popisi enaki, spremembe med posameznimi popisi ne bi bile primerljive, ker bi bili kritični momenti v različnih delih leta. To pa bistveno vpliva na stalež živine. Da se temu ognemo, moramo vzeti popise v razmakih, ki so mnogokratniki pe¬ riode - v našem primeru leta. Čeprav so razmaki med členi pri mesečnih ali četrtlet¬ nih momentih časovnih vrstah različni, je učinek razlik na časov¬ no vrsto tako malenkosten, da podatkov ne popravljamo. 12.27 Pri intervalnih časovnih vrstah pa je ta učinek znaten in moramo podatke reducirati na enake razmake. To dose žemo tako, da za osnovne podatke, ki se nanašajo na dejanska me sečna razdobja, izračunamo namesto mesečnih vrednosti povprečja na en dan, enotin mesec s 30 koledarskimi ali 25 delovnimi dne¬ vi. Tako odstranimo učinek različne dolžine meseca. Ali reduci¬ ramo podatke na 25 ali 30 dni, je odvisno od pojava, ki ga ana¬ liziramo. Rojstva reduciramo na koledarski mesec 30 dni, enako proizvodnjo v panogah, ki imajo zvezni delovni proces, na mesec 25 dni pa reducirano proizvodnjo v panogah in podjetjih, v ka¬ terih je delovni proces prekinjen. Tako se najbolj prilagodimo dejanskemu številu dni v posameznih mesecih. Popravni faktorji za posamezne vrste poprav so nakaza¬ ni v tabeli 12.9. - 191 - Tabela 12.9 Popravni faktorji za mesečne časovne vrste Podatke mesečnih časovnih vrst reduciramo na enotino dolžino meseca tako, da jih pomnožimo z ustreznimi popravnimi faktor¬ ji. Vsote popravljenih podatkov so brez smisla, ker so poprav Ijeni podatki povprečja, čeprav so osnovni podatki intervalne ga značaja. 12.28 Reducirajmo število rojstev dečkov v SR Sloveniji v ‘ letu 1955 na enotine mesece. Tabela 12.10 Reduciranje števila rojstev dečkov v SRS v letu 1955 na enotine mesece (Vir: MSP) - 192 - 12.29 Na velikost pojavov dostikrat vplivajo administrativni ukrepi, ki s vsebino proučevanega pojava nimajo nepo¬ sredne zveze. Eden izmed običajnih vzrokov so upravno-teritori- alne spremembe, s katerimi se spremeni geografska opredelitev pojava. Taka sprememba je lahko sprememba državnih meja, ki je posledica vojne, ali sprememba upravno-teritorialnih mej zno¬ traj države. Različna geografska opredelitev onemogoča primer¬ ljivost podatkov v časovni vrsti. V tem primeru je potrebno po¬ datke časovne vrste za nazaj preračunati na novo območje, kar je običajno težaven in zamuden posel. Včasih si pomagamo tako, do, za čas, ko je nastopila sprememba, registriramo podatek po starem in novem stanju. Tako vidimo, kolika je ob prehodu spre¬ memba zaradi spremembe v teritoriju. Če časovno vrsto za nazaj ne korigiramo, moramo anali¬ zirati vsak del posebej, nikakor pa ne smemo smatrati vrste kot enotno. Isti problem so tudi spremembe zaradi drugih admini¬ strativnih ukrepov, na primer prehajanje podjetij iz ene kom¬ petence v drugo itd. Tudi v teh primerih ravnamo s sprememba¬ mi enako kakor pri teritorialnih spremembah. 12.30 Ker se število prebivalstva stalno spreminja, poveča¬ na proizvodnja še ne pomeni nujno povečane produktiv¬ nosti dela, povečana potrošnja še ne povečanja življenjskega standarda itd. Vpliv sprememb v spremenjenem številu prebivalstva odstranimo tako, da izračunavamo koeficiente "na prebivalca", "na delavca" itd. Časovno primerljivost podatkov včasih motijo tudi spremembe v strukturi. Sprememba starostne strukture prebival¬ stva, ki more nastopiti v daljšem časovnem razdobju, močno vpliva na umrljivost. Primerjava koeficientov mortalitete za daljše razdobje zato lahko da natančno sliko v spremembah v umrljivosti prebivalstva. Spremenjena struktura proizvodnje tako v po-djetju kot v večjih gospodarskih enotah ali v celot¬ nem narodnem gospodarstvu odločilno vpliva na sumarne koefici¬ ente o produktivnosti dela, o povprečni plači itd. Vpliv spre¬ menjene strukture na določene pojave v časovni vrsti odpravimo s standardizacijo podatkov, to je z izračunavanjem koeficien¬ tov v stalni strukturi. 0 standardizaciji koeficientov je bilo več govora pri koeficientih. 12.31 Proizvodnjo, promet tako v zunanji ali notranji trgo¬ vini in druge pojave izražamo v vrednosti. Časovno primerjavo vrednostnih podatkov motijo spremembe v cenah, ker se vrednost proizvodnje, prometa itd. spreminja zaradi spre¬ memb v obsegu in sprememb cen. Vpliv, ki ga povzročajo spre- memebe cen, odstranimo tako, da izražamo proizvodnjo, promet - 193 - itd. v stalnih cenah. Vendar je ta način izredno zamuden in težko izvedljiv, ker hi ga morali upoštevati že v osnovni evidenci. Vpliv cen popravimo tudi z indeksi cen tako, da po¬ datke po tekočih cenah delimo z ustreznim indeksom cen. Ta način je operativno veliko lažji, je pa kljub temu, da je le ocena, zadovoljiv. Paziti je treba le, da je indeks, s kate¬ rim popravljamo podatke, ustrezen po vsebini in značaju. Elementarni pokazatelji dinamike 12.32 Enostavno analiziramo dinamiko pojava s primerjavo členov v časovni vrsti. Najlaže primerjamo člene ča¬ sovne vrste z indeksi. Zato z njimi izvedemo več elementarnih pokazateljev dinamike. Raven je osnovna časovna vrsta. Ze iz sprememb v ravni sklepamo na smer in jakost dinamike pojava. Če raven časovne vrste izrazimo v primerjavi z nekim stalnim karakterističnim členom v časovni vrsti, dobimo vrsto indeksov s stalno osnovo. = 100 V Y o ( 12 . 11 ) Absolutna razlika ■k-1 ( 12 . 12 ) pokaže v absolutnih vrednostih spremembo pojava od člena do člena. Tempo rasti Y k “ Y k-1 T k = 100 \ ■ — = 100 y D, L k-1 A k-1 pokaže relativno razliko od člena do člena. Koeficient dinamike (12.13) Wl (12.14) pokaže v obliki koeficienta relativne spremembe od člena do člena. - 194 - Enak značaj ima verižni indeks I k = 100 . Y k /Y k _ 1 (12.15) le da relativno spremembo nakaže v indeksu, Ker so vsi ti pokazatelji izpeljani iz osnovne časov ne vrste, so med njimi enostavne zveze. T k = 100 . D k /Y k _ 1 = 100(k k - 1) = I k - 100 h - 100 • k k (12.16) V tabeli 12,11 je prikazano, kakšni so posamezni poka¬ zatelji dinamike, če pojav raste, zastane ali pada. Tabela 12,11 Vrednosti posameznih pokazateljev dinamike pri različnem gibanju po' java 12.35 Za svetovno proizvodnjo boksita imamo v tabeli 12.12 izračunane vse vrste elementarnih pokazateljev dina¬ mike. - 195 - Tabela 12.12 Pokazatelji dinamike za svetovno proizvodnjo boksita (v tisočih tonah; Vir: SG 58) 12.34 Nakazani pokazatelji dinamike pa niso edini pokaza¬ telji, s katerimi prikazujemo dinamiko pojava. Za nekatere časovne vrste se izkažejo za primernejše druge ko¬ ličine. Izmed teh naj omenimo samo^mesečne časovne vrste za pojave, ki so sezonskega značaja. Če je pojav sezonski, pri¬ merjava tekočega meseca s predhodnim mesecem nima logične povezave in smisla. Bolj smiselno je, da primerjamo podatek tekočega meseca s podatkom iz predhodnega leta za isti mesec Ta dva podatka sta si sorodnejša kakor zaporedna meseca. Ti indeksi imajo premično bazo, vendar niso verižni, ker osnova indeksov ni predhodni člen. Tabela 12.13 Mesečni in kumulativni indeksi za proizvodnjo piva v letu 1957 v SRS tv tisoč hi; Vir: MSP) - 196 - Enako za ta e primere izračunavamo indekse iz kumula¬ tivnih vrednosti dveh zaporednih let. Ta primerjava je logič¬ na, ker obe primerjani vrednosti obsegata isti del sezone v dveh zaporednih letih. Za proizvodnjo piva v SRS v letu 1957 so te vrste pokazatelji izračunani v tabeli 12.13. Časovna vrsta mesečnih indeksov med dvema letoma po¬ kaže, da je - če izvzamemo mesece z nizko proizvodnjo piva - največje zvečanje v mesecu juniju (indeks: junij 1957/junij 1956 je 216). Indeks kumulativ pa kaže v drugi polovici leta precej stalno vrednost okrog 150. Komponente gibanja v časovnih vrstah 12.35 Časovna vrsta je kvantitativen izraz časovnega delo¬ vanja vseh faktorjev, ki vplivajo na pojav, ki ga prikazuje. Teh faktorjev je veliko in se njihova jakost in u- činek časovno spreminjata. Zato se členi časovne vrste spre¬ minjajo; pravimo, da se pojav giblje. Nemogoče je is časovne vrste izluščiti, kolikšna je sprememba zaradi posameznega faktorja. Moremo pa iz nje raz¬ brati skupen učinek faktorjev, ki imajo soroden vpliv na pojav, ki ga proučujemo. Na časovni vrsti po tem vidiku opazujemo na¬ slednje vrste sprememb: a) trend - T, ki podaja osnovno linijo razvoja, b) ciklične spremembe - C, ki izvirajo iz dolgoročnih vzrokov, c) periodične spremembe - P, med katerimi so posebno važne se¬ zonske - S, ki izvirajo iz vzro¬ kov, ki se ponavljajo na stalno razdobje, d) iregularne spremembe - I, ki so rezultat enkratnih epizo- dičnih dogodkov ali rezultat stalnih slučajnih vzrokov. V Časovni vrsti ne opazimo vedno vseh komponent. Ta ali ona komponenta more izpasti. Časovna vrsta letnih podat¬ kov ne kaže sezonskega gibanja, marsikateri pojav nima ciklič¬ nih nihanj ali epizodičnih sprememb. Vsak pojav pa ima neko osnovno smer razvoja, le redki so primeri konstantnih pojavov in še ti niso z ekonomskih področij. Na vsaki časovni vrsti opazimo tudi slučajna nihanja, ki so izraz manjših vzrokov, ki nastopajo v eni ali drugi obliki. 12.36 Trend. Vsak ekonomski pojav ima neko osnovno linijo razvoja. Ta je opazna le v daljših časovnih razdobjih. - 197 - To osnovno smer razvoja imenujemo trend. Če trend nakazuje razvoj v daljšem razdobju, ga včasih imenujemo sekularni trend. Trend je rezultat faktorjev, ki teže k stalnemu razvo¬ ju. Tako je trend povečanja proizvodnje električne energije izraz tehničnega napredka, trend zniževanja umrljivosti re¬ zultat razvoja zdravstvene službe in medicine nasploh itd. Trend proizvodnje električne energije kaže stalno naraščanje, trend gibanja umrljivosti pa stalno padanje. Trend za določen pojav more tudi spremeniti smer. Tako more proizvodnja nekega artikla določeno razdobje naraščati, v nadaljnjem razvoju pa zaradi nadomestitve z drugim, kvalitetnejšim artiklom, padati. Enako more proizvodnja rudnika za neko razdobje stalno rasti, v nadaljnjem razdobju pa zaradi osiromašenja rudnika padati. Kakor smo že navedli, je konstantnih pojavov malo. Eden izmed njih je na primer razmerje med številom rojstev dečkov in de-» klic. To razmerje ima časovno isto vrednost. Odkloni od kon¬ stante so le slučajni in ne kažejo težnje k časovni spremembi tega razmerja. Ta primer je prikazan v drugem poglavju v ta¬ beli 2.1. Zaradi drugih vplivov se dejanske vrednosti od tren¬ da odklanjajo navzgor in navzdol, vendar v večini primerov že iz slike za časovno vrsto razberemo osnovno smer razvoja. 12.37 Periodična nihanja . Za veliko pojavov je značilen pe- riodičen, zlasti sezonski značaj. Sezonski značaj marsikaterih pojavov povzroče predvsem klimatski vplivi. Tako je s klimatskimi vplivi povezana gradbena dejavnost, turizem in gostinstvo, kmetijstvo in vse druge dejavnosti, ki so od¬ visne od klimatskih vplivov ali posredno povezane z eno izmed navedenih. Tako je prehrambena industrija vezana na poljedel¬ stvo, promet na turizem itd. Sezonski značaj pa ne izvira nuj¬ no iz klimatskih vplivov, marveč more biti vzrok tudi drugje. Tako morejo vplivati sezonsko določene ustaljene navade ali prireditve na sezonski značaj. Tako je potniški promet, pošt¬ ni promet, trgovinski promet itd. odvisen od praznikov, ki so v vsakem letu ob istem času (npr. novo leto). Enako izzove sezonski značaj določenega pojava prireditev, ki se letno po¬ navlja na isti datum: tak primer so gospodarski velesejmi. 12.38 Ciklična gibanja. V časovnih vrstah za daljša razdo¬ bja opazimo nihanja okrog trenda. Ta nihanja so več ali manj regularna, ni pa niti njihova dolžina niti oblika stal¬ na kakor pri periodičnihnihanjih. Ta nihanja pa kljub temu, da niso popolnoma regularna, niso slučajna in so odvisna od doga¬ janj v preteklosti. Imenujemo jih ciklična gibanja. Ciklična gibanja so tipična za ekonomske pojave in jih opazujemo na nizu Pojavov. Jakost cikličnih nihanj je za različne pojave različ¬ na. Odvisna je od tega, ali gre za pojav, ki je bolj ali manj občutljiv za spremembe v gospodarskem življenju. Zaradi poveza¬ nosti gospodarstva je med cikli za posamezne gospodarske panoge - 198 - ali pojave zveza, ker se tako prosperiteta ali depresija pre¬ naša od panoge na panogo. 12.39 Iregularne variacije. Razen navedenih treh vrst gi- banj, trenda, periodičnih nihanj in cikličnih spre¬ memb na časovni vrsti opazujemo še iregularne variacije, ki so rezultat enkratnih ali pa slučajnih vzrokov. Zaradi prekinitve toka nastane zastoj v prometu električne cestne železnice. Po¬ tres vpliva na niz dejavnosti. Zaradi prometne nesreče je za¬ stoj v železniškem prometu, zaradi poplave je uničena letina, epidemija vpliva na morbiditeto in mortaliteto itd. Navedeni dogodki so enkratni vplivi, ki imajo za rezultat, da se za kraj¬ še razdobje pojav odkloni od regularnega razvoja. Za razliko od enkratnih - epizodičnih vplivov, ki na¬ stopijo nepričekovano, vendar za krajši čas, slučajne variaci¬ je, ki so rezultat slučajnih vplivov, nastopajo stalno in v vseh pojavih. Slučajne variacije so manjše fluktuacije, rezul¬ tat manjših dogodkov, ki jih ne obravnavamo, ker ni za to po¬ trebe ali pa jih niti ne moremo obravnavati individualno. Osnovni modeli časovnih vrst 12.40 V vsaki časovni vrsti ne opazimo vseh komponent, bo¬ disi da te komponente pojav sploh ne vsebuje ali pa je v časovni vrsti zabrisana. Marsikateri pojav nima sezonske oziroma periodične komponente, v nekaterih časovnih vrstah pa je zabrisana. Tako na dnevni časovni vrsti novorojenih ne opa¬ zimo tedenske periodičnosti, medtem ko je v tedenski vrsti števila prevoženih potnikov zabrisana tedenska periodičnost. Enako je v vrsti letnih podatkov zabrisano sezonsko gibanje pojava. Marsikateri pojav nima cikličnih nihanj ali epizodič¬ nih sprememb. Skoraj vsak pojav pa ima svoj trend, Le malo je pojavov, ki bi bili konstante v tem smislu, da nimajo neke sme¬ ri razvoja. Na vsaki časovni vrsti moremo opaziti tudi slučaj¬ ne variacije, ki so izraz manjših vzrokov, ki vedno nastopajo. Vrednosti členov v časovni vrsti Y so torej skupnost trenda T, cikličnih gibanj G, sezonskih oziroma periodičnih vplivov P in iregularnih variacij, ki so epizodične E ali slučajne S. Zvezo teh komponent moremo nakazati v nekaj osnovnih modelih, ki jih uporabljamo pri analizi časovnih vrst. 1) y = t + p + c + e + s 2) Y=T(l+p+c+e+s) 3) y = t.p.c.e.s 4) Y = T.P. C.E + S (12.17) 199 - V prvem modelu so posamezne komponente vezane aditiv¬ no. ^nako je to primer v drugem modelu, vendar je za ta primer učinek vsake komponente sorazmeren s trendom. Tretji model ima za osnovo faktorialno povezavo vseh komponent, medtem ko četr¬ ti predpostavlja aditivno slučajno komponento, druge komponen¬ te pa so vezane faktorialno. Ce v stvarnem primeru, ki ga proučujemo, kakšne kompo¬ nente ni, ustrezni .simbol v modelu izpade. V prvih dveh modelih so periodične in ciklične komponente in iregularne variacije (epizodične in slučajne) pozitivne ali negativne količine. Če učinka kake komponente ni, je njihova vrednost enaka 0. V prvem modelu so posamezne količine (P. G, E, S) izražene z absolutni¬ mi, v drugem (p, c, e, s) pa z relativnimi odkloni od trenda. V tretjem in četrtem modelu so komponente P, C, E, S izražene s koeficienti, ki so ena, če učinka ni, in večji ali manjši od ene, če deluje v smeri povečanja oziroma zmanjšanja. V stvarno¬ sti prvi model srečamo poredko, čeprav je najenostavnejši. Tež¬ ko si namreč predstavljamo, da bi bila velikost učinka posamz- nih komponent neodvisna od velikosti pojava, ki je dan s tren¬ dom. Vendar je analiza prvega modela najenostavnejša. Zato sku¬ šamo druge modele privesti na prvega, če se le da. Drugi model preuredimo v prvega, če osnovno časovno vrsto Y delimo s tren¬ dom, tretji model pa prevedemo v prvega, če ga logaritmiramo. Osnovna analiza časovnih vrst gre za tem, da razdru- žimo osnovno časovno vrsto na njene sestavne dele. S tem pro¬ dremo že precej v zakonitosti dinamike pojava. Te zakonitosti izkoriščamo, kadar analiziramo dogajanja v preteklosti ali na¬ povedujemo razvoj v prihodnosti. Z različnimi analitičnimi po¬ stopki namreč moremo določiti posamezno izmed teh komponent v časovni vrsti. Vendar moremo časovno vrsto analizirati le, do¬ kler v kompleksu vplivov ni kakovostnih sprememb. To je jasno. Ako na primer neko novo odkritje da nove proizvodne možnosti, se smer razvoja bistveno spremeni. Ker imamo za take primere dve smeri razvoja, moramo časovno vrsto razdeliti v dva dela in ju obravnavati ločeno, -^nako analiziramo sezonsko komponen¬ to kot statično, le, dokler moremo predpostavljati, da je ta nespremenjena. Ge se v proučevanem razdobju sezonska komponen¬ ta spremeni, moramo časovno vrsto razdeliti in analizirati se¬ zonsko komponento za vsak odsek posebej. Vloga povprečij za analizo časovnih vrst 12.41 Enostavno orodje, ki pomaga analizirati časovne vrste, so povprečja. Pod določenimi pogoji moremo s povpreč¬ ji odstraniti neT.ce komponente v časovni vrsti, druge pa ohrani¬ ti. Povprečja is časovnih vrst vplivajo v eni ali drugi obliki na vse komponente. Če je trend v razmaku, iz katerega izračunavamo pov¬ prečje, linearen, povprečje, ki ga centriramo na sredino razma¬ ka, leži na trendu. Če je trend na odseku, iz katerega tvorimo 200 povprečje, krivuljčen, povprečje, ki ga centriramo na sredino razmaka, stoji nad trendom, če je trend konkaven, in pod tren¬ dom, če je trend konveksen. Razlike so tem večje, čimbolj je trend ukrivljen. Povprečje, centrirano na obratišče, pa leži na trendu. Iz tega dalje sklepamo, da se časovna vrsta drsečih sredin, če jo izračunamo iz trenda, na odseku, na katerem je trend linearen, sklada s trendom, če pa je trend krivuljčen, dobimo črto, ki je bolj izravnana kot trend. Ker je krivina trenda na daljših odsekih večja, je izravnavanje trenda tem večje, čim širši so razmaki, za katere izračunavamo povprečje. Izravnavanje ni tako izdatno, če člene, iz katerih izračunavamo povprečja, tehtamo tako, da imajo stranski členi manjšo, srednji pa večjo težo. Običajno tehtamo člene z binom- skimi koeficienti (1, 2, 1) za povprečja iz treh členov, (1, 3, 3, 1) za povprečja iz štirih členov, (1, 4, 6, 4, 1) za povprečja iz petih členov. Izdelani so še različni drugi sistemi tehtanja. To pa presega naš okvir. Če je zveza med komponentami aditivna, se učinek pe¬ riodičnih oziroma sezonskih vplivov v povprečju uniči, če je dolžina razdobja, za katero računamo povprečje, enaka periodi ali mnogokratniku periode. Pri faktorialnih zvezah, kakoi' je nakazana v modelu 3 v 12.17, pa se v povprečju uničijo loga¬ ritmi sezonske komponente. V vrsti drsečih sredin se uniči ciklična komponenta, če so povprečja izračunana iz razdobja celotnega cikla. Učinki slučajnih vplivov se v povprečju vedno bolj manjšajo, čim daljše je razdobje, iz katerega izračunavamo povprečja. če ta pravila izkoriščamo kombinirano, povprečje ve¬ liko pripomore k analizi časovnih vrst. TREND 12.43 Trend proučujemo iz dveh razlogov. Proučujemo ga same¬ ga zase, da spoznamo smer razvoja pojava, da ga pri¬ merjamo s trendi pojavov, ki so med seboj odvisni ali pa da proučujemo vpliv trenda na druge komponente (periodične in ci¬ klične;. Trend pa dostikrat iščemo zato, da is odklonov stvar¬ ne časovne vrste od trenda proučujemo sezonska, ciklična ali iregularna nihanja. I-Ietcd za določevanje trenda je več. Vsaka izmed njih raa za osnovo različne predpostavke in postopke. Zato je važ¬ na in odgovorna nalo 0 a izbrati v vsakem posebnem primeru obli¬ ko in metodo za določanje trenda. Trend določamo z mehaničnimi sredstvi prostoročno ali z izravnavanjem s sredinami, ali ana¬ litično, s prilagajanjem analitičnih funkcij danim podatkom. Katero metodo uporabimo za določanje trenda, je odvis¬ no od proučevane časovne vrste in namena analize. Če potrebuje¬ mo trend zaradi proučevanja cikličnih ali sezonskih odklonov, je logično, da predpostavljamo, da je trend črta, ki poteka med realnimi vrednostni tako, da se izenačujejo periodični ali ciklični vplivi. To črto določamo običajno mehanično. Če pa potrebujemo trend za napovedovanje, ga iščemo v obliki anali¬ tične krivulje, za katero moremo z ekstrapolacijo izračunati potek trenda tudi v prihodnost. 12.44 Najvažnejši problem je izbira pravilnega tipa krivu¬ lje, ki naj predstavlja trend. Enoličnega pravila za določevanje trenda ni. Splošne smernice predpisujejo, da mora biti krivulja, ki jo uporabimo za trend, smiselna, ne preveč zamotana in objektivna. Po sliki časovne vrste, poznavanju pojava, ki ga vr¬ sta prikazuje in poznavanju lastnosti funkcij, ki pridejo v po¬ štev, izberemo v vsakem določenem primeru, kateri tip krivulje je vsebinsko in tehnično najprimernejši. K 0 t trend uporabljamo ali iregularno prilagojene kri¬ vulje ali analitične krivulje. Od splošnih analitičnih krivulj pridejo najpogosteje v poštev tele funkcije: 1. Premica: T = a + bx 2. Parabola druge, tretje .. stopnje: T = a + bx + cx2 + dx3 . . . 3. Parabola: T = a + bvx X 4. Eksponencialna funkcija: T = ab 5. Modificirana eksponencialna funkcija: T = k + ab* b x 6. G-ompertzova krivulja: t = Ka 7. Pearl-Reedova logistična krivulja T T = co 1 + e a+bx *\ > J ( 12 . 18 ) k, T co V teh funkcijah pomeni T trend, x čas, a, b, c, d, pa so parametri trenda. 12.45 Določitev trenda ima dva dela. Najprej je treba izbra¬ ti ustrezen tip krivulje, ko pa tega imamo, je treba za konkretno časovno vrsto določiti parametre trenda. Prvi del je vsebinske, drugi pa tehnične narave. 202 Da se moremo odločiti v vsakem primeru za ustrezen tip krivulje, moramo poznati potek posameznih tipov krivulj in njihove lastnosti. Zato je najbolje, da časovno vrsto, za katero določamo trend, narišemo v linijski grafikon z aritme¬ tičnimi ali logaritemskimi skalami in presodimo, kateri tip krivilje najbolje ustreza stvarni smeri razvoja. 0 obliki trenda se moremo poučiti tudi iz vrsti dife¬ renc zaporednih členov. Če je trend linearen, so prve diferen¬ ce DT^. = stalne količine. Če je trend parabola druge stopnje (tipa 2), so druge diference, ki jih dobimo iz vrste o prvih diferenc D = DT^-^-DT^, konstantne. Enako ugotovimo, da je trend parabola tretje stopnje, če so tretje diference 'z n p D J T^_ = D^T^ +1 - D^T^, dobljene iz vrste drugih diferenc, kon¬ stantne . Če je trend eksponencialna funkcija, so prva diferen¬ ca logaritmov trenda konstante. Enako preizkusimo, ali je trend eksponencialen, z verižnimi indeksi ali z vrsto koeficientov dinamike. Če je trend eksponencialen, so verižni indeksi ali koeficienti dinamike konstantne količine. Relativen prirastek je namreč pri eksponencialni funkciji konstanten. Če se pojav giblje v obliki Pearl-Reedove krivulje, tvorijo prve diference simetrično unimodalno krivuljo. Pri Gompertzovi krivulji pa dobimo unimodalno krivuljo, ki je asi¬ metrična v desno. Pri logistični krivulji relativen prirastek linearno pada. Jasno je, da zgornja pravila veljajo za trend, ne pa za stvarno časovno vrsto. Ta ne vsebuje samo trenda, ampak tu¬ di druge komponente. Zato so časovne vrste povprečij, če so izračunana tako, da odstranijo periodične in ciklične vplive in zmanjšajo slučajne variacije, veliko primernejše za zgornje preizkuse. 12.46 Za tehnično izračunavanje parametrov trenda je pri vseh metodah najprimernejše, da so parametri v linear¬ ni zvezi. Za prve tri tipe krivulj to velja, ne velja pa za druge. Vendar moremo eksponencialno krivuljo privesti na obli¬ ko, za katero to ne velja, če jo logaritmiramo log T = log a + xlogb (12.19) kar moremo pisati T' = a' + b'x (12.20) pri tem je T'= logT; a'= loga; b'= logb. - 203 Modificirane eksponencialne krivulje ne moremo privesti v že¬ leno obliko, vendar moremo bolj zamotani funkciji, logistično in Gompertzovo funkcijo, prevesti v modificirano eksponencial- no funkcijo. Ce vzamemo reciprok logistične funkcije, dobimo 1 T" T 1_ oo bx T co ali dalje: T'= k'+ a'b' ( 12 . 21 ) ( 12 . 22 ) ~| C*. -i Pri tem pomeni: T'= a' = |—; b'=* e ; k'= T oo Ce logaritmiramo Gompertzovo funkcijo, pa dobimo: logT = logK + b loga (12.23) ali T '= k'+ a'b' x (12.24) Pri tem pomeni: T'= logT; k'= log K; a' - loga; b'= b. Medtem ko je eksponencialna funkcija zelo primerna funkcija za smer razvoja za razdobja, ki niso predolga, se iz¬ kaže, da sta logistična in Gompertzova krivulja primerni za prikazovanje naravnega razvoja za zelo dolga razdobja. Za zelo dolga razdobja opazimo, da se v logistični krivulji spreminja Število prebivalstva. Enake zakonitosti opazujemo tudi pri drugih živih bitjih. Ugotovili so, da moremo logistično in Gompertzovo krivuljo s pridom uporabiti tudi za trend proiz¬ vodnje. Logistična ali Gompertzova krivulja, s katero ponazo¬ rimo trend proizvodnje, nakazuje štiri obdobja: obdobje nizke proizvodnje pomeni stopnjo eksperimentiranja in uvajanja, dru¬ go obdobje, ki pomeni vzpon v družbeno proizvodnjo, tretje ob¬ dobje po infleksiji, ko proizvodnja raste, vendar v vedno manjšem obsegu, in zadnje obdobje stabilizacije pri nasičeno¬ sti. 12.47 Splošno velja pravilo, da moremo trend izračunavati le za daljša razdobja. V nasprotnem primeru sicer do¬ bimo prilagojeno "krivuljo, vendar pa ta ni trend, marveč pre¬ cej verjetno vsebuje predvsem ostanek ciklov, pa tudi drugih vplivov. Tudi pri daljših razdobjih moramo paziti, da je raz- - 204 - dotje, za katero določamo trend, tako, da vključuje cele cikle ne pa samo dele. Če ta pogoj ni izpolnjen, more nezaključeni cikel znatno vplivati, da dobljena krivulja ni verna slika o- snovne smeri razvoja. Kljub tej rezervi dostikrat prilagajamo krivulje tu¬ di krajšim časovnim vrstam. Vendar moramo biti v teh primerih oprezni pri tolmačenju take smeri razvoja, saj je kratkoročna in more vsebovati razen trenda tudi ciklična nihanja in druge vplive. 12.48 Ketode določanja trenda. Omenili smo že, da imamo več 'metod za določanje trenda. Od njih bomo obravnavali naslednje: a) prostoročno metodo, b) metodo drsečih sredin, c) metodo sredin med najvišjimi in najnižjimi točkami. Te metode posredujejo trend v mehanični ali grafični obliki. Od metod, ki dajejo trend analitično v obliki krivulj, pa bomo obravnavali: a) metodo izbranih točk, b) metodo delnih sredin, c) metodo delnih vsot, d) metodo najmanjših kvadratov. Prostoročna metoda 12.49 Običajno si moremo v grafikonu časovne vrste že iz slike časovne vrste zamisliti potek trenda. Trend v vsakem primeru poteka med realnimi vrednostmi tako, da se o- snovna časovna vrsta odklanja od trenda navzgor in navzdol. Zato moremo trend včrcati v grafikonu prostoročno. Ta metoda je subjektivna in zato nima posebne analitične vrednosti. Ven¬ dar je njena prednost v enostavnosti in hitrosti. Zato jo upo¬ rabljamo predvsem za približek in za osnovo pri izbiri anali¬ tične oblike trenda. 12.50 V sliki 12.10 je narisana časovna vrsta proizvodnje cinkovega koncentrata na območju SRS v razdobju med obema vojnama od 1919-1941, v njej pa prostoročno včrtan trend - 205 - Leto 1 J roiz- vodnja Tabela 12.14 Proizvodnja cinkovega koncentrata v SRS med obema vojnama v tonah (Vir: SB SRS 1952, St. 8) 1919 1920 1921 1922 1923 1924 1925 1926 1927 90 350 75 450 600 520 510 639 1143 . Leto 1928 1929 1930 1931 1932 1933 1934 1935 1936 Ppo1 7 — vodnja 1076 1313 1547 1301 1358 2393 2282 2173 2567 Leto 1937 1938 1939 1940 1941 vodnja 2401 4530 3252 4121 3483 Slika 12.10 Trend za proizvodnjo cinlcovega koncentrata v SRS med obema vojnama, določen prostoročno 206 Metoda drsečih sredin' 12.51 Iz lastnosti sredin, ki smo jih že navedli, sklepamo, da da vrsta drsečih sredin približno linijo trenda, če je trend linearen. Če pa je trend krivuljčen, se v vrsti drsečih sredin trend bolj ali manj izravnava. Stopnja izrav¬ navanja je odvisna od števila členov, iz katerih izračunavamo povprečje. Kot primer vzemimo časovno vrsto števila umrlih na 1000 prebivalcev v bivši Jugoslaviji in vrsto petletnih drse¬ čih sredin. Slika 12.11 pokaže, kako se vrsta drsečih sredin giblje med členi osnovne vrste. To pa je osnovni pogoj, ki ga mora izpolniti trend. Vendar je vprašanje, ali je v tem prime¬ ru vrsta drsečih sredin res trend, ali pa je v njem ostala sled eventualnih ciklov. V časovnih vrstah, ki vsebujejo periodično in ciklič¬ no komponento, da vrsta drsečih sredin trend le, če je trend linearen, povprečja pa izračunana za razdobja, ki so mnogo¬ kratniki periode oziroma cikla. V vseh drugih primerih časov¬ no vrsta drsečih sredin izravnava trend ali pa ima v sebi o- stanek periodične ali ciklične komponente. Za primer indeksa industrije gradbenega materiala v SFRJ, za katerega smo izra¬ čunali vrsto letnih drsečih sredin, na sliki 12.11 jasno vidi¬ mo, da je iz osnovne vrste odstranjen sezonski vpliv in slučaj¬ ne variacije, ker so povprečja letna. Metoda sredin med najnižjimi in najvišjimi točkami 12.52 Ce v grafikonu za časovno vrsto med seboj povežemo najvišje osti in enako najnižje osti, omejimo plo¬ skev, v kateri so v grafikonu vse vrednosti časovne vrste. Za trend vzamemo linijo, ki poteka po sredini te ploskve. To li¬ nijo dobimo enostavno tako, da iz osti, ki smo jih povezali, narišemo navpičnice i poiščemo sredine.navpičnic med zgornjo in spodnjo mejo ploskve. Te sredine med seboj zvežemo. Tako dobimo lomljeno črto, ki zadosti dobro prikazuje osnovno smer razvoja. Ta metoda je subjektivna, ker je odvisna od tega, ka~ tere osti med seboj povežemo. Hiba je tudi ta, da povezujemo ekstreme, ki so lahko rezultat iregularnih vplivov. Splošno pravilo, ki ga moramo upoštevati, je, da povezujemo res eks¬ tremne ne pa manjše - lokalne osti. V nasprotnem primeru je v črti trenda še ostanek ciklov. Na sliki 12.12 je nakazano, M' ko je za proizvodnjo cinkovega koncentrata iz tabele 12.14 d ločen trend po tej metodi. - 207 - Slika 12.11 Indeksi industrije gradbenega materiala v SFRJ z vrisano časovno vrsto drsečih sredin 208 Slika 12.12 Trend za proizvodnjo cinkovega kon¬ centrata, določen po metodi sredin med najvišjimi in najnižjimi- točkami Metoda izbranih točk 12.53 S prostoročno metodo trend včrtamo na oko. V grafiko¬ nu je laže določiti nekaj točk, za katere menimo, da leže na trendu, kakor celo krivuljo trenda. Če za določen pri¬ mer izberemo tip krivulje, ki naj predstavlja trend, imamo za trend tisto izmed možnih krivulj, ki gre skozi izbrane točke. Če naj izbrane točke leže na krivulji, ki smo jo izbrali za trend, morajo koordinate teh točk zadostiti enačbam krivulje. - 209 - Tako dobimo sistem enačb, iz katerega izračunamo parametre funkcije trenda. Ker potrebujemo toliko enačb, kolikor ima krivulja parametrov, moramo izbrati toliko točk, kolikor ima izbrana funkcija parametrov. Računski postopek poenostavimo, če izberemo točke v enakih časovnih razdobjih. 12.54 Kot primer vzemimo proizvodnjo cinkovega koncentrata iz tabele 12.14. Iz grafikona zaključimo, da parabola druge stopnje T = a + bx + cx^ dobro opiše smer razvoja v tem razdobju. Ker ima ta funkcija tri v parametre, moramo izbrati tri točke v raz¬ makih po osem let. Če vzamemo točke bližje skupaj, je ocena znatno slabša. Izhodišče koordinatnega sistema izberemo v sredini ča¬ sovne vrste (leto 1930), posamezne izbrane točke pa osem let vsaksebi. Iz grafikona ocenimo trend: za leto 1922 (x = -8), trend T_g = 300, za leto 1930 (x = 0) trend T q = 1348, za leto 1939 (x = +8) pa T +Q = 3100. Če vstavimo te koordinate v enačbo za parabolo druge stopnje, dobimo sistem treh linearnih enačb s tremi neznanka¬ mi - parametri a, b in c. 300 = a - 8b + 64c 1348 = a 3100 = a + 8b + 64 c Če rešimo ta sistem linearnih enačb, dobimo, da so parametri a = 1348, b = 175, c = 5,5 ali trend T = 1348 + 175x + 5,5x 2 Če v to funkcijo vnašamo posameznim letom ustrezne vrednosti x od -11 do +11, dobimo Vsakemu členu osnovne vrste prirejeno vrednost trenda. Za posamezna leta so izračunane vrednosti trenda dane v tabeli 12.15. 210 Tabela 12,15 Trend za proizvodnjo cinikovega kon¬ centrata, določen po metodi izbranih točk Metoda delnih sredin 12.55 Tudi- če je trend krivuljčen, moremo na krajšem odseku ča¬ sovnega razvoja meniti, da je trend linearen. Navedli smo že, da v primeru linearnega trenda povprečje vrednosti členov leži na trendu. Zato moremo priti do objektivneje izbranih točk na trendu, če namesto na oko izbranih točk vzamemo kot točke na trendu povprečja iz določenega števila členov. Po tej metodi razdelimo časovno vrsto na toliko enakih delov, kolikor ima funkcija trenda parametrov. Za vsak dobljeni del časovne vrste izračunamo povprečje. Za točke, ki imajo za absciso sredino ča¬ sovnega razmaka, iz katerega izračunamo povprečje, za ordinato pa izračunamo povprečje, menimo, da leže na trendu. Od tu dalje je postopek enak postopku po metodi izbranih točk. Koordinate točk vstavimo v funkcijo trenda, da dobimo sistem enačb za pa¬ rametre. Iz njih izračunamo parametre, ki jih vstavimo v funk¬ cijo trenda. Z vstavljanjem vrednosti x za posamezne momente pa dobimo časovno vrsto trenda. Čeprav je navedena metoda objektivnejša kakor metoda iz¬ branih točk, je njena slaba stran v tem, da točke leže na tren¬ du le, če je trend na ustreznem delnem odseku linearen. Če pa ni, da postopek delnih sredin preveč izravnan trend. Zato raz¬ dobja, iz katerih računamo sredine, ne smejo biti predolga. Če pa vzamemo prekratka razdobja, se preveč pokažejo slučajni vplivi. Treba je torej paziti, da spravimo v sklad oba učinka in izberemo pravilno dolžino. 12.56 Vzemimo za primer časovno vrsto proizvodnje cinkovega koncentrata v SRS, za katero smo trend določili že po metodi izbranih točk. Po analizi podatkov menimo, da je trend parabola druge stopnje. Potrebujemo torej tri sredine, ker ima parabola druge stopnje tri parametre. 211 Ker ima vrsta 23 členov, kar ni deljivo s tri, povprečja izračunamo iz sedmih členov tako, da med njimi izpustimo po en Člen. Tako dobimo simetrično sliko členov 7+1+7+1+7=23. Ce vstavimo izhodišče za koordinatni sistem v sredino vrste, so abscise za povprečja -8, 0, +8, ordinate pa povprečja ustreznih členov osnovne vrste. Tako dobimo T_q - -7(90+350+75+450+600+520+510) = 371 T q = 7(1143+1076+1313+1547+1301+1358+2393) = 1462 T +q = -1(2173+2567+2401+4530+3252+4121+3483) = 3218 Koordinate točk I_ Q (-8,371), T q (0,1462), T +g (+8,3218) vnesemo v funkcijo 2 T = a + bx + cx . Tako dobimo tri enačbe: 371 = a - 8b + 64c 1462 = a 3218 = a + 8b + 64c Iz tega sistema enačb zlahka dobimo, da je: a = 1462, b = 177,94, c = 5,1953. Analitična oblika trenda je torej T = 1462 + 177,94x + 5,1953x 2 Če po prejšnjem načinu v to funkcijo vnašamo posamezne vrednosti za x, dobimo vrsto trenda v tabeli 12.16. Tabela 12.16 Trend za proizvodnjo cinkovega koncen¬ trata v Sloveniji, določen po metodi delnih sredin 212 Metoda delnih vsot 12.57 Slada stran metode sredin je izravnavanje trenda. Temu se izognemo z metodo delnih vsot. Ta metoda predpostav¬ lja: a) v vsoti se razultati slučajnih vplivov uničujejo; b) vsota rezultatov periodičnih vplivov v eni periodi je enaka nič; c) vsota rezultatov cikličnih vplivov v enem ciklu je ena¬ ka nič. Če veljajo te predpostavke, je vsota členov časovne vr¬ ste v razmaku, ki je mnogokratnik periode in cikla, samo rezul¬ tat trenda. Ge je na primer med komponentami aditivna zveza Y = T + P + C + S velja torej EY = IT. + 0 + 0 + 0 Če je T = af^ + bf 2 + cf^ + ... funkcija trenda, a, b, c ... parametri, f^, fg, f, pa^funkcije časa, dobimo sistem linearnih enačb za parametre a, b, c ... če vzamemo delne vsote členov iz časovne vrste. Število vsot se ravna po številu parametrov. Če imamo na primer tri parametre, dobimo, da je EY = a^f + bEf + c^f, 1 1 1 1 * 1 IY = alf-, +, bYf -f cZf., 2 2 1 2 ^ 2 ? T Y = alf-, + blf ? + cEf., 3 3 3 3 5 (12.25) Pri tem pomeni:IY, EY, IY = delne vsote členov v časovni vrsti 12 3 T-f-, , E f 9 ... Ef, = delne vsote funkcij časa. Nadaljnji potek 1 1 2 Z 3 ^ določanja funkcije trenda je enak kakor pri prejšnjih metodah. Iz enačb izračunamo parametre in jih vnesemo v funkcijsko obli¬ ko trenda. Iz te izračunamo časovno vrsto trenda, če vanjo vna¬ šamo posamezne vrednosti za x. 12.58 Za proizvodnjo cinkovega koncentrata v Sloveniji je trend ■ parabola druge stopnje: 2 T = a + bx + cx^. Torej je: f-, = 1, fg = x, f^ = yč ~. Izračun parametrov in vrste trenda je nakazan v tabeli 12.17. 213 Tabela 12.17 Izračunavam,je parabolienega trenda druge. stopnje za proizvodnjo cinkovega koncen¬ trata v SRS med obema vojnama, po metodi - delnih vsot Kakor pri prejšnji metodi smo tudi tu izpustili leti^ V-*26 in 1934, da dobimo trikrat po sedem členov. Sistem enačb, katerega izračunamo parametre, sestavimo iz vsot, ki so iz¬ kušane v stolpcih 2, 3, 4. 7a - 56b + 476c = 2595 7a + 28c - 10131 7a + 56b + 476 c « 22527 - 214 - 155 tega sistema linearnih enačb dobimo, da je: a = 1425,59, b « 177,964, c = 5,4241 V stolpcih 5, 6 in 7 je nakazano, kako izračunamo časovno vr¬ sto trenda. Kontrola računa je pravilo, da so pri metodi vsot del¬ ne vsote izračunanega trenda enake ustreznim delnim vsotam v osnovni časovni vrsti. V našem primeru se vsote natančno skla¬ dajo, razen zadnje, pri kateri je razlika zaradi zaokroževanja 1. Metoda najmanjših kvadratov 12.59 V splošnem vzamemo za trend tisto krivuljo določenega tipa, ki se dani osnovni vrsti podatkov najbolje prile¬ ga. Ce po analizi podatkov ugotovimo, da je trend parabola dru¬ ge stopnje, kot trend izmed vseh parabol vzemimo tisto, ki se osnovni vrsti najbolj prilega. Običajno vzamemo za merilo stopnje prilagojenosti vsoto kvadratov odklonov osnovne vrste od krivulje. Čim bolj je kri¬ vulja prilagojena osnovnim podatkom, tem manjša je ta vsota in narobe. Kot trend v tem primeru vzamemo tisto krivuljo, za ka¬ tero je vsota kvadratov odklonov najmanjša. Ta pogoj moremo pisati v obliki I(Y - T) 2 = Min (12.26) Ta vsota je funkcija parametrov krivulje, ki srno jo iz¬ brali kot trend. Naloga je najti, pri katerih vrednostih para¬ metrov je ta izraz minimalen. Če je trend funkcija, v kateri so parametri v aditivni zvezi T = af x + bf^ + cf, ... (12.27) f ■, , f 2 , f^ = funkcije x s pogoj iz obrazca 12.26 napišemo v konkretnejši obliki H Y - af-, - bf 2 - cf 5 ...) 2 = Min (12.28) Po znanih stavkih o ekstremih dobimo s parcialnim odva¬ janjem po a, b, c, .., sistem linearnih enačb. Tem enačbam, ki jih imenujemo normalne enačbe, morajo zadostiti parametri, da je izpolnjen zgornji pogoj. Za trend s tremi parametri je si¬ stem normalnih enačb naslednji: - 215 - ZYf, = alf? + bi f„f, + clf,f n 1 1 2 1 9 1 XYf 2 = alf^ + b 2 f^ + c£f,f 2 IYf 5 = alf^ + blf 2 f 5 + clfj (12.29) 12.60 Največkrat vzamemo kot funkcije potence od x (f^= 1, f 2 = x, f^ Ce je trend premica T = a + bx, enačb po zgornjih pravilih časa f. je sistem normalnih IY = Na + blx (12.30) !Yx = aXx + blx 2 v p Oe je trend parabola druge stopnje T = a + bx + cx , je sistem normalnih enačb XY = aN + bXx + cXx 2 XYx = aXx + blx 2 + clx 3 (12.31) IYx 2 = alx 2 + blx^ + cXx 4 :- N ^ ^e pa je trend parabola tretje stopnje T = a + bx + cx + dx , dobimo tele normalne enačbe XY = aN + bIx + cix 2 + dXx'^ XYx = alx + bXx 2 + cXx^ + dXx 4 IYx 2 = alx 2 + bLx^ + cXx 4 + dYx^ !Yx 3 = alx 3 + bXx 4 + clx 5 + dXx 6 ( 12 . 32 ) Kakšne so normalne enačbe, če je trend parabola viš¬ je stopnje kot tretje, je razvidno iz teh primerov. Vendar krivulje, ki imajo preveliko število parametrov, iz vsebinskih razlogov niso primerne za trend. 12.61 Zgornje normalne enačbe znatno poenostavimo, če vzame¬ mo, da je izhodišče koordinatnega sistema za x natanč¬ no sredi vrste, V ten primeru so namreč vsote vseh lihih potenc od x enake 0. če je število členov v časovni vrsti lihoN=2i+l, vzamemo izhodišče x = Ov(i+l) členu časovne vrste. Vrednost x so torej: -i, -i+l ... -2, -1, 0, +1, +2 ... i - 1, i. Težavneje je, če je število členov sodo število: N=2i. V tem primeru vzamemo prvi člen časovne vrste x = -2i +1, za 216 nadaljnje člene pa x večamo za 2. Tako dobimo vrsto za x. Za prvo polovico časovne vrste so x negativna, za drugo polovico pa pozitivna cela liha števila. Vrsta za x je v tem primeru: -2i + 1, -2i + 3, ... -5, -3, -1, +1, +3, +5 ... 2i-3, 2i-l Če je izpolnjen ta pogoj za vrste do 30 členov razme¬ roma enostavno izračunamo parametre do tretje stopnje s kon¬ stantami iz tabele G-. Postopek je tale: a) iz osnovne vrste izračunamo izraza LY, XYx, lYx 2 in PYx 5 b) parametre izračunamo z naslednjimi enačbami: Za linearen trend T = a 1 + b-jX (12.33) so parametri: 12.62 Za proizvodnjo cinkoVega koncentrata v obdobju med obema vojnama je treba, izračunati po metodi najmanj¬ ših kvadratov paraboličen trend druge stopnje. Trend izra imamo po naslednjih stopnjah: 217 - Iz osnovne vrste, ki ima 23 členov, izračunamo količine: 2Y, LYx, IYx 2 . Iz njih in s konstantami za izračunavanje parame¬ trov paraboličnega trenda v tabeli 3- izračunamo parametre a 9 , 2 ^ b 9 , c 2 za trend T = a 2 + b 2 x + c 2 x . Iz te enačbe na znan na¬ čin izračunamo vrednosti trenda, ki ustrezajo posameznim čle¬ nom tako, da v T = a 2 + b 2 x + c 2 x 2 vnašamo ustrezne vrednosti za x. V tabeli G najdemo, da je za N = 23: A 2 = 0,981366_ 1 ; B 2 = 0,988142_ 3 ; C 2 = 0,282326_ 4 ; K 2 = 0,124224_ 2 Tabela 12.18 Izračunavanje paraboličnega trenda druge stopnje za proizvodnjo cinkovega koncentrata v Sloveniji v razdobju med obema vojnama 38071 +180050 1882894 LY LYx LYx 2 213 Po obrazcih za izračunavanje parametrov za parabolični trend, dobimo: a 9 = A 2 XY - K 2 IYx 2 = 0, 981366.10" 1 .38071 - 0,124224.10“ 2 o . 1882894 = 1397,15 b 2 = B LYx = 0,988142.10“ 3 .180050 = 177,915 c 2 = C 2 IYx 2 - K 2 1Y = 0.282326.10“ 4 .1882894 - 0.124224.10“ 2 . . 38071 = 5,86567 Enačba trenda je: T = 1397,15 + 177,915x + 5,86567x^ Po znanem postonku dobimo iz te funkcije vrsto trenda v tabeli 12.19. Tabela 12.19 Trend za proizvodnjo cinkovega koncen¬ trata v Sloveniji, določen po metodi najmanjših kvadratov Pri kontroli o pravilnosti izračuna trenda upoštevamo pravilo, da je vsota členov v osnovni vrsti enaka vsoti trenda. Vsota trenda je ?T = 38072, vsota v osnovni vrsti pa £Y=38071. Razlika izvira iz zaokroževanja. 12.63 Za proizvodnjo svinčeno-cinkove rude v SR Sloveniji v razdobju po osvoboditvi od 1946-1957 je treba določi¬ ti smer razvoja. Osnovna vrsta podatkov je dana v tabeli 12.19. Tabela 12.19 Proizvodnja svinčeno-cinkove rude v SR Sloveniji v 10^ tonah (Vir:MSP SRS) Leto 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 Proiz- 133 145 pil 226 232 231 238 312 347 419 455 461 vodnja Analiza osnovnih podatkov pokaže, da imajo podatki li¬ nearno smer, če so narisani na pollogaritmičnem grafikonu. Iz tega sklepamo, da je smer razvoja eksponencialna funkcija obli- 219 - ke T = ab x . Iz odstavka o primernih funkcijah trenda povezamemo, da moremo to eksponencialno funkcijo prevesti v enostavnejšo obliko logT =.loga + x.logb, če jo Jogaritmiramo. To pa je li¬ nearna funkcija za x. Postopek določitve trenda je torej naslednji: Najprej za časovno vrsto osnovnih podatkov poiščemo ustrezno časovno vrsto logaritmov logY. Ta časovna vrsta kaže linearno smer razvoja. Vrsti logY prilagodimo po metodi najmanjših kvadratov premico. Iz enačbe vidimo, da sta parametra te premice loga¬ ritma parametrov eksponencialnega trenda. Z antilogaritmiranjem vrste logT dobimo časovno vrsto trenda za proizvodnjo svinčeno- cinkove rude. Ker je število členov sodo, vzamemo za x vrsto: -U, -9 ... -3, +1, +3 ... +9, +11. tabela 12.20 Izračunavanje eksponencialnega trenda za proizvodnjo svinčeno-cinkove rude v SR Sloveniji Parametre izračunamo po tabeli G. Ker je logaritmični trend linearen, poiščemo pod N = 12 : A-, = 0,83333_2» B 1 = 0,174825_ 2 . Dalje sledi: loga = A^Ilogl = 0,833333.10" 1 . 29,0478 = 2,42065 Logb = B 1 Ix.logY = 0,174825.10“ ? - . 13,8226 = 0,02417. 220 te rezultate antilogaritmiramo, dobimo: a = 263,42 b - 1,0572 T = a.b x = 263,42 . 1,0572 X p a = 263,42 pomeni vrednost trenda sredi vrste, b = 1,1177 pa je povprečni koeficient dinamike za proizvodnjo svinčeno-cin- kove rude v razdobju 1946-1957. Na sliki 12,13 je narisana osnovna vrsta podatkov in eksponen- cialni trend. Iz slike je dobro viden tipičen cikel v letih 1948-1953. tisoč t Slika 12.13 '1’rend za proizvodnjo svinčeno-cinkove rude v SRS, določen po metodi najmanjših kvadratov SEZONSKE I1T PERIODIČNE VARIACIJE 12.64 Sezonske in periodične variacije proučujemo iz več na¬ menov. Pomembno je, da poznamo sezonske variacije v preteklosti zaradi medsebojne primerjave in analize. Sezonsko komponento proučujemo tudi zaradi planiranja in napovedovanja za krajša razdobja. Sezonska variacija in periodične variaci¬ je nasploh so važne prvine v ekonomskih pojavih. Zato jih mo¬ ramo poznati, da moremo proučevati običajno negativen vpliv teh variacij. Ce časovno primerjamo sezonske variacije za različna razdobja, osvetlimo in analiziramo spremembe, ki so nastale v sezonskem variiranju kot rezultat različnih ukrepov ali iz dru¬ gih vzrokov. Tako na primer različna tehnika gradenj spremeni sezonsko komponento v gradbeni dejavnosti, različna politika subvencioniranja v gostinstvu spremeni sezonsko komponento v turizmu itd. Poznavanje sezonskih in periodičnih variacij je važno tudi za kratkoročno planiranje najrazličnejših pojavov. Za vr¬ sto dejavnosti je nepravilno linearno razdeljevanje letnega plana na mesečne plane in moramo zanje upoštevati sezonski zna¬ čaj določenih pojavov. To pa moremo le, če poznamo sezonsko komponento za te pojave. Sezonski značaj pojavov pa je samo eden izmed perio¬ dičnih vplivov. Tako ima na primer promet v trgovini na drob¬ no mesečno periodičnost in opažamo v začetku vsakega meseca večji, proti koncu meseca pa manjši promet. Tudi tedenska pe¬ riodičnost je tipična za veliko število pojavov. Tako pri po¬ tniškem prometu in z njim zvezanim številom prometnih nesreč, v prometu v gostinstvu itd. opazujemo tedensko periodičnost. Tudi dnevna periodičnost je zelo pogosta. Potrošnja električ¬ ne energije ali vode, gostota prometa itd. imajo dnevno peri¬ odičnost. Znane so dnevne konice v potrošnji električne ener¬ gije ali vode, konice v lokalnem prometu itd. Bistvo periodični vplivov je v tem, da se na določe¬ no časovno razdovje (npr. leto, mesec, teden, dan) ponavljajo; to izzove na proučevanih pojavih periodično vedno enak učinek. V splošnem periodični vplivi v gospodarstvu niso za¬ želeni. Periodičen značaj dovede ali do zastoja v času sezone ali do neizkoriščenja kapacitet izven sezone, če imamo zadost¬ ne kapacitete za čas maksima. Zato si prizadevamo, da perio¬ dične vplive omilimo, če jih že ne moremo odpraviti. Tipičen primer je nadomeščanje proizvodnje hidro in termo elektrike. Obe se medsebojno dopolnjujeta tako, da čimbolj omilimo sezon¬ ski značaj proizvodnje hidroelektrarn. Periodične vplive mora¬ mo nujno poznati in proučevati, če skušamo njih učinek ublaži¬ ti in odpraviti." Nakazali smo, da je bistvo periodičnih vplivov v tem, da se na določene časovne razmake ponavljajo. Vendar budi ta učinek ni statičen. V daljšem razdobju opažamo spremenljivost 222 sezonskih vplivov. Te spremembe prinesejo bodisi razvoj ali za¬ vestni ukrepi, s katerimi vplivamo na sezonski značaj pojavov. Sna izmed važnih nalog analize časovnih vrst je raz¬ stavljanje časovne vrste na njene osnovne komponente. Tudi za¬ radi tega je važno, da poznamo sezonsko komponento, da jo more¬ mo iz osnovne časovne serije odstraniti. Če is časovne vrste odstranimo trend in sezonske variacije, ostane namreč v časovni vrsti le še ciklična in slučajna komponenta. Sezonsko komponen¬ to moramo zato poznati tudi, če analiziramo ciklična nihanja pojavov. 12.65 Sezonsko oziroma periodično komponento v časovnih vr¬ stah določamo po več metodah. Vsaka izmed njih je pri¬ lagojena posebnostim različnih časovnih vrst. Zato je odločitev o tem, katero izmed metod v posebnem primeru uporabimo, odvisna od dinamike pojava, ki ga časovna vrsta prikazuje. V nadaljeva¬ nju obravnavamo tele metode za določanje sezonske komponente: a) metodo vsot, b) metodo verižnih indeksov, c) metodo kvocientov na trend, d) metodo kvocientov na vrsto drsečih sredin, e) metodo grafičnega približka. Metoda vsot 12.66 Če pojav, za katerega iščemo periodično komponento, ni¬ ma izrazitega trenda niti cikličnih nihanj, moremo s pridom uporabiti metodo vsot. Če trend iz ciklične variacije zanemarimo, je model take časovne vrste Y = A.(l + p+e) (12.38) Pri tem je A = konstanta, p = periodična komponenta, ki se v povprečju ene periode uniči, e = rezultat slučajnih vplivov. Sezonske indekse 1+p dobimo iz take vrste takole: a) Imamo večletno časovno vsto po mesecih. Za vsak me¬ sec izračunamo iz ustreznih mesečnih vrednosti za vsa leta, ki jih imamo v časovni vrsti, vsote S. Tako seštejemo podatke za januarje vseh let v januarsko vsoto, podatke za februarje vseh let v februarsko vsoto. S tem odpravimo slučajne odklone, in je S = KA(1+p) (12.39) b) Iz dobljenih vsot izračunamo povprečje vsot S. Ker se periodična komponenta p v vsoti ene periode uniči, d bimo ( 12 . 40 ) S = KA 223 c) Če mesečne vsote S delimo s povprečno vsoto S, dobimo sezonske indekse S/Š = KA(l+-)/KA = 1+p (12.41) la postopek ne velja samo za sezonska, temveč za vsa periodična nihanja. Za te primere pride se pogosteje v poštev, ker se v urnih ali dnevnih časovnih vrstah trend in ciklični vplivi ne pokažejo, kakor je to primer pri večini mesečnih ča¬ sovnih vrst. 12.67 ^a teden od 19. junija do 21. junija 1958 imamo vrsto o dveurni_porabi vode v Ljubljani, (/ir: Mestni vodo¬ vod - Ljubljana). Po metodi vsot je treba določiti periodo v dnevni porabi vode v tem razdobju. Uporaba te metode je upravi¬ čena, ker se v razdobju šestih dni ne pokažejo niti spremembe trenda niti drugi časovni vplivi, ki bi onemogočali uporabo te metode. Tabela 12.21 Izračunavanje periodične komponente v dnevni porabi vode v Ljubljani v dneh 16.6.- 21.6.1958 po metodi vsot (Vir: Mestni vodovod - Ljubljana) S = 243455/12 = 20288 - 224 ~ Slika 12.14 Periodična komponenta v dnevni porabi vode v Ljubljani za razdobje 16.6.-21.6.1958 225 Vsota periodičnih indeksov mora hiti 1200, ker ima pe¬ rioda 12 členov..Razlika 1 izvira iz zaokroževanja. Iz dnevnih vsot vidimo, da v porabi vode v tem tednu res ni nikakih cikličnih sprememb. V sliki 12.14 imamo razen osnovne časovne vrste porabe vode narisano, še vrsto sezonskih indeksov, v navadnem in polar¬ nem grafikonu. Iz slike periodičnih indeksov vidimo, da je absoluten maksimum porabe vode., od 12* 1 - 14* 1 . Drug relativni maksimum pa opazimo v času od 18 h - 20^. V Metoda kvocientov na trend 12.63 Ce ima pojav, za katerega proučujemo sezonsko varia¬ cijo, izrazit trend, metoda vsot ni uporabna. Če pred¬ postavljamo, da je v tem primeru model časovne vrste Y=T(l+p+e), iz nje trend odstranimo tako, da osnovno časovno vrsto delimo s trendom K = Y/T = 1+p+e. Vrsta kvocientov, ki jo dobimo, je, kakor kaže shema, izraz periodičnih in slučajnih vplivov. Na¬ daljnji postopek je podoben prejšnjemu. Da odstranimo rezultate slučajnih vplivov, poiščemo povprečja kvocientov za vsak mesec tako, da seštejemo kvociente za isti mesec v vseh letih. Iz mesečnih vsot kvocientov izračunamo povprečje. Če mesečne vso¬ te kvocientov delimo s povprečno vsoto, dobimo sezonske indek¬ se 1 + p. Ta metoda je uporabna, 'če v časovni vrsti ni ciklične komponente. To pa je v praksi razmeroma redko. Zato uporablja¬ mo pogosteje metodo kvocientov na časovno vrsto drsečih sredin. Metoda kvocientov na vrsto drsečih sredin 12.69 Splošnejši pomen in uporabo ima metoda, ki je zgornji zelo podobna, le da izračunavamo kvociente, namesto na trend, na drseče sredine. Seveda morajo biti drseče sredine izračuna¬ ne iz dolžine ene periode, da je iz njih odstranjena periodič¬ na komponenta. V ter. primeru menimo-, da je vrsta drsečih sre¬ din t rezultat trenda in cikličnih vplivov. Ta metoda da torej rešitev splošnejšega problema, če je razen trenda T v časovni vrsti še ciklična komponenta C. Model te časovne vrste je Y = T.G.(1 + p + e) (12.42) Če predpostavljamo, da časovna vrsta drsečih sredin predstavlja trend in ciklično komponento, Y = T.C, iz časovne vrste odstranimo trend in ciklična nihanja, če izračunamo kvo¬ ciente med osnovno časovno vrsto in drsečimi sredinami 226 K ri = Y/Y = T.C(1+p+e)/T.C = l+ Pi +e ri (12.4;) Iz tega vidimo, da so ti kvocienti izraz periodičnih vplivov p in slučajnih vplivov e. Po že znanem postopku oči¬ stimo podatke slučajnih vplivov, če izračunamo mesečne pov¬ prečne kvociente = 1+P ± (12.44) Ker običajno zaradi preostalih vplivov povprečje me¬ sečnih povprečnih kvocientov ni 1 oziroma 100, jih popra¬ vimo tako, da povprečne mesečne kvociente Ek delimo z njiho¬ vim povprečjem Ž =IK/12. Tako dobimo prave sezonske indekse Ek/K = l+p ± (12.45) 12.70 Če pogledamo sliko 12.11, v kateri je poleg osnovne vrste indeksov industrije gradbenega materiala v SFRJ vrisana še vrsta drsečih sredin, vidimo, da vrsta drsečih sre¬ din ni samo trend, temveč vsebuje tudi ciklična nihanja. Zato pride pri izračunavanju sezonske komponente za ta primer v po¬ štev metoda kvocientov na vrsto drsečih sredin. Iz tabele 12.5 in iz slike 12.11 vidimo, da se vrsta dvanajstmesečnih drsečih sredin začne pol leta kasneje in kon¬ ča pol leta prej kakor osnovna časovna vrsta. Na teh odsekih seveda ne moremo izračunati kvocientov. V tabeli 12.12 je pri¬ kazan postopek, kako izračunavamo sezonsko komponento po tej metodi. Ta je izračunana po naslednjih stopnjah: 1) Ker smo izračunali vrsto letnih drsečih sredin za indeks gradbenega materiala v SFRJ že v tabeli 12.5, jo upora¬ bimo za izračunavanje sezonske komponente. 2) Iz časovne vrste osnovnih podatkov in vrste drse¬ čih sredin izračunamo vrsto kvocientov K = Y/¥. Kvociente za¬ radi večje nazornosti pomnožimo s 100. Prvi kvocient izraču¬ namo za mesec julij 1951. Indeks gradbenega materiala iz os¬ novnega gradiva za ta mesec je 97, ustrezna vrednost dvanajst¬ mesečne sredine pa 71,1. Kvocient je torej 100.97/71,1 = 136,4. Enako izračunamo vse nadaljnje kvociente. 3) Ker morejo zaradi enkratnih vplivov nastopiti iz¬ redni vplivi, ki motijo regularni potek, za vsak mesec izloči¬ mo minimalni in maksimalni kvocient, na primer: iz januarja 37,1 in 56,2. 4) Iz preostalih kvocientov izračunamo modificirane povprečne mesečne kvociente K. : npr. januar: Ek = 1/4(44,6+ +41,7+55,8+40,6) = 1827/4 = 45,7. - 227 - i 'd aj ra u a i tj *H Ti J> ra o M ra ra Al OJ CD TJ >o £ CD •h ra P O tP -p ra oi P S > i> cj o H -p O -H m o Al o cd !> n Al P •H -P 'd M O •H -P Al ra ra g P o o n p, CD m cd CD -H • 1-3 p a -p cd m > P ra 'd c! rj 3 -p >p P cd P Pl N CD H P CM CM • CM i—| a! i—I CD rO P EH CD O P - CO C"- «■* O co CO i —1 CNJ LPv ir\ «K co co LO CD CO O CD C» CT\ VD LPv LPv «s C— to LO co »s co co to LO •N O D- CM C— «►» CD O CM LO O t —i C^ *. CM CO H w pc CM •» LO CO O- ec CT\ LPv LP> K\ i —I - 3 - C\J LPv i—I C\J ■'d" i—I to LPv co co CD »v C- CD O- •c 1 - 1 LO LO CO LO p- tP CO (O IM a> •ra >o OJ P P< > O p. co co co I—I rp P -P O ra > CD co 00 co CD CO i—I CO p" I—I co LO (H CO p - i—I LO CO I—i co co CO CD CM LO LO CO CD P- •H £P + rH Vsota: 1199, povprečje: 100 228 5) Iz dobljenih mesečnih kvocientov izračunamo pov¬ prečje K. Če bi bili povprečni mesečni kvocienti pravi sezonski indeksi, bi bilo povprečje teh kvocientov enako 100. Izračunano povprečje je v našem primeru E = 99,68. Razlika torej ni velika; zato tudi popravljena vrsta sezonskih indeksov ni bistveno raz¬ lična od nje. 6) Povprečne mesečne kvociente popravimo tako, da jih_delimo s povprečjem povprečnih mesečnih kvocientov K 1+p^ = v*- 7) Vsota sezonskih indeksov, ki jih tako dobimo, je enaka 1199, in torej ni bistveno različna od pričakovane vredno¬ sti 1200. Izračunana vrsta sezonskih indeksov in njihov grafikon pokažeta tipično sliko sezonskega nihanja v industriji gradbene¬ ga materiala. Amplituda tega nihanja je velika, kar je vsekakor negativen pojav. Metoda verižnih indeksov 12.71 Razen omenjenih metod v praksi večkrat uporabljamo še metodo verižnih kvocientov. Ta metoda ima to prednost, da predhodno ni treba izračunavati niti trenda niti vrste drse¬ čih sredin. Metoda verižnih indeksov teoretično predpostavlja, da je trend eksponencialna funkcija tipa T = a.b x . Če to predpo¬ stavljamo, je model časovne vrste Y v = a.b x (1+p+e) A. ( 12 . 46 ) Verižni kvocienti za ta tip časovne vrste so: X/ ab x ( 1+p . +e-, ) h - V Y x-l = ,x-l “ b 1+p. ab ( 1 +p i _l+ e 0 ) l + p, + e (12.47) i-1 Kakor vidimo iz tega obrazca, je od trenda v kvocientu ostal le še parameter b, od periodične komponente pa kvocient dveh zapo¬ rednih sezonskih indeksov. Kakor pri prejšnjih metodah, slučaj¬ ne variacije e' odstranimo, če poiščemo povpfečne mesečne veriž¬ ne indekse 1 + pi 1 + Pi-i b ( 12 . 48 ) - 229 - Zaradi lastnosti kvocientov sezonskih indeksov je geo¬ metrijska sredina povprečnih mesečnih indeksov enaka h. AZ 1+p- '1 1 + Pp Gx = W b — —- . b ^ 1+P 1+p 12 1+p- 1+P n „ 1+ p D 12 10 1+p = h 11 (12.49) S kvocientom povprečnega mesečnega indeksa T. in geo¬ metrijske sredine dohimo čiste kvociente sezonskih indeksov V°i 1+p. ^5-i /b . 1+P i 1+P, i-1 (12.50) Ge dobljene čiste kvociente sezonskih indeksov t, postopoma mno¬ žimo med seboj, dobimo naslednje izraze 1+D-| K 1 “ *1 = I+p K 2 = K i t 2 K- 12 1+P]_ 1+P 12 l+p 2 K 2 t 3 = I+P^J 1+p K 4 = hH = 1+P 3 12 l+p 2 1+Pp 1+P 3 1+P 2 1+ P 4 1+P^ 1+p, 1+Pi 2 1+P 5 !+ p 12 1+ P 4 !+ p 12 (12.51) K 12 “ K ll t 12 1+p 11 1+p 12 1+p 12 1+p 12 1+p 11 1+p 12 Členi vrste kumulativnih produktov K. so, kakor vidimo iz 12.51 sezonski indeksi, deljeni z (1+P 12 ). Ker 3 e zaradi lastnosti sezonskih indeksov povprečje iz K, enako E = l/l+p^ 2 , prave se¬ zonske indekse 1+p^ dobimo 1+p, K i/^ = TTpTT / 1+p 1 '12 ^12 če K, delimo s povprečnim E. = l+p i ( 12 . 52 ) - 230 - 12.72 Časovna vrsta inaeksov industrije gradbenega materiala kaže smer razvoja, ki jo moremo v približku vzeti not eksponencialno. Ker dd metoda verižnih indeksov zadovoljive rezul¬ tate, tudi če trend ni povsem eksponencialen, jo moremo upraviče¬ no uporabiti v našem primeru. V tabeli 12.23 je za primer indeksov industrije gradbe¬ nega materiala SFRJ nakazano, kako izračunavamo sezonske indekse po metodi verižnih indeksov. Sezonsko komponento izračunamo po teh stopnjah: a) Iz vrste osnovnih podatkov izračunamo vrsto veriž¬ nih indeksov I . Verižnega indeksa za januar 1951 ne moremo izra¬ čunati, ker ne poznamo indeksa za december 1950. Prvi verižni in¬ deks is osnovne časovne vrste je izračunan za februar 1951 (100.37/38 = 97,4), drugi za marec 1951 (100.49/37 = 132,4) itd. Verižne indekse za januarje naslednjih let dobimo z deljenjem januarskih vrednosti z decembrskimi vrednostmi prej¬ šnjega leta (npr. I^ an 1952 = 100 *5l/58 = 53,4 itd.) b) Izračunamo povprečja verižnih indeksov za vsake¬ ga izmed 12 mesecev. Za vsak mesec izločimo najmanjšo in največ¬ jo vrednost in izračunamo modificirana povprečja. Pri januarskem povprečju moramo upoštevati, da manjka verižni indeks za januar 1951. Zato vsoto januarskih indeksov (222,8) delimo s štiri, ne pa s pet kakor za druge mesece, za katere imamo dane verižne in¬ dekse za pet let, ko odstranimo skrajne primere. c) Poiščemo geometrijsko sredino G^ povprečnih meseč¬ nih verižnih indeksov 1^ & I =12 y 56,9 . 86,4 . 144,5 ... 74,5 . 84,6 = 101,06 G-j- izračunamo z logaritmi. d) Povprečne mesečne verižne indekse delimo z G-j- = 101,06, da odstranimo parameter b. Tako dobimo kvociente sezon¬ skih indeksov t ± = Tj/Gj. Geometrijska sredina G-j-= 101,06 je vmesni rezultat, ki pove, da je povprečni mesečni koeficient dinamike b = 101,06. e) S postopnim množenjem kvocientov t^ dobimo K^. K, = t, = 56,3; K 2 =K x t 2 = 56,3 . 0.855 = 48,1 ... itd. Kontrola: K-^ = 100,0. f) Izračunamo povprečje iz K^. Z = j|(56,3 + 48,1 + ... + 119,5 + 100,0) = = 150|ol = 125,5 Tabela 12.23 Izračunavanje sezonskih indeksov za časovno vrsto indeksov Industrije gradbenega materiala po metodi verižnih indeksov a) Osnovni podatki - 231 - •H CQ M N •H P O) > O 00 cn cn C\J tn Ln rH i—I tn O I —I m tn ai -P o ra > •H Ph •P -H -H H- M -P M rH - 232 - g) Posamezne delimo z dobljenim povprečjem Z = = 125,5, kvociente pa pomnožimo s 100. Tako dobimo čiste sezon¬ ske indekse. Za januar je npr. 1+p i ° 100 ifftf = 45 Kontrola: Vsota sezonskih indeksov je enaka 1200. V našem prime¬ ru dobimo vsoto enako 1201. Razlika izvira iz razokroževanja. 12.73 Primerjava sezonskih indeksov za industrijo gradbenega materiala, ki smo jih izračunali po obeh metodah, ne kaže velikih razlik in sta obe metodi pokazali tipično obliko se¬ zonskega značaja te dejavnosti. Primerjava je lepo vidna iz slike 12.15. Slika 12.15 Sezonski indeksi industrije gradbenega materiala v SFRJ v razdobju 1951-1957 Metoda grafičnega približka 12.74 Dosti dober približek sezonskih indeksov dobimo z raz¬ meroma majhnim trudom tudi grafično, Metoda po svojem bistvu ni različna od metode kvocientov na vrsto drsečih sredin, le da ves posel opravimo grafično. Sezonske indekse določimo po naslednjih točkah: 233 a) Na pollogaritmičen papir nanašamo v razmeroma veli¬ kem merilu vrsto osnovnih mesečnih podatkov. h) Izračunano letna povprečja in jih vrišemo v zgornji grafikon v sredine ustreznih let. c) Skozi točke povprečij prostoročno narišemo krivuljo, tako da najbolje ponazarja skupno črto trenda in ciklov. Povpreč¬ ja uporabimo pri tem kot oporne točke. d) Na list praznega papirja narišemo pravokotno na rob Črto izhodišča z vrednostjo 100. Ta papir uporabimo za črtanje odklonov Y od črte trenda in cikla. Rob papirja naravnamo tako, da izhodišče (100) lezi na včrtani črti trenda in cikla za janu¬ ar prvega leta. S črtico naznačimo odklon stvarne vrednosti od trenda. Na istem robu ponovimo ta postopek za januarje za vsa druga leta. f) Ko s črticami naznačimo odklone za januarje za vsa letr, prečrtamo črtici za najmanjši in najveoii odklon. Za druge črtice pa na oko ocenimo težišče. Težišče zaznamujemo na pasu ta¬ ko, da se loči od individualnih odklonov. Težišče moremo kontro¬ lirati in popraviti. Praviloma je vsota negativnih in pozitivnih odklonov od težišča enaka 0. Dobljeno težišče je modificirana geometrijska sredina odklonov od trenda in je nepopravljeni se¬ zonski indeks za januar. g) Ko dobimo nepopravljeni sezonski indeks za .januar, papir preganemo pravokotno na izhodiščno linijo in ob novem robu ponovimo postopek za februar. Enako določimo nepopravljene sezonske indekse tudi za vse druge mesece. h) Če razgrnemo naguban papir, pomenijo črtice, s kate¬ rimi smo označili težišča za posamezne mesece, logaritme nepo¬ pravljenih sezonskih indeksov. Z logaritemski odstotno skalo šte¬ vilčno odberemo vrednosti nepopravljenih sezonskih indeksov. i) Če je vsota nepopravljenih sezonskih indeksov pri¬ bližno 1200 (različna za manj kot šest), dobljene sezonske inde¬ kse ne popravljamo dalje. Če pa je vsota nepopravljenih sezonskih indeksov od 1200 različna za več kot 6, izračunamo kvocient med vsoto nepo¬ pravljenih sezonskih indeksov in 1200. To razmerje zaznamujemo na nagubanem papirju, na katerem smo včrtali individualne odklone. Novo izhodiščno črto 100 načrtamo iz tega novega nivoja. j) S logaritemsko odstotno skalo odberemo od nove iz¬ hodiščne črte popravljene sezonske indekse. - 234 - CIKLIČNA NIHANJA 12.75 Razen trenda in periodičnih komponent opazimo na nek - terih časovnih vrstah še ciklična nihanja. Ciklični vplivi imajo za rezultat, da pojav niha okrog trenda. Ciklična nihanja so povsem različna od sezonskega ali na splošno perio¬ dičnega nihanja. Za razliko od njih se .ciklična nihanja ne po¬ javljajo niti po dolžini niti po obliki in amplitudah tako pra¬ vilno kakor sezonska oziroma v splošnem periodična nihanja. Proučevanje ciklov je v ekonomiji zelo važno iz več razlogov. Poznavanje ciklov za določene gospodarske panoge ozi¬ roma elemente pokaže, koliko je določen ekonomski pojav občut¬ ljiv za splošne ciklične vplive. Ciklična gibanja je potrebno upoštevati tudi pri napovedovanju in planiranju za posamezne gospodarske aktivnosti. Če poznamo ciklična nihanja v preteklo¬ sti, jih moremo prenesti po analogiji v prihodnost. Naloga statistike je, da d£ ekonomistu metode, s kate¬ rimi more iz osnovne časovne vrste izluščiti ciklična nihanja in ugotoviti njihove značilnosti. Od teh metod bomo nakazali le eno - reziduaino metodo, po kateri z enostavnimi sredstvi izluščimo iz osnovne časovne vrste ciklično komponento, ki je osnova za proučevanje ciklov. Če vzamemo, da je časovna vrsta rezultat vseh vrst vplivov: trenda T, sezonskih vplivov P, cikličnih vplivov C.in slučajnih vplivov S, upoštevamo, da so navadno te komponente vezane po modelu Y = T . C . P . S, iz osnovne časovne vrste od¬ stranimo vpliv trenda in sezonske komponente, če podatke osnov¬ ne časovne vrste delimo z ustreznimi vrednostmi trenda in se¬ zonskimi indeksi. Tako dobimo, da je Y/TP = C . S (12.49) Ti kvocienti vsebujejo samo še ciklične in slučajne vplive. Rezultate slučajnih vplivov odstranimo, če izračunamo iz dobljenih kvocientov časovno vrsto drsečih sredin, ker se rezultati slučajnih vplivov v povprečju uničijo oziroma omili¬ jo. Običajno izračunavamo povprečja iz ne prevelikega števila členov, da povprečja ne izravnavajo še ciklične komponente. 12.76 Ciklično komponento v časovni vrsti določimo po rezi- dualni metodi v naslednjih stopnjah: a) Za časovno vrsto, ki jo proučujemo, poiščemo ča¬ sovno vrsto trenda. b) Razen tega moramo zanjo poznati sezonske indekse. c) Posamezne člene osnovne časovne vrste Y delimo z ustreznimi vrednostmi trenda T in sezonskim indeksom P. d) Časovno vrsto kvocientov očistimo slučajnih vplivov tako, da iz njih izračunamo časovno vrsto drsečih sredin. Časov' - 235 - ne vrste drsečih sredin zabrišejo oziroma izravnajo ciklična nihanja, če izračunamo sredine za predolga razdobja. Zato so primerna povprečja in neprevelikega števila členov. Zelo pri¬ merne so trimesečne ponderirane sredine, pri katerih vzamemo za pondere binomske koeficiente (1, 2, 1). e) Ko smo tako izluščili iz osnovne časovne vrste ci¬ klično komponento, opisujemo cikle z različnimi parametri: iz¬ računavamo povprečno dolžino cikla, povprečno amplitudo in povprečja za posamezne karakteristične dele ciklov. Razlike v dolžinah, amplitudah in drugih značilnostih ciklov opisujemo s povprečnimi absolutnimi odkloni.AD za posamezno značilnost cikla. Povprečni absolutni odkloni so za proučevanje ciklov primernejše merilo variacije kakor standardni odklon SD. 12.77 Dostikrat moramo pri analizi ciklov primerjati značil¬ nosti cikličnih nihanj, za različne raznovrstne pojave. Ciklična nihanja za raznovrstne pojave zelo dobro primerjamo, če ciklično komponento izražamo v standardiziranih z-odklonih. Te dobimo tako, da individualne odklone zaradi cikličnih ni¬ hanj reduciramo s standardnim odklonom SD . Tako dobimo za vsak posamezen pojav ciklično komponento izraženo v standar¬ diziranih z-odklonih z = C/SD (12.50) c c Statistične vrste standardiziranih cikličnih nihanj so dobro primerljive med seboj, ker so neimenovana števila in jih moremo zato primerjati za različne pojave med seboj. Razen te¬ ga pa z njimi reduciramo na enotno variabilnost ciklična niha¬ nja vseh pojavov, tako da so ciklična nihanja med seboj primer¬ ljiva. V podrobnejšo in konkretnejšo problematiko merjenja ci¬ klov se ne bomo spuščali. f - 236 - TRINAJSTO POGLAVJE KORELACIJA 13.1 V prejšnjih poglavjih smo proučevali posamezne znake samostojno, hrez zveze z drugimi znaki populacije. Te metode analize statističnih podatkov zelo podrobno obravnavajo značilnosti za posamezne znake. Vendar obsegajo samo del anali¬ ze statističnih podatkov. Ne zajamejo namreč enega izmed najva¬ žnejših problemov v analizi socialnoekonomskih pojavov in mno¬ žičnih pojavov na sploh, to je njihovo medsebojno odvisnost in povezanost. Pri proučevanju socialnoekonomskih pojavov zelo ce¬ sto naletimo na problem povezanosti in odvisnosti med pojavi. Obseg proizvodnje kmetijskega obrata je odvisen od velikosti obrata, strukture osnovnih sredstev, delovne sile, klimatskih faktorjev itd. Vrednost proizvodnje industrijskega obrata je od¬ visna od števila delavstva, mehanizacije, produktivnosti dela, vrste proizvodnje itd. Cena je odvisna od količine blaga, ki je na trgu, plača od kvalifikacije, službene dobe itd. V medseboj¬ ni povezavi sta tudi nepismenost moških in nepismenost žensk po občinah, starost ženina in neveste itd. Podobnih primerov more¬ mo našteti veliko. Vendar niso vsi pojavi med seboj povezani, čeprav bi po vsebini mogli odvisnost pričakovati. Imamo tudi primere nesmiselne povezave. Nesmiselno je npr. proučevati od¬ visnost med številom porok in množino padavin po letih, cene kmetijskih pridelkov od obolelosti za tuberkulozo itd. FUNKCIJSKE ODVISNOSTI 13.2 0 funkcijski odvisnosti med x in y v matematičnem smi¬ slu govorimo, če je dano neko pravilo zveze med neod¬ visno spremenljivko x In odvisno spremenljivko y, po katerem določeni vrednosti neodvisne spremenljivke x ustreza ena ali več natančno določenih vrednosti odvisne spremenljivke y. S simbolom pišemo: y - f(x) (13.1) in pravimo: y je funkcija od x. Funkcijska zveza med y in i je običajno nakazana z enačbo funkcije, iz katere moremo za vsak x izračunati ustrez¬ no vrednost y. Tako je npr. za funkcijo y - 2x + 3x‘ ? ' (13.2) 2 x * 2 ustrezna vrednost y * 2.2 + 3.2 « 16. 4 4 2 Slika 13.1 Slika funkcijske odvisnosti y=2x+3x Razen z obrazcem moremo funkcijsko vrednost med x in y nakaza¬ ti tudi z nizom dvojic ustreznih vrednosti x in y. Tako je v ta¬ beli 13.1 dana funkcijska zveza iz zgornje enačbe za osem parov vrednosti x in y Tabela 13.1 S sistemom dvojic pa ne moremo podati funkcijske zveze med x in y za vse,vrednosti x. To moremo prikazati edino z enač¬ bo med x in y. Niz dvojic vrednosti x in y moremo prikazati tudi gra¬ fično v pravokotnem koordinatnem sistemu. Posamezno dvojico 238 - vrednosti x,y po znanem načinu prikažemo s točko v pravokotnem koordinatnem sistemu. Kolikor dvojic ustreznih vrednosti x in y imamo, toliko imamo točk v koordinatnem sistemu. Medtem ko mo¬ remo niz dvojic vrednosti grafično prikazati s sistemom točk, prikažemo funkcijo, dano z obrazcem, s krivuljo. Grafično vsaki vrednosti x v določenem razmaku ustreza funkcijska vrednost y. Slika niza dvojic iz tabele 13.1 je prikazana v sliki 13.la, funkcijska slika odvisnosti iz obrazca 13.2 pa v sliki 13.Ib. Funkcijske odvisnosti moremo torej prikazati na tri načine: a) z enačbo: y = f(x), b) v tabeli z nizom ustreznih vrednosti x in y, c) grafično s sistemom točk ali s krivuljo v pravokotnem koor¬ dinatnem sistemu. KORELACIJSKE ODVISNOSTI 13.3 Če prenesemo pojem funkcijske odvisnosti na množične pojave, bi imela v primeru funkcijske odvisnosti med površino in proizvodnjo kmetijskega gospodarstva vsa gospodar¬ stva z enako površino enako proizvodnjo. Vendar to ni tako. Če¬ prav sta površina gospodarstva in proizvodnja med seboj odvisni, imata^gospodarstvi z enakima površinama le redko enako proizvod¬ njo. Še več, Čeprav sodimo, da ima večje gospodarstvo večjo pro¬ izvodnjo, velja ta odvisnost samo na splošno, v posameznih pri¬ merih pa more imeti tudi večje gospodarstvo manjšo proizvodnjo. Do tega pride zato, ker proizvodnja ni odvisna samo od površi¬ ne, temveč še od mnogo drugih faktorjev. Poizkus, da bi odstra¬ nili vse dodatne faktorje in tako prišli do funkcijske povezave med dvema znakoma, se ne bi posrečil. Vedno ostanejo neki fak¬ torji, katerih vpliv ne moremo odstraniti in jih štejemo med slučajne faktorje. Pri množičnih pojavih moremo torej opazova¬ ti le splošno tendenco odvisnosti, v posameznih primerih pa za¬ konitost zaradi delovanja dodatnih-individualnih vplivov ni nujna. Zato imenujemo'za razliko od funkcijskih te vrste odvis¬ nosti korelaciiške odvisnosti . Proučevanje korelaoijskih odvi snosti je različno od proučevanja funkcijskih odvisnosti , čeprav imata obe” vrsti pro¬ učevanja svoje stične točke. Prikazovanje korelacijskih odvisnosti Korelacijske odvisnosti prikazujemo na enake tri nači¬ ne kakor funkcijske odvisnosti: a) v tabeli z nizom dvojic vrednosti koreliranih podat¬ kov za vsako enoto populacije ali v korelacijski tabeli, b) s točkami v korelacijskem grafikonu, c) v funkcijski obliki z regresijsko funkcijo ali črto. 13.4 Niz dvojic podatkov. Z nizom dvojic vrednosti korelira¬ nih podatkov na splošno prikazujemo osnovne podatke pri proučevanju korelacije med pojavi. Čeprav je ta način nepregle¬ den in iz njega še ne dobimo vtisa o zakonitosti povezave med dvema pojavoma, ga na splošno uporabljamo, ker je osnova za vsa nadaljnja proučevanja. Ker je vir podatkov o množičnih pojavih populacija} po¬ samezna dvojica koreliranih podatkov velja za posamezne enote proučevane populacije. V tabeli 13.2 so prikazani osnovni podatki za proučeva¬ nje korelacije med številom delavcev in številom opravljenih de¬ lovnih ur za 19 industrijskih podjetij obutvene industrije. Tabela 13.2 Število delavcev (x) in število opravljenih de¬ lovnih ur (v tisočih) (y) v decembru 1952 za 19 industrijskih podjetij z manj kot 200 delavcev za obutveno industrijo v SRS (Vir: Mesečna sta¬ tistična služba v industriji SRS) V tabeli 13.3 so prikazani dohodki in stroški za kultu¬ rno in družbeno življenje za 36 delavskih družin v Mariboru v no¬ vembru 1957. Tabela 13.3 Dohodki v tisočih'dinarjev (x) in stroški za kul¬ turno in družbeno življenje v dinarjih (y) za 36 delavskih družin v Mariboru v novembru 1957 (Vir: Anketa o življenju delavcev in nameščene ZS SRS) - 240 - V tabeli 13.4 so podatki o odstotkih travniških in paš- niških površin za okraje v SRS po stanju leta 1952. Tabela 13.4 Odstotki travniških in pašniških površin po okrajih v SRS po stanju leta 1952. (Vir: Statistični bolten SRS) 13.5 Iz zgornjih treh primerov moremo sklepati še na določe¬ no vsebinsko razliko med korelacijami. V prvih dveh primerih je jasno, da je število opravljenih delovnih ur odvisno od števila delavcev, stroški za kulturne in družbene potrebe pa od dohodkov, ne pa obratno. To so vzr-ohna- -po ve za ve jo zi ro m a -odvi¬ snosti, ker ,ie en znak vzrok, drugi pa posle dica. Vzročne pove¬ zave pa ne zasledimo v tretjem primeru, ker ne moremo reči, da je visok odstotek travniških površin vzrok za nizek odstotek - 241 pašniških površin ali obratno. Kljub temu, da med njima ni vzroč¬ ne odvisnosti, pa sta ta dva podatka med seboj povezana, ker na oba vplivajo isti pojavi, ki imajo v našem primeru za posledico, da je travnikov mnogo, pašnikov pa malo in obratno. Dva taka od¬ ločilna skupna faktorja sta npr. nadmorska višina in vrsta tal. Na podobno nevzročno čisto korelacijsko povezavo tudi naletimo, če proučujemo korelacijo med odstotkom nepismenih žensk in moških po okrajih. Čeprav med njima ni vzročne povezanosti, sta med seboj v korelaciji, ker na oba deluje isti kompleks fak¬ torjev, od katerih je odvisna nepismenost. To so npr. število šol v okraju, kulturnoprosvetna dejavnost v preteklosti itd. Tudi korelacija med starostjo moža in žene ob razvezi zakona iz tabele 13.5 je primer čiste korelacijske povezave. Medtem ko pri vzročnih odvisnostih po pravilu iščemo sa¬ mo odvisnost posledice od vzroka, moremo pri čistih korelacijskih odvisnostih iskati odvisnost znaka x od y in obratno odvisnost znaka y od x. 13.6 Korelacijska tabela. Že pri majhnem številu enot je prikazovanje koreliranih podatkov v zgornji obliki zelo obširno in nepregledno. Zato za večje populacije prikazujemo ko- ! relirane podatke v kombinacijski tabeli, ki jo imenujemo korela¬ cijska tabela. Kakor dobimo frekvenčno distribucijo, če podatke uredimo v razrede po enem znaku, dobimo korelacijsko tabelo, če podatke uredimo v razrede po obeh koreliranih znakih hkrati. Po¬ ložaj frekvenc v korelacijski tabeli zelo nazorno pokaže smer po¬ vezave med koreliranima znakoma. Kot primer je v tabeli 13.5 prikazana korelacijska ta¬ bela o razvezanih zakonih po starosti zakoncev za zakone, razve¬ zane v letu 1955 v SR Sloveniji. Tabela 13.5 Korelacijska tabela o razvezanih zakonih po starosti zakoncev za zakone, razvezane v le¬ tu 1955 v Sloveniji (Vir: Vitalna statistika za 1955) - 242 Podatki v tabeli pomenijo frekvence, tj. število razve¬ zanih zakonov, v katerih je bila starost moža in žene v ustreznih razredih, npr. v 91 razvezanih zakonih je bila starost moža ob razvezi med 30-34 let, starost žene pa med 25-29 let. Iz korelacijske tabele nazorno vidimo, da je med staro¬ stjo moža in žene ob razvezi korelacijska odvisnost, ker se frek¬ vence za starost moža premikajo v smeri od leve na desno, če se veča starost žene. Enako je korelacijska tabela tudi tabela 5.10, ki za 2236 kmetijskih gospodarstev, ki so bila anketirana v SFRJ, pri¬ kazuje odvisnost med skupno površino gospodarstev in denarnimi dohodki od gospodarstva v letu 1956. 13.7 Korelacijski grafikon. Nazorno prikažemo korelacijo med dvema znakoma v korelacijskem grafikonu. V njem je vsak dvojica vrednosti prikazana s točko v pravokotnem koordinat¬ nem sistemu, v katerem je na abscisi skala za znak x, na ordinati pa skala za aiak y. V korelacijskem grafikonu je torej toliko točk, kolikor je enot populacije. Ker s pogledom zajemamo vse točke hkra- Slika 13.2 Korelacijski grafikon med številandelav¬ cev in številom opravljenih delovnih ur za 19 podjetij obutvene industrije v le¬ tu 1952 243 ti, je korelacija med dvema znakoma v korelacijskem grafikoni vidna neposredno. V slikah 13.2, 13.3 in 13.4 so prikazani korelacijski grafikoni podatkov iz tabel 13,2, 13.3 in 13.4. Regresijska krivulja 13.8 Slike 13.2, 13.3 in 13.4 so zelo poučne in pokažejo bistvo korelacijskih odvisnosti. Kakor smo že nakaza¬ li, med socialnoekonomskimi pojavi ni funkcijske zveze, ker po¬ javi niso nikdar odvisni samo od enega znaka, temveč vplivajo nanj vedno najrazličnejši individualni vplivi, ki motijo oziro¬ ma zabrišejo zvezo med dvema pojavoma. Iz slike 13.2, ki prika¬ zuje korelacijo med številom delavcev in številom opravljenih delovnih ur v decembru 1952 za 19 industrijskih podjetij obut¬ vene industrije v SRS, sklepamo, da je odvisnost števila oprav¬ ljenih delovnih ur od števila delavcev velika, ker se točke ze¬ lo določno goste okrog neke črte, s katero bi mogli prikazati odvisnost števila opravljenih delovnih ur od števila delavcev. IrL_£rto, ki gre med vr isanimi-honkami-^—hzmen u .i emo regresi .iško krivuljo. Regresij sk a. kri - v udrja pokaže, kakšna bi bil a zveza .med koreliranima znakoma, če ne bi bilo individualnih'vplivov. V tem primeru bi bile točke za vse enote na regresijski krivulji. Odvisnost med pojavoma bi bila funkcijska. Zaradi individualnih vplivov pa se točke bolj ali mani odklanjajo od idealne regresij ske krivulje. Korelacijsko odvisnost moremo torej pisati z ob¬ razcem y = f(x) + e (13.3) Pri tem pomeni: f(x) = funkcijska oblika regresijske krivulje, ej> rezultat individualnih vplivov, ki more biti pozitiven ali negativen. Za konkretno enoto moremo vrednost y 1 razstaviti v dva dela: y 1 = f(x 1 ) + e 1 ; f(x 1 ) je del, ki izvira iz povezano¬ sti med y in x, e^ pa je rezultat individualnih vplivov na kon¬ kretni enoti. Čim večji so individualni vplivi e, tem večji so odkloni točk in tem bolj je zabrisana regresijska krivulja. To nazorno vidimo, če primerjamo sliko 13.2 s sliko 13.3. Regre¬ sijska krivulja je v prvem primeru dobro vidna, ker so indivi¬ dualni odkloni od regresijske krivulje v primeru odvisnosti šte- vila opravljenih delovnih ur od števila delavcev majhni. Regre¬ sijska krivulja pri korelaciji stroškov za kulturno in družbe¬ no življenje pa je manj vidna, ker so v tem primeru individual¬ ni vplivi zelo veliki. Iz tega sklepamo, da je v prvem primeru korelacijska odvisnost večja kakor v drugem. Korelacijska odvi¬ snost more torej biti večja ali manjša. Največja je v ekstrem¬ nem primeru funkcijske odvisnosti (e =0), najmanjša v primeru neodvisnosti (f(x) = C), Če sta dva pojava neodvisna, na kore- - 244 - Slika 13.3 Korelacijski grafikon med dohodki in izdatki za kulturno in družbeno življenje za 36 delavskih družin v Mariboru v novembru 1957 % travnikom Slika 13.4 Korelacijski grafikon med odstotkom travnikov in odstotkom pašnikov za okraje v SRSv letu 1952 lacijskem grafikonu ne moremo začrtati črte, za katero bi mogli reči, da je regresijska črta. Takrat se točke brez reda goste o- krog točke, ki ima za koordinati arimetični sredini koreliranih znakov. V prvih dveh zgornjih primerih opazimo, da je smer re- gnesijske krivulje taka, da se ve ča v rednos t enega znaka, če se v eča vrednost drugega^. Takim vrstam povezav pravimo cbozitivne^po- kezavn. Č? pa se z ^fecaSrjejz. ;eneaa zna ka vrednost v iTUT^ga dn anT&a^ Pa pravimo, da je povezava negativna .^Negativna povezanost je med odstotkoma travniške in pašhiške površine po okrajih, prikazana v sliki 13.4. Iz gostitve točk moremo sklepati, da je za okraje z Večjim odstotkom travnikov odstotek pašnikov v splošnem manjši in obratno. Iz slike o odvisnosti števila opravljenih delovnih ur od števila delavcev vidimo, da je črta, ki ponazarja regresijsko krivulj o, premica, v obeh drugih primerih pa Ipzivnlj^. V prvem primeru govorimo o 2i ~ i neam i povezavi. , v obeh drugih pa o kri- izavi med dvema pojavoma. Metode določanja regresijskih krivulj 13.9 Eden izmed osnovnih problemov regresijske in korelacij- ske analize je določitev regresijske krivulje. Določamo jo v splošnem po treh metodah: a) prostoročno, b) z grupnimi sredinami, c) analitično. 13.10 Prostoročno določanje regresijske krivulje. Iz slik 13.2, 13*3 in 13.4 vidimo, da je smer regresijske kri- vilje bolj ali manj vidna že iz korelacijskega grafikona. Zato moremo pri nekaterih slabše, pri drugih pa bolje včrtati regre- sijsko krivuljo na oko. Za regresijsko krivuljo, imamo krivuljo, ki jo včrtamo med točke tako, da se meglici točk najbolje prile¬ ga. Seveda ne sme biti vrisana črta preveč komplicirana, marveč Čimbolj izglajena. V naših primerih regresijsko krivuljo najlaže včrtamo za pojava, prikazana v sliki 13.2, za katera je povezava največja. Zato je regresijska krivulja najbolj vidna. Težja je odločitev v drugih dveh primerih. Metoda prostoročnega včrtovanja regresijskih črt je prikladna, ker je izredno preprosta. Ima pa to napako, da je sub¬ jektivna. 'Uporabljamo jo običajno v prvi stopnji študija regresi¬ je kot osnovo za druge metode. V dosti primerih pa je kljub sub¬ jektivnosti ravno zaradi svoje hitrosti v primerjavi z drugimi metodami zelo koristna. - 246 - 13.11 Metoda grupnih sredin. Če izhajamo iz obrazca y = f(x) + e, (13.4) moremo za določanje regresijske krivulje s pridom uporabiti grup- ne sredine. Če za enote, ki imajo iste ali ne preveč različne vrednosti x, izračunamo povprečje iz vrednosti y, dobimo Ker je namreč x konstanten, je konstantna tudi vrednost f(x), povprečje konstante pa konstanta. Po znanih stavkih o sredinah pa se v povprečju vpliv individualnih ali slučajnih faktorjev sicer ne uniči, omili se pa vsekakor. Z vrsto povprečij po gru¬ pah x dobimo tako niz točk, ki^so vsaj v bližini regresijske krivulje, če že niso na njej. Če te točke vrišemo v korelacij- ski grafikon in zvežemo z daljicami, dobimo lomljeno črto; ta je zelo dober približek poteka regresijske krivulje. Po metodi grupnih sredin določamo regresijsko krivuljo torej takole: a) Dvojice vrednosti x, y grupiramo v razrede po vrednostih x. G-rupe morajo biti take, da število enot v njih ni niti preveliko niti premajhno. b) Za vsako grupo izračunamo aritmetični sredini za vrednosti x in y. c) V korelacijskem grafikonu narišemo točke, ki imajo kot koordinati ustrezne grupne aritmetične sredine za x in y (x. , y, ). Tako imamo v grafikonu toliko točk, ki leže na regre¬ si jski krivulji ali v njeni bližini, kolikor imamo grup. d) Vrisane točke grupnih sredin med seboj zvežemo z daljicami. Lomljena črta, ki jo dobimo, je približno regresijska krivulja. 13.12 Po tej metodi določimo regresijsko krivuljo za odvis¬ nost stroškov za kulturno in družbeno življenje za 36 delavskih gospodinjstev v Mariboru. Podatki so vzeti iz tabele 13.3. y = f (x) + e ~ f(x) (13.5) Tako dobimo vrsto dvojic grupnih aritmetičnih sredin - 247 - Tabela 13.6 Dohodki in Izdatki za kulturno in družbeno življenje iz tabele 13.3, grupirani po vi¬ šini dohodkov. (x = dohodki v tisočih dinarjev); (y = izdatki v dinarjih) x in y. Ker je med dohodki in stroški vzročna zveza, vzemimo dohodke za neodvisno spremenljivko (x), stroške pa za odvisno spremenljivko (y). Po analizi podatkov glede na velikost dohod¬ kov vzamemo razrede dohodkov po 5000din in po njih razdelimo dvojice vrednosti x in y. Tako grupirani podatki so navedeni v tabeli 13.6. Tabela 13.7 G-rupne sredine za dohoake in izdatke za kul¬ turno in družbeno življenje za 36 delavskih družin v Mariboru iz tabele 13.6 - 248 - Slika 13.5 Regresijska črta med dohodki in izdatki za kulturno in družbeno življenje za 36 delav¬ skih družin v Mariboru v novembru 1957 Če grupne sredine vnesemo v korelacijski grafikon, do¬ bimo sliko 13.5. Iz slike vidimo, da se dobljena regresijska čr¬ ta resnično prilagaja osnovnim vrednostim in da ponazarja smer odvisnosti med dohodki in stroški za kulturno in družbeno življe¬ nje. 13.13 Po metodi grupnih sredin moremo določiti regresijsko črto tudi, če so podatki grupirani v korelacijski ta¬ beli. Grupne sredine v tem primeru izračunamo po katerikoli iz¬ med metod za izračunavanje sredin iz frekvenčnih distribucij. Te grupne sredine včrtamo nad sredine razrednih razmakov. Za korelacijo med starostjo moža in starostjo žene ob razvezi zakona iz tabele 13.5 je smiselno izračunati obe regre- sijski seriji sredin, ker zveza med starostima ni vzročna. Ker so v korelacijski tabeli podatki že grupirani, grupiranje odpade. Če najprej izračunamo povprečja za starost žene ob raz¬ vezi zakona za posamezne starostne grupe moža, dobimo vrsto sre¬ din za regresijsko črto, ki naj pokaže odvisnost starosti žene od starosti moža. Za prvo starostno grupo moža (20-24 let) izračuna¬ mo povprečno starost žene iz prve navpične frekvenčne distribuci¬ je (frekvence te distribucije so po vrsti: 2, 48, 15, 5, 1, 1). - 249 - Za njo dobimo, da je povprečna starost žen, ki se razvežejo in so njihovi možje stari od 20-24 let ali povprečno 22,5 let, ena¬ ka y 1 = 24,6 let. Če izračunamo povprečje iz analognih frekvenčnih dis- stribucij še za druge grupe starosti moža, dobimo vrsto povpreč¬ nih starosti žena, ki je prikazana v tabeli 15.8a. Tabela 13.8a Povprečne starosti žena ob razvezi zakona po petletnih grupah starosti moža ob raz¬ vezi v SR Sloveniji v letu 1955 Če hočemo podobno izračunati povprečne starosti moža za posamezne grupe starosti žena, moramo izračunati grupne sredi¬ ne iz vodoravnih frekvenčnih distribucij. Za prvo starostno sku¬ pino 15-19 let za žene ima vodoravna frekvenčna distribucija te¬ le frekvence: 2, 2, 2. Iz te frekvenčne distribucije izračunana aritmetična sredina je x^ = 27,5 let. Če iz ustreznih vodoravnih frekvenčnih distribucij iz¬ računamo še druge sredino, dobimo vrsto povprečnih starosti moža za posamezne grupe starosti žena. Ta vrsta sredin pokaže odvis¬ nost starosti mož od starosti žena. Tabela 13.8b Povprečne starosti mož ob razvezi zakona po petletnih grupah starosti žene ob raz¬ vezi zakona v SR Sloveniji v letu 1955 250 - Zgornji vrsti, narisani v sliki 13.6, sta zelo ilustra¬ tivni. V grafikonu je vrisana tudi premica pod kotom 45°, ki kaže enako starost žene in moža. Regresijska črta odvisnosti starosti žene od starosti moža pokaže, da je povprečna starost žen ob raz¬ vezi zakona, razen v razredu 20-24 let, manjša od povprečne sta¬ rosti moža in da se ta razlika s starostjo moža veča. Povprečna starost mož ob razvezi pa je do starostne grupe 40-44 let za že¬ ne večja, po tej starosti pa je za malenkost manjša od starosti žene. Iz slike vidimo, da ima dve regresijski črti, ki se v gra¬ fikonu po pravilu križata. Ker je populacija velika, je potek približka regresijskih črt zadosti umirjen in dobro ponazarja regresijsko krivuljo. Slika 13.6 Regresi jski črti grupnih. sredin za starost moža in žene ob razvezi zakona v letu 1955 v SR Sloveniji 13.14 Analitična metoda. Regresijsko krivuljo moremo določi¬ ti tudi analitično. Če se po analizi podatkov odločimo da je določen tip funkcije y'= f(x; a, b, c ...), (13.6) ki ima več parametrov (a, b, c,,,), primeren za ragresijsko kri¬ vuljo, je treba ustrezno podatkom, ki jih proučujemo, poiskati vrednosti parametrov a, b, c... tako, da se regresijska krivulja danim vrednostim najbolj prilega. Kot merilo boljše ali slabše prilagojenosti krivulje vzamemo vsoto kvadratov odklonov stvar¬ nih vrednosti y od y' na regresijski krivulji X(y - y') 2 = F(a, b, c...) (13.7) Za regresijsko krivuljo imamo izmed vseh krivulj iste¬ ga tipa tisto, za katero je vsota kvadratov odklonov stvarnih vrednosti y od vrednosti y' na regresijski krivulji, P(a, b, c,, najmanjša. Po tej metodi, ki jo imenujemo metodo najmanjših kva¬ dratov, moremo določiti vrednosti parametrov za regresijsko kri- viljo in tako regresijsko krivuljo samo. Kadar ugotavljamo re¬ gresijsko krivuljo analitično, uporabljamo najpogosteje metodo najmanjših kvadratov. Indeks korelacije 13.15 če vzamemo, da je y kvantitativen izraz delovanja vseh faktorjev, ki vplivajo na določen pojav, moremo vse faktorje razdeliti v tri grupe: a) na splošne vplive, ki so za vse enote isti; b) na faktor x, s katerim je y v korelaciji; c) na ostale individualne vplive skupno s slučajnimi. Tako je na primer plača uslužbencev odvisna od: a) splošnih vplivov: kategorije uslužbencev, časa, za katerega pla¬ ča velja itd.; b) let službe, s katerimi je plača v korelacijski zvezi; c) drugih individualnih vplivov, kot so: vestnost pri de¬ lu, šolska izobrazba, delovno mesto itd. Prav tako je na primer proizvodnja kmetijskega obrata odvisna od: a) splošnih faktorjev: klimatskih pogojev, speciali¬ ziranosti itd,; b) velikosti gospodarstva, s katero je proizvod¬ nja v korelacijski povezanosti in c) od drugih individualnih fak torjev, ki vplivajo na proizvodnjo, kot so: razlike tal, različ¬ na produktivnost dela, različno seme itd. Če poznamo aritmetično sredino y in regresijsko krivu¬ ljo y' med x in y, moremo celotno vrednost y za posamezno enoto razdeliti na te tri komponente, od katerih vsaka prikazuje re¬ zultat vplivov po zgornjih treh skupinah. y je rezultat vseh faktorjev, ki vplivajo na pojav: splošnih, koreliranega in drugih individualnih;_y' je rezultat splošnih faktorjev in koreliranega faktorja x; y pa je rezultat samo splošnih faktorjev, zato moremo pisati y = y + (y'- y) + (y - y') (13.8) Pri tem pomeni: y = rezultat splošnih vplivov; (y-y) = = rezultat vpliva koreliranega znaka x; (y-y') = rezultat vpliva drugih individualnih faktorjev. Tako smo uspeli razdeliti celotno vrednost y po znača¬ ju faktorjev v tri ločene komponente. Če je vpliv faktorja x velik, je komponenta (y'~ y) velika. Če je vpliv faktorja x maihen,_so vrednosti (y'- y) maj¬ hne, če pa y od x ni odvisen, je (y'- y) za vse enote enak nič. Za skupno merilo velikosti vpliva x na y uporabimo varianco od¬ klonov (yy) 6 y.x = f y) 2 (13.9) Enako so odkloni (y-y') veliki, če so drugi individu¬ alni faktorji močni. Če je vpliv teh faktorjev majhen, so ti od¬ kloni majhni, če jih ni, je (y-y') enak nič. Povezava je v tem primeru funkcijska. Skupno merilo jakosti individualnih vplivov je analogno zgornjemu merilu varianca odklonov (y-y') = jf H y-y') 2 (13.10) Po stavku o razstavijanju variance na vsoto varianc po faktorjih (glej obrazec 10.14) velja, da je skupna varianca o vsota dveh varianc: variance zaradi vpliva faktorja x na y y 2 2 in variance zaradi vpliva drugih individualnih faktorjev 6 , y.x e Ker tako pojasnimo, kla en del celotne variance izvira iz povezave y z x, imenujemo#”. pojasnjeno varianco, za razli- 2 y» x - ko odbg, ki izvira iz drugih, neznanih faktorjev in jo imenuje¬ mo nepojasnjeno varianco. Z obrazcem moremo zgornje napisati: 6 2 = Č 2 y y.x (13.11) Če to enačbo delimo dobimo obrazec + 1 (13.12) 2 2 V tem obrazcu kvocient 6 M pove, koliki del skupne J • ^ J O O r 2 a- 2 G e'y pa, koliki izraza €>f T se ravna po tem, kako velik je variance je pojasnjene s povezanostjo y z x, del skupne variance odpade na druge, nepojasnjene vplive, 2 2 Velikost izraza 6^ yJ6y vpliv x na y. Če y od x ni odvisen, je vrednost tega izraza nič, če pa je odvisnost funkcijska^ je ta izraz največji, in sicer e- nak ena. Vrednost kvocienta 6 /č~. je torej med 0 in 1 in pome- j •*- y 2/2 ni večjo ali manjšo stopnjo vpliva x na y. Zato kvocient 6 ^/<5^ uporabljamo za merilo stopnje odvisnosti y od x in ga imenujemo determinacijski koeficient. Čim večji je vpliv x na y, tem večja 2 2 je namreč vrednost ^/6^. Čeprav je determinacijski koeficient <5 2 y vsebinsko zelo nazoren, saj je delež pojasnjene variance od skupne varian¬ ce,dostikrat namesto njega uporabljamo kot merilo povezanosti kvadratni koren tega izraza. To merilo korelacije imenu jemo „.in~ .deJts korelacije. Indeks korelacije je torej razmerje med stan¬ dardnim odklonom za pojasnjeno variabilnost in skupnim standard¬ nim odklonom I y.x ( 13 . 13 ) Če upoštevamo enačbi 13.12 in 13.13, moremo indeks korelacije pisati v obliki, ki jo splošno uporabljamo ( 13 . 14 ) Standardna napaka ocene 13.16 Če je povezava med x in y tesna, se točke za dejanske vrednosti x in y razmeroma malo odklanjajo od regresij- ske krivulje. Ako za dano enoto poznamo samo vrednost x, moremo vzeti ustrezno vrednost y' na regresijski črti za oceno stvarne vrednosti y. To ocenjevanje ima veliko praktično vrednost. Če poznamo regresi j sko ..krivuljo med količino padavin in hektarskim donosom, moremo iz količine padavin v določenem letu oceniti hektarski donos. Če imamo regresijsko krivuljo med oceno na oko in stvarnim hektarskim donosom, moremo z njo popraviti vizualno oceno, če poznamo regresijsko krivuljo o odvisnosti cene od ko¬ ličine blaga, ki je naprodaj, moremo pri znani količini blaga oceniti Ceno itd. Ta ocena je jasno tem boljša, čim bolj je y odvisen x. Najboljša bi bila seveda, če bi bila odvisnost funkcijska. Takrat bi se iz regresijske krivulje izračunana vrednost y'skla¬ dala s pravo vrednostjo y. Vendar, kakor vemo, takih primerov v stvarnosti ni. Za vsako posamezne^ oceno ne vemo, kolik o smo pr i ocenjevanju pogrešili, ali z drugimi besedami: kolika je_razli- ka ocene y' od stvarne vrednosti y. Vendar moremo izračunati standardni odklon teh napak. Napaka pri ocenjevanju izvira iz individualnih vplivov, ki jih' ne poznamo. Standardni odklon-na¬ pake je torej enak standardnemu odklonu iz nepojasnjene varian- pa moremo izračunati, če poznamo indeks korelacije'~lr^r med podatkoma y in x. Iz obrazca 13.14 namreč zlahka dobimo, da je *e - £* (13 - 15) Standardni odklon nepojasnjene variance zato imenujemo tudi standardno napako ocene. Ce predpostavljamo, da se odkloni ocen od pravih vrednosti distribuirajo normalno, moremo sklepa- 1 ti, da 68 $ ocen ne bo napačnih za več kot<5 e , približno 95 % ne več kot 26^ in da bo le izjemoma ocena od prave vrednosti raz lična za več kot 36" . Tako moremo s standardno pogreško oceniti 6 napako ocene, ki jo dobimo z regresijsko enačbo. odklon (5 y K 0 eficient VI - Ij" , s katerim reduciramo standardni da dobimo standardno napako ocene €> , imenujemo na splošno koeficient alienacije ali koefi cient nepovez ano sti. LINEARNA KORELACIJA 13.17 Dosedanja razglabljanja o regresiji in korelaciji ve¬ ljajo na splošno, neodvisno od tipa regresijske krivu¬ lje. V vsakem primeru izračunavamo regresijsko krivuljo, ki poka že obliko odvisnosti med x in y, indeka_ korelaci.ie . ki pokaže ja kost povezanosti in standardno napako ocene, ki pokaže kvaliteto ocenjevanja z regresijsko krivuljo. Vse te količine najenostavneje izračunamo-, če je odvis nost med x in y linearna ali drugače povedano, če je regresijska krivulja premica. Linearne odvisnosri so v praksi zelo pogoste. Tudi če je povezava krivuljčna, je na krajših odsekih premica ze lo dober približek regresijske krivulje. Zato je linearna regre¬ sija za prakso zelo važna in jo najpogosteje uporabljamo. Če upoštevamo načela metode najmanjših kvadratov, izra čunavamo pokazatelje linearne korelacije po naslednjih osnovnih obrazcih: Ker imamo v splošnem dve regresijski krivulji, imamo tudi dve regresijski premici. Prva y'= y + b 1 (x-x) (13.16) podaja odvisnost y od x, druga x' = x + b 2 (y-y) (13.17) pa pokaže odvisnost x od y. V zgornjih enačbah pomenita x in y aritmetični sredini za x in y, in b 2 pa sta prvi in drugi regresijski koeficient. Regresijska koeficienta sta smerna koeficienta obeh regresijskih premic. Prvi regresijski koeficient b^ pokaže, za koliko se v povprečju poveča y, če se x poveča za enoto; drugi regresijski koeficient b 2 pa pokaže, za koliko se v povprečju spremeni x, če se y spremeni za enoto. Regresijska koeficienta b-^ in b 2 izraču¬ namo po obrazcih h -J?' U3 ' 18) X y 2 2 Pri tem pomenita 61 . in6 varianci za znaka x in y. c pa je x y - gg- nov izraz, ki ga imenujemo kovarianco . Kovarianca je po definici¬ ji povprečen produkt odklonov x in y od ustreznih aritmetičnih sredin x in y in jo moremo izraziti z obrazcem c xy = I I(x-x).(y-y) (13.19) Za razliko od variance more biti vrednost kovariance pozitivna ali negativna. Indeks korelacije pri linearni korelaciji imenujemo koeficient korelacije. Zaznamujemo pa ya z r xy . Koeficient korelacije izračunamo po osnovnem obrazcu c. 'xy *y_ x y ( 13 . 20 ) Vrednosti -korelacijskega koeficienta leže med -1 in +1. Korelacijski koeficient je pozitiven, če je povezava med x in y pozitivna; to pomeni, da se veča tudi vrednost druge spre¬ menljivke, če se veča vrednost prve. - 256 Korelacijski koeficient pa je negativen, če je povezava negativna. Taka pa je povezava, če se z večanjem enega znaka vrednost drugega manjša. Koeficient korelacije ima vrednosti -1 oziroma +1, če je povezava med x in y funkcijska in linearna, 0 pa, kadar med x in y ni linearne zveze. Slika 13.7 nazorno kaže velikost korelacijskega koefi¬ cienta za nekaj najznačilnejših ohlik linearnih odvisnosti med x in y. Te povezave so ponazorjene s korelacijskim grafikonom. Slika 13.7 Vrednosti korelacijskega koeficienta pri različnih razmestitvah točk v korelacij- skem grafikonu 2 Kvadrat korelacijskega koeficienta r imenujemo deter- - AjLa minacijski koeficient. Determinacijski koeficient sicer nima predznaka, ki hi nakazoval smer povezave, pačTpa~pove, kakšen del celotne variance je pojasnjen z linearno zvezo med x iny. Zato je analitično pomembnejši kakor korelacijski koeficient. Koefi¬ cient determinacije ima vrednosti med 0 in 1. Izračunavanje pokazateljev linearne korelacije 13.18 Negrupirani podatki. Če je število enot v populaciji, za katero proučujemo korelacijo, razmeroma majhno, so osnovni podatki dani z nizom dvojic vrednosti za x in y. Ce po¬ gledamo obrazce v prejšnjem odstavku, vidimo, da od osnovnih ko¬ ličin, s katerimi izračunavamo pokazatelje linearne korelacije, razen kovariance c , znamo izračunati vse količine. 13.19 Direktna metoda. Po direktni 0 metodi izračunavamo o- snovne količine: i, y, in c xy nataIl6no p0 ob _ razcih, ki so dani z definicijami. Izkaže se, da je direktna metoda tehnično neprikladna, ker so povprečja običajno decimalna števila, odkloni od povpre¬ čij zaradi tega večmestna števila, kvadriranje in množenje teh števil pa zamudno. Zato je ne bomo natančneje obravnavali. 257 - 13.20 Pomožna znaka u in v. Pri izračunavanju pokazateljev korelacije iz individualnih podatkov si največkrat po¬ magamo s pomožnima znakoma u in v. Z analognim postopkom smo si že olajšali izračunavanje variance. Po tej metodi izračunamo po¬ kazatelje linearne korelacije po tehle točkah: a) imamo osnovne podatke x in y, h) izberemo neko poljubno vrednost x q med stvarnimi vrednostmi za x, in poljubno vrednost y^ med stvarnimi vrednostmi za y, ° c) izračunamo odklone stvarnih vrednosti x od x q in stvarnih vrednosti y od y Q . Tako dobimo nove pomožne znake u = (x-x Q ) in v = (y-y Q ). Vrednosti u in v so v večini primerov prikladne j še manjše vrednosti kakor x in y # 2 2 d) poiščemo kvadrate posameznih vrednosti u in v in izračunamo produkte u . v, 2 2 e) seštejemo kolone za u, v, u , uv, v . Tako dobimo lu = U, Zv = V, ZuS Zuv, Zv 2 , f) iz količin N, U, V, Zu , Zuv inZv izračunamo poka¬ zatelje korelacije ph shemi v tabeli 13.9. 13.21 Kot primer za izračunavanje pokazateljev korelacije po metodi pomožnih znakov u in v vzemimo linearno korela¬ cijo in regresijo med rezultati mehanskega (x) in prostorninske- ga (y) testa za 20 tretješolcev mariborske klasične gimnazije. Podatke smo vzeli iz kompleksnega testiranja zmožnosti srednje¬ šolske mladine v SRS in pomenijo število doseženih točk pri posa¬ meznem testiranju. Iz absolutnih podatkov za x in y smo presodili, da je primerno, da vzamemo za x Q = 40 in za y Q = 50. Znaki u in v so pokazali, da so te vrednosti upravičene. Vrednosti u in v so znatno manjše kakor osnovne vrednosti x in y. Kakor vidimo iz tabele 13.10, poteka račun natančno po shemi iz tabele 13.9. Za obe regresijski premici so v tabeli 13.11 dane zveze med x in y po pet točk Tabela 13.11 Regresijski premici med številom točk pri mehanskem (x) in prostorninskem (y) testu iz primera v tabeli 13.10 Prva regresijska premica: Tabela 13.9 Shema za računanje pokazateljev linearne korelacije - 258 - C\l t> 3 CM II O S I >> 0 II X I X CM i—I CM CM t> !> I-1 f> H P CM k CM CM H CM CM 0 0 H CM t> i> I—I P CM 0 iH CM I—I CM X M rH CM CM te > k 0 CM l> • • Pj . . F • • tO CM f> \A CM > I W II \ CM > I CM k n CM t >3 t >3 \Q 19 n h tO I CM t >3 >u t> 0 u l t> P M fO I t> 0 ut >3 X o n CM 0 Ut CM to I M II \ CM to I CM Pl n CM X Id lo x II I CM X Li t> n t> to II 0 Usi k o + lt>s O >3 + to X + IX ll X + P t> 0 M fc 4 CM P K"} X t>3 CM X Pl I IX X H P + lt>3 >3 l>3 I X CM P + IX X Tabela 13.10 Izračunavanje pokazateljev linearne korelacije ned rezultati mehan¬ skega (x) in prostorninskega (y) testa za 20 tretješolcev mariborski klasične gimnazije po metodi pomožnega znaka u in v CD - 259 - 52,55 + 2,21(x-4l) = -38,06 + 2,21x 41 + 0,259(y-52,55) = 27,39 + 0,25.9y - 260 - tocK X* tneh*.rt«ki "t«i+ Slika 13.8 Regresijski premici za korelacijo med dosežki pri mehanskem in prostorninskem testu za 20 dijakov klasične gimnazije v Mariboru Korelacijski grafikon z včrtanima regresijskima premi¬ cama je za primer iz tabele 13.10 prikazan v sliki 13.8. 13.22 Če podatki zelo variirajo in ne moremo najti nekih u- streznih vrednosti za x q in y , da bi poenostavili o- snovne vrednosti, vzamemo, da je x = 0 in y Q = 0. Če to storimo, odpade iz zgornjega postopka točka c, ker ni potrebno izračuna¬ vati u in v. Ves nadaljnji postopek pa je isti, le da upoštevamo, da je x identičen z u, y pa z v. Tako izračunavanje pokazateljev linearne korelacije je posebno prikladno, če računamo z računskim strojem. Tedaj so po¬ možni znaki u in v nepotrebni in postopek samo zapletejo. Po tej metodi izračunajmo pokazatelje linearne korela¬ cije za primer korelacije med številom delavstva in številom o- pravljenih delovnih ur za 19 podjetij z manj kot 200 delavcev iz obutvene industrije v SRS v decembru 1952. Izračun je izvršen v tabeli 13.12. Tabela. 13.12 Izračunavanje pokazateljev linearne korelacije med številom delavstva (x) in številom opravljenih, delovnih ur (y) v tisočih ur za 19 podjetij z manj kot 200 delavci v obutveni industriji v SRS v decembru 1952 261 d CS' 13,16 + 0,2l6(x-66,68) = -1,24 + 0,216x Ker je med številom delavstva x in številom opravlje¬ nih delovnih ur y vzročna zveza, izračunamo samo prvo regresij- sko premico. Ker je število ur dano v tisočih, regresijski koefici¬ ent 0,216 pove, da se v povprečju spremeni skupno število oprav¬ ljenih ur za 216 ur, če se število delavcev spremeni za enega. O Iz r in r~. vidimo, da je med številom delavcev in xy xy številom opravljenih delovnih ur močna'povezanost in da je samo 2,39 i° celotne variance nepojasnjene. Standardna napaka ocene za število opravljenih delov¬ nih ur je s co Cn C- O + CO cn cn II i —I O m to I CO cn c- *K O + CM cn •s c~- to n \ M - 267/- KRIVULJCNA KORELACIJA 13.25 Čeprav je povezanost med pojavi pogosto linearna, ima¬ mo mnogo primerov nelinearne - krivuljčne povezave. Te primere rešujemo tako, kakor smo nakazali v splošnem razglablja¬ nju o korelacijskih odvisnostih. Najtežji problem pri krivuljčni korelaciji je določitev tipa krivulje povezave. Tip krivulje običajno določimo tako, da narišemo korelacijski grafikon, prostoročno včrtamo vanj regre- sijsko krivuljo, nato pa precienimo, kateri tip krivulje najbolj ustreza tej črti. Ta način zahteva, da praktično poznamo potek posameznih tipov krivulj. Včasih je tip regresijske krivulje nakazan vnaprej z določeno hipotezo, ali pa je dan z znano za¬ konitostjo odvisnosti. Dostikrat pa ugotovimo tip regresijske krivulje s transformacijo podatkov. S pravilno transformacijo osnovnih podatkov včasih dosežemo, da je zveza med transformi¬ ranimi podatki linearna; to olajša nadaljnjo analizo odvisnosti. Analitična metoda za določanje regresijskih krivulj 13.26 Najobjektivneje določimo regresijsko krivuljo in ana¬ liziramo korelacijo med dvema pojavoma analitično, z me¬ todo najmanjših kvadratov. Po tej metodi najprej z analizo korelacijskega grafiko¬ na ali iz vsebine koreliranih pojavov določimo ustrezno funkcij¬ sko obliko y'= f(x) za regresijsko krivuljo. Najpogosteje je re¬ gresi jska krivulja ena izmed tehle funkcij: 1. Premica y' = a + bx 2 2. Parabola druge stopnje y' = a + bx + cx 2 3 3. Parabola tretje stopnje y' = a + bx + cx^ + dx J 4 . Parabola y'= a + b 5. Parabola y'= (a + bx)^ (13.21) 6. Parabola y'= ax' 3 7) Eksponencialna funkcija y"= ab 8. Hiperbola y'= a + ™ 9. Hiperbola y'= - Vse zgornje funkcije so splošne oblike, ker vsebujejo parametre a, b, c, d,.. Zato ni dovolj, da z analizo podatkov v posebnem primeru ugotovimo najprimernejši tip funkcije, ki naj predstavlja regresijsko krivuljo, temveč je treba najti da¬ nim podatkom ustrezne vrednosti parametrov a, b, c, d Vrednost parametrov določimo po metodi najmanjših kva¬ dratov z naslednjo predpostavko: Za regresijsko krivuljo imamo izmed vseh funkcij določenega tipa tisto, za katero je vsota kvadratov odklonov dejanskih vrednosti za y od regresijske kri vulje y'= f(x) najmanjša. To načelo zagotavlja, da je regresij ska krivulja res krivulja, ki se danim vrednostim najbolje pri lega. Z obrazcem moremo zgornji pogoj napisati I(y - y') 2 = Min • (13.22) Parametre za regresijsko krivuljo določimo razmeroma enostavno, če je regresijska krivulja funkcija, v kateri so parametri a, b, c ... v linearni zvezi. Temu pogoju izmed gor¬ njih funkcij neposredno zadoščajo tipi funkcij 1, 2, 3, 4 in 8 Druge pa moremo v to obliko privesti z določenimi transforma¬ cijami. Po pravilih za določanje ekstremov dobimo, da morajo parametri a, b, c ..., če so med seboj v linearni zvezi, zado¬ stiti sistemu linearnih enačb, ki jih imenujemo normalne enač¬ be. Če je splošna oblika regresijske funkcije s tremi pa¬ rametri g(y) = af 1 (x) + bfg(x) + cf 5 (x), (13.23) je sistem normalnih enačb enak Igf^ = a^f 2 + blf 2 f-^ + c^f^f-^ Igf 2 = alf 1 f 2 + blf 2 + clf 5 f 2 (13.24) Igf 5 = aE - f 1 f 3 + ‘ b ^ f 2 f 3 + c ^ f 3 Pri tem je: g = g(y.) funkcijske vrednosti g za stvar¬ ne vrednosti y i za posamezne enote: f^ = f^(x i ), f 2 = f 2 (x i ), f^ = f^(x i ) pa so funkcijske vrednosti funkcij f-^, f 2 in f^ za stvarne vrednosti x^ za posamezne enote populacije. Znak £ po¬ meni seštevanje ustreznih izrazov za vse enote populacije. Transformacija znakov 13.27 Dostikrat si pomagamo pri proučevanju krivuljčne ko¬ relacije s transformacijo znakov x in y. Že v prejš¬ njem odstavku smo navedli, da moremo nekatere razmeroma zamo¬ tane funkcije s transformiranjem privesti v enostavnejšo ob¬ liko. Za nekaj najobičajnejših tipov krivulj so transforma¬ cije in transformirani znaki dani v tabeli 13.16. Tabela 13.16 Transformacija regresijskih funkcij Iz teh primerov vidimo, da so najobičajnejše transfor¬ macije znakov: kvadratni koren iz znaka x ali y ( fx; ly); re¬ cipročna vrednost znaka x ali y (l/x; l/y) in logaritem iz zna¬ ka x ali y (logx; logy). V vseh primerih smo v tabeli 13.16 uspeli s transfor¬ macijo razmeroma komplicirano funkcijo prevesti v linearno ob¬ liko transformiranih znakov I in I: I'= A + BX. Jasno je, da s prejšnjimi šestimi primeri ne izčrpamo vse funkcije, ki jih moremo analogno s transformacijo prevesti v linearno funkcijo. Že s prejšnjimi transformacijami (kvadrat¬ ni koren, reciprok in logaritem) moremo sestaviti še druge funk¬ cije ✓ y = • , na primer 3Tb 3 . + * ki je implicitna oblika funkcije 13.28 Ker so transformirane spremenljivke iz tabele 13.16 v linearni zvezi, je proučevanje korelacije in regresi¬ je za take vrste krivuljčne povezave podobno kot proučevanje linearne korelacije. Postopek moremo nakazati z naslednjimi tremi stopnja¬ mi : a) S transformacijo osnovnih podatkov ugotovimo tip regresijske krivulje. Pri preizkušanju, za kateri tip funkcije gre, si obi¬ čajno pomagamo tako, da osnovne vrednosti vnašamo v korelacij- ski grafikon, ki ima namesto linearnih skal transformirane ska¬ le (skale kvadratnih korenov, skale reciprokov ali logaritemske skale). Osnovne znake transformiramo z ustrezno transformacijo šele tedaj, ko uspemo, da korelacijski grafikon na transformi¬ ranih skalah pokaže linearno povezavo. b) Iz transformiranih podatkov X in Y po znanih postopkih izra¬ čunamo pokazatelje linearne korelacije in regresijsko premico. c) S transformacijo pomožno regresijsko premico Y' = A+BX preve¬ demo v regresijsko krivuljo za osnovne znake x in y. 13.29 Odstotek travnikov in pašnikov za okraje v SRS po sta¬ nju leta 1952 v grafikonu 13.4 kaže krivuljčno poveza¬ vo. Ker se z zmanjševanjem odstotka travnikov odstotek pašnikov nelinearno veča, sodimo, da so odnosi linearni, če namesto od¬ stotka pašnikov proučujemo logaritme odstotkov pašnikov. Da na¬ pravimo preizkus te naše hipoteze, na pollogaritemskem grafiko¬ nu prikažemo korelacijski grafikon odvisnosti med odstotki trav¬ nikov in pašnikov po okrajih. Resnično je ta transformacija zna¬ tno popravila nelinearnost in moremo vzeti to zvezo kot linearno (glej sliko 13.9). oele ko iz grafikona potrdimo našo predpo¬ stavko, transformiramo y in izračunamo pokazatelje linearne ko¬ relacije in regresije (glej tabelo 13.17). Naslednji pokazatelji so izračunani iz vsot XX, XY, IX 2 , ZXY in IY Č ' po shemi iz tabele 13.9. Tabela 13.17 Izračunavanje krivulj ene korelacije za odstotke travniških in pašniških površin za okraje v SRS po stanju 1952. (x=odstotek travnikov, y=odsto¬ tek pašnikov) s transformacijo osnovnih znakov 271 C\J X OOOmt-OJHCMOJCOCOOOJH^OHCvIOHOO Tj-COVOCTiCnOHlAUJNCM^inHCDO^VDOHU)^ lA^OJON^Oh-IALtMniA^-OinOCTi^OOOOJlA HOi^^CDHHNtOOOHiMHlOO^iriOHCnH CO O MO OJ Vi IX a\ CM O MO MO 00 OJ cn MO o X X o OM MO CO OC\li—li—irHOOOr—IOOOOO i—I H i—i CM i—IO i—I O H I! CM II X ' VCM H IM HcmJh X CM M \D 19 ! M fx! VOHtriO^inM-VOfflM-OlAf-lMOOOtDO Minc- U)M-OI>lAHvOLnK>Of"d-HtACriOW^)OfOOCM CO (Oif-inoc^CM tof-ovo inou) l>o o inovo mn CTiM-HlAC-irantAODM-H^OI^CMCOVOHI^^^DCD r—I rH l—i H I—ll—I F—Ir—I I—Ir—I II X X N vi VI X - v iz; X X X X o II X X u CM X X wjx o I—I X X- cn CO X HViM0cnM0XXXLrMnHXOXir\rHcnXLr\H CO CM Vi X" LCM CO CM CM CM CM X MO O CM CM X MO CM CO CM X V Vi CM CM X H K', IM Vir~-rHXMOUnX[~-XCOOOVXXCnOXCOOXrHV 0'tOHVX-inVX-f'hOMnhOOy)OlAOO cnxvr-iHCOcnxoc--xcnxcncMOcMvocnvcn Or—li—I f—I H o O O I—IOOOOOi—li—li—I i—1 i—I O r—(O CDCOOKMPiVCntAHCOCDCOtnCTFCnOCOlVOO^OCO CM CM i—I i —I i—I i—I i—I i—I V iH CM cMtcNcnLnvoo-v.ocococOinLrHOOOOLnHO-oOin CM iH CM H H i—li—ICM r—li—I H HCMViXir\MOtXOOCnOHCMV\XinMO!XCOCnOHCM HHHHHHHrlrlrlNNN 272 2 Z t k S JP /VOJllMS*«! •/. R Slika 13.9 Korelaeijska grafikona med odstotkom travnikov in odstotkom paš¬ nikov za okraje v SRS v letu 1952 z včrtanima regresijskima kri¬ vuljama na: a) transformiranih skalah, h) osnovnih skalah Regresijske krivulje pa so iz teh pokazateljev dalje: Y=Y+B 1 (X-I)=1,0162-0,0299(X-11,55)=1,3615-0,0299 X= A+B.I logy1,3615 -0,0299* A = loga « 1,3615; a - 22,9 9 B^= logb = -0 ,0299; 0,9335 Iz tega dalje sledi, da je y' v eksplicitni obliki y' = 22,99 . 0,9335* ■' *^ Druga regresijska enačba pa ima obliko: X' = X+B ? (Y-Y) = 11,55 - 20,29(Y-1,0162) = 32,17 - 20,29Y Če upoštevamo transformacijo Y = logy, se druga re¬ gresij ska enačba v osnovni obliki glasi: x' = 32,17 - 20,29logy Y sliki 13.9 sta prikazani v korelacijskem grafikonu obe regresijski krivulji, na sliki a na transformiranih skalah, na sliki b pa na osnovnih. Na sliki a sta zaradi transformacije skal regresijski krivulji premici. 13.30 Koreiacijski grafikon pokaže, da so odnosi odstotkov travnikov in pašnikov linearno povezani tudi, če znak x in y transformiramo s kvadratnim korenom iz osnovnih podat¬ kov. To lepo vidimo na sliki 13.10 a, na kateri so podatki iz tabele 13.4 vrisani v koreiacijski grafikon, v katerem sta obe skali skali za kvadratni koren. Regresijski krivulji sta v tem primeru funkciji tipa Postopek je popolnoma analogen postopku v prejšnjem primeru in je nakazan v tabeli 13.18. Regresijska premica za transformirane spremenljivke je Y'= Y + B 1 (X - I) = 3,377 - 0,793(X~3,229) = 5,938 - 0,793X Regresijska krivulja v osnovnih znakih x in y pa je '|yi- 5,938 - 0,793 \/x ali v eksplicitni obliki y'= (5,938 - 0,793 \t) 2 Tabela 13.18 Izračunavanje krivuljčne korelacije in regresije med odstotkom travnikov (x) in pašnikov (y) za okraje v SRS po stanju leta 1952 s transformacijo znakov - 274 - co O C\J CO KO o I C\J m o lo M OD 275 ^ N - . . 7^ ? K AOifIUSVci % K Slika 13.10 Korelacijska grafikona med odstotkom travnikov in odstotkom pašni¬ kov za okraje v SRS v letu 1952 a včrtano regresijsko krivuljo y' in pasom ene standardne napake: a) na transformiranih skalah, b) na osnovnih skalah - 276 - Standardna napaka ocene <6 = 0,628 ey Če iščemo pas odklonov ene standardne napake ocene, dobimo dve mejni premici: Y' = Y'- 6 = 5,938 - 0,793X- 0,628 = 5,310 - 0,793X a Y' = Y'+ 6 = 5,938 - 0,793X + 0,628 = 6,566 - 0,793X O “ J Če ti mejni premici prevedemo v osnovne znake, dobi¬ mo dve mejni regresijski krivulji, ki sta v eksplicitni obli¬ ki takile: y' = (5,310 - 0,793 ) 2 ; j' = (6,566 - 0,793 ^) 2 o Zj Primerjava dobljenega korelacijskega koeficienta -0,801) s korelacijskim koeficientom, ki smo ga dobili z logaritemsko transformacijo v prejšnjem primeru (r^= -0,779) pokaže, da je dala transformacija s kvadratnimi koreni malen¬ kostno bolje prilagojeno krivuljo. Slika 13.10 pokaže korelacijski grafikon na transfor¬ miranih skalah z vcrtano transformirano regresijsko premico Y' in mejnima premicama Y' in Y'. V grafikonu b poleg njega pa je prva regresijska krivulja z včrtanima mejama odklonov ene stan¬ dardne pogreške na linearnih skalah x in y. Pas, ki ga dobimo, je v skladu s pričakovanjem, da v njem leži približno dve tre¬ tjini vseh primerov. Znotraj pasu leži namreč 14 od 22 točk, kar je 64 a /°. I zračunavanj e korelacije s krivulj čne polinomi 13.31 Naravno razširjenje regresijske premice y' = a + bx je polinom. Tako dobimo funkcije, ki so parabole druge ali višjih stopenj z ustreznim številom parametrov. Parabola druge stopnje ima tri parametre y' = a + bx + cx 2 (13.25) parabola tretje stopnje štiri parametre y'= a + bx + cx 2 + dx^ (13.26) parabola četrte stopnje pet parametrov . 2 3 4 y a a + bx + cx + dx + ex (13.27) 277 - Ta postopek moramo teoretično nadaljevati, vendar obi¬ čajno čez parabolo četrte stopnje ne gremo. Zaradi velikega števila parametrov se namreč krivulje bolj in bolj prilegajo stvarnim vrednostim in imajo v sebi vedno več elementov slučaj¬ nih sprememb. Zgornje funkcije pogosto uporabljamo kot regresijske črte. Parametre iščemo po metodi najmanjših kvadratov iz normal¬ nih enačb; te pa sestavimo, kot smo nakazali v uvodu. Zaradi eno¬ stavnosti funkcij, ki nastopajo v tej obliki, so normalne enačbe za ta primer zelo pregledne. Za parabolo druge stopnje dobimo sistem treh normalnih enačb, ker imamo tri parametre O Iy = aN + blx + clx Xxy = alx + bXx 2 + cXx^ (13.28) Xx 2 y = alx 2 + bHx^ + clx^ Normalne enačbe so linearne enačbe za parametre a, b in c. V njih nastopajo kot konstante, ki jih izračunamo iz stvarnih podatkov, vsote potenc za znak x do četrte potence in vsote produktov med y in potencami x do druge potence. Za parabolo tretje stopnje sistem normalnih enačb raz¬ širimo za eno enačbo. Tako dobimo: 2 ^ Tj = aN + bXx + cXx + dXx Xxy = aXx + b£x 2 + c£x^ + dlx^ 2 2 3 4 3 ( 13 . 29 ) Xx y = a£x + b£ur + cXx^ + diur v 3 = afx"' + blx^ + cXx^ + dZx^ lx j Sistem normalnih enačb za parabolo tretje stopnje je po svojem sestavu zelo podoben sistemu normalnih enačb za pa¬ rabolo druge stopnje, le da je razširjen. Podobno moremo po potrebi sestaviti sistem normalnih enačb za poljubno razšir¬ jen polinom. Krivuljčno korelacijo tega tipa torej proučujemo tako, da: a) iz stvarnih podatkov izračunamo vsote potenc za x (Xx, X;: 2 , Ix^, Ix^ ...) b) te izraze vnesejo v ustrezni sistem normalnih enačb. c) iz sistema norr.ao.nin enačb izračunamo parametre a, b, c... - 278 - d) Če te parametre vnesemo v ustrezno funkcijsko obliko 13.25, 13.26 ali 13.27, dobimo regresijsko krivuljo. f) Standardno napako ocene vo a- a- C\J H a- (M Po obrazcu 13.35 dobimo ^ x = ;^Ž4100 - " 0,784 Tabela 13.21 Izračunavanje korelacijskega razmerja za odvisnosti dohodka od kmetijstva od velikosti gospodarstva v letu 1956 (Vir: Tabela 5.10) - 284 - F Ph o 0) O 'O ta rt O -H -H xi -p -rt o n > OOOir>VO|A (M CO tO O CO rH|OCO O V*- VO CO O CO LTV i—I rH C\J 'H- (XI C\J C\J 00 C- CM O CM IX- 00 H CO to i—I i—I C\J CM LO C— tO C LO CO O H KMA CM CO CO H CM V H CM CM C HO rl H CM CM O E— rH O O O CM i—I CM ITN Cn CO P-VCTiO O CM C\l tO tj- C— C- o -v co o m co co CM LTn 'H- H H to 'H- CM 'M- LO H CM C- i—i to cn c— to rH tO O CJ IX- -st- tO (T CM H tO IX- 00 CM CM to c— cn CO to CM H HO 4 cm cn o o o o o o o O O O O O O O tx- co m -v to cm H I I I I I I I O O O O O O O O O O O. O O CO LO ■'J- to OJ rH 'H’ S« i—I (Ti in ^ tr¬ oj •v CTv in O rH CM tr- CM H Ir¬ en CM cn co co c- -M- C cO to cn ■'M- to CM >4 CM 44 «4 W ■v CO M ts; 4.4 <4 oj 4*4 <4 4*4 cm 4*4 <4 cn C— H O c- CM • cn in O tr¬ ni cn in o i —i cn to in C-rH O H + co 0— kfr- in o CM i—l » CM X rt rt •ra i —I rt r d o S •rl 43 O tH CO to . to rt o N rt rt 43 o o Ph o Rezultat pokaže, da je ^ = 0,179 od skupne variance dohodkov iz kmetijstva pojasnjena s skupno površino ^ - 285 - J 5.37 Izračunajmo kot primer korelacijsko razmerje za odvisnost denarnih dohodkov v kmetijskih gospodarstvih od velikosti gospodarstva iz tahele 5.10, V tabeli 13.21 je pregledno nakazano, kako izračunamo osnovne količine, ki jih potrebujemo, če izračunamo korelacij¬ sko razmerje po zgornjem postopku. Ta način je posebno prikla¬ den, če kumulative izračunavamo s seštevalnim strojem, ki ima kontrolni trak. Po obrazcu 13.37 dobimo iz podatkov v tabeli 13.21 tole vrsto grupnih sredin. Tabela 13.22 G-rupne sredine dohodkov od kmetij¬ stva po velikostnih skupinah KORELACIJA RANGA 13.38 Rang je v ozki zvezi z vrednostjo znaka. Večji vrednosti ustreza večji rang in obratno. To lastnost rangov s pri¬ dom uporabljamo tudi pri proučevanju korelacije med pojavi. Raz¬ vrstimo enote po velikosti po obeh koreliranih znakih in enotam pripišimo rang, enkrat po prvem, drugič pa po drugem znaku. Če sta proučevana znaka v ozki pozitivni povezavi, se rangi obeh znakov med seboj precej dobro ujemajo. V skrajnem primeru - če je povezava funkcionalna, so celo med seboj identični. Če je med pojavoma majhna povezava ali je sploh ni, pa med rangi ni nobene zveze. Če osnovne podatke y nadomestimo z rangi, imamo namesto niza dvojic vrednosti x in y niz dvojic rangov za x in y. Če je med znakoma-x in y povezava tesna, je tesna tudi med rangoma. Če pa je povezava rahla ali je sploh ni, moremo to o- paziti tudi na rangih. To lastnost rangov izkoriščamo in izračunavamo koeficient korelacije iz rangov namesto iz osnovnih podatkov. Če število enot ni preveliko, je izračunavanje korelacije ranga znatno eno- 286 - stavne j še kot izračunavanje korelacijskega koeficienta r r . Koe- ficient korelacije ranga izračunavamo po Spearmanovem obrazcu b K d 2 N(N 2 -l) ( 13 . 38 ) p Pri tem je: §>= koeficient korelacije ranga; Ed = vsota kvadratov razlik med rangoma za oba znaka. Ker je koefi¬ cient korelacije ranga navaden koeficient korelacije med rangi, je vrednost Spearmanovega koeficienta korelacije ranga med -1 do +1, Izračunavanje Spearmanovega koeficienta ranga 5 je eno¬ stavno in ga izračunavamo po naslednjih stopnjah: a) Najprikladneje je, če osnovne podatke vpišemo na obdelovalne listke tako, da na vsak listek napišemo ustrezna podatka x in y za posamezno enoto. b) c) d) Ko prepišemo vse podatke na obdelovalne listke, razporedimo listke po velikosti vrednosti za znak x in na listke napiše¬ mo ustrezne range R. x Enako razporedimo listke po tudi zanj vpišemo na listku velikosti range R razliko vrednosti znaka y in y ran gov R x R„ in raz- Za vsako enoto izračunamo like rangov kvadriramo. 2 Kvadrate razlik rangov d za posamezne enote seštejemo in vsoto kvadratov diferenc Id^ vnesemo v obrazec (13.38). Vrednosti r^ in , izračunani iz istih podatkov, ni¬ sta enaki, ker sta izračunani različno. Vendar v večini primerov razlike niso velike in moremo vsaj v prvi stopnji proučevanja korelacije s pridom uporabiti kot orientacijski podatek. Pred¬ nost korelacije ranga je tudi v tem, da zmanjša učinek ekstrem¬ nih vrednosti; to je ena izmed hib navadnega korelacijskega ko¬ eficienta r . xy S korelacijo ranga razširimo proučevanje korelacije tudi na nekatere nenumerične znake. Veliko atributivnih znakov je nam¬ reč takih, da moremo njihove vrednosti razporediti po velikosti in jim določiti rang. Za take znake sicer ne moremo izračunati korelacijskega koeficienta r , ker so vrednosti znaka atributiv- ne narave, moremo pa zanje izračunati korelacijski koeficient ranga , je odstotek delov nih žena samo 42,7 - 289 - Čim večja je odvisnost delavnosti od spola, tem večja je tudi razlika med tema odstotkoma, in obratno: čim manjša je odvisnost delavnosti od spola, tem manjša je razlika med tema odstotkoma. Če bi bila delavnost neodvisna od spola, bi bila odstotka enaka, in sicer enaka povprečnemu odstotku 54,8 Ker vemo za skupno število moških in žensk, moremo izračunati, ko¬ likšno bi bilo število delovnega prebivalstva v SR Sloveniji, če delavnost ne bi bila odvisna od spola. Ker bi bilo v tem primeru recimo 54,8 $ od skupno 693 tisočev moških delovnih, bi bilo število delovnih 693 . 0,548 = 380 tisoč. Podobno izračuna¬ mo druge podatke. Tako dobimo tabelo 13.26, ki pokaže, kakšen bi bil sestav prebivalstva po spolu in delavnosti, če delavnost ne bi bila odvisna od spola. Tabela 13.26 Teoretično število prebivalstva v SRS, če delavnost ne bi bila odvisna od spola Če primerjamo tabelo 13.26 s tabelo 13.24, opazimo, da se obe v robnih frekvencah ujemata, ne ujemata pa. se v frekven¬ cah v notranjih poljih. Razlik ne bi bilo, če bi delavnost stvar¬ no ne bila odvisna od spola. Razlike so tem večje, čim bolj je delavnost odvisna od spola. Ker je 0,548 = 804/1466, moremo izračunati teoretično frekvenco tudi takole: 380 = 693.804/1466. Iz tega moremo izde¬ lati splošno pravilo: teoretično frekvenco za dano polje izraču¬ namo, če pomnožimo polju ustrezni robni frekvenci, produkt pa delimo s skupno frekvenco N. Če iz simbolov a, b, c in d sestavimo štiripoljno ta¬ belo je teoretična frekvenca za prvo polje enaka: _ ^ (a+b) . (a+c) a - N (13.39) (13.40) Analogno dobimo teoretične frekvence za druga polja. - 290 - 13.41 Ker so diference med stvarnimi in teoretičnimi frekven¬ cami tem večje, čim večja je odvisnost - asociacija med obema znakoma, moremo vzeti razliko a - a' za merilo odvisnosti. Tako dobimo, da je a - a'= a - < a+t> > ^ ^ g (13.41) pozitiven pri pozitivni in negativen pri negativni odvisnosti ali asociaciji. Njegova absolutna vrednost pa' je tem večja, čim večja je asociacija med znakoma. 13.42 lacije, cije Q Ker to merilo razen teh splošnih oznak po svoji vredno¬ sti ni določeno, ker je odvisno tudi od velikosti popu- je Yule vpeljal kot merilo asociacije koeficient asocia- ^ ad-bc w “ ad+bc (13.42) Koeficient asociacije Q ima vrednosti med -1 do +1. Q je negativen, če je asociacija negativna, in pozitiven, če je asociacija pozitivna. Q je nič, če pojava nista odvisna, ena pa pri funkcijski povezavi. Koeficient asociacije Q ima torej vse lastnosti dobrega merila odvisnosti. 13.43 Če damo eni vrednosti posameznega atributa numerično vrednost 0, drugi pa 1, moremo iz podatkov štiripoljne tabele formalno izračunati navadni koeficient korelacije r . Tako do¬ bimo novo merilo asociacije V. Tega izračunamo po obrazcu V = . ad _X .. . (13.43) ]] (a+b).(a+c).(b+d).(c+d) Koeficient asociacije V ima iste lastnosti kakor kore- lacijski koeficient r . x y 13.44 Kot primer analizirajmo asociacijo med spolom in de¬ lavnostjo za število prebivalstva po popisu 1953 po republikah. Osnovni podatki so dani v tabeli 13.27. Za Slovenijo smo koeficiente asociacije izračunali takole: ad - bc = 474.443 - 219.330 = +137712 6 = = +137712/1466 = 93,937 Q = X ad - bc _ _ +137712 _ _ n AR o ad+bc " 474.443 + 219.330 " - 291 - ad - bc + 137712 , .-:-= =======^ - .. - = + 0,258 VU+b).(a+c).(b+d).(c+d) ^693.804.662.773 Tabela 13.27 Število prebivalstva po spolu in delavnosti po republikah v milj. fYirs Popis prebival¬ stva 1953) V tabeli 13.28 so vpisani koeficienti asociacije Q za vse republike. Izračunali smo jih enako kakor za Slovenijo. Če pogledamo koeficiente asociacijo Q, ki merijo asoci¬ acijo med spolom in delovnostjo, opazimo izjemno nizek koeficient asociacije za Slovenijo (Q=+0,488) in izjemno visok za Makedoni¬ jo (Q = +0,646). Za druge republike pa so koeficienti asociacije med Q — +0 f 583 in Q = +0.587. To je v skladu z razmerami, ker so v Sloveniji zaradi različnega položaja žensk razlike v delovnosti po spolu manjše kakor v drugih republikah, posebno v Makedoniji. - 292 - Tabela 13.28 Koeficienti asociacije Q med delovnostjo in spolom prebivalstva po republikah« (Po podatkih iz tabele 13.27) Kontingenca 13.45 Vzemimo splošnejši primer, kombinacijski kontingenčni marveč več. V tem primeru govorimo o v katerem posamezen znak v tabeli nima dveh vrednosti, kontingenci. Za posamezna polja v kontingenčni tabeli dobimo teore¬ tične frekvence f^ za primer neod visnosti med pojavoma podobno kot za asociacijo. co Stvarni frekvenci f za primer neodvisnosti f^ ustrezajočo namreč dobimo teoretično frekven- če pomnožimo ustrez¬ ni robni frekvenci f-, in f , produkt pa delimo s skupno frekvenco N. Z obrazcem to izrazimo ® takole: (13.44) med Enako stvarnimi f n kakor pri asociaciji in teoretičnimi f' so tudi tu majhne razlike ^ .U-, frekvencami izraz majhne, kg kg J velike razlike pa izraz velike odvisnosti med pojavoma. Iz teh razlik med teoretičnimi in stvarnimi frekvencami f-f' je sestav¬ ljeno merilo kontingence uc 2 = I (13.45) f' 2 G-lede na zgornji obrazec izračunamo X (hi kvadrat) tako, da: a) iz robnih frekvenc po obrazcu 13.44 izračunamo tabelo teore¬ tičnih frekvenc f', b) izračunamo diference med ustreznimi stvarnimi f in teoretič¬ nimi f' frekvencami, - 293 c) dobljene diference kvadriramo (f-f ') 2 d) kvadrate diferenc delimo z ustreznimi teoretičnimi frekven¬ cami f', e) če seštejemo dobljene izraze (f-f') /f' izračunane za vsa po¬ lja v kontingenčni tabeli, dobimo X 2 , 2 f) včasih je primerneje, če izračunavamo x po obrazcu (13.46) V tem primeru namesto diferenc f-f' kvadriramo stvarne frekvence f; to je večinoma enostavnejše. 2 2 Iz osnovnega obrazca za X sklepamo, da je x = 0> če ni razlik med stvarnimi in teoretičnimi frekvencami; če sta dva pojava neodvisna, je x 2 večji, če so razlike večje, če je torej odvisnost med pojavi večja. Ta lastnost, ki jo ima , ustreza merilu za kontingenco. p Vendar X ne moremo neposredno primerjati za različne pojave in različne populacije. Zato večkrat iz njega izračunava¬ mo povprečno kvadratično kontingenco $ 2 - 4 - (13.47) ki omili vpliv razlik v obsegu populacij, ali Pearsonov koefici¬ ent kontingence C C = X 2 2C 2 +N (13.48) Za C je sicer zgornja meja odvisna od števila razredov, vendar C nikdar ni večji kot 1. 13.46 ženinov 1955. 2 Kot primer za izračunavanje x in koeficientov kontin¬ gence 2 in C vzemimo kontingenčno tabelo med stanom in nevesl pred sklenitvijo zakona za SR Slovenijo v letu Tabela 13.30 Sklenjeni zakoni po prejšnjem stanu ženina in neveste v SRS v letu 1956 - 294 - Teoretična irekvenca za prvo polje v prejšnji tabeli (samec-samska) je po obrazcu 13.44 12987 . 12513 f ll “-"13740"^ " - 18 "' za naslednje polje (samec-vdova) _ 343 . 12513 _ z 12 " 13740 “ Analogno izračunamo f' za vsa druga polja. Tako dobimo tabelo teoretičnih frekvenc pod predpostav ko, da prejšnji stan ženina in neveste nista odvisna. Tabela 13.31 Sklenjeni zakoni po prejšnjem stanu ženina in neveste v SRS v letu 1956 (teoretične frekvence f') Tabela 13.32 Razlike med stvarnimi in teoretičnimi frekvencami ((f-f') iz podatkov v tabe¬ lah 13.30 in 13.31) Ce pogledamo tabelo diference f-f', vidimo, da so dife r nce elike in pozitivne za ustrezne kombinacije samski-samska, ■'•d o ve c-vdove , razve zan-razvezana. Iz te tabele je dobro vidna j setojna odvisnost prejšnjega stanu zakoncev. 295 2 X ' izračunamo dalje po obrazcu 15.45 I (f-f') 2 (+?31) 2 , (-157)" , (-174) f' + . * • +' 11827 " ' 312 ' 374 -- 18 = 3495,997 Iz tega je dalje = 7L 2 /N = 3495,997/13740 = 0.254 (+41) , (+145) 20 C 7C+N 3495.997 3495,997 + 13740 0,450 Dobljeni koeficient 0 moremo primerjati z analognimi Koeficientipza druge republike, za Slovenijo za druga leta itd,, medtem ko X ni neposredno primerljiv za različno velike popula¬ cije. PARCIALNA KORELACIJA 13.47 Dva pojava sta med seboj povezana, če sta vzročno od¬ visna ali pa če sta odvisna od istih faktorjev, ki na¬ nju delujejo. Običajno je del povezanosti rezultat neposredne - vzročne odvisnosti, del povezanosti pa_rezultat posredne poveza¬ nosti zaradi vpliva drugih faktorjev. Ge raziskujemo neposredno odvisnost med dvema pojavoma tako, da odstranimo vpliv enega ali več faktorjev, govorimo o parcialni ali delni korelaciji. Izračunavanje parcialnih korelacijskih koeficientov,ki pokažejo odvisnost med dvema pojavoma, če odstranimo skupen vpliv drugih faktorjev, je razmeroma enostavno, če je odvisnost linearna. Posebno je enostavno izračunati koeficient parcialne korelacije, če odstranimo vpliv enega samega faktorja. Parcialni korelaci jski koeficient r i 2 3 me( ^ pojavoma 1 in 2, če odstranimo vpliv faktorja 3, dobimo iz ustreznih eno¬ stavnih korelacijskih koeficientov za linearno korelacijo r^, r^> r 23 P° obrazcu r 12.3 r 12 r 13 r 23 (13.49) 13.48 Vzemimo za primer, kako je produktivnost dela, ki jo merimo z vrednostjo proizvodnje na enega delavca (x-^), odvisna od števila delavcev v podjetju (x 2 ). Pri tem proučimol kaj je s to odvisnostjo, če odstranimo vpliv porabljene elek¬ trične energije v podjetju (x 3 ) na povezanost med številom de¬ lavstva in produktivnostjo dela. - 296 - Proučevanje obsega 27 podjetij tekstilne industrije v Sloveniji v letu 1957, ki imajo zaposlenih pod 1.000 delavcev in je njih osnovna dejavnost proizvodnja tkanin. Enostavni kore- lacijski koeficienti, izračunani iz podatkov za zgornja podjet¬ ja, so: med proizvodnostjo dela in Korelacijski koeficient r 1? med proizvodnostjo dela in številom zaposlenih pokaže zelo majhno povezanost med tema dvema pojavoma. Če izračunamo po obrazcu 13.49 parcialni korelacijski koeficient med proizvodnostjo dela (x-|) in številom zaposlenih (x ? ), če odstranimo vpliv porabe eleketrične energije (x,), do¬ bimo : r 12.3 0.03383 - 0.34802 . 0.72000 \ 1 - 0,34802 2 \ 1 - 0,72000 2 -0,333 Dobljeni rezultat se zdi nerazumljiv, ker kaže, da pro duktivnost dela, merjena s proizvodnjo na enega zaposlenega, pri isti porabi eleketrične energije pada, če se število zaposlenih veča. Rezultat pa je stvaren, če upoštevamo, da se razmerje med porabljeno električno energijo in številom zaposlenih slabša, če se pri isti porabi električne energije število zaposlenih veča. MULTIPLA KORELACIJA 13.49 Dosedaj smo obravnavali probleme odvisnosti nekega po¬ java od enega faktorja. Vemo pa, da posamezni socialno ekonomski pojavi niso odvisni od enega, marveč od več faktorjev. Proizvodnja v podjetju je odvisna od števila zaposlenih, porab¬ ljene električne energije, Števila strojev itd. Cena je odvisna od količine na trgu in povpraševanja. Hektarski donos je odvisen od gnojenja, padavin, zemlje, lege parcele itd. Analogno kot proučujemo odvisnost pojava od enega fak¬ torja, moremo proučevat- odvisnost pojava od več faktorjev hkra¬ ti. V tem primeru govorimo o multijli regresiji in multipli ko¬ relaciji. Če proučujemo z multiplo regresijo, kako je odvisen od dveh faktorjev x 2 , x^, moreno pisati, da je X 1 = f ( x 2' x y + e (13.50) - 297 - Pri tem je f(x 2 >x^) rezultat vpliva in x^ na x^, e pa je rezultat drugih, individualnih faktorjev na x-^. Namesto regresijske krivulje pri enostavni regresiji, imamo pri multipli regresiji regresijsko ploskev, ki je podana z enačbo f(x 2# x 3 ) (13.51) Enako kot pri enostavni regresiji, vzamemo tudi pri multipli regresiji, da je po metodi najmanjših kvadratov regre- sijska funkcija tista, za katero velja, da je vsota kvadratov odklonov stvarnih vrednosti x 1 od ustreznih vrednosti x^ naj¬ manjša. Enako merimo jakost povezave z indeksom multiple kore¬ lacije I 1.23 = 1 - 1.23 6 1 (13.52) 2 2 pri tem pomeni: 6^ = skupna varianca za znak x^; 6 1 ^ - nepo¬ jasnjeni del skupne variance za znak x~,. Podobno kot pri enostavni regresiji izračunamo tudi za multiplo regresijo standardno napako ocene po obrazcu 6 1.23 '1.23 (13.53) Linearna multipla korelacija 13.50 Kot pri enostavni korelaciji tudi pri multipli korela¬ ciji najpogosteje proučujemo linearne zveze in odvis¬ nosti. Za linearno multiplo regresijo za odvisnost znaka x~^ od dveh znakov x^ in x.* ima regresijska funkcija, ki je enačba rav¬ nine, obliko: ^ h)1 2 ^(^2” ^ ^2 ) + "b 13 2 (x^) (13.54) Pri tem pomenijo: x-^, x^ in x^ povprečja za ustrezne znake, b-^ ^ in b tiple regresijske dnih odklonov <3^, koeficientov r-, ? , 3 2 P a nm}.tiple regresijske koeficiente. Mul- koeficiente za ta primer izračunamo iz standar- ^ 2 » ^ in ustreznih enostavnih korelacijskih r-^ 3 in r 2 ^ po obrazcih - 298 - ' 12.3 6l s 2 - r 12 r 13 r 23. ? S'-! r 13 r 12 r 23 1 - r 2 23 13.2 “ ^ (13.55) 1 - r 23 Determinacijski koeficient multiple korelacije R-^ 2 ^ ki pokaže, kolik del od skupne variance za znak x^ je pojasnjene z linearno odvisnostjo z znakom x 2 in x^, pa izračunamo iz r^ 2 > r 13 ’ r 23 °^ razc ' u - 2r 12 r 15 r 23 2 - r 25 (13.56) Kvadratni koren iz determinacijskega koeficienta je multipli korelacijski koeficient R^ 2 ^. Standardno napako ocene 6^ ^ p a izračunamo po obrazcu 6 ” 1.23 (13.57) Ge primerjano vse zgornje pojme s pojmi za enostavno linearno regresijo in korelacijo, opazimo, da so posamezni pojmi ostali isti, le da so razširjeni na več znakov. Zgornjo teorijo moremo, če je potrebno, razširiti na večje število znakov. Vendar to presega naš okvir. 13.51 Vzemimo za primer multiple korelacije odvisnost produk¬ tivnosti dela (x-, ) v 27 podjetjih s pod 1.000 zaposle¬ nimi v tekstilni industriji v Sloveniji v letu 1957, od števila zaposlenih (x^) in porabe električne energije (x^). Če merimo produktivnost dela z vrednostjo proizvodnje v lexu 1957 v tisočih dinarjev na enega zaposlenega, porabo elek¬ trične energije pa v MW, , iz osnovnih podatkov o proizvodnosti dela, številu zaposlenih in porabi električne energije za posa¬ mezna podjetja dobimo tele delne rezultate: x. =2910 tisoč din; x^ = 34-5,78 zaposlenih; x, = 900,70 MW^ 8^ = 813,0; & 2 = 244,9; = 1231,5 x'j 2 - +0,03383; r 13 = +0,34802; r g5 = 0,72000. Iz teh podatkov dobimo po obrazcih 13.55 - 299 - _ 813.0 0.03383 - 0.34802 . 0.72000 _ n , 0 , n , lp 7 ' • P — — ^,4:7 4^4 244,9 1 - 0,7200CP b 13.2 813,0 # 0,34802 - 0,03383 . 0.72000 = +Q 1231,5 * 1 - 0,72000 2 Če vstavimo zgornje podatke v obrazec 13.54, dobimo naslednjo funkcijo x{ = 2910 - l,49404(x 2 -345,78) + 0,44367(x 3 ~900,70) ali, če jo dalje razvijemo x' = 3027 - l,49404x 2 + 0,44367x 3 Ta regresijska funkcija pokaže, kako je produktivnost dela x^ linearno odvisna od števila zaposlenih x 2 in porabe elek¬ trične energije x 3 « Vendar je ta povezava zelo rahla. Ce namreč izračunamo po obrazcu 13.56 determinacijski koeficient multiple korelacije 2 R-, dobimo 1.23 R 2 0.03383 2 + 0.34802 2 - 2.0.03383.0.34802.0.72000 _ c 21QG6 1.23 1 - 0,72000 Iz tega rezultata sklepamo, da je samo približno 21 $ od skupne variance v produktivnosti dela pojasnjene z odvisnost¬ jo produktivnosti dela od števila delavstva in porabljene elek¬ trične energije. Iz determinacijskega koeficienta R6 dobimo, da je koeficient multiple korelacije enak * ^ R ± 23 = y 0,21866 = 0,468 Temu ustrezno je velika tudi standardna pogreška ocene 1.23* Po obrazcu 13.57 namreč dobimo, da je 6"i 25 = 813,0 \J'l—0 ,21866 = 719 tisoč dinarjev. Standardna pogreška ocene je tako velika, da iz doblje¬ ne regresijske funkcije ne moremo ocenjevati produktivnosti dela, če poznamo za podjetje število zaposlenih in porabljeno električ¬ no energijo. Praviloma R-^ n i manjši kakor r^ 2 ali r ]_5 • 3 e ra_ zumljivo, ker je pojav, ki je v odvisnosti z dvema znakoma, z o- bema vsaj'toliko določen kakor z vsakim izmed njiju. - 300 - ŠTIRINAJSTO POGLAVJE V. ZORČENJE Osnove vzorčenja 14.1 Vzporedno s hitrim ekonomskim in družbenim razvojem se je v zadnjih desetletjih vedno bolj večala potre¬ ba po statističnih podatkih v naj različne j sili področjih. Stare metode zbiranja in obdelave podatkov niso mog¬ le zadostiti novim zahtevam, ker so bile drage, počasne, zveza¬ ne z angažiranjem velikega številka ljudi itd. Razen tega so se te metode zaradi posebnih pojavov izkazale za neuporabne za no¬ va, nerazvita področja. Zato smo morali odstopiti od osnovnega načina opazo¬ vanja statističnih populacij, to je popisovanja v ožjem smislu in v marsikaterem področju začeti ocenjevati statistične podat¬ ke. Statistične podatke ocenjujemo na več načinov. Nekatere od njih smo našteli v prvem delu. Od teh ao nekatere ocene izdelane na osnovi poznavanja predmeta bolj ali manj brez uporabe stati¬ stike. Druge npr. metoda izbora tipičnih enot, monografija, me¬ toda opazovanja osnovne mase itd. pa so izdelane na poznavanju dela populacije. Vendar imajo vse te metode ocenjevanja večino¬ ma iste pomanjkljivosti. Vse so subjektivne, za sestavljanje ocen pa moramo razmeroma zelo podrobno poznati osnovno popula¬ cijo; razen tega pri nobeni od njih ne vemo, kolikšna je raz¬ lika ocene od prave vrednosti, ki bi jo dobili, če bi opazova¬ li populacijo, oziroma koliko so te ocene zanesljive. Vseh teh pomanjkljivosti, ki jih imajo ocene gornjih tipov, pa nima metoda vzorčenja . Po tej metodi ocenjujemo para¬ metre populacije iz dela enot populacije - vzorca. Enote vzorca izberemo iz populacije podobno kot številke pri loteriji po me¬ todi slučajnega izbora tako^ da ima vsaka enota populacije ena¬ ko možnost, aa je izbrana. Ce je vzorec, kakor pravimo, slučaj- nosten, ima ta ocena kakovosti, ki jih nobena drugačna ocena nima. Za slučajnosten vzorec namreč veljajo zakonitosti, ki bi¬ stveno pripomorejo h kakovosti ocene. Te pa moremo odkriti z uporabo verjetnostnega računa. Zaradi tega je osnova metode vzorčenja verjetnostni račun. Zakonitosti vzorčenja pa veljajo le, če so enote izbrane naključno. 14.2 Le toda vzorčenja je v svojih posebnih oblikah v ne¬ katerih znanostih že dolgo znana kot raziskovalna metoda. Tako je vzorčenje že razmeroma dolgo znano v agronomi¬ ji, biologiji, medicini, psihologiji itd. Vzrok, da se je meto¬ da vzorčenja uveljavila najprej v teh znanostih, ni naključje. Raziskovalec v teh. področjih je bil že od vsega začetka nujno - 301 - navezan na opazovanje samo dela populacije, ker celotne popu¬ lacije ne obstajajo. Tako je za agronoma trideset preskusnih parcelic samo vzorec iz populacije neomejenega števila parce¬ lic, ki bi jih obravnavali enako kakor stvarnih trideset par¬ celic. Prav tako je v poskusih v biologiji ali medicini tri¬ deset ali štirideset poskusov na miših samo vzorec iz neome¬ jenega števila poskusov ob enakih pogojih. Enako vzamemo do¬ ločeno število izdelkov, ki jih proizvedemo na določenem stro¬ ju, za vzorec iz neomejene populacije izdelkov, ki bi jih stroj proizvedel ob enakih pogojih. V teh znanostih se je vzorčenje uveljavilo razmero¬ ma zgodaj, ker s popolnim opazovanjem nismo mogli zajeti neo¬ mejenih - umišljenih populacij. Ravno to pa je vzrok, da se je vzorčenje razmeroma pozno začelo uveljavljati tudi v socialno¬ ekonomskih znanostih. Te znanosti namreč večinoma obravnavajo populacije, ki imajo končno število enot. Te pa je možno opa¬ zovati s klasičnimi metodami opazovanja, s popisi, s tekočimi službami itd. Vendar je potreba po statističnih podatkih pre¬ rasla možnosti, ki jih dajejo klasične metode. Zato so izdela¬ li specifične metode vzorčenja, ki omogočajo objektivno in ka¬ kovostno ocenjevanje podatkov tudi za to področje. Te metode so sedaj splošno orodje statistike in v mnogih področjih izpod¬ rivajo klasične metode opazovanja. Prednosti in pomanjkljivosti metode vzorčenja / 14.3 Prednosti vzorčenja pred drugimi metodami ocenjeva¬ nja, a v mnogih primerih tudi pred metodami popol¬ nega opazovanja, se tele: a) število enot v vzorcu je znatno manjše kakor pri popolnem opazovanju. Pri velikih populacijah je število enot v vzorcu komaj ne¬ kaj promilov ali odstotkov od skupnega obsega populacije. Manjše število enot pa ima niz prednosti za vzorčenje. } * b) Stroški vzorčenja so znatno manjši kakor stroški za popolno opazovanje. c) Kakovost zbranih podatkov je v marsikaterem primeru celo bolj¬ ša kot pri popisu, ker je za izvedbo potrebno manj ljudi. Ti pa so zaradi lažje izbire boljši, bolje poučeni itd. d) Zaradi izbire kadrov in možnosti kontrole so napake pri po¬ pisovanju kar najbolj skrčene. e) Čas, v katerem dobimo rezultate, je znatno krajši kot pri popolnem opazovanju; to pa poveča uporabno vrednost podat¬ kov. «•» f) Pogrešek, ki izvira iz tega, da nismo opazovali celotne po¬ pulacije, temveč samo del, moremo pri vzorčenju■objektivno 302 izmeriti in uravnavati. Te lastnosti nima nobega druga meto¬ da ocenjevanja. Ta pogrešek, ki ga moremo oceniti, je dosti¬ krat celo manjši kakor pa je rezultat popisnih napak pri ce¬ lotnem opazovanju. 1 opisnih napak je predvsem kriv velik Oh-- seg populacije, sodelovanje velikega števila popisovalcev, ki jih ne moremo uspešno poučiti in kontrolirati,itd. g) V raziskovalnem delu je metoda vzorčenja edino možna, ker umišljenih - hipotečni, populacij v nobene primeru ne more¬ mo zajeti. Pomanjkljivosti vzorčenja pa so predvsem v tem: a) Vzorčenje moremo uporabiti le za populacije z velikim števi¬ lom enot. b) Zato ne moremo dobiti z njim zadovoljivin ocen za manjša, temveč le za večja območja. c) Vzorčenje ne da zanesljivih podrobnih rezultatov. Zato z njim ne moremo obdelovati kombinacije več znakov. d) Zanesljivost ocen za posamezne podatke je različna. e) Načrt vzorčenja je bolj zapleten kakor načrt popolnega opa¬ zovanja. Enako je računanje ocen in pokazovalcev zaneslji¬ vosti ocen razmeroma zamotano. Uporaba vzorčenja pri statističnem opazovanju 14.4 Vzorčenje moremo uporabiti v vseh stopnjah stati¬ stičnega opazovanja. Pri izvedbi 'statistične akcije more vzorec nadome¬ stiti popolno opazovanje ali pa ga uporabimo kot dopolnilo k popolnemu opazovanju. Tako npr. z vzorcem v nekaterih letih v Jugoslaviji nadomestimo popis živine. Kot dopolnilo pa vzorče¬ nje uporabimo, če podatke, ki jih potrebujemo zelo podrobno tudi za manjša ocmočj«., zberemo s popisom. Podatke, ki jih po¬ trebujemo samo za večja območja pa istočasno opazujemo z vzor¬ cem. Zato prve podatke zberemo od vseh enot populacije, druge pa samo od vnaprej naključno izbranih enot. Pri obdelavi statističnega gradiva moremo uporabi¬ ti vzorčenje za dva namena. Obdelava velikih popisov traja razmeroma dolgo. V tem času podatki velikokrat že izgube ak¬ tualnost. Z vzorcem predhodnih rezultatov pa moremo dobiti o- cene podatkov znatno pred koncem popolne obdelave. Y tem pri¬ meru je popolna obdelava tudi potrebna, ker da vzorec samo globalne, ne pa podrobnih rezultatov. ^Moremo pa vzorčenje uporabiti tudi za dopolnilno obdelavo . Čeprav s statističnim opazovanjem zberemo popolne 303 podatke za vsa vprašanja, včasih popolno obdelamo le nekatera od teh vprašanj. Druge pa obdelamo z vzorcem v dopolnilni ob¬ delavi, ker sicer bodisi zaradi pomanjkanja sredstev ali dru¬ gih vzrokov ne bi teh podatkov sploh obdelali. Z vzorcem moremo tudi kontrolirati izvedbo stati¬ stične akcije v vseh stopnjah. Z njim ocenimo delo popisoval¬ cev ali obdelavo statističnih podatkov v celoti. Vzorčenje u- porabljamo celo za popravo podatkov, ki smo jih zbrali s popi¬ som. Pri popisu živine, pa tudi pri drugih statističnih akci¬ jah, neposredno po popisu izvedemo kontrolni vzorec. Kakovost¬ no dobri, zanesljivi in posebej za to poučeni kontrolorji z vzorcem ugotove, koliko so zbrani podatki različni od stvarnih Podatke zberejo kontrolorji z drugačnimi sredstvi, bolj vestno in natančno kakor popisovalci. Tako ugotovimo učinek napak, ki jih z drugimi sredstvi kontrole ne moremo ugotoviti. Iz podat¬ kov kontrolnega vzorca pa ocenimo za vsako vrsto živine oziro¬ ma podatek posebej, koliko je stvaren podatek oziroma za koli¬ ko je treba v skupnem ta podatek popraviti. Vzorčna kontrola ima namen ugotoviti skupni učinek napak, ne pa napake posamez¬ nika. Čeprav je v problemih, ki smo jih nakazali v prej¬ šnjem odstavku, število enot v vzorcu razmeroma majhen del ce¬ lotne populacije, je število enot vseeno razmeroma veliko, saj je imel npr. 2 °/o vzorec popisa prebivalstva v Sloveniji v letu 1953 približno 30.000 enot. Vzorčenje se je razvilo v eno izmed osnovnih metod pri proučevanju javnega mnenja, analize tržišča, kontrole pro¬ izvodnje in proizvodnega procesa itd. Pri teh problemih so vzorci razmeroma majhni in v dosti primerih ne presegajo nekaj deset enot populacije. Seveda rezultati takih vzorcev niso ta¬ ko zanesljivi kakor rezultati vzorcev z več tisoči enot. Ven¬ dar je njihova zanesljivost glede na problem, ki ga s takimi vzorci rešujemo, večinoma ustrezna. 14.5 Normalna distribucija . Osnovna verjetnostna distri¬ bucija v vzorčenju je normalna porazdelitev. M n ogo slučajnostnih spremenljivk, ki jih sestavljamo v vzorčenju, se distribuira v normalni distribuciji, če ne neposredno, pa vsaj asimptotično. Normalna distribucija je tudi osnova za druge teoretične distribucije. V normalno distribucijo preide asimptotično večina teoretičnih distribucij. Opis normalne distribucije 14.6 Normalna distribucija je določena z dvema paramet¬ roma: z aritmetično sredino M, ki je rezultat sploš¬ nih vplivov, in s standardnim odklonom 6, ki je rezultat posa¬ mičnih oziroma slučajnih vplivov. - 304 - Gostota relativne frekvence za normalno distribuci¬ jo je dana s funkcijo = efVIšr U- M) 16 1 (14.1) Ta enačba pokaže, v kakšni odvisnosti je relativna gostota frekvence <5>(x) z vrednostjo x. Če vzamemo vrednost znaka x za absciso, ustrezno vrednost relativne gostote frekvence <$(x) pa za ordinato, do¬ bimo sliko normalne distribucije (glej sliko 14.1). Iz enačbe (14.1) in slike spoznamo, da je normalna, distribucija unimodal- na, simetrična in zvonasta, zaradi Česar je zanjo M = Me = Mo. Največja gostota relativne frekvence je za x = H, gostota pa vztrajno pada, čim bolj je x oddaljen od aritmetične sredine. Normalna krivulja se abscisni osi asimptotično približuje, če x raste čez vse meje. Slika 14.1 N 0 rmalna distribucija za M = 8 in SD = 2 - 305 - 14.7 Čeprav imajo normalno distribucije različne parametre M in SD, so si med seboj podobne. Slike za normalne dis¬ tribucije z različnimi aritmetičnimi sredinami so samo premaknje- me v levo ali desno. Normalna distribucija pa je bolj stisnjena, Če je standardni odklon manjši in bolj raztegnjena, če je stan¬ dardni odk.lon velik. Za vsak poseben primer normalne distribucije bi bilo zelo neprikladno neposredno računati gostoto relativne frekvence 96 tto 2o,71 tudi prava vrednost poprečja M x ni od ocene x s tveganjem ^različna za več kot D(x). Iz tega sle¬ di, da je slučajnostno izbrani vzorec s tveganjem ec = 0,05 tak, da je prava sredina v razmiku x - 1,96 SE(x) 4. M x < x + 1,96 SE(x) (14.16) Ta razmik imenujemo razmik zaupanja , obe meji pa spod¬ njo in zgornjo mejo zaupanja ocene. To oceno prave vrednosti po¬ prečja Imenujemo Intervalno oceno, ker je dana z razmikom zaupa¬ nja, v katerem je z določenim tveganjem pravo poprečje. 14.21 Ocenjevanje strukturnega deleža z velikimi vzorci . Ra¬ zen aritmetične sredine je strukturni delež parameter, ki ga zelo pogosto ocenjujemo z vzorčenjem. Zgled za uporabo vzorčenja pri ocenjevanju strukturnih deležev so najrazličnejše ankete s področja javnega mnenja, analize trga ipd. S temi anke¬ tami skušamo oceniti, kolik odstotek prebivalstva ima določeno mnenje o kakem problemu, kolik delež prebivalstva je naklonjen ali nenaklonjen določenemu ukrepu, kolik delež prebivalstva je pripravljen, da nabavi določen izdelek, ki ga reklamiramo in po¬ dobno. Slično je ocena strukturnega deleža dobrodošel pokazova- lec o kakovosti skupine izdelkov. Z vzorčno kontrolo moremo nam¬ reč oceniti delež izmeta, delež prvovrstnih izdelkov ipd. Strukturni delež ocenjujemo podobno kot aritmetično sredino. Strukturni delež p />, izračunan iz vzorca z n enota¬ mi, je nepristranska ocena za strukturni delež v populaciji n p/ = ..100 . (14.17) Pri tem je p/o ocena za strukturni delež, n število e- not v vzorcu, n pa število enot v vzorcu, ki ima proučevano d značilnost, npr. število anketiranih oseb, ki so pripravljene kupiti določen izdelek. Podobno kot za aritmetično sredino je pfo točkovna ocena za strukturni delež. - 318 - Če želimo dobiti razmično oceno, moramo najprej poiska¬ ti standardni pogrešek za oceno strukturnega deleža. Pravo vred¬ nost za standardni pogrešek za strukturni delež dobimo po obraz¬ cu SE(p/o) = \j ^ UP . P-j ŽT (14.18) • Pri tem je P/ prava vrednost za ocenjevani strukturni delež. Ker pa tega ne poznamo, ga moremo za velike vzorce nado¬ mestiti z ocenjenim p/o, Tako dobimo obrazec za oceno za stan¬ dardni pogrešek za strukturni delež se(p$) se (p,S) = \j žž (100-EŽ) ' (14.19) tako, da zamenjamo pravo vrednost P/> z oceno p/o . Razmik zaupanja za oceno strukturnega deleža dobimo po neenačbi P s £ = p/o - l,96.se(p$) <

<5q = 2, da je standardni odklon večji kot 6=2, postavimo nasproti ničelno domnevo, H Q : <3 < 6f = 2, da je standardni odklon manjši kot 2. 15.3 Enostavne in sestavljene domneve . V zgledu o izmetu vsebuje ničelna in osnovna domneva po eno samo - toč¬ no določeno vrednost. Take domneve imenujemo enostavne za razli¬ ko od domnev, ki nastopajo v zgledu o standardnem odklonu, v ka¬ terem so domneve sestavljene , ker vsebujejo več vrednosti. 15.4 Preizkušnje enostavnih domnev . Prvine preizkušanja do- mne v ponazorimo na zgledu, v katerem sta H 0 in H-, eno¬ stavni domnevi o aritmetičnih sredinah. Preizkušamo domnevo H-, , da je pošiljka izdelkov izde¬ lana iz surovine S^, pri kateri je poprečna trdnost H^:M = M-^ = = 21,5 proti ničelni domnevi, da so izdelki iz surovine S^, pri - 322 - kateri je povprečna trdnost Hq:M = Mq = 20. Predpostavljajmo, da se x porazdeljuje normalno s 6'= 2. Dani domnevi preizkušajmo s preizkusnim vzorcem z n = 16 enotami. Iz teorije vzorčenja vemo, da velja za sredine iz vzorca Pr (x x z = M 1 - z ± _^ -~r-) =1-/3 (15.2) Če vstavimo znane izraze v to verjetnostno neenačbo pri pogoju normalnosti, ugotovimo, da je l-$ = 0,912. Verjetnost, da bo v primeru, da velja osnovna domneva, poprečje v kritičnem ob¬ močju, je zelo velika. Verjetnost 1- Pa, ki pokaže, s kakšno ver¬ jetnostjo zavrnemo ničelno domnevo (in s tem sprejmemo osnovo), če velja osnovna domneva, imenujemo moč preizkusa . Čim večja je moč preizkusa, tembolj verjetno je, da bomo zavrnili ničelno in sprejeli osnovno domnevo, če ta velja. Obratno pa ugotovimo, da je z verjetnostjo (l možen napačen sklep, ki ga imenujemo napako II. vrste. Napaka II. vrste je v tem, da ničelno domnevo sprej¬ memo, če ta ne velja. Vse štiri možne situacije, katere morejo nastopiti pri preizkušanju domnev, so nakazane v primerjalnem pregledu. - 324 Primerjalni pregled nočnin situacij pri preizkušanju enostavnih domnev. 13.6 Odvisnost moči preizkusa od velikosti vzorca. Pri da- niP. domnevah je preizkus tem' močnejši, d im večji je vzo¬ rec. Kako je v našem zgledu moč preizkusa odvisna od velikosti vzorca, je ponazorjeno v sliki in tabeli za vzorce n= J, n=16 in n = 25. 325 15.7 Značilnost in ne značilnost razlik in vzorčnih izrazov. V prikazanem zgledu preizkusa domnev o izvoru surovin smo za x določili: a) kritično območje, b) območje sprejema ničelne domneve. Če pada x v kritično območje, sklepamo, da z razmeroma majhnim tveganjem zavrnemo ničelno domnevo H, in sprejmemo osnov no domnevo. Ta sklep strnemo v ugotovitev, da je preizkusni x značilno različen od M Q , ki ga postavljamo z ničelno domnevo. Značilne razlike pomenijo, da je vzorec s tveganjem, ki ni večji kakor <*., odkril, da ne velja ničelna temveč osnovna domneva. Obratno pa sklepamo, da so razlike neznačilne, če x pade v ob¬ močje sprejema ničelne domneve. Ce so razlike neznačilne, po zgornjem pravilu sprejmemo ničelno domnevo. Ker pa ne poznamo verjetnosti za napako II. vrste, vemo pa, da more biti tudi razmeroma velika, običajno sprejmemo ničelno domnevo, če so raz¬ like neznačilne z razlago, da jo sprejmemo, ker ni razloga, da bi na osnovi vzorčnega rezultata dvomili v njo. Če pri prever¬ janju dela stroja v proizvodnem procesu s preizkusnim vzorcem ugotovimo, da je preizkusni x neznačilno različen od predpisa¬ nega (ki se sklada z ničelno domnevo), vzamemo, da teče pro¬ izvodni proces v redu, ker na osnovi preizkusnega vzorca nimamo osnove, da dvomimo v to. Gornji sklep je ena izmed možnih odločitev pri nezna- čilnosti razlik pri preizkušanju domnev. Ker je kritična meja in s tem tudi značilnost vzorčnih j_zrazov bistveno odvisna od velikosti preizkusnega vzorca, sklepamo lahko tudi tako, da mo¬ re neznačilnost izvirati iz tega, da je vzorec premajhen in je neznačilnost razlik razlog, da preizkusni vzorec povečamo in skušamo odkriti značilnost razlik z večjim vzorcem. 15.8 Stopnje značilnosti . ker je kritično območje odvisno od tveganja ot, se more zgoditi, da je x v kritičnem območju, če je večji, da pa je v območju sprejema ničelne do¬ mneve za manjše tveganje oi. Zato govorimo, da je razlika značil¬ na na ravni d = 0,05, če 30 razlike značilne stopnji tveganja cl = 0,05, niso pa značilne na stopnji c<- = 0,01. Razlike smatra¬ mo za značilne na ravni oc= 0,01, če so značilne s tveganjem os./ = 0,01, niso pa značilne na ravnioc= 0,001. In končno: razli¬ ke smatramo za značilne na ravnioc^ 0,001, če se izkažejo zna¬ čilne na ravni ou = 0,001. Te tri s + opnje so seveda vzete kon¬ vencionalno. Ker je s-topnja tveganja na ravniot= 0,10 razmeroma veliko, sklepamo, da obstaja sum j.a značilnost razlik, če je vzorčna vrednost v kritičnem območju z oi = 0,10 in v območju sprejema za cc= 0,05. 15.9 Vzorčni izrazi . Poprečje in vse druge parametre pa eno- s tavneje le ot direktno preizkušamo prek vzorčnih izrazov ki vsebujejo rezultate preizkusnega vzorca in domevne vrednosti. - 326 - Če je populacija v skladu z domnevnimi vrednostmi, vzorčni izra¬ zi slede določenim zakonitostim«, Tako se izraz M _ (T = z (l5o3) porazdeljuje standardizirano normalno, Če velja ničelna domneva Hq: M 0 = M. Preizkušanje domnev o aritmetični sredini je z naka¬ zanim vzorčnim izrazom enostavnejše, ker dobimo kritične vredno¬ sti za z direktno iz tabel o standardizirani normalni porazdelit¬ vi. Tako štejemo, da so razlike na določeni stopnji značilne ali neznačilne, če je absolutna vrednost za z v mejah. 1,645 1,96 2,56 3,29 Če ničelna domneva ne velja, moremo gornji vzorčni izraz razdeliti v dva dela Prvi del ]fn' sledi zakonitost za standardizirano normalno porazdelitev, ker je v njej prava aritmetična sredina. ffLzil o p a j e konstanta, ki zavisi od; razlike med Drugi del pravo In domnevno aritmetično sredino M - M r , merjeno v standard¬ nih odklonih in od velikosti vzorca n. Ražlika z večjo verjet¬ nostjo odstopa od zakonitosti z, čim večja j P razlika M-Mq, čim reč ji je vzorec n in čim manjši je standardni odklon 6 „ 1 < -II- 1976 / Y