n..... Narodna in univerzitetna knjižnica v Ljubljani I . V V . . : ; : ■ ' », ■ H : . . . ..... i •: ■ n : " : • : , ■' . : \ ' ' - • ■ - m i . v j i s 1 ■ - - ■ . Ufi J • ■ ~• ■ ■ . : r . . / /: &%}' Ntžfr ' ■ '. . . 1 m ' t , ■ • ’ f V.-' 1 -' 4f .’ ’ .?> J -j' : ... >>.: Vi-:;* ‘ ■ >T T- V/ \ . . ' >■■ ' • V :' v ' v . : , ' •V>. • * < v " ' V ' •• ■ ■' •’ t ' " ' ■■ ■■ :". v ; > ■ : V' 'v-'’,. . • • . ' pvk\'| %-vn' : JT' :>H” 7 - -M;/ /' /,:• / -i> -V t V •’ • V. v: ; ;; . i 4 ■ ■ . . . : ■ . > ■ ■ ■ -, •, L . * *' ' j- ’• • v > •k/&' ’ v ... t ... M .. • v,- ■: • / XA ■ i. - J > k •. 5; » A : U'O p - . ■ -* '--vn v .. r v' "f ?'i j J I* ' v ' i *' f* g -p, * ’ i H ‘ ■ ; i J . . ■ * , -. *cnf ■ ri-. 5, r -r‘ * •* .- v '>y • ;vy ' v • * * f * x !H 1 y-. . < 4 .* r * Mi f$;«| ■ rv-r. : ’ V ■' ' /■ ; ' • : > . • • ‘ : > . . J>. *• • :•. ‘ •• ; P* > V - : ; .* - •. ... ■ : ^ ' ' . ' • : • ‘ / ' ’ - i - » vi : : . . * ! -/'M' :/ ' i *■* -%4 t-;- Ca : . i: ‘' %■. ■ 'k-v4-. v' >.--P > V n . f .. •; -. . . , ... ' . v • ' . .. 1 ‘ ■ ! ‘ - , , i - - ' *,JS, j f3i| ; 5 . ■ i ; ; , ' ■ * , ■! ’ ■ ‘ , ^ \ypl 4 i : ,9 i’£ž ' -.#■ ■ š : ■ . . *• - ■ . ■ 4 ■ ■ - j.- ;; ■■■■-.■ 1 ; . .. V -v I •A;V ;; / . ' ’} ■■ ? . ; •' ' .. . %s s .. • i ’■ ,yVivi^ r ■ r i:;*:.* ; . . : . i. i; . v ... I.. '■ ■ ... ! ■ ; ■ , ’ . i ■ ;■■ -, „•■ .' ; : ■ , •/j'-. ~%A f 'M-- ,:. ■ \ Jht : fi .'Tv ' j H : : .. -i s- y ... t ... : ?.•“ 7 ■ ' .- i . '■ s 4 • ' -V'. Iliff i 1 * ' ; *4'. r . ■ .:,T . y 4 T*i®i vHi- ; / • •' V . ■:.v,4-'• ■’ Iti, - ■ ft*V ..v i- - >,/ . f. •• § Ti : . v 3- • • > mi smminm MIJ , i . ; : ? 7 ; -... fi r> i' - ''. i.i f ; ;/S’V. HRZA V LJUBLJANI •NOMSKA FAKULTETA MARIJAN BLEJEC POSLOVNA STATISTIKA Druga izdaja LJUBLJANA 1976 UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA MARIJAN BLEJEC POSLOVNA STATISTIKA Druga izdaja LJUBLJANA 1976 275217 Založila in izdala Ekonomska fakulteta v Ljubljani Tiskala Univerzitetna tiskarna v Ljubljani Naklada 1500 izvodov PREDGOVOR K DRUGI IZDAJI Druga izdaja učbenika Poslovna statistika je prirejena po učbeniku M.Blejec: Sta¬ tistične metode za ekonomiste, druga predelana in razširjena izdaja, Ekonomska fa¬ kulteta, Ljubljana 1973. Učbenik obsega snov, ki je v učnem programu za predmet Poslovna statistika I. na prvi stopnji poslovne smeri na Ekonomski fakulteti v Ljubljani. Učbenik je razdeljen v 12 poglavij, od katerih vsako obravnava bodisi posamezno fazo statističnega proučevanja ali statistične metode analize. Zgledi, ki ilustrirajo posamezne postopke, so vzeti predvsem iz publikacij Zvezne¬ ga zavoda za statistiko in Zavoda za statistiko LRS. Viri so pri posameznih tabelah, podatkih in grafikonih označeni največkrat s kraticami publikacij oziroma ustanov, ki so podatke dale. Uporabili smo tele kratice: SG = Statistični godišnjak ; Zvezni zavod za statistiko (Številka zraven kratice po¬ meni letnik (npr.: SG-57) SB = Statistički bilten: Zvezni zavod za statistiko (številka zraven kratice pomeni številko biltena) I = Indeks, Zvezni zavod za statistiko SL = . Statistični letopis LRS; Zavod za statistiko LRS (številka zraven kratice pome¬ ni letnik) - 3 - SB-LRS = Statistični Bilten LRS MSP = Mesečni statistični pregled; Zavod za statistiko LRS. Ljubljana, marec 1976 M. Blejec - 4 - VSEBINA Str. 1. UVOD .,. 15 Kaj je statistika. 15 Področja, v katerih uporabljamo statistiko .. 16 Socialno-ekonomska statistika. 18 2. PROUČEVANJE MNOŽIČNIH POJAVOV Množični poiavi. . 21 Statistične enote. 23 Statistični znaki. 24 Statistične populacije. 29 Statistični parametri. 33 Značilnosti pri proučevanju množičnih pojavov. 34 Etape statističnega proučevanja. 39 3. STATISTIČNO OPAZOVANJE Opredelitev predmeta opazovanja-statistične populacije. 43 Vrste opazovanj .. 44 Longitudinalno in transverzalno opazovanje. 45 Popi s. v . 47 Tekoča registracija-statistična poročila. 49 Delna opazovanja. 50 - 5 - Str. Viri podatkov.. 52 Načini posrednega opazovanja. 54 Znaki opazovanja. • 57 Sredstva opazovanja... 58 Kraj opazovanja. 66 Organi statističnega opazovanja. 67 Napake in kontrola pri statističnem opazovanju. 69 4. UREJEVANJE IN OSNOVNA OBDELAVA STATIS¬ TIČNEGA GRADIVA Grupiranje vrednosti znakov. 75 Šifriranje osnovnega gradiva. 87 Osnovna obdelava statističnega gradiva. 88 5. PRIKAZOVANJE STATISTIČNIH PODATKOV Statistične vrste. 100 Statistične tabele. 104 Grafično prikazovanje. 110 Prvine grafičnega prikazovanja. 111 Skale - lestvice. 113 Mreže. 116 Vrste grafikonov. 118 Stolpci. 118 Linijski grafikoni. 122 Figure. 128 Kartogrami. 130 6. RELATIVNA ŠTEVILA Strukture ali razčlenitvena števila. 138 Enostavne strukture . 138 - 6 - Str. Večkratne strukture. 140 Splošne zveze za dvojne strukture. 142 Grafično prikazovanje struktur. 144 Statistični koeficienti in gostote. 157 Statistični koeficienti in gostote. 157 Grafično prikazovanje. 168 Enostavni indeksi. 174 Stvarni in krajevni indeksi. 176 Časovni indeksi. 177 7. FREKVENČNE PORAZDELITVE Sestavljanje frekvenčnih porazdelitev ... 185 Frekvenčne porazdelitve z neenakimi razredi. 188 Grafično prikazovanje frekvenčnih porazdelitev. 191 Oblike frekvenčnih porazdelitev. 195 Kumulativna frekvenčna porazdelitev. 200 8. KVANTIH . 203 Ranžirna vrsta, rang. 203 KvantiIni rang. 205 Kvantili. 206 Rang grafikon. 211 Izračun kvantilnih rangov in kvantilov iz frekvenčnih porazdelitev 213 9. SREDNJE VREDNOSTI Vrste srednjih vrednosti. 220 Mediana. 220 Modus. 221 Aritmetična sredina. 224 Izračun aritmetične sredine iz frekvenčnih porazdelitev ... 228 - 7 - SlT. Aritmetična sredina aritmetičnih sredin. 233 Harmonična sredina. 234 Poprečja iz relativnih števil.' 237 Standardizirani pokazovalci. 240 Geometrijska sredina . 242 Odnosi med različnimi vrstami srednjih vrednosti. 246 10. MERE VARIACIJE IN KONCENTRACIJE Mere variacije. 249 Vrste mer variacije. 249 Variacijski razmik. 250 Kvartilni odklon. 251 Poprečen absolutni odklon. 252 Varianca . Standardni odklon. 254 Izračun iz negrupiranih podatkov. 254 Izračun iz grupiranih podatkov... 256 Skupna varianca... 260 Zveza standardnega odklona z normalno porazdelitvijo... 262 Poprečna razlika . 263 Razmerje med Q, AD in SD za normalno porazdelitev. 265 Relativne mere variacije. 266 Mere koncentracije. 270 Lorenzov grafikon. 270 11. PROUČEVANJE DINAMIKE POJAVOV - ČASOVNE VRSTE Oblike časovnih vrst. 275 Trenutne in razmične časovne vrste. 276 Izvedene časovne vrste. 277 Kumulativna časovna vrsta . 277 - 8 - Str. Vrsta sredin. 278 Vrsta drsečih vsot. 280 Časovna vrsta drsečih sredin. 282 Grafično prikazovanje časovnih vrst... 286 Pol logaritemski grafikon... 287 Polami grafikon. 292 Analiza časovnih vrst. 294 Primerljivost podatkov v časovni vrsti. 294 Enostavni pokazovalci dinamike. 299 Sestavine dinamike v časovnih vrstah. 302 Vloga poprečij pri proučitvi časovnih vrst... 305 Trend. 306 Metode za določanje trenda ..... 307 Prostoročna metoda. 307 Metoda drsečih sredin. 309 Določitev linearnega trenda po metodi najmanjših kvadratov ... 311 Transformacija časa... 311 Linearni trend. 312 12. PROUČEVANJE ODVISNOSTI MED MNOŽIČNIM! POJAVI Funkcijske odvisnosti .. 315 Korelaci jske odvisnosti...... 315 Prikazovanje korelacijskih odvisnosti. 318 Regresijska krivulja ... 325 Metode za določanje regresijske krivulje... 327 Mere jakosti odvisnosti... Standardna napaka ocene. 336 Linearna odvisnost. 337 Pokazova ici. 337 Izračun pokazova!cev za linearno odvisnost. 339 -9-T4- PRVO POGLAVJE UVOD KAJ JE STATISTIKA? . i Z imenom statistiko razumemo več stvari. Statistike so številčni p o d a t k i , s kateri¬ mi opisujemo pojave iz najrazličnejših socialno-ekonornskih področij. Tako so statistike zbrane v najrazličnejših publikacijah, statističnih letopisih, specialnih statističnih publi¬ kacijah, npr. o industrijski statistiki, kmetijski statistiki, statistiki prebivalstva itd. Kot statistiko razumemo tudi delo pri zbiranju statističnih podatkov. Pako imamo statistiko zunanje trgovine; v njej zbiramo podatke iz področja zunanje trgo¬ vine; industrijsko statistiko, ki zbira podatke iz industrijske dejavnosti; kmetijsko statis¬ tiko, ki se ukvarja z zbiranjem podatkov iz kmetijstva, itd. 2 imenom statistika obeležujemo tudi organe, ki zbirajo statistične podatke. Tako pomeni državna statistika mrežo vseh organov, ki zbirajo podatke iz najrazličnejših soci- alno-ekonomskih področij, da prikaže številčno sliko dogajanja, ki rabi državnim in dru¬ gim organom za njihovo delo in analizo. Statistika kot znanost pa pomeni teorijo in metode statističnega proučevanja. Sta¬ tistiko kot znanost opredelimo takole: statistika je veda, ki s številčnim prouče¬ vanjem množičnih pojavov, z metodami, ki so njej lastne, odkrivc zakonitosti množičnen ga pojavljanja in podaja kakovostno analizo pojavov. - 15 - Iz te opredelitve spoznamo, da ima statistika svoje področje-množične pojave ~ in svo¬ jo metodo, da s kvantitativnim proučevanjem analizira kvalitativne odnose množičnih po¬ javov. Tako na primer količina proizvodnje, proizvedena v enoti časa; pokaže produktiv¬ nost dela, višina hektarskega donosa uspeh agrotehničnih mer v kmetijstvu, koeficient •umrljivosti zdravstveni standard itd. Ker je v statističnem proučevanju pojavov vedno poudarek na metodi proučevanja, je v uporabi teh metod statistična metoda v ozki povezavi z znanostjo v katero spada prouče¬ van pojav. Zato bi mogli imeti statistiko le za eno izmed metod za proučevanje pojavov. Vendar statistična metoda,razen v nekaterih posebnih primerih, ni bistveno vezana na do¬ ločeno področje, marveč veljajo njene metode in zakonitosti neodvisno od predmeta za vse množične pojave.Tako matematična statistika,ki razvija metode proučevanja množič¬ nih pojavov in katere osnova so postavke verjetnostnega računa, razvija svoje metode ne¬ odvisno od področja uporabe. Zato je statistika kot znanost v ozki zvezi z matematiko, soj se tudi ukvarja s številčnimi odnosi, vendar po ne s kvantitativnim proučevanjem mno¬ žičnih pojavov. Statistiko moramo ločiti od evidence, ker bi mogla v nekaterih področjih nastati zmedo v razmejitvi med statistiko in evidenco. Kakor knjigovodstvo ni statistika, tako tudi eviden¬ ca na splošno ni statistika, čeprav se knjigovodstvo in evidenca ukvarjata z množičnimi pojavi. Knjigovodstvo in evidenca sistematično registrirata pojave, ki so množični. To pa je edino stična točka s statistiko. Namen zbiranja podatkov v knjigcrt/odstvu. in evidenci je predvsem registrirati posamezne dogodke ali stvari, brez težnje, da bi iz teh podatkov dali sliko ali analizo celote. V statistiki pa je registracija samo sredstvo, ki omogoča,da s statističnimi metodami analiziramo pojav in množico podatkov kot celoto. Posamezen po¬ jav je v statistiki zanimiv same toliko, kolikor prispeva k tej splošni sliki ali analizi poja¬ ve. Knjigovodstvu in evidenci je torej registracija namen, medtem ko je statistiki le sred¬ stvo. PODROČJA, V KATERIH UPORABLJAMO STATISTIKO 1.2 Beseda statistika je izšla iz latinske besede "status"-država. Ta izraz je za prouče¬ vanje množičnih pojavov zgodovinsko upravičen. Razvojno je statistika res rabila najprej za opisovanje ekonomskih in socialnih razmer v razvitih državah starega in sred- - 16 - njega veka. Vendar je ta pojem že dolga nekaj drugega kakor za metodo opi¬ sovanja socialnih in ekonomskih razmer v državi. Statistika je razširila in razvila svo¬ jo metodologijo na splošno proučevanje množičnih pojavov, od katerih je mnogo ta¬ kih, ki jih ne uporabljamo za opis in analizo ekonomskih in socialnih razmer v državi. Razen tega po je statistika tako razširila področje uporabe, da so socialno-ekonomski pojavi samo eden, čeprav ne najmanjši sektor v uporabi statističnih metod. Ker so statistiko razvojno dolgo časa uporabljali izključno v socialno-ekonomskih zna¬ nostih, je prevladovalo dolgo časa mišljenje, da s statistiko proučujemo le socialno¬ ekonomske pojave in da se zato vtapija v socialno-ekonomskih znanostih. Vendar je statistika osvajala vedno nova področja uporabe. Na prelomu med devet¬ najstim in dvajsetim stoletjem opazimo velikansko povečanje uporabe statistike v vseh področjih in silen razvoj v statistični metodologiji. Statistika je postala ena izmed osnovnih metod za proučevanje v najrazličnejših znanostih. Statistika je še vedno ostala ena osnovnih metod za proučevanje v socialno-ekonomskih znanostih. Poleg splošnih metod statistike so rczvili tudi take, ki jih uporabljamo iz¬ ključno za proučevanje socialnih ali ekonomskih pojavov. Prav tako je statistika veli¬ ko pripomogla k razvoju in uporabi ekonometričnih metod. Statistika je tako osnovna metoda v demografskih proučevanjih, da so demografijo ce¬ lo istovetili z demografsko statistiko. Metode statistične analize z velikim pridom uporabljamo tudi v biologiji. Problemati¬ ka biologije je bila v mnogih primerih povod za izdelavo nekaterih statističnih metod, ki so jih v začetku uporabljali samo v biologiji, kasneje pa so se kot splošne metode proučevanja množičnih pojavov razširile tudi na druga področja. Skoraj vsa metodološ¬ ka plat biometrike je statistika. Enako je statistika ena izmed metod merjenja v psihologiji, ki so združene v psihome- triki. Testiranje, ki j« osnova marsikaterega'psihološkega proučevanja, je zasnovano na statistiki. - 17 - Statistiko z velikim pridom uporabljamo tudi v meteorologiji. Agronomija je tudi tipično področje za uporabo statističnih metod pri načrtovanju po¬ skusov. Statistika ima svoje mesto tudi v moderni fiziki. Kinetična teorija plinov, mehanika in radioaktivnost, vse to so področja, v katerih veljajo zakonitosti množičnega pojav¬ ljanja in zanje statistika pomaga odkrivati in tolmačiti najrazličnejše zakonitosti. Statistika si je priborila posebno mesto v sodobni industrijski proizvodnji. Množičnost in tempo proizvodnje je pri kontroli proizvodnega procesa in proizvodnje zahtevala no¬ ve metode. Na osnovi vzorčenja, ki ga bomo kasneje podrobneje proučevali, so izde¬ lali specifične in učinkovite metode zo kontrolo proizvodnje in proizvodnih procesov. Statistiko so začeli uporabljati tudi v področjih, za katera bi na prvi pogled bila nje¬ na uporaba neutemeljena in nemogoča. S statističnimi metodami analizirajo celo literar¬ na dela, študirajo stile posameznih pisateljev in dob itd. Čeprav imamo statistiko za samostojno vedo, je v uporabi tesno povezana s predmetom, ki go s statističnimi metodami proučujemo. Ta zveza se kaže v tem, da pri določenem proučevanju sodelujejo v skupinskem delu strokovnjaki iz področja, iz katerega je pro¬ blem in strokovnjaki-stafistiki. Brez te zveze bi se proučevanje izrodilo v neuporabno preračunavanje številk, ne glede no to, da bi uporabljali razmeroma.visoke statistične metode. SOCIALNOEKONOMSKA STATISTIKA 1.3 Kakor smo že navedli, so statistiko začeli uporabljati najprej za proučevanje socialno-ekonomskih pojavov. To je izzvala razmeroma velika potreba po teh podatkih in razmeroma jasno opredeljen predmet proučevanja. Medtem ko ima v dru¬ gih znanostih statistika za predmet množične pojave, ki so bolj ali manj umišljeni in je njihovo število neomejeno, proučujemo v socialno-ekonomskih področjih množice realnih pojavov, ki so v času in prostoru v končnem številu. - 18 - Splošne metode statističnega proučevanja moramo uporabiti v vseh področjih, kjer na¬ letimo na množične pojave. Vendar so se v socialno-ekonomskih znanostih razen sploš¬ nih metod zaradi specifičnih lastnosti pojavov v teh področjih razvile metode, ki so tipične za proučevanje socialno-ekonomskih pojavov in jih v splošnem ne uporabljamo v drugih znanostih. Medtem ko so nekatere metode statistike, ki jih uporabljamo v so¬ cialno-ekonomskih področjih, splošnega značaja (srednje vrednosti, mere variacije,ko¬ relacija itd.), so druge take, da jih uporabi jamo samo ali pretežno za proučevanje so¬ cialno-ekonomskih pojavov. Med temi so na primer analiza časovnih vrst, teorija in¬ deksov in konjunkturna statistika. V tej knjigi obravnavamo splošne metode statističnega proučevanja socfolno-ekonom- skih pojavov. Posamezne metode obravnavamo na zgledih iz socialno-ekonomskih pod¬ ročij, vendar samo ilustrativno. Te metode na splošno uporabljamo za proučevanje ka¬ terega koli socialno-ekonomskega pojava. Tako z istimi statističnimi metodami za proučevanje časovnih vrst proučujemo dinamiko pojavov v demografiji, industriji, kme¬ tijstvu, prometu itd. Enako je s srednjimi vrednostmi, merami variacije, korelacijo in drugimi statističnimi metodami. 1 -4 Vendar so kljub nekim splošnim načelom in metodam analize v posameznih soci¬ alno-ekonomskih področjih posebnosti, ki se jim mora statistično proučevanje pri¬ lagoditi. Zato imamo razen splošne statistike tudi metode statističnega proučevanja, ki so ozko povezane z vsebino posameznih socialno-ekonomskih vej. Tako imamo posebej: Demografsko statistiko; ta obravnava posebnosti proučevanja pojavov prebi¬ va Istva s statističnimi metodami. Kmetijska statistika se ukvarja s posebnimi problemi statističnega proučeva¬ nja v kmetijstvu. Industri jska statistika ima tudi svoje posebne prijeme in probleme,ki jih re¬ šujemo s specifičnimi metodami . Analogno imamo nadalje gozdarsko statistiko, statistiko obrti, grad- - 19 - beništva, prometa, trgovine, sio . ..iko gostinstva , turizma, financ, statistiko cen, k u 11 ur n o-pr os v e t n o statistiko, statisti¬ ko zdravstva, sodno statistiko itd. Vsaka izmed teh statistik se ukvarja z vsebinsko problematiko iz svojega področja in je z njimi v ozki povezanosti. Navedene posebne statistike se pečajo s specifično pro¬ blematiko opredelitve, zbiranja in analize pojavov na svojih področjih. - 20 - DRUGO POGLAVJE PROUČEVANJE MNOŽIČNIH POJAVOV MNOŽIČNI POJAVI 2.1 V naravi in družbi pojavi ne nastopajo posami^marveč v velikem številu, ne izo¬ lirano, marveč povezani med seboj. Ce opazujemo te pojave individualno in izo¬ lirano, se zdi njihovo pojavljanje brez reda. V resnici pa veljajo zanje določene zako¬ nitosti. Te odkrijemo šele, če opazujemo ne samo posamezen pojav, temveč skupnosti pojavov. Omenili smo že, da statistika opazuje in analizira množične p o j a- v e . Množičen pa je vsak pojav, ki se v času in prostoru pojavlja v velikem številu. Na take pojave naletimo v različnih področjih, med drugimi tudi v socialno-ekonom- skih znanostih. Tako je na primer množičen pojav industrijsko podjetje, kupoprodaja, oseba, predmet, ki ga proizvajamo v množični proizvodnji itd. Če analiziramo pojave, ki množično nastopajo, odkrijemo, da ti pojavi niso med seboj enaki, marveč se v svojih značilnostih razlikujejo. Podjetja imajo različno število de¬ lavcev, različno mesečno proizvodnjo, različno porabo surovin, so iz različnih strok itd. Kupoprodaje se med seboj razlikujejo po času, prodajalcu, kupcu, ceni, količini, kakovosti prodančga blaga itd. Osebe so različnega spola, starosti, stanu, zaposlitve, imajo različno šolsko izobrazbo, mesečne prejemke, število otrok itd. Izdelki so raz¬ ličnih dimenzij, imajo različno kakovost, uporabnost itd., čeprav se zde na oko med seboj enaki. - 21 - 2.2 Če natančneje proučimo možnosti za analiziranje množičnih pojcvov, spoznamo, da je treba področje proučevanja opredeliti. Če na primer opazujemo prebival¬ stvo, ne moremo hkrati opazovati vsega človeštva v vseh časih, ker je to neizvedljivo, niti ni v posebnem v dani raziskav! zanimivo. Zato se omejimo samo na'del prebival¬ stva tako, da opredelimo, katerim pogojem morajo ustrezati osebe, ki so predmet kon¬ kretne raziskave. Z opredeljujočimi pogoji razmejimo pojave, ki jih proučujemo, od pojavov, ki v konkretnem primeru niso predmet proučevanja. Skupnost pojavov, ki jih opredelimo zato, da jih proučimo, imenujemo statistično množico ali populacijo. Čeprav je beseda populacija privzeta iz pojma prebivalstva, uporabljamo ta izraz za vse vrste statističnih množic. Populacija v statističnem smislu ni samo prebivaIstvo, temveč tudi skupnost in¬ dustrijskih podjetij v Jugoslaviji na določen datum, skupnost izdelkov, proizvedenih na določenem stroju v določenem času itd. Vsak posamezen pojav populacije imenujemo statistična enota . Tako je v zgornjih populacijah enoto posamezen prebivalec, posamezno industrijsko podjetje, posamezen artikel. Vsaka enota populacije ima veliko značilnosti. Izmed teh pa so samo nekatere predmet konkretnega proučevcnja. Značilnosti, ki sov posameznem primeru predmet proučevanja, imenujemo statistične znake, ali kratko , z n a k e . Vsak znak ima za posamez¬ ne enote različne vrednosti . Tako niso vsi ljudje enako stari, vsa podjetja nimajo enako število delavstva, vsi izdelki niso enako uporabni itd. Medtem, ko je spol znak za posamezno enoto, je število oseb v populaciji, ki so moške¬ ga spola, znočilnost za celotno populacijo, čeprav je ta podatek odvisen od tega, kak¬ šnega spola so posamezni prebivalci v populaciji. Enako je odstotek neuporabnih izdel¬ kov v proizvodnji za določen dan značilnost o celotni proizvodnji, ne pa značilnost za posamezen izdelek, čeprav smo ta podatek izvedli iz podatkov o uporabnosti posameznih artiklov. Značilnosti populacije, kot so npr. število moških v prebivalstvu, odstotek ne¬ uporabnih izdelkcv v dnevni proizvodnji, poprečen dohodek delavcev v neki stroki, po¬ prečen hektarski pridelek pšenice v socialističnih kmetijskih obratih, itd., imenujemo - 22 - parametre populacije. Enote sestavljajo populacije. Značilnosti enot imenujemo znake, značilnosti popula¬ cij pa parametre. Statistične enote 2.3 Po zgornjem uvodu opredelimo statistično enoto takole: statistična enota je vsak pojav, ki v času in prostoru množično nastopa in je predmet statističnega prouče¬ vanja. Po tej opredelitvi more biti enota v statističnem smislu: a) oseba (prebivalec, delavec, študent), b) žival (konj, krava, prašič itd.), c) stvar (avto, motor, izdelek), d) pravna tvorba (zadruga, društvo), d) administrativna enota (občina, krajevna skupnost), f) gospodarska tvorba (industrijsko podjetje, trgovina, kmetijsko gospodarstvo), g) dogodek (kupoprodaja, smrt, nesreča itd.), h) poskus (poskusna obdelava parcele, cepljenje živali), i) trenutek (v katerem opazujemo pojav), Formalno je važna delitev enot na: a) realne enote, b) dogodke in c) dogajanja . Realne enote so na primer ljudje, podjetja, živina itd., ker v času in prostoru obstajajo. Dogodki so pojavi, ki se v času dogode. Med dogodke štejemo npr. smrt, rojstvo, nesrečo, kupoprodajo. Dogodek se zgodi praktično vzeto v trenutku ali v zelo kratkem času. Vmesna stopnja med realnimi enotami, ki obstajajo in dogodki, ki se dogode trenutno, je dogajanje, ki traja dalj časa. Dogajanje je na primer gradnja hi¬ še, proizvodnja izdelka itd. Zgornja delitev enot je posebno važna pri opredelitvi popu¬ lacij. Od tega, ali proučujemo populacijo realnih enot, dogodkov ali dogajanj, je nam¬ reč odvisna časovna opredelitev populacije. Statistične enote so bodisi enostavne enote ali pa agregati - sku- p i n i c e enostavnih enot. Tako štejemo posameznega človeka za enostavno enoto. - 23 - Družina, občina, društvo itd. pa so agregati, ker so sestavljeni iz enostavnih enot: članov družine, prebivalcev občine, članov društva itd. Združevanje enostavnih enot v enote višje stopn je-agregate je za statistično proučevanje vsebinsko in tehnično iz¬ redno pomembno. Statistični znaki 2.4 Statistični znoki da jo enotam vsebino. Znaki so tiste značilnosti statističnih enot, ki so predmet proučevanja. Statistične enote oziroma množični pojavi na splošno imajo namreč veliko najrazličnejših značilnosti. V konkretni raziskavi pa podobno ka¬ kor iz množice pojavov izberemo populacijo, iz množice vseh možnih značilnosti izbe¬ remo tiste, ki so važne za proučevanje in te imenujemo znake. Katere značilnosti so v posebnem primeru znaki, je odvisno od namena proučevanja. Tako je pri splošnem popi¬ su prebivalstva neumestno , da vzamemo za znak številko čevljev, zbiramo pa podat¬ ke o zaposlitvi, številu otrok itd. Če pa anketiramo prebivalstvo z namenom, da zbere¬ mo podatke o velikosti nog za potrebe čevljarske industrije, vzamemo za osnoven znak velikost noge; nobenega smisla pa nima v tem primeru spraševati za poklic, po številu otrok anketirancev itd., ker te značilnosti nimajo zveze s predmetom proučevanja. 2.5 Vrste statističnih znakov. Vsebinsko delimo znake na: a) krajeyne a ii geografske, b) časovne i n c) stvarne .Krajevni ali geograf¬ ski znak je lahko kraj, ki je v zvezi z enoto proučevanja ali z dogodkom, ki je značilen za proučevano enoto. Tako je krajevni znak kraj rojstva, kraj stalnega biva- / lišča, kraj zaposlitve, sedež podjetja, kraj nesreče itd. Časovni so vsi znaki, ki so v zvezi s časom, v katerem se je zgodil kak dogodek, ki je v zvezi s proučevano enoto. Časovni znak je npr. čas rojstva novorojenčka, čas prodaje izdelka, čas ustanovitve podjetja itd. Vsi drugi znaki so stvarni. Stvarnih znakov je največ in z njimi označujemo vse značilnosti pojavov, ki niso krajevne ali časovne. -24 Glede na to, kako izražamo stvarne znake, aelimo stvarne znake na: a) atributivne in b) numerične. A t r i b u t i v n i so znaki, za katere vrednosti izražamo opisno,z besedami. Tako Je na primer atributiven znak_spol, ker so njegove vrednosti: moški, ženski, izražene z bese dami. Iz istega vzroka je atributiven znak tudi zaposlitev, panoga dejavnosti, vrsta zgradbe, vzrok smrti itd. Numerični so znaki, katerih vrednosti izražamo številčno. Po tem, katere vred¬ nosti morejo zavzeti, delimo numerične znake v: a) nezvezne - diskontinuirne inb) zvezne - kontinuirne. Nezvezen znak je na primer število čla¬ nov v gospodinjstvu, število otrok, ki jih ima mati, število delavcev itd. Nezvezni znaki morejo imeti samo neke, običajno cele vrednosti na določenem razmaku. Tako ne more imeti gospodinjstvo 3 1/2 članov, mati 1 1/4 otrok, podjetje 86 1/2 zaposle¬ nih itd. Zvezni znaki so tisti numerični znaki, ki morejo teoretično imeti vsako izmed vrednosti v določenem razmaku. Zvezni znaki so na primer starost, teža izdelka, premer profila. 2.6 Vrednosti časovnih in numeričnih znakov se dajo urediti po velikosti po nedvoum¬ nem vrstnem redu. Te lastnosti krajevni in atributivni znaki v splošnem nimajo. Možnost, da lahko uredimo vrednosti znakov po velikosti, je velika prednost časovnih in numeričnih znakov; omogoča namreč poglobljeno analizo, ki je za geografske in a- tributivne znake ne moremo izvesti. Možnost analize atributivnih znakov v primerjavi z numeričnimi je torej okrnjena. Medtem ko moremo vse metode za analizo atributivnih znakov uporabiti tudi za numerične znake, obratno niso vse metode za numerične znake uporabne za atributivne. 2.7 Iz vsebinskih razlogov, ki so pogoj za uporabo različnih metod statistične anali¬ ze, je pomemben značaj znakov. Tako govorimo o nominalnosti, ordi- nalnosti, intervalnosti in razmernosti znakov. Nominalnost je lastnost znakov, da moremo posamezne vrednosti znakov med seboj razlikovati. Nominalen značaj znakov je torej izražen z y, / y. . Samo nomi- * - 25 - nolen značaj imajo stvarno atributivni znaki, po Katerih moremo vrednosti znakov samo razlikovati. Ordinalnost znakov je v tem, da moremo vrednosti znaka ali enot urediti ozi¬ roma razvrstiti po logičnem zaporedju,običajno po velikosti. Ordinalnost znaka je iz- . Z ordinalnimi znaki pogosto tipološko izražamo stopnje kakovosti določenega pojma. Tipičen znak z orainalnim značajem je npr. kakovost izdelka,ta je izražena z : odličen, uporaben, neuporaben popravljiv, neuporaben nepopravljiv.Ena¬ ko je z ocenami: odličen, prav dober, dober, zadosten, nezadosten. Po znakih z oral- nalnim značajem moremo razvrstiti enote populacije po vrstnem redu, čeprav vrednosti znaka za posamezne enote ni mogoče izraziti numerično. Tako skupino delavcev razvr¬ stimo po prizadevnosti ipd. V tem primeru se izraža ordinalnost v tem, da moremo eno¬ te populacije glede na dano enoto razdeliti v enote, ki so manjše, slabše, manj uspeš¬ ne in v skupino enot, ki so boljše, večje, bolj uspešne kot opazovana enota. Na znake z orainalnim značajem naletimo pri najrazličnejših raziskavah. Ocenjevanje, preskuša¬ nje izdelkov, proučevanje okusa potrošnika, psihološke raziskave ipd, so navezane v veiiki meri na opazovanje znakov, ki so ordinalnega značaja. Vrednosti znakov z interva Ini m-razmičn i ni^ z na ča jem izražamo numerično. Vendar je zanje tipično, da ti znaki nimajo nekega enoličnega izhodišča. Tipičen primer intervalnosti znakov je temperarura. Njo merimo z različnimi skaiami, ki imajo različna izhodišča. Niz znakov s področja psihologije porabnika, vsi znaki,ki imajo značaj točkovanja, so primeri intervalnih znakov. Intervalncst znakov se izraža v tem, da moremo za znoke z intervalnim značajem izra¬ čunavati razlike med vrednostmi znakov y^ " =< ^ • Z razmerji med dvema vrednostima znaka je možna primerjava le za znake, ki imajo razmernosten značaj. Vrednosti takih znakov primerjamo z razmerjem y^/y-j -R. Razmernosten značaj imajo znaki, ki Imajo enolično izhodišče. Taki znaki so na primer količina, vrednost proizvodnje, velikost posestva ipd. Numeričnih znakov z razmernost- nim značajem je v socialno-ekonomskih raziskavah veliko. Vsi pojavi, ki po svojem zna- - 26 - čaju ne morejo biti negativni, imajo enonc,.^ izhodišče in so zato rozmernostni. Kot je razvidno iz opredelitve značaja znakov imajo razmernostni znaki tudi interva¬ len, ordinalen in nominalen značaj , infervalnost vključuje ordinalnost in nominalnost, ordinalnost po nominalnost. Tako imajo vsi znaki nominalen značaj, saj moremo vred¬ nosti za katerikoli znak grupirati v grupe. Če proučimo znake na splošno, spoznamo,da ima večina stvarno atributivnih znakov samo nominalen značaj, da pa ima večina stvar¬ no numeričnih znakov razmernosten značaj, ker moremo iz njih izračunavati razen ra¬ zlik tudi razmerja. Najbolj razvite so metode statistične analize za razmernostne znake. Zanje tudi naj¬ globlje prodremo v zakonitosti množičnih pojavov. Čim nižji je značaj znakov, tem bornejša je možna statistična analiza. Ze pri merah variacije se izkaže, da so relativ¬ ne mere variacije smiselne le za razmernostne, ne pa za znake, ki imajo le intervalen značaj. Čeprav je obseg metod in možnost analize za ordinalne in nominalne znake okrnjena, pa te metode, ki so na splošno vključene v neparametrične metode, dostikrat s pridom uporabljamo tudi pri proučevanju intervalnih in razmernostnih znakov. Neparametrič¬ ne metode namreč niso vezane na niz predpostavk, katerim mora običajno zadoščati populacija, da moremo uporabljati t.i. parametrične metode. Razen tega so običajno neparametrične metode tudi tehnično računsko manj zahtevne in zato racionalnejše. Gotovo pa je, da se vrednost dobljenih informacij z uporabo neparametričnih metod zmanjša. 2.8 Numerične znake delimo po drugem merilu na: a)_ekstenzivne in b) intenzivne. Ekstenzivni znaki nakazujejo količino, i n N e-tu ivni po koko - vost. Tako so ekstenzivni znaki npr. vrednost proizvodnje podjetja v določenem raz¬ dobju, število delavcev po podjetjih, količina določenega blaga na trgu itd. Inten¬ zivni znaki pa so na primer cena izdelka, produktivnost dela, merjena z vrednostjo proizvoda na enoto časa, hektarski pridelek'itd. - 27 - 2.9 Pomembna je delitev znakov po vlo^,,, k! jo imajo pri proučevanju množičnih pojavov. V tej zvezi razdelimo znake na: ojfaktorialne inb) re- zultafivne. Faktorialni znaki so izraz faktor jev-dejavnikov, k? vplivajo na pojav. Rezultativni znaki pa so rezultat vpliva dejavnikov, ki nanje vplivajo. Tako ■je na primer količina uporabljenega umetnega gnojila faktorialen, hektarski donos pa rezultativer, znak. Enako je število delavcev v podjetju faktorialen, vrednost proiz¬ vodnje pa rezultativen znak. Količina blaga na trgu je faktorialen, cena blaga pa je rezultativen znak. Zveze med faktoriolnimi in rezultafivnimi znaki kažejo, kako se spreminja vrednost rezultativnega znaka, če se spreminjajo vrednosti faktorialnih zna¬ kov. Proučevanje teh zvez je ena izmed važnih metod v statistični analizi. 2.1 0 V a r i i ra n j e statističnih znakov. Vsak znak ima določeno število vred¬ nosti znakov. Število vseh teoretično možnih vrednosti je najmanj dve, največ neomejeno. Spol ima na primer dve vrednosti: moški, ženski; stan štiri vrednosti: sam¬ ski, poročen, razvezan, vdovec; poklic veliko, vendar končno število različnih mož¬ nih vrednosti, človekova starost pa teoretično neomejeno število vrednosti. Značilno za znake je, da imajo posamezne enote različne vrednosti znakov. Temu po¬ javu pravimo variiranje statističnih znakov. Statistični znaki so torej variabil¬ ni. Da imajo nekatere enote tudi iste vrednosti enega in istega znaka, ni v nasprotju z opredelitvijo variabilnosti. Vsaka oseba v dani populaciji namreč ne more biti različ¬ nega spola, če ima znak spol samo dve vrednosti: moški ali ženski. Variabilnost statističnih znakov je ena izmed temeljnih lastnosti množičnih pojavov. Statistika se predvsem in v najrazličnejših oblikah ukvarja z variabilnostjo pojavov. Če množični pojavi ne bi bili variabilni, pojavov sploh ne bi proučevali s statističnimi metodami. Zato smo tudi navedli, da ima statistični znak najmanj dve vrednosti, saj značilnost z eno samo vrednostjo ne more biti statistični znak, ker ne variira . Posebno važna je variabilnost numeričnih znakov. Kakor bomo videli kasneje, je va¬ riabilnost numeričnih znakov osnova za na [podrobnejšo proučevanje numeričnih poja¬ vov . - 28 - Vrednost znaka variira v populaciji od enem. v o enote. Vrednost znaka pa se spremi¬ nja tudi časovno za isto enoto. Tako se starost spreminja zvezno, kraj zaposlitve pa skokoma, ker je za neko razdobje isti, se pa teoretično ob menjanju zaposlitve v mo¬ mentu spremeni. Imamo pa tudi znake, katerih vrednost ostane za enote stalna. Tak znak je na primer kraj rojstva, leto ustanovitve podjetja itd. č n e populacije 2.11 Opredelitev statistične populacije. Statistična populacija je mno¬ žica vseh istovrstnih pojavov - statističnih enot, ki izpolnjujejo opredeljujo¬ če pogoje , s katerimi je opredeljena. Statistično populacijo opredelimo tako, da navedemo, kakšne vrednosti znakov, ki so opredeljujoči pogoji, morajo imeti enote,da so enote populacije. V znakih, ki opredeljujejo populacijo, je torej variacija okrnje¬ na. Ce proučujemo razmere zaposlenih poročenih žensk na področju Slovenije po stanju 31.12.1972, je s tem že opredeljena populacija, ki jo proučujemo. Proučujemo samo poročene, zaposlene ženske. V stanu, zaposlenosti in spolu populacija ne variira.Ena¬ ko je z variacijo v časovnem znaku, ker je populacija opredeljena s teoretično trenut¬ nim stanjem konec leta 1972. V krajevnem znaku pa je variabilnost populacije okrnje¬ na, ker proučujemo žene v Sloveniji. Za populacijo ne velja samo množica vseh statističnih enot v gornjem smislu, marveč je populacija tudi množica podatkov za neki znak. Tako je populacija v tem smislu tu«’’ di množica vseh podatkov o starosti poročenih zaposlenih žena v SRS po stanju 31.12. 1972. 2.12 Kakor vidimo iz gornjega zgleda, mora biti populacija nedvoumno opredeljena: a) časovno, b) krajevno in c) stvarno. Gornjo populacijo smo časovno opredelili tako, da smo navedli: enote populacije so samo tiste ženske, ki zadoščajo vsem opredeljujočim pogojem konec leta 1972. Krajev¬ no je zgornja populacija opredeljena s tem, da navedemo: enote populacije so samo -2.9- ženske, ki zadoščajo drugim opredeljujočim ^gojem in so v Sloveniji. Stvarno je po¬ pulacija opredeljena s tremi znaki: s stanom, s spolom in z zaposlenostjo. V splošnem krajevna opredelitev ne dela posebnih težav. Običajno pri krajevni opredelitvi uporabimo obstoječo upravno razdelitev teritorija. To olajša krajevno opredelitev. Razen tega pa imajo večjo operativno vrednost podatki, ki so dani za območja, skladna z upravno razdelitvijo. Časovno opredelitev je bolj problematična in je odvisna od narave po¬ pulacije, ki jo proučujemo. Zgornjo populacijo žensk smo opredelili s trenutkom, ker je populacija realnih enot. Zato populacije realnih enot včasih tudi imenujemo momentne ali tre¬ nutne populacije. Momenfnih populacij imamo veiiko. Vse časovno enolično o- predelimo z momentom, v katerem morajo posamezne enote populacije zadoščati vsem drugim pogojem, da so enote populacije. Ce se je katera izmed zaposlenih žena poro¬ čila v januarju, ne sodi v populacijo. Enako tudi ni enota populacije poročena žena, ki je bila še zaposlena v decembru 1972, je pa v decembru prekinila delovno razmer¬ je. Momentna opredelitev populacij realnih enot je potrebna zaradi nedvoumne razmejit¬ ve pojavov v pojave, ki so enote populacije, od pojavov, ki niso enote populacije. Če bi populacijo stvarnih enot skušali opredeliti z razdobjem, te nedvoumnosti ne bi dosegli. Če bi obravnavano populacijo zaposlenih poročenih žena opredelili časovno z mesecem decembrom 1972, bi bilo dvomljivo, katere žene pridejo v populacijo in katere ne. Problematični bi bilo vsi primeri žena, ki so se v decembru bodisi zaposli¬ le ali prekinile delovno razmerje, umrle ipd. Časovna opredelitev populacij dogodkov z momentom ni smiselna. V določenem mo¬ mentu se more zgoditi in se zgodi samo omejeno in slučajno število dogodkov. Tako ni¬ ma smisla iskati populacijo rojstev, nesreč, smrti, proizvodnje itd., ob določenem mo¬ mentu. Populacijo dogodkov opredelimo z razdobjem in vanjo štejemo vse dogodke, ki so se zgodili v določenem razdobju in zadoščajo vsem drugim pogojem. Te populacije imenujemo intervalne ali razmične populacije, ker so opredeljene s ča- - 30 - sovnimi razmiki. Intervalne populacije so npr. proizvodnja, rojstva, nesreče, prodaja itd. Dogajanja imajo intervalen in momenten značaj. Zato moremo opredeliti populacijo gradenj momentno, če iščemo populacijo poslopij, ki so v gradnji in intervalno, če iščemo populacijo poslopij, ki so jih v določenem razdobju gradili. Stvarno je obravnavana populacija žensk opredeljena s spolom; ženske, zaposlenostjo: zaposlene in stanom: poročene. Za to populacijo je stvarna opredelitev enostavna. V splošnem pa je stvarno opredelitev populacij najtežja in zahteva dobro poznavanje in proučitev pojava, ki ga raziskujemo. Iz navedenega spoznamo, da v opredeljujočih znakih enote ne varirajo (spol: ženske) ali pa je variiranje okrnjeno (kraji Slovenija). a)realne enote opredelitev: momentna ■»-w bi dogodki opre delitev: interval c) dogajanje opredelitev ca.moment c b:in ter val Slika 2.1 Momentna in intervalna opredelitev 2.13 Homogene in heterogene populacije. Po sorodnosti enot so populaci” je homogene - istorodne in heterogene - raznorodne. V homogenih populacijah enote med seboj niso preveč različne, medtem ko so heterogene populacije sestavljene iz raznorodnih enot. Homogenost populacije dosežemo, če jo opredelimo.po čim več faktorialnih znakih ."Delitev populacij na homogene in heterogene ni ostra in imamo bolj ali manj homogene in bolj ali manj heterogene populacije. Tako je populacija obrt¬ mi- nih podjetij za določeno stroko, v katerih obrtnik razen sebe zaposluje enega samega delavca, bolj homogena kot populacija obrtnih podjetij za isto stroko ne glede na šte¬ vilo zaposlenih. Čeprav druga populacija ni heterogena, je vendar manj homogena kot prva. Homogenost populacij je sicer pogojena z opredeljujočimi pogoji, ni pa is- ■ tovetna. Opredelitev v faktorialnih znakih ima za posledico manjše variiranje oziro¬ ma večjo sorodnost ne samo v opredeljujočih temveč tudi v rezultafivnih znakih, ki ni¬ so opredeljujoči. Krajevna opredelitev kmetijskih gospodarstev pogojuje homogeno po¬ pulacijo glede na strukturo proizvodnje, način gospodarjenja ipd. 2.14 Delne popul a c i j e . Če v zgornji populaciji zaposlenih poročenih že¬ na v Sloveniji konec leta 1972 dodamo pogoj, da je zaposlena kot delavka, iz prve populacije izločimo novo populacijo. To populacijo imenujemo delno populacijo prvotne, zato ker je vsaka enota druge populacije hkrati enota prve populacije. Populacijo moremo po nekem znaku razdeliti v popoln sistem delnih populacij, če jo razdelimo v delne populacije po vseh vrednostih nekega znaka. Tako moremo populaci¬ jo vseh obrtnih obratov v Sloveniji konec leta 1972 razdeliti po strokah v popoln sistem bi razdelitev v delne populacije po A cldvojna razdelitev v delne populacije po A in B Slika 2.2 Delne populacije delnih populacij. Delne populacije so bolj homogene kot osnovna populacija, ker se enote delnih populacij ujemajo še v dodatnem pogoju. Če populacijo razdelimo v po¬ poln sistem delnih populacij po nadaljnjih faktorialnih znakih, heterogeno populacijo . razdelimo v sistem homogenih populacij. To metodo večkrat uporabljamo pri analizi množičnih pojavov. - 32 - V sliki 2.2 je nakazana osnovna populacija in delna populacija, razdelitev popula¬ cije v popoln sistem delnih populacij po enem in dveh znakih. 2-15 Korespond ir u j oče populac ije. Med nekaterimi momentnimi in inter¬ valnimi populacijami je zveza, ki je nakazana z naslednjim zgledom. Če vzame¬ mo moment.no populacijo-prebivalstva v začetku leta 1968 v SRS, smrt vsakega izmed teh prebivalcev vpliva na momentno populacijo - prebivalstvo konec leta 1968 tako, da se populacija za eno enoto zmanjša. Vsako rojstvo pa ima obraten učinek in se po¬ pulacija prebivalcev za eno enoto zveča. Vsa rojstva v letu 1968 so intervalna popuia- Cl ja rojstev, vse smrti v tem letu pa intervalna populacija smrti. Iz zgleda vidimo, da sta dve momentni populaciji (prebivalstvo v začetku in prebivalstvo na koncu leta) od¬ visni od dveh intervalnih populacij (populacije smrti, in populacije rojstev v letu). Šte¬ vilo enot v posameznih populacijah pa je v tejle zvezi P, = P + R - S (2.1) 1 o ' Pri tem pomeni: Pj = število prebivalcev konec leta; P q * število prebivalcev v začet¬ ku leto; R = letno število rojstev; S = letno število smrti. Podobno so korespondirujoče populacije tudi druge populacije. Enako se vežejo na pri¬ mer : začetna zaloga-nabavljeno-porobljeno-končna zaloga; oli: delavstvo na začetku meseca: na novo prišli-odšli-delavstvo na koncu meseca itd. Etatistični parametri 2-16 S statističnimi parametri opisujemo in proučujemo množične pojave. Z njimi šte¬ vilčno izražamoTtevUČneTiTkakovostne značilnosti in odnose populacij. Nekate¬ re parametre populacij dobimo s preprostim preštevanjem in seštevanjem podatkov za vse enote populacije. Tako je statistični parameter za populacijo kmetijskih gospodarstev število kmetijskih gospodafttev N, ki ga dobimo, če preštejemo vse enote populacije. Parameter "skupna vrednost proizvodnje vseh kmetijskih gospodarstev" dobimo, če se- - 33 - štejemo vrednost proizvodnje vseh kmetijskih gospodcrstev v populaciji. Y = 2y; • Parameter: vsota podatkov za populacijo imenujemo agregat. Parametre z analitično vrednostjo dobimo že s preštevanjem in seštevanjem v delnih populacijah. Tako dobi¬ mo na primer s preštevanjem po delnih populacijah število gospodarstev po vrsti proiz¬ vodnje, velikosti gospodarstev itd., s seštevanjem podatkov pa vrednost proizvodnje v vseh kmetijskih gospodorstvih po vrsti proizvodnje, velikosti gospodarstev itd. Te parametre moremo shematično nakazati s simboli: pri čemer indeksi nakazujejo, da se število enot ali agregati nanašajo na prvo 1, dru¬ go 2, ... k-to delno populacijo. Drugi parametri, kot so relativna števila, srednje vrednosti, mere variacije, mere kon¬ centracije, mere sploščenosti in mere asimetrije, so parametri, s katerimi opisujemo in analiziramo predvsem posamezne populacije. S korelacijsko analizo pa dobimo paramet¬ re, s katerimi analiziramo odnose med več različnimi statističnimi populacijami. ZNAČILNOSTI PRI PROUČEVANJU MNOŽIČNIH POJAVOV 2.17 Če primerjamo proučevanje pojavov v fiziki, kemiji ali agronomiji s proučevanjem sociolno-ekonomskih pojavov, opazimo med njimi nekatere podobnosti, a tudi raz-’ like. V fiziki, kemiji in v agronomiji proučujemo pojave večinoma^poskusi. : Poskuse v fi - z i k i in kemiji delamo laboratorijsko v natančno določenih pogojih, da čim¬ bolj odstranimo vse vplive, ki bi mogli poskus motiti. Če bi mogli odstraniti vse dodotne vplive in rezultate meriti z idealno točnimi merilnimi instrumenti, bi zadoščal en sam poskus, ker bi dobili pri vsakem poskusu ob enakih pogojih isti rezultat. Vendar v prak- -3b- tičnih primerih rezultati pri ponovitvah niso povsem enaki. Pokažejo se majhne razli¬ ke, ker je nemogoče poskus ponoviti natančno enako. Zaradi dodatnih vplivov, ki jih z obstoječimi poskusnimi sredstvi ne moremo odpraviti, so rezultati med seboj različni, učajne"]razlike, faktorje, ki jih povzroče, i v velikem številu poskusov pojavljajo v nekih zakonitostih.Za¬ radi slučajnih faktorjev se rezultati posameznih poskusov odklanjajo od prave vrednosti navzgor in navzdol. Po zakonu o velikih številih pa se slučajnosfni odkloni v vsoti re¬ zultatov iz velikega števila poskusov izravnavajo. Zato je poprečen rezultat bliže re¬ zultatu, ki bi ga dobili, če ne bi bilo subjektivnih momentov eksperimentatorja, ne¬ močnosti popolne določitve poskusnih pogojev in napak v meritvah. Da dobimo objek- tivnejše poprečje, je dobro, če vsak poskus izvedejo različni eksperimentatorji z raz¬ ličnimi merilnimi instrumenti. Tako merilne priprave kot eksperimentator lahko povzro¬ čijo sistematične napake. Napaka v instrumentu je lahko take narave, da sistematično daje vedno premajhne rezultate. Isto more biti tudi z eksperimentatorjem. Če ponavlja¬ mo poskuse z istimi merilnimi instrumenti ali eksperimentatorji, se sistematične napake ne izravnajo in poprečen rezultat se ne približa dejanski vrednosti - je pristranski. Podobno je pri poskusih v drugih znanostih. Za razliko od laboratorijskih fizikalnih po¬ skusov je na primer pri poskusih v agronomiji kompleks slučajnih faktorjev moč¬ nejši kot pri fizikalnih poskusih. Mikrosestav zemlje, razlike v semenu, lega parcele itd. so faktorji, ki jih pri posameznih poskusih ne moremo natančno izenačiti. Pri po¬ skusih v agronomiji moramo na primer določen gnojilni poskus izvesti v več ponovit¬ vah, da zmanjšamo vpliv s lučajnih faktorjev, katerih iz objektivnih razlogov ne more¬ mo odstraniti pri posamičnih poskusih. Kakor pri fizikalnih poskusih tako smo tudi pri poskusih v agronomiji ugotovili isto važ¬ no dejstvo. Zakonitost, ki jo preizkušamo s poskusom, v posamičnem primeru motijo slu¬ čajni vplivi. V veliki množici istovrstnih poskusov pa se učinek slučajnih vplivov v po¬ prečju izravna in se zaradi delovanja zakona o velikih številih pokaže tipičnost pojava. Ta postopek je povsem specifičen . Točne i š ih_cgxultatov pri poskusihjie dosegamo z iz¬ boljšavo laboratorijske tehnike , Jamvei-ž-paD^ligniempOžkusov ob daflltupogojTh Iz rezultatov skupine poskusov dobimo natančnejši rezultat. Talca pot jev dosti . h Te razlike imenujemolsi S Vendar se te razlik« pa^slučajne faktor- - 35 - ustrezna, ker je običajno ceneje ponavljati poskus jz da nimi sr edstvi, kakor ga z dragi¬ mi aparaturam i neposredno ocktron-jevo ri slučajne vpliv e. V primeru, da dosežemo meje možnosti pri opredelitvi pogojev, so pa slučojni vplivi kljub temu močni, kakor je to npr. pri poskusih v oaronomiji, edino s ponovnimi poskusi oziroma poprečji dosežemo 'natančnejše rezultate. V fiziki, kemiji in agronomiji preskušamo učinek nekega faktorja tako, da spremenimo aoločiine pogoje in raziskujemo učinek spremenjenih pogojev na rezultat. Če proučuje¬ mo pri prostem podu odvisnost med časom padanja in potjo, spreminjamo višino, s kate¬ re spuščamo kroglico in proučujemo čas padanja kroglice iz različnih višin. Prav tako pri poskusih v agronomiji preskušamo učinkovitost določenih agrotehničnih mer na hek¬ tarski pridelek tako da izvedemo vrste poskusov ob spremenjenih pogojih in proučujemo razlike v hektarskem pridelku zarodi spremenjenih pogojev. Iz gor n jih zgledov sklepamo, da je z množičnim opazovanjem pojavov možno preseči meje natančnosti, ki jih dosežemo s posamičnim opazovanjem. 2.18 Če skušamo postopke, ki smo jih navedli kot primerne za proučevanje v fiziki in agronomiji, prenesti v socialno-ekonomske znanosti, spozna¬ mo neke bistvene razlike v možnosti opazovanja. V fiziki in agronomiji smo za prouče- vonje določene zakonitosti izvedli poskuse v laboratoriju ali na polju. Predmet opazova¬ nja v socialno-ekonomskih znanostih pa po pravilu ne moremo ustvariti s poskusom. Če proučujemo, kako je struktura porabe odvisna od skupnih dohodkov po gospodinjstvih, ne moremo zaradi te raziskave sestaviti poskusnih gospodinjstev z natančno določeno sesta¬ vo članov, jim odrediti skupne dohodke in opazovati razlike pri različnih skupnih dohod¬ kih. Enako ne moremo zaradi raziskave o višini proizvodnje v podjetjih kovinske stroke z 51 do 100 zaposlenimi delavci zaradi raziskave ustanoviti niz podjetij kovinske stroke, ki imajo 51 do 1 00 zaposlenih delavcev in opazovati njihovo proizvodnjo. V socialno¬ ekonomskih znanostih v splošnem enot opazovanja ne moremo (razen v nekaterih posebnih primerih) dobiti s poskusi kakor v fiziki in agronomiji. Tu uporabljamo druge metode. Življenje samo ustvarja pojave v najrazličnejših oblikah. Da proučimo, kako je odvisno sestava porabe od višine dohodkov, ne sestavimo poskusnih družin, temveč iz množice - 36 - obstoječih gospodinjstev poiščemo gospodinjstvo, ki ustrezajo pogojem zo naše razisko¬ vanje. Ce proučujemo višino proizvodnje podjetij v kovinski stroki, ki imajo zaposle¬ nih od 51 do 100 delavcev, ne ustanavljamo podjetij zaradi proučevanja, temveč iz obstoječih industrijskih podjetij poiščemo podjetja iz kovinske stroke, ki imajo zaposle¬ nih od 51 do 100 delavcev in zanje proučimo proizvodnjo. To je ena izmed temeljnih razlik med proučevanjem s poskusi in med proučevanjem, ki je običajno v socialno-eko- nomskih raziskavah. Vendar razmejitev ni tako ostra in moremo v določenih primerih in za določene potrebe tudi v socialno-ekonomskih proučevanji h uporabiti poskusno meto do. Če proučujemo od¬ visnost prodaje nekega izdelka od embalaže in načina prodaje, moremo ta problem ra¬ ziskati s poskusom v pravem pomenu besede. V določeni veleblagovnici organiziramo prodajo tega izdelka po natančno določenem načrtu: koliko časa, kdaj in kje prodaja¬ mo določeni izdelek na en ali drug način. Ta razpored more biti sestavljen kot čisti po¬ skus prav tako, kakor načrtujemo poskuse v agronomiji ali drugje. Takih zgledov bi mo¬ gli našteti veliko. Vsi ti poskusi pa so večinoma manjšega obsega in pomena. S poskusi more na primer podjetje zase proučevati učinke različnih pogojev na produktivnost dela, probleme notranjega transporta, učinek odmora na delovno storilnost itd. Razlika med proučevanjem socialno-ekonomskih pojavov in proučevanjem v fiziki ali agro¬ nomiji pa je tudi v tem, do so posamični vplivi pri socialno-ekonomskih proučevanjih še močnejši kakor pri poskusih v agronomiji Po zakonu o velikih številih moramo opazova¬ ti tem večje število pojavov/, čim večji so slučajni oziroma posamični vplivi; le tako se rezultati posamičnih vplivov izravnajo in se pokaže tipičnost pojava. Izraz slučajni vplivi pri proučevanju socialno-ekonomskih pojavov raje zamenjujemo z izrazo m posa¬ mični vpliv i, ker ima ta izraz širši n amen. Medtem ko so slučajni vplivi tisti , ki jih o e moremo kontrolirati oziroma določ iti, so posamični vplivi vsi tisti vplivi, katerih učin¬ ki se od enote do enote populacije spreminjajo. Zato moramo pri proučevanju socialno¬ ekonomskih pojavov opazovati razmeroma velike populacije, če hočemo, do se po zako¬ nu velikih števil pokaže tisto, kar je za pojav tipično, netipično pa odstrani oziroma iz¬ ravna. - 37 - 2.19 Vzemimo za ponazoritev zakona o velikih številih proučevanje spolnega indek¬ sa za novorojenčke. Spolni indeks je razmerje med številom rojenih dečkov in deklic v določenem času na določenem ozemlju. To razmerje je demografska konstan¬ ta, ki se ne spreminja niti časovno niti krajevno. Jasno je, da je razmerje med rojeni- •mi dečki in deklicami za posamezno družino zelo različno. So družine, v katerih so vsi otroci dečki in družine s samimi deklicami. Število rojstev po družinah je premajh¬ no, da bi se pokazala zakonitost v spolnem sestavu novorojenčkov. Da proučimo stabil¬ nost spolnega indeksa v odvisnosti od velikosti populacije, vzemimo spolni indeks zo mesto Ljubljapo, Slovenijo in Jugoslavijo v letih 1947-1955. Ljubljana Slika 2.3 Spolni indeks novorojenčkov Iz podatkov in iz slike je razvidno, kako raste stabilnost p odatkov, čim večje sopopu- lacije, ki jih proučujemo. Medtem ko je število rojstev v Ljubljani po letih co 2500 letno, je število rojstev v Sloveniji poprečno 33 tisoč , v Jugoslaviji pa 470 tisoč na leto. Skladno z velikostjo populacij je za Ljubljano razlika med največjim in najmanj¬ šim letnim vitalnim indeksom R = 114,4 - 97.9 = 16,5 , za Slovenijo R = 108,8 - 103,8 = 5,0, za Jugoslavijo pa R = 108,2 - 106,7 =1,5. - 38 - Če izračunamo poprečni spolni indeks iz podatkov za Jugoslavijo v vseh devetih le¬ tih 1947-1955, dobimo, da je spolni indeks, izračunan iz 4 milijonov 230 tisoč roj¬ stev, enok 107,2. V razdobju devetih let 1931-1939 pred vojno je bil spolni indeks za Jugoslavijo tudi 107,2. Iz zgleda lepo vidimo veljavnost zakona o velikih številih. Zakonitosti se pokažejo v množičnem opazovanju, medtem ko v posamičnih primerih oziroma v maiem številu primerov prevladujejo posamični vplivi, ki splošno zakonitost zabrišejo. Iz zgleda pa je razvidno to, kako se le za velike populacije pokaže zakonitost v spol¬ nem indeksu. To je vselej, kadar so posamični vplivi zelo močni. Vendar dostikrat nimamo možnosti opazovati tako velikega števila primerov kakor v zgornjem zgledu, ko smo analizirali spolni indeks novorojenčkov. Zato se za male po¬ pulacije omejimo navadno le na statistično opisovanje množičnega pojava, ne iščemo pa zakonitosti. Statistično je proučevanje sociaino-ekonomskih pojavov včasih omeje¬ no le na opisovanje populacij. ETAPE STATISTIČNEGA PROUČEVANJA 2.20 Statistično proučevanje sociaino-ekonomskih pojavov je razmeroma kompleksen in obsežen posel in sestoji iz več etap. Te so po značaju in vlogi bistveno različ¬ ne, vse so pa med seboj tesno povezane. Izvajanje vsake izmed njih je odvisno od me¬ tode in izvedbe v prejšnjih stopnjah. Enako je izvedba posamezne etape odvisna od te¬ ga, kako bomo obdelovali statistične podatke v naslednjih stopnjah. Zato je potreben za vsako statistično proučevanje dobro premišljen splošni načrt, ki določi osnovne me¬ tode in smernice dela v posameznih etapah. Statistično proučevanje moremo v glavnem razdeliti v tele velike, po funkciji različ¬ ne etape: a) določitev vsebine in namena statističnega proučevanje z ana¬ lizo pojava, ki ga proučujemo, - 39 - b) izdelavo splošnega načrta statističnega proučevanja, c) opazovanje v ožjem smislu, d) urejevanje in osnovna obdelava, e) analitično obdelavo in analiz a p odatkov. 2.21 Za vsako statistično proučevanje je potrebno najprej določiti namen in vsebino proučevanja. Natančno moramo opredeliti pojav, ki ga proučuje¬ mo in določiti znake, ki jih bomo proučevali. Če hočemo proučevati delovno silo v kmetijstvu, je treba natančno določiti obseg proučevanja. Lahko se omejimo samo na delovno silo v privatnem sektorju, na delovno silo, ki je zaposlena izključno v kmetij¬ stvu, itd. Enako je od namena proučevanja odvisno, ali se bomo omejili pri proučeva¬ nju samo na številčno stanje delovne sile v kmetijstvu, ali nas zanima stanje po velikost¬ nih skupinah za različne vrste kmetijskih gospodarstev, ali so za proučevanje važne tu¬ di življenjske razmere itd. Le če je natančno postayljen namen statističnega proučeva¬ nja, moremo predmet opredeliti in določiti posamezne pojme. Glede na namen in potrebe proučevanja je treba že v začetku določiti, ali je zadost¬ no, da dobimo za posamezne proučevane pojave le ocene. Ko določimo vsebino pojava in namen statističnega proučevanja, postavimo splo¬ šen načrt, ki povezuje vse nadaljnje stopnje. Pri tem nastopijo že v tej stopnji predvsem problemi z opredelitvijo pojmov; ti pa so osnovnega pomena tako za tehnič¬ no izvajanje kakor za analizo rezultatov. Ni brez vsega razumljivo, kaj je kmetijsko gospodarstvo, koga imamo za zaposlenega v kmetijstvu itd. Zato je treba vsak pojav in pojem, ki ga v proučevanju uporabljamo, natančno opredeliti. To je potrebno, da bo¬ do opredelitve nedvoumno razumljive vsem, ki sodelujejo pri izvajanju opazovanja in vsem, ki podatke kasneje uporabljajo. Nič ne koristijo s še tolikšnim trudom in stroški zbrani podatki, če ne vemo, kaj ti podatki pravzaprav pomenijo. V prvi stopnji je po¬ trebno podati tudi vsebino proučevanja. Statistično to pomeni, da moramo postaviti o- snovna vprašanja, ki naj jih obravnava statistično proučevanje, če naj izpolni svoj na¬ men. Ko postavljamo namen in vsebino statističnega proučevanja, sodelujejo pri tem predvsem - 40 - porabniki statističnih podatkov in strokovnjaki iz področja, iz katerega je problem, ki ga nameravamo analizirati. 2.22 Splošni načrt statističnega proučevanja. Glede na postavljeni namen in vsebino proučevanja pojava v splošnem načrtu določimo osnovne smer¬ nice dela v vseh naaaljnjih stopnjah. Brez predhodnega splošnega načrta bi bilo delo v posameznih stopnjah neučinkovito. Od tega, kako bomo podatke obdelovali, je od¬ visno že statistično opazovanje. Enako je obdelava statističnih podatkov odvisna od tega, kakšna bo analitična obdelava podatkov itd. Naloga splošnega plana je, da gle¬ de na namen opazovanja in razpoložljiva sredstva določi metodo dela v posameznih stopnjah, tako da dobimo čim bolj zadovoljiv odgovor na problem, ki ga proučujemo. Zahteve, ki jih postavljamo splošnemu načrtu, ni lahko izpolniti. Zato je za sestavlja¬ nje splošnega načrta potrebno poznavanje teoretičnih in tehničnih prijemov v vseh stop¬ njah statističnega proučevanja, tako v opazovanju kakor pri obdelavi in analizi. V splošnem načrtu moramo glede na namen in razpoložljiva materialna in finančna sred¬ stvo določiti metode opazovanja, način osnovne in analitične obdelave in način prika¬ zovanja oziroma publiciranja podatkov. Postavke splošnega načrta moramo upoštevati pri sestavljanju operativnega načrta v posameznih stopnjah. 2.23 Statistično opazovanje v ožjem smislu. Statistično opazovanje v ožjem pomenu besede je zbiranje statističnih podatkov o statističnih enotah. S statističnim opazovanjem zberemo podatke o populaciji v obliki, ki je primerna za o- snovno obdelavo. Ločimo več vrst statističnih opazovanj. Vsako izmed njih ima svoje tipičnosti glede na metodo dela in glede na to, kakšna je vrednost in zanesljivost rezul¬ tatov, ki jih z njim dobimo. Izvajanje statističnega opczovanjaje bol j tehničnega kot pa vsebinskega značaja. V zvezi z njim moramo rešiti niz tehničnih problemov, katerih teža je odvisna od populacije, ki jo proučujemo in vrste opazovanja, ki ga uporablja¬ mo. dl- 2.24 Osnovna obdelava. Osnovna obdelava sestoji iz urejevanja, prešteva¬ nja in seštevanja podatkpv, ki smo jih zbrali s statističnim opazovanjem po da¬ nih shemah grupiranja. Ta stopnja zahteva za velike populacije razmeroma veliko časa, kar gre v škodo uporabnosti podatkov. Z mehanizacijo čas obdelave znatno skrčimo. Če •pomislimo, da pri popisu prebivalstva obdelujemo na milijone popisnih obrazcev, da pri obdelavi sodeluje na stotine ljudi, da obdelava traja tudi pri mehanizirani obdelavi več let, si moremo predstaviti razsežnost dela pri osnovni obdelavi za velike populaci- je. 2.25 Analitična obd e I a va . V osnovni obdelavi dobimo podatke urej ene, pre¬ štete in seštete. Vendar ti podatki še ne zadostujejo za analizo pojava. Mno¬ žične pojave analiziramo z obdelavo osnovnih absolutnih podatkov s posebnimi metoda¬ mi, ki jih bomo v nadaljevanju podrobneje obravnavali. Iz osnovnih podatkov namreč dalje izračunavamo relativna števila, srednje vrednosti, mere variacije, mere korela¬ cije, pokazovalce dinamike pojavov ipd. s katerimi prikažemo in analiziramo zakoni¬ tosti množičnih pojavov. Iz navedenega je bolj razumljivoj kako potrebna je povezava vseh stopenj proučeva¬ nja; samo tak postopek zagotavlja uspešno delo in sklepe statističnega proučevanja. - 42 - TRETJE POGLAVJE STATISTIČNO OPAZOVANJE 3.1 Statistično opazovanje, ki obsega zbiranje podatkov o proučevani populaciji, je osnova statističnega proučevanja. Od.tega, ali je ta osnova dobra ali slaba, je odvisna kakovost celotnega proučevanja ne glede na to, kako je opravljeno delo v nadaljnjih stopnjah. Iz slabih osnovnih podatkov je s še tako dobrimi metodami obde¬ lave nemogoče proučevani pojav pravilno analizirati. Problemi pri izvedbi statističnega opazovanja izvirajo iz tega, ker je delo v tej stop¬ nji pri proučevanjih večjega obsega navezano na veliko ljudi, ki nimajo posebne sta¬ tistične izobrazbe; razen tega so krajevno razkropljeni; pri svojem delu, ki ga je treba hitro in odgovorno izvesti, so v večini primerov navezani le sami nase in na pi¬ sana splošna navodila. Ker se opazovane populacije običajno hitro spreminjajo, je po izvedenem opazovanju težko znova iskati podatke, če se izkaže, da so napačni. Še nevarneje pa je, da veliko napak v opazovanju ni mogoče odkriti. Statistično opazo¬ vanje je zaradi obširne organizacije in udeležbe mnogih sodelavcev običajno tudi raz¬ meroma drago. Vse to govori za to, da je treba predhodno dobro premisliti, za kakšno obliko opazovanja se odločimo in kako ga izvedemo. OPREDELITEV PREDMETA OPAZOVANJA - STATISTIČNE POPULACIJE 3.2 Že v programu statističnega proučevanja v načelu opredelimo enoto proučevanja oziroma populacijo, ki jo opazujemo. Vendar moramo pred izvedbo statistične¬ ga opazovanja populacijo in enote opazovanja opredeliti tako, da je nedvoumno in - 43 - preprosto razumljivo, kateri pojavi so predmet opazovanja in kateri n e. Popu lacijo moramo, kakor smo že nakazali, opredeli:;' stvarne, krajevno in časovno. Stvarno opredelitev predmeta opazovanja je najtežja. Dostikrat je težko v nekaj t - ^ i- stavkih določiti enoto opazovanja tako, da je v vsakem primeru nedvoumno jasno, ali določen pojav spada v populacijo ali ne. Predrpet opazovanja je neredko opredeljen ta¬ ko, do moramo poznati več podatkov, da ugotovimo, ali pojav ustreza oprede ljujo čim pogojem ali ne. Toko npr, je težko opredeliti, kaj je kmetijsko gospodarstvo, kaj indu¬ strijsko podjetje, še teže pa, koga imamo za srednjega ali veiikega kmeta. Opredelit¬ ve vseh teh pojavov so sestavljene iz več značilnosti pojava. Včasih se zaradi enostavnosti in nedvoumnosti,kaj zbrani podatki pomenijo,omejimo na en sam znak in z ni im opredelimo enoto opazovan ja .Tako smo v letu 1 946 vključi 1 1 v po¬ pis industrijskih podjetij kot industrijska podjetja vsa proizvodna podjetja z več ko petim! deiavci.Leta 1947 pa smo popisali kot kmetijsko gospodarstvo vsako posest z nad 500 m^ zemlje. Čeprav zgornji definiciji nista natančni, smo z njima dosegli vsaj enoličnost in nedvoumnost tako pri opazovanju kakor pri tolmačenju podatkov. Meji pet delavcev 2 . • T za popis industrije in 500 m z a popis kmetijskih gospodarstev imenujemo c e n s u s Čeprav to način teoretično ni najboljši, ima take tehnične prednosti, da ga cesto upo¬ rabi jemo. Krajevna opredelitev je običajno brez težav, ker se opremo na obstoječe ob¬ činske, republiške ali državne meje. Časovna opredelitev je tudi brez posebnih težav in pri popisih opredelimo popu¬ lacijo časovno s teoretičnim momentom - kritičnim momentom, pri tekočih regi-' stracijah pa navadno s koledarskim razdobjem. • VRSTE OPAZOVANJ 3.3 Glede na proučevano populacijo uporabljamo različne vrste statističnega opazova¬ nja. Medtem ko populacije realnih enot, kot so prebivalstvo, stavbe, gospodarstva, - 44 - živina itd., opazujemo s p o piši, populacije dogodkov, kot so smrti, rojstva, ne¬ sreče, itd., opazujemo s tekočo registracijo. Glede na potrebe, mate¬ rialne in finančne možnosti pa opazujemo vse enote populacije, če po- • trebujemo popolno in podrobno sliko o populaciji, ali samo del populacije, če se zadovoljimo z ocenami. 3.4 Longitudinalno in transverzalno opazovanje Uvodoma smo navedli, da dobimo z opazovanjem določenega pojava v različnih časovnih trenutk ih sliko o časovnem spreminjanju oziroma gibanju pojava. Taka t.i. transverv n Inn opazovan ja samo delno prikažejo gibanje pojava . Populacija realnih enot se časovno spreminja zaradi različnih dogodkov, ki se dogode v vmesnem razdobju med dvema opazovanjema in spreminjajo značilnosti enot oziroma populacij. Te spremembe pa se morejo v določenem razdobju delno ali v celoti izravnati. Transverzalna opazovanja v določenih časovnih razmikih sicer pokažejo spremenjeno sliko, ki je projekcija sprememb populacije v določenem trenutku, vendar je ta projek¬ cija samo delno slika sprememb oziroma dogodkov, ki so vplivali na populacijo.Vzemi¬ mo shematičen zgled populacije, ki jo opazujemo po treh vrednostih določenega zna¬ ka: A, B in C. Možni dogodki, ki spremene sestavo populacije realnih enot po tem zna¬ ku so: enota ne preide v drug razred ali enota preide v enega izmed drugih razredov. Če sestavimo matriko teh dogodkov, dobimo: V numeričnem zgledu vidimo kakšno sliko moremo dobiti v praksi. - 45 - I II Transverzalno' opazovanje v obeh trenutkih pokaže enako stanje in sestavo populacije .S tem pa še ni rečeno, da v vmesnem razdobju ni bilo sprememb. Slika I pokaže situacijo, v kateri ni bilo sprememb, slika II pa kaže situacijo, v kateri se je populacija spreminja¬ la, kljub temu pa smo dobili enako sestavo. Opazovanje, v katerem proučujemo dinamiko populacij prek sprememb posameznih enot v določenem razdobju, imenujemo longitudinalna opazovanja. Prikazani zgle¬ di so samo shematični primeri longitudinalnega opazovanja. V vmesnem rozdobju more na posamezno enoto vplivati ne en sam dogodek temveč več dogodkov, ki spremene zna¬ čilnosti enot. V takem primeru je seveda shema in opazovanje znatno bolj zamotano. Enota 1 AAAAAAAAABBB3B3BB3B3 2 AAAAAAAAAAAAA/JVAAAAA 3 B3Bx>BB33BAAAAAii/vAAAA 4 AAAAAABBBBBB333BB33B 5 BBBBAAAAAAAB3B33B333 6 AAAAAAB333BBBB3BBBAA Če proučimo sesta^v začetku, dobimo: 4xA in 2xB. Ob koncu pa je stanje: 3xA in 3xB. To sta rezultata transverzalnih opazovanj v začetku in na koncu razdobja. Če pa proučimo celotno razdobje^pa vidimo, da sta se v transverzalnem opazovanju enota 1 in 3 kompenzirali. Longitudinalno proučevanje med začetkom in koncem pa da nasled¬ nji rezultat: Vendar iz longitudinalnega pregleda med začetkom in koncem izpade iz enote 5 vmesen prehod iz B v A in v B nazaj in iz enote 6 vmesen prehod iz A v B in iz B v A. 3.5 Če potrebujemo popolno in podrobno sliko pojava, opazujemo populacije stvar¬ nih enot s popisom. Popis je zgodovinsko najstarejša in še danes pogosta oblika statističnega opazovanja. Osnovna značilnost popisov je, da popišemo vse enote populacije po stanju v določenem trenutku - kritičnem momentu. Popisati vse enote populacije je ideal, ki se mu bolj ali manj približamo. Odstotek, ki pove, kolik del populacije smo uspeli popisati, meri stop¬ njo zajetja. Odstotek zajetja je odvisen od proučevane populacije in uspešnosti organi¬ zacije opazovanja. Populacije, ki se gibljejo, je teže popolno popisati kakor populaci¬ je, ki se malo gibljejo ali pa mirujejo. Popolnost zajetja pri popisu prebivalstva je za¬ radi gibanja prebivalstva večji problem kakor pri popisih zgradb, popisih kmetijskih go¬ spodarstev itd. 3.6 S popisom dobimo podobno kakor s fotografskim posnetkom trenutno sliko popula¬ cije. Nemogoče je npr. s statističnim popisom obseči prebivalstvo v mesecu ali letu, ker je stanje prebivalstva vsak hip drugačno. Zato pri vsakem popisu določimo trenutek, na katerega se nanašajo zbrani podatki. Ta trenutek imenujemo kritični trenutek. Čeprav populacije ne moremo opazo¬ vati natančno v kritičnem trenutku in popisujemo enote po kritičnem trenutku, jo vendar - 47 - skušamo popisati po stanju, kakršno je biio v Kritičnem trenutku. Kako dolg naj bo čas popisovanja, ki se ne ujema s kritičnim trenutkom, je odvisno od popula¬ cije in tehničnih možnosti popisovanja. Posebno za populacije, ki se gibljejo, čas popi¬ sovanja ne sme biti preveč oddaljen od kritičnega datuma, niti predolg, ker drugače fež- •ko ugotovimo stanje ob kritičnem trenutku. Cas popisovanja pri popisu prebivalstva mora biti razmeromo kratek in morajo popisovclci popisati prebivalstvo v nekaj dneh po kri¬ tičnem trenutku. Pri popisu zgradb pa npr. ni nujno, da je tako krotek, ker je populaci¬ ja zgradb znatno manj dinamična kakor predivoistvo. Kritični trenutek je odvisen od vsebine pojava, je pa odvisen tudi od tehničnih možnosti popisovanja. Iz vsebinskega stclišča naj popis zajame populacijo v hipu, ko je ta v nor¬ malnem stanju ali v stanju, ki je za proučevanje važno in značilno. Tako je npr. za ži¬ vino značilno maksimalno stanje živine. Zato so v Jugoslaviji popisi živine v mesecu ja- ni/orju, v katerem je stanje večine vrst živine maksimalno. Iz tehničnega vidika je najprikladnejši čas za popis takrat, ko je populacija v takem sta¬ nju, da zanjo najlaže zberemo podatke. Za živino je neprikladen čas popisovonja polet¬ je, ko je velik del živine izven kmetijskih gospoacrstev na paši v planinah. Čeprav bi za popis prebivalstva iz vsebinskih razlogov najbolj ustrezal kritični trenutek 31 . decem¬ ber, prebivalstva ne popisujemo v tem času, ker bi verjetno za ta datum težko izvedli popis. Iz tehničnih in vsebinskih razlogov ne ustreza tudi poletje, ko je čas dopustov. Niti regionalno porazdelitev prebivalstva niti tehnična možnost nista v tem času za popi¬ sovanje prebivalstva najugodnejši. Zato kljub temu, da je 31 . marec iz vsebinskih raz¬ logov neprimeren, vzamemo ta datum za kritični trenutek popisa, ker je na ta datum prebivalstvo v večini primerov v krajih svojega stalnega bivališča in ni takih sezonskih premikov kakor poleti ali neugodnih okoliščin popisovanja, kakršne so okrog Novega le¬ ta. Izkaže se, da je enostavneje podatke po stanju na dan 31. marca po potrebi s podat¬ ki o naravnem in mehanskem gibanju prebivalstva prevesti na stanje v začetku ali v sre- dini leto, kakor pa popisovati ob neprimernem času. V vsakem popisu je pri določitvi kritičnega trenutka potrebno najti ravnotežje med vse¬ binskimi in tehničnimi argumenti. 3.7 S popisom dobimo trenutno sliko pojava. Vendar je za proučevanje populacij do¬ stikrat zelo važna dinamika .Te pa enkratni popis ne da. 2 več zapored¬ nimi popisi v določenih časovnih razmikih, podobno kakor v kinu iz slik v časovnem za-- poredju, dobimo vtis o gibanju. Če hočemo, da dajo rezultati zaporednih popisov osno¬ vo za proučevanje dinamike, moramo upoštevati tale tri načela: At Za populacije, ki se časovno hitro spreminjajo, mora biti čas med dvema zaporednima popisoma krajši kot pri po pulacijah, ki se spreminjajo počasi. To je eden izmed razlogov, aa imamo npr. popise prebivalstva vsakih pet ali deset let, popise živine pa vsako leto. Razdobja med zaporednimi popisi morajo biti enaka, če hočemo iz rezultatov popisov neposredno sklepati no jakost s prememb. To načelo je razumljivo. Razumljivo je, da se pri isti intenziteti sprememb populacija v daljšem razdobju bolj spremeni kot v krajšem razdobju. Zato so popisi prebivalstva v enakih razmikih vsakih pet ali deset let, ne pa enkrat po enem letu, drugič po petih letih, tretjič po desetih letih itd. Če je pojav, ki ga proučujemo, sezonski, kar pomeni, da je odvisen od letnega časa,mo¬ ramo popisovati vsako leto na isti datum, če proučujemo dinamiko pojava na daljša raz- _dob.ja. Če tega ne storimo, sezonski vplivi motijo dinamiko razvoja in ne dobimo pravil¬ ne slike o časovnih spremembah pojava. Zato popisujemo npr..živino vsako leto .pa isti datum (15. januar). Drugače je, če z vrsto popisov proučujemo sezonsko dinamiko stanja živine. Takrat je nujno, da popišemo živino v določenem letu ali zaporedju več let na krajša razdobja, npr. vsak mesec. Tekoča registracija * Statistična poročila 3.8 , Medtem ko je za popis bistvena istočasnost obstoja vseh enot populacije v kritič¬ nem trenutku, je za tekočo registracijo bistveno, da registrira vsak dogodek v tazličnem času, v trenutku, ko se dogodi ali neposredno po dogodku. Tudi za tekočo registracijo je značilno popolno zajetje vseh enot populacije. Redkeje ko pri popisih je namen tekoče registracije zbiranje podatkov samo za statistično - 45 - proučevanje pojave. Matična služba, register prebivalstva, operativne evidence v pod¬ jetjih, knjigovodski podatki itd. so samo posredno vir statističnih podatkov. Te podatke zbiramo s statističnimi poročili, ki podajajo splošno šliko za dogodke v določenem razdobju (dnevu, tednu, mesecu, letu). Statistična poročila so ena izmed običajnih oblik registrecije socialno-ekonomskih pojavov. Tako imomo npr. statistična poročila iz statistike cen, gostinstva, turizma, gradbeništva, industrije, matične služ¬ be itd. Delna opazovanja 3.9 Značilno za popise in tekoče registracije je, da z njimi opazujemo vse enote po¬ pulacije. Z njimi dobimo popolno in podrobno sliko o proučevanem pojavu. Slaba stran popolnega opazovanja pa je, da zahteva veliko materialnih sredstev in časa. Kadar za proučitev pojava ni potrebna podrobna slika opazovane populacije, ali če ni¬ mamo na razpolago zadosti sredstev, podatke o populaciji ocenjujemo. Najpopularnejše so metode ocenjevanja, pri katerih skušamo sklepati in ocenjevati podatke o populaciji, če poznamo razmeroma majhen del enot populacije. Na jobjektivnejša metoda pri ocenjevanju statističnih podatkov je vzorčenje. Osnovna značilnost vzorčenja je, da so enote, ki jih opazujemo, da iz njih ocenimo ce¬ loto, izbrane slučajnostno. Metoda slučajnost nega izbora ima niz prednosti pred drugimi metodami ocenjevanja. Ocene, ki jih dobimo z vzorčenjem, so objektivne, na kako¬ vost ocen moremo enostavno vplivati, zanesljivost ocen pa moremo objektivno določiti. Ker je ta metoda ocenjevanja v socialno-ekonomskih proučevanjih zelo pomembna, za njeno razumevanje pa je potrebno poznavanje osnov statistične analize, na tem mestu vzorčenje samo omenjamo, podrobneje pa ga bomo obravnavali v posebnem poglavju ka¬ sneje. 3.10 Druge metode delnega opazovanja, od katerih pa nobena nima vseh kvalitet,ki jih ima vzorčenje, so med drugimi: metoda izbora tipičnih enot in monografija. - 50 - Preden se je uveljavila v praksi metoda vzop&enp, ki jo uporabljamo za socialno-eko- nomska proučevanja šele nekaj desetletij, so metodo izbora tipičnih enot ime¬ li za eno izmed osnovnih metod delnega opazovanja. Metoda izbora tipičnih enot na pr¬ vi pogled nudi nekaj prednosti pred metodo vzorčenja. Skupina enot, ki so pazljivo iz¬ brane, tako da čim bolje predstavlja celoto, da navidezno zanesljivejše ocene kot skup¬ nost enot, ki so iz populacije izbrane slučajnostno. Vendar pri metodi izbora tipičnih enot nastopi težava, ki je slučajni izbor nima. Če hočemo izbrati iz populacije enote, ki predstavljajo celoto, moramo proučevano populacijo podrobno poznati. To pri vzor¬ čenju ni potrebno. Tudi odločitev, kaj je tipično za populacijo, je subjektivna. Za oce¬ ne, ki jih dobimo po metodi izbora tipičnih enot, ne moremo oceniti zanesljivost podat¬ kov niti ne moremo zavestno vplivati na kakovost ocen, čeprav verjetno z opazovanjem z majhnim številom enot dobimo z izborom tipičnih enot boljše ocene kakor z vzorčenjem. 3.11 Mon_ogro.fi jo uporabljamo, kadar hočemo zelo podrobno osvetliti dolo¬ čen problem na eni ali nekaj tipičnih enotah populacije. Namen monografije ni posploševanje na celoto, temveč podrobna osvetl itev posameznih primerov. Znana so podrobna monografska proučevanja o produktivnosti dela, o delovnih razmerah delavcev itd. Monografska proučevanja so zelo uspešna tudi pri odkrivanju novih kvalitet poja¬ vov . 3.12 Panel ankete. Proučevanje dinamike pojavov z vrsto neodvisnih vzorcev je problematično. Ker so v vsak vzorec izbrane druge enote: osebe, gospodinj¬ stva, gospodarstva ipd., je vzorčni pogrešek razmeroma velik. Četudi se ne bi stanje v populaciji spremenilo, bi verjetno v dveh zaporednih vzorcih dobili zelo različne re¬ zultate, kar bi bila posledica tega, da so v posameznih vzorcih druge enote. To hibo odpravimo tako, da vzorec istih enot uporabimo za niz opazovani in opazu|emo spremem¬ be na posameznih enotah tega vzorca v sukcesivnih opazovanjih. Taka anketa, ki jo imenujemo panel anketa, ima za osnovo longitudinalno opazovanje in je odlično sredstvo za proučevanje dinamike pojavov. Zato panel ankete uporabljamo v primerih, kadar gre za proučevanje časovnih sprememb, ki so rezultat najrazličnejših vplivov. S panel anketami proučujemo spremembe v obnašanju gospodinjstev pod vplivom najrazličnejših -5V- dejavnikov, ki vplivajo na spremembe v standardu prebivalstva. S panel anketami more¬ mo meriti reakcijo na oglaševanje, na cene, na konkurenco, na spreminjanje javnega mnenja ipd. Medtem ko je v primerih, ko gre za dolgoročnejše raziskave, en vzorec dalj časa osnova za panel anketo, more za določene raziskave, npr. vpliva na oglaša¬ nje rabiti panel anketa s samo dvema opazovanjema: pred in po reklamiranju. S panel anketami oziroma longitudinalnim opazovanjem izločimo predvsem razlike med enotami opazovanja. Seveda pa ima panel anketa tudi niz pomanjkljivosti. Problemi nastopijo zaradi izpadov posameznih enot iz panela zaradi različnih vzrokov: smrti, preselitve, nezainteresira¬ nosti ipd. Slaba reprezentativnost panel anket gre v dosti primerih tudi na račun tega, ker je težko sestaviti reprezentativen panel vzorec, ker predstavljajo oni, ki so voljni sodelovati v panel anketi, dostikrat nereprezentativen del celote. Daljše sodelovanje v panel anketi izzove tudi drug način obnašanja. Gospodinjstvo go¬ spodari drugače, če beleži svoje dohodke in izdafke^kot gospodinjstvo, ki tega ne dela. Izhod v tokih primerih je postopna zamenjava enot panel vzorca z drugimi enotami. Če od časa do časa zamenjamo po en del enot (npr. četrtino) , se pri štirikratni zamenjavi izmenja celoten vzorec. KTjub temu pa je ohranjena zveznost, panel ankete, ker je v dveh zaporednih razdobjih vedno vključenih tri četrtine enot, ki časovno vežejo podat¬ ke . VIRI PODATKOV 3.13 Pri organiziranju statističnega opazovanja je važno predhodno proučiti statistič¬ ne vire, ki se nanašajo na pojav, ki ga nameravamo proučevati. Predhodna ana¬ liza virov mnogokrat poenostavi opazovanje, včasih pa celo uspemo, da pridemo do po¬ datkov o proučevanem pojavu brez statističnega opazovanja. Zavedati se moramo nam¬ reč, da je statistično opazovanje najdražji in razmeroma zamotan način, da pridemo do statističnih podatkov. Zato predhodno pregledamo vse publicirane in ne pub I i c ira n e podatke o problemu, ki ga proučujemo. Včasih dobimo odgovor na postavljeni problem že nepo- - 52 - sredno 121 podatkov, ki so jih zbrali in Ouuetoii drugi. Tako uspemo, da analiziramo po¬ jav s podatki iz enega ali več različnih virov brez posebnega statističnega opazovanja in osnovne obdelave. Večina podatkov, ki jih objavija uradna statistika, so osnovni po¬ datki. Njih namen je, da jih dalje prouči porabnik za svoje potrebe in po svojih vidi¬ kih. 3.14 Podatki že izvedenih statističnih opazovanj niso vedno obdelani tako, da bi mogli rezultate neposredno uporabiti za analizo problema, ki ga proučujemo. Preden se odločimo, da izvedemo samostojno opazovanje, proučimo še osnovno gra¬ divo že izve denih st atističnih a k c i j . Dostikrat se izkaže, da sicer obdela- ni rezultati ne dajo odgovora na proučevan problem, moremo pa do njega priti s posebno obdelavo že zbranega gradiva po ustreznih vidikih in kombinacijah. Če nam to uspe,ni • treba zbirati osnovnih podatkov. Tako izkoriščamo osnovno gradivo najrazličnejših popi¬ sov, kot so popisi prebivalstva, industrije, obrti itd. in prihranimo stroške zbiranja po¬ datkov. 3.15 Za osnovo pri proučevanju uporabljamo tudi dosedanje zapise - eviden¬ ce , ki jih zbira ena ali druga organizacija ali enota v nestatistične namene. Ti zapisi - imenujemo jih tudi sekundaren vir statističnih podatkov - so osnova za podatke iz vseh gospodarskih statistik, statistike industrije, trgovine, go¬ stinstva itd. Prav tako je sekundaren vir statističnih podatkov matična služba, ki zbira podatke iz naravnega gibanja prebivalstva in register prebivalstva, ki beleži mehansko gibanje prebivalstva. Obstoječi zapisi olajšajo statistično opazovanje, ker so podatki, ki jih iščemo, že zbra¬ ni. Zato je zbiranje osnovnih podatkov omejeno le na prepisovanje. Ker so ti zapiski običajno uradni dokumenti, so ti podatki dosti zanesljivi. 3Č16 Dostikrat pa ne razpolagamo za proučevan pojav niti s takimi zapisi. Takrat smo primorani, dd'podatke o enotah populacije zberemo drugače. Eden izmed takih načinov je posredno opazovanje po osebah, ki enoto opazovanja poznajo in mo- - 53 - rejo doti o njej zahtevane podatke. Posredno opazovanje je zelo razširjeno. Tako daje¬ jo gospodarji kmetijskih gospodarstev podatke o svojih gospodarstvih, gospodinje o pora¬ bi v svojih gospodinjstvih, starešine gospodinjstev podatke o članih, obrtniki o svojih podjetjih itd. V nekaterih primerih, posebno če gre za poskuse je vir osnovnih statističnih podatkov neposredno opazovanje. Neposredno opazujemo pojave, če sami izvedemo po¬ skus oziroma merimo enote opazovanja. 3.17 Posamezni viri so v zgornjem pregledu navedeni po vrstnem redu prednosti. Če ni publiciranih podatkov, ki bi dali odgovor no naš problem, iščemo ali je zbra¬ no osnovno gradivo o tem problemu. V teh dveh primerih populacije statistično v ož¬ jem smislu sploh rie opazujemo. Ce tudi osnovnega gradiva o proučevanem problemu ni, iščemo sekundarne vire - obstoječe zapise. Čeprav v teh primerih izvršimo opazovanje, ker so ti podatki verjetno teritorialno in organizacijsko raztreseni, se izognemo izpraše¬ vanju ali merjenju. Če ni niti zapisov o proučevanem pojavu, smo prisiljeni, da opazuje¬ mo populacijo v pravem smislu besede in sicer tako, da iz posrednih virov dobimo podat¬ ke o enotah populacije. Če pa odpovedo še posredni viri, moramo meriti, to se pravime- posredno opazovati. Zgled za posredno in neposredno opazovanje je določanje pridelka po kmetijskih gospo¬ darstvih. Pri posrednem opazovanju se zanesemo na izjave gospodarja kmetijskega gospo¬ darstva, pri neposrednem opazovanju pa pridelek v posameznih gospodarstvih izmerimo. Iz tega zgleda vidimo tudi prednosti in pomanjkljivosti posrednega in neposrednega opa¬ zovanja. Gospodarjevo napoved dobimo zlahka, podatek pa more biti nezanesljiv; me¬ rjenje pridelka pa da zanesljivejše podatke, je pa bolj zamotano. NAČINI POSREDNEGA OPAZOVANJA 3.18 Med osebami, ki podatke dajejo in organi statističnega opazovanja je več vrst stikov. Običajno popisovalec ali anketar o-b-i-iče osebo, ki more dati o proučevani enoti podatke. Tako pri popisih prebivalstva popisovalci obiščejo posamezna ■ 54 - gospodinjstva in osebe v svojem popisnem okolišu. Enako pri vzorčenju obiščejo anke¬ tarji izbrane enote, da jih popišejo. Pri popisovolčevem obisku ločimo dve tehniki popisovanja .Pri samoregistrociji popisovalec ob prvem obisku ra zdeli obrazce, razloži tehniko in namen popisa in prosi popisovono osebo, da do določenega roka izpolni obrazce; pri ponovnem obisku pa iz¬ polnjene obrazce pobere. Samoregistracija ima prednosti in hibe. Prednost je v tem, da oseba, ki podatke daje, lahko v miru in premišljeno izpolni obrazec, kar je v prid ka¬ kovosti, posebno če popisana oseba vpisuje podatke iz dokumentov. Prednost samoregi- stracije je tudi ta, da popisovalec ali anketar pri prvem obisku obrazce'in navodila lah¬ ko pusti pri sosedih ali sorodnikih popisovane osebe, če je ni doma in naroči, da izpol¬ ni obrazce do predpisanega roka. V tem primeru sploh ni potreben neposreden stik med popisovalcem in osebo, ki podatke daje. Pomanjkljivost samoregistraci je pa je v tem, da je uporabna le tedaj, če moremo predpostavljati, da so osebe zmožne, da same pra¬ vilno in vestno izpolnijo obrazce. 3.19 Pri ekspedicijskem načinu ali metodi intervjuva vnaša odgovo¬ re, ki jih dobiva od popisanih oseb,v obrazec popisovalec. Ta postopek je v ne¬ katerih točkah boljši, v drugih pa slabši kakor samoregistraci ja. Ekspedicijski način za¬ hteva mnogo več časa za popisovanje kakor somoregistracija. Čeprav je pri ekspedicij¬ skem načinu teoretično potreben en sam obisk, je treba osebe, ki jih obiskovalec pri prvem obisku ne najde doma, ponovno obiskati. Posebne težave so pri ekspedicijskem načinu z osebami, ki so čez dan odsotne. Za te primere je zelo problematično, kdaj je najbolj primeren čas za obisk, da dobi popisovalec popisano osebo doma. Ekspedi¬ cijski način je vsekakor primernejši za populacijo z nizko kul turno; ravni jo in pri zamo- tanejših opazovanjih. Tudi odgovori so običajno pri ekspedicijskem načinu popolnejši, boljši, pravilnejši in enotnejši, ker izpolnjuje obrazce popisovalec, ki je napravil po¬ seben tečaj za popisovanje, ima obširnejša navodila, prakso v popisovanju itd. Popiso¬ valec ali anketar pri ekspedicijskem načinu tudi hitreje presodi, ali so odgovori pravil¬ ni ali ne in more z dodatnimi kontrolnimi vprašanji priti do pravilnih podatkov. - 55 - 3.20 O prijavnem načinu g ovorrwo, ce se mora jo popisane enote prijaviti in dati podatke v zato določenih prijavnih pisarnah. Ta postopek je za popisoval¬ ca enostavnejši kot obiski, ker odpcde obhod terena. Po prijavnem načinu so v Sloveni¬ ji izvedli popis kmetijskih gospodarstev v letu 1947. Vsak lastnik zemljiške posesti je •bil obvezan, da na prijavnem uradu dd podatke osvoji zemljiški posesti. Po tem nači¬ nu, kolikor je lagoden, običajno zajamemo mnogo manjši odstotek populacije kot pri drugih metodah, razen če je uradno predpisana prijava in določene sankcije, če se ose¬ ba ne prijavi. Pri imenovanem popisu zemljiških gospodarstev je bila prednost prijavne¬ ga načina tudi ta, da sov prijavni pisarni imeli podatke katastra,, s katerimi so prijav¬ ne komisije sproti kontrolirale navedbe zemljiških posestnikov. Po prijavnem načinu so organizirane različne službe npr. ma tična služba, registracija prebivalstva itd. 3.21 Pri poštnem načinu statistično mrežo popisovalcev na terenu zamenja po¬ šta . Poštni način je znatno cenejši kot opazovanje z obiski ali prijavni način, ker odpadejo vsi vmesni organi med osebo ali organizacijo, ki podatke daje in central¬ nim organom, ki zbira podatke. Strošek stika z osebo ali organizacijo, ki podatke daje, se skrči na poštne stroške. Pri poštnem načinu so stroški znatno manjši, organizacija pa enostavnejša kot pri drugih metodah. Enako je tudi čas izvedbe opazovanjo pri discipli¬ niranih enotah pri poštni metodi zelo kratek. Hiba poštnega načina pa je v tem, da mo¬ remo pri poštnem načinu uporabiti le samoregistracijo in so osebe, ki dajejo podatke, na¬ vezane na pisana navodila brez osebnega stika s statističnimi organu Zaradi tega je pri poštnem načinu kakovost podatkov slaba, delež neodgovorov pa v splošnem še večji kot pri samoregistraciji. Poštni način uporabljamo le, če vemo, da so osebe, ki podatke da¬ jejo, disciplinirane in zmožne, da same brez pomoči popisovalcev izpolnijo in pošljejo obrazce organizaciji, ki podatke zbira. Zgledi za uspelo opazovanje po poštnem načinu, so tekoče statistične službe v industriji, trgovini, gradbeništvu itd. Podjetja so po služ¬ beni dolžnosti zavezana, da v roku pošljejo podatke o svoji dejavnosti, zagotovljena pa je tudi strokovnost izpolnjevanja. Če opazujemo s poštnim načinom privatne osebe, obrtne obrate, kmetijska gospodarstva itd. običajno kombiniramo poštni način z metodo obiskov tako, da skušamo dobiti po pošti odgovore za čim večji de! r Jacije, iz enot, za katere nismo prejeli odgovorov - 56 - pa izberemo vzorec. Izbrane enote obiščejo anketarji, da dobimo od njih podatke z osebnim stikom. 3.22 Podobne narave kot poštni način so tudi ankete, ki jih razpisujejo različni časo¬ pisi ali organizacije, tako da s pozivi v časopisju prosijo bralce ali člane, da pošljejo odgovore na zastavljena vprašanja pismeno na uredništvo lista ali na sedež orga¬ nizacije. Pri tem načinu pričakujemo, da je število neodgovorov še večje. Število odgo¬ vorov skušamo zvečati z žrebanjem različnih nagrad za tiste, ki pošljejo odgovore, ali jih nagradimo kako drugače. 3.23 O J< or e s p od e n t ne m načinu govorimo, če imamo za proučevanje določe¬ nega pojava na terenu stalno mrežo kor.espodentov, ki občasno pošiljajo podat¬ ke o dejavnosti, za katero so določeni. Korespodenti po stroki niso statistiki in imajo drugo glavno zaposlitev. Običajno pa so korespodenti zaposleni v stroki, iz katere je pojav, ki ga proučujemo. Tako imamo v kmetijski statistiki stalno mrežo korespodentov, ki so izbrani tako, da so razmeščeni po celem ozemlju, ki ga proučujemo. Kmetijski ko¬ respodenti so običajno agronomi ali razgledani privatni kmetovalci, ki so sposobni, da ocenjujejo pojave iz kmetijstva in občasno pošiljajo podatke v centralni urad, kjer po¬ datke obdelujejo. Korespodenti pošiljajo podatke o stanju posevkov, o vegetaciji, o tem, kako kaže pridelek itd. ZNAKI OPAZOVANJA 3.24 K opredelitvi opazovanja ne sodi samo opredelitev populacije, temveč tudi opre¬ delitev vsebine opazovanja. Vsebino dajo opazovanju znaki opazovanje. Od do¬ bre in smiselne izbire znakov je odvisen uspeh opazovanja in proučevanja nasploh. Pri izbiri znakov statističnega proučevanja moremo upoštevati nekaj splošnih načel, ki pomagajo pri izbiri znakov. V opazovanje je treba vključiti vse znake, ki sov neposred¬ ni zvezi s proučevanim pojavom, vendar samo tiste^J/'"N'— \“r>i —'-1-' Pred izpolnitvijo prcčitajlc vso popisniro! Preden napišete odgovor na posamezna vpraša« nja, ponovno prečitajte navodila, ki so tiskana pri teh vprašanjih! Ce vam ni kaj jasno, vprašajte popisovalca za pojasnilo! Popisnim se izpolni za vtnko osebo, ki živi opol¬ noči med 31. marcem in t. aprilom 1953. Oseb«, ki je ob rosn popiva v kraju, kjer stalno stanuje, se popiše v tem krajo (v svojem gospodinj¬ stvu). V svojem gospodinjstvo se popiše (kot trnjoo prisotna) tudi vsako osebo, ki jc ob popisu pri voja¬ kih, na vojaških vajah ali v zaporu. Oseba, ki ob popisu ni v kraju, kjer stalno stanuje (ker je na potovanju, v bolnici in pod.), sc popiše v kraju, kjer stalno stanuje (kot začasno odsotna), in tudi v kraju, kjer je ob popisu (kol začasno prisotna). 1. PRIIMEK. OČETOVO IME (ZA POROČENE ŽENE MOŽEVO IME) IN IME __ Obrazce l’S - I I I 2. SPOL (odgovor: molki — ženski) u 3. ROJSTNI DATUM dan __ mesec _ leto 4. ROJSTNI KRAJ a) naselje (mesto, vus) ___ b) okraj _______ c) ljudska republika (osebe, rojene v inozemstvu, navedejo državo).. . 5. DRUŽINSKI STAN |l’ri oselmh, rojenih po 31. ionreti 1939. naredimo črlieo (—); pri osel m h. ki so *e rodile pred tem dat umom. vpišemo mren izmed odgovorov: suniski-snmika, poročen-poročena, odooec-odova, razveian-m/.ovtona / .. k KATERI 7.AKON JE PO ATF.VIU1 (Na to vprašanje odgovorijo samo osebo, ki so ob popisu poročene, in napišejo z besedami, n. pr.: prvi, drugi, trd ji itd.j .... _ _ 7. DOPOLNJENA IJCTA STAROSTI OS SKLENITVI IMIVI.dA ZAKONA |OwW. ki so so porofilc do dneva popisn, napišejo leta s številkami, n. pr.: 18, 23, 29 itd.; osebe, ki se do popisa niso poročile, naredijo črlieo t—).|. h. ATEVII/) ŽIVOROJENIM OTROK |Nn to vprašanje odgovori Vsaka ženska, ki se je rodila pred 31. marertn 1939; pri teoi naj upošteva vse avojc zakonske in nezakonske otroke.). 9. KOLIKO OD TEH OTROK SEDAJ ŽIVI 30 U 30 10. DRŽAVLJANSTVO (Državljani FLRJ vpišejo: FLRJ; tuji državljani navedejo državljanstvo, ki ga imajo.). tl, NARODNOST |V«aka oseba vpiše svojo narodnost, n. pr.: .Vrb, Hrvat, Slovenec, Makedonec. Črnogorec, Madžar, SifHnr, Nemce, Italijan. Celi, Slovak, Turek, Cifiun itd. Osebe jugoslovanskega rodu, ki niso narod¬ nostim opredeljene, vpišejo: Jugoslooan-ncopredeljrn, medtem ko ostale narodnostno neopredeljene osebe vpišejo: narodnostno neopredeljen. 'Im otroke pod 10 leti je odločilna izjava staršev.j ------ - 12 . MATERIN JEZIK {Vpišemo jezik, katerega oseba največ uporublja v svojem gospodinjstvu, oz. jezik, ki gu ima oseba za svoj materin jezik. Im otroke pod 10 loti je odločilna izjava staršev.).... 13. ODNOS DO VERE (Osebe, ki imajo določeno versko prepričanje, napišejo veroizpoved, kateri pripadajo, osebe brez verskegu prepri¬ čanja napišejo: bre i vere. Za otroke pod 14 leti je odločilna izjava •taršev.) ... .. . . . ..— Slika 3.1. Prva stran popisnice pri popisu prebivalstva 31.3.1953 v SFR Jugoslaviji. ■ 62 ' Bolj osebno je, da damo namesto nazivov znakov vprašanja . Namesto, da vpiše¬ mo npr. poklic in pričakujemo, da bo popisana oseba v ustrezni prostor vpisala svoj po¬ klic, raje zastavimo vprašanje: Kakšen je vaš poklic? Na tako vprašanje moremo priča- ' kovati večje razumevanje, kaj mora popisana oseba storiti, kot pa če postavimo suhopar¬ no: Poklic. Vprašanja uporabljamo posebno takrat, kadar med osebami, ki podatke daje¬ jo in statističnimi organi ni osebnega stika. Na razumljivo in vljudno postavljeno vpra¬ šanja moremo pričakovati več in pravilnejše odgovore - kot pa na suhoparno listo znakov, za katere naj popisana oseba dd odgovore. 3.32 Izkazalo se je, da so zelo primerna vprašanja, na katera oseba, ki podatke daje, odgovori z d a ali n e . Ta vprašanja so najbolj neposredna in zahtevajo od osebe, ki podatke daje, najmanj napora. Vendar mora biti tako vprašanje zastavljeno ta¬ ko, da se čimbolj izognemo pristranosti odgovorov. Če število možnih odgovorov na dano vprašanje ni preveliko, je zelo uspešna tale meto¬ da. Poleg vprašanja v sistematični obliki navedemo vse možne odgovore z navodilom, da oseba, ki podatke daje, pri različnih tehnikah ali: a) prečrta nepravilne odgovore, b) podčrta pravilen odgovor, c) odkljuka v ustreznem polju pravilen odgovor, d) obkroži ustrezno oznako - številko pri pravilnem odgovoru. Npr. vprašanje: Družinski stan, mo¬ remo po posameznih sistemih postaviti vprašanja in dobiti odgovore takole: a) sarprkf^ poročen, razv^an', vdoyerč b) samski, poročen , razvezan, vdovec c) samski poročen razvezan vdovec □ B' □ □' d) samski poročen razvezan vdovec 1 © 3 4 Če je število možnih odgovorov razmeroma veliko, v obrazcu navedemo nekaj večjih skupin odgovorov; oseba, ki podatke vpisuje, pa vpiše podroben odgovor v okence za ustrezno skupino npr. .. - 63 - Sliko 3.2 Prvo sttan vprašalnega lista za kmetijsko anketo 15.1 .1958. Zvezni zr.vod za daiiztiko, Beogrsi! Zavod LRS za statistiko, Ljubljana potim predal »2 - klelo« U. 22-379 IKD-1-1958 MaseCno poročita Esidusirijsiicsa porcija za mesec ...... 1958 Polni naziv podjetja .. .... telef. it. _ LR Slovani)* — okraj; _ Kr*): ... Ulic* In II. Ne Izpolnjuje podjefje Lelo le meter Okr*| Obilo* Pano«*, strok* In vrrt* dejavnosti Sektor lastnMv* i. □j:: Izpolnjuje Zavod za »UtUtlko OLO Vsako podjetje, ki Je obvezno pošlljilt to poročilo, izpolnjuje obrazec v 4 Izvodih. italerc fi. v mesecu odd* Zavodu z stilistiko tule«* okraj*, na katerega 'erilorlju »e nahaja sedel uprave p-djitj* Rok 6. v mesecu Tabela I — Izgotovljena proizvodnja, zaloge in realizacija blaga v količinnh Slika 3.3. Glava mesečnega poročila industrijskega podjetja v letu 1958. - 64 - Če hočemo, da bodo vprašanja ustrezna, moramo preštudirati različne primere. Katero izmed možnih variant uporabimo v popisu ali anketi, se odločimo šele po temeljitem pre¬ misleku in preskusu na terenu, saj se bo tam najbolj pokazalo, kateri način je najpriklad- riejši. 3.33 Navodila . Obrazec bi bilo običajno nemogoče pravilno izpolniti, če bi vseboval !e listo znakov ali spisek vprašanj. Mnoga vprašanja niso takoj jasna in moramo zanje dati pojasnila v navodilih za izpolnjevanje obrazca. Če opazujemo ekspedicijsko, dobe popisovalci navodila za izpolnjevanje obrazcev na te¬ čajih za popisovanje inv posebnih tiskanih navodilih. Pri ekspedicijskem načinu navodi¬ la za izpolnjevanje obrazca na samem obrazcu niso potrebna in samo zamotajo osnovni o- brazec. Če pa je za opazovanje predvidena samoregistracija, moramo vsako osebo, ki izpolnju¬ je obrazec, poučiti, kako je treba pravilno izpolniti obrazec. Zanje v splošnem ne more¬ mo prirediti posebnih tečajev za izpolnjevanje obrazca. Morejo pa v tem primeru dobro rabiti članki v časopisu in oddaje v radiu ali televiziji; tako opozarjamo osebe, ki izpo I- njujejo obrazce, na najbolj kočljive točke v izpolnjevanju obrczcev. Pri samoregistraci- ji pa so najbolj uspešna tiskana navodila na samem obrazcu. Splošna navodila damo na popisnem obrazcu tik pod naslovom, pojasnila k posameznim vprašanjem pa pri ustreznem vprašanju. Nikakor niso priporočljiva navodila na zadnji strani obrazcev ali celo navodi¬ la, ki so ločena od obrazca. Dostikrat osvetli izpolnjevanje izmišljen primer, ki nazorno pokaže, kako je treba obrazec izpolniti. 3.34 Posebnost prikazanega obrazca za popis prebivalstva je v tem, da ima ob desni strani prostor, določen za vnašanje številičnih šifer - oznak za posamezne vred¬ nosti znakov. Šifre so potrebne za strojno obdelavo podatkov. Pri obrazcu za kmetijsko anketo v sliki 3.2 pa vidimo, da je prostor za vnašanje podatkov o številu živine sistema¬ tično nanesen ob robu obrazca in do ima obrazec nenavadno-podolgovato obliko. Ta posebna oblika in prostor za podatke sta določena z načrtom ročne obdelave podatkov. Seštevanje podatkov je tako znatno poenostavljeno. Obrazce, za katere moramo podat- - 65 - ke seštevati, naložimo drug čez drugega. Tako zlahka seštevamo podatke brez prepiso¬ vanja v obdelovalne tabele. Podobnih prijemov, ki jih uporobljamo pri sestavi obrazcev, skladno s predvideno obdela¬ vo, je še več in jih je vredno upoštevati. Razmeroma neznatna sprememba popisnega obraz¬ ca poenostavi popisovanje ali obdelavo podatkov. KRAJ OPAZOVANJA 3.35 Regionalna razmestitev populacije je važna iz vsebinskega in tehničnega vidika. Proučevanje aglomeracije prebivalstva, lokacije industrije, trgovinske mreže, transporta itd. je vezano na podatke o regionalni razmestitvi posameznih pojavov.Zato večina opazovanj skuša zbrati podatke tako, da je možno proučevati regionalno razmesti¬ tev pojava. Razen tega pa je regionalna razmestitev zelo važna za organizacijo opazovanja. Za popu¬ lacije, za katere so enote razmeščene po vsem teritoriju, je organizacija opazovanja bi¬ stveno drugačna kakor za populacije, za katere so enote nakopičene v enem ali nekaj središčih. 3.36 Pri statističnih opazovanjih z velikim številom enot, ki so teritorialno raztresene, običajno celotno področje opazovanja razdelimo v popisne okoliše. Popisni okoliši so najmanjše teritorialne enote, sestavljene za potrebe opazovanja. Popis¬ ni okoliš je po pravilu področje, v katerem popisuje en sam popisovalec. Zato so popis¬ ni okoliši glede na razmere terena zelo različni. Popisni okoliš more biti naselje ali del' naselja, mestna ulica, stanovanjski blok, samotna kmetija itd. Popisni okoliši morajo bi¬ ti po pravilu taki, da enolično zajamejo vse področje opazovanja. To pomeni, da mora biti vsaka enota v enem samem popisnem okolišu. Nepravilna bi bila razdelitev teritori¬ ja v popisne okoliše, če bi neka hiša pri popisu prebivalstva spadala v dva popisna oko¬ liša, neka samotna kmetija pa v nobenega. Razdelitev teritorija popisa v popisne okoliše mora biti izvedena tako, da moremo z nji¬ mi sestaviti najmanjše politično-upravne teritorialne enote, t.j. občine. To načelo je razen drugega zelo koristno, če potrebujemo podatke po upravno-teritorialnih enotah. Če ga upoštevamo, moremo iz popisnih okolišev brez težav sestaviti podatke za katero koli upravno-teritorialno enoto. 3.37 Kraj opazovane enote more biti v načelu različen od kraja popisa. Pri posrednem opazovanju daje podatke oseba, ki ni nujno v istem kraju kot enota opa¬ zovanja. Tako daje centrala podatke za svoje podružnice, ki niso v istem kraju, kmetij¬ ski posestnik podatke o svojem imetju (živini, zemljiščih itd.), ki ni v istem kraju kakor sedež gospodarstva. Razmestitev opazovane populacije ni nujno ista kakor razmestitev enot poročanja - to je oseb, organizacij, ustanov itd., ki dajejo podatke o opazovanih enotah. Regionalna raz¬ mestitev enot populacije je važna iz vsebinskih razlogov, ker da sliko o razmestitvi opa¬ zovanega pojava; razmestitev poročevalskih enot pa je pomembna za organizacijo opazo¬ vanja, ker od njih dobimo podatke o enotah populacije. ORGANI STATISTIČNEGA OPAZOVANJA 3.38 Pri statističnem opazovanju večjega obsega sodeluje veliko ljudi z različnimi nalo¬ gami . Program statističnega opazovanja sestavljajo statistični strokovnjaki v tesnem sodelovanju s porabniki statističnih podatkov in strokovnjakiiz področ¬ ja , kamor spada konkretno statistično opazovanje. Pri sestavljanju programa sodeluje razmeroma malo toda visoko kvalificiranih strokovnjakov. Enako je potrebno tesno sodelovanje statističnih strokovnjakov in strokovnjakov s področ¬ ja, kamor spada opazovanje, tudi pri sestavljanju obrazcev, splošnem načrtu in organiza¬ ciji opazovanja. Vendar je pri tem situacija obrnjena. Program opazovanja je predvsem delo strokovnjakov s področja, v katerega spada opazovanje po vsebini; statistični strokov¬ njaki samo pomagajo pr-i izdelavi programa, da je formulacija programa taka, da zadošča statističnim načelom. Organizacija opazovanja pa je predvsem delo statističnih strokovnja¬ kov in jim strokovnjaki s področja, v katerega spada pojav, samo pomagajo. Ta pomoč je - 67 - neobhodna pri sestavljanju obrazcev, vsebinskih navodil itd. Važni sodelavci pri statističnem opazovanju so popisovalci oziroma anketarji. Popisovalci neposredno izvajajo statistično opazovanje no terenu. Njihov poklic običajno ni statistika. Za to delo so izbrani pri vsakem popisu posebej. Čeprav to niso statistiki,si pri vsakem popisu prizadevamo, da izberemo za popisovalce osebe, ki imajo tako zaposli¬ tev, da jim predmet ni tuj. Tako npr. pri anketah iz kmetijstva izberemo za popisovalce agronome, pri anketah iz gozdarstva gozdarje ali logarje, pri popisih iz šolstva in prosve¬ te učitelje ali profesorje itd. To znatno pripomore h kakovostni izvedbi opazovanja. Popi¬ sovalce usposobimo za njihovo delo na posebnih tečajih ali s podrobnimi navodili za izva¬ janje statističnega opazovanja, pri katerem sodelujejo. Razen kontrolorjev, ki so bolje poučeni in izurjeni za opazovanje kakor popisovalci in so običajno, če le mogoče, statistični organi, sestavimo pri velikih popisih popisne komisije. Popisne komisije in kontrolorji imajo nalogo pomagati drugim organom pri opazovanju. Obenem popisne komisije zbirajo gradivo od popisovalcev in skrbe za pra¬ vilno izvajanje opazovanja na svojem področju. Razen popisovalcev so organi opazovanja še osebe, ki dajejo podatke o opazovanih enotah. To so v vsakem primeru osebe, ki predmet opazovanja najbolje po¬ znajo. Tako dajejo pri popisih prebivalstva starši razen zase še podatke za svoje otroke, gospodarji kmetijskih gospodarstev za svoje gospodarstvo, statističarji. v industrijskih pod¬ jetjih za svoje podjetje itd. Kakovost izvedenega opazovanja je odvisna predvsem od oseb, ki podatke dojejo. Kako¬ vost njihovih izjav pa je odvisna od organizacije opazovanja, popisnih obrazcev, navo¬ dil za izpolnjevanje, dela popisovalcev itd. Le razumevanje in skupen napor vseh organov opazovanja, od vodstva do tistih, ki podatke dajejo, more zagotoviti uspešno izvedbo sta¬ tističnega opazovanja. V posameznih opazovanjih more ta ali oni organ izpasti. Tako pri poštnem načinu odpade¬ jo popisovalci in popisne komisije, pri opazovanjih manjšega obsega popisne komisije itd. Vrsta in število organov pri posameznem statističnem opazovanju je odvisno od proučeva¬ ne populacije in organizacije opazovanja. - 68 - napake in kontrola pri statističnem opazovanju 3.39 Vzroki napak. Pri statističnem opazovanju sodeluje veliko ljudi, ki ima¬ jo najrazličnejše težnje, so na različni kulturni ravni, so bolje ali slabše poučeni o vlogi opazovanja in tehniki izpolnjevanja obrazcev itd. Zato organizatorji opazovanja vnaprej vedo, da zbrani podatki ne bodo niti popolni niti popolnoma pravilni. Vendar sku¬ šamo opazovanje izvesti in organizirati tako, da je čim manj rtopak v opazovanju, gradi¬ vo pa čim popolnejše. Vnoprejšnja analiza napak, ki morejo nastati v statističnem opazo¬ vanju, more dati smernice, kako posamezne vrste napak odpravimo ali pa vsaj kar najbolj orne j i mo. Vzrokov za napake v statističnem opazovanju je več. Pomanjkljiva navodila, nera¬ zumljive opredelitve pojmov, slabo zastavljena vprašanja v popisnem obrazcu, vprašanja, ki preveč posegojov osebno življenje, slabo organizacija itd. so vzroki napak, ki jih za¬ greši vodstvo opazovanja. Vzrok napak more biti tudi napačno tolmačenje in slabo delo popisovalcev. Vendar moremo kljub temu, da so v opazovanju vprašanja dobro zastavlje¬ na in delo popisovalcev dobro, dobiti slabe podatke, če ljudje namerno navajajo napačne podatke. To je pogost pojav pri podatkih o premoženjskih razmerah, dohodkih, potrošnji itd. Popisana oseba se boji, da bi zbrane podatke izkoriščali v nestatistične namene, če¬ prav je ta bojazen neupravičena. Z zakonom je namreč zagotovljena tajnost posamičnih statističnih podatkov. Namen zbiranja statističnih podatkov je izključno statistična obde¬ lava in slika celote. Ti podatki se ne smejo izkoriščati v nobene druge namene. Zaupa¬ nje ljudi, da se zbrani podatki ne uporabijo za posamične sklepe, včasih utrdimo tako, da izvedemo anketo anonimno, čeprav je v tem primeru otežkočena kontrola zbranih po¬ datkov. 3.40 Vrste' napak. Napake v statističnem opazovanju morejo biti slučajne ali sistematične. Slučajne napake izvirajo iz malomarnega opazovanja in izpolnjevanja obrazcev. Učinek slučajnih napck na rezultate opazovanja ni prevelik, ker se po zakonu o velikih številih slučajne napake izravnavajo. Hujši je učinek sistematičnih napak. Sistematične napake so napake, ki se pojav¬ ljajo iz nekega določenega vzroka s sistematično enakim učinkom pri posameznih enotah - 69 ’- opazovanja. Učinek sistematične napake se v velikem številu enot ne izravna, temveč kopiči. Zato so sistematične napake nevarnejše kakor slučajne. Vir sistematičnih napak more biti vsak izmed vzrokov, ki smo jih našteli zgoraj. Tako more biti vzrok sistematič¬ ne napake nejasno opredeljen pojem ali slabo zastavljeno vprašanje. Če npr. iščemo po ■podjetjih vrednost proizvodnje v določenem razdobju, a ne določimo natančno, kaj pome¬ ni vrednost industrijske proizvodnje, more biti to vir sistematične napake, ker podjetja v dobri veri vključujejo ali izključujejo neke od svojih dejavnosti v vrednost proizvodnje. Vir sistematičnih napak more biti tudi zaokroževanje podatkov. Tipičen primer je navaja¬ nje starosti pri popisih prebivalstva. Stari ljudje radi zaokrožujejo svojo starost na okrog¬ la leta in npr. navajajo, da so stari 60, 65 , 70, 75 , 80 let, čeprav niso stari 60 let,tem¬ več okrog 60 let, ne 65, marveč okrog 65 let itd. Zato imamo v rezultatih števila prebi¬ valcev po starosti značilna kopičenja prebivalstva za starosti 60, 65, 70 itd. let. Tc se¬ stava ni stvarna, marveč je rezultat sistematične napake zaradi zaokroževanja let. To napako moremo pri opazovanju odpraviti, če od popisovalca zahtevamo, da starost preve¬ ri z rojstnim listom ali drugim dokumentom. Vir sistematičnih napak more biti tudi namerno dajanje napačnih podatkov. Kakor smo že navedli, opažamo sistematično navajanje premajhnih podatkov o premoženju, dohodkih itd. 3.41 Kontrola napak. Da bi dobili čim boljše podatke o opazovanem pojavu, je potrebna dobra in učinkovita kontrola zbranega gradiva. Kontrola med opazovanjem obstoji iz terenske kontrole o delu popisovalcev in izpolnjevanja obrazcev. Namen te kontrole , ki ne more biti celotna, je predvsem odkrie vanje tipičnih napak v organizaciji in napak pri izpolnjevanju obrazcev. Z dodatnimi splošnimi navodili in priporočili odstranimo težave in napake v opazovanju, ki jih ori na¬ črtu opazovanja nismo poznali in jih je odkrila šele kontrola v toku opazovanja. Kontrola zbranega gradiva je popoln pregled gradiva opazovanja. Kontrola zbranega gradiva obsega tele stopnje: kontrolo polnoštevilnosti zajetja enot, kontrolo pol- noštevilnosti odgovorov in kontrolo pravilnosti odgovorov. - 70 - Kontrola p o I noštev 11 nosf i zajetja je omejena na pregled gradiva in številčno primerjavo zbranih obrazcev s kontrolniki, spiski oziroma registri enot. Ta kontrola odkri¬ je enote, ki niso bile popisane oziroma enote, popisane večkrat. Kontrola o polnoštevilnosti odgovorov je preprosta. V tej stopnji kontrole ob¬ razce pregledamo, ali so na vsa zastavljena vprašanja vpisani odgovori. Kontrola pravilnosti odgovorov je najtežja. Kontrola pravilnosti odgovorov je trojna: stvarna, logična in računska. Stvarna kontrola odkrije napake, če je podatek sam zase neverjeten. Stvarna kon¬ trola odkrije, če nekdo navede, da je star 105 let, da ima njegovo privatno gospodarstvo 200 ha obdelovalne površine itd. Te napake so običajno napake v pravem smislu, ker se je tisti, ki je podatke vpisoval, verjetno zmotil, brez namena, da bi potvarjal podatke. Logična kontrola kontrolira posamezne podatke v medsebojni odvisnosti. Podatek more biti zase verjeten, v primerjavi z drugim pa je nelogičen. Tako stvarna kontrola ne odkrije napake, če je nekdo napisal, da je star dve leti, a da je po poklicu inženir.Eno in drugo je samo zase možno, v medsebojni zvezi pa je nelogično. Z logično kontrolo odkrijemo tudi manj nelogične odgovore. Računska kontrola odkriva napake v numeričnih podatkih, ki sov medsebojni zve¬ zi. Tako mora biti vsota izdatkov po vrstah stroškov enaka skupnim izdatkom, produkt ce¬ ne in količine enak vrednosti itd. Čeprav se izogibamo odvečnih podatkov,posebno, če moremo iz njih sami izračunati do¬ datne podatke, dostikrat namenoma postavljamo kontrolna vprašanja , da z račun¬ sko ali logično kontrolo odkrijemo napake, ki jih brez kontrolnih vprašanj ne bi odkrili. Z zgornjimi vrstami kontrol pa ne moremo odkriti vseh napak. V popisnem gradivu so nam¬ reč lahko še napake, ki jih z nobeno od zgornjih kontrol ni moč odkriti. Določen podatek je verjeten v zvezi z vsemi drugimi podatki,, pa je kljub temu napačen. Te vrste napak so najhujše in tudi na j pogoste j še. Podatke, ki so verjetni, vendar nepravilni, more odkriti le dober poznavalec krajevnih - 71 - razmer aIi oseba, ki popisano enote pozna. Te napake odkrije tudi ponoven popis, ki ga izvedemo bolj natančno z dokumenti, pregledom itd. Jasno je, da taka kontrola ne pride v poštev, ker je pravzaprav ponovna izvedba opazovanja s strožjimi merili. Da ugotovimo skupen učinek napak te vrste, dostikrat izvedemo kontrolni slučajni vzorec in za izbrane enote izvedemo ponoven popis. Pri tem vzorcu pa uporabimo vsa razpoložljiva sredstvo, da dobimo popolne podatke. Primerjava podatkov, ki jih dobimo s kontrolnim vzorcem, s podatki, ki jih dobimo z osnovnim opazovanjem za iste enote, po¬ kaže skupen učinek napak. Z njim moremo popraviti popisne podatke. Če je namreč vzorčna kontrola pri popisu živine pokazala, da smo s kontrolo v vzorčnih gospodarstvih ugotovili za 5% več živine kakor za ista gospodarstva pri popisu, moremo ta rezultat po¬ splošiti na celoto in skupno število živine te vrste po popisu povečati za 5%. 3.42 Podatke kontrolirajo organi opazovanja v vseh stopnjah. Kontrola podatkov na vsaki stopnji ima svoje pomanjkljivosti in prednosti. Prvi, ki pri samoregistraciji kontrolira podatke, je popisovalec, ko prevzema izpolnjene obrazce. Prednost te kon¬ trole je v tem, da je razmeroma najcenejša, hitra in tudi učinkovita. Tako je najceneje, če popisovalec pri prevzemu konttoliro polnošfevilnost odgovorov, ker takoj dobi odgovo¬ re na neizpolnjena vprašanja. Enako more popisovalec, če pozna enoto ali razmere v svo¬ jem popisnem okolišu, odkriti veliko več napak v odgovorih, ki se zde na prvi pogled pravilni, kakor kontrolor, ki ne pozna razmer. Kontrola na prvi stopnji pa ima svoje hibe. Je neenotna in ne more biti sistematična.Gle¬ de tega je boljša kontrola, ki jo izvedejo popisne komisije ali drugi vmesni organi med popisovalcem in središčem, ki opazovanje organizira. Kontrola v središču je sicer enotna, sistematična in kvalitetna, vendar le za napake, ki jih more odkriti običajna stvarna, lo¬ gična ali računska kontrola. Napake, ki so take narave, da so podatki verjetni, kljub temu pa napačni, pa odkrije kontrole tem teže, čim bolj je odmaknjena od terena.Razen tega je popravljanje napak tem teže in tem bolj zapleteno, čim višji organ napako odkri¬ je. Medtem ko napako, ki jo odkrije popisovalec, popravi popisovalec mimogrede pri prevzemu popisanega gradiva, je pri napakah, ki jih odkrije šele višji organ, potrebno dopisovanje, ponoven obhod terena itd. - 72 - ) ČETRTO POGLAVJE UREJEVANJE IN OSNOVNA OBDELAVA STATISTIČNEGA GRADIVA 4.1 Ko z opazovanjem zberemo podatke o populaciji, ki jo proučujemo, je populaci¬ ja dana v nepregledni množici posamičnih obrazcev. Ta množica obrazcev in po¬ datkov nadomesti populacijo v obliki, ki je primerna za obdelavo. Zbrani obrazci so su¬ rovina, ki v nadaljnji obdelavi dd končni proizvod - statistične tabele, grafikone, pre¬ glede in parametre,s katerimi analiziramo pojav. Osnovna obdelava statističnih podatkov je urejevanje. Urejevanje sestoji iz gru¬ piranja, preštevanja in seštevanja statističnih enot in podatkov. Namen urejevanja so ab¬ solutni podatki o statistični popuiaciji^fak<4, da jih je z analitičnimi metodami možno ob¬ delati in analizirati. Pri popisu prebivalstva npr. z urejevanjem ugotovimo sestavo prebi¬ valstva po spolu, stanu, starosti, šolski izobrazbi, poklicu itd., skratka po vseh znakih in kombinacijah znakov, ki smo jih zbrali s popisom. Rezultate urejevanja prikazujemo s statističnimi vrstami v statističnih tabelah. Statistična vrsta je osnovni način prikazova¬ nja statističnih podatkov, tabela pa eden izmed načinov za prikazovanje statističnih vrst. Osnovni podatki, ki jih dobimo z urejevanjem, so osnova za preračunavanja in analizo. Urejevanje statističnega gradiva sestoji iz več različnih stopenj, ki so med seboj vezane časovno in vsebinsko. Urejevanje statističnega gradiva je za velika opazovanja tehnič¬ ni posel, ki traja razmeroma dolgo. Ves napor za izboljšanje tehnike urejevanja je us- - 73 - merjen v to, da skrajšamo čas urejevanja. Vrednost podatkov določenega opazovanja je tem večja, čim prej so podatki po izvedenem opazovanju na razpolago. Obdelavo pospe¬ šimo, če zaposlimo več obdelovalcev. Vendar je število obdelovalcev'omejeno, ker so po¬ trebne za urejevanje kvalificirane osebe. Zaradi vseh naštetih razlogov na splošno uvaja- •mo moderna sredstva elektronske obdelave podatkov. Ta je pri opazovanjih večjega obse¬ ga že skoraj izpodrinila ročno obdelavo. Vendar so tudi pri urejevanju določena dela,ki se ne dajo mehanizirati. 4.2 Po kontroli statističnega gradiva sestoji urejevanje statističnega gradiva iz različ¬ nih stopenj dela. Z načrtom urejevanja določimo in rešimo vprašanja za izvedbo naslednje stopnje urejevanja: o )I grupiranje vrednosti znakov. b) šifriranje oziroma signiranje zbranih statističnih podatkov. c) načrt za osnovno obdelavo. d) način obdelave podatkov. Kakor smo že nakazali pri obravnavanju znakov, imajo nekateri znaki razmeroma veliko, včasih tudi neomejeno število vrednosti. Nalogo grupiranja je za znake z veli¬ kim številom vrednosti združiti sorodne vrednosti npr. sorodne poklice, sorodne artikle itd., v grupe tako, da število grup ni preveliko. Ti grupni znaki dajo sicer bolj grobo sliko, vendar so zaradi manjšega števila grup bolj prikladni za obdelavo in dado pregled¬ nejšo sliko o pojavu. Grupiranje znaka je ozko povezano z vsebino in nameni proučeva¬ nja . Cisto tehničnega značaja pa je šifriranje oziroma signiranje podatkov. Da je nadaljnja obdelava podatkov čim bolj avtomatična, posamezne podatke v gradivu zazna¬ mujemo $ kratkimi oznakami - šiframi, pri obdelavi pa se oziramo ie na šifre in ne več na osnovne podatke. Načrt obdelave določa, po katerih kombinacijah znakov ali grupah znakov bomo obdelali gradivo, do bomo dobili odgovor za dano proučevanje. Pri popisu prebivalstva ne iščemo sestave prebivalstva samo oceno po spolu in starosti, temveč je pomembna se¬ stavo, ki razdeli prebivalstvo po spolu in starosti hkrati. Tako dobimo vpogled ne le v spolno in starostno sestavo ločeno, ampak v spolno-starostno sestavo prebivalstva. Kombi¬ nirana obdelava dveh ali več znakov hkrati je ena izmed osnovnih metod obdelave in osno¬ va za analizo odvisnosti med pojavi. Z načrtom obdelave glede na namen proučevanja do- loč imo,katere kombinacije znakov so za proučevanje pomembne in ali nameravamo po teh kombinacijah znake preštevati ali seštevati. V načrtu osnovne obdelave je treba tudi določiti, kako bomo obdelovali statistične podat¬ ke. Ze pri sestavljanju obrazcev (glej primere obrazcev) posebno pa pri šifriranju podat¬ kov, je treba upoštevati, ali nameravamo obdelovati podatke ročno ali strojno. Rezultati urejevanja so prikazani v obdelovalnih tabelah, ki so prikrojene načinu obde¬ lave. Sele iz obdelovalnih tabel sestavimo končne publikacijske ali analitične tabele, s katerimi prikažemo populacijo ali damo osnovo za analizo pojava. GRUPIRANJE VREDNOSTI ZNAKOV 7 4.3 Grupne značilnosti uporabljamo že v vsakdanjem izražanju. Tako starost zaokro¬ žujemo v starost v letih. Če zaokrožujemo starost na izpolnjena leta, vzamemo za 26 let stare vse, ki so stari več kot 26 in manj kot 27 let. Če pa zaokrožujemo starost na najbližje leto, štejemo za 26 let stare vse, ki so stari od 25 in pol do 26 in pol let. Vse, katerih starost je v navedenem razmiku, štejemo da so stari enako - 26 let. Prav tako tu - 6i osebne dohodke ne navajamo v parah, marveč dinarjih. Enako v pojmu delavec ali uslužbenec združujemo vse delavske ali uslužbenske poklice. Če za nekoga pravimo, da je delavec, zanj sicer ne vemo natančno, kakšen je njegov po¬ klic; vemo pa, v kateri skupini poklicev je. Vsi delavski poklici so združeni pod skupnim pojmom delavec. Tudi časovno v vsakdanjem govoru uporabljamo grupe in pravimo: ta in ta nesreča se je zgodila v nedeljo 25.1 .1968. Tako je čas dogodka za dane potrebe zadosti določen, če¬ prav se je mogla po teh-podatkih nesreča dogoditi v razmiku 24 ur. Včasih zadoščajo še širše časovne grupe. Na vprašanje, kdaj se je neka oseba poročila, ta odgovori: v letu 1956, Ta podatek, čeprav je dan z razmikom enega leta, povsem zadošča za opredelitev časa poroke. - 75 - Enako ravnamo tudi s krajevnimi opredelitvami. Včasih na vprašanje odkod smo, odgovo¬ rimo; iz Ljubljane, ne navedemo pa ulice, hišne številke, nadstropja in stopnišča. Ko rečemo, da smo iz Ljubljane, povemo, da je naše stanovanje na območju Ljubljane. Da so iz Ljubljane, odgovorijo na vprašanje, odkod so, vsi, ki so doma na območju Ljublja¬ ne . Iz gornjih zgledov vidimo, da v vsakdanjem življenju in govoru ne zaokrožujemo samo numeričnih ampak na splošno vse znake. V kako velikih grupah se izražamo, je odvisno od potreb in razmer, v katerih smo. Včasih ni dovolj, če kdo reče, da je uslužbenec.Za¬ to je treba poklic natančneje določiti. Enako je s krajem stalnega bivališča. Če vas v Ameriki nekdo vpraša, odkod ste, je dovolj, da rečete, da ste iz Jugoslavije, čeprav je to razmeroma širok pojem. Če vas pa nekdo, ki vč, da ste Ljubljančan, v Ljubljani vpra¬ ša, kje ste doma, morate navesti ul ico, torej niti opredelitev, do ste Ljubljančan, ni za¬ dostna. 4.4 V bistvu iz istega razloga in po istih načelih kakor v vsakdanjem življenju gru¬ piramo znake tudi v statistične namene. Natančne vrednosti dostikrat niso potrebne. Število vseh.možnih vrednosti znaka je za nekatere znake veliko ali celo neomejeno. Zato je običajno prikladneje, da sorodne vrednosti združimo v grupne vred¬ nosti. Tako sicer izgubimo pri natančnosti, pridobimo pa pri preglednosti. Še en razlog, ki ga pri grupiranju v vsakdanjem življenju ni, je odločilen za grupiranje znakov v sta¬ tistiki. Šele pri grupnih znakih se za večino znakov pokaže množičnost pojavljanja, ki je ena izmed bistvenih lastnosti množičnih pojavov. To bomo opazovali pri podatkih o porabi lesa v kmetijskih gospodarstvih, ko bomo obravnavali frekvenčne porazdelitve. 4.5 Preden bomo obravnavali grupiranje za posamezne vrste znakov, navedimo nekaj splošnih načel, ki veljajo za grupiranje vseh znakov. Grupiranje mora biti izvedeno pri vseh znakih opazovanja enolično) Vse vrednosti znaka grupiramo v grupni znak tako, da vsaka osnovna vrednost znaEcTšpada v eno in samo eno grupo. Napačno bi bilo grupiranje, pri katerem bi bila določena vrednost v dveh ali več grupah istočasno ali pa v nobeni grupi. To načelo zahtevo, da smo posebno pazljivi pri mejnih vrednostih. Tako je pri časovnih grupah za dneve vprašanje, kam spada trenutek - 76 - od koncu enega dne in v začetku drugega dne- Pri geografskih grupah more biti sporno, kam spadajo točke, ki so teoretično na meji med dvema geografskima območjema. Grupe vseh znokov imajo tudi tole lastnost; grupe znakov moremo grupirati v grupe višje vrste enako, kakor grupiramo osnovne vrednosti znakov. Tako moremo~obclne, trio grupe prve stopnje, grupirati v okraje, ki so grupe druge stopnje, te v republike kot grupe tretje stopnje itd. Enako moremo ure združevati v dneve, te v mesece, mesece v leta, leta v petletja. Podobno je tudi s stvarnimi znaki. Posamezne poklice grupiramo v najožje grupe poklicev, te grupe v širše grupe itd. Ta postopek ponavljamo, dokler gru¬ piran je ne dovede do najširših grup oziroma do grvpe, |ci obseže vse vrednosti - Vsaka po¬ drobnejša grupacija v tem stopnjevanju grup podrobnttj* do|očq poklice. Enako grupiramo predmete porabe, vzroke smrti itd. Vrednosti enega in istega znaka moremo grupirati po različnih načelih, tako da za isti znak dobimo več različnih grupacij. Ker posamezne vrednosti združujemo v grupe po sorodnosti, daje načelo grupiranja merilo o sorodnosti. Načelo grupiranja je v tesni zvezi s predmetom opazovanja, namenom in potrebami proučevanja pojava. Artikle, ki so predmet zunanje trgovine, grupiramo v grupe po načelu surovine, iz kotere je predmet pretežno izdelan ali po načelu uporabe. Enako sestavljamo geografske grupe po upravno- političnem načelu in so v posameznih grupah kraji, ki so v istih občinah, itd. Mo¬ remo pa geografske grupe sestaviti tudi glede na kmetijsko proizvodnjo; po tem načelu pa združujemo v grupe vse kraje, v katerih je kmetijska proizvodnja pretežno iste vrste. Toko dobimo kmetijske rajone. Ti so sestavljeni po sorodnosti krajev glede na kmetijsko proizvodnjo in se ne ozirajo na upravno-politično razdelitev. Grupiranje po upravno- političnem načelu pa se spet ozira somo na to, ali so posamezni kraji v isti občini itd. Razen tega pri grupiranju vsaka grupa običajno dobi neko ime-novo vred - n o s t , ki pojmovno združuje vse vrednosti znakov za ustrezno grupo. Grupe dobe po¬ sebna imena: geografske grupe npr. imena občin, republik itd., časovne grupe datume, mesece, leta itd., stvarne grupe nazive grup poklicev itd. Razen skupnih načel ih lastnosti grupiranja in grup, ki smo jih navedli, imajo posamezne vrste znakov svoje posebne probleme. Te bomo obravnavali ločeno za vsako vrsto pose¬ bej. 4.6 Krajevne znake običajno grupiramo v področja po up ra v n o političnem vidiku. Ta grupacija je upravičena iz dveh razlogov. Porabnik statističnih po¬ datkov, če ne gre za neke posebne raziskave, potrebuje za svojo uporabo podatke po u- pravno-politični razdelitvi. Razen tega so upravno politične enote prikladne grupe, ker -so že izdelane v druge namene. Za potrebe posebnega proučevanja se samo naslonimo na to razdelitev terena. Hiba upravno-polifične razdelitve pa je v tem, da se ta razdelitev časovno menja. Zato je krajevno proučevanje dinamike pojavov otežkočeno ter zahteva razmeroma težavna preračunavanja. Hibo pri grupiranju podatkov po upravno-polifični teritorialni razdelitvi je tudi, da je načelo tega grupiranja za večino proučevanj formal¬ no in ima zato omejeno analitično uporabnost. Marsikatera značilnost se nomreČ pri t«m zabriše. Za proučevanje pojava je vsekakor bolje grupiranje po načelu, ki je v vsebinski zvezi s pojavom, ki ga proučujemo. Če upoštevamo to načelo, razdelimo teritorij v vsebinske geografske grupe - rajone. Geografske rajone izdelujemo po različnih merilih in za različne potrebe. Rajonizacijo pa spremljajo tehnične težave. Izvesti rajonizacijo po nekem vsebinskem načelu je običajno zelo težko, ker moramo teritorij in razmestitev pojava, ki ga proučujemo, zelo dobro poznati. Čeprav je za določeno proučevanje ta¬ ka razdelitev najboljša, so težave v tem, da je treba tako rekoč za vsako proučevanje posebej podrobno razdeliti teritorij na vsebinske grupe. Te grupe v splošnem seka jo u- pravno-teritorialno razdelitev. Običajno vzamemo kompromisno rešitev, da manjše ad¬ ministrativne enote npr. občine ne grupiramo dalje v republike, marveč po vsebinskem načelu po pretežnosti v vsebinske grupe - rajone. Ta način, čeprav n! najbolj natančen, omogoča rajonizacijo brez posebnih dodatnih težav. Razen tega pa moremo po potrebi grupirati iste podatke po obeh načelih: upravno-teritorialnem in vsebinskem. Nojmanjše krajevne grupe, ki so sestavljene v statistične namene, so statistič¬ ni o k o I i š i . Ti so sestavljeni tako, da ne sekajo upravno-teritorialnih enot. 4.7 Za časovne znake je sorodnost momentov običajno dana s časovnim razmikom med momenti. Po tem načelu dobimo naravne enote: minute, ure, dne¬ ve, tedne, mesece, leta. Izmed teh grup so najbolj problematični meseci, ker so različ¬ no dolgi (od 28 do 31 dne). Razlika med najkrajšim in najdaljšim mesecem je tri dni ali približno deset odstotkov. Še večje so razlike, če namesto koledarskih dni upoštevamo - 78 - samo delovne dni. S posebnimi prijemi reduciramo podatke tako, da lahko mesečne po¬ datke primerjamo med seboj. f Za proučevanje nekaterih pojavov uporabljamo drugačna načela grupiranja časa. Za prou¬ čevanje sezonskih vplivov so si sorodnejši vsi januarji, vsi februarji, vsi marci za vsa leta v določenem razdobju kakor pa januar, februar, marec itd. istega leta, čeprav so prvi časovno bolj oddaljeni. Če proučujemo na primer turizem, gradbeništvo, poljedelstvo, je takoj razumljivo, da je res tako. Okoliščine za vsako od teh dejavnosti sov istih mese¬ cih v zaporednih letih bolj sorodne kot v različnih mesecih istega leta. Enak problem je z grupiranjem dni v tednu, če proučujemo promet, prometne nesreče, rabo pi jaČjld. V tem primeru tvorimo grupe vseh ponedeljkov, vseh torkov itd. Enako sestavljamo grupe Iz določenih ur iz zaporednih dni, če proučujemo nihanje v dnevni rabi električne ener¬ gije ali vode, število prevozov v lokalnem prometu itd. 4-8 Grupiranje stvarnih znakov je bistveno različno za atributivne in za numerične znake. Grupiranje atributivnih znakov je najtežje. Čeprav postavimo za grupiranje atributivnih znakov npr. poklice, vzroke smrti, dejavnost, izdelke v zu- nanji trgovini, surovine v industriji itd. neko načelo grupiranja, s tem grupiranje še ni izvedeno kakor je npr. izvedeno krajevno grupiranje, če se odločimo za upravno-terito- rialno načelo ali če določimo načelo grupiranja za časovne znake. Za stvarno-atributiv- ne znake so z načelom postavljene samo smernice za grupiranje. Grupiranje posameznih poklicev, vzrokov smrti, dejavnosti itd. pa je obširno delo, ki ga morejo opraviti le strokovnjaki. Ti po načelih grupiranja sistematično klasificirajo vse mogoče posamezne poklice, vzroke smrti, dejavnosti itd. in izdelajo podrobne klasifikacije - nomenklature, v katerih je za vsak poklic, vzrok smrti, artikel itd. navedeno, v katero grupo spada. Klasifikacije in nomenklature so torej sistematično po grupah in podgrupah urejeni sezna¬ mi poklicev, vzrokov smrti, artiklov itd. 4.9 Atributivne znake z velikim številom vrednosti običajno tehnično grupiramo po decimalni klasifikaciji. Osnova decimalne klasifikacije je v tem, da naj¬ več po deset osnovnih pojmov združimo v grupe prve stopnje, največ po deset grup prve stopnje v grupe druge stopnje itd v To grupiranje v grupe višjih stopenj ponavljamo toliko - 79 - čašo, da imamo največ deset grup zadnje stopnje. To načelo ni vsebinsko temveč tehnič¬ no. Vsak pojem moremo namreč po decimalni klasifikaciji označiti s številom, ki ima to¬ liko mest, kolikor stopenj ima grupiranje. To je zelo prikladno. Prva številka označbe po decimalni klasifikaciji pove, v kateri naj širši grupi je določen pojem, prvi dve mesti opredelita grupo po naslednji razdelitvi in ta ko dalje. Cim večmestno število vzamemo, tembolj je pojem določen. Za zgled podajamo prvo razdelitev blaga v statistiki zunanje trgovine (Vir: Nomenklatu¬ ra statistike spoljne trgovine SFR Jugoslavije, ki jo je v letu 1957 izdal Zvezni zavod za statistiko): © Prehrambeni proizvodi. 1 Pijače in tobak. 2 Surovine, ki niso prehrambene (razen goriv). 3 Mineralna goriva, maziva in sorodni proizvodi. 4 Živalska in rastlinska olja in maščobe. 5 Kmetijski proizvodi. 6 Izdelki, klasificirani pre.težno.po materialu. 7 Stroji in transportne priprave. 8 Razni gotovi izdelki. 9 Razne transakcije in nikjer omenjeno blago. Izsek iz te nomenklature za izdelke iz lesa in plute pa je takle: 63 Izdelki iz lesa in plute (razen pohištva) 631 Furnir, vezane plošče, deske, umetno ali rekonstruiran in drugi les,obdelan neome¬ jeno 631-01 Furnir 3 631-01-11 Furnir bukov normalen m' /kg 631-01-12 Furnir bukov za stole " 631-01-20 Orehov furnir " 631-01-30 Hrastov furnir " 631-01-40 Furnir slepi " 631-01-90 Furnir iz drugih listavcev " - 80 - Iz zgleda vidimo smisel in pomen decimalne klasifikacije. Prva številka v oznaki 631-01-11, s katero je zaznamovan normalen bukov furnir (6), pove, da normalen bukov furnir spada po klasifikaciji v grupo izdelkov, klasificiranih pretežno po materialu. Prvi' dve številki (63) pomenita, da spada ta izdelek v podgrupo izdelkov iz lesa in p!ute(brez pohištva). Prve tri (631) številke oznake pomenijo, da spada navedeni izdelek v nadalj¬ njo podgrupo furnirjev, vezanih plošč, desk itd. Decimalna klasifikacija je zelo prikladna, ker številčne oznake nazorno pokažejo v ka- tero grupo po kateri koli grupaciji sodi posamezen pojav. 4.10 Pri grupiranju stvarno atributivnih znakov včasih vrednosti, ki jih ne moremo gru¬ pirati v grupe ali pa za proučevanje niso bistvene, združimo v grupo "drugo" . Se¬ veda moramo grupo "ostalo" tvoriti tako, da ni preobširna. Včasih tvorimo tudi grupo "neznano", v katero zaradi popolnosti pregledov vključimo vse enote, za katere iz katerega koli vzroka nimamo podatkov. 4.11 Grupiranje za vrednosti s tv a r n o-n u m e r i č n i h znakov mora ustrezati vse¬ binskim in tehničnim pogojem. Ker je analiza numeričnih znakov najbolj razvita, se pri grupiranju numeričnih znakov oziramo na formaIno-tehnična načela grupiranja, če le taka grupacija ni nedopustna iz vsebinskih razlogov. Za zgled grupiranja zveznega numeričneg- Znaka vzemimo skupno površino privatnih kme Hjskih gospodarstev. V"statističnem godišnjaku 1972" imamo naslednje grupe:-2 ha; nad 2 ha - 3 ha; nad 3 ha - 5 ha; nad 5ha - 8 ha in nad 8 ha in več. 4.12 Grupe za numerične znake, ki jih imenujemo ra z re d e ,so določene s spod- mejo y, . in z g o r n j o _! _lk* *mia. m e -V . Nobena vrednost v * k f mm -- razredu ni manjša od spodnje meje razreda in nobena ni večja od zgornje meje razreda. V posamezen razred spadajo vse vrednosti med spodnjo in zgornjo mejo razreda. Vsak razred ima svojo širino r azreda i r , ki je razlika med zgornjo in spodnjo me¬ jo razreda 'k ^k,max ^k,min ^ -Sl- in sredino razreda y^, ki je polovica vsote mej razreda 'k, min y k,mox (4.2) Kakor smo navedli, ima na splošno vsaka grupa neko svojo vrednost. Tako vzamemo, da je pri numeričnih znakih sredina razreda reprezentant vseh vrednosti v razredu - torej grupna vrednost. Iz zgornjega zgleda vidimo, da niso vsi razredi omejeni s spodnjo in zgornjo mejo. Zad¬ nji razred v našem zgledu ima le spodnjo mejo (8 ha). Take razrede, ki so omejeni samo navzdol ali samo navzgor, imenujemo odprte razrede. Odgpfe razrede tvori¬ mo, če je število enot, ki ima vrednost nad ali pod neko mejo, majhno, podatki pa so med seboj zelo različni. Za zgornjo grupacijo površin so širine razredov po vrsti: 2 ha, 1 ha, 2 ha, 3 ha. Za zad¬ nji razred ne moremo izračunati širine, ker je odprt. Sredine razredov pa so tele: i ha, 2.5 ha, 4 ha, 6,5 ha. Za zadnji.odprt razred tudi sredine razreda ne moremo izračunati. Zgornji razredi ustrezajo načelu enoličnosti in popolnosti grupacije, ker vsaka vrednost spada v en in samo en razred. Pri zgornjem grupiranju štejemo vrednosti, ki so na meji razredov, v spodnji razred, ker je spodnja meja razredov označena z nad, kar pomeni,da spodnja meja ni vključena v razred. Če hočemo meje razredov vključiti v zgornji razred, pa opišemo razrede takole: do pod 2 ha 2 ha do pod 3 ha 3 ha do pod 5 ha 5 ha do pod 8 ha 8 ha in več Obe zgornji grupaciji sta enolični in kompletni. Grupacija - 2 ha; 2 ha - 3 ha; 3 ha - 5 ha; 5 ha - 8 ha; 8 ha - pa ni enolična, ker mejne vrednosti spadajo v dva razreda. - 82 - 4.13 Površine gospodarstev ne merimo natančno do mm , marveč jih običajno zaokrožu¬ jemo na are. Kakor smo že omenili, pa je; zaokroževanje numeričnih znakov dvoj¬ no: zaokrožujemo jih na n a j b I i ž j o celo vrednost alipana največjo celo O vrednost v enoti, v kateri navajamo podatek. Tako gospodarstvo, ki ima 3 ha 27 a 58 rri , po prvem načinu zaokrožimo na 3 ha 28 a, ker je stvarna površina bliže 3 ha 28 a kakor površini 3 ha 27 a, po drugem načinu pa je zaokrožena vrednost 3 ha 27 a, ker je 3 ha 27 a največja površina, navedena v arih, ki je manjša kakor stvarna površina gospodar¬ stva . Ce upoštevamo zaokroževanje podatkov na are, pišemo zgornjo grupacijo površin takole: - 1,99 ha 2.00 ha -2,99 ha 3.00 ha -4,99 ha 5.00 ha -7,99 ha 8.00 ha - Na prvi pogled se zdi, da sprednja grupacija ni popolna, ker je npr. zgornja meja prvega razreda označena z 1 ,99 ha, spodnja meja naslednjega razreda pa z 2,00. Če pa upošte¬ vamo, da so to zaokroženi podatki, ni nobenega dvoma o komplefnosti te grupacije. Ven¬ dar je od tega, kako zaokrožujemo, odvisno, katere vrednosti so meje razredov. Če za¬ okrožujemo na najbližjo celo vrednost v najmanjši enoti, zaokrožena vrednost 1,99 pome¬ ni vse površine od 1 ,985 do 1,995 ha, zaokrožena vrednost 2,00 ha pa vse površine od 1 .995 do 2.005 ha. Meja med prvim in drugim razredom je torej 1.995 ha. Če pa zaokro¬ žujemo na največjo celo vrednost v najmanjši enoti, pa vrednost 1,99 pomeni vse povr¬ šine od vključno 1,99 do pod 2,00, vrednost 2,00 ha pa vse površine od vključno 2,00 do pod 2,01 itd. Meja razreda pri tem zaokroževanju je 2,00 ha. Iz zgleda vidimo, da na¬ čin zaokroževanja vpliva na meje razredov in po njih na sredine razredov. V splošnem da naravnejše razrede zaokroževanje na največjo celo vrednost, kar vidimo že iz zgleda. Pri prvem načinu zaokroževanja dobimo meje razredov 1,995 ha, 2,995 ha, 4,995 ha itd., pri drugem pa 2,00 ha, 3,00 ha 5,00 ha itd, V zgornjem zgledu smo iz vsebinskih razlogov vzeli različne širine razredov. - 83 - Iz tehničnih razlogov primernosti grupacije za nadaljnjo statistično obdelavo pa težimo, da so razredi enako široki in da grupacije nimajo odprtih razredov. Tako na primer mesečne osebne dohodke grupiramo v grupe - 799 din 800 - 999 " 1000 - 1199 " 1200 - 1399 " 1400 - 1599 " 1600 - 1799 M 1800 -1999 " 2000 - 2199 " 2200 - 2399 " 2400 - 2599 " 2600 - 2799 " 2800 - 2999 " 30Q0 - . " Širina razreda je v tej grupaciji enaka 200 N din. Zato se tudi sredine razredov 900, 1100, 1300, 1500, 1700, 1900, večajo v aritmetični posfopici. 4.13 G rupiranje nezveznih znakov je podobno kakor grupiranje zveznih znakov, le da vprašanje mej za nezvezne znake v praksi ni tako pereče kakor pri zveznih znakih. Če grupiramo število zaposlenih v trgovinskih podjetjih v grupe po tri zc- poslene, dobimo grupacijo nezveznega znaka po številu zaposlenih: 1-3, 4-6, 7-9, 10-12, 13-15, 16-18. Pri nezveznih znakih moramo paziti, katere vrednosti so meje raz¬ redov. Zgornja grupacija kaže, kot da ni popolna, ker se en razred konča s 3, drugi pa začne s 4. Vendar to ni res, ker more biti število zaposlenih samo celo število in med 3 in 4 ni vrednosti. Tako navajanje razredov pa moti pri izračunavanju širine razredov.Raz¬ like med tri in ena je dva, v razredu so pa tri vrednosti: 1,2,3. Širina razreda je tri,ne pa dva. -8.4- Vsem zmedam se izognemo, če obravnavamo tudi nezvezne znake kot zvezne in vsaki vrednosti priredimo enotin razmik tako, da je ustrezna vrednost sredi tega razmika .Vred¬ nosti 1 priredimo razmik od 0,5 do 1,5, vrednosti 2 razmik od 1 ,5 do 2,5 itd. Tako sta ' meji prvega razreda ne 1 in 3, ampak 0,50 in 3,5. Razlika teh mej pa je resnična širina razreda (3,5 - 0,5 =3,0). Tak6 grupiranje in obravnavanje nezveznih znakov izenači¬ mo z zveznimi. Pri zveznih znakih razmikom pripišemo kot reprezentanta sredino razre¬ da, pri nezveznih pa posamezni vrednosti priredimo enotin razmik. 4.14 Sorodnost dveh numeričnih vrednosti merimo z razliko med vrednostima. po tem merilu sta dohodka 800 in 850 din enako različna kot dohodka 2000 in zuuu v.i Na prvi pogled pa spoznamo, da je razlika med dohodkoma 800 N din in 850 N din več¬ ja kot med dohodkoma 2000 in 2050 dinarjev, čeprav je v absolutnem razlika v obeh pri¬ merih 50 din. Za merilo razlik in sorodnosti ni vedno ugodna absolutna razlika, temveč je bol jša relativna razlika. Kadar so možne velike razlike med vrednostmi znaka, so za merilo o sorodnosti vrednosti primernejše relativne kakor pa absolutne razlike. Za take primere sestavljamo razrede, za katere niso razlike, ampak kvocienti mej, konstante .Me¬ je razredov za tako grupacijo niso aritmetično, ampak geometrično zaporedje. Zgled za tako grupacijo v naši statistiki je grupiranje industrijskih podjetij po številu de¬ lavcev. Podjetja so po številu delavcev grupirana v tele grupe: število delavcev kvocient za meje do 15 16 do 30 31 do 60 61 do 125 126 do 250 251 do 500 501 do 1000 1001 do 2000 2001 - 2.00 2.00 2.08 2.00 2.00 2.00 2.00 Kvocienti med mejami so stalni (2,00^razen v razredu 61 do 125, v katerem je 2,08,da so meje naslednjih razredov prešle na naravnejše meje. Celoten cikel mej razredov s stalnim razmerjem 2 je v okviru tromesfnega števila nasled¬ nji: .1 2 4 8 15 30 60 125 250 500 1000 Naprej gre na 1000 2000 4000 . .. torej na ista števila kot zgoraj samo tisočkrat več¬ ja. V zgornji vrsti mej razredov sta izjemi le prehoda iz 8 na 15, pri katerem je razmerje 15/8 = 1, 88 in prehod iz 60 na 125, pri katerem je razmerje 125/60 =2,08. Ta odstopa sta nebistvena, uspemo pa z njima zaokrožiti meje. Cikel mej rczredov v približnem geometrijskem zaporedju s kvocientom 2,5 je: 10 25 60 150 400 1000 Ta cikel se ponavlja v okviru dveh decimalnih mest. Le odstopanje v razmerju med za¬ porednima mejama je 60/25 =2,4 in 400/150 =2,67. Cikel mej razredov v približnem geometrijskem zaporedju 3 je: 1 3 10 Ta cikel se zaključi v okviru enega decimalnega mesta. Odstop od razmerja 3 pa je 10/3 =3,33 Cikel zaporedja s približnim razmerjem 4 pa je 1 4 16 60 250 1000 Od razmerja 4 odstopata 60/16 =3,75 in 250/60 =4,17 Zgornje sisteme z mejami v geometrijskih zaporedjih po potrebi priredimo v problemu u- k k strežne meje oziroma razrede, če jih pomnožimo z 10 ali 5.10 . Podobno moremo cikle mej ekstrapolirati v levo ali desno poljubno mnogokrat. Tako moremo iz cikla 1 3 10 izdelati meje za širšo grupacijo, ki začne npr. z 0,5. Tako dobimo meje 0,5 1,5 5 15 50 150 500 1500 5000 15000 50000 - 86 - To načelo je uveljavljeno v dosti primerih v publikacijah Zveznega zavoda za statistiko SFRJ za pojave, ki so med seboj zelo različni. ŠIFRIRANJE OSNOVNEGA GRADIVA 4.15 V osnovni statistični obdelavi podatkov preštevamo in seštevamo podatke po grupacijah in klasifikacijah, ki jih predpisuje načrt obdelave. Če sestavimo gru¬ pe zo posamezne znake, delo še ni opravljeno. Sestavljene grupacije so samo navodilo, kako moramo grupirati. V nadaljnji obdelavi zbrano gradivo po izdelanih gruporitnti mr- tiramo in dalje obdelujemo. To delo si znatno olajšamo, če predhodno celotno gradivo pregledamo in pregledno ozna¬ čimo, v katero grupo po posameznem znaku spada posamezna enota opazovanja. Temu de¬ lu pravimo šifriranje ali signiranje gradiva. Oznakam za posamezne grupe pravimo šifre, seznam grup z ustreznimi šiframi pa je šifrant. Če gradiva ne ši¬ friramo, moramo vsakokrat, ko pride v obdelavo določen znak, ponovno ugotavljati, v katero izmed grup posamezna enota po tem znaku spada. Šifre morejo biti različne. Zelo pogoste so številčne šifre. Za šifre pa uporabljamo tudi - črke ali kakšne druge oznake. Pri številčnih šifrah z eno izmed zaporednih števi Ik označimo posamezno vrednost znaka ali pri grupiranem znaku posamezno grupo. Tako morejo biti številčne šifre za stan: samski 1, poročen 2, razvezan 3, vdovec 4.; za spol: moški 1, ženski 2. Številčne oznake pri decimalni klasifikaciji so idealne šifre. Glede na to, ali potrebuje¬ mo podrobno ali grobo grupacijo, vzamemo za šifro več ali manj-mestno oznako v deci¬ malni klasifikaciji. Tako pri šifriranju blaga v zunanji trgovini po vrsti blaga vzamemo samo prvo številko, če obdelava predpisuje razdelitev blaga po najširših skupinah ali večmestne šifre, če obdelava predvideva podrobnejšo obdelavo. Tudi črkovne šifre so prikladne, posebno, če je število grup manjše. V tem primeru je dobro vzeti za šifre prve črke oznak za vrednosti ali grupe. Tako vzamemo za - 87 - stan šifre: samski - S , poročen - P, razvezan - R in vdovec - V; ali za spol: moški - M, ženski - Z. Za take primere so črkovne šifre primernejše od številčnih, ker si jih lažje zapomnimo. Druge oznake uporabljamo redkeje. V praksi pa za znake, ki imajo samo dve gru¬ pi, včasih namesto številčnih ali črkovnih šifer uporabljamo oznaki + in -. Medtem ko je pri načrtovani ročni obdelavi šifriran je p riporočljivo in moremo izbirati med številčnimi in črkovnimi šiframi, moramo pri strojni obdelavi obvezno šifrirati podatke s številčnimi šiframi, ki so sestavi jene po načelu decimalne klasifikacije. OSNOVNA OBDELAVA STATISTIČNEGA GRADIVA 4.16 Z osnovno obdelavo dobimo absolutne podatke o statistični populaciji. Če hočemo dobiti vpogled v starostno strukturo prebivalstva, razdelimo popisno gradivo o po¬ pisu prebivalstva v grupe po starosti in preštejemo, koliko oseb oziroma popisnih obrazcev je v posameznih grupah. Do pregleda o sestavu prebivalstva pridemo z dvema stopnjama obdelave. Najprej gradivo razdelimo -razsortiramo po starostnih skupinah pre¬ bivalstva, noto pa preštejemo , koliko oseb oziroma obrazcev je v posamezni gru- pi. Če želimo dobiti vpogled v razdelitev zemlje po posameznih velikostnih skupinah privat¬ nih gospodarstev, najprej razdelimo popisno gradivo po velikostnih skupinah, nato pa za vsako skupino seštejemo površino vseh gospodarstev v posameznih skupinah. Enako pri demo do podatkov o osebnih dohodkih po grupah delavcev itd. Tudi pri tej obdelavi delo opra¬ vimo v dveh stopnjah: najprej gradivo razdelimo - razsortiramo v grupe, po gru¬ pah pa seštejemo podatke o velikosti gospodarstev, podatke o dohodkih delavcev itd. Glavne stopnje osnovne obdelave so torej: sortiranje gradiva v grupe, preštevanje in seštevanje podatkov. Obdelava statističnega gradiva je v praksi bolj zamotana. Navadno ne iščemo sestave po¬ pulacij po enem,temveč po več znakih,ki so med seboj povezani, hkrati. V teh primerih - 88 - podatke ne sortiramo samo po enem, temveč po več znakih. Katere znake kombiniramo med seboj in ali po teh grupah podatke samo preštevamo ali jih tudi seštevamo, je odvisno od namena obdelave in načina analiziranje podatkov. Zato je bistveno povezana z vsebi¬ no pojava odločitev, katere znake v obdelavi kombiniramo in za katere grupacije podat¬ ke preštevamo, za katere pa podatke seštevamo. Zato moramo najbolj paziti na načrt ob¬ delave, ki predpisuje, katere znake v obdelavi kombiniramo in katere podatke prešteva¬ mo, katere pa seštevamo. 4.17 Pri načrtovanju osnove obdelave je najprikladneje uporabiti shematičen na- čr t obd e la ve . Za zgled take sheme je prikazan v sliki 4.1 načrt obdelave po¬ datkov popisa prebivalstva z vzorcem za predhodno obdelavo popisa prebivalstva 31 .lil. 1953. Od skupno 29 različnih tabel, kolikor jih je predvidevala obdelava, je v sliki na¬ kazanih prvih deset tabel. Shema je razdeljena na dva dela: Prvi del nakaže, kateri kontingent prebivalstva se na¬ naša no posamezno tabelo, drugi del pa se nanaša na vsebino tabele. V tem delu so ozna¬ čeni znaki popisa, v posebnem stolpcu pa število grup za vsak posamezen znak. V shemi |e vsaka tabela ponazorjena z več krogci, ki so med seboj povezani z navpično črto.Krog¬ ci so postavljeni pri tistih znakih, ki so kombinirani v posamezni tabeli. Tako je v prvi tabeli predvideno, da skupno prebivalstvo razdelimo po spolu, po starosti po najdrobnej¬ ši grupaciji s 102 grupami in po aktivnosti, ki ima tri grupe. Z znamenji (^) in (T)v krogih je naznačeno, ali je posamezen znak v glavi (£) °li čelu (T) tabele. Analog¬ no iz sheme razberemo vsebino za druge obdelovalne tabele. Ker pri popisu prebivalstva osnovna obdelava sestoji samo iz preštevanja gradiva po posameznih grupacijah, ni po¬ grebno, da pri vsaki izmed prikazanih tabel to posebej navedemo. Če pa je obdelava bolj raznolika, pa razen krogcev uporabljamo še druge dogovorne znake in simbole: tri¬ kotnike, kvadrate itd. Z njimi naznačimo posamezne operacije: preštevanje, seštevanje °li elementarna preračunavanja. Prikazani način je prikladen zato, ker nudi pregled čez vse predvidene kombinacije hkrati in moremo zlahka'ugotoviti, ali smo kateri znak ali kombinacijo iz obdelave iz¬ pustili ali pa določeno kombinacijo dvojno predvideli. - 89 - Slika 4.1 Shema načrta obdelave vzorca predhodnih rezultatov popisa prebivalstva 21.3.1953 (Vir: Popis stanovništva 1953 knjiga XI) - 90 - Shema načrta obdelave pa v končni obliki ne kaže samo obdelave gradiva, marveč tudi kakšne so obdelovalne tabele, v katere vnašamo podatke obdelave. Skladno s shemo, v kateri je pri tabeli 1 vodoravna črtica postavljena v krogcih pri spolu z dvema grupama ' in pri aktivnosti s tremi grupami, naypična črtica pa v krogcu pri starosti z 102 grupami, sta v obdelovalni tabeli znaka spol in aktivnost v glavi, znak starost pa v čelu tabele. 4.18 Seštevanje s ta t i s t i č n i h • poda t k o v ni brez zapleti ja jev. Neposredno moremo seštevati le istovrstne podatke. Če seštevamo dnevno proizvodnjo za dolo¬ čeno vrsto cigaret za določeno podjetje, dobimo mesečno proizvodnjo cigaret te vrste. Če seštevamo mesečne osebne dohodke za posamezne uslužbence, dobimo skupen Ionu zu sebne dohodke vseh uslužbencev v določeni delovni enoti itd. V navedenih zgledih je se¬ števanje podatkov smiselno in dobimo s seštevanjem smiselno količino. Iz dnevne proizvod¬ nje dobimo mesečno proizvodnjo, iz osebnih dohodkov posameznih uslužbencev pa fond osebnih dohodkov za ustanovo. Problem pa se zamota že pri seštevanju istovrstnih količin. Vzemimo število kilometrov,ki jih prepotuje v določenem razdobju posamezen potnik. Če seštejemo število kilometrov,ki jih je prepotoval posamezen potnik, za vse potnike, dobimo vsoto, katere pomen ni več tako jasen kakor v zgornjih primerih. S seštevanjem poti posameznih potnikov dobimo skup¬ no število kilometrov, ki so jih prepotovali vsi potniki. Ta vsota pa se zdi, da je brez po¬ mena. Razumljivo je, da je potnik, ki je prepotoval prvi dan 100 kilometrov, drugi dan 130 km, tretji dan 150 km, skupno prepotoval 380 kilometrov, manj jasna pa jevsota, če seštevamo poti različnih potnikov. Vendar imajo te vrste podatkov v prometni statistiki velik pomen. Da se izognemo napačnemu pojmovanju tega podatka, damo vsoti poti vseh potnikov novo enoto mere - potniški kilometri. Če je prvi potnik prepotoval 30 kilomet¬ rov, drugi 65 kilometrov, tretji pa 34 kilometrov, je podjetje, ki jih je prevozilo, opra¬ vilo 30 + 65+ 34 = 129 potniških kilometrov. Po enakem sklepu dobimo v prometni statis¬ tiki vlakovne kilometre, če seštevamo dolžino poti posameznih vlakov; če seštevamo prevožene kilometre, ki so jih prevozili posamezni železniški vozovi, dobimo vozovne ki¬ lometre itd. Tudi v industrijski statistiki naletimo na podobne probleme. Število ur, koli¬ kor je v določenem mesecu delal posamezen delavec, seštevamo v skupno število delavec - ur ali skupno število opravljenih delovnih ur v podjetju. Isti problem imamo, če sešteva¬ mo čas dela pri strojih: tu dobimo s seštevanjem ur dela za posamezen stroj strojne ure za podjetje itd. - 91 - Medtem ko imajo zgoraj navedene vsote vsaj posreden smisel, seštevanje nekaterih isto¬ vrstnih podatkov nirrtt smisla. Tako je sama zase brez smisla vsota starosti posameznikov za določeno populacijo, vsota cen za določeno vrsto blaga za različne trge itd. 4.19 Poseben problem je v statistiki seštevanje raznovrstnih količin. Do¬ stikrat seštevamo dobesedno hruške in jabolka. Seštevanje proizvodnje premoga za različne rudnike se zdi na prvi pogled brez posebnih težav. Vendar je ta vsota smi¬ selna le, če jo proučujemo kot skupen delovni učinek vseh rudnikov. Ce pa pomislimo, da je kakovost premoga za različne premogovnike od lignita mimo različnih vrst premo¬ ga do črnega premoga med seboj bistveno različna, je upravičen pomislek, ali smemo proizvodnjo različnih premogovnikov seštevati. Enako je upravičen pomislek, ali je vse¬ lej smiselno preštevati npr. konje v določeni občini. Pri preštevanju štejemo kot isto¬ vrstno enoto žrebička, starega manj kot leto dni in težkega delovnega konja. Enako je vprašanje ali je prav v zunanje trgovinski statistiki seštevati težo posameznih pošiljk, ker je v enem primeru malo vredna ruda, v drugem pa precizna in draga aparatura. Odgovor, ali ima seštevanje teh količin smisel ali ne, je odvisen od tega, za kakšne po¬ trebe seštevamo in zbiramo podatke. Ce zbiramo podatke o proizvodnji premoga zato,da ugotovimo skupni delovni učinek premogovnikov, ima vsota raznovrstnih podatkov smi¬ sel. Ta vsota proizvodnje pa nima smisla, če hočemo z njo izraziti ekonomski pomen te proizvodnje. Določeno količina črnega premoga ima povsem drugačen pomen kakor ena¬ ka količina lignita. 4.20 Raznovrstne količine, ki imajo različne enote mere, pa sploh ne moremo sešte¬ vati. Podjetje, ki izdeluje različne izdelke, svoje mesečne proizvodnje ne more sešteti in izraziti v enem podatku. Enako trgovina ne more izraziti svojega skupnega prometa v naturalnih enotah mere, ker prodaja popolnoma različno blago. Na skupno enoto mere privedemo količine v naturalnih enotah mere tudi tako, da količi¬ ne izrazimo v vrednosti. Vrednost proizvodnje za vsak posamezen proizvod je produkt proizvedene količine in cene, skupna vrednost proizvodnje pa je vsota vrednosti proiz¬ vodnje v dinorjih za vse proizvode. Z obrazcem moremo to izraziti N - 92 - (4.3) Pri tem pomeni: V =skupna vrednost, pj= cena za posamezen artikel, q. = ustrezno količina J" - znak za seštevanje. 4.21 Načelo, da posamezne količine tehtamo glede na njihov pomen in vred¬ nost, kakor ga uporabljamo pri sestavljanju skupne vrednosti, pri kateri količine tehtamo s ceno, v ekonomski statistiki razširimo. Zo premog moremo uporabiti za težo ali ponder ceno posameznih vrst premoga, ker je cena skladna s kvaliteto premoga. Vendar je objektivnejše merilo kakovosti kalorična vrednost premoga. Po tem načelu vzamemo za enoto tono premoga z določeno kalorično vrednostjo. Ta premog, ki ga označimo z 1, imenujemo pogojno enoto. Premog, za ka¬ terega je kalorična vrednost samo tri četrtine kakovosti za pogojno enoto, označimo s koeficientom 0,75, premog, ki irna za 20% višjo kalorično vrednost, po s koeficientom 1,20 itd. Podobno kakor smo dobili skupno vrednost, če smo produkte količin s cenami sešteli, izrazimo proizvodnjo premoga v pogojnih enotah premoga določene kakovosti tako, da proizvodnjo za posamezno vrsto premoga pomnožimo z ustreznim koe¬ ficientom, te produkte pa seštejemo. Dobljena vsota pomeni, kolikim tonam pogojne ka¬ kovosti ustreza stvarna proizvodnja premoga. Ta podatek ima večji ekonomski pomen ka¬ kor pa navadna vsota proizvodnje za vse vrste premoga ne glede na kakovost. Na podoben problem tudi naletimo, če preštevamo motorna vozila, traktorje itd. Jakost raznih traktorjev je različna. Pri enostavnem preštevanju pa jih izenačujemo. Do pravil¬ nejše slike o jakosti traktorskega parka pridemo, če podobno, kakor smo to naredili pri premogu, traktor z določeno močjo vzamemo za pogojni traktor. Za druge vrste in tipe traktorjev pa glede na jakost določimo ustrezni koeficient, ki je manjši od 1, če je slab¬ ši in večji od 1, če je močnejši. Z enakim postopkom, da vsak posamezen traktor ne štejemo za 1, temveč z ustreznim koeficientom, skupna vsota prikaže, koliko je skupno število traktorjev, če jih izrazimo v pogojnih traktorjih. Ta podatek je sicer fiktiven, podaja pa boljšo stvarno moč traktorskega parka kakor število traktorjev. Tudi v kmetijski statistiki upoštevamo enako načelo. V statistiki živinoreje vzamemo za pogojno žival 400 kg težko govedo. Vse druge živali izražamo s koeficienti v razmerju s to pogojno-normaino živaljo. Tako ponderiramo posamezne vrste živali glede na veli¬ kost in proizvodno moč, Ta način omogoča, da seštevamo govejo živino, konje, praši¬ če, ovce itd. v skupno število normalnih živali. Če vzamemo za zgled konje, imamo za - 93 - posamezne skupine tele koeficiente: Žrebeta do enega leta 0 , 6 ; žrebeta od enega le¬ ta do treh let starosti 1,0; kobile nad tri leta 1,4; žrebci 1,3; konj! nad tri leta 1,5. Če je na nekem področju 100 žrebet do enega leta, 200 žrebet od enega leta do treh let, 250 kobil nad tri leta, 50 žrebcev in 400 konj nad tri leta, je skupno: .1 00.0,6 + 200.1,0+ 250.1,4 + 50.1,3 + 400.1,5 = 12.75 normalnih živali. Čeprav je ta podatek fiktiven, ga moremo s pridom uporabljati za primerjave med območji, ker z enim podatkom izrazimo skupnost vseh živali na določenem območju, v določenem ve¬ likostnem razredu itd. Osnovna obdelava podatkov Ročna obdelava. Pri ročni obdelavi statističnega gradiva ločimo v glavnem dva osnovna načina obdelave: a) odlaganje obrazcev in b) črtkanje. 4.22 Pri odlaganju obrazcev popisne obrazce razdelimov grupe tako, da posa¬ mezne popisne obrazce odložimo na obdelovalni mizi na mesto, ki je določeno za posamezno grupo. Če moramo določeno število popisnic razdeliti po spolu, popisni- ce na obdelovalni mizi odlagamo na dva kupa. Vsak obrazec posebej pregledamo in ko ugotovimo, kakšen je spol osebe, na katero se obrazec nanaša, obrazec odložimo na ustrezno mesto, kjer zbiramo na enem kupu popisnice za moške, na drugem pa popisni- ce za ženske. Če načrt obdelave predvideva kombinirano obdelavo po spolu in stanu, popisnice za moške podobno dalje z odlaganjem razdelimo na štiri grupe - kupe: moški- samski, moški-poročen, moški-razvezan in moški-vdovec. Če storimo isto s popisnicami za ženske, dobimo podobne grupe: ženske-samske, ženske-poročene, ženske-razvezane in žertske-vdove. Tako z dvojnim odlaganjem obrazcev dobimo osem grup zo kombinaci¬ jo znakov spol x stan. Po enakem načelu z odlaganjem razdelimo populacijo na grupe za poljubno kombinacijo znakov. Temu postopku pravimo sortiranje osnovnega gradiva po grupah. Številčen pregled o razdelitvi populacije v grupe po predpisani kombinaciji znakov do¬ bimo, če preštejemo po grupah število enot oziroma obrazcev in rezultate vpi¬ šemo v obdelovalno tabelo. Če je v načrtu obdelave predvideno seštevanje določenega podatka po grupah, seštejemo ustrezen podatek za vse enote v posameznih gru- - 94 - pah. Tako seštevamo površino, donos, število posameznih vrst živine v obrazcih, ki smo |ih prej razsortirali po velikostnih skupinah, po skupni površini. Pri tem ne šteje¬ mo, dc je obdelava strojna, če podatke seštevamo z običajnimi računskimi stroji. Metoda odlaganja je zelo uporabna v vseh primerih. Kontrola sortiranja je razmeroma lahka in morebitne napake pri odlaganju kasneje zlahka odkrijemo. Obdelava z odla¬ ganjem ima praktično neomejeno uporabo. S postopnim sortiranjem po posameznih zna¬ kih populacijo razdelimo z odlaganjem v poljubno število kombinacij znakov. Obseg populacije obdelave ne zapleta, temveč jo samo poveča. Vendar moremo odlaganje uporabiti samo pri opazovanjih s posamičnimi obrazci, ni pa uporabno za kolektivne obrazce. Če so obrazci kolektivni, navadno prepišemo šifre podatkov na posamične obdelovalne listke, te pa potem po znanem postopku odlaganja samostojno obdelujemo. 4.23 Č r t k a n j e uporabljamo pri manjših obdelavah. Če hočemo dobiti za dano populacijo prebivalstva sestavo po spolu, urejujemo podatke s črtkanjem eno¬ stavno takole: Sestavimo obdelovalno tabelo, ki ima za posamezno grupo primerno veli¬ ka polja. Če razdeljujemo populacijo po spolu, ima obdelovalna tabela samo dve po¬ lji: eno za moške, drugo za ženske. Ko po vrsti pregledujemo v katero grupo spadajo posamezne enote, naznačimo to za vsoko enoto posebej v ustreznem polju v obdeloval¬ ni tabeli s črtico. Če je prva popisnica za moškega, napravimo črtico v polju za moške. Če je druga popisnica tudi za moškega, napravimo zraven prve črtice drugo črtico. Če je tretja popisnica za žensko, napravimo črtico v polju za ženske. Ta postopek ponav¬ ljamo za vsako popisnico, dokler populacije ne izčrpamo. Če preštejemo črtice v po¬ lju za moške, dobimo število moških v populaciji. Analogno dobimo število žensk, če preštejemo črtice v polju za ženske. Skupno število vseh črtic pa je enako številu enot v populaciji. Da si olajšamo štetje črtic po končani obdelavi, včasih že med obdelavo sestavljamo skupine po pet črtic, tako da s peto črtico'v vsaki skupini po pet črtic prve štiri prečr¬ ta" 10 : 7/ML Drug način, po katerem združujemo po deset enot je: |^| s štirimi oglišči, štirimi stra- *•«» - 95 - nicami in dvema diagonalama kvadrata registriramo deset vrednosti. Vzemimo populacijo 25 oseb. Zanje je spol označen z M za moške in z Ž za ženske. Osnovni podatki o enotah so:MŽMMŽMMŽŽŽMŽMŽMMŽŽŽŽMMŽ Ž Z . Po metodi črtkanja dobimo takle rezultat obdelave: 4.24 Črtkanje uporabljamo, kadar obdelava narekuje preštevanje gradiva. Ce mo¬ ramo glede na obdelavo po grupah seštevati podatke za nek numeričen znak, moremo podobno kakor pri črtkanju sestaviti obdelovalno tabelo; v ustrezna polja pa ne rišemo črtice, temveč vpisujemo ustrezne vrednosti za numerični znak za posamezno eno¬ to. Vzemimo, da je populacija sestavljena iz desetih enot, od katerih so neke popisnice za delavce - D, druge pa za uslužbence - U. Imamo pa še podatke o dohodkih za teh deset enot (v din). Osnovni podatki za posamezne enote so;-D-690, U-930, D-810, D-910, U-1150, U-950, D-1230, U-960, U-1170, U-940. Da dobimo skupni fond dohodkov po grupah za delavce in uslužbence, po zgornjem postopku obdelamo podatke takole: število fond v din 1230, 4 3640 960, 1170, 940 _6_ 6100 10 9740 Razen vsot dobimo število enot v posamezni grupi, če vpisane podatke preštejemo. Črtkanje je uporabno vselej: pri individualnih in kolektivnih obrazcih ali če so podatki navedeni za vse enote na enem listu papirja kakor je tov naših zgledih. To je njegova prednost. Črtkanje pa ima svoje hibe, ki omejujejo uporabnost. Črtkanje je neprikladno za obdelave, v katerih kombiniramo več znakov. Za take obdelave je iskanje ustrezne¬ ga polja v obdelovalni tabeli zamudno. Razen tega je za populacije velikega obsega črfkanje neuporabno, ker nimamo kontrole. Napake moremo naknadno odkriti le s po¬ novno obdelavo. Pri črfkanju si pomagamo tako, do osnovno populacijo razstavimo v več obdelovalnih - delovnih populacij. Vendar tudi ta rešitev ni vselej ustrezna .Zato črtkanje uporabljamo le za manjše populacije, ne pa za zamotane obdelave. 4.25 Avtomatizirana obdelava podatkov. Ročna obdelava podatkov, pa četudi pri tem uporabljamo klasične računske stroje, ni kos večjim statističnim proučevanjem. Z razvojem elektronskih računalnikov so se posebej statističnim prouče¬ vanjem odprla vrata na stežaj. Možnost shranjevanja podatkov, hitrost in kompleks¬ nost avtomatizirane obdelave podatkov je revolucionarno spremenila statistično obdela¬ vo. Cas obdelave se je skrčil na minimum, obseg dela in metodologija pridobivanja sta¬ tističnih informacij pa se od generacije do generacije računalnikov spreminja tako po hitrosti kot po enostavnosti upravljanja. Sistem elektronskega računalnika ima pet glavnih elementov: centralno enoto, pomnil¬ nik, enoto za računanje in vhodne in izhodne elemente. Centralna enota koordinira de¬ lo celotnega sistema za obdelavo podatkov. V pomnilnik shranjujemo osnovne podatke, ki jih obdelujemo, programe in vmesne in končne rezultate. Najpogosteje so nosilci po¬ datkov v pomnilniku magnetna jedra v obliki diskov ali magnetnih trakov. Računski ele¬ menti posredujejo računske operacije, ki jih izvaja računalnik. Z avtomatizirano trans¬ formacijo iz dekadnega številčnega sistema v binarni sistem in obratno je omogočeno delo računalnika. Vhodni elementi podatke prek določenih nosilcev informacij čitajo in prenašajo do pomnil¬ nika. Vhodni elementi morejo biti: čitalci luknjanih kartic, čitalci magnetnih trakov,či- falci luknjanih papirnatih trakov, optični čitalci, sprejemniki akustičnih (govornih) ele¬ mentov in sprejemniki raznih fizikalnih količin. Izhodni elementi računalnika so: hitri pisalni stroj, akustični izhodni elementi, ekrani, izhodi na mikrofilm, izhodi na luknja¬ ne kartice, luknjane papirnate trakove ali magnetne trakove in priprave za risanje. Naj¬ širšo uporabo ima vsekakor hitri pisalni stroj. S terminali povezujemo vhodne in izhodne enote s centralnim računalnikom na velike razdalje. S to dislocirano konfiguracijo računalnika se poveča možnost uporabe velike¬ ga računalnika za več uporabnikov hkrati. - 97 - Pri koriščenju računalnika je poleg tehnične opremljenosti osnovnega pomena tudi inte¬ lektualni del v zvezi z zbiranjem in obdelavo. Tega sestavlja niz programov in podpro¬ gramov. V praksi je vse večji poudarek tudi na tem delu. Uporabnost računalnika se z izdelavo standardnih paketov programov, od katerih so nekateri že vgrajeni v računal¬ nik, bistveno poveča. Z avtomatizirano obdelavo podatkov ne izvajamo samo osnovnih obdelav statističnih podatkov ampak tudi in predvsem analitično obdelavo podatkov. AOP je omogočila praktično uporabo najrazličnejših metod statistične analize, katerih brez nje zaradi ob¬ sežnosti in zapletenosti ne bi mogli izvesti. - 98 ' PETO POGLAVJE PRIKAZOVANJE STATISTIČNIH PODATKOV 5.1 Statistične podatke redkokdaj navajamo posamič, ker je bistvo statističnega proučevanja pojavov v primerjavi med podatki. Sorodne statistične podatke združujemo v s ta t is t i č n e vr.s te , te pa prikazujemo v t a b e ! a h in gra - f i k o n i h . Tabelarični in grafični prikaz sta izvirna načina prikazovanja statistič¬ nih podatkov. Tabelarično in grafično prikazovanje statističnih podatkov se po svojih sredstvih med seboj razlikujeta. Imata pa isti namen: čim nazorneje in pregledneje pri¬ kazati proučevano populacijo, tako da je analiza pojava čim lažja. Sredstva, s katerimi to dosežeta,pa so različna. Zato grafično prikazovanje ni enako¬ vredno tabelaričnemu prikazovanju statističnih podatkov ali narobe. Vsak način ima svo¬ je prednosti in pomanjkljivosti. Neredko se tabelarični in grafični prikaz istih podatkov medsebojno dopolnjujeta in skupno pripomoreta k čim boljši sliki in analizi proučevane¬ ga pojava. Prednosti tabelaričnega prikaza statističnih podatkov so predvsem: a) v tabeli moremo prikazati po potrebi razmeroma veliko podatkov; b) v tabeli prikažemo podatke s poljubno natančnostjo; c) tabelarični način je enostavnejši kakor grafični, ker so načela za sestavljanje dobrega tabelaričnega prikaza enotnejša kakor pri grafičnem pri¬ kazovanju, pri katerem za'različne statistične vrste in v različne namene uporabljamo različne metode grafičnega prikazovanja. 2 Prednost grafičnega prikazovanja v primerjavi s tabelaričnim prikazom pa je - 99 - predvsem v tem: a) v grafikonu nazorno odkrijemo zveze in odnose za več podatkov hkra¬ ti, tov tabelaričnem prikazu ni možno; b) grafikon, s katerim hočemo popularizirati do¬ ločen pojav, je bolj privlačen in neposreden kakor tabelaričen prikaz; c) z analitičnimi grafikoni statističnih podatkov uspemo včasih analizirati pojav neposredno brez dodatne analitične obdelave. Dostikrat pa da grafikon smernice za podrobno statistično obdelavo, kot je to npr. pri proučevanju odvisnosti med pojavi, proučevanju dinamike ekonomskih pojavov itd. STATISTIČNE VRSTE 5.2 Statistična vrsta je niz sorodnih statističnih podatkov, od katerih se vsak nanaša na eno izmed vrednosti ali na grupo določenega znaka. Glede na to, po kakšnem znaku se razlikujejo med seboj posamezni členi statistične vrste, razlikujemo: krajevne, časovne in stvarne statistične vrste. Stvarn e sta tistične vr¬ ste pa dalje delimo v atrfbutivne in numerične vrste, glede na to, ali statistična vrsta prikazuje podatke porazdeljene po atributivnem ali numeričnem znaku. Iz opredelitve statistične vrste sledi, da se posamezni členi vrste nanašajo na vrednosti osnovnega zna¬ ka . 5.3 V tabeli 5.1 je prikazana kot zgled krajevne ali geografske vrste porazdelitev narodnega dohodka v SFRJ v letu 1965 po socialističnih republikah. Tabela 5.1 Narodni dohodek v SFRJ v letu 1965 po socialističnih republikah v mlj din (vir: SGJ - 67)__ - 106 - 5.4 Časovna vrsta Je npr. proizvodnja električne energije v SFRJ v razdobju 1952-1971 v tabeli 5.2, ki prikazuje dinamiko v proizvodnji električne energije v tem razdobju. Tabela 5.2. Proizvodnja električne energije v SFRJ v razdobju 1952-1971 v mlj kWh (Vir: SGJ-72) Leto | 1961 1962 1963 1964 1965 1966 1967 1 968 1969 1970 1971 Proizvodnja j 9924 11275 13535 14189 15523 1 7174 18702 20641 23375 26023 29509 Statistična vrsta proizvodnje električne energijSLv tabel’u5.2 je intervalna ali raz- mična časovna vrsta, ker prikazuje intervalne oziroma rozmične podatke. Trenut- na časovna vrsta pa je npr. število zaposlenih v družbenem sektorju na dan 30.sep¬ tembra v razdobju 19^7-1971 v SFRJ v tabeli 5.3. Tabela 5.3 Število zaposlenih dne 30. septembra v letu v razdobju 1957-1971 v SFRJ (Vir. SGJ-72) v določenem trenutku v vsakem letu. 5.5 Stvarno atributivna statistična vrsta je npr. število zaposlenih v družbenem in privatnem sektorju dne 30.septembra 1966 po gospodarskih dejav¬ nostih, ki je prikazana v tabeli 5.4. - 101 - Tabela 5.4, Število zaposlenih v družbenem in privatnem sektorju v gospodarstvu v SFRJ na dan 30.septembra 1966 po panogah dejavnosti (Vir SB 515). 5.6 Zgled za z v e z n o numerično v rs to so poprečni skupni izdatki za hrano na eno gospodinjstvo za štiričlanska delavska gospodinjstva z enim zaposlenim po vi¬ šini skupnih razpoložljivih sredstev. Tabela 5.5 Poprečni skupni denarni izdatki za hrano na eno gospodarstvo v SFRJ za go¬ spodinjstva s štirimi člani, z enim zaposlenim po višini skupnih razpolož¬ ljivih sredstev v letu 1963 (Vir SB 429). 5.7 Nezvezna numerična statistična vrs ta pa je število anketiranih kme¬ tijskih gospodarstev po številu članov v kmetijski anketi v letu 1956 v Sloveniji. - 102 - Tabeia 5.6. Število gospodarstev v kmetijski anketi v Sloveniji v letu 1956 po številu članov v gospodinjstvu (Vir SB 113). Prikazane statistične vrste so po svojem značaju med seboj različne tudi po drugih last¬ nostih in ne samo po tem, da ima jo za osnovo različne vrste znakov. Tabela 5.1 prika¬ zuje sestavo skupnega narodnega dohodka v SFRJ po republikah. Enak značaj ima tudi statistična vrsta v tabeli 5.4, ki prikazuje sestavo števila zaposlenih po panogah de¬ javnosti . Prav poseben pomen imajo statistične vrste kakršna je npr. število kmetijskih gospodar¬ stev po številu članov v tabeli 5.6. Ta statistična vrsta prikazuje variabilnost števila članov za anketirana gospodarstva. Take sta tis ti čn e vrste imenujemo frekvenčne porazdelitve. Ker so za analizo populacij osnovne važnosti, jih bomo podrobneje proučevali v posebnem poglavju. Podobne narave je tudi statistična vrsta o številu za¬ poslenih po panogah dejavnosti v tabeli 5.4. Tudi ta statistična vrsta pokaže variabil¬ nost znaka: panoga dejavnosti. Vendar so metode proučevanja statističnih vrst, ki kaže¬ jo variabilnost, za numerične znake mnogo bolj razvite kakor za nenumerične. Tudi analiza časovnih vrst je specifična. S časovnimi vrstami proučujemo dinami- k o socialno-ekonomskih pojavov. Ker je analiza časovnih vrst specifična, tudi časov¬ ne vrste proučujemo v posebnem, za ekonomista važnem poglavju o analizi časovnih - 103 - vrst. Dinamika proizvodnje električne energije v SFRJ je nakazana v tabeli 5.2., di- nomiko števila zaposlenih v družbenem sektorju pa v tabeli 5.3. Statistična vrsta o poprečnih skupnih izdatkih za prehrano po grupah denarnih dohod¬ kov v tabeli 5.5 prikazuje, kako so poprečni mesečni izdatki za prehrano odvisni od skupnih denarnih dohodkov v kmetijskem gospodarstvu. Ta vrsta osvetljuje važen in splošen problem socialno-ekonomskih pojovov - odvisnost med pojavi. Tudi o odvisnosti med socialno-ekonomskimi pojavi je govora v posebnem poglavju. Iz navedenega smospoznoli, da imamo najrazličnejše statistične vrste. Vsaka od njih prikaže določeno znočilnost aii lastnost proučevanih pojavov. STATISTIČNE TABELE 5.8 Statistične vrste v zgledih iz odstavka 5.7 so prikazone v tabelah. Statistične po¬ datke najpogosteje prikazujemo v statističnih tabelah ali razpredelnicah, ker je tabela najpreglednejši in najracionalnejši prikaz podatkov. Tabela je s sistemom vrst in stolpcev razdeljena v p o I j a , v katera vpi¬ sujemo po določenem sistemu statistične podatke. Dogovorno vel ja, da imajo vsa polja v isti vrsti isto vsebinsko oznako, ki je naznačena za vsoko vrsto posebej v posebnem tekstualnem delu - čelu tabele. Enako imajo vsa polja v istem stolpcu enako vse¬ binsko oznako, ki je ustrezno naznačena v tekstualnem delu - glavi tabele. Po¬ men podatka v določenem polju dobimo, če križamo pomen ustrezne vrste s pomenom ustreznega stolpca, v katerem je polje oziroma podatek. Vsi ti pojmi so shematično na¬ kazani v tabeli 5.7. Polje A v tabeli 5.7 je polje za podatek o vzdrževanih ženskah v starosti izpolnjenih treh let. - 104 - Tabela 5.7. Tabela 1 za obdelavo vzorca predhodnih rezultatov za popis prebivalstva 31 . 111.1953 v SFRJ Tabela 5.8 Osnovni podatki o gospodarskih organizacijah družbenega sektorja v SFRJ v letu i965 po panogah. (Vir SGJ 67) - 105 - 5.9 Tabela je enostavna, če v njej prikažemo eno samo statistično vrsto. Eno¬ stavne tabele so torej vse tabele od 5.1 do 5.6 v prejšnjem odstavku, ker je v njih prikazana ena sama statistična vrsta. Vse enostavne taoele imajo bodisi en sam stolpec (tabele 5.1 , 5.4, 5.5 in 5.6), ali eno samo veslo (tabeli 5.2, 5.3). .5.10 Dostikrat imamo dve ali več različnih statističnih vrst, ki imajo za osnovo isti znak in so med seboj v vsebinski zvezi. Take statistične vrste združimo v eno sa¬ mo statistično tabelo - sestav I jeno tabe lo . V sestavljeni tabeli je združenih več enostavnih tabel. Sestavljena tabela je tabela 5.8, ki prikazuje število organizacij,po¬ prečno število zaposlenega osebja,osnovna in obratna sredstva ter neto produkt v letu 1965 v SFRJ po panogah. V tabeli 5.8 prikazani podatki so združeni iz petih enostavnih tabel. 5,11 Če razčlenimo populacijo samo po enem znaku, dobimo za rezultat enostavne sta¬ tistične vrste, ki jih prikazujemo v enostavnih statističnih tabelah. Dostikrat pa po¬ pulacijo razdelimo po dveh, treh ali celo več znakih hkrati• Ta obdelava da podroben vpogled v odvisnosti pri množičnih pojavih in je posebno pomembna, če proučujemo zve¬ zo med faktoriolnimi in rezultativnimi znaki. Rezultate toke večkratne istočasne obdela¬ ve prikazujemo v kombinacijskih tabelah. V kombinaci jski tobe I i kri žarno po dva ali več znakov. Kombinacijska tabela je npr. razdelitev privatnih kmetijskih gospodar¬ stvih v letu 1956 v tabeli 5.9. V njej so razčlenjena kmetijska gospodarstva po velikost¬ nih skupinah in dohodkih od kmetijskego gospodarstva za 2236 anketiranih gospodarstev. Tabela 5.9. Število privatnih kmetijskih gospodarstev v kmetijski anketi v SFRJ po veli¬ kosti gospodarstev in denarnih dohodkih od kmetijstva v letu 1956 (Vir SB 113). - 106 - V kombinacijski tabeli 5.9 so razen običajnih stolpcev in vrst še seštevki stolpcev in vrst. To sta zbirna vrsta in zbirni s t o I p e c . Zbirno vrsto in zbirni stolpec postavimo na konec tabele, kakor je to v našem zgledu, včasih pa na začetek tabele Vrste tabel po vlogi v statističnem proučevanju 5.12 Glede na vlogo, ki jo imajo v statističnem proučevanju, delimo tabele na: obdelovalne, pubIiko c i j s k e in analitične. Osnovni namen obdelovalnih tabel je sistematično zapisovanje rezultatov osnovne obde¬ lave statističnega gradiva, medtem ko je osnovni namen publikacijskih-tabel sistematič¬ no prikazovanje končnih rezultatov. Z analitičnimi tabelami pa prikažemo podatke ta¬ ko, da je iz njih neposredno možna analiza statističnih podatkov. ]5.13 Oblika obdelovalnih tabel je prilagojena obdelavi podatkov. Zato se obdelovalne tabele pri ročni obdelavi razlikujejo od obdelovalnih tabel pri elektronski obdelavi. Oblika in velikost obdelovalnih tabel je drugotnega pomena in pri sestavljanju dajemo prednost momentom obdelave. Zato obdelovalne tabele pri ne¬ katerih statističnih obdelavah združujejo kombinacije razmeroma velikega števila zna¬ kov. Tako vsebujejo obdelovalne tabele pri popisih prebivalstva kombinacije tudi po šest in več znakov hkrati in so sestavljene iz več delnih tabel. 5.14 V p ub I i ka c i js k i h tabelah je še poudarek na tem, da damo strnjeno čim več statističnih podatkov. Vendar je pri njih odločilen vsebinski moment. V pu- blikacijskih tabelah so podatki prikazani tako, da so podatki, ki so med seboj v zvezi, čim bolj primerljivi. Publikacijske tabele so v glavnem vse tabele, ki so objavljene v statističnih publikacijah statističnih organov, kot so: letopisi, bilteni, rezultati popi¬ sov itd. Čeprav v publikacijskih tabelah že močno čutimo, da so sestavljene tako, da moremo prikazane podatke čim laže proučiti, je njihov osnovni namen še vedno dati običajne absolutne podatke o populaciji, ki jo prikazujejo, pojava pa ne analizirajo. Zato osnovne statistične publikacije redko vsebujejo več kakor absolutne podatke o sta¬ tistični populaciji. - 107 - 5.15 Namen analitičnih tabel pa je prikazati statistične podatke tako, da je iz njih možno neposredno analizirori določeno značilnost pojava. Zato mora biti v analitični tabeli primerljivost podatkov čim boljša, osnovne značilnosti pojava pa čim bolj vidne. Ker je razmeroma Ježko, včasih pa celo nemogoče,- istočasno prime¬ rjati veliko podatkov hkrati, so analitične tabele po obs egu manjše in vsebujejo samo .podatke, ki so v neposredni zvezi s problemom, ki ga hočemo z analitično tabelo prika¬ zati in analizirati. Zato v ana litičnih tabelah običajno kombiniramo po dva, največ tri znake hkrati. Kombinacija več znakov analizo podatkov znatno zamota. V analitič¬ nih tabelah ne prikazujemo samo absolutnih števil, kakor v obdelovalnih tabelah inv veliki večini publikacijskih tabel. Vanje vključujemo vse vrste statističnih parametrov: relativna števila, srednje vrednosti, mere variacije itd. Analitične tabele so navadno sestavni del pismene analize proučevanega pojava. Tehnična načela za sestavljanje tabel. 5.16 Če hočemo, da je tabela razumljiva in pregledna, mora biti sestavljena po ne¬ kih enotnih tehničnih načelih. Tabela naj ima samostojen n a s I o v , iz kate¬ rega je v kratkem razvidno, kaj prikazuje, območje, ki ga obsega, čas, na katerega se podatki v tabeli nanašajo in’kako so podatki v tabeli razdeljeni. Tako je npr. iz naslo¬ va tabele 5.1 takoj vidno, kaj prikazuje: narodni dohodek; območje: SFRJ; čas: leto 1965 ; razdeljen: po republikah. Pojasnila k tabeli dajemo včasih v podnaslovu ali, če so daljša, pod tabelo; to naznačimo v naslovu z ustreznim znakom (zvezdico, križcem ali črko). V nadaljevanju naslova navedemo v i r , iz katerega podatki izvirajo. To je potrebno, ker iz vira sklepamo na kakovost podatkov, po potrebi pa moremo iz osnovnega vira do- - biti podrobne dodatne podatke. V tabeli je treba naznačiti enoto mere, ki jo vnesemo nad tabelo ali v podna- slov, če je enota mere enotna za vse podatke v tabeli (npr. tabela 5.9). Če so enote mere za posamezne podatke različne (npr. tabela 5.8), jih vnesemo v ustrezna polja v glavi oziroma čelu tabele. Opredelitve v opisnem delu tabele - glava in - 108 - čelo tabele - morajo biti kratko in jasno označene. Če zaradi pomanjkanja prostora to v sami tabeli ni mogoče, damo dodatna pojasnila o posameznih pojmih v pripombah pod tabelo. V analitičnih tabelah se izogibamo podatkom z vel ikim številom mest, zato podatke ustrezno zaokrožujemo. V glavnem so pri večmestnih podatkih vsebinsko pomembna tri mesta. Vendar zaokrožujemo podatke na naravna ali dogovorna merila, (npr. vredno¬ sti na tisoče, milijone ali milijarde dinarjev, ne pa na desettisoče, deset milijone itd.). Če je število stolpcev ali vrst veliko, jih oštevilčimo z zaporednimi številkami. 5.17 Grupe za posamezne z na k e r a zv r s t i m o po različnih načelih. Časovne gru¬ pe in razrede za numerične znake razporedimo po naravnem vrstnem re¬ ci u po velikosti v čelu tabele od zgoraj navzdol, v glavi tabele pa od leve na desno (glej tabele 5.2, 5.3, 5.5 in 5.6). Za druge vrste znakov vrstni red ni vnaprej določen. Zanje uporabljamo različne nači¬ ne. Če je štev ilo grup znaka veliko in ni nobenega merila, po katerem bi združevali grupe nižjega reda v grupe višjega reda, uredimo vrednosti po abecednem re¬ li u . Včasih je vrstni red ustaljen po kakem drugem sodilu. Tako je npr. ustaljen vrst¬ ni red za panoge dejavnosti v tabeli 5.4. Če prikazujemo eno samo statistično vrsto, je včasih ugodno, da navedemo grupe po velikosti podatkov v statistični vrsti. Če imamo sestavljeno tabelo, pa včasih ure¬ dimo člene po velikosti podatka, ki je v tabeli vodilen. Za nekatere atribufivne znake moremo grupe urediti po e n o I i č n e m vrstnem redu po velikosti, čeprav znak ni numeričen. Tak znak je npr. šolska izobrazba, za katero razvrstimo grupe po stopnji od grupe: brez šolske izobrazbe do končne, najvišje stopnje: dokončana visoka šola. Enako stopnje kva¬ lifikacije navajamo po vrstnem redu: visoko kvalificiran, kvalificiran, priučen in nekva¬ lificiran ali v obrnjenem vrstnem redu. - 109 - 5.18 Polja v tabeli so razmeroma majhna. Zato pojasnila k posameznim'po- datkom ali poljem ne moremo dati v sami tabeli. Da skrajšamo in poenostavimo pojasnila k posameznim okencem, uporabljamo dogovorjene kratice oziroma ozna ke, ki enostavno opisu jejo določene značilnosti v tabeli. V uradnih statističnih publi¬ kacijah statističnih zavodov v SFRJ so ustaljeni tile dogovorjeni znaki. pojava ni, ne razpolagamo s podatkom, podatek je manjši kakor je 0,5 od enote mere, podatek je manjši kakor je 0,05 od enote mere. poprečje oznaka za opombo pod tabelo nepopoln oziroma nezadostno preverjen podatek popravljen podatek obseženo v podatke v smeri puščice. 5.19 V tabeli ne včrtavamo preveliko število črt. Običajno vse osnovne črte izpuščamo in včrtavamo v tabelo le črte, ki delijo grupe podatkov. V ob¬ širnejših tabelah zvečamo preglednost z različno širokimi presledki med posameznimi vrstami oziroma stolpci. Če je število istovrstnih grup veliko, če so podatki prikazani npr. po občinah, vrstah bolezni ali poklicih, je primerno, da po tri ali pet vrst ločimo s širšimi presledki. To je veliko pregledneje, kakor pa če prenatrpamo tabelo s črtami. S črtami običajno delimo glavo in čelo tabele od številčnega dela - telesa tabele in posamezne pojme v glavi tabele, v številčnem delu pa se omejimo samo na najnujnejše črte. 0 0,0 0 1 ) ( ) * 4 -* GRAFIČNO PRIKAZOVANJE 5.20 V uvodu v prikazovanje statističnih podatkov smo nakazali, da statistične po¬ datke prikazujemo razen s tabelami tudi z grafikoni. Na kratko smo na¬ vedli tudi prednosti in pomanjkljivosti enega in drugega načina. Grafično prikazani podatki dajo enostavno in nazorno sliko o statističnih vrstah. Čeprav - 110 - more biti tabela teoretično poljubno velika, moremo v njej istočasno primerjati zelo omejeno število podatkov. Število istočasno primerjanih podatkov je v grafičnem pri¬ kazu znatno večje. Grafikon ne prikaže natančnih podatkov. Vendar to ni bistveno, ker je njegov namen, da dd grobo sliko in vtis o pojavu. Zato običajno grafikon dopol¬ njuje tabela, če niso podatki številčno vpisani že v grafikon. Grafikoni s svojo nazornostjo niso važni le za približanje statističnih podatkov in skle¬ pov nestrokovnjaku, temveč so koristno in uporabno sredstvo za analizo tudi za strokov¬ njaka. Z grafikonom laže kakor iz tabele odkrijemo določene težnje in značilnosti v množičnih pojavih. Razen tega dosti statističnih metod vsaj v zasnovi analize sloni na grafičnem reševanju problemov. Zato moremo grafikone deliti po svoji vlogi v dve vrstne nostavne grafikone; z njimi ponazarjamo osnovne statis tične podatke tako, da so razumljivi čim večjemu številu porabnikov; 'a na I i t i č n e grafikone, ki so analitično sredstvo raziskoval¬ ca . Ker je večina analitičnih grafikonov zvezana z vsebino pojava in specifičnimi metodami analize, ki jih za sedaj še ne poznamo, so v tem odstavku nakazane splošne osnove gra¬ fičnega prikazovanja in obdelani le najenostavnejši grafikoni. Posebne grafikone pa obrav¬ navamo pri posameznih metodah analize posebej. Tako pri poglavju o relativnih številih obravnavamo specifične načine za grafično prikazovanje sestave populacij in statističnih koeficientov, pri poglavju o frekvenčnih porazdelitvah grafično prikazovanje frekven¬ čnih porazdelitev, pri korelaciji grafične metode primerne za analizo odvisnosti med po¬ javi, pri časovnih vrstah pa metode prikazovanja, ki so specifične za analizo časovnih vrst. Prvine grafičnega prikazovanja 5.21 Vsaka statistična vrsta je sestavljena iz niza številčnih podatkov, od katerih se vsak nanaša na posamezno vrednost ali grupo vrednosti za osnovni znak v statis¬ tični vrsti. Ker so statistični podatki dani številčno, uporabljamo za njegov prikaz naj¬ različnejše geometrijske elemente, ki imajo svoje mere. Ustrezna povezava teh elemen¬ tov večinoma dd nazorno sliko pojava. Za prikazovanje statističnih podatkov med drugim -m- uporabljamo tele geometrijske elemente: a) daljico, b) pravokotnike s stalno širino, ki jih imenujemo s t o I p c e c) odda I je nos f točke od dane osi, d) kvadrate, e) kroge,.f) kocke g) krog le itd. •Vsak izmed teh elementov ima določeno mero: za daljico in stolpec je značilna dolži¬ na. Enako z dolžinsko mero merimo oddaljenost točke od osi. Kvodraf in kocka sta do¬ ločena s stranico, krog in krogla s polmerom. Lastnost, da moremo te elemente meriti, izkoriščamo za prikazovanje statističnih podatkov. Če z daljico določene dolžine po¬ nazorimo doni podatek, narišemo za dvakrat večji podatek dvakrat daljšo daljico ali :tolpec. Enako s točko, ki je dvakrat bolj oddaljena od osi kot prva, prikazujemo dva¬ krat večji podatek kot s prvo točko. Če ponazorimo statistične podatke s kvadrati ali krogi, je dvakrat večji podatek ponazorjen s kvadratom ali krogom, ki ima dvakrat več¬ jo ploščino. Če go ponazorimo s kocko ali kroglo, pa je volumen kocke ali krogle dva¬ krat večji. 1 • Slika 5.1 Prvine grafičnega prikazovanja Če primerjamo daljico in stolpec s kvadratom in krogom ali kocko in kroglo, spoznamo, da je najlažja primerjava različno velikih količin pri daljicah in stolpcih: elementi pa so tem slabše primerljivi, čim višja je razsežnost geometrijskega elementa. To je lepo razvidno iz slike 5.1, v kateri so narisani dvakrat večje posamezne zgoraj naštete prvine. Razen gornjih elementov, od katerih je vsak določen samo z enim podatkom, uporab¬ ljamo za prikazovanje tudi druge elemente, ki imajo več različnih razsežnosti .Pravokot- -ll 2- nik, ki ima svojo višini in dolžino, uporabljamo za prikazovanje dveh statističnih po¬ datkov hkrati; zaradi zveze med širino, dolžino in ploščino pa celo treh. Enako je krogov izsek določen z dvema podatkoma: radijem in kotom, ki ga izsek okle¬ pa itd. Te elemente uporabljamo v kompleksnejših primerih grafi čnega prikazovanja. V grafikonih, ki so namenjeni popularizaciji podatkov, dostikrat uporabljamo za ele¬ ment grafičnega prikaza idea lizirane figure, ki so vezane z vsebino pojava. Podatke o prebivalstvu prikažemo npr. z idealizirano figuro moškega ali ženske (glej sliko 5.1) železniški promet z idealizirano lokomotivo, promet po morju z idealiziranim prikazom parnika itd. Tudi pri figurah uporabljamo dve metodi: Po prvi je volumen pri¬ kazane figure sorazmeren s podatkom, ki ga prikazujemo, po drugem pa velikost podatka ponazorimo z ustreznim številom enako velikih figur. Skale- lestvice. 5.22 Statistični podatki imajo različne enote mere. Vrednost proizvodnje merimo v kosih, metrih, kg. ipd., površino v ha, narodni dohodek v milijonih dinarjev, število prebivalcev v tisočih prebivalcev itd. Geometrijske elemente kakor: daljica, stolpec ali oddaljenost točke od osi, merimo v dolžinskih merah mm, cm itd., ploščine 2 2 kvadratov in krogov v ploščinskih merah mm , cm itd., volumen kocke in krogle pa v 3 3 prostorninskih merah; mm , cm itd. Če hočemo nakazane geometrijske elemente uporabiti za prikazovanje statističnih podat¬ kov, moramo določiti razmerje med enoto mere za statistični podatek in enoto mere za geometrijski element, s katerim prikazujemo podatek. Če vzamemo, da 1 cm pomeni 10 t proizvodnje, je s tem razmerjem dana dolžina daljice za katero koli vrednosti pro¬ izvodnje. Najprikladneje pa je, da sestavimo s. k a 1 o ,. ki grafično podaja razmerje med dolžino stolpcev ali daljice in statističnimi podatki. Ko se odločimo za določeno razmer¬ je in sestavimo skalo, prvotno geometrijsko merilo sploh odpade in s skalo merimo prouče¬ vani pojav neposredno. 5.23 Uporabljamo različne skale ali lestvice. Najobičajnejše so aritmefične- linearne skale. Na aritmetičnih skalah so daljice med dvema vredno- - 113 - stima v sorazmerju z razliko vrednosti. Aritmetična skala je npr. skala za vrednost proizvodnje v sliki 5.2 in skale v večini grafikonov v tem odstavku (slike 5.7, 5.8, 5.10, 5.12, 5.15). 5.24 Razen aritmetičnih - linearnih skal imamo še druge vrste skal, v katerih odnos med podatkom in geometrijskim elementom ni linearen. Od teh je pri proučeva¬ nju dinamike pojavov s časovnimi vrstami posebno uporabna logari tems k a—s_ka I a . Logaritemska skala je skala b na sliki 5.2 Na logaritemski skali so daljice med dvema vrednostima v sorazmerju z logaritmi podatkov, ki jih skala meri. Logaritemska skala je za proučevanje statističnih podatkov priporočljiva, ker z njo ne merimo razlik med podatki, kakor je to primer pri aritmetični skali, temveč razmerja, oziroma kvociente. Razmerja pa so v statistični analizi mnogo važnejša in učinkovitejša za primerjavo ka- v* kor razlike. Podrobno o uporabi ligaritemskih skal in o logaritemskih grafikonih bo govora pri časovnih vrstah, ker so logaritemski grafikoni posebno priporočljivi za ana¬ lizo časovnih vrst. Slika 5.2 Skale ali lestvice 5.25 Risanje skal v ustreznem meri I u . Pri risanju grafikonov je vsakdanji problem, kako narisati skalo v merilu, ki je v skladu z velikostjo grafikona. Pri tem uporabljamo enostavno metodo, ki pomaga risati skale v poljubnem merilu. Vzemi¬ mo, da moramo narisati tako linearno skalo na daljici 7,8 cm, da bo celotna daljica merila proizvodnjo 10 t. Daljico 7,8 cm moramo torej razdeliti na deset ali pri natan¬ čnejši skali na 20 enakih delov. To skalo dobimo takole: na robu papirnatega traku od¬ merimo predpisano dolžino skale 7.8 cm. Eno oglišče zaznamujemo z A, drugo pa z B. Rob traku primaknemo k listu črtanega ali milimeterskega papirja tako, da je oglišče A - 114 - Slika 5.3 .Risanje linearnih skal v poljubnem merilu - 115 - daljice na robu papirja na prvi, oglišče B pa na deseti črti, če razdeljujemo razdaljo 7,8 cm na deset enakih delov. Kjer sekajo vzporednice črtanega papirja rob traku, ka¬ terega smo ustrezno naravnali, narišemo črtice. Tako dobimo skalo v ustreznem merilu. To je prikazano na sliki 5.3 a. Ce potrebujemo podrobnejšo skalo, vzamemo papir z go¬ stejšimi črtami. Podobno z vzporednicami zmanjšujemo skale (glej sliko 5.3 b). 5.26 Zgornji postopek pa ne velja samo za linearne skale, temveč ga uporabljamo tu¬ di za druge vrste skal. Na sliki 5.4 je nakazano kako poljubno povečuje¬ mo ali znonjšujemo- logaritemske skale. Mreže 5.27 Statistične vrste prikazujemo v koordinatnih sistemih za dve spremenljivki. Obi¬ čajno prikazujemo statistične vrste v pravokotnem koordinatnem sistemu. Le za posebne prikaze uporabljamo tudi druge koordinatne sisteme, npr. polarnega, trikotniške- gaitd.V pravokotnem koordinatnem sistemu na eno os - običajno absciso - nanašamo vrednosti znaka za grupo, ki je osnova statistične vrste, druga os - običajno ordinata - pa je os za številčen podatek, katerega statistična vrsta prikazuje. Pravokot¬ ni koordinatni sistem je osnova za večino grafikonov za vse statistične vrste. Vendar je najbolj upravičen za prikazovanje časovnih oziroma numeričnih statističnih vrst. Če v sc u so 20 C S n IS 20 2S SO i! QJ aritmetična mreža -LLJ 1910 S1 SZ ss « 51 ss 57 h) po llogaritmicna mreža Slika 5.5. Mreži grafikona v pravokotnem koordinatnem sistemu. - 116 - pravokotnem koordinatnem sistemu vrišemo osnovne linije za nekaj važnejših vrednosti, dobimo mrežo grafikona. Z mrežo grafikona olajšamo branje grafikona. Na sliki 5.5 sta vrisani navadna aritmetična in pol logaritemska mreža grafikona v pravokotnem ko¬ ordinatnem sistemu. 5.28 V istem grafikonu običajno prikazujemo več pojavov, ki so med seboj vsebinsko povezani. Ker vse pojave v istem grafikonu prikazujemo z daljicami, stolpci, površinami itd., bi bil grafikon nepregleden, če bi uporabljali enake črte za različne pojave, enako zaznamovali površine, ki se nanašajo na različne pojave itd. Pregled¬ nost povečamo tako, da linije za različne pojave različno črtamo, površi¬ ne za različne pojave pa različno šrafiramo.V legendi - pojasnilu pa ozna¬ čimo, kaj posamezni znaki, črte, šrafure itd. pomenijo. Na sliki 5.6 a je načrtano nekaj vzorcev črtanj za linijske grafikone. Če so teh¬ nične možnosti, je prikladno, da namesto različnega črtanja linij uporabljamo različne barve. Barve moremo izbirati skladno s pojavom, ki ga prikazujemo. Tako v kmetijski statistiki rišemo črte, ki se nanašajo na travnike, zeleno, črte, ki se nanašajo na njive, rjavo, za gozd temno zeleno itd. Pri šrafurah je izbira še bolj pisana. Tu imamo možnost spreminjati barve in vzorce v šra¬ furi. Za šrafure v glavnem veljajo trije načini: a) šrafure brez zveze s pojavom; b) šra¬ fure v skladu z intenziteto pojava, ki ga prikazuje; c) šrafure asociativno povezane s pojavom. V sliki 5.6 b so šrafure sestavljene tako, da podajajo pojav, ki ga prikazuje površina. Prva ponazarja gozd, druga sadovnjak, tretja pa vinograd. V sliki 5.6 c pa so šrafure razporejene po vrstnem redu od bele mimo različnih odtenkov do črne. Take šra¬ fure koristno uporabljamo za prikazovanje različne intenzitete pojava in pomeni temnej¬ ša šrafura večjo intenziteto. -m- a Sliko 5.6. Črte in šrafure Vrste grafikonov 5.29 Običajni grafikoni so: a) stolpci, b) linijski grafikoni c) grafiko¬ ni s figurami, d) ka r tog ra m i . Vsak izmed teh načinov ima svoje pred¬ nosti in pomanjkljivosti, ker ima vsak grafikon posebne značilnosti, ki jih drug nima. Stolpce moremo uporabljati za prikazovanje vseh statističnih vrst, vendar niso v vseh pri¬ merih najprikladnejši. Linijski diagrami imajo niz prednosti, ki jih drugi načini grafične¬ ga prikazovanja nimajo. Zato so analitični grafikoni običajno linijski. Figure uporablja¬ mo za popularizacijo pojavov, ki jih z njimi prikazujejo, nimajo pa posebnega študijske¬ ga značaja. Regionalno razmestitev pojava pa lepo prikažemo s kortogrami. Pri teh na¬ vadno mrežo v koordinatnem sistemu zamenja geografska karta. Stolpci 5.30 Z enostavnimi stolpci prikazujemo grofično vse_ilg tistične vrst e. To je prednost stolpcev. Te lastnosti linijski grafikoni npr. nimajo, čeprav so zcradi drugih lastnosti bolj čislani. S stolpci prikazujemo predvsem tiste statistične vrste, ki jih ne moremo prikazovati z linijskimi grafikoni. To so: geografske vrste in stvarno atri- butivne vrste. - 118 - Stolpce v grafikonu večkrat razporedimo po velikosti členov, da podatke laže primerja¬ mo med seboj. V sliki 5.7 je s stolpci prikazana poraba skupne energije v tonah pogoj¬ nega premoga na prebivalca v letu 1964 v evropskih državah. V grafikonu so stolpci na¬ nizani po velikosti podatkov v ranžirni vrsti. Stolpci so postavljeni vodoravno, da more¬ mo zlahka oabrati državo, na katero se stolpec nanaša. Običajno v stolpce, če le more¬ mo, vnesemo številčne podatke. Skala je v sliki 5.7 nanesena vodoravno, mreža pa je v grafikon včrtana tako , da se zdi, kot do so stolpci položeni prek mreže. Optični učinek grafikona tako povečamo. 0 12 3 4 5 6 Slika 5.7. Poraba skupne energije na prebivalca za evropske države v tonah pogojnega premoga v letu 1964 (V^irtSGJ-67). Stolpce uporabljamo včasih tudi za prikazovanje numeričnih vrst, čeprav so linijski grafikoni zanje priporočljivejši. V sliki 5.8 imamo prikazane povprečne denarne izdat- - 11 ?- ke za hrano za gospodinjstvo po grupah skupnih razpoložljivih sredstev za štiričlansko gospodinjstvo z enim zaposlenim v SFRJ v letu 1963 iz tabele 5.5. Posebnost tega grafi¬ kona je v tem, da so vrisani somo obrisi stolpcev. Tako povečamo nazornost grafikona. Enako je mreža včrtana podobno kot v gornjem primeru samo do stolpcev. Širina stolpcev je v razmerju s širino razredov. Le tako dobimo pravilen vtis o spremembah med posamez¬ nimi razredi denarnih dohodkov. Slika zelo nazorno pokaže odvisnost izdatkov od dohod¬ kov v kmetijskih gospodarstvih. OOC dr Slika 5.8. Poprečni skupni izdatki za hrano po grupah skupnih mesečnih razpoložljivih sredstev za štiričlanska gospodinjstva z enim zaposlenim v SFRJ v letu 1963 5.31 V tipkanih poročilih dostikrat ne utegnemo niti nimamo tehničnih možno¬ sti, da vrišemo grafikon. Grafikon z enostavnimi stolpci pa moremo vrisati kar s pisalnim strojem, tako da vtipkamo podatkom ustrezno število X ali I. Tak primer je na¬ kazan v sliki 5.9. V njej je grafično prikazana geografska vrsta za narodni dohodek po republikah v letu 1965 iz tabele 5.1 . - 120 - Narodni dohodek 2 v m11 din 1 3 123456789012345678501234567890 Srbija 28.712 Hrvatska 19.422 Slovenija 11 .263 BiH 9.022 Makedonija 3.907 Črna gora 1 .244 / 7 a X X X X x Jt 1 XXa,wC7a4K4/ : .aaj'i JžaJCaJ.! XXXXXXXX£OI 7dCD0CCXXX X — 1 milijarda din _ I = 500 milijonov din Slika 5.9. Narodni dohodek v SFRJ v letu 1965 po republikah 5.32 Več statističnih vrst s stolpci prikazujemo poredko, ne gl ede nato, da moremo na istem grafikonu prikazati le istovrstne količine. Razen tega je tu¬ di tehnično težko prikazati veliko število raznovrstnih stolpcev. V sliki 5.1 0 sta s stolp¬ ci prikazani indeksni vrsti za zaposleno osebje in industrijsko proizvodnjo v SFRJ v raz¬ dobju 1965 - 71. Indeksi, ki jih podrobneje obravnavamo pri relativnih številih, kaže¬ jo razmerja podotkov v statistični vrsti v primerjavi na določen člen - osnovo primerja- Slika 5.10. Indeksi za število zaposlenih in za skupno industrijsko proizvodnjo v SFRJ v razdobju 1965-1971 (1965=100) (Vir: SG - 71). - 121 '- ve. V naši sliki je osnova primerjave leto 1965. Iz stolpcev nazorno vidimo, da proiz¬ vodnost dela po letih raste, ker se stolpci za indekse proizvodnje hitreje večajo kot stolpci za indekse zaposlenih. Stolpci so v sliki 5.10 risani tako, kakor da bi bili prekriti. To poveča učinek grafiko¬ na. Z različnima šrafurama poudarimo, da grafikon prikazuje dve različni časovni vrsti Linijski grafikoni 5.33 Največjo analitično vrednost imajo linijski grafikoni vseh vrst. Z njimi prika¬ zujemo stvarno numerične, predvsem pa časovne vrste. Ker posebne oblike linij¬ skih grafikonov časovnih vrst obravnavamo v poglavju o časovnih vrstah, se v tem odstav¬ ku omejimo samo na splošne oblike in pravila za risanje linijskih grafikonov. Bistvo linijskih grafikonov je v tem, da podatke vnašamo s točkami, ki so od abscisne osi oddaljene v razmerju z velikostjo podatkov, te točke pa zvežemo z daljicami. Za risanje linijskih grafikonov veljajo ustaljena pravila. Z njimi dosežemo, do je grafi¬ kon pregleden in nazoren in da nedvoumno prikaže proučeni pojav. Ta pravilo mo¬ remo v kratkem združiti v naslednje točke: a) Običajno je abscisna os časovna skala ali skala za numeričen znak, na katerega se podatki nanašajo, ordinata pa količinska oziroma vrednostna skala. b) Časovno skalo oziroma skalo za numeričen znak praviloma nanesemo na dnu grafikona tako, da jo čitamood leve na desno, količinsko pa rta levi strani tako, da jo čitamo od spodaj navzgor. Enoto mere pri količinski skali označimo nad skalo. c) Količinsko skalo začnemo z izhodiščem 0, če je skala oritmetična, ker drugače niso vidni pravilni proporci med vrednostmi. Logaritemske skale začnemo in končamo - če je le mogoče - z 1, 10, 100 .... d) Če izhodišče ne moremo narisati, skalo prekinemo; to pa naznačimo, kakor da bi bi¬ la skala prerezana. Tako opozorimo, da skala ni celotna. e) Da laže čitamo podatke, ima grafikon praviloma včrfano mrežo. - 122 - obel g) napačno leto pravilno t leto c) napačno pravilno napačno c ^ pravilno Slika 5.11 Pravila za risanje linijskih grafikonov -123- f) Mreža ne sme biti pregosta nit! preveč poudarjena in mora stopiti v ozadje. g) Črtg_zfl.podatke morajo biti risane tako, da jasno izstopijo iz mreže. h) Razmerje med časovno in količinsko skalo mora biti tdko, da ni podan vtis tendenčne¬ ga prikazovanja podatkov. i) Če v istem delu prikazujemo več sorodnih grafikonov, mora biti razmerje med skala¬ ma v vseh grafikonih isto. j) Podatke v linijski grafikon vnesemo z majhnim krogcem ali točko. Za momentne vr¬ ste postavimo krogce točno nad momentom, ki ustreza členu (glej sliko 5.13), za inter¬ valne pa nad sredino ustreznih razmikov. (Glej sliko 5.12). k) Posamezne krogce v linijskem grafikonu povežemo z daljicami, ne pa s krivuljami, da s tem ne napravimo vtisa , kot da poznamo potek pojava tudi v inferpoliranem raz¬ dobju. i) Črte za posamezne različne vrste na istem grafikonu rišemo z različnimi barvami,da je jasno viden potek za posamezne vrste. m) Skala za znak (časovna skala, skala za numeričen znak) mora biti v sorazmerju z vrednostjo znaka. Če to ni mogoče, kombiniramo različne vrste grafikonov. n) Na enem grafikonu ne smemo prikazovati preveč statističnih podatkov oziroma vrst, ker tak grafikon ni pregleden. Zgornja pravila so grafično ponazorjena v sliki 5.11 . 5.34 V sliki 5.12 je prikazana z linijskim grafikonom statistična vrsta poprečnih iz¬ datkov za hrano v letu 1968 v delavskih gospodinjstvih z enim zaposlenim v od¬ visnosti od skupnih razpoložljivih sredstev. (Vir: SG-1971). Linijski grafikon nazorneje kot stolpci pokaže spreminjanje izdatkov, če se spreminjajo denarni dohodki. Če pozor-- neje pogledamo sliko, opazimo, da so točke, ki ponazarjajo podatke iz statistične vrste, risane v sredini razredov za skupne dohodke, ker se poprečja nanašajo na posamezne raz¬ mike. Za zvezne statistične vrste so smiselne tudi veznice točk. Posamezne točke na lomljeni črti pokažejo, koliko so poprečni izdatki v kmetijskih gospodarstvih, ki imajo dohodke, ustrezne koordinatam določene točke. Tako je v grafikonu nakazano, da ustreza popreč¬ nim dohodkom 18000 dinarjev 6700 dinarjev denarnih izdatkov za hrano. /2 da tki za hrano y 10* din Siika 5.12 Povprečni letni izdatki za hrano v odvisnosti od skupnih razpoložljivih sredstev v delavskih gospo¬ dinjstvih z enim zaposlenim v letu 1968 5.25 V sliki 5.13 je prikazana statistična vrsta za število zaposlenih v SFRJ v druž¬ benem sektorju po letih v razdobju 1957-1971 .(Podatki iz tabele 5.3 .)Ker se podatki nanašajo na konec septembra vsakega leta, so točke, ki prikazujejo števi¬ lo zaposlenih, nad ustreznimi datumi v letnih razmikih. Tudi za ta primer so točke na veznicah linearne interpolacije za število zaposlenih za druge datume. - 125 - Število zaposlenih Slika 5.13. Število zaposlenih v družbenem sektorju v SFRJ v raz¬ dobju 1957-1971 (Vir: Tabela 5.3) 5.36 Slika 5.14, ki prikazuje proizvodnjo električne energije, je zanimiva, ker ima dvojno skalo. Na levi je skala za količino električne energije, na desno pa je skala indeksov s stalno osnovo leto 1965. Da se skali ne mešata, sta narisani le do kri¬ vulje, vsaka s svoje strani. Ta grafikon prikazuje intervalno časovno vrsto. Posamezni vrisani podatki se torej nanašajo na posamezna leto. Vendar imajo tudi točke na lom¬ ljeni črti grafikona svoj smisel. Posamezne točke na liniji pomenijo linearno interpola¬ cijo za proizvodnjo električne energije v letu, za katerega je čas, ki ustreza tej točki, sredi leta. - 126 - Slika 5.14. Proizvodnja električne energije v SFRJ v razdobju 1952-1971 . (Vir: Tabela 5.2) - 127 - 1952 5.37 Dostikrat linijski grafikon kombiniramo s kakšnim drugim načinom grafičnega prikaza. Tako so v sliki 5.15 na enem in istem grafikonu mesečna poprečja po letih v razdobju 1960-1971 in mesečna vrsta števila tujih gostov v SRS. Ker je ne¬ mogoče vskladiti letna in mesečna razdobja, so mesečno poprečja po letih narisana s stolpci, mesečni podatki v letu 1 971 pa z linijskim grafikonom. Figure cz..,- 7" i 5.38 Če hočemo z grafikonom popularizirati pojave, ki jih prikazujemo, včasih upo¬ rabljamo za grafično prikazovanje idealizirane figure, da je iz grafikona ne¬ posredno razvidno, kaj prikazuje. Figure vključujemo v grafikone na tri načine. Včasih spremlja običajen gra¬ fikon s stolpci ali linijami slika, ki laiku približa pojav, ki ga grafikon prikazuje. Slika 5.15, Število tujih gostov v SRS v razdobju 1966-1972 - 128 - pismonoš ne pošiljke 1939 1957 1971 h □ l 1939 1957 1971 £ C 1939 1957 1971 paketi Slika 5.16 PTT storitve v SFRJ v letu 1957 in 1971 v primerjavi z letom 1939. (Vir: Indeks.) V sliki 5. 16 imamo za primerjavo poštnih storitev v letih 1957 in 1971 z letom 1939 upo¬ rabljen ta način. Pri tem načinu je slika samo dopolnilo k običajnemu grafikonu. V obeh nadaljnjih primerih pa slika obenem kaže, kako velik je podatek. 5.39 V sliki 5.17 je posamezna slika v razmerju z velikostjo podatka. Vendar so podatki slabo primerljivi, če so risani po tej metodi. Tako je pri pismonošnih storitvah velikost podatka sorazmerna z dvodimenzionalno površino kuver¬ te; za pakete in telefonske razgovore s trodimenzionalno prostornino paketa oziroma telefonske slušalke; za telegrafske storitve, ki so ponazorjene s telegrafskim trakom, pa v sorazmerju z enodimenzionalnim telegrafskim trakom. Ta metoda je v splošnem tako slaba, da se je izog ibamo . 5.40 Najbolje je, da prikažemo podatke s figurami tako, da velikost podatka pona- zorimo z ustreznim številom enakih, idealiziranih figur. V tem primeru odpadejo vsi dvomi in nevšečnosti zaradi različne razsežnosti pojavov,sla- - 129 - 1939 1357 Slika 5.17. PTT storitve v SFRJ v letu 1957 v primerjavi z letom 1939.' be primerljivosti prostornin itd. Po tem načinu so prikazani podatki o PTT storitvah v sliki 5.18. Vsaka slikica danega elementa predstavlja določeno velikost pojava.Ta¬ ko pri pismonošnih storitvah ena kuverta ponazarja 100 milijonov pismonošnih storitev, en paket 1 milijon paketov, 1 cm telegrafskega traku 1 milijon telegrafskih storitev in ena telefonska slušalka 50 milijonov telefonskih pogovorov. Kakor vidimo iz slike 5.18, moremo z delom osnovne slikice nakazati podatek, ki je manjši od podatka, ki ga prikazuje cela figura. Kartogra mi 5.41 Geografsko razmestitev pojavov najlepše prikažemo s kartogrami. Osnova kar- togramov je geografska karta, v katero vrisujemo podatke na mesto, ki ustre¬ za stvarni razmestitvi pojava. Mreža kartograma je torej geografska karta.Vse grafiko- -13Q- Pismonošne C» s DXl [X] 1X1 |X3 [X\j [Xl 58? ml J usluge (X! -- vomtj S57 [x^l 1X1 1X1 X [XIDX [2 652 m, i Paketi 03 - / mlj 03 03 S303 030 m Y/X , če je Y,A > X,A - 171 - Tabelo 6.15 Primerjava strukturnih deležev za industrijo SR Slovenije v industriji SFRJ za leto 1970. (Vir: SG-1972) - 172 - IndSRS tndSFRJ 116 T' m— % 20- 19 ~ 1 < 9 - 77 - -DP NP -OD -ŠOrg F!-LZS -Šzap t~ DS/4 - W osr- 75 — 13 - 12 - -i-os Vj— OSA ~ S7 7^-osr-s/ — FI-FFSF 77 - -I-DS 0 20 —** FI-FFSF Sliko 6.12. Strukturni grafikon za odnose v industriji SR Slovenije v letu 1970 Iz te zveze moremo iz grafikona neposredno odčitati: družbeni produkt (DP) in neto pro¬ dukt (NP) na osebni dohodek (OD) je v SR Sloveniji malenkostno večji kot v poprečju za SFRJ. Obenem pa je osebni dohodek (OD) na zaposlenega (Z) v industriji precej več¬ ji v Sloveniji kot je jugoslovansko poprečje. Zaradi prvih dveh zvez je to izraz višje produktivnosti dela. Ker je strukturni delež za skupna (OS Z -SV) in aktivna osnovna sredstva (OSA-SV) po sedanji vrednosti znatno nižji kot po nabavni vrednosti (OSZ-NV) (OSA-NV), moremo računati, da je izrabljenost osnovnih sredstev v Sloveniji znatno - 173 - večja kot v poprečju za vso državo. Ker so deleži osnovnih sredstev (OS-SV) (posebno sedanja vrednost) nižja od številnih zaposlenih (Z) sklepamo, da je opremljenost oziro¬ ma sestav v Sloveniji pod jugoslovanskim poprečjem. Če pogledamo delež investicij v osnovna sredstva (l-OS) in strukturo financiranja, spoznamo, da večji delež financi¬ ranja investicij iz iastnih in združenih sredstev (FI-LZS) in manjši delež za financira¬ nje iz kreditov sredstev in fondov federacije (FI-KFSF) in izjemno majhen delež za financiranje iz federalnih sredstev in fondov (FI-FFSF) kaže značilno strukturo financi¬ ranja investicij v industriji v SR Sloveniji. S premakljivo logaritemsko skalo, ki je v enakem merilu kot je osnovna logaritemska skala, bi mogli nakazane odnose izraziti z indeksi. Ce izhodišče logaritemske skale (1 ali 100) naravnamo v grafikonu na strukturni delež, ki je v koeficientu v imenoval¬ cu, odberemo indeks ustreznega koeficienta ob strukturnem deležu za podatek, ki je v koeficientu v števcu. V grafikonu je za zgled nakazan indeks za neto produkt na zaposlenega (11 6). Iz grafiko¬ na odberemo podobno, da je indeks izrabljenosti osnovnih sredstev v industriji Sloveni¬ je 118 v primerjavi s SFRJ. Indeks osnovnih sredstev na zaposlenega je 82, indeks dele¬ ža financiranja investicij iz lastnih sredstev je 118, deleža kreditiranega iz sredstev in fondov federacije pa 83. Podobno bi mogli analizirati še vse druge odnose za SR Slo¬ venijo v primerjavi s SFRJ. Uporabnost grafikona moremo razširiti iz enega grafikona na več grafikonov. Ker je en grafikon za en del narisan ob eni premici, moremo nazoHio prikazati odnose za vse re¬ publike hkrati za eno panogo ali za različne panoge po republikah. Časovna vrsta strukturnih grafikonov pokaže spreminjanje v indeksih odnosov ipd. ENOSTAVNI INDEKSI 6.37 O indeksih govorimo, kadar z relativnimi števili primerjamo istovrstne, prireje¬ ne podatke. Strukture in koeficiente računamo iz absol utnih podatkov. Indekse po računamo iz vseh vrst statističnih podatkov, ne pa samo iz absolutnih. Tako moremo z indeksi primerjati med seboj različne koeficiente, strukturne odstotke in druge izvede- - 174 - ne pokazovolce. Indeks računamo po osnovnem obrazcu l 1/0 = 100. v/to (6.10) Pri tem pomeni: = podatek, ki ga primerjamo s podatkom Y q . Y q = podatek, na ka¬ terega primerjamo. Podatek, na katerega primerjamo, imenujemo bazo ali osno- v o indeksa. Z indeksom izražamo tekoči podatek v stotinkah ali poenih od osnove Y . Indeks pod 100 pomeni, da je pojav manjši od osnove, indeks 100 pomeni, da sta pri¬ merjani podatek in osnova enaka. Indeks pa je nad 100, če je podafek.večji od osnove. Ker so indeksi neimenovana števila in imajo enoten merski sistem, iz njih zelo nazorno dobimo vtis o velikosti sprememb oziroma razlik. Razen tega moremo med seboj primer¬ jati indekse za raznovrstne podatke, ki drugače ne bi bili neposredno primerljivi. 6.38 Po podatkih mednarodnega pregleda v SG 1958 je imela Jugoslavija v letu 1955 1298,3 milijard dinarjev narodnega dogodka, v letu 1956 pa 1444,1 milijard dinarjev. Italija je imela v letu 1 955 1 0814 milijard lir, v letu 1956 pa 11 504 milijard lir narodnega dohodka. Iz absolutnih podatkov si ne moremo ustvariti slike, v kateri dr¬ žavi je bilo povečanje narodnega dohodka večje. Podatki za Italijo in Jugoslavijo niso med seboj neposredno primerljivi, ker so eni dani v dinarjih, drugi pa v lirah. Če pa izračunamo indekse, dobimo, da je za Jugoslavijo indeks enak: '56/55 1 00 ' Y 5 6 / Y 55 100.1444,1 1298,3 = 111,2 za Italijo pa 100.11504 56/55 = 10814 = 106,4 Indeksa pc. a primerljiva in sicer kažeta, da je bil porast narodnega dohodka relativ¬ no večji v Jugoslaviji kakor v Italiji. Ce so spremembe, ki jih izražamo z indeksi , velike, indekse računamo na cela števila, na eno decimalko pa jih računamo le, če prikazujemo majhne spremembe. Praviloma i- ~ pa ne računamo indeksov na več decimalk, ker tako indeks izgubi svojo osnovno kvali¬ teto - nazornost. - 175 - Stvarni in krajevni indeksi 6.39 Ker se podatka, ki smo ju primerjali med seboj v zgornjem zgledu, razlikujeta v času (leto 1955 in leto 1956), imenujemo toke indekse časovne indekse. Pri- merjana podatka pa se moreta razlikovati tudi v krajevnem ali stvarnem znaku. V tem primeru računamo krajevne in stvarne indekse. Običajno računamo indekse za cele vr¬ ste podatkov. V takih primerih vzamemo običajno za bazo vseh indeksov en in isti člen. 6.40 Kot zgled za vrsto krajevnih indeksov vzemimo poprečno pogodbeno pro- 2 dajnoceno za m stanovanjske površine zo glavna mesta republik in pokrajin v letu 1971 . Tabela 6.16. Poprečna pogodbena prodajna cena za 1 2 m (Vir: SG-72) Za osnovo vzamemo člen, za katerega najbolje poznamo razmere. Ker kot Slovenci najbolje poznamo razmere v Ljubljani, zato vzamemo za osnovo primerjave Ljubljano in nanjo izračunamo vse indekse, iz tabele 6.16 vidimo, da je stanovanjska površina le v Zagrebu višja od Ljubljane, da pa je indeks za Skopje najnižji (59). Pri proučitvi teh podatkov pa moramo upoštevati ne le razlike v stroških temveč tudi v stanovanj¬ skem standardu. 6.41 Za zgled indeksov iz vrste za stvarni znak vzemimo poprečne mesečne osebne dohodke v gospodarskih in negospodarskih dejavnostih v letu 1969 po stopnji strokovnosti. - 176 - Tabela 6.17 Poprečni neto osebni dohodki po stopnji strokovnosti v gospodarstvu in negospodarstvu (JZI 1969) (Vir: ŠG-72) Indeksi nazorneje kakor pa absolutni podatki v enem številu pokažejo razmerje med gospodarstvom in negospodarstvom. Indeks za kvalificiranega delavca pokaže za 7.3 poena višjo raven v negospodarstvu v razmerju z gospodarstvom. Enako je indeks več¬ ji od 100 za zaposlene z visoko strokovno izobrazbo, kar je razumljivo. Za vse druge vrste delavcev pa so indeksi manjši kot 100 in sicer so največje razlike pri zaposlenih z višjo strokovno izobrazbo. Zaradi različne sestave skupno zaposlenih v gospodar¬ stvu v primerjavi z negospodarstvom pa je indeks izredno velik 121,7. Časovni indeksi 6.42 Indeksi s stalno osnovo . Največkrat računamo indekse za časovne vr¬ ste in z njimi proučujemo dinamiko pojavov. Časovna vrsta osnovnih podatkov - 177 - sicer že samo prikazuje dinamiko, vendar ji razmeroma težko sledimo, ker so posamezni pojavi različno veliki, imajo različne enote mere itd. Preračunanje take vrste v indeks¬ no vrsto s pravilno izbrano bazo pa pokaže spremembe od osnove, ki je v vsakem prime- ru 100, v stalnem merilu - stotinkah. 6.43 Za zgled časovnih indeksov vzemimo časovne vrste v razdobju 1965-71 za nekaj pomembnih podatkov za SFRJ. Tabela 6.18 Razvoj za nekaj pojavov za SFRJ v razdobju 1965-71 (Vir: SG-72). - 3 $P = število prebivalcev V 10 3 ZDS = zaposleni v družbenem sektorju v 1 0 ND = narodni dohodek v 10^ po stalnih cenah v letu 1966 EE = skupna proizvodnja elektro-energije v 10 KWh 3 PR = skupna proizvodnja premoga v 10 ton 3 NF = proizvodnja surove nafte v 1 0 ton 3 S = surovo jeklo SM in EL v 10 ton Tako enote mere kot ravni, na katerih so posamezni pojavi,otežuje jo, če že ne onemo- . gočajo primerjovov dinamiki med posameznimi pojavi, zato izračunajmo vrste časov¬ nih indeksov in vzemimo leto 1965 (prvo leto gospodarske reforme) za osnovo. V tabeli 6.19 so iz absolutnih podatkov izračunane vrste indeksov. Ti indeksi so med seboj primerljivi, ker so vsi izračunani na isto osnovo in so neimenovana števila, iz njih sklepamo, kako je npr. rastel narodni dohodek znatno hitreje kakor število prebi¬ valstva, da je od indeksov proizvodnje energetskih sredstev proizvodnja premoga stag- - 176 - Tabela 6.19. Indeksi razvoja za nekaj pojavov za SFRJ v razdobju 1965-71 nirala, medtem ko kažejo indeksi za elektroenergijo močan vzpon. Indeksne vrste iz tabele 6.1 9 so še nazorneje prikazane v sliki 6.13. 6.44 Indeksi s premično os n o v o . V gornjem primeru smo za posamezne pojave primerjali podatek za vsako leto s podatkom za leto leta 1965. Take indeksne vrste imenujemo indeksne vrste s stalno osnovo ali bazo. Slika 6.13 Indeks! razvoja za nekaj pojavov iz gospodarstva za SFRJ v razdobju 1965-71 Večkrat pa računamo indekse tudi tako, dav isti časovni vrsti menjamo osnovo ali ba¬ zo primerjave. Take indeksne vrste imenujemo indeksne vrste s premično bazo. Iz med indeksnih vrst s premično bazo najpogosteje uporabljamo verižne indekse. Za dano časovno vrsto računamo vrsto verižnih indeksov tako, da za vsak podatek, za katerega računamo verižni indeks, vzamemo za osnovo predhodni člen. Tako dobimo -vrsto verižnih indeksov, ki pokažejo relativne spremembe od člena do člena. Verižne indekse torej računamo po splošnem obrazcu 'k = 100 • Wi (6 - n) Pri tem pomeni: = tekoči podatek: ^ = podatek za predhodni člen; 1^ = veriž¬ ni indeks. 0.45 Če vzamemo iz tabele 6.18 podatke o narodnem dohodku v SFRJ v letih 1965 1971, je vrsta veri žnih indeksov takale: Tabela 6.20 Verižni indeksi za narodni dohodek v SFRJ v razdobju 1965-1971 iz zgleda vidimo, da verižnega indeksa za prvi člen časovne vrste ne moremo izra¬ čunati, ker ne poznamo predhodnega člena. Vrsta verižnih indeksov kaže, da se na¬ rodni dohodek od leta do leta veča, da pa so spremembe neenakomerne. 115 110 105 100 1965 1966 1967 1968 1969 1970 1971 Slika 6.14 Verižni indeksi za ND v SFRJ - 180 - 6.46 Preračunavanje indeksov na drugo os n o v o . V navedenih primerih smo izračunali indekse iz vrst osnovnih podatkov. Dostikrat pa imamo indeksne vrste,iz katerih želimo izračunati indeksne vrste z novo osnovo, nimamo pa osnovnih podatkov. V tokih primerih preračunamo indeksno vrsto v indeksno vrsto z novo bazo 1 tako kakor iz osnovne vrste U/1 = 100-p^ (6.12) 4/1 'l/O Velja namreč 1 2 /o 100.YyY '°°' V )oo. Yl A° - "”-WVi ' 6.47 Vzemimo za zgled iz tabele 6.16 indeksno vrsto za poprečno pogodbeno prodaj- no ceno za 1 m . Osnova te indeksne vrste je Ljubljana . Želimo pa izra¬ čunati novo indeksno vrsto, v kateri je osnova mesto z najnižjim indeksom (Skoplje). Po obrazcu 6.12 indeks za vsako mesto primerjamoz bazičnim indeksom (Skoplje 59). vršine v letu 1971 Za Beograd smo indeks z novo bazo izračunali takole: 10 ° - - 6.48 Podobno preračunamo na novo osnovo tudi vrste časovnih indeksov. Tako dobi¬ mo po gornjem pravilu iz indeksne vrste za proizvodnjo električne energije v Ju¬ goslaviji iz tabele 6.19 novo .indeksno vrsto z osnovo 1971, tako da vsak člen indeksne vrste delimo z indeksom za leto 1971 (190) in kvociente pomnožimo s 100. Podobno kakor iz absolutnih podatkov moremo izračunati iz časovnih indeksnih vrst tu¬ di vrste verižnih indeksov. Iz vrste verižnih indeksov pa dobimo indeksne vrste s poljubno -181 - stalno osnovo s postopnim množenjem oziroma del jenjem verižnih indeksov. Tabela 6.22 Indeksna vrsta za proizvodnjo električne energije v Jugoslaviji v razdobju 1965-1971 . 6.49 Izbira baze ali os n o v e . Forma Ino moremo vzeti za osnovo pri računan ju indeksov kateri koli člen v vrsti, za katero računamo indekse, ali tudi vrednost, ki je izven nje. Vsebinsko pa je odločitev o osnovi primerjave odvisna od namena, pri¬ mernosti in smiselnosti primerjave. Zaradi tega je za izbiro baze nemogoče dati enotno pravilo, marveč samo nekaj splošnih načel,ki pomagajo pri pravilni izbiri baze. Pri stvarnih in geografskih indeksih vzamemo za osnovo po pravilu po¬ jav oziroma območje, ki si ga najbolje predstavljamo oziroma ga najbolje poznamo. Tako v medrepubliški primerjavi vzamemo npr. za osnovo SR Slovenijo, v meddržavni primerjavi SFRJ itd. Če primerjamo z indeksi relativna števila ali druge izvedene po- kazovalce za posamezne dele populacije, je najprimerneje in najenostavneje, da vza¬ memo za bazo sumarni pokazovalec za celoto. Taki indeksi pokažejo odklone od neke¬ ga povprečnego stanja. Poseben problem je izbiro osnove jor i časovnih i nd e ks i h . Za časovne indekse velja splošno pravilo, da vzamemo za osnovo čas, ko je pojav normalen in ustaljen. Kdaj pa je pojav normalen, je težko določiti. Vendar moremo iz tega pravila vsaj sklepati, katere člene ne smemo vzeti za osnovo, ker je laže ugotoviti, kdaj pojav ni normalen. Zaradi tega za primerjavo večine pojavov ne vzamemo vojna leta, leto gospodarskih kriz in tako dalje. Enako v zdravstveni statistiki ne vzamemo za osnovo I eta epidemij. Večja verjetnost je, da je pojav normalen v daljšem razdobju kot v krajšem. Zaradi tega običajno ne jemljemo za osnovo kratka razdobja, npr. mesece pri indeksih proizvodnje, marveč vzamemo za osnovo leto. Težko je tudi npr. reči v kmetijstvu, katero leto je normalno, ali je to leto ugodne ali neugodne vegetacije. - 182 - Zato v kmetijstvu dostikrat vzamemo za osnove večletno (petletno ali desetletno) po¬ prečje . Povojni razvoj običajno primerjamo s stanjem pred vojno. Za osnovo primerjave vzamemo čim kasnejše leto pred vojno, vendar tako, da nanj še ne vplivajo priprave na vojno. V SFRJ vzamemo za primerjavo s predvojnim stanjem za bazo leto 1939, OZN pa leto 1937. Vendar moramo paziti, kdaj so primerjave pred in povojnega stanja vsebinsko ute¬ meljene in smiselne. Za zelo dolga razdobja in v primeru velikih sprememb primerjava na določeno storo stanje nima smisla. Če je bila nekaj let po drugi svetovni vojni primerjava s predvojnim stanjem upravičena, ker smo tako približno dobili vtis o pojavih in spremembah, je primerjava s predvojnim stanjem sedaj nepomembna, ker nas zanima povojni razvoj, ne pa primerjava s predvoj¬ nim stanjem, ki je že razmeroma zelo odmaknjeno. Vendar ne vzamemo za osnovo po¬ vojnega razvoja prvo povojno leto, ko so bile razmere še neustaljene, temveč kasnejše razdobje normaliziranega stanja. Včasih vzamemo za osnovo indeksov tudi zadnje - tekoče leto. Taka indeksna vrsta primerja preteklo stanje s podatkom, ki je časovno najbližji in tudi najzanimivejši,ker predstavlja trenutno stanje. Velikih sprememb tudi ne kaže prikazovati z indeksi. Tako nima smisla npr. računati indeksa proizvodnje valjanih aluminijevih proizvodov na bozo 1939, ko je bila proizvod¬ nja 15 ton, s proizvodnjo v letu 1957, ko smo proizvedli 4527 ton valjanih aluminije¬ vih proizvodov. Indeks, ki ga izračunamo iz zgornjih podatkov, je 30180 in nenazoren. Kljub temu, da indeksi v splošnem izboljšajo primerjavo, ta indeks nima smisla, ker je nepredstavljiv. - 183 - SEDMO POGLAVJE 7. FREKVENČNE PORAZDELITVE SESTAVLJANJE FREKVENČNE PORAZDELITVE 7.1 Med statističnimi vrstami imajo posebno mesto vrste, ki prikazujejo razporeditev vrednosti za numerične znake. Take vrste imenujemo frekvenčne porazde- litve ali pogostnostne porazdelitve. Za dano populacijo dobimo frekvenč¬ no porazdelitev, če za posamezne razrede za proučevani znak poiščemo, koliko enot ima vrednost znaka v ustreznem razredu. Vzemimo za zgled porabo lesa v letu 1953 v 149 kmetijskih gospodarstvih v takratnem okraju Novo mesto. Ta gospodarstva so bila anketirana v anketi o porabi lesa leta 1953. Osnovni podatki o porabi lesa v posameznih anketiranih gospodarstvih so navedeni v tabeli 7.1 . 3 Tabela 7.1 Poraba lesa v m v 149 kmetijskih gospodarstvih v letu 1953 v okraju Novo mesto. (Vir: Anketa o porabi lesa v letu 1953). Uredimo zgornjo nepregledno množico podatkov v frekvenčno porazdelitev, v kateri vzemimo po 1 rrr široke razredel V tabeli 7.2 pomeni npr. 3 porabo od 3,0 m do 3,9 m3. - 185 - Tabela 7.2 Frekvenčna porazdelitev 149 kmetijskih gospodarstev v Novem mestu po porabi lesa v letu 1953. Število enot v posameznem razredu imenujemo frekvenca. Po pravilu zaznamujemo frekvence s črko f. Frekvenčna porazdelitev v tabeli 7.2 kaže veliko pregledneje porabo lesa v gospodar¬ stvih kakor posamični podatki v tabeli 7.1 . Vendar frekvenčna porazdelitev ne da na¬ tančnih vrednosti. Iz nje npr. vidimo, da je eno gospodarstvo porabilo od 2,0 do 2,9 O iti lesa, ne vemo pa, koliko so natančno porabili lesa v tem gospodarstvu. Enako je iz frekvenčne porazdelitve razvidno, da je 14 gospodarstev porabilo 10,0 do 10,9 m , ne vemo pa natančne porabe lesa. S frekvenčno porazdelitvijo se je preglednost povečala, natančnost informacij pa zmanjšala. Iz frekvenčne porazdelitve dobimo nekatere zelo koristne ugotovitve. Predvsem je frekvenčna porazdelitev slika o variiranju znaka. Iz tabele 7.2 vidimo, da je bila ——■—---— 2 2 npr. poraba lesa v kmetijskih gospodarstvih od 2 m' do 34 m . Razen.tega si iz frek¬ venčne porazdelitve zlahka ustvarimo sliko o porabi lesa znotraj teh meja. Bežen po¬ gled pokaže, da je gospodarstev z majhno porabo malo, medtem ko se število gospo¬ darstev v posameznih razredih do neke porabe v glavnem veča, za večjo porabo pa so frekvence vedno manjše. Frekvenčna porazdelitev nakazuje zakonitost, ki jo opazimo pri večini populacij. V dani populaciji se vrednosti najbolj goste okrog nekega sredi¬ šča, od katerega so odkloni tem redkejši, čim večji so. Vendar se ta zakonitost v frek¬ venčni porazdelitvi v tabeli 7.2 ne kaže popolnoma, imamo več odstopanj od tega pravila. Frekvence v sosednih razredih so včasih večje, včasih manjše. Število enot v posameznih razredih je namreč razmeroma majhno, zato prevladujejo še slučajni vpli¬ vi. Če bi bilo število enot v posameznih razredih večje, slučajni vplivi ne bi bili tako močni in bi se gornja zakonitost izražala močneje. Frekvence v razredih moremo pove- - 186 - čoti na dva načina. Če bi namesto 149 gospodarstev imeli desetkrat večjo populacijo s 1490 gospodarstvi, bi bile tako frekvence večje. Zakonitost bi se izražala močneje. Vendar tako večanje frekvenc običajno ne pride v poštev. Frekvence pa povečamo tudi, če vzamemo širše razrede. S tem se sicer zmanjša natančnost prikaza, zakonitost variiranja vrednosti pa je prikazana bolje, ker so slučajni vplivi manjši. Če v tabeli 7.2 združimo po štiri razrede, dobimo novo frekvenčno porazdelitev; ta je prikazana v tabeli 7.3. Tabela 7.3 Frekvenčna porazdelitev za porabo lesa v letu 1953 za 149 kmetijskih gospodarstev v okraju Novo mesto. 149 = N Frekvenčna porazdelitev v tabeli 7.3 je preglednejša, ker je število razredov manjše. Razen tega pa je zaradi razmeroma velikih frekvenc dobro vidna zakonitost gostitve. Frekvence se sprva večajo, dokler ne dosežejo največjo gostitev v razredu 12,0 - 16,9 m^, od tu pa stalno padajo. Seveda pa ne smejo biti razredi preširoki. S širjenjem razredov se natančnost bolj in bolj manjša. Tudi zakonitost gostitve je vedno manj vidna. Če v gornji frekvenčni po¬ razdelitvi združimo po dva razreda, dobimo skrčeno porazdelitev, ki je prikazana v tabeli 7.4. - 187 - Tabela 7.4 Frekvenčna porazdelitev za porqbo lesa v letu 1953 v 149 kmetijskih gospodarstvih v okraju Novo mesto Ta frekvenčna porazdelitev sicer še vedno nakazuje osnovno zakonitost, vendar daje pregrobo sliko, ker so v istem razredu gospodarstva, ki imajo do 8 m^ razlik v porabi 1 lesa. Zato je pri sestavljanju frekvenčnih porazdelitev važno števjjo in velikost razredov. Če — _ , ... _- n - i-,— - .. vzamemo premajhne razrede, na frekvence preveč vplivajo slučajni vplivi in zabrišejo osnovno zakonitost gostitve, preveliki razredi pa dajo pregrobo sliko. Nimamo splošne¬ ga pravila, kakšne in koliko, razredov naj ima frekvenčna porazdelitev, pač pa je prak- sa pokazala tole: razredi, ki razdele razmik med najmanjšo in največjo vrednostjo v po¬ pulaciji na osem do šestnajst razredov, dajo običajno dosti dobro sliko gostitve. Števi¬ lo razredov se ravna po velikosti populacije. Za manjše populacije vzamemo manj, za večje pa več razredov. V našem primeru smo resnično dobili s štiridesetimi razredi ne¬ pregledno, s petimi razredi pregrobo sliko o porabi lesa, medtem ko je frekvenčna po¬ razdelitev z desetimi razredi pokazala vse značilnosti gostitve. 7.2 Frekvenčne porazdelitve z neenakimi razred ij. Čeprav je iz tehničnih razlogov najbolje, da so vsi razredi v frekvenčni porazdelitvi enako široki, včasih iz vsebinskih razlogov sestavljamo frekvenčne porazdelitve, v katerih so razredi različno široki. Vzemimo za zgled industrijska podjetja! Če ima eno podjet¬ je 10, drugo pa 50 zaposlenih, je med njima večja vsebinska razlika kakor pa med pod¬ jetjema s 1 000 in 1040 delavci, čeprav je v obeh primerih razlika 40 delavcev. Zato industrijska podjetja po številu delavstva prikazujemo v frekvenčni porazdelitvi z raz¬ ličnimi širinami razredov. - 188 - Tabela 7.5 Industrijska podjetja v SFRJ v letu 1970 po poprečnem številu zaposlenih (Vir: SG 72) 2374 = N Iz tabele 7.5 vidimo, da se meje razredov vrste v približnem geometrijskem zaporedju z razmerjem k =2 ; to pa je v skladu z relativno primerljivostjo števila delavstva po podjetjih. 7.3 V frekvenčnih porazdelitvah z enakimi razredi so razlike med frekvencami pred¬ vsem izraz različne stopnje gostitve v posameznih razredih. V frekvenčnih po¬ razdelitvah z neenakimi razredi pa je frekvenca v danem razred u odvisna razen od go¬ stitve tud! od širine razreda.. Pri isti stopnji gostitve imajo širši razredi večjo., ožji ra¬ zredi, pa manjšo frekv enc o. Da iz frekvence odstranimo vpliv različne širine razredov in prikažemo samo stopnjo gostitve, izračunavamo po obrazcu (£) / i' ®9b' P ‘d ( 21 '} i . ‘1 ■ v f ; 9 k = f l/'k (7,1) gostoto frekvence g^ ; ta pokaže, koliko frekvence v razredu odpade na enotin razmik. Za vsako frekvenčno porazdelitev moremo izračunati strukturne deleže; ti pokažejo, ko¬ liki del celotne populacije je v posameznem razredu. Strukturne deleže, ki jih dobimo, če frekvence f^ delimo z obsegom populacije N, imenujemo relativne frekvence f k - v? - 18 S*? - /ttoefG V C« (7.2) Kakor iz frekvenc računamo gostoto frekvence, tako moremo po obrazcu ‘Fk" 9 ” = f k /! k = f / N,! k P* 3 ) izračunati tudi gostoto relativne frekvence če relativno frekvenco de lir no razreda. Iimo s siri — Iz obrazca 7.3 zlahka dobimo, da je f k = N - ! k- prikazanem pojavu. Iz nje po¬ dobno kakor iz frekv enč ne porazdelitve neposredno vidimo, v kakšnih mejah variira populacija, ker kaže podatek (2244 din), ki je prvi po rangu, najmanjši promet,oni,ki je zadnji po rangu, pa največji promet na malo (49433 din). daje o posameznih enotah dodatno informacijo, katere osnovna vrednost znaka - v na¬ šem zgledu poprečen promet v občini, ne daje. Če npr. za občino Nova Gorica vemo, do je bil poprečen promet na drobno v letu 1971 12039 din, iz tega podatka ne more¬ mo sklepati, ali je to malo ali veliko. Če pa dodatno povemo, da je v ranžirni vrsti - 204 - Tabela 8.2 Ranžirna vrsta za občine v SR Sloveniji za promet na drobno na prebi¬ valca v letu 1971 60 občin, občina NovaJjorica pa 56- po rangu, sklepamo, da je ta poprečen promet za Slovenijo razmeroma velik, ker imajo od 60 občin samo 4. občine večji promet na prebivalca, 55 občin pa manjšega. Ikvantilni RANG j 8.2 Hiba ranga je v tem, da'*moramo poleg ranga navesti še skupno število enot po¬ pulacije, če hočemo, da rang pokaže mesto enote v populaciji. Občina, ki je 56. po rangu, je npr. za populacijo s 60 enotami občina z razmeroma velikim prome¬ tom. Če pa je neka občina 56. po rangu v ranžirni vrsti za vseh 500 občin v SFRJ,pa - 205 - bi bil Ki podatek razmeroma majhen, ker bi imelo 444 občin večji promet. Rang R po¬ kaže torej mesto enote v populaciji šele, če ga primerjamo z obsegom populacije N. Zato je primerneje, da izračunamo mesto enote v populaciji namesto z rangom R s kvantilnim rangom P. Tega dobimo, če primerjamo rang R z obsegom popula¬ cije N. Kvantilni rang v relativnem številu pove, na katerem delu celotnega ranžirne¬ ga razmika leži določena enota oziroma koliki del celote ima manjše vrednosti kakor je dana vrednost. 8.3 Teoretično vzamemo, da je ranžirni razmik zvezen in vsakemu rangu pripišemo razmik.polovico enote na levo in desno. Po tej predpostavki se ranžirni razmik začne z 0,5 (spodnja meja razmika, ki ustreza rangu 1) in konča z N+ 0,5 (zgornja meja razmika, ki ustreza rangu N). Ker se skala kvantiInih rangov P začne z 0 in kon¬ ča z 1, je zveza med rangom R in kvantilnim rangom P dana z obrazcem R NP + Če je P = 0, je R = 0,5, če pa je P = 1, je R = N + 0,5 ( 8 . 1 ) Iz gornje zveze dobimo, da velja tudi _ R - 0,5 * ~ N (8.2) Če vzamemo naš zgled o prometu na drobno v Novi Gorici z rangom R =56 in N = 60, dobimo po obrazcu p= 56 ~ °'. 5 - = 0,93 60 ' Kvantilni rang P = 0,93 pove, da ima 0,93 del celotne populacije občin manjši popreč-_ ni promet na prebivalca kot občina Nova Gorica. Iz zgleda vidimo, da kvantilni rang P sam zase, ne da bi navajali obseg populacije, nazorno prikaže mesto določene enote . v populaciji. KVANTIH 8.4 Z obrazcem 8.1 in 8.2 moremo reševati dva različna problema. :/■ Za posamezno enoto populacije moremo določiti mesto enote v populaciji, če - 206 - izračunamo vrednosti y ustrezen kvantiIni rang P . Kvanti Ini rangi so torej značilno¬ sti posameznih enot. Moremo pa analogno reševati tudi drug problem. Če se vprašamo, kakšna vrednost y^ ustreza npr. kvanfilnemu rangu P =0,50, vrednost, ki jo dobimo, ne označuje posa¬ mezne enote, marveč je značilnost za populacijo. y_, ki ustreza danemu kvanfilnemu • —L--- — ~ rangu P, imenujemo kvanti I . Kvcntil y^ je npr. vrednost, od katere ima polo¬ vica enot populacije manjše, polovica pa večje vrednosti. Ta vrednost je vsekakor va¬ žen parameter populacije in jo imenujemo mediana . ■Me = y P =0.50 (8.3) Kvanfili Yq 2 y Yq 50 ' n Yq 75 s0 vreciri0sf '' ^i razdale populacijo v štiri dele tako, da je pod y Q 25 , med ^ in y 0 ^ 5Q , med y Q5Q in y 0(75 in nad y Q75 po četrtina po velikosti urejenih vrednosti populacije. Te vrednosti, ki razd e le populacijo v štiri po obsegu enake dele, imenujemo kvartile in zaznamujemo z Q, y P=0.25 ; Q 2 y P=0.5o ' Q 3 y P=0.75 Podobno z de c i I i D 1 y 0,10 ' °2 =y 0,20.°9 =y 0,90 ^ 8,5) ' /f h- _~ razdelimo celotno populacijo v deset po obsegu enakih delov, j Jc e n j t l i s =v 0, 01 ^2~ y 0,02 . C 98 _y 0,P8 lri C ?9 ~ y 0,99 'f pa v sto po obsegu enakih delov. Z vrsto kvanti lov'prikažemo gostitev vrednosti populacije vendar drugače kot s frek¬ venčno porazdelitvijo. V frekvenčni porazdelitvi z enakimi razredi se glede na gosti¬ tev pojava menja frekvenca v razredih, s kvantili pa razmejimo razrede, v katerih so frekvence enake: N/4 pri kvantilih, N/10 pri decilih in N/100 pri centilih, od stop¬ nje gostitve pojava pa je odvisna širina razredov oziroma razmiki med zaporednimi kvan¬ tili. - 207 - Preračunanje kvantilov iz negrupiranih podatkov 8.5 Ker predpostavijarno, da je rong zvezna količina, moremo določiti range zo vsa¬ ko vrednost med najmanjšo in največjo vrednostjo v populaciji in ne samo za po¬ jo. Tako npr. menimo, da ustreza v našem zgledu rangu 12,5 kot kvantil sredina med vrednostjo za rang 12 in 13: (4068 + 4135) : 2 = 41 01,5 din Če predpostavljamo zveznost rangov, izračunamo iz ranžirne vrste za poljubno vred¬ nost y med najmanjšo y in največjo vrednostjo populacije y^ ustrezni kvoptiI- ni rang po naslednjem postopku: a) Imamo ranžirno vrsto vrednosti enot populacije. b) V ranžirni vrsti poiščemo, med kateri vrednosti y^ in y, pade vrednost y, za kate¬ ro iščemo P , tako da velja: v^^. y n R} ustrezata vrednosti y Q in y^. d) Iz teh podatkov izračunamo z linearno interpolacijo kvantil y po obrazcu: y p = y o + _y o ) • (R P _R 0 ) (8 - 10) V tabeli 8.3 je nakazano računanje decilov za promet v trgovini na drobno na prebi¬ valca po občinah v letu 1971 iz ranžirne vrste v tabeli 8.2 Tabela 8.3 Izračunanje decilov za promet na prebivalca v trgovini na drobno v SR Sloveniji v letu 1971 Rp dobimo po obrazcu: Rp = 60.0,1 . i + 0,5 - 6.i + 0,5 - 209 - Slika 8.1 Ranžirna vrsta za promet na prebivalca v trgovini na drobno v SR Sloveniji v letu 1971 po občinah o o o jjSSoopgtf no«|fo 8 004— o a —flpoa. V sliki 8.1 so z "o" narisane vrednosti o prometu na drobno na prebivalca, nakazana je frekvenčna porazdelitev, decili in kumulativna vrsta frekvenc, ki posreduje preslika¬ ve vrednosti y v kvantilne range in obratno preslikave kvantiInih rangov P v kvanti le y p. 8.7 V sliki 8.1 imamo v grafikonu za promet na prebivalca v trgovini na drobno v SR Sloveniji po občinah vrisano ranžirno vrsto tako, da je abscisa vrednost podatka, ordinate pa ustrezni rang. Točke predstavljajo osnovno ranžirno vrsto, lomljena črta,ki veže točke, pa linearno interpolacijo za vmesne vrednosti. V grafikonu je razen skale rangov vrisana tudi skala kvantilnih rangov P, za katero je nazorno vidno, da se na ska¬ li rangov začne z 0.5 in konča z N + 0,5. 8.8 Rang grafikon Rang grafikon je kombinacija ranžirne vrste in frekvenčne - - — - - • _ porazdelitve. V njem so enote razvrščene po velikosti od največje do najmanjše vrednosti v tako ozkih razredih, da moremo zadosti dobro določiti tudi posamično vred¬ nost. V našem zgledu je vsaka občina označena s tremi črkami, v načelu s prvimi tremi črkami imena občine, če pa je ime občine sestavljeno iz več besed pa iz začetnic vseh besed imena vendar tako, da skupno ne presega treh črk. Vsaka občina je obeležena tu¬ di z zaporedno številko po velikosti urejenih enot - z rangi. Tako moremo za vsako ob¬ čino odbrati rang in približno velikost podatka. Tako je npr. občina Piran (oznaka PIR) po prometu v trgovini na drobno na sedmem mestu med vsemi šestdesetimi občinami v SR Sloveniji in ima v letu 1971 med 9500 in 9750 din prometa na prebivalca. Ker je N =60 občin, je prvi kvartil med 15. in 16. občino (med poprečjem za Tolmin in Trbovlje), da¬ lje je promet med Ribnico in Ilirsko Bistrico enak mediani za promet na drobno na prebi¬ valca ipd. Levo od skale sov ustrezne razrede vnešeni tudi poprečni podatki za posa¬ mezne republike in SFRJ skupno. Tako moremo napraviti tudi primerjave občinskih podat¬ kov z republiškimi poprečji. Tak poprečen promet v trgovini na drobno na prebivalca, kot je približno v poprečju za SFRJ, imajo občine: Ljubijana-Moste, Žalec, Laško, Kr¬ ško in Gornja Radgona. Enako sklepamo, da ima tri četrtine občin poprečje večje kot je jugoslovansko poprečje in le enq četrtina večje kot je poprečje za SR Slovenijo.Sklad¬ nost tretjega kvartila s poprečjem za SR Slovenijo je izraz velike asimetrije proučevane porazdelitve. Ker je informacija za vsako občino na ustreznem mestu dana z istomestno oznako: dvomesten rang, črtica, tromestna oznaka občine, daje rang grafikon kot celota - 211 - din/preb 50000 40000 16000 15000 14000 13000 12000 11000 01-LJC 02- SEŽ 03- K0P 04- CHL 05-UGo 06-LjB SLO HKV Voj S'£2J OSr SH ČGr MAK BIE KOS 10000 9750 9500 9250 9000 8750 85OO 8250 8000 7750 7500 7250 7000 6750 6500 6250 6000 5750 5500 5250 5000 4750 4500 4250 4000 3750 3500 3250 3000 2750 2500 2250 2000 1500 07- PIR 08- HAD 09- iiAH 10- IZ0 11-LjŠ 12-JES 13-KBA 14-POS 15-TOL 16- TRB 17- VSL 18-KOC 19-TBŽ 20r-ŠLo 21-BRB 22-I.3T 23-HLIe 24-AJD 25-SGr 26- DCM 27- IBR 28-VRH 29-KAM 30-RIB 31-IBi 32-PTO 33-j.ISo 34-LOG 35-RAV 36-HRA 37-nOZ 38-LJU 39-ZAG 40-DRA 41- CZR 42 - LjM 43-ŽAL 44-LAŠ 45-KRŠ 46-GRA 47-SK0 48-SBi 49-CRK 50-RJB 51-THE 52-LJV 53-SEV 54-LEN 55-LIT 56-ŠMA. 57- GRO 58- OBK 59- LRT 60 - šTj Slika 8.2 Rang grafikon prometa na prebivalca v trgovini no droorio v SR Sloveniji po občinah v letu 1971 - 212 - vtis histograma. Razen nakazanih informacij o poprečnem prometu moremo iz rang gra¬ fikonov dobiti še druge informacije, ki so kombinacija naziva, ranga in vrednosti podat¬ ka za posamezno enoto. Računanje kvantilnih rangov in kvantilov iz frekvenčnih poraz¬ delitev 8.9 Če je populacija, ki jo proučujemo, obsežna, je razvrščanje vrednosti v ran¬ žirno vrsto neprikiadno. Za obsežne populacije pa moremo izračunati približ¬ ne vrednosti kvantilnih rangov in kvantilov iz kumulativnih frekvenčnih porazdelitev. Če vemo, kaj pomenijo členi v kumulativni vrsti, spoznamo, v kakšni zvezi je kumulativna frekvenčna porazdelitev z rangi. Proučimo frekvenčno porazdelitev o porabi lesa v 149 kmetijskih gospodarstvih v Novem mestu iz tabele 7.3. Iz nje vidimo, da ima frekvenčna porazdelitev nekatere lastnosti ranžirne vrste. V ranžirni vrsti so vrednosti, ki leže levo od dane vrednosti, manjše,des¬ no po večje. V frekvenčni porazdelitvi so vse vrednosti enot v danem razredu večje od vrednosti v vseh spodnjih razredih in manjše od vrednosti v vseh zgornjih razredih. Tudi v frekvenčni porazdelitvi so torej vrednosti razporejene po velikosti, le da je ranžiranje izvedeno med razredi, ne pa znotraj razredov. Iz kumulativne frekvenčne porazdelitve moremo celo približno ugotoviti, katere vred¬ nosti ustrezajo določenim rangom. Če preučimo kumulativno frekvenčno porazdelitev v tabeli 8.4, moremo iz nje sklepati tole: Tabela 8.4 Kumulativna frekvenčna porazdelitev o porabi lesa v letu 1953 za 149 kmetijskih gospodarstev v okraju Novo mesto 149 “ N - 213 - 3 Dvoje kmetijskih gospodarstev je porabilo manj kot 4,0 m lesa. Če vzamemo, do ima gospodarstvo z največjo porabo v tem razredu v približku porabo enako tej meji, je go- 3 spodcrstvo, ki ima rang 2, porabilo 4,0 m . Iz kumulative dalje izvemo, da je 18 go- 3 x spodarstev porabilo pod 8,0 m .Če vzamemo, da je največja poraba v teh 18 gospodar™ 3 stvih enaka tej meji, dobimo, da ima gospodarstvo, ki je porabilo 8,0 m lesa, rang .18 itd. Iz frekvenčne porazdelitve sklepamo, da imajo gospodarstva, ki so porabila to¬ liko kot so spodnje meje razredov, range enake ustreznim vrednostim v kumulativni vr¬ sti. Če to upoštevamo, moremo sestaviti tabelo, ki je zelo podobna ranžirni vrsti, le da so rangi d ani šo tno za meje razredov. Tabela 8.5 Okrnjena ranžirna vrsta za porabo lesa v 149 kmetijskih gospodarstvih v okraju Novo mesto. (Dobljena iz kumulativne vrste v tabeli 8.4) Rang R 2 18 54/ 95 124 136 143 147 149 v v . 4,0 8,0 12,0 16,0 20,0 24,0 28,0 32,0 36,0 'R min r - Ker za druge enote v ranžirni vrsti ne poznamo vrednosti, predpostavljamo, da so vred¬ nosti znotraj razredov razmeščene enakomerno. Tako dobimo vrednosti drugih enot v ran¬ žirni vrsti z linearno interpolacijo. Grafikon kumulativne frekvenčne porazdelitve v sli¬ ki 8.3. ponazarja približen odnos med rangom R in vrednostjo znaka y. Ker tudi pri grafičnem prikazu predpostavljamo enakomerno razporeditev vrednosti znotraj razredov, so točke zvezane z daljicami. Ker je kumulativna frekvenčna porazdelitev nadomestek za ranžirno vrsto, računamo iz nje kvantiIne range in kvantile podobno kakor iz ranžirne vrste. 8.10 Oceno kvantilnega ranga P izračunamo po naslednjem postopku: —’ .... y _ — a) Iz frekvenčne porazdelitve izračunamo kumulativno frekvenčno porazdelitev F^. b) Poiščemo, v kateri razred pade vrednost y za katero iščemo kvantilni rang P^. Ta razred imenujemo kvantilni razred in ga zaznamujmo z o . Zanj izpišemo iz frekvenč¬ ne porazdelitve ustrezne vrednosti: y . , i , f , r . 'o,mm ooo c) Iz gornjih vrednosti izračunamo vrednosti y ustrezni rang po obrazcu: - 214 - ( 8 . 11 ) y ~y. R = F + f y o o i d) Iz dobljenega ranga pa izračunamo kvantilni rang po obrazcu: R - 0,50 P = —1 t-r-. - (8.12) / N ' Če je obseg populacije N velik, iz obrazca 8.12 običajno izpuščamo 0,5, ker je ta količina za velike populacije nebistvena. Postopek velja tudi za frekvenčne porazdelitve z različnimi širinami razredov. 8.11 Če za populacijo o porabi lesa iz tabele 8.4 iščemo kvantilni rang za gospodar- 3 stvo, ki je v letu 1953 porabilo y =13,8 m lesa, izračunamo P po zgornjem 3 7 postopku takole: Poraba lesa y = 13,8 m pade v razred 12,0-15,9. Iz tabele 8.4 od¬ beremo: y . =12,0; i =4; f =41; F = 54; o,mm o o o Če vstavimo te podatke v obrazec 8.11, dobimo: r = 54 + 41 - 13, 8 " 12, °- - =72,4 y 4 in dalje po obrazcu 8.12: p = 22,4 - 0,5 q 402 P y =13,8 149 Gospodarstvo s porabo y = 13,8 m lesa je v 48. centilu. 8.12 Podobno računamo iz frekvenčne porazdelitve tudi kvantlle, Postopek je naslednji: a) Iz frekvenčne porazdelitve izračunamo kumulativno frekvenčno porazdelitev F^. b) Iz danega P izračunamo ustrezni rang Rp po obrazcu R p = NP + 0,5 (8.12) - 215 - Če je populacija velika, v obrazcu 8.13 izpusrtmo 0,5. c) V kumulativni frekvenčni porazdelitvi poiščemo, med kateri vrednosti kumulativ¬ ne vrste pade R, tako da je: F Si R n < F, . F ustrezen razred je kvantilni razred. r ' o P I o 1 Zanj poiščemo v frekvenčni porazdelitvi količine: y . , i , f in F . o,min o o o d) Iz teh količin izračunamo ustrezni kvantil po obrazcu: y =y . + i - 'P o,min o R p' F o (8.13) Enako kot za kvantiine range velja nakazani postopek tudi za frekvenčne porazdelitve z različnimi širinami razredov. 8.13 Da za naš zgled izračunamo kvartile, je najbolje, da sistematično izračunamo v računski tabeli vse tri kvartile hkrati. Tabela 8.6 Izračunavanje kvartiiov za porabo lesa v 149 kmetijskih gospodarstvih v okra¬ ju Novo mesto.. 8.14 Podobno kakor v sliki 8.1 za negrupirane podatke, moremo grafično ocenifi vse zgornje količine iz grafikona kumulativne vrste. V sliki 8.3 je nakazano, kako dani vrednosti y = 13,8 m^ poiščemo ustrezni kvantilni rang in obratno: kako moremo grafično oceniti kvartile. 8.15 V praksi večkrat izdelujemo decilne ali centilne norme, $ katerimi dobimo nepo¬ sredno zvezo vrednosti znaka z decili oziroma pri podrobnejših normnih tablicah - 216 - s centili. Centilne norme s pridom uporokl|'qi»o v psihologiji, moremo pa jih izdelati tudi za določene socialno-ekonomske probleme. Tako tablica decilnih ali centilnih norm o produktivnosti delo pomaga presoditi, kakšna je produktivnost dela za posamez¬ nega delavca v razmerju s celotnim kolektivom itd. Slika 8.3 Grafično ocenjevanje kvantilnih rangov in kvantilov iz slike kumu¬ lativnih frekvenčnih porazdelitev za porabo lesa v 149 kmetijskih gospodarstvih v Novem mestu v letu 1953 -217, \ / * . DEVETO POGLAVJE SRED N JE VRED NOST I 9.1 Frekvenčne porazdelitve za homogene populacije (glej stike 7.3, 7.6, 7.7) ka¬ žejo posebno razporeditev vrednosti za populacije. Vrednosti za re populacije se goste okrog nekega središča, od katerega se odklanjajo navzgor in navzdol. Odkloni posameznih vrednosti od tega središča so najpogosteje majhni. To središče, ki predstavlja vrednosti populacije, je značilno za populacijo in ne za posamezne enote in se menja, če se menjajo okoliščine, ki opredeljujejo populacijo. Če primerjamo za določeno stroko frekvenčne porazdelitve za dohodke za visoko kvalificirane, kvalifici¬ rane in preučene delavce, opazimo, da so središča - srednje vrednosti za posamez¬ ne populacije različna. Dohodki-za visoko kvalificirane delavce se goste najvišje, dohod¬ ki kvalificiranih delavcev nižje in dohodki priučenih delavcev najnižje. Ta sredi¬ šča so torej za posamezne populacije določene z opredeljujočimi pogoji populacije, ti pa so za vse enote enaki. Če bi na dohodek za posameznega delavca vplivala samo kva¬ lifikacija, bi imeli vs! delavci z enako kvalifikacijo enake dohodke. Zaradi drugih - posamičnih vplivov, ki so za vsakega delavca različni, pa se dohodki odklanjajo navzgor in navzdol od dohodkov, ki so pogojeni s kvalifikacijo. Čim manjši so posamični vplivi, tem bolje srednja vrednost predstavlja vrednosti popula¬ cije in obratno: čim večji so posamični vplivi, tem slabše srednja vrednost predstavlja vrednosti populacije. Zato je srednja vrednost predstavnik vrednosti v populaciji le,če je populacija enovita. - 217 - Vrste srednjih vrednosti 9.2 Parametrov, ki pokažejo osrednjo težnjo vrednosti populacije, poznamo več. Od teh so v socialno-ekonomski statistiki pomembne naslednje srednje vredno¬ sti: a) m e d i a n a, - Me >—' b) m o d u s , - Mo — c) aritmetična sredina, -M d) harmonična sredina, - H e) geometrijska sredina, -G Medtem ko sta mediana in modus dana z lego vrednosti, štejemo aritmetično, harmo¬ nično in geometrijsko sredino med izračunane srednje vrednosti. 9.3 Za srednjo vrednost more dobro rabiti mediana, ki jo poznamo že iz poglavja o kvantilih. Mediana je vrednost, ki ustreza kvantilnemu rangu P = 0,50, Me = y p= - 50 Mediana je uporabna srednja vrednost, ker nujno leži sredi posamičnih vrednosti. Po opredelitvi ima namreč polovica enot manjše, polovica pa večje vrednosti kakor je mediana. Določanje mediane ne bomo obravnavali posebej, ker se sklada z določanjem kvanti- lov na splošno. Te pa smo obravnavali že v odstavku o kvantilih. 9.4 Lastnosti med ione, Prednost mediane je predvsem v tem, da je lahko ra¬ zumljiva srednja vrednost in zato kot opisni parameter priporočljiva. Velika prednost mediane pred izračunanimi sredinami je tudi ta, da za določanje mediane ni nujno, da poznamo vrednosti za vse enote Dopulacije. Zadosti je, da poznamo vredno¬ sti za enote, ki leže okoli sredine v ranžirni vrsti. Ta lastnost mediane pride posebno prav, če iščemo srednje vrednosti za frekvenčne porazdelitve, ki imajo odprte razrede. - 220 - Za odprte razrede namreč dostikrat niti priblii.no ne vemo, kakšne vrednosti vsebujejo, ker so omejeni samo navzgor ali samo navzdol. Mediana je primerna srednja vrednost rudi tokrat, če so skrajne vrednosti take, do sumimo, ali sploh sodijo v homogeno popula¬ cijo, ker so mogoče izraz nekih drugih kakovosti. Pomanjkljivos t mediane pa je v tem, da je le preveč neobčutljiva za spremembe vrednosti in se njena vrednost ne spremeni vse dotlej, dokler so spremembe take, da vrednosti ne preidejo iz ene polovice v drugo. Pomembna iastnost mediane je tudi, ca je vsota absolutnih odklonov posameznih vredno¬ sti najmanjša, če odklone računamo od mediane. Mediana je torej sorazmeroma dober predstavnik posameznih vrednosti N ][ I y. “Al = min ; če je A = Me (9.1) i = 1 ' I MODUL f 9.5 Mediana po ni vedno dober predstavnik vrednosti populacije. Za asimetrične ali poii- modalne porazdelitve je mediana vrednost, ki je različna od večine vrednosti v populaciji. Če naj bo srednja vrednost predstavnik populacije, je v takih primerih veliko primerneje, da vzamemo za sredino vrednost, okrog katere se vrednosti populacije najbolj goste. Če pogledamo poligone frekvenčnih porazdelitev, moremo za vsako frekvenčno porazdelitev zlahka ugotoviti približno mesto največje gostitve. Vrednost, okrog katere se vrednosti po¬ pulacije najbolj goste, imenujemo modus ali na j p o g os te j šo vrednost. Modus moremo ugotoviti samo za razmeroma obsežne populacije, ki so grupirane v frek¬ venčni porazdelitvi. Iz posamičnih podatkov je modus neposredno nemogoče ugotoviti. Če imamo frekvehčno porazdelitev dano s frekvenčno krivuljo,poiščemo modus enostavno. V tem primeru je modus abscisa tisre točke na frekvenčni krivulji, za katero je ordinata (gostota frekvence) največ ja." 9.6 \Računanje modusa Iz frekvenčne porazdelitve*^ Za populacije običajno nimamo frekvenčnih krivulj, temveč frekvenčne porazdelitve, ki jih mo- - 221 - remo narisati v histogramu. Ker histogram nakaže približno obliko frekvenčne krivulje, moremo tudi iz frekvenčne porazdelitve oziroma histograma sklepati, kje je gostota frek¬ vence največja. Iz histograma za frekvenčno porazdelitev z enakimi razdeli sklepamo, da je modus v razredu, v katerem je frekvenca največja. Za porabo leSa v 149 kmetijskih gospodarstvih v letu 1953 v Novem mestu iz tabele 7.3 sklepamo, da je najpogostejša •vrednost v razredu od 12,0 do 15,9 m lesa. Kot prvi približek modusa vzamemo kar sre¬ dino razreda z največjo frekvenco - sredino modalnega razreda. V našem zgledu je prva le, če je porazdelitev simetrična. Drugače leži modus nad sredino razreda ali pod njo, odvisno od oblike frekvenčne porazdelitve. Natančnejšo oceno za modus dobimo, če upoštevamo tudi frekvence v sosednih razredih. Iz histograma o porabi lesa v sliki 7.1 sklepamo, da je modus za porabo lesa verjetno 3 pod sredino modalnega razreda s sredino 14 m . Ker je frekvenca pred modalnim razre¬ dom večja kot frekvenco za modalnim razredom, bi bila frekvenčna krivulja, ki bi jo na- črtoli med stolpce histograma, nagnjena proti razredu z višjo frekvenco. Predpostavimo, da je v okolici modusa frekvenčna krivulja v približku parabola druge stopnje, ki gre skozi točke s koordinatama (y_^ . f_^), (y . f^ ) in (y + ^ . f + ^ ). Pri tem pomenijo y y^, y + .| sredine modalnega .razreda in njegovih sosedov, f_j, f Q in f + ^ pa ustrezne frekvence. Pri tej predpostavki izračunamo modus po naslednjem postopku: a) Podatke imamo grupirane v frekvenčni porazdelitvi z razredi z enako širino i. Razre¬ di morajo biti tako veliki, da frekvenčna porazdelitev izraža zakonitost gostitve frek¬ venc . b) V frekvenčni porazdelitvi poiščemo razred z največjo frekvenco f_^ < f^ > f + ^ . Raz¬ red z največjo frekvenco (o) imenujmo modalni razred. c) Modus izračunamo po obrazcu f M =y . + i - o 'o.min 2r -f,-f -1 '+1 (9.2) Pri tem pomeni razen že navedenih izrazov: y. . = spodnja meja za modalni razred. v,min 9.7 Za zgled o porabi lesa v 149 kmetijskih gospodarstvih v letu 1953 v Novem mestu je od treh porazdelitev, ki smo jih sestavili, za izračunavanje modusa prikladna porazdelitev, v kateri je razredna širina i = 4 m .V porazdelitvi z i = 1 m se zako- 3 nitost gostitve še ne kaže, v porazdelitvi z i = 8 m pa je zaradi prevelike širine razre¬ dov zakonitost gostitve že zabrisana. Iz frekvenčne porazdelitve v tabeli 7.3 sklepamo, da je modalni razred razred 12,0 - 3 15,9 m , ker ima največjo frekvenco (f = 41). Ker je za to porazdelitev f , = 36, f, . = 29 ; i = 4 ; y . = 12,0, je modus po obrazcu 9.2 -1 +1 ' o.min Mo =12,0 + 4 •- 2 -^ 1 -"" 3 ^ — 29 - = 13 ' 18 * Kot smo pričakovali, je druga ocena za modus Mo 3 3 : 13,18 m pod prvo oceno 14,0 m . 9.8 Modus pa moremo ob istih predpostavkah zelo enostavno oceniti iz histograma za frekvenčno porazdelitev tudi grafično. Kakor kaže slika 9.1, zvežemo v histogramu Slika 9.1 Grafična določitev modusa iz frekvenčne porazdelitve za porabo lesa v 149 kmetijskih gospodarstvih v Novem mestu - 223 - oglišče A s C, oglišče B z D. Projekciji seiišČo obeh veznic E na abscisi je ocena mo¬ dusa Mo. Slika pokaže, da grafičen način aa isti rezultat kakor račun. 9.9 Lastnosti modusa. Modus je srednja vrednost, ki dobro predstavlja vrednosti za populacijo, ker je že po opredelitvi vrednost, ki se v populaciji najpogosteje pojavlja. Enako kakor mediana je modus srednja vrednost, ki je dana z lego vrednosti po¬ pulacije. Zato je tudi modus neobčutljiv za spremembe vrednosti posameznih enot vse dotlej, dokler gostitev na nekem drugem mestu ne prekorači stopnje gostitve v modusu. To moremo šteti za dobro lastnost modusa, ker ni odvisen od vrednosti, ki za populacijo niso tipične, more pa biti tudi hiba, ker je modus le pre malo odvisen od posamičnih vred¬ nosti . Nehomogena populacija more imeti tudi več mest gostitve. Bimodalne porazdelit¬ ve imajodva, polimodalne porazdelitve pa celo več središč gostitve. Take porazdelitve imajo torej dva ali več relativnih - lokalnih modusov. Od teh pa je abso¬ lutni modus tisti, za katerega je gostitev največja. Relativne - lokalne moduse ocenjuje¬ mo enako kot moduse za unimodalrie porazdelitve. Pojem modusa uporabljamo včasih že pri zbiranju statističnih podatkov in ne samo pri ob¬ delavi. Tako pri registriranju cen na tržišču upoštevamo modus cene, to je ceno, po ka¬ teri je na tržišču na prodaj največ blaga. ARITMETIČNA SREDINA 9.10 Opredelitev . Izmed vseh srednjih vrednosti je najbolj znana in uporabljana aritme¬ tična sredina ali poprečje. Aritmetično sredino M dobimo, če delimo vsoto vred¬ nosti vseh enot v populaciji z obsegom populacije. Z obrazcem moremo to izraziti M y = Tl ^1 + + + >W £ y i = TT (9 ‘ 3): Pri tem pomeni^ M^ = aritmetična sredino. Znak M^ včasih zamenjamo z znakom y (y prečna) ; f y,=Y = vsoto vseh vrednosti v populaciji; L = splošen znak za seštevanje i=l ' izraza, ki stoji za njirrv y. = posamične vrednosti. Nakazane oznake uporabljamo na splošno. - 224 - 9.H Za zgled vzemimo podatke o številu izdelkov, ki jih je skupina desetih delavcev izdelala v eni izmeni. Če so posamični podatki: -d, a5, 42, 47, 39, 48, 32, 42, 44, 50, je poprečno število izdelkov po obrazcu 9.3 M = 38+ 35 + .+ 44+50 10 = 41.7 kosov Poprečno število M = 41,7 pove, da bi moral vsak delavec izdelati po 41,7 kosov, če bi hoteli, da bi bila skupna proizvodnja enaka stvarni. 9.12 4. a s t n o s t i a r i t m ejJ čji e sredine a) Aritmeti čna sredina je izpeljana ob predpostavki, da je vrednost y za posa¬ mezno enoto vsota rezultatov splošnih (M) in posamičnih vplivov (e) (9.4) Nadaljnja predpostavka je, da se rezultati posamičnih vplivov v vsoti uničijo N - , z ., ei '°' Če upoštevamo zgornji predpostavki in seštejemo vrednosti y, za celo populacijo,dobimo N N JT y.=N.M+ £e. = N.M i=l ' i=l Iz te enačbe dobimo, da je rezultat splošnih vplivov M - Y /N. To pa je aritmetična sredina. b) Aritmetična sredina za linearno zvezo iz več znakov ,u. l..~ r o ; ° =o o + £ =1 Vk je enaka linearni zvezi iz aritmetičnih sredin ( 9 . 5 ) - 225 - JJL u= °o + I. a k y k ; M u = V,£ a k M | (9.6) k= k*J Dokaz je dokaj enostaven. Če enačbo N u = I u. = £ (a o + Io^.)=a o N+ £a I y k; =° 0 N + I o k Y k k i k . , i - o f k' kT' o 1 = 1 i K ki jo dobimo, če seštejemo linearne enačbe 9.5 za vse enote populacije, delimo z obse¬ gom populacije N, dobimo zvezo 9.6. Kot poseben primer zveze 9.6 je M =a (9.7) a Poprečje konstante je enako konstanti in M, = b.M (9.8) by y poprečje znaka, pomnoženega s konstanto, je enako produktu konstante s poprečjem znaka. Vzemimo za zgled, da je skupni dohodek D delavca sestavljen iz osnovnega dela O, do¬ hodka iz rednega delovnega časa R, za katere je urni dohodek r, in izrednega dela, ki ga je opravljal P ur po urnem dohodku p D=0+ R.r+P.p Po gornjem stavku je poprečni dohodek na delavca Mp. = M + R M + PM Do r p c) Vsota odklonov posamičnih vrednosti y. od aritmetične sredine j e nič N L (y;-M) = o (9.9) Dokaz je preprost. Ker je vsota razlik enaka razliki vsot, spoznamo, da je Y,y. - N . M =0 - 226 - v skladu z opredelitvijo aritmetične sredine d) Vsota kvadratov odklonov posamičnih vrednosti y. od neke konstante A je najmanj ša, če je A enak aritmetični sredini M N SK = £ (y. - A ) : če je: A = M i=l (9.10) Dokaz: dSK dA Če naj bo izraz SK minimalen, mora biti = o aA - 2 Z(y. — A) = 0; I(y.-A)=£y.- NA=0; A=±£y. =M Ta lastnost zc aritmetično sredino je zelo važna za nadaljnje proučevanje populacij, iz vsote kvadratov odklonov od aritmetične sredine je namreč izpeljan poseben parameter, varianca , ki je najvažnejša mera jakosti za posamične vplive. e) Sumarno aritmetično sredino populacije M izračunamo iz aritmetičnih sredin del nih populacij z obsegi N^ po obrazcu M = t'* •/' f NM N,M,+ N,M,+ ...+ NM .L ' N k k 112 2 r r k=l N ] + N 2 + + N i N, H N k M k (9.11) Ta način za računanje aritmetične sredine imenujemo tehtano računanje za razliko od enostavnega računanja po obrazcu 9.3. Dokaz: Skupna vsota Y je enaka vsoti delnih vsot Y^ za y Y -w~ + v£ Y k Ker velja za skupno populacijo in delne populacije Y = NM^, je dalje: r -H? NM =N ] M 1 + N 2 M 2 + — + NM r = ), N k M k Če delimo to enačbo z N dobimo obrazec 9.11. Splošnejše moremo tehtan način za izračunanje aritmetične sredine pisati - 227 - M (9.12) Pri tem pomeni: = teža - ponder Računanje aritmetične sredine iz frekvenčnih porazdelitev 9.13 Neposredno računanje aritmetične sredine po osnovnem obrazcu 9.3 je za velike populacije zaradi velikega števila sumandov zamudno. Ker daje frekvenčna poraz¬ delitev približno sliko vseh vrednosti populacije, moremo aritmetično sredino oceniti iz frekvenčne porazdelitve. Če predpostavljamo, da sredina razreda y^ v frekvenčni porazdelitvi predstavlja vred¬ nosti v posameznem razredu, dobimo oceno za vsoto vrednosti v tem razredu, če sredino razreda pomnožimo s frekvenco f^. Oceno za vsoto vrednosti za celo populacijo pa do¬ bimo, če produkte f^y^_ za vse razrede seštejemo. Če to uporabimo, računamo oceno aritmetične sredine iz frekvenčne porazdelitve po obrazcu M y Vl +f 2^2 + •V + f /r f , + f 2 + — + f r ' r (9.13) Ta obrazec je samo posebna oblika splošnega obrazca 9.12 za tehtan način računanja aritmetične sredine. Pri tem so frekvence teže ali p o n d e r i.. Po obrazcu 9.13 dobljena ocena je tem boljša, čim ožji so razredi, vendar dobimo tudi pri razmeroma širokih razredih še vedno zadovoljive rezultate, če je frekvenčna porazde litev unimodalno in ne preveč asimetrična. Za zelo asimetrične porazdelitve, posebno za porazdelitve tipa J, pa daje tako računanje sistematično napačne ocene. C- razdelitev asimetrična v desno, dobimo sistematično prevelike ocene, pri asimetri|i v levo pa sistematično premajhne ocene. Računanje aritmetične sredine po obrazcu 9.13 velja za porazdelitve z enakimi in z ne¬ enakimi razredi. Ne moremo pa po tem obrazcu ocenjevati aritmetične sredine za frek¬ venčne porazdelitve z odprtimi razredi, ker zanje ne moremo izračunati sredine razre¬ dov. Če zo odprt razred poznamo razen frekvence f še vsoto vrednosti v odprtem razre- - 228 - (9.14) du Y , izračunamo oceno za aritmetično sredino po obrazcu VTT ( Vl + f 2 y 2 + •• + f r -lVl + Y r ) 9.14 Računanje ocene aritmetične sredine po neposredni metodi je v tabeli 9.1 nakaza¬ no za frekvenčno razdelitev za porabo lesa v letu 1953 za kmetijska gospodarstva v Novem mestu. Tabela 9.1 Računanje ocene aritmetične sredine za potrošnjo lesa v 149 kmetijskih go¬ spodarstvih v okraju Novo mesto v letu 1953 po neposredni metodi. Po obrazcu 9.13 je M = 2190/149 = 14,70 m^. „ . .... 3 Ce primerjamo dobljeni rezultat s pravo aritmetično sredino =2182,1/149 =14,64 m , izračunano iz osno/nih podatkov v tabeli 7,1, vidimo, da je razlika malenkostna. 9.15 Pomožni znak u. Za frekvenčne porazdelitve, ki imajo enake razrede, ra¬ čunanje aritmetične sredine poenostavimo, če vpeljemo namesto sredin razredov/k pomožni znak u^, ki je z osnovnim znakom y ^ v naslednji linearni zvezi: ' y k =y ° + u k j (9.15) Pri tem pomeni: y = sredina razreda, ki je približno v sredini frekvenčne porazdelitve - 229 - ali blizu razreda z največjo frekvenco, i * žirin« razreda. Če natančneje proučimo vrednosti znaka u, spoznamo, da sredinam razredov v posamez¬ nih razredih ustrezajo u ... - 3, -2, -1,0,+ l,+2,+3... Pri tem je vrednost u *= o v razredu, ki mu ustreza y^. Zaradi obrazca 9.13 in 9.6 pa velja M = y + iM (9.16) y 'o u Ta postopek je prikladnejši kakor neposredna metoda, ker poenostavi množenje. Po tem postopku izračunamo aritmetično sredino po tehle točkah. a) V dani frekvenčni porazdelitvi izberemo nekje v sredini ali v razredu, okoli katerega so frekvence največje, izhodišče za pomožni znak u. Glede na to poljubno izhodišče postavimo v posamezne razrede ustrezne vrednosti pomožnega znaka u ... -3, -2, -1,0, + l,+2,+3. b) Pomnožimo frekvence f^ z ustreznimi vrednostmi u^. Tako dobimo produkte f^u^. Vv c) Seštejemo dobljene produkte in vsoto L f, u, vnesemo v obrazec M = y + y 'o LT N <-• Vk (9.17) 9.16 Za porabo lesa v Novem mestu je izračunanje aritmetične sredine s pomožnim zna¬ kom u nakazano v tabeli 9.2. Tabela 9.2 Računanje ocene za aritmetično sredino za porabo lesa v 149 kmetijskih go¬ spodarstvih v okraju Novo mesto po metodi pomožnega znaka u. N = 149 2.fu = + 26 - 230 - Ker je / = 14,0, i = 4, N = 149 in Lfu =+26, dobimo po obrazcu 9.17 M y = 14,0 + 4 . (+ 26) = 14,70 m 3 Rezultat se sklada z rezultatom, ki smo ga dobili po neposredni metodi. 9.17 Metoda kumulativ t Če so podatki grupirani v frekvenčni porazdelitvi z ena¬ kimi razredi, aritmetično sredino enostavno izračunamo s kumulativami. Pri tej me¬ todi odpade vmesno množenje. Razen tega pa imamo kot postranski rezultat izračunano kumulativno frekvenčno porazdelitev; ta pa je važna sama zase ali za računanje kvanfi- lov. Po metodi kumulativ izračunamo aritmetično sredino po naslednjem postopku: a) Iz frekvenčne porazdelitve izračunamo iz f^ kumulativno frekvenčno porazdeli - tev F k . b) Seštejemo člene v kumulativni vrsti, razen zadnjega, ki leži pod črto, ki pomeni ob¬ seg populacije N. Vsoto členov iz kumulativne vrste zaznamujemo s C. c) Aritmetično sredino M y izračunamo iz dobljenih podatkov po obrazcu M y = y 0 -«■-£- (9 - 17) Pri tem pomeni: y Q = sredina zadnjega razreda v frekvenčni porazdelitvi; I = širina razreda; C = vsota členov v kumulativni vrsti; N = obseg populacije. Aritmetična sredina za porabo lesa v letu 1953 v Novem mestu je izračunana po metodi kumulativ v tabeli 9.3. - 231 - Tabela 9.3 Izročunanje aritmetične sredine za porabo lesa v 149 kmetijskih gospodar¬ stvih v letu 1953 po metodi kumulafiv. Ker je sredina zadnjega razreda = 34, dobimo po obrazcu 9.17 M y =34,0 - 4.719/149 = 14,70 m 3 Dobljeni rezultat se j klada z rezultatom, ki smo ga dobili po prejšnjih meitodah. Modificirana aritmetična sredina^ 9.19 Aritmetična sredina je odvisna od vseh vrednosti populacije. Zato nanjo vpliva jo tudi skrajne vrednosti, ki so včasih rezultat izjemnih okoliščin in jih ne moremo šte¬ ti, da sodijo v prikazano populacijo. Te vrednosti pačijo sliko populacije in tudi aritme¬ tično sredino populacije. Zato za take primere izračunamo s redino, k i je nekak kompro¬ mis med aritmetično sredino in mediano. Iz ranžirne vrste dobimo mediano, če postopoma paroma izpuščamo po en spodnji in en zgornji člen v ranžirni vrsti. Na koncu tega postopka ostane samo en člen - mediana,ali dva člena, katerih sredino štejemo za mediano. Kompromisna rešitev pa je v tem, da iz¬ puščamo po en zgornji in en spodnji člen le toliko časa, dokler ne izključimo vseh neti¬ pičnih vrednosti, iz ostanka pa izračunamo aritmetično sredino. Tako odstranimo vpliv skrajnih - izjemnih vrednosti, ki včasih občutno vplivajo na aritmetično sredino.Kljub - 232 - vsemu pa je tc sredina izračunana iz večine vrednosti populacije. Modificirano aritme¬ tično sredino dobimo torej tako, da iz ranžirne vrste posamičnih vrednosti odstranimo po en, dva ali več parov skrajnih - izjemnih vrednosti, iz ostalih pa izračunamo poprečje. Ta postopek uporabljamo pogosto pri analizi časovnih vrst. Zaradi izjemnih razmer v do¬ ločenih razdobjih nekateri podatki pačijo tipičnost aritmetične sredine. Če pa teh skraj¬ nih vrednosti ne upoštevamo in uporabimo modificirano poprečje, dobimo realnejšo sliko. Aritmetična sredina aritmetičnih sredin 9.20 Če poznamo aritmetične sredine M^ in obsege za delne populacije, ki se¬ stavljajo populacijo, iz teh podatkov izračunamo aritmetično sredino M za popula¬ cijo po obrazcu ^ N k M k M = - (9.18) č-^k Ta obrazec smo dokazali v odstavku o lastnostih aritmetičnih sredin. Lastnosti, da more¬ mo izračunati skupno srednjo vrednost, če poznamo ustrezne srednje vrednosti za deine populacije, nimata niti mediana niti modus. Pri obeh je treba iz delnih populacij sesta¬ viti skupno populacijo in iz nje poiskati mediano ali modus. Zgornje računanje za aritmetično sredino imenujemo tehtan ali ponderiran način, ker je iz delnih sredin izračunana skupna sredina tako, da upoštevamo velikost- težo ali ponder za posamezno delno aritmetično sredino. Obrazec 9,18 je po¬ seben primer splošnega obrazca za računanje tehtane aritmetične sredine M = . k .±. (9.19) R I w k Pri tem pomeni: = tehtana aritmetična sredina količin R^, posamezne vrednosti R^. V ponder-teža za 9.21 V tabeli 9.4 je nakazano računanje skupnih poprečnih mesečnih prejemkov de¬ lavcev v elektrogospodarstvu, če poznamo poprečne mesečne prejemke in skupno število delavstva po vrstah podjetij. - 233 - Tabela 9.4. Računanje skupnih poprečni" in&sečnih prejemkov zaposlenega osebja v pro¬ izvodnji, prenosu in distribuciji električne energije. Skupno lN k = 6097 1840 IM ^=41221257 Poprečni dohodek za stroko je K I N k M, 11221257 6097 = 1840 din Popolnoma nepravilno bi bilo, če bi izračunali navadno aritmetično sredino iz podatkov o mesečnih prejemkih po kvalifikaciji. Rezultat, ki bi ga dobili, M = 1/4 (2349+ 1736 + 2211 + 1738) =2008.5 je seveda različen od nav 1 zgornjega in brez logičnega smisla, medtem, ko pravo sumorno poprečje pove, kakšni bi bili prejemki delavcev v elektrogospodarstvu, če bi imeli vsi enake prejemke pri istem fondu dohodkov. Sumarna poprečja pa moramo uporabljati zelo previdno. V splošnem sumarne aritmetične sredine ne predstavljajo vrednosti v populaciji. Sumarno poprečje more biti celo vrednost, ki jo ima malo število enot. Vendar kljub hibam dostikrat izračunavamo sumarna popreč¬ ja, ki so, če jih pravilno tolmačimo, dobro sredstvo za analizo. HARMONIČNA SREDINA 9.22 Med izračunane srednje vrednosti štejemo tudi harmonično sredino, ki je po defi¬ niciji recipročna vrednost aritmetične sredine reciprokov iz osnovnih podatkov.Po - 234 - v* \ <■>< tej opredelitvi je harmonična sredina H enaka u.C ^ \ jiv:-— H = N 1 + _i_ ...+ _L y l y 2 y N Tehtana harmonična sredina pa podobno _ N ’ I? (9.20) w 1 + w 2 + + W r Z ^k _^i + v2.+ +Jli ~ y l y 2 y r ^ y k (9.21) 9.23 Če iz istih podatkov izračunamo aritmetično sredino in harmonično sredino, do¬ bimo različne rezultate. Za podatke 1,2,4,7,9, je ar itmetična sredina enaka 1 + 2+ 4+ 7+ 9 M =-j- = 4,6 , harmonična sredina pa H = i + i + _L + J_ + _L 1 2 4 7 9 = 2,5 Iz shematičnega zgleda vidimo, da so razlike znatne. Harmonično sredino uporabljamo redkeje kakor aritmetično. Kadar se vrednosti populaci¬ je porazdeljuje jo v asimetrični porazdelitvi, a tako, da je porazdelitev recipročnih vred¬ nosti simetrična, pa harmonična sredina bolje kaže osrednjo težnjo kakor aritmetična sre¬ dina. Zato v takih primerih aajemo prednost harmonični sredini. 9.24 S harmonično sredino računamo včasih tudi poprečja iz relativnih števil. Vzemimo, da je pet delavcev delalo po eno uro. Pri tem so dosegli naslednjo pro¬ izvodnost dela: 4,5,2,6,3 minute za en Izdelek. Proizvodnost dela merimo s časom,ki so ga potrebovali za izdelavo enega izdelka. Sumarni pokazovalec o produktivnosti dela za vseh pet delavcev dobimo, če skupno po- - 235 - rabljen čas delimo s številom proizvedenih izdelkov. Vseh pet delavcev je delalo skup¬ no 5.60 = 300 minut. Število izdelkov, ki jih je izdelal posamezen delavec, dobimo,če za vsakega delavca čas (60 minut) delimo s časom, ki ga je potreboval za izdelavo enega izdelka (pokazovalec produktivnosti dela). Za posamezne delavce dobimo po vrsti: 60/4=15; 60/5=12; 60/2 =30; 60/6 = 10; 60/3 =20. Skupno število izdelkov pa dobimo, če te podatke seštejemo. Poprečna produktivnost de¬ la je torej 5.60 300 „ , 60/4 + 60/5 ' +"60/2 + 60/6 ~+~6 0 73' = 17“ = 3 ' 45 m '" ut /‘ zdelek Iz računa vidimo, da smo izračunali poprečno proizvodnost dela s harmonično sredino. Če v gornjem računu krajšamo s ponderom 60, dobimo 5 T/m/5 + l/2 + l/6 + 'l/3 _ ' = 3 > 45 minut/izdelek Ker so ponderi med seboj enaki, dobimo isti rezultat, če vzamemo tehtano ali netehtano obliko, Če iz gornjih podatkov izračunamo aritmetično sredino, pa dobimo M = (4+5+2 + 6 +3) = 4. Preizkus pokaže, da harmonična sredina da pravi prezultat. Vseh pet delavcev, ki so de¬ lali skupno 300 minut, je izdelalo 87 izdelkov. Če bi vsi delavci delali s poprečno pro¬ izvodnostjo dela 3,45 minut za izdelek,bi napravili enako število 300/3,45 = 87 izdelkov. To pa je v sklodu z opredelitvijo poprečja. Če bi vseh pet delavcev delalo z enotno pro¬ duktivnostjo dela 4 minute za kos, ki smo jo dobili z aritmeti čno sredino, pa bi v skupno 300 minutah izdelali le 75 artiklov in ne 87, kolikor so jih v resnici. Podrobneje o uporabi harmonične sredine pri računanju poprečnih relativnih števil bomo zvedeli v naslednjem odstavku. - 236 - POPREČJA IZ RELATIVNIH ŠTEVIL 9.25 Problem računanja poprečij iz relativnih števil je za socialno-ekenomsko siatisti- ko tako osnoven in pomemben, da mu bomo posvetili poseben odstavek. Relativna števila sov splošnem kvocienti primerjanih količin. Če vzamemo, da je grupno relativno število R^ razmerje dveh absolutnih podatkov Y k in X k R k ■ V x k (9.22) moremo ta obrazec pisati v več oblikah. Iz njega dobimo, da je Če upoštevamo te zveze, računamo sumarno relativno število R na tri načine: a) Sumarno relativno število je razmerje med vsotami absolutnih grupnih vrednosti za X k inY k . Po tej opredelitvi je sumarno relativno število R enako (9.25) S tem obrazcem računamo sumarno relativno število, če imamo po grupah absolutne podatke za Y k in X k> b) Če upoštevomo' obrazec 9.23, je sumarno relativno število l\ R k R = * ■-- (9.26) L X k tehtana aritmetična sredina grupnih relativnih števil R k . Pri tem so vrednosti, ki so v imenovalcu relativnega števila, ponderi. Tako računamo poprečno relativno števi- - 237 - lo,če razpologGmo z grupnimi relativnimi levili in vrednostmi, ki nastopajo v imeno¬ valcu relativnih števil, oziroma če je smiseln produkt pondera z relativnim številom x k • V c) Če upoštevamo obrazec 9.24, po sumarno relativno število izračunamo po obrazcu Iy l R = £V R k (9.27) Topa je tehtana harmonična sredina grupnih relativnih števil R^. Pri tem so ponderi količine, ki nastopajo v relativnem številu v števcu. Po tem obrazcu računamo sumarno relativno število, če razpolagamo z grupnimi relativnimi vreanostmi in grup¬ nimi količinami Y^, ki nastopajo v relativnem številu v števcu, oziroma če je smiseln kvocient pondero in relativnega števila V^/R^. Obrazci 9.25, 9.26 in 9.27 oziroma gornja pravila ne veljajo samo za relativna števila v ožjem smislu, temveč tudi za računanje sumarnih aritmetičnih sredin, saj so aritmetične sredine tudi relativna števila, ker so razmerja med vsoto vrednosti in številom enot. 9.26 Po zgornjih pravilih ugotovimo, kdoj uporabimo za računanje sumarnih relativnih števil tehtano aritmetično ali tehtano harmonično sredino. Po teh pravilih ugotovimo, da je treba v primeru produktivnosti dela, ki smo ga navedli v odstavku 9.24, računati harmonično sredino. Produktivnost dela je merjena z relativ¬ nim številom "čas, porabljen za izdelavo enega izdelka", ki ga dobimo, če porabljen čas delimo s številom izdel kov. Ker razpolagamo s časom, koliko so posamezni delavci delali (60 minut), so ponderi količine, ki v relativnem številu nastopajo v števcu. Po gor¬ njih pravilih je treba za sumarno relativno število uporabiti harmonično sredino. Če poznamo površine in poprečno gostoto prebivalstva po republikah, izračunamo gostoto prebivalstva zo SFRJ kot tehtano aritmetično sredino, ker so ponderi površine v koeficien¬ tu "gostota prebivalstva" v i menovalcu^ Če imamo po podjetjih dano število zaposlenih žensk in odstotek zaposlenih žensk od skupnega števila zaposlenih, izračunamo poprečen odstotek zaposlenih žensk za celo - 238 - stroko po obrazcu za računanje harmonične sredine. Relativno število "odstotek zapo¬ slenih žensk" je kvocient med številom zaposlenih žensk in številom skupno zaposlenih v podjetju. Ponder - število zaposlenih žensk - je v tem primeru v števcu relativnega števila. Za podjetje imamo koeficiente o obračanju zalog posameznih vrst surovin (merjeno s časom enega obrata za posamezno vrsro surovine) in ustrezne vrednosti porabljenih suro¬ vin. Sumarni koeficient obračanja zalog izračunamo po obrazcu za izračurtanje tehta¬ ne aritmetične sredine. Pokczovalec o obračanju zalog "čas enega obrata" je namreč kvocient med poprečnimi zalogami in vrednostjo porabljenih surovin. Ponder - vrednost porabljenih surovin - pa je v relativnem številu v imenovalcu. Če imamo po občinah podatke o površini in skupnem pridelku pšenice v določenem le¬ tu, izračunamo poprečen hektarski pridelek pšenice po obrazcu 9.25 tako, da vsoto pridelkov po občinah delimo z vsoto površin. Odvisnost sumarnega relativnega število od sestave ponderov 9.27 Če preuredimo obrazec 9.26, dobimo X R =■ £-r"«k (9.28) Podobno dobimo iz obrazca 9.27 R = Y Pri tem pomeni: X° = X^/X strukturni delež za grupni podatek strukturni delež za grupni podatek Y^. (9.29) Y k =V Y Iz teh dveh obrazcev sklepamo, da sumarno relativno število ni odvisno samo od grupnih relativnih števil, R^, temveč tudi od sestave ustreznih ponderov x£ ali Y ^ . To je ena izmed osnovnih hib sumarnih relativnih števil, zaradi katere imamo včasih zelo - 239 - resne pomisleke o uporabnosti sumarnih pokaiovalcev. Za populaciji, ki imata enaka grupna relativna števila, sta sumarni relativni Š4evili med seboj različni, če sta sestavi ponderov različni. Še več. Razlike v sestavi ponderov morejo povzročiti, da je sumarno relativno število za populacijo A večje kot za populacijo B, čeprav sffvsa grupna rela¬ tivna število za populacijo A manjša kot za populacijo B. 9.28 Vzemimo zn zgled poprečne mesečne prejemke delavcev v kmetijstvu in gradbe¬ ništvu po kvalifikaciji. Tabela 9.5. Poprečni prejemki delavcev v kmetijstvu in gradbeništvu po kvalifikaciji v letu 1957 v SFRJ (Vir SB 114). Iz tabele 9.5 vidimo, da so poprečni prejemki delavcev v kmetijstvu za vse kvalifikaci¬ je višji kot v gradbeništvu. Kljub temu pa so sumarni poprečni prejemki v kmetijstvu niž¬ ji kot v gradbeništvu. Vzrok je različna sestava za število delavstva v kmetijstvu in gradbeništvu. Iz zadnjih dveh stolpcev v tabeli 9.5. vidimo, da je sestava delavstva po kvalifikaciji v poljedelstvu znatno nižja kot v gradbeništvu. Ta razlika v sestavi delav¬ stva po kvalifikaciji ima tako močan vpliv na sumarno poprečje, da so poprečni prejemki' delavstva v celoti v kmetijstvu nižji kot v gradbeništvu, čeprav so za posamezne kvalifi¬ kacije prejemki obratni. Standardizirani pokazov^TcT] 9.29 Omenjena lastnost sumarnih pokazovalcev je tako značilna, da se vprašamo,ali imajo sumarni pokazovalci sploh analitičen pomen in smisel, ker je primerljivost - 240 - sumarnih pokaževa Icev zelo dvomljivo in meglena, če ne vemo, ali izvira razlika iz razlik v grupnih pokazo/aici h ali iz razlik v sestavi ponderov. Splošen koeficient mortalitete je po tem odvisen od umrljivosti po posameznih starostnih skupinah za ženske in moške in spolno-starostne sestave prebivalstva. Prebivalstvo z raz¬ meroma nizko stopnjo umrljivosti po posameznih starostnih skupinah more imeti visok splošen koeficient umrl jivosti, če sov populaciji predvsem stari ljudje. Prebivalstvo z razmeroma visoko stopnjo umrljivosti po posameznih starostnih skupinah pa more imeti ni¬ zek splošen koeficient umrljivosti, če sestoji predvsem iz mladih ljudi. Podjetje izkaže visok sumarni koeficient za produktivnost dela, če izdeluje predvsem izdelke, za katere je splošna produktivnost dela visoka, čeprav je produktivnost dela za posamezen izdelek v podjetju razmeroma nizka in obratno. Primerljivost tako izračunanih sumarnih pokazovalcev motijo razlike v sestavi. Da izloči¬ mo vpliv razlik v sestavi, izračunavamo standardizirane pokazovalce tako, da vzamemo za vse sumarne pokazovalce, ki jih primerjamo, stalno- standardno sestavo za ponderje.Takoje standardiziran koeficient umrljivosti tehtana sredi¬ na specifičnih koeficientov umrljivosti po starosti, pri tem pa vzamemo enotno standard¬ no starostno sestavo za vse države, za katere primerjamo podatke. Ti koeficienti imajo večjo analitično vrednost kot navadni koeficienti umrljivosti, ker razlike med standardi¬ ziranimi koeficienti kažejo samo razlike v umrljivosti, ne pa v starostni in spolni struktu¬ ri. Standardna struktura, ki jo vzamemo za osnovo za izračunanje sumarnih koeficientov, mora biti seveda taka, da čim bolje ustreza stvarnim sestavam za posamezne populacije, ki jih med seboj primerjamo. Standardna sestava je zato včasih poprečna sestava iz vseh populacij, ki jih primerjamo, včasih pa idealna sestava, ki je pogojena z analizo poja¬ va in podobno. 9.30 Izračunajmo za prejemke delavcev po kvalifikaciji za kmetijstvo in gradbeništvo iz tabele 9.5 standardizirane poprečne prejemke delavcev za obe panogi. Za standardno sestavo vzemimo povprečno sestavo delavstva v SFRJ po kvalifikaciji v vseh panogah. - 241 - Tabela 9.6 Izračunanje standardiziranih raesačnih prejemkov v kmetijstvu in gradbeništvu v letu 1957 v SFRJ 1.000 10576.50 9855.34 Za izračunanje sumarnih poprečnih prejemkov vzamemo za standardno sestavo sestavo delavstva po kvalifikaciji v SFRJ. Tako dobimo, da sov kmetijstvu poprečni mesečni prejemki večji (10576 din) kakor v gradbeništvu (9855 din). Standardizirana poprečja resnično pokažejo, da je raven dohodkov v kmetijstvu višja kot v gradbeništvu, ker razlike v sumarnih dohodkifrizvirojo samo iz razlik v ravni dohodkov po kvalifikacijah, ne pa tudi iz razlik v sestavi zaposlenih. Seveda so standardizirana poprečja različna od poprečij, ki smo jih dobili v tabeli 9.5. Te razlike so rezultat tega, da je stvarna sestava v posamezni panogi različna od poprečne sestave za vse panoge. GEOMETRIJSKA SREDI 9.31 Geometrijska sredina G iz N vrednosti .. ta vseh N vrednosti • y N i e N-ti koren iz produk- (9.30) Iz te opredelitve sklepamo, da ima smisel računati geometrijsko sredino le tedaj, če no¬ ben izmed členov ni negativen ali nič. - 242 - 9.32 Tehtana geometrijska sredina je za razliko od navadne geometrijske sredine,ki je dana v obrazcu 9.30, enaka (9.31) 9.33 Neposredno računanje geometrijske sredine po zgornjih osnovnih obrazcih je,ra- zen za najenostavnejše pri mere, ne izvedi jivo. Pač pa moremo geometrijsko sredi¬ no razmeroma enostavno izračunati z logaritmi. Če namreč obrazca 9.30 in 9.31 loga- ritmiramo, dobimo log G = -L- £lo gy . (9.32) in l°g G log y k (9.33) Logaritem navadne geometrijske sredine je enak navadni aritmetični sredini logaritmov iz osnovnih podatkov, logaritem za tehtano geometrijsko sredino pa je enak tehtani arit¬ metični sredini iz logaritmov osnovnih podatkov. S tema obrazcema posredno računamo geometrijske sredine z logaritmiranjem. 9.34 Zaradi razmeroma zamotanega računanja in težjega tolmačenja geometrijsko sre¬ dino računamo redkeje kot druge vrste sredin. Vendar so problemi, pri katerih je upravičeno edino računanje geometrijske sredine. Tako računamo geometrijsko sredino v nekaterih posebnih problemih z indeksi oziroma relativnimi števili na splošno. Povečanju cene za 1 00% (indeks 200) smiselno ne ustreza znižanje cene za 100%, ker bi v tem primeru bila cena nič, temveč znižanje za 50% (indeks 50). Izravnava razno- smernih učinkov se pokaže pri geometrijski sredini, ker je geometrijska sredina iz indek” sa 200 in 50 ^ 200.50^.100 Ne pokaže pa se na primer pri aritmetični sredini, ker je aritmetična sredina med 200 in 50 enaka 125. Zato je za izračunanje časovnih sredin iz posamičnih indeksov bolj upravičena geometrij¬ ska kot aritmetična sredina. - 243 - 9.35 Geometrijsko sredino uporabljamo tudi za računanje srednjega koeficienta di¬ namike ali verižnega indeksa poprečne stopnje rasti. Zaznamujmo z Y , Y,, Y„, . ..Y., posamezne člene v časovni vrsti, s k, = Y,/Y , O I Z »N ,110 kj ~ Yj/Y^ , .k^ = Y^/Y^j ^ P° posamezne koeficiente dinamike, k naj bo srednji koeficient dinamike, s katerim bi se moral pojav v času od o dc N spreminjati,da bi dosegi! isti končni člen Y^. Med temi količinami so naslednje zveze Vv k 2 . k N =Y N =Y o k - k . k=Y o kN P* 34 ) Če namreč Y q postopoma množimo s k^, k^ ... k^, dobimo zaradi pomena koeficien¬ tov dinamike postopoma vrednosti členov v časovni vrsti in končno zadnji člen Y^.Gle¬ de na opredelitev srednjega koeficienta dinamike k pa dobimo Y M tudi, če začetno N N vrednost Y q N-krat pomnožimo s k, ali če jo pomnožimo s k . Iz zveze v obrazcu 9.34 moremo izpeljati dva obrazca Srednji koeficient dinamike je po obrazcu 9.35 geometrijska sredina iz posameznih koe- ’ ficientov dinamike. Po drugem obrazcu pa računamo srednji koeficient dinamike, če poznamo zo razmik, za katerega ročunamo srednji koeficient dinamike, začetno Yf in končno vrednost pojava Y t . . Srednji koeficient dinamike je v tem primeru koren iz kvocienta iz Y t , in Y t . *' M -o Stopnja korena pa je določena s čcsovnim razmikom, za katerega iščemo srednji koefici¬ ent dinamike. Zato ni nujno, da je N celo število, ampak more biti (fj-t^) kateri koli - 244 - časovni razmik, kar je določneje vidno iz obrazca 9.37. 9.36 Pri obravnavanju verižnih indeksov v odstavku o enostavnih indeksih smo izra¬ čunali vrsto verižnih indeksov za proizvodnjo električne energije v SFRJ v letih 1 951 -1956. Verižni indeksi v teh letih so: 1 05, 9 ; 110,4; 115,4; 126,1; 117,1. Srednji verižni indeks v tem razdobju je po obrazcu 9.35 enak geometrijski sredini iz posameznih verižnih indeksov T = 105,9.110,4.115,4.126,1.117,1 Z logaritmi izračunamo srednji verižni indeks po obrazcu 9.32 log I = -i- (log 1 05,9t-log 110,4 + log 115,4 + log 126,1 + log 117,1) (2,02490 + +2,04297 + 2,06221 + 2,101106 + 2,06856) = 2,0599. Z antilogaritmiranjem dobimo, da je srednji verižni indeks I = 114,8, poprečna stopnja rasti T =T - 100 =14,8% Da bi bilo zvečanje proizvodnje električne energije v razdobju 1951-1956 enako stvar¬ nemu, bi se morala proizvodnja električne energije večati s srednjim verižnim indeksom 114,8. Isti rezultat dobimo, če računamo srednji verižni indeks po obrazcu 9.36 iz začetne in končne proizvodnje električne energije. 9.37 Po republikah imamo podatke o družbenem produktu, po cenah iz leta 1966 za leti 1963 in 1971 po republikah. Ker je od 1963 do 1971 razdobje osmih let, je poprečen koeficient dinamike osmi koren iz kvocientov in - 245 - Tabeia 9.8 Poprečni koeficienti dinamike za družbeni produkt v razdobju 1963-1971, po republikah in pokrajinah (Vir:SG-72) Za posamezne republike in pokrajine so osemletni poprečni koeficienti dinamike v razmi¬ ku od 1 ,060 za BiH do 1,082 za Kosovo. ODNOSI MED RAZLIČNIMI VRSTAMI SREDNJIH VREDNOSTI 9.38 Če vzamemo ilustrativen zgled in iz 1 in 4 izračunamo harmonično H, geometrij¬ sko G in aritmetično M sredino, dobimo, da je H= "j7Pn =1,6f g={T.”4-2 ; m = 1~- 2,5 Iz teh rezultatov vidimo, da je harmonična sredina, če jo izračunamo iz istih podatkov, najmcnjsa, aritmetična sredina največja, geometrijska sredina pa leži med obema. To ne velja samo za ta primer, ampak velja splošno pravilo; harmonična sredina je manjša ka¬ kor geometrijska, ta po manjša kakor aritmetična sredina, če jih izračunamo iz istih po¬ datkov, H < G < M (9.34) -(L—— -/ - 245 - 9.39 Tudi med vrednostmi modusa Mo, mediane Me in aritmetične sredine M opazimo neke stalne odnose. Za unimodalne sime trične porazdelitve so vrednosti modusa, mediane in aritmetične sredine enake (M q = M^ = M). Za unimodalne porazdelitve, ki so asimetrične v desno, je modus manjši, aritmetična sredina pa večja kot mediano (Mo ( 10 . 2 ) ki je polovica kvartilnega razmika. Gornji meri variacije pravilneje pokažeta jakost variacije kakor variacijski razmik, ker nanju ne vplivajo skrajne - netipične vrednosti. Vendar pogosteje uporabljamo kvartilni kot decilni razmik. V sliki 10.1 je shematično prikazono, kako je variacijski razmik ne¬ občutljiv za razlike v razmestitvi vrednosti znotraj variocijskega razmika, in kako se raz- - 251 - lična razmestitev pokaže na kvartilnem razmiku. Določanje gornjih mer variacije ne dela težav, ker smo v odstavku o kvantilih nakaza¬ li, kako izračunamo aecile in kvartile. oooi a< H Qj 4 Xr Slika 10.1 Variacij tki in kvartilni razmik pri različni razmestitvi vred nos ti 10*5 Za blagovni promet na prebivalca med občinami v SRS v letu 1969, za katerega smo izračunali že variacijski razmik, je kvartilni odklon 1 ^ , 5102,5 - 2632,5 . T ( Q 3 ” Q l> = -2- 235 a,n Poprečni absolutni odklon - AD 10.6 Uvodoma smo naznačili, da z odkloni posamičnih vrednosti od sredine merimo jakost posamičnih vplivov na posamezno enoto. Sumcrno merilo jakosti teh vpli¬ vov bi moglo biti poprečje posamičnih odklonov. To pa je, kakor vemo, enako nič, če odklone računamo od aritmetične sredine, ker so odkloni pozitivni in negativni. Zato vzamemo za merilo variabilnosti poprečje absolutnih vrednosti posamičnih odklonov od sredine. Po tej definiciji je poprečni absolutni odklon od aritmetične sredine AD M = N^- M (10.3) Ker je poprečni absolutni odklon najmanjši, če računamo odklone od mediane, računa¬ mo AD tudi iz absolutnih odklonov od mediane AD Me N I I y ' Me | 00.4) - 252 - je vsebinsko zarod! te lastnosti mediane bolj upravičen kot AD M' 1-0.7 Čez Y s - £y. zaznamujemo vsoto posamičnih podatkov, katerih vrednost y < M e je manjša kot mediana, z Y x = Z y; pa vsoto podatkov, ki so večji kakor me' y> M e diana, izračunamo AD., po obrazcu Me AD Me " N (10.d) pri čemer je M_ poprečje iz členov pod, M pa poprečje iz členov nad mediano. Ta zveza je po sestavu podobna kvartilnemu odklonu, le da namesto kvartilov, ki sta mediani za prvo in drugo polovico populacije,vzamemo ustrezne aritmetične sredine. Za blagovni promet na prebivalca v letu 1969 je; Y s = 79347 , Y z = 183078, število občin N = 60 Po obrazcu 10.5 je AD Me = ~5o 0 83978 - 79347) = 1743,85 din AD P° dobimo po obrazcu M AD.. = 2 . P . P (M - M ) (10.7) M z s z s' pri tem pomeni: P = N /|s| in P = N /N strukturna deleža število enot pod in s s' z z nad aritmetično sredino M, M =Y /N in M =Y /N pa poprečji členov, ki so s s z z z pod oziroma nad skupnim poprečjem M. Za blagovni prometna prebivalca v SRS po občinah je =42, =18, Y $ =126249, Y^ = 183978. Iz teh podatkov dobimo, da je: P^ =42/60 =0,70; P z =18/60 = 0,30; - 253 - Mj = 126249/42 = 3005,93 in = 183974/18 =7615,33. Po obrazcu 10,7 pa je AD = 2.0,30 .0,70. (7615,33 - 3005,93) = 1935,95 din • M Vorianca. Standardni odklon -6 ,6-SD 10.8 2 Podobno osnovo kakor poprečen absolutni odklon ime tudi varianca o , ki je po definiciji poprečje kvadretov odklonov od aritmetične sredine ( 10 . 8 ) Pri AD odpravimo predznake odklonov tako, da vzamemo cbsolutne odklone, pri d*' pa tako, da odklone kvadriramo. 2 Podobno kot AD je tudi 6 izračunana mera variacije in je odvisna od vsake izmed vrednosti populacije. Vendar so druge lastnosti variance osnovne važnosti zo statistično analizo. Zaradi tega je, enako kakor je aritmetična sredina osnovna srednja vrednost,va¬ rianca osnovna mera variacije, čeprav je njeno izračunanje razmeroma zamudno. 10.9 Varianca je poprečje kvadratov odklonov od aritmetične sredine. Zato je izraže¬ na v neprikladnih enotah mere - kvadratu enote mere znaka. Temu se izognemo ta¬ ko, da izračunamo kvadratni koren iz variance. Dobljeno mera variacije, ki jo imenujemo standardni odklon, zaznamujemo pa z 6 ali SD pa je merjena v isti enoti mere kot osnov¬ ni znok. Varianca in standardni odklon sta v naslednji enostavni zvezi 00 . 9 ) Računanje iz negrupiranih podatkov 1 0.10 Računanje variance po osnovnem obrazcu 10.8 ss izkaže za zelo neprikladno. Po njem bi morali najprej izračunati aritmetično sredino za proučevan znak M , izračunati odklone posameznih vreabosti od aritmetične 2 sredine (y. - M), vsak posamezen odklon kvadrirati (y; - M) , dobljene kvadrate sešteti • 25 . 4 - in deliti z obsegom populacije. Zato varianco iz posamičnih podatkov raje računamo po enem izmed obrazcev j v ^ £± 2 _ L y i N & 7 = n 2>2 '<£y N N'* ( 10 . 10 ) 6) --ft > ^ 'V 0 ‘ Q i Q -- a Ž i ,2 Ky (10.11) Prvi obrazec dobimo iz osnovnega obrazca 10.8 z enostavnim računom P' cip- & -- -— --- Iy 2 -2MZ y *NM 2 -J-lr.2. illČ 6?4I(/,-“! 2 4 N Zrl- N -] 00 . 12 ) Nakazani način je še posebno prikladen, če računamo varianco z računskim strojem, ki istočasno zbira vsote podatkov in vsote kvadratov. 10.11 Če iz podatkov za 20 največjih mest v SFRJ izračunamo varianco poprečnih cen na drobno (v starih din) v letu 1970 za kokošja jajca, dobimo iz osnovnih podat¬ kov 71 71 68 71 74 73 63 78 73 66 60 78 74 71 66 62 56 59 58 66 Zy. =Y =71 + 71 + 68+ ...+ 58 + 66 = 1358 Iv? = 71 2 + 71 2 + o8 2 + ... + 58 2 + ,2 , ,,2 66 = 93028 g 2 = y 1358 y _ N 93028 - 20 N 20 = 40,99 standardni odklon pa 6 = \/40,99 = 6,4 din r v 10.12 Ker ostane varianca enaka, če vsem osnovnim podatkom prištejemo ali odštejemo isto konstanto, je včasih prikladno, da od osnovnih podatkov pred računanjem od* - 255 - štejemo osnovnim podatkom ustrezno konstanto y j ^ko do s0 reducirane vrednosti u čim manjše U; - v j - y O Varianco osnovnega zncka 6 dobimo, če računamo varianco iz reduciranih podatkov u po obrazcu e 2 = e 2 = K,/N y u (Zu ) 2 N (10.13) 10.13 Če v našem zgledu za ceno jajc odštejemo od osnovnih podatkov =68, dobi¬ mo reducirane vrednosti: 330365 -5 105 -2 -8 106 3 -2 -6 -12 -9 -10 -2 U = lu.; =3+3+ 0 + ...+ (-9)+ (-10)+ (-2) =-2 lu 2 = 3 2 + 3 2 + 0 2 + ... + (-9) 2 + (-10) 2 + (-2) 2 = 820 c 2 ui 2 6 2 - ™: . UU * L = 40,99 Dobili smo isti rezultat kot po obrazcu 10.10 Računanje iz grup i ra nih podatkov v' 10.14 Neposredna metoda. Zo velike populacije je računanje variance iz ne- grupiranih podatkov še zomudneje kakor računanje aritmetične sredine. Zaradi tega za velike populacije tudi variance ocenjujemo iz podatkov, ki so grupirani v frek¬ venčne porazdelitve. Ocena variance iz frekvenčne porazdelitve je = 7j^ f k (y k M (10.14) tehtana aritmetična sredina kvadratov odklonov sredin razredov od aritmetične sre¬ dine M . Vendar » ta pustnpak izkaže nepriklade.i v primerjavi z drugima postopkoma, ■ 25 - 6 - s katerima moremo ludi izračunati varianco iz frekvenčnih porazdelitev. Zato zanj ne navajamo primera, ker v splošnem te metode ne uporabljamo. 10.15'^ Metoda pomožnega znake u . Metoda pomožnega znaka u je samo raz¬ širitev metode pomožnega znaka u za računanje aritmetične sredine iz grupira¬ nih podatkov. Po tej metodi računamo varianco tako, da: c) Enako kakor za aritmetično sredino izberemo razred, ki je nekje sredi frekvenčne porazdelitve. Vonj postavimo izhodišče znaka u = o, v druge razrede pa navzdoi in navzgor od izhodišča ustrezne vrednosti pomožnega znaka u: ... -3, -2, -1, 0, +1, +2, +3, ... b) Enako kakor za aritmetično sredino, izračunamo produkte frekvenc f^z ustreznimi vrednostmi znaka u^, da dobimo f^u^ c) Produkte f^u^ ponovno pomnožimo z ustreznimi vrednostmi znaka u^: tako dobimo vrednosti f, u,2 k k o d) Seštejemo frekvence f^ f produkte f^u^ in produkte f^u^ e) Iz teh količin izračunamo varianco po obrazcih .2 , K : K *Ff. uf N u u u k k N 00.15) Pri tem je: i = širina razreda. 10.16 Za porabo lesa v 149 kmetijskih gospodarstvih v okraju Novo mesto je prikaza¬ no računanje variance po tej metodi v tabeli 10.1. - 257 - Tabeio 10.1 Izračun variance 6 in standordnega odklona Q za porabo lesa v 149 kmetijskih gospodorstvih v okraju No/o mesto po metodi pomožne¬ ga znaka u PoobrazcihlO.il dobimo dalje = 372 - (t26) 2 /l 49 = 367,4631 6 2 = 4 2 . 367,4631/149 = 39,4591 0 y = \j 39,4591 =6,28 m 3 10.17 Metoda kumulativ. 'Tudi za računanje variance moremo koristno uporabi¬ ti lastnosti kumulativnih vrst. Ta metoda je enako kakor metoda pomožnih zna¬ kov g samo razširitev iste metode pri računanju aritmetične sredine. Po metodi kumulativ računamo varianco tako, da: a) Enako kakor pri računanju aritmetične sredine iz frekvenčne porazdelitve iz f izra¬ čunamo kumulativno vrsto F. Zadnji člen kumulativne vrste (pod črto) je obseg popula¬ cije N. b) Po enakem postopku kumuliranja izračunamo iz prve kumulativne vrste F drugo kumu¬ lativno vrsto FF. Zadnji člen druge kumulativne vrste FF (pod črto) je . - 258 - c) Seštejemo vrednosti členov druge kumulativne vrste (brez člena pod črto). To vsoto zaznamujmo s Cj • d) Iz teh količin izračunamo varianco po obrazcih 2 2 ' ^ K u = 2C 2+ c 1 - c ;/N ; — K y (10.16) e) Kumulativne vrste moremo računati od zgoraj navzdol ali obratno od spodaj ncvzgor. Zo asimetrične porazdelitve je prikladne je začeti izračunavati kumulative na strani asi¬ metrije. 1 Q\18 V tabeli 10.2 je postopek nakazan za porabo lesa v Novem mestu. Tabela 10.2. Računanje variance za porabo lesa v 149 kmetijskih gospodarstvih v okra¬ ju Novo mesto po metodi kumulativ. 149 719 1559=2+20»-... N C j +429+572 =C 2 o K = 2.1559+ 719 - 719 /149 = 367,4631, torej enako kot po metodi pomožnega zna¬ ka. 10.19 Sheppardov popravek . Varianca, ki jo izračunamo po zgornjih postop¬ kih, je samo ocena za pravo vrednost variance, ki bi jo dobili, če bi jo izraču- - 259 - nali iz posamičnih podatkov. Analizo te ocene pa pokaže, da dobimo za unimodalne, ne preveč asimetrične porazdelitve zo zvezne znake po lej metodi sistematično preve¬ like vrednosti zo varianco. Ta napaka je tem večja, čim širši so razredi. Varianco, iz¬ računano po prejšnjih metodah, moremo popraviti po obrazcu 2 6 y.p°p ; 2 /i2 (10.17) tako, da od prvotne ocene variance, ki jo dobimo po metodi znaka u ali po metodi ku- mulativ, odštejemo dvanajstino kvadrata širine razreda. Ta popravek imenujemo Sheppardov popravek. Za frekvenčno porazdelitev o porabi lesa v Novem mestu v letu 1953 je popravljena varianca enaka 6 2 =39,4591 - 4 2 /l 2 =38,1258 Y> P°P 6 = (/38,1258 =6,17 m 3 y,pop » Skupna varianca J' 10.20 Enako kakor sumarno aritmetično sredino moremo tudi skupno varianco izračuna- ' ti iz grupnih podatkov. Če poznamo po grupah število enot N, , aritmetične -2 k sredine in grupne variance 6 ^ , izračunamo skupno varianco za celo populacijo po obrazcu 6 2 = Mg 2 + 6 2 M (10.18) Pri tem je tehtana aritmetična sredina grupnih varianc, 6 M ■ rrlN t (M k -M ) 2 ( 10 . 20 ) pa tehtana varianca med grupnimi aritmetičnimi sredinami M^. . . 2 To zelo pomembno zvezo moremo dokazati enostavno, iz znanih zvez voljo N, 6 , = — 2 2 _ < k = L(/,. “A) - N. (M, -A) . Ta zveza velja za poljubenA, Ce postavimoA = M iri ^ 2 v " v 2 V 2 x seštejemo po grupah, dobimo 2. , N, 6 , = 4 L(y - M) - Z. N. (M. - M) . Če to K k k k i ki k zvezo delimo z N , dobimo M„2 = 6 9 - 6 S K I 2 .M I 0.21 Vzemimo zo zgled stroške zc kulturno in družbeno življenje v novembru 1957 za 2 36 delavskih družin v Mariboru. V tabeli 10.3 so navedeni , M^ in £). po višini dohodkov . Tabela 10.3 Podatki za , M, in 6 za stroške za kulturno in družbeno življenje za 36 delavskih družin v novembru 1957 v Mariboru po skupinah dohodkov. Iz teh podatkov dobimo 6 M =4t t 12 ‘ ( 479 “ 8 ' i9 ) 2+ ••• + 3 • O703-819) 2 ]= 140709 M n =srl- ( 12 . 28358+ ... + 3.8089) =38726 5 46 6 2 = M c 2 + 6 2 = 38726+ 140709 =179435 O M 10.22 Pomembnejše kakor to, da moremo izračunati skupno varianco, če poznamo grup- ne podatke, pa je dejstvo, da moremo z zgornjim postopkom skupno varianco raz¬ staviti po grupnem znaku v dva dela. Skupna varianca namreč meri vpliv vseh posamič- 2 nih faktorjev, medtem ko meri 6^ vpliv grupnega znaka, M^2 P° vpliv drugih, posa¬ mičnih faktorjev na variabilnost pojava. -2:61- Po zgornjem postopku moremo torej varianco analizirati v tem smislu, do ugotovimo, ko¬ liko od skupne variance je rezultat dejavnika, ki ga vzamemo za grupni znak. Za stroške za kulturno in družbeno življenje za 36 družin v novembru 1967 v Mariboru vidimo, da je velik de! (78%) od skupne variance stroškov za kuiturno'in družbeno življe¬ nje pojasnjen z višino dohodkov. Višina dohodkov je torej eden izmed bistvenih faktor¬ jev, ki vplivajo na stroške za kulturno in družbeno življenje. 10.23~|zveze standardnega odklona z normalno porazdelitvijo Variacijski razmik ali kvartilni razmik imata enostavno tolmačenje in pomen. Enako je tudi poprečni absolutni odklon razmeroma razumljiv. Teže pa je s standardnim odklonom, dokler ga ne obravnavamo v zvezi z nekaterimi lastnostmi porazdelitev.Stan¬ dardni odklon namreč dobimo z razmeroma zapletenim računskim postopkom, ki zomegli predstavo o smislu tega parametra. Čeprav normalno porazdelitev podrobneje obravnavamo kasneje, je prav, da navedemo nekaj njenih lastnosti v zvezi s standardnim odklonom. Kakor že vemo, je normalna po¬ razdelitev ena izmed osnovnih teoretičnih porazdelitev. Pomembna je po svojih teoretič¬ nih lastnostih in prckfičnem pomenu. V stvarnosti se ob določenih pogojih pogosto pojav¬ ljajo porazdelitve, ki so po svojih značilnostih normalni več ali manj podobne, ker so simetrične, uriimodalne in zvonaste oblike. Za vse normalne porazdelitve na splošno velja, da leži v razmiku M - S do M+ 6 68,27% ali okroglo 2/3 vseh vrednosti, v razmiku M-26 do M+'26 95,45% oli - 262 - o!i praktično vse vrednosti. Odkloni od aritmetične sredine, ki so absolutno večji od 6, se v splošnem pojavijo v tretjini vseh primerov, odkloni, ki so večji kot 2 5 , sa¬ mo v 5% vseh primerov, odkloni, ki so večji kot 3 6 , po so zelo zelo redki. Ti odno¬ si veljajo strogo za normalno porazdelitev. Približno pa veljajo tudi za druge unimodal-' ne, simetrične in zvonaste porazdelitve. Koliko veljajo gornje zakonitosti za unimodolne zvonaste porazdelitve na splošno, si moremo ustvariti sliko iz porazdelitve o porabi lesa v Novem mestu. Zanjo dobimo, da 3 3 leži v razmiku M - 6 do M + 6 , to je od 8,53 m do 20,87 m 70% vseh primerov,v razmiku M - 2 6 do M + 2 5 , to je od 2,36 m° do 27,04 m 94% vseh primerov, v 3 razmiku M - 3 6 do M + 3 6 , to je od 0 do 33,21 m pa 99,3% vseh primerov. Raz¬ like od deležev pri normalni porazdelitvi so torej neznatne. Poprečna razlika- 10.24 Poprečni absolutni odklon in varianca imata za osnovo odklone od neke srednje vrednosti (Me ali M). Mera variacije, ki ni zasnovana na odklonih od neke sred¬ nje vrednosti, je poprečna razlika A]. Poprečna razlika je poprečje iz vseh možnih pozitivnih razlik vseh vrednosti v populaciji. Če je število enot enako N, je vseh možnih pozitivnih razlik (^). Za ranžirno vrsto posamičnih vrednosti je po¬ prečna razlike dana z obrazcem O « l« y 2 < •••< y i < ••• <>'n 00 . 21 ) Iz podatkov, ki so urejeni v ranžirni vrsti, izračunamo Aj s kumulativami ker je 1= I jo 1 1 = (i-1) y. - (N —i)y ; l = g [2 Iy. - ((*•’., V.]= (N-1)C o - 2C, J i=l L Iz kumulative ranžirne vrste dobimo pomožne vrednosti C q in . Za kumulativne vrste vemo, da je C q = ^ y. inCj= |" M « + -2 V (11.3) Po obrazcu 11.2 računamo na primer poprečno mesečno proizvodnjo pouletih, če ima¬ mo mesečne podatke o proizvodnji, ali poprečno število prebivalstva po petletjih,če razpolagamo s številom prebivalstva po letih sredi leta. Obrazec 11 .3 po upošteva¬ mo, če izračunavamo na primer poprečno število delavcev po letih, imamo pa podat¬ ke o številu delavcev v začetku vsakega meseca itd. Na to moremo paziti zato, da se poprečja nanašajo na zaokrožena koledarska razdobja: tedne, mesece, leta, pet- - 279 - lefja in no iste trenutke kot členi v osnovni časovni vrsti. Vrsta drsečih vsot 11.8 iz mesečnih podatkov o proizvodnji s seštevanjem dobimo časovno vrsto za letno proizvodnjo. Ti letni podatki se nanašajo na letne razmike koledarskih let od januarja do decembra. Pri proučevanju dinamike pa so poleg ieh važni tudi drugi letni razmiki, na primer od februarja danega leta do januarja naslednjega ie- fa, od marca do februarja naslednjega leta itd. Ti letni razmiki se med seboj delno prekrivajo, tako da je vsak rozmik, če ga primerjamo« predhodnim, premaknjen za en mesec. Ti letni razmiki tako rekoč drsijo od člena do členo za en mesec. Odtod tudi ime drseče vsote. Cosovnc vrsta drsečih vsot ima niz lastnosti, ki ji dajo poseb¬ no analitično vrednost. Ena izmed teh je, do se v časovni vrsti drsečih vsotizrav- novaTo^shjčajni [ j^n| periodlični vpliv i, če obsego vsota časovno periodo. O tem bomo podrobneje slišaii v naslednjih poglcviih. Zaradi zveze med zaporednimi členi v čosovni vrsti drsečih vsot računamo časovno vrsto drsečih vrednosti razmeroma enostavno. Ce imamo izračunan prvi člen čosov- ne vrste drsečih vsot (dobimo ga tako, da seštejemo vrednosti od jariuorjo do decem¬ bra za prvo leto v časovni vrsti), dobimo naslednji člen v časovni vrsti drsečih v&ot tako, da januorsko vrednost od prve letne vsote odštejemo, prištejemo pa vred¬ nost za januar naslednjega leta. Iz loko dobljenega drugega člena dobimo tretji člen časovne vrste drsečih vsot, če prištejemo februarski člen prihodnjega' in odštejemo februarski člen prejšnjega leta iz osnovne časovne vrste. Posamezni členi v vrsti drsečih vsot pomenijo letno proizvodnjo v preteklem letu do začetka januarja, do začetke februarja itd. Nakazano računanje vrste drsečih vsot ne velja samo za mesečne podatke, marveč na splošno za katero koli vrsto ekstenzivnih razmičnih podatkov. Enako iz dnevnih podotkov računamo časovno vrsto tedenskih drsečih vrednosti o številu prevoženih potnikov. Iz letnih podatkov o številu živorojenih po moremo sestoviti petletno vr¬ sto drsečih vsot za število živorojenih itd. - 280 - Drseče vsote v vseh primerih računamo po splošnem obrazcu: Vi 'VVV, ' s k + ,i? Pl .4) Pri tem pomeni: in S^ = ustrezne vrednosti v vrsti drsečih vsot; = člen k v osnovni vrsti; Y^_ r = člen osnovne vrste, ki je zo r členov pred ; r = šte¬ vilo členov, iz kolikor so računane vsote ; d, =Y, - Y. = razlika ustreznih r k K k-T vrednosti za Y. .11 .9 Za število potnikov v zračnem prometu v SFRJ v razdobju 1955-1958 je izra- čunanje časovne vrste drsečih vsot nakazano v tabeli 11 ,3. Tabelo 11 .3 Izračunanje časovne vrste drsečih vsot za število potnikov v zračnem prometu po četrtletjih v SFRJ v razdobju 1955-1958 (Vir: Indeks) 130,2 - 281 - Iz zgleda je jasno razviden postopek: S 5 =8,24-23,1+38,0H4,7=104,$ S 6 =104,0(+0,l)=104,l; S 7 =l04,1+(-3,2)=!00,9 itd. Časovna vrsta drsečih sredin 11.10 Vrednosti členov v čosovni vrsti sredin priredimo sredini razmikov, na kate¬ re se poprečja nanašajo (npr. sredini let pri letnih poprečjih, tretjemu letu petletke pri petletnih poprečjih itd.). Členi v časovni vrsti sredin so torej prireje¬ ni samo nekaterim členom v osnovni čosovni vrsti. Za analizo pa je dostikrat po¬ trebno, da imamo prirejena poprečja vsem, ne pa samo nekaterim členom v osnovni časovni vrsti. To dosežemo s časovne vrsto drsečih sredin, ki jo izračunavamo po¬ dobno kot vrsto drsečih vsot. Ker se morajo posamezni členi v vrsti drsečih sredin nanašati na iste trenutke kot členi v osnovni časovni vrsti, izračunamo člene vrste drsečih vsot glede na osnovno časovno vrsto na dva načina: Ce imajo razmiki, no katere se nonašajo sredine, liho število osnovnih razmikov: r = 2'r+l, izračunavamo časovno vrsto drsečih sredin po obrazcu y k = r (Y k-i +Y k -H-i + --- +Y k + -- +Y kt- i-l +Y k+i ) = r Vh-1 (11-5) Tak primer je računanje tedenskih ali petletnih poprečij.. 11 .11 Vzemimo za zgled časovno vrsto o številu umrlih na 1000 prebivalcev v Ju¬ goslaviji v letih 1921-1939 in zanjo izračunajmo časovno vrsto petletnih sredin. Ker računamo poprečja iz lihega števila osnovnih razmikov, uporabimo obra¬ zec 11 .5. Iz obrazca 1.1.5 povzamemo, da je najbolje, če po postopku, ki smo ga že navedli, izračunamo vrsto drsečih petletnih vsot S^, petletne vsote pa delimo s pet. - 282 - Tabela 11.4 Izračun časovne vrste drsečih sredin za število umrlih na 1000 pre¬ bivalcev v bivši Jugoslaviji v letih 1921-1939 11 -12 Če pa sredine veljajo za sodo število osnovnih razmikov (r ~2i), računamo drseče sredine po obrazcu: Vt-itVVm + ••'»V ••• + Vi-l + T Y kH ) ( 11 . 6 ) Tak primer imamo pri letnih poprečjih iz mesečnih (r - 12) ali četrtletnih (r = 4 ) podatkov. Če je število osnovnih razmikov sodo (r =2i), je najprikladneje obrazec 11 .6 preure¬ diti v obliko - 283 - 1 01.7) Vf^h* "k-m +-+zv-*WY ktI ) -ir s k Ker je ^k+1 ~^ld-rH + ^k+r*-2 “k+i + r d kt-i ^k+i+1 r^k+f+l^k r^k+i r^k+r+1 je ponderirano vsoto no [prikladne je računofl po obrazcu 11.8 tako, da prvo vso¬ to izračunamo, naslednje pa dobimo s postopnim prištevanjem dveh diferenc d^. 11.13 Če imamo vrsto mesečnih podatkov, po pravilu računamo vrsto drsečih sredin za letna razdobja. Za ta primer je po gornjih obrazcih: r =2i =1 2 ; i =6. Ker začnemo s = S^ seprvi člen drsečih sredin nanaša na 7.mesec (julij) prvega leta. Zanj računamo po obrazcu 11.7 : S 7 = (Y 1 + 2Y 2+ ... + 2Y 7+ ... + 2Y 12 + Y 13 ) Y^ 3 - podatek za januar drugega leto. Po obrazcu 11 .8 pa dobimo dalje: S 8 =S 7 + 12 d 13 + 12 d 14 : S 9 =S 8 + 12 d 14 + 12 d 15 ,!d .12 d 13 = Y 13 _Y 1 12 d l4 = V Y 2 Kot zgled vzemimo indeks industrije za gradbeni material vSFRJ. (Glej tabelo 11.51). Razlike med ustreznimi meseci zaporednih let smo izračunali takole: Prva možna razliko je za mesec januar 1952: 12 d >3 - Y J,52- Y J,5! ‘ 3 ’- 38 ‘ ^ ” f ' b "» '«* 1 2 d u ,Y F .52' Y F,5! = = 27-37=- 10 ifd. Prvo vsoto (za julij 1951) smo izračunali v celoti: S j 51 =38+ 2,37 + 2.49+ .+ 2.84 + 2.71 + 2.: Nadaljnje vsote pa so izračunane, kot kaže slika ll .1 - 284 - Tobela tl .5 izračunanje časovne vrste drsečih sredin zo indeks industrije gradbenega moferiola v SFRJ {j} 1956 = 100) (Vir: SB 108) - 285 - 1707 O - 7 + -10 + 1690 O -10 + -13 + 1667 O -13 + - 6 + 1648 O - 6 + Slika 1.1 .1 Izračunonje vrste drsečih vsot Sj^. Iz obeh zgledov vidimo, da je časovna vrsta drsečih sredin krajša od osnovne časovne vrste in da začetnim in končnim i členom v osnovni časovni vrsti ne mo¬ remo prirediti drseče sredine. To je hiba časovne vrste drsečih sredin, s katero mo¬ ramo računati. GRAFIČNO PRIKAZOVANJE ČASOVNIH VRST 11.14 Kompleksen vpogled v dinamiko pojavov dobimo z grafičnim prikazom ča¬ sovnih vrst. Tabelarični prikaz časovnih vrst je nenazoren, ker imajo časov¬ ne vrst« običajno veliko členov. Razen tega je v tabeli izredno težko primerjati več čascvnih vrst istočasno. Časovne vrste prikazujemo prete žno z linijskimi grafikoni. Stolpce ali druge nači¬ ne prikazovanja uporabljamo le za krajše časovne vrste. Najenostavnejši prikaz časovne vrste je navoden linijski grafikon. V njem je ko- - 286 - ličinsko skalo navadne aritmetična skala. Teh vrst grafikonov imamo največ. Eden izmed njih je grafikon v sliki 11.2. umrlih na K00 prebivalcev Slika 11.2 Število umrlih na tisoč prebivclcev v predvojni Jugoslaviji Na aritmetični skali daljice med podatki prikazujejo absolutno diference med dve¬ ma podatkoma. Na linijskih grafikonih z aritmetično skalo pa moremo praviloma prikazovati samo istovrstne časovne vrste. Pri prikazovanju raznovrstnih časovnih vrst na istem grafikonu je namreč problematično razmerje med skalami. Po i Iogarite ms ki grafikoni 11.15 Za prikazovanje dinamike pojavov je posebno prikladen grafikon, ki ima na¬ mest o aritmetične količinske skale logaritemsko skalo. Ker je razlika loga¬ ritmov enaka logaritmu kvociente, je na logaritemskem grafikonu navpična razdalja med dvema podatkoma v razmerju z logaritmom kvociente med podatkoma. Zato mc- - 287 - remo iz logaritemskega grafikoriG odbrati relativne odnose med podatki. Ker so re¬ lativna števila važno orodje pri statistični analizi dinamike pojavov, so ti grafiko¬ ni zelo prikladni za prikazovanje in analizo časovnih vrst. Prednost logaritemskih grafikonov je tudi v tem, da moremo na njih prikazovati raznovrstne vtste, ker osta- ne logaritemskos_kojc_zg_ysfi, pasovne vrtie-kta .. Ker je logaritemska skalo v sorazmerju z logaritmi, so oblike krivulj drugačne kot na ritmetični skali. Iz slike 11 .3 vidimo, da je pojov, ki je na ar itmetični skali pri¬ kazan s premico (A), na logaritemski skali prikazan z logaritemsko krivuljo (A). Če pa je smer razvoja eksponentna funkcija (B), je na logaritemskem grafikonu prikaza¬ na s premico (B). časovna vrsta, ki ima stalen koeficient dinamike, je na logaritem¬ skem grafikonu premica. Prednost logaritemskih grafikonov je tudi v tem, da podojo- ne 9 lede 00 v elikost podatkov.V sliki 11.3 imamo prikazana tudi dva pojava, ki se enako razvijata, le da je za po- jav C podatek petkrat večji kot za pojav D. Na aritmetični skali dobimo vtis, Hn jo dinamika za pojav D milejša kakor za ppjav_C_ L Logaritemski grafikon pa pravilno pokaže enako dinamiko za obe časovni vrsti. Če sta na aritmetičnem grafikonu dve časovni vrsti vzporedni, pomeni, da jejazjikc med obema časovnima vrstama ifcalpa. Ce pa sta časovni vrsti na logaritemskem grafikonu vzporedni, pomeni, da je stalno razmerje med obema vrstama. - 288 - at trn ‘ V - Slika 11 .3 Odnosi med časovnimi vrstami v aritmetičnih in polloga ritenskih grafikonih 11.16 Na logaritemskem grafikonu je v sliki 11.4 prikazan razvoj proizvodnje električne energije v SFRJ in SRS. Tabela Tl .6. Proizvodnja električne energije in število prebivalstva v SFRJ in SRS v razdobju 1946-1957 (Vir: SG 57-5S) ■ 289 - Logaritemska skala na grafikonu v sliki 11.4 je neimenovana in velja za vse prikazane časovne vrste ne glede na velikost in vrsto podatka. Za vsako vrsto posebej pa v grafikonu vpišemo decimalni faktor \ z njim je treba vrednost, ki jo odberemo na skali, pomnoži¬ ti, da dobimo vrednost količine v enoti mere, ki je naznačena za decimalnim faktorjem. Iz grafikona 11.4 tako odberemo, da je bila skupna proizvodnja električne energije leta o -1948 2,06.10 KVVh ali 2,06 milijard KWh. Ker je logaritemsko skalo teže brat i kakor aritmetično, logaritemske grafikone običajno proučujemo s pomožno premično skalo, ki jo vrišemo na rob pasu papirja. To pomožno skalo uporabljamo predvsem za določanje re¬ lativnih števil (indeksov, koeficientov In struktur). Na sliki 11.4-je naznačeno, kako s pomožno skalo odberemo relativna števila. V zgle¬ du, ki ie označen z a, odberemo ind^jj .5 skupne proizvodnje električne energije za SFRJ za leto 1954 na bazo..1248 tako, da izhodišče pomožne skale 100 naravnamo na osnovo 1948. Na pomožni skali odberemo tam, kjer linija preseka skalo, indeks 165 (natančna vrednost je 167). Če zvežemo točki, ki prikazujeta podatka na začetku in koncu določenega razdobja za isto časovno vrsto, letni prirastek na daljici pokaže poprečni koeficient dinamike oziroma poprečni verižni indeks, če gc merimo z ustrezno logaritemsko skalo. Za proizvodnjo elek¬ trične energije v Jugoslaviji je iz grafikona (a]) razvidno, da je poprečen koeficient di- - namike v razdobju 1948-57 enak 1,14 kar ustreza poprečni stopnji rajti 14 točk. Z b] je naznačeno, kako določimo koeficien t proizvodnje električne energije na enega prebivalca v SFRJ v letu 1955. Ta koeficient odberemo tako, da izhodišče 1 na pomožni skali naravnamo na linijo števila prebivalstva,na skali pa pri liniji proizvodnje odčitamo ustrezno vrednost 2,47. Vrednost koeficienta pa dobimo, če to vrednost pomnožimo s kvo- 9 7 cientom 10 KWh/10 prebivalcev ; tega dobimo iz decimalnih fa ktorjev, ki so vpis ani ob ustreznih iinijah za proizvodnjo in število prebivalstva. Koeficient je torej 247 KVVh/ preb. Analogen koeficient za isto leto za SR Slovenijo dobimo, če premaknemo izhodi¬ šče na pomožni skali na črto za prebivalstvo v Sloveniji-, ob črti za proizvodnjo pa na po¬ možni skali odberemo vrednost 1,02. Po istem pravilu kot prej to vrednost pomnožimo s kvocientom 10^ KWh/10^ prebivalcev. Iz grafikona ocenjeni koeficient je torej 1020 KWh/preb. v letu 1955 v SR Sloveniji. Kako s pomožno logaritemsko skalo odčitamo strukturne odst otke^ je nakazano v zgledu c. Ker iščemo strukturne deleže za skupno proizvodnjo v SFRJ, izhodišče - 290 - Slika 11 .4 Proizvodnja električne energije in število prebivalstva v SFRJ in SRS v razdobju 1946-1957 291 1 00 no premični skali naravnamo v letu 1957 na skupno proizvodnjo SFRJ. Ob črtah za proizvodnjo pa za dele skupne proizvodnje odberemo, da je bilo od skupne pro¬ izvodnje v SFRJ v letu 1955 približno 56% od skupne proizvodnje hidroelektrike in približno 44% proizvodnje termoelektrike. Proizvodnja v Sloveniji pa -je približno 37% od skupne jugoslovanske proizvodnje. Iz teh treh primerov vidimo, kako iz iogaritmičnih grafikonov odberemo vse vrste relativnih števil, izhodišče pomožne skale postavimo vedno na podatek, na katere¬ ga primerjamo {imenovalec v relativnem številu). Čitanje logaritemskih grafikonov je podobno računanju z logaritmičnim računalom in ima vse njegove prednosti (hitrost, enostavnost) in pomanjkljivost (nenatančnost). Brez uporabe pomožne skale moremo iz logaritemskega grafikona opazovati splošne tendence dinamike. Tako vidimo, da je v letih 1948-1952 koeficient dinamike v proizvodnji skupne električne energije precej stalen, se v nadaljnjih letih poveču¬ je, v razdobju 1954-1957 pa ima zopet precej stalno vrednost. Ker se razlike med linijo za skupno proizvodnjo in linijo proizvodnje hidroelektrarn vedno manjšajo, sklepamo, da delež hidroelektrike v skupni proizvodnji narašča. Delež proizvodnje Slovenije v skupni jugoslovanski proizvodnji je precej ustaljen, ker sta obe liniji precej vzporedni. Iz grafikona moremo sklepati podobno tudi za druge odnose med prikazanimi podatki. Polarni grafikon 11.17 Časovne vrste, ki imajo periodično komponento, včasih prikazujemo v po¬ larnem koordinatnem sistemu. Za periodične časovne vrste je n amreč pomemb¬ nejša fn bolj smiselna primerjava med isroležnimi členi za različne periode kakor pa primerjava med zaporednimi členi v časovni vrsti. S polarnim grafikonom najbolje primerjamo ustrezne člene v različnih periodah. Osnova polarnega grafikona je po- lami koordinatni sisterrv ta zamenja pravokotni koordinatni sistem. V polarnem gra¬ fikonu je čaj znotraj ene periode nakazan s smerjo, podatek pa z oddaljenostjo toč¬ ke od izhodišča polarnega koordinatnega sistema. Če imamo mesečne časovno vrsto s se¬ zonsko variacijo, krog razdelimo v dvanajst enakih delov. Vsak izmed teh delov po¬ meni po en mesec. Če se podatki nanašajo na konce ali začetke mesecev, rišemo - 292 - ^sc Slika 11.5. Indeksi proizvodnje gradbenega materialov SFRJ v razdobju 1955-1957 (Vir: Tabela 21.5) -/555 *-- /555 -- /557 podatke na meje posameznih k.rogovih izsekov, če pa se nanašajo na cele mese¬ ce ali na sredi ne. mesecev, pa v sredino krogovih izsekov. Za časovne vrste z izrazito sezonsko komponento kaže polarni grafikon tipično ekscentrično sliko. Če pojav narašča, dobimo na polarnem grafikonu spiralo, ki se odvija. Za pojave, ki upadajo, pa se spirala zcvija proti izhodišču. Seveda po- - 293 - lame grafikone ne uporabljamo samo za mesečne vrste s sezonsko variacijo,temveč tudi za prikazovanje časovnih vrst s kakršno koli periodo; npr. tedensko periodo v dnevni časovni vrsti itd. V teh primerih moramo seveda razdeliti krog na ustrezno število odsekov (za tedenske periode na sedem). Hite polarnega grafikona pa je v tem, da je nepregleden,če je časovna vrsta predolga 'ali če nima izrazitega trenda. 11.78 V sliki 11.5 je prikazana s polarnim grafikonom časovna vrsta indeksov proizvod¬ nje za gradbeni material v SFRJ v letih 1955-1957. Časovna skala je krožna, medtem ko je skala za indekse naznačena s koncentričnimi kro¬ gi. Za vsako leto so podatki včrtani drugače,da se leta ne pomešajo med seboj. Grcfikon kaže izrazit sezonski značaj proizvodnje gradbenega materiala, ker so črte za posamezna leta ekscentrične. Razen tega pc kaže,da pojav narašča,ker se spirala odvije. Primerjava med istimi meseci v različnih letih je zelo dobra, ker podatki za isti mesec v različnih letih leže v isti smeri. ANALIZA ČASOVNIH VRST 11.19 Dinamiko pojavov analiziramo tako,da opazujemo spreminjanje vrednosti členov v časovnih vrstah in iščemo zakonitosti tega spreminjanja. Naloga enostavne analize časovnih vrst je enostavna primerjava mea' člen? v isti časovni vrsti.Člene v časovni vrsti primerjamo lahko na več načinov. Vsak izmed njih po svoje osvetli dinamiko pojava. Z me- todomi,ki so s pecifične za analizo časovnih vrst analiziramo zakonitosti dinamike ene sa¬ me vrste, s J^3ES»lž&i^^n ° na ^ 20 9 ° ZQ konitosti odvisnosti v dinamiki večih pojavov,ki so med seboj v zvezi. Prime ri j i v o s t podatkov v časovni vrsti 11.20 Kljub temu,dc so členi v isti časovni vrsti istovrstne količine,dostikrat med seboj niso neposredno primerljivi kot bi se za to zdelo na prvi pogled. Da jih moremo pri¬ merjati,morajo izpolniti določene pogoje.Če jih ne izpolnjujejo, je treba časovno vrsto pred analizo preurediti tako, da tem pogojem zadošča. Osnovni pogoj za primerljivost členov v isti časovni vrsti je pravilna in ne dvoumna opredelitev pojava, katerega časovna vrsta prikazuje. Ta opredelitev mora biti vso dobo opazovanja enaka in se ne sme spreminjati. 11.21 Ker so spremembe pojava, ki ga časovna vrsta prikazuje, bistveno odvisne od časa, je zelo koristno, če so časovni razmiki med posameznimi členi enaki. Tako dosežemo, da je pri enakem delovanju dejavnikov, spremem- - 294 - ba pojava od člena do člena enaka; rega v nasprotnem primeru ne bi bilo. Zato imamo popise prebivalstva v razdobjih pet ali deset let, popise živine vsako leto na isti datum itd. Kljub temu, da to pogoj na prvi pogled ni težko izpolniti, sov določenih primerih težave. Problem so namreč osnovne vrste, za katere se členi nanašajo no krajša raz¬ dobja, mesece, dekade, tedne itd. Število rojstev po mesecih ne moremo neposred¬ no primerjati, ker se število koledarskih dni v mesecu spreminja od 28 do 31 dni.Raz¬ lika med najkrajšim in najdoljšim mesecem je torej tri dni ali približno 10%. Če bi bili vsi ostali dejavniki, ki vplivajo na število rojstev, stolni, bi bilo število rojstev od meseca do meseca različno tudi za več kot 10% zaradi vzroka, ki nima nobene zveze z rodnostjo. Te razlike so še večje pri pojavih, ki so, kakor na primer proiz¬ vodnja, odvisni ne od koledarskih, temveč od delovnih dni, ker so med meseci za¬ radi različnega števila nedelj in praznikov še večje variacije v številu delovnih dni. Koledar vpliva tudi na pojave, ki imajo tedensko periodičnost. Ker je na primer šte¬ vilo prevoženih potnikov, prometnih nesreč ali nočnin v tujskem prometu ncjvečje okrog nedelje, je številčnost teh pojavov v mesecu bistveno odvisno od števila ne¬ delj in praznikov- v mesecu. Razlike med posameznimi meseci zaradi tega vzroka so tudi do 50%. 11.22 Za trenutne časovne vrste si prizadevamo, da so časovni razmiki med posameznimi členi enaki. Kakor smo že navedli, so popisi prebivalstva no enaka razdobja - vsakih pet ali deset let na isti datum, popisi živine vsako leto na isti datum. Le tako iz časovne vrste dobimo hiter pregled a dinamiki enega ir. drugega pojava. Vendar enakost razmikov med posameznimi členi še ni zadosten pogoj za primerlji¬ vost med členi. Vzemimo, da popisi živine ne bi bili na letne, temveč na primer sedemmesečne razmike. Popis živine bi bil na primer januarja, avgusta, marca na¬ slednjega leta, oktobra naslednjega leta itd^Kljub temu, do so razmiki enaki, spre¬ membe med posameznimi popisi ne bi bile primerljive, ker bi bili kritični momenti - 295 - v roz ličnih delih leta. To pa bistveno vpliva na stalež živine. Da se temu ognemo, izvajamo popise v razmikih, ki so mnogokratniki periode. - v našem primeru leta. 11.23 Čeprav so razmiki med členi pri mesečnih ali četrtletnih trenutnih časovnih vrstah različni, je učinek razlik na časovno vrsto tako malenkosten, da po¬ datkov ne popravi jemo. Pri razmičnih časovnih vrstah pa je ta učinek znaten in moramo podatke pred ana¬ lizo preračunati na enake razmike. To dosežemo tako, da za osnovne podatke, ki se nanašajo na dejanska mesečna razdobja, izračunamo namesto mesečnih vrednosti poprečjo na en dan, enotiri mesec $ 30 koledarskimi ali 25 delovnimi dnevi. Tako odstranimo učinek različne dolžine meseca. Ali preračunamo podatke na 25 ali 30 dni, je odvisno od pojava, ki ga analiziramo. Rojstva preračunamo na koledarski mesec 30dni, enako proizvodnjo v panogah, ki imajo zvezen delovni proces; na mesec 25 dni pa preračunavamo proizvodnjo v panogah in podjetjih, v katerih je delovni proces prekinjen. Tako se najbolj prilagodimo dejanskemu številu dni v po¬ sameznih mesecih. Popravni faktorji za posamezne vrste poprav so nakazani v tabeli 11.7. Tabela 11.7 Poprovnl faktorji za mesečne časovne vrste. Podatke mesečnih časovnih vrst prerač unamo no en otino dolžino meseca tako, da jih pomnožimo z ustreznimi popravnimi faktorji. Vsote popravljenih podatkov so - 296 - brez smisla, ker so popravljeni podatki povprečje, čeprav so osnovni podatki rozmič- nega značaja. 11.8 Reduciranje števila rojstev v SRS v letu 1969 na enotine mesece (Vir: MSP) 11.24 Na velikost pojavov dostikrat vplivajo a d m i n i s tra t i v n i ukrepi, ki z vsebino proučevonega pojava nimajo neposredne zveze. Eden izmed obi¬ čajnih vzrokov so . uprav no-teri to r icl ne spremembe, s katerimi se spremeni geograf¬ ska opredelitev pojova. Toka sprememba je lahko sprememba državnih meja, ki je posledico vojne, ali sprememba upravno-teriforialnij me} znotraj države. Različ¬ na geografska opredelitev onemogoča primerljivost podatkov v časovni vrsti. V tem primeru je potrebno podatke časo/ne vrste za nazaj preračunati na novo območ¬ je, kar je običajno težaven in zamuden posel. Včosih si pomagamo tako, aa zg čc$, ko je nastopila sprememba, navedemo podatek po starem in novem stanju, loko vi¬ dimo, kolika je ob prehodu sprememba zaradi spremembe v teritoriju. Če časovno vrsto za nazaj ne popravimo, moramo proučiti vsa* del posebej, nika¬ kor pa ne smemo proučevati vrsto kot enotno. -.'297- Isti problem so tudi spremembe zarodi drugih administrativnih ukrepom, na primer ko je šlo za prehajanje podjetij iz ene pristojnosti v drugo itd. Tudi v teh primerih ravnamo s spremembami enako kakor pri teritorialnih spremembah. H. 25 Ker se število prebivalstva stalno spreminja, povečana proizvodnja še ne pomeni nujno povečane produktivnosti dela, povečona porabo še ne poveča¬ nje življenjske ravni itd. Vpliv^sprememb v spremenjenem številu prebivalstva odstranimo tako, da izračunc- mo koeficiente "na prebivalca", "na delavca" itd. časovno primerljivost podatkov včasih motijo tudi spremembe v sestavi. Sprememba starostne sestave prebivalstva, ki more nastopiti v daljšem časovnem razdobju, močno vpliva na umrljivost. Primerjava koeficientov mortalitete za dalj¬ še rczdobje zato lahko dc napačno siiko v spremembah v umrljivosti prebivalstva. Spremenjena sestava proizvodnje tako v podjetju kot v večjih gospodarskih združbah ali v celotnem narodnem gospodarstvu odločilno vpliva na sumarne koeficiente o produktivnosti dela, o poprečnih osebnih dohodkih itd. Vpliv spremenjene sestave na določene pojave v časovni vrsti odpravimo s standardizacijo podatkov, to je s koeficienti pri stalni sestavi. O standardizaciji koeficientov je bilo več govora pri koeficientih. li.26 Proizvodnjo, promet v zunanji ali notranji trgovini in druge pojave izraža¬ mo v vrednosti. Cosovno primer javo vrednostnih podatkov moti jo spremembe v cenah, ker ss vrednost proizvodnje, prometa itd. spreminja zaredi sprememb v obsegu in sprememb cen. Vpliv, ki ga povzroča jo spremembe cen, odstranimo tako, do izražamo proizvodnjo, promet itd. v stalnih cenah. Vendar je ta način iz¬ redno zamuden in težko izvedljiv, ker bi ga morali upoštevati že v osnovni evidenci Vpliv cen popravimo tud! z indeksi cen tako, da podatke po tekočih cenah delimo z ustreznim indeksom cen. To način je operativno veliko lažji, je po kljub temu, da je le ocena, zadovoljiv. Le paziti je treba, da je indeks, s katerim popravlja- - 293 - mo podatke, ustrezen po vsebini in značaju. Enostavni pokazovalci dinamike 11.27 Enostavno anaiiziramo dinamiko pojava s primerjavo čienov v časovni vrsti. / Najlaže primerjamo člene časovne vrste z indeksi. Zato z njimi izvedemo več elementarnih pokazovalcev dinamike. Raven je osnovna časovna vrsta. Že iz sprememb v ravni sklepamo na smer in jakost dinamike pojava. Če raven časovne vrste izrazimo v primerjavi z nekim stalnim značilnim členom v časovni vrsti, dobimo vrsto indeksov s stalno osnovo 'k/o= 100Y iA 01 . 8 ) J Absolutna razlike P D k =Y k- Y k-i 01.9) pokaže v absolutnih vrednostih spremembo pojava od člena do člena. Tempo rasti ali stopnja rasti Y i " Y u i T = 100 k v ■— = 100 k Y k-1 Y k-1 •01.10) pokaže relativno razliko od člena do člena. Koeficient dinamike S - Vm (mn) pokaže v obliki koeficienta relativne spremembe od člena do člena. Enak značaj ima ver i žni indeks ' k = 100 ■ Wi 01 - 12 ) - 299 - !e, da relativno spremembo nakaže v indeksu. Ker so vsi ti pokazovalci izpeljani iz osnovne časovne vrste, so med njimi enostav¬ ne zveze: T, = 100 . DjTV, =šl00(K. -l)=T k -100 k < K i k (11.13) 'k " 100 * K k V tabeli 21 .11 je prikazano, kolikšni so posamezni pokazovalci dinamike, če pojav raste, zastane ali pada. Tabela .U ,9'. Vrednosti posameznih pokazovalcev dinamike pri različnem gibanju pojava 11.33 Za svetovno proizvodnjo boksita imamov tabeli 21.12 izračunane vse vrste elementarnih pokazovalcev dinamike. Tabelo 1 1.10 Pokozovolcl dinamike za svetovno proizvodnjo boksita (v tisoč tonah ; vir: S G 58) 11.28 Nakazani pokazovalci dinamike pa niso edini pokazovclci, s katerimi pri¬ kazujemo dinamiko pojava, pogosto prikažemo dinamiko tudi z drugačnimi primerjavami. Izmed teh naj omenimo samo mesečne časovne vrste za pojave, ki so sezonskega značaja. Če je pojav sezonski, primerjava tekočega meseca s pred¬ hodnim mesecem nima logične povezave in smisla. Bolj smiselno je, da primerjamo podatek tekočega meseca s podatkom iz predhodnega leta za isti mesec. Ta dva podatka sta si sorodnejša kakor zaporedna meseca. Ti indeksi imcjo premična osno¬ vo, vendar niso verižni, ker osnova indeksov ni predhodni člen. Enako računamo tudi indekse iz kumulativnih vrednosti dveh zaporednih let. Ta pri¬ merjava je logična, ker obe primerjani vrednosti obsegata isti del sezone v dveh zaporednih letih. V tabeli 11.11 je prikazana standardna primerjava z indeksi iz tekočih podatkov Indeksa za julij 1971 . Za proizvodnjo vseh vrst premoga so izračunani štiri vrste indeksi: l-VII 71 l-VII 70 VII 71 ^ 70 leta; indeks iz kumulative proizvodnje do julija med letoma 1971 in 1970 indeks proizvodnje v tekočem mesecu (julij 71) s poprečjem preteklega -30.1- VII 71 VII 70 = indeks tekočega meseca z istim mesecem preteklega ieta (VII 70) in VII 71 V! 71 = verižni indeks. Tabela 11.11 Proizvodnja premoga v SFRJ v tisoč tonoh (Vir: Indeks Vlil, 1971) Sestavine dinamike v časovnih vrstah 11.29 Časovna vrsta je številčen izraz časovnega delovanja vseh dejavnikov, ki vplivajo na pojav, ki ga prikazuje. Teh dejavnikov je veliko in se njihova ja¬ kost in učinek časovno spreminjata. Zato se členi časovne vrste spreminjajo ; pravimo, da se pojav giblje. Nemogoče je iz časovne vrste izluščiti, kolikšna je sprememba zaradi vsakega posa¬ meznega dejovtiika posebej. Iz časovne vrste pa je moč razbrati skupen učinek dejav¬ nikov, ki imajo soroden vpliv na pojav, ki ga proučujemo. Na časovni vrsti po tem vidiku opazujemo naslednje vrste sprememb: a) trend - T, ki podaja osnovno smer razvoja, b) ciklične spremembe - C, ki izvirajo iz dolgoročnih vzrokov, c) periodične spremembe - P, ki izvirajo iz vzrokov, ki se ponavljajo na stalno razdobje - periodo, - 302 - d) iregularne spremembe - I, ki so rezultat enkratnih epizoaičnih dogod¬ kov ali rezultat stalnih slučajnih vzrokov. Časovna vrsta ni vedno rezultat delovanja vseh sestavin. To ali ona sestavina ne nastopi bodisi zaradi tipa vrste ali ker ni vsebinsko po gojeno . Časovna vrsta let¬ nih podatkov ne kaže sezonskega gibanja, čeprav je pojav mogoče sezonski, marsi¬ kateri pojov nima cikličnih nihanj ali epizcdičnin sprememb zaradi narave pojava. Vsak pojav pa ima neko osnovno smer razvoja. Le redki so primeri nespremenljivih pojavov. Na vsaki časovni vrsti opazimo slučajna nihanja, ki so izraz manjših vzro¬ kov, ki nastopajo v eni ali drugi obliki. 11.30 T r e n d . Vsak ekonomski pojav ima čcsovno neko osnovno smer razvoja. Ta pa je opazna le v daljših časovnih razdobjih. Osnovno smer razvoja ime¬ nujemo trend. Če trend nakazuje razvoj za dolgo razdobje, ga včasih imenujemo sekularni trend . Trend je rezultat dejavnikov, ki pogojujejo ifalfi/i razve; pojava. Tako je trend povečanja proizvodnje električne energije izraz tehničnega napredka, trend zniževanja umrljivosti rezultat razvoja zdravstvene službe in medi¬ cine nasploh itd. Trend proizvodnje električne energije kaže stolna naraščanje, trend gibanja umrljivosti pa stolno padanje. Trend pa more v določenem razdobju tudi spremeniti smer. Tako more proizvodnja nekega izdelka določeno razdobje porašča¬ ti, v nadaljnjem razvoju pa zaradi nadomestitve z drugim izdelkom, ki je bolj ka¬ kovosten, pada. Enako more proizvodnja v rudniku zc neko razdobje naraščati, v nadaljnjem razdobju pa se zaradi osiromašenja rudnika zmanjšuje. Navedli smo že, da je konstantnih pojavo-v malo. Eden izmed njih je na primer spolni indeks - raz¬ merje med številom rojstev dečkov in deklic. To razmerje ima časovno precej stal¬ no vrednost brez težnje naraščanja ali padanja. Odkloni od konstante so le slučajni in ne kažejo težnje k časovni spremembi tega razmerja. Ta primer je prikazan v dru¬ gem poglavju v tdbeii 2.1 . Zaradi drugih vplivov se dejanske vrednosti od. trenda odklanjajo navzgor in navzdol, vendar v večini primerov že iz slike zo časovno vrsto razberemo osnovno smer razvo- ja. - 303 - 11.31 Peri odično nihanje , Zo veliko pojavov je znoč ilen periodičen, z lo- sti sezonski znočaj. Sezonski značaj marsikaterih pojavov povzroče predvsem kiimotski vplivi. Toko je s klimatskimi vplivi povezana gradbeno dejavnost, turizem in gostinstvo, kmetijstvo in vse druge dejavnosti, ki so odvisne od klimatskih vpli¬ vov ali posredno povezane z eno izmed navedenih. Prehrambena industrija je veza- .no na poljedelstvo, promet na turizem itd. Sezonski značaj pa ne izvira nujno iz t iirnatskih vplivov, marveč more biti vzrok tudi drugje. Toko vplivajo ustaljene na¬ vade oli prireditve no sezonski značaj pojavov. Potniški promet, poštni promet, tr¬ govinski promet itd. je odvisen od praznikov, ki so v vsokem letu ob istem času (npr. Novo leto). Enako izzove sezonski značaj določenega pojava prireditev, ki se letno ponavlja no isti datum; tak zgled so npr. gospodarski velesejmi. Pri naj¬ različnejših pojavih pa opazimo periodična nihanja, za katere je perioda krajša kot leto. Tako opozujemo npr. v blagovnem prometu mesečna nihanja, v prometu teden¬ ska ali dnevno nihanja ipd. 11.32 Ciklična nihanja , V časovnih vrstah za daljša razdobja opazimo niho- nja okrog trenda.Ta nihanja so več ali manj regularna, ni pa niti njihova oolžina niti oblika stalna kakor pri periodičnih nihanjih. Ta nihanja po kljub temu, do niso popolnoma regularna, niso slučajna in so odvisna od dogajanj v preteklosti, imenujemo jih ciklično gibanja. Ciklična gibon ja so tipična za ekonomske pojave in jih zasledimo no nizu pojavov. Jakost cikličnih nihanj je za različne pojave raz¬ lične. Odvisna je od tega, oli gre zo pojav, ki je bolj oli monj občutljiv zo spre¬ membe v gospodarskem življenju. Zarodi povezanosti gospodarstva je med cikli zo posomezne gospodarske panoge oli pojave zveze, ker se tako prosperileta kot depre¬ sija prenaša od panoge na panogo. 11.33 ireguiarne variacije. Razen novedenih treh vrst gibanj, trenda, pe¬ riodičnih nihanj in cikličnih sprememb opazujemo na časovni vrsti še iregu¬ iarne variacije, ki so rezuitor enkratnih ali po slučajnih vzrokov. Zarodi prekinit¬ ve toka nastane kratkoročen zastoj v prometu električne cestne železnice. Potres jvplivo no niz dejavnosti. Zaradi prometne nesreče je zastoj v železniškem prometu ( - 304 - zaradi poplave je uničena letina, epidemija vpliva na morbiditeto in mortaliteto itd. Navedeni dogodki so enkratni vplivi, ki imajo za rezultat, da se za krajše razzobje pojav odkloni od rednega poteka. Za razliko od enkratnih - epizooičnin vplivov, ki nastopijo nepričakovano, ven- dor za k rajši čas, nos topa jo sta Ino in v vseh pojavih slučajne variacije, ki so rez ul tat slučajnih vplivov . S luča jne variaci je so manjše spremembe, ki so rezultat nepomembnejšin vplivov. Slučajne variacije le redko obravnavamo posamično,ker za to bodisi ni možnosti ali potrebe. Vloga poprečij pri proučitvi časovnih vrst J1 .34 Enostavno oroaje, ki pomaga proučiti časovne vrste, so poprečja. Ob določe¬ nih pogojih moremo s poprečji neke sestavine v časovni vrsti odstraniti, druge pa ohraniti. Poprečja iz časovnih vrst vpliva jo v eni ali drugi obliki na vse sestavi¬ ne . Ce je trend v razmiku, iz katerega računamo poprečje, linearen, poprečje,ki ga centriramo na sredino razmika, leži na trendu. Če je trend na odseku, iz katere¬ ga računamo poprečje, krivuljčen, je poprečje, centriramo na sredino razmika, nad trendom, če je trend konkaven in pod trendom, če je trend konveksen. Razlike so tem večje, čimbolj je trend ukrivljen. Poprečje, centrirano na obratišče, pa leži na trendu. Iz tega sklepamo, da se časovna vrsta drsečih sredin, če jo izračunamo iz trenda, na odseku, na katerem je trend linearen, skleda s trendom, če pa je trend krivuljčen, dobimo črto, ki je bolj izravnana kot trend. Ker je krivina trenda na daljših odsekih večja, je izravnavanje trenda tem večje, čim širši so razmiki, za ka- t ere iz računavamo poprečja. Izravnavanje ni tako izdatno, če člene, iz katerih računamo poprečja, tehtamo ta¬ ko, da imajo robni členi manjšo, osrednji pa večjo težo. Običajno tehtamo člene z binomskimi koeficienti (1(2*1) za poprečja iz treh členov, (1,3,3,1) za poprečja iz štirih členov, (1,4,6,4,1) za poprečja iz petih členov. Izdelani so še različni drugi načini tehtanja. - 305 - Ce je zvezo med sesiavinomi aditivna, se učinek periodičnih oziroma sezon¬ skih vplivov v poprečju uniči, če je dolžina razdobja, zo katerega računamo poprečje, enako periodi oli mnogokratniku periode. V vrsti drsečih sredin se uniči ciklična sestavina, če so poprečja izraču¬ nana iz razdobjo celotnega cikla. Učinki slučajnih vplivov se v poprečju manjšajo, čim daljše je rozaobje, iz katerega računamo poprečja. Ce ra pravilo izkoriščamo povezano, poprečje ve¬ liko pripomore k proučitvi časovnih vrst. JREND l(m\& le 11.35 Trend proučujemo iz dveh razlogov. Samega zase proučujemo, da spoznamo smer razvoja pojava, da ga primerjamo s trendi za pojave, ki so med seboj odvisni ali pa da proučujemo vpliv trenao na druge sestavine (periodične in ciklične). Trend pa dostikrat iščemo zato, da iz odklonov stvarne časovne vrste od trenda prou¬ čujemo druge sestavine - sezonska, ciklična ali iregulorna nihanja. Metod za določanje trenda je več. Vsaka izmed njih ima za osnovo različne pred¬ postavke in postopke. Zato je pomembno in odgovorno izbrati v vsakem posebnem primeru primerno obliko in metodo za določanje trenda. Trend določamo s prostoroč¬ nim vrisavanjem, z izravnavanjem s sredinami ali analitično s prilagajanjem analitič¬ nih funkcij danim podatkom. Katero metodo uporabimo za določanje trenda, je odvisno od proučevane časovne vrste in namena analize. Če potrebujemo trend zaradi proučevanja cikličnih ali se¬ zonskih odklonov, je logično, da predpostavljamo, da je trend črta, ki poteka med realnimi vrednostmi tako, da se izenačujejo periodični in ciklični vplivi. To črto določamo običajno mehanično. Če pa potrebujemo trend za napovedovanje, iščemo - 306 - za trend funkcijsko obliko, iz katere moremo z ekstrapolacijo oceniti potek trenda budi v prihodnost. li.36 Najvažnejši problem je izbira pravilnega tipa funkcije, ki naj predstavlja niče določajo, da mora biti funkcija, ki jo uporabimo za trend, smiselna, ne pre¬ več zamotana. Po sliki časovne vrste, poznavanju pojava, ki ga vrsta prikazuje in poznavanju last¬ nosti funkcij, ki pridejo v poštev, izberemo v vsakerti določenem primeru, kateri tip funkcije je vsebinsko-in tehnično najprimernejši. Kot trend uporabljamo ali iregularno prilagojene črte ali analitične krivulje. Najeno¬ stavnejša funkcija, s katero pa v mnogih primerih zadovoljivo opišemo smer razvoja, je premica Linearen trend, katerega opisuje premica ima dva parametra: a in b, s katerima je določena osnovna smer razvoja. za določanje trenda. Od njih bomo obravnavali tele: a) prostoročno metodo, b) metodo drsečih sredin, c) metodo najmanjših kvadratov za določanje linearnega trenda. Prostoročnametoda 11.38 Običajno si moremo v grafikonu že iz slike časovne vrste zamisliti potek osnovna časovna vrsta odklanja od trenda navzgor in navzdol. Zato moremo trend T = a + bx (11.14) 11.37 Metode za določanje trenda. Omenili smo že, da imamo več metod trenda. Trend v vsakem primeru poteka med realnimi vrednostmi tako,da se - 307 - včrtati v grafikonu prostoročno. Ta metoda je subjektivna in zato nima posebne analitične vrednosti. Vendar je njena prednost v enostavnosti in hitrosti. Zato jo uporabljamo predvsem za približek in za osnovo pri izbiri analitične oblike trenda. 11.39 V sliki 11.6 je narisana časovna vrsta proizvodnje cinkovega koncentrata na območju S love ni je v razdob ju med obema vojnama od 1919-J 941 , v njej pa prostoročno včrtan trend. Slika .11.6 Trend za proizvodnjo cinkovega koncentrata v Sloveniji med obema vojnama, določen pro¬ storočno - 308 - Tabela 11.12 Proizvodnja cinkovega koncentrate v Sloveniji med obema vojnama v tonah (Vir: SB SRS 1952, št. 8) Leto: | 1919 1 920 1 921 1922 1 923 1 924 1 925 1 926 1 927 1 928 1 929 Proiz- , vodnja j 90 35 0 75 450 600 52 0 510 639 1143 1 076 1 313 Leto: j 1930 1 931 1932 1 933 1934 1 935 1 936 1937 1938 1 939 1 940 1 941 Proiz- j vodnja | 1547 1 301 1358' 2393 2282 2173 2567 2401 4530 3252 4121 3483 Metoda drsečih sredin 11.40 Iz lastnosti sredin, ki smo jih že navedli, sklepamo, da da vrsta drsečih sre¬ din približno linijo trenda, če je trend linearen. Ce pa je trend krivuljčen, se v vrsti drsečih sredin trend bolj ali manj izravnava. Stopnja izravnavanja je od¬ visna od števila členov, iz katerih računamo poprečje. Kot zgled vzemimo časovno vrsto števila umrlih na 1000 prebivalcev v stari Jugoslaviji in vrsto petletnih drsečih sredin. Slika M.2 pokaže, kako se vrsto drsečih sredin giblje med členi v osnovni vrsji .To pa je osnovni pogoj, ki ga mora iz polniti tr end. Vendar je vprašanje, ali je v tem primeru vrsta drsečih sredin res trend, ali pa je v njem ostaia sled morebitnih cik- !ov. V časovnih vrstah, ki vsebujejo periodo in cikel, da vrsta drsečih sredin trend ie, če je trend linearen, poprečja pa izračunana za razdobja, ki so mnogokratniki pe¬ riode oziroma cikla. V vseh drugih primerih časovna vrsta drsečih sredin izravnava trend ali pa ima v sebi ostanek periodične ali ciklične sestavine. Za indeks industri¬ je gradbenega materiala v SFRJ, za katerega smo izračunali vrsto letnih drsečih sre¬ din, na sliki 11.6 jasno vidimo, da je iz osnovne vrste odstranjen sezonski vpiiv in slučajne variacije, ker so poprečja letna. - 309 - - 310 - Indeksi industrije gradbenega materiala v SFRJ z vrisano časovno vrsto desečih sredin. Določitev linearnega trenda po metodi najmanjših kvadratov 11.41 Transformacija časa. Členi v časovni vrsti se nanašajo na zaporedne enake časovne razmike ali trenutke. Za letne časovne vrste so členi označe¬ ni s štirimestnim številom. Če gre za mesečno časovno vrsto pa je oznočevanje členov še bolj zamotano, ker je treba vsak člen označiti Z letom in mesecem. Zato pri analizi časovnih vrst pa tudi v končnih rezultatih čas transformiramo na enostav¬ nejše merjenje. V končnih rezultatih pogosto čas v časovnih vrstah ali funkcijah, ki nakazujejo zakonitosti dinamike, štejemo tako, da je izhodišče v prvem členUj razmiki med členi v časovni vrsti pa so enotina razdobja. V praktičnih primerih ča¬ sovni vrsti z N členi, priredimo naslednje čase: x = 0, 1,2,3,... (N-l). /1 Izkaže pa se, da tudi to štetje časa, kljub temu, da je v primerjavi s koledarskim označevanjem že zelo poenostavljeno, pri izračunanju pokazovalcev dinamike ni vselej najprikladnejše. Pri izračunanju ima veliko prednosti štetje, za katerega je izhodišče v sredini proučevane časovne vrste, razmik med posameznimi členi pa 2 r najmanjše cela števila. To štetje časa ,i me nuje mo ga tehnični čas, zaznamujemo -TFT--— pa je za časovne vrste z lihim številom členov N = 21+1 t : -r-— L/ - -~..—. .NT.L . 2 2 ' -r+ 1 - 2-10 1 2 r-1, r = u Če po je število členov v časovni vrsti sodo,! N -2r, pa gornjim pogojeni ustreza tale vrsta za tehnični čas t: -N+l -hh-3 .-3 -1 1 3 ... N-3 N-l Med tehničnim časom t in časom z izhodiščem v prvem členu x, je glede na to, ali je število členov N liho ali sodo tale zveza: N -1 N = 2r+ 1 ; t = x - —=— N = 2 r ■, t = 2x - (N-l) (11.15) - 311 - 11 .42. Linearen trend. Po metodi najmanjših kvadratov vzamemo kot line¬ aren trend tisto funkci jo, ki zadošča pogoju, da je vsota kvadratov odkionov stvarnih vrednosti od funkcije trenda najmanjša N i=l [ V T( Vi =mln Za primer iineameaa trenda T - b Q + b^f je ta pogoj N 2 22 ( Y. - b - b t. ) = min i o 1 i i=1 !z tega pogoja dobimo, da morata parametra b^ in b, zadoščati enačbama I V =b N ; I Yt = b,I t 2 (11.16) Parametra b Q in b. sta torej: ; b, - ž Y t It 2 2 2 t izračunamo za poljuben N po obrozcih Z t 2 = y( N ^ 1 ) « je N =2i +1 1 I t 2 = 2.(^) če je N = 2i (11.17) (11.18) Za 2 £ N 4 30 so po obrazcih 11.21 izračunane vrednosti 2 t v tabeli 11 • 13. - 312 - Tobela 11.13 I t 2 za 2 4 N -č 30 Da bi dobili parametra b Q in b^, je treba iz časovne vrste izračunati le Z. Y in I Y t ter uporabiti obrazca ] 1 . 17 in tabelo 1 T . 13. Linearen trend, transformiran na prvi člen kot izhodišče, izračunamo po obrazcih r Vn-D, T = |^b o -^-j + bj x za N = 2i + 1 01 . 19 ) T = £b Q - bj (N-l )j+2b^x za N=2i 11.42 Če za naravni prirastek na tisoč prebivalcev za SFRJ po nakazani metodi izračunamo linearen trend, dobimo: I Y =134,9 1 Yt-61>9 134,90 =£T I f2= 330 - 313 - 61,9 330 = " 0,1876 Yt 2 f T = b + b t = 13,49 - 0,1876 t ali transformiran T =[b - b 1 (N-l)j + 2 b, x = 15,1784 - 0,3752 x Ker ie T =T^ - ^ =2 b, , dobimo vrsto trenda, če začetnemu trendu T q = 15,1784 kumulativno prištevano 2 b^ = -0,3752 =^T T 1 =T q + Al = 15,1784 - 0,3752 = 14,8032 T 2 =T, + Al = 14,8032 - 0,3752 = 14,4280 na ra vn i priros te k '' na 1000 prebivalcev N IY- 134,9 10 13,49; b, = Slika 1.1.7." Trend za naravni prirastek prebivalstva ta SFRJ v razdobju 1955-1964. - 314 - DVANAJSTO POGLAVJE PROUČEVANJE ODVISNOSTI MED MNOŽIČNIMI POJAVI 12. 1 V prejšnjih poglavjih smo proučevali posamezne znake samostojno, brez zveze z drugimi znaki. Te metode analize statističnih podatkov zelo podrobno obrav¬ navajo značilnosti za posamezne znake. Vendar obsegajo samo dei analize statistič¬ nih podatkov. Ne zajemajo namreč enega izmed najvažnejših problemov v analizi socia Ino-ekonomskih pojavov in množičnih pojavov na sploh, to je njihovo medseboj¬ no odvisnost in povezanost. Pri proučevanju socialno-ekonomskih pojovov namreč če- sto naletimo na problem povezanosti in odvisnosti med pojavi. Obseg proizvodnje kme¬ tijskega obrata je odvisen od velikosti obrata, strukture osnovnih sredstev, delovne sile, klimatskih faktorjev itd. Vrednost proizvodnje industrijskega obrata je odvisna od števila delavcev, mehanizacije, produktivnosti dela, vrste proizvodnje itd. Cena je odvisna od količine blaga, ki je na trgu, osebni dohodek od kvalifikacije, služ¬ bene dobe itd. V medsebojni povezavi sta tudi nepismenost moških in nepismenost žensk po občinah, starost ženino in neveste, itd. Podobnih primerov moremo našteti veliko. Vendar niso vsi pojavi med seboj povezani, čeprav bi po vsebini mogii od¬ visnost pričakovati. Imamo pa tudi primere nesmiselne povezave. Nesmiselno je npr. proučevati odvisnost med številom porok in množino padavin po letih, cene kmetij¬ skih pridelkov od obolelosti za tuberkulozo itd. FUNKCIJSKE ODVISNOSTI 12.2 O funkcijski odvisnosti med x in y v matematičnem smislu govorimo, če je dano neko pravilo zveze med neodvisno spremenljivko x in odvisno spremen- - 315 - Ijivko y , po koterem določeni vrednosti neodvisne spremenljivke x ustreza ena a li ve č natančno določenih vrednosti odvisne spremenljivke y.. S simbolom pišemo: Y = f(x) ( 12 . 1 ) in pravimo: y je funkcija od x. Funkcijska zveza med y in x je običajno nakazana z enačbo funkcije, iz katere mo¬ remo za vsok x izračunati ustrezno vrednost y. Tako je npr. za funkcijo 2 y = 2 x + 3 x x = 2 ustrezna vrednost y =2.2+ 3.2 2 = 16. ( 12 . 2 ) b) 2 S lika 12.1 Slika funkcijske odvisnosti y = 2x + 3x Razen z obrazcem moremo funkcijsko odvisnost med x in y nakazati tudi z nizom dvojic us treznih vrednosti x iny. Tako je v tabeli 12.1 dana funkcijska zveza iz - 316 - gornje enačbe za osem parov vrednosti x in y. Tabela 12.1 Pari vrednosti za x in y S sistemom dvojic pa za gornji zgled ne moremo podati funkcijske zveze med x in y za vse vrednosti x. To moremo prikazati edino z enačbo med x in y. Niz dvojic vrednosti x in y moremo prikazati tudi grafično v pravokotnem koordi¬ natnem sistemu. Posamezno dvojico vrednosti x, y po znanem načinu prikažemo s točko v pravokotnem koordinatnem sistemu. Kolikor dvojic ustreznih vrednosti x in y imamo, toliko imamo točk v koordinatnem sistemu. Medtem ko moremo niz dvo¬ jic vrednosti grafično prikazati s sistemom točk, prikažemo funkcijo, dano z obraz¬ cem, s krivuljo. V določenem razmiku ustreza vsaki vrednosti x funkcijska vred¬ nost y. Slika niza dvojic iz tabele 12.1 je prikazana v sliki 12.la, slika funkcij¬ ske odvisnosti iz obrazca 12.2 pa v sliki 12.Ib. Funkcijske odvisnosti moremo torej prikazati na tri načine: a) z enačbo: y = f(x), b) v tabeli z nizom ustreznih vrednosti x in y, c) grafično s sistemom točk ali s krivuljo v pravokotnem koordinatnem sistemu. - 317 - KORELACJJSKE ODVISNOSTI 12.3 Če prenesemo pojem funkcijske odvisnosti na množične pojove, bi imela v primeru funkcijske odvisnosti med površino in proizvodnjo kmetijskega gospo¬ darstva vsa gospodarstvo z enako površino enako proizvodnjo. Vendar to ni tako. .Čeprav sta površino gospodorstva in proizvodnja med seboj odvisni, imata gospodar¬ stvi z enakima površinama le redko enako proizvodnjo. Se več. Čeprav sodimo,da ima večje gospodarstvo več jo proizvodnjo, veljo ta odvisnost samo na splošno, v po¬ sameznih primerih pa more imeti tudi večje gospodarstvo manjšo proizvodnjo. Do te¬ ga pride zato, ker proizvodnja ni odvisna samo od površine, temveč še od mnogo dru¬ gih faktorjev. Poizkus, da bi odstranili vse aodatne faktorje in tako prišli do funk¬ cijske povezave med dvema znakoma, se ne bi posrečil. Vedno ostanejo neki^gk- torji, katerih vpliv ne moremo odstraniti in kontrolirati in jih štejemo med slučajne f aktorje ■ Pri množičnih pojovih moremo torej opazovati le splošno tendenco odvi sno- sti, v posameznih primerih pa zakonitost zaradi delovanja dodatnih - posamičnih vplivov ni nujno vidna. Zato imenujemo za razliko od funkcijskih odvisnosti te vr¬ ste odvisnosti korejocijske. odsusnižShi • Proučevanje korelacijskih odvisnosti je različno od proučevanje funkcijskih odvisno¬ sti, čeprav imata obe vrsti proučevanja svoje stične točke. Prikazovanje korelacijskih odvisnosti Korelocijske odvisnosti prikazujemo na enake tri načine kakor funkcijske odvisnosti: (a))v tabeli z nizjpm dvojic vrednosti..koreliro nih p odatkov zc vsako enoto populacije, ali v korelociiski tab eli, (b ^ s točkami v k ore la c i js ke m .grafikonu , c) v funkcijski obliki z r egresijsko funkcijo oli črto . l2.4Niz dvojic podo tkov . Z nizom dvojic vrednosti korelironih podatkov na splošno prikazujemo osnovne podatke pri proučevanju korelacije med pojavi. Čeprav je ta način nepregleden in iz njega še ne dobimo vtisa o zakonitosti povezave - 318 - med dvema pojavoma, ga pogosto uporabljamo, ker je osnova za vsa nadaljnja pro¬ učevanja . Ker je vir podatkov o množičnih pojavih populacija, posamezna dvojica korelironih podatkov velja za posamezne enote proučevane populacije. V tabeli 12.2 so prikazoni osnovni podatki zo proučevan je korelacije med odstot¬ kom nepismenega prebivalstvo (x) in odstotkom nepismenih žensk (y) v SFRJ v letu 1961 po okrajih. Tabela 12.2 Odstotki nepismenega prebivalstvo (x) in odstotki nepismenih žensk (y) v SFRJ v letu 1961 po okrajih 9,8 14,1 12,1 16,8 11,6 16,6 8,6 'll,6 12,1 17,2 4],1 56,0 V tabeii 12 -3 so prikazani dohodki in stroški za kulturno in družbeno življenje za 36 de¬ lavskih družin v Mariboru v novembru 1957. .- 319 - Tabelo 12.3 Dohodki v tisočih dinar jev (x) in stroški za kulturno in družbeno ži¬ vljenje v dinarjih (y) za 36 delavskih družin v Mariboru v novembru 1957. (Vir: Anketa ZS SRS o življenju delavcev in nameščencev) V tabeli 12.4 so podatki o odstotkih travniških in pašniških površin za okraje v SRS po stanju v letu 1952. Tobela 12.4 Odstotki travniških in pašniških površin po okrajih v SRS po stanju leta 1952. (Vir: Statistični bilten SRS) -320r 12.5 Iz gornjih treh primerov sklepamo še no določeno vsebinsko razliko med kore¬ kcijskimi odvisnostmi. V prvih dveh primerih je jasno, da je delež nepismenih odvisen od republike, stroški zo kulturne in družbene potrebe pa od dohodkov, ne pa obratno. To so v z r o č n e povezave oziroma odvisnosti, ker je en pojav vzrok, drugi pa posledica ali statistično, en znak faktoriolen, drug pa rezultati- ven. Vzročne povezave pa ne zasledimo v primeru odstotka površin, ker .ne moremo reči, da je visok odstotek travniških površin vzrok za nizek odstotek pašniških površin ali obratno. Kljub temu, da med njima ni vzročne odvisnosti, pa sta fa dva podatka med seboj povezana, ker na oba vplivajo isti pogoji, ki imajo v našem pri¬ meru za posledico, da je travnikov mnogo, pašnikov pa malo in obratno. Dva taka odločilna skupna.faktor ja sta npr. nadmorska višina in vrsto tal. Na podobno nevzročnohč is t o jk or e I a c i j s k o povezavo naletimo npr. tudi pri proučevanju korelacije med odstotkom nepismenih žensk in moških po okrajih. Čeprav med nepismenostjo moških in žensk ni vzročne povezanosti, sta med seboj v korelaciji, ker na oba deluje isti kompleks faktorjev, od katerih je odvisno ne¬ pismenost. To so npr. število šol v okraju, kulturno prosvetno dejavnost v preteklo¬ sti itd. -321- Medtem ko pri vzročnih odvisnostih po pravilu proučujemo samo odvisnost posledi¬ ce od vzroka, moremo pri čistih korelacijskih odvisnostih proučevati odvisnost zna¬ ka x od y in obratno, odvisnost znaka y od x. 12.6 K or e I a c i j s ka tabela. Že pri majhnem številu enot je prikazovanje po¬ samičnih dvojic koreiiranih podatkov v gornji obliki zelo obširno in nepregled¬ no. Zato za večje populacije prikazujemo korelirane podatke v kombinacijski tabe¬ li, ki jo imenujemo korelacijska tabela. Kakor dobimo frekvenčno porazdelitev, če podatke uredimo v razrede po enem znaku, dobimo korelacijsko tabelo, če podatke uredimo v razrede po obeh koreiiranih znakih hkrati. Položaj frekvenc v korelacij- ski tabeli zelo nazorno pokaže smer povezave med koreliranima znakoma. Kot zgled je v tabeli 12.5 prikazana korelacijska tabela med poprečnim neto oseb¬ nim dohodkom vseh zaposlenih (x) in poprečnim osebnim dohodkom direktorjev v le¬ tu 1963 za 205 izbranih podjetij iz ankete o neto osebnih dohodkih v letu 1963. Tabela 12.5. Korelacijska tabela med poprečnim mesečnim dohodkom zaposlenih in poprečnim mesečnim dohodkom direktorjev za 205 v vzorec izbranih obrtnih poči jeti j v letu 1963 v SFRJ (v tisoč starih dinarjih). Vir: SZS SB 369, Beograd, 1965. Podatki v tabeli 12 .5 pomenijo število enot, ki ima vrednost ustreznemu kombiniranemu razredu. Toko je npr. bilo 19 podjetij, v katerih je bil poprečen osebni dohodek zaposle- - 322 - ne go od 1 0-20 tisoč din,poprečen dohodek direktorja pa med 40 in 60 tisoč din. Korelacijska tabela je torej frekvenčna po razd elitev, v kateri je populacija razde¬ ljena v razrede po dveh znokih hkrati. Iz korelacijske tabele je jasno razvidna korelacijska odvisnost med x in y. 12.7 Korelacijski grafikon, f Nazorno prikažemo korelacijo med dvema zna¬ koma v korelacijskem grafikonu. V njem je vsaka dvojica vednosti prikazana % nepismenih - 6 U +- ske 50 + 40 30 20 10 + A 0 O * © o »8 11 A ‘A - + - 10 Legenda: + BiH . Črna Gora * Hrvafska 0 Makedonija X Slovenija 0 Srbija 20 30 40 % nepismenih - skupno 50 Slika 12.2. Korelecijski grafikon med odstotkom nepismenega prebivalstva in odstot¬ kom nepismenih žensk v SFRJ v letu 1961 po okrajih. - 323 - s točko v pravokotnem koordinatnem sistemu, v katerem je na abscisi skala za znak x, na ordinati pa skalo za znak y. V korelacijskem grafikonu je torej toliko točk, kolikor je enot populacije. Ker s pogledom zajamemo vse točke hkrati, je korelaci¬ ja med dvema znakoma v korelacijskem grafikonu vidna neposredno. _ V slikah 12.2, 12.3 in 12.4 so prikazani korelacijski grafikoni podatkov iz tabel 12.2, 12.3 in 12.4. Izda v d 2000 13U0 1000 300 0 Slika 12.3. Korelacijski grafikon med dohodki in izdatki za kulturno in družbeno življenje za 36 delavskih družin v Mariboru v novembru 1957. Dohodki v 10 din - 324 - pašnikov 4u .. 2u + 10 + + --+ • 0 10 'L travnikov 20 30 Slika 12.4. Korelacijski grafikon med odstotkom travnikov in odstotkom pesnikov za okraje v SRS v leto 1952. Regresijska krivulja 12.8 Slike 12,2, 12.3, 12.4 so zelo poučne in pokažejo bistvo korelacijskih odvis¬ nosti. Kakor smo že nakazali, med socialno-ekonomskimi pojavi ni funkcij" .....___ ske zveze, ker pojavi niso nikdar odvisni samo od enega znaka, temveč nanj vpliva¬ jo vedno najrazličnejši posamični vplivi, ki motijo oziroma zabrišejo zvezo med dve¬ ma pojavoma. Iz-slike 12.2, ki prikazuje korelacijo med deležem nepismenega pre¬ bivalstva in deležem nepismenih žensk v SFRJ v letu 1961 po okrajih, sklepamo, da je odvisnost med deležem nepismenih žensk in nepismenega skupnega prebivalstva ve¬ lika. Točke se zelo določeno goste okrog neke črte, s katero bi mogli prikazati od¬ visnost v nepismenosti. To črto, ki gre med vrisanimi točkami, imenujemo r e g r e - -: 325 - sij. k o krivuljo. Regresijsko krivulja pokaže, kakšna bi bila zveza med koreliranima znakono, če ne bi bilo posamičnih vplivov. V tem primeru bi bile toč¬ ke za vse enote na regresijski krivulji. Odvisnost med pojavoma bi bila funkcijska. Zaradi posamičnih vplivov po se točke bolj o ji manj odklanjajo od idealne regresij- ske krivulje. Korelacijsko odvisnost moremo torej pisati z obrazcem (12.3) Pri tem pomeni: f(x) = funkcijska oblika regresijske krivulje, e = rezultat posamič¬ nih vplivov, ki more biti pozitiven ali negativen. Za posamezno enoto moremo vred¬ nost y razstaviti v dva dela: jy. = f(x.) + e. j, f(x.) je del, ki izvira iz povezanost) med y in x, e. pa je rezultat posamičnih vplivov na enoti i. Cim večji so posamični vplivi e, tem večji so odkloni točk in tem bolj je zabrisana regresijsko krivulja. To nazorno vidimo, če primerjamo sliko 12.2 s sliko 12.3. Regresijsko krivulja je v pr¬ vem primetu dobro vidna, ker so posamični odkloni od regresijske krivulje v primeru nepismenosti majhni. Regresijsko krivulja pri korelaciji stroškov za kulturno in druž¬ beno življenje pa je manj vidna, ker so v tem primeru posamični vplivi zelo veliki. Iz tega sklepamo, da je v prvem primeru korelacijska odvisnost večja kakor v dru¬ gem. Korelacijska odvisnost more torej biti večja ali ma n j ša . Na jvečja je v skrajnem primeru funkcijske odvisnosti (e = o), najmanjša pa v primeru neodvisnosti (f(x) = C). Če sto dva pojava neodvisna, na korelacijškem grafikonu ne moremo za¬ črtati črte, za katero bi mogli reči, da je regresijsko črta. Takrat se točke brez reda goste okrog točke, ki ima za koordinati aritmetični sredini koreliranih znakov. V prvih dveh zgledih opazimo, da je smer regresijske krivulje toka, da se veča vred- nost enega znaka, če se veča vrednost drugega. Takim vrstam povezav pravimo pozitivne povezave. Če pa se z večanjem enega znaka vrednost drugega manj¬ ša, pa pravimo, da je povezava negativna.. Negativna povezanost je med odstotkoma travniške in pašniške površine po okrajih, prikazana v sliki 12.4. Iz go¬ stitve točk moremo sklepati, da je za okraje z večjim odstotkom travnikov odstotek pašnikov v splošnem manjši in obratno. - 326 - V sliki o odvisnosti proučevanih deležev o nepismenosti po okrajih, je črta, ki po- nczorjo regresijsko krivuljo, premica , v obeh drugih primerih pa krivuljo . V prvem primeru govorimo o linearni p ov e z a \m , v obeh drugih pa o krivuljčnl po¬ vezavi med dvema pojavoma. Metode določanja regresijskih krivulj 12 .9 Eden izmed osnovnih problemov regresijske in korelacijske analize je določi¬ tev regresijske krivulje. Določamo jo v splošnem po treh metodah: o) prostoročno, b) z grupnimi sredinami, c) analitično. 12.10 Pj^os toročno določanje regresijske krivulje. Iz slik 12 .2,12.3 in 32.4 vidimo, da je smer regresijske krivulje bolj ali manj vidna že iz kore¬ kcijskega grafikona. Zofo moremo pri nekaterih slabše, pr! drugih pa bolje, včrtoti regresijsko krivuljo prostoročno. Za regresijsko krivuljo imamo krivulja, ki jovčrta- mo med točke tako, da se meglici točk najbolje prilega. Seveda ne sme biti vrisana črto preveč komplicirana, marveč čimbolj izglajena. V naših primerih regresijsko krivuljo najlaže včrtamo za pojava, prikazana v sliki 12.2, za katera je povezava največja. Zato je regresijsko krivulja najbolj vidna. Težja je odločitev v drugih dveh zgledih. Prostoročno včrtovanje regresijskih črt je prikladno, ker je izredno preprosto, ima pc to napako, je subjektivno. Regresijsko črto rišemo prostoročno kot osnovo za dru¬ ge načine določanja regresije. V dosti primerih po je kljub subjektivnosti ravno za¬ radi svojeJiitresti v primerjavi z drugimi metodami zelo koristna. 12.11 Metoda grupnih sred in . Če izhajamo iz obrazca y = f(x)+ e (12.4) za določanje regresijske krivulje s pridom uporabimo grupne sredine. Če za enote, - 327 - ki imajo iste ali ne preveč rczlične vrednosti x, izračunamo poprečje iz vrednosti y, dobimo: y = f(x) + e = f(x) ■ 0'2.5) • Ker štejemo, da je x konstanten, je konstantna tudi vrednost f(x), poprečje kon¬ stante pa konstanta. Po znanih stavkih o sredinah pa se v poprečju vpliv posarmčf nih ali slučajnih faktorjev sicer ne uni či, omili se pa vsekakor. Z vrsto poprečij po grupah x dobimo tako niz točk, ki so vsej v bližini regresijske krivulje, če že niso na njej.,Če te točke vrišemo v korelacijski grafikon in zvežemo z daljicami? dobimo lomljeno črto, ki je zarodi gornjih lastnosti dober približek poteka regresij¬ ske krivulje. Po metodi grupnin sredin določamo regresijsko krivuljo torej ta«ole: a) Dvojice vrednosti x, y grupiramo v razrede po vrednosti x. Grupe morajo biti take, da razredi za x niso preširoki, da pa število enot v njih ni premajhno. b) Za vsako grupo izračunamo aritmetični sredini zo vrednosti x in y. Tako dobimo vrsto dvojic grupnih aritmetičnih sredin x|< in c)'V korelacijskem grafikonu narišemo ročke, ki imajo kot koordinati ustrezne grup- ne aritmetične sredine zc x in y (x^, y, ). Tako imamo v grafikonu toliko točk, ki leže na regresijski krivulji ali v njeni bližini, kolikor imamo grup. d) Vrisane točke gruonih sredin med seboj zvežemo z daljicami. Lomljena črta, k! jo dobimo, je približno regresijsko krivulja. 18.12 Po tej metodi določimo regresijsko krivuljo za odvisnost stroškov za kultur¬ no in družbeno življenje za 36 delavskih gospodinjstev v Moriboru. Podatki so vzeti iz tabele 1 2.3. Ker je med dohodki in stroški vzročna zvezo, vzemimo dohodke za neodvisno spre¬ menljivko (x), stroške po za odvisno spremenljivko (y). Po anolizi podatkov glede na veiikost dohodkov vzamemo razrede dohodkov po 5.000 din in po njih razdelimo dvojice vrednosti x in y. Tako grupirani podatki so navedeni v tabeli 12-6. - 328 - Tabela 12.6. Dohodki in izdatki zo kulturno in družbeno življenje iz tabele 12.3, grupirani po višini dohodkov. (x = dohodki v tisoč dinarjev ; y = izdatki v dinarjih) !z grupiranih podatkov izračunamo grupne sredine za x in y. Tabela 12.7. Grupne sredine za dohodke in izdatke za kulturno in družbeno življe¬ nje za 36 delavskih družin v Mariboru iz tabele 12-6 Če grupne sredine vnesemo v korelacijski grafikon, dobimo sliko 12-5. >z slike vi¬ dimo, da se dobljena regresijska črta resnično prilagaja osnovnim vrednostim in da ponazarja smer odvisnosti med dohodki in stroški za kuifurno in družbeno življenje. - 329 - 12.13 Po metodi grupnih sredin moremo določiti regresijsko črto tudi, če so podat¬ ki grupirani v korelocijski tabeli. Grupne sredine v tem primeru izračuna¬ mo po katerikoli izmed metod za izračunavanje sredin iz frekvenčnih porazdeli¬ tev. Te grupne sredine včrfamo nad sredine razrednih razmikov. Slika 12.5. Regresijsko črta med dohodki in izdatki za kulturno in družbeno življenje za 36 delavskih družin v Mariboru v novembru 1957. Za korelacijo med poprečnimi dohodki zaposlenih in dohodki direktotjev v obrti iz tabele 12.5 je smiselno izračunati obe regresijski vrsti sredin, ker zveza ni vzročna. Ker so v korelocijski tabeli podatki že grupirani, grupiranje odpade. Če najprej izračunamo poprečja za dohodke direktorjev za posamezne dohodkovne skupine zaposlenih, dobimo regresijsko črto, ki kaže odvisnost dohodkov direktor¬ jev od dohodkov zaposlenih. Ker je v frekvenčni porazdelitvi dohodkov direktor¬ jev za dohodkovno skupino do 10 tisoč din ena sama frekvenca, je ocena popreč¬ ja sredino razreda =30. Za skupino 10-20 je = j § • ^:r u =40.27 tisoč din itd. - 330 - Iz navpičnih frekvenčnih porazdelitev v korelacijski tabeli dobimo vrsto poprečnih dohodkov direktorjev y^ v odvisnosti od dohodkovnih skupin poprečij za zaposlene, iz vodoravnih frekvenčnih porazdelitev pc vrsto poprečnih dohodkov zaposlenih v odvisnosti od dohodkovne skupine direktorjev X q ■ Ti rezultati so dani v tabeli 12.8. Tabela 12.8. Poprečni dohodki direktorjev za dohodkovne skupine zaposlenih in po¬ prečni dohodki zaposlenih za dohodkovne skupine direktorjev ( tiso¬ čih din) V sliki 1 2.6 sta vrisani obe regresijski črti (x, , y, in y , x ). Medtem ko je prva, k k gg ki kaže, kako se poprečje dohodkov direktorjev spreminja v odvisnosti od dohodkov zaposlenih, skoraj linearna, je druga, ki kaže obrnjene odnose, krivuljčna. Obe regresijski črti se praviloma sekata. Zaradi nazornosti so v sliki v ustreznih poljih vpisane tudi frekvence. - 331 - dohodek direktorjev Sliko 12.6 Regresijske črte sredin med dohodki zaposlenih in dohodki di- • rektorjev iz tabele 18.8. 12.14 Anolitičn a metoda. Regresi js ko krivuljo moremo določiti tudi a na li- tično. Če po analizi podatkov ugotovimo ustrezen tip funkcije y' = f(x ; a, b, c.. .) (12,6) ki ima več parametrov (a, b, c...), primeren za regresijsko krivuljo, je treba gle¬ de na podatke, ki jih proučujemo, poiskati vrednosti parametrov a, b, c..., tako da se regresijsko krivulja danim vrednostim najbolj prilega. Kot merilo prilagojeno- - 332 - sfi krivulje vtarnemo vsoto kvadratov odklonov stvarnih vrednosti y od y' I (/; ■ yf ) 2 = F( a - b / =•••) (12.7) Za regresijsko krivuljo vzamemo izmed vseh krivulj istega tipa tisto, za katero je vsoto kvadratov odklonov stvarnih vrednosti y od vrednosti y'no regresijski krivu¬ lji F (o, b,c...) na jmanj ša. po te j me tod!, ki jo imenujemo j m e tod o na j -j manjših kvadratov, moremo določiti vrednosti parametrov za regresij¬ sko krivuljo in tako regresijsko krivuljo samo. Kadar ugotavljamo regresijsko krivu¬ ljo analitično, uporabi jamo najpogosteje metodo najmanjših kvadratov'. jMere jakosti od v is nos t i J 12.15 Dejavnike, ki vplivajo na določen pojav (y), moremo razdeliti v tri skupi¬ ne: a) na splošne vplive, ki so za vse enote isti. '■ b) na vpliv faktorja x, s katerim je y v korelaciji. -* ( ^ “ Mj f c) na ostale posamične vplive skupno s slučajnostnimi. - ^ ^ Tako je na primer dohodek zaposlenih odvisen od: a) splošnih vplivov: kategorije zaposlenih, časa, za katerega velja dohodek itd., b) let službe, s katerimi je dohodek v korelacijski zvezi, c) drugih, posamičnih vplivov, kot so: vestnost pri delu, šolska izobrazba, delovno mesto, itd. Prav tako je na primer proizvodnja kmetijskega obrata odvisna od: a) splošnih faktorjev: klimatskih razmer, specializiranosti itd. b) velikosti gospodarstva, s katero je proizvodnja v korelacijski povezanosti in c) od drugih, posamičnih faktorjev, ki vplivajo na proizvodnjo, kot so: razlike tol, različna produktivnost dela, različno seme itd. Če poznamo aritmetično sredino y in regresijsko krivuljo y'med x in y, moremo celotno vrednost y za posamezno enoto razdeliti na nakazane tri komponente, od - 333 - katerih vsaka prikazuje rezultat vplivov po naštetih treh skupinah. jy]i e rezultat ^ sel^dejov ni k ov, k* vpliv ajo na pojav; sp lošnih, koreliranega in drugih posamičnih;^' je rezuitat splošnih dejavnikov in koreliranega d ejavnika x; | y jje re- zultot samo splošnih faktorjev. Zato moremo pisati y =Y + ?«0 S <0 f =0 f )0 f »0 Slika 12.7. Vrednosti korelacijskega koeficienta pri različnih razmestitvah točk v koreiacijskem grafikonu. Kvadrat korelacijskega koeficienta (p ^ ime nujemo d e ter m i no c i js k i ko efi- cient za linearno odvisnost. Determinaci jski koeficient sicer nima predznaka,ki bi nakazoval smer povezave, pač pa pove, kakšen del celotne variance je pojasnjen z linearno zvezo med x in y. Zato je analitično pomembnejši kakor korelacijski koeficient. Njegove vrednosti so med 0 in 1. Računanje pokazovalcev za linearno odvi is nos t 12,18 Ce imamo dane posamične podatke x., y. (i = 1,2. .N) za celotno popula¬ cijo, izračunamo pokazovalce linearne regresije in korelacije po shemi: - 339 - 1. y l 2 X 1 2 xy Vi X 2 y 2 2 y l 2 y 2 N 'N N 2 . X=lx Y = 1 ; x N y N I xy 3. M x =X/N My = Y/N K x =Ix-— < =Ixy- N 5. 6 , 7. 8 . 9. 6-=K x /N C -K /N xy rj 6 = _*X = _22 . =b,b 2 =^ K N K y=I y 'IT (18.21) rr •(&-** * ?xy “ T2 ^L ji 7 \J~ £ K, cr-e x y J2L lxy \|KK J x y r ^8.y - ^ I' ” ?xy / ^ ?xy y' = M +b, (x - M ) ’ y 1 x 0“ = cT V1 - P 2 v e.x xl \xy x' = M + b_ (y - M ) x 2 ' y V shemi je nazorno nakazan potek za računanje pokazovalcev linearne odvisnosti. Pogosto posamičnih rezultatov iz točke 1 niti ne pišemo, ker na računskem stroju dobimo vsote iz točke 2 direktno Včasih se izkaže tehnično koristno, če obračunamo pokazovalce linearne odvisno¬ sti iz reduciranih vrednosti u=x-x inv=y-y. Vse količine, razen M = O ' ' O v 2 2 2 2 A X 0 +M u ; M y = >'o +M v s0 invariantne in velja <3* = ^; C = C j b. = b. ' T b = b 0 , o = (? xy uv lxy 1 uv 2 xy 2uv ; xy 3 uv Zgled za izračunan je bomo podali v naslednjih odstavkih. - 340 - 12.19 Za zgled računanja pokazovaicev za linearno odvisnost vzemimo podatke o odstotkih nepismenega pre¬ bivalstvo (x) in odstotkih nepismenih žensk (y) v SR Srbiji v letu 1961 po okrajih iz tabele 12.2. Raču¬ nanje je prikazano po shemi iz 12.18. Tabela 12.9. Računanje pokazovaicev linearne odvisnosti med odstotkom nepismenega prebivalstva in nepisme¬ nih žensk v SR Srbiji v letu 1961 po okrajih - 341 - Iz zgleda spoznamo,, da je odvisnost med deležem nepismenih za vse prebivalstvo in 2 deležem nepismenih žensk ^ve j j k g . saj je determinacijski koeficient ^ = .959. Zato_z_regresi jsko enačbo dokaj dobro ocenjujemo oziroma napovedujemo delež nepis menih žensk, če poznamo delež nepismenega prebivalstva in obratno. • Ce za zgled uporabimo regresijsko enačbo y' = 1,49 + 1,405x ( mgrejTio z njo nap ovedati za posamezne okraje v SR Srbiji delež nepismenih žensk,če poznamo delež nepismenega prebivalstva. Za deveti okraj je delež nepismenega preb valstva = 25,8%. Iz zgornje regresijske enačbe dobimo, da je napoved oziroma ocena deleža za žensko prebivalstvo y ' 9 = 1,49+ 1,405 . 25,8 = 37,7 % Ocenjena vrednost = 37,7% je od prave vrednosti = 38,5% različna le za y 9 - y' 9 = 38,5% - 37,7% = 0,8%. ■ - ;l M v r rt \ ; • '.-trt i ) , , "" „ f-rt-M-';iJ - ^ :i i ^£1 i LiM t.t.\4$r \ f -f, -rti •t ■’ . - > , 'rt " ■ ! . - 1 : Mi rt -' ?: ■ ■ 'rt. ' ’■« ' " ■' ■ m , ??/*> ■ Vrf | ■ •*•< i l&f) ,, '- ' V /- ’ l * / rt ’ ‘‘rt i rt k ’ / ■ r • y / • - * - ' rt ‘ f. • r I v;.Uirt^:>- ;■ • rt- rtlrt;:-rt^ *'? rt " ■ v ' - -rt;, -m;:v;,: rt y it l • “rt-;, rt . y" J|*\- * . , * { £>• j* ’■ vv j-rt .rt.,;- :rt«irt- :i rtM-rtrt: ; ^ •’ -: ?&*: ,: J f J ,. rft.rt 5 ? - cfl i ■irt-rtrt .rt; *; V -' H -,4 'tel f ■ •’ & v . ‘ rt ; r '’ X ] rt- rt|!"T'rt- ; ;:.> rt. ' ^ _ ■* V* rt;!/-!' f5. rt-rrt,- v '-v rt' * : i \ 'rt rt.: srt ' j is s - -;; . rtrt^rt >.■ ?- v Vf : ; -V; 'rt- y ' : .> * - N rt J, ~ s. .''./rt; rt,. i rtir -v« ■> - V , f ' ' - f Irtrtrt rtrtrt . ' f>5rrt>; k .: \ - i ifci i v U* sh* f /’*-r ■ ■ V " ; rt, - : :■ ■:; ; ;-- ’ "■■ - . •" , ' ? •' -i , -rt '.'rt-' ' . - ; rt ; ' • % - :-i - | ; ; : 1 4' I š v > f -i .i;' --:-'- ^'Jiv : /*- j rtv T .rtrt.; .••'?•*.?•• ,U*: k rt S: k: Zj' ;: .. .. ,v--t; I- - ■ ■ ; t. ■{■■■ ■? \ -/1 - rtt -: 1 / • !S J ,v -i • < -^ v '^irtsi ■ * . rt :' rt ; ^ i * ' ’ 'im f; rt'.-, rt. ff -> BIS; s" ‘ ' i : '. 'rtrt' * !»5d rt; rt i »• rtrt;:'rt-. • rt /■ : ' £rt. ' - 'rt.rt V rty * rt--''.- > '' V ' > M 7 - ni.'. -, v ■ ■ \ • • fy č-J \ ■- 'i * 'i »-"'V rt’"’' i rt.rt rti . (■ -A «11 ^ - ' "".V*? ; ;‘V4 . . ■ •- ■ ' . ■ ' .. • % ■ » » -i J- ‘J ■- ‘ ^ • • ! • :: • ; »,.J ; ‘ : • š&ifm ■ 1 .'. 1 ’ .-rt" V-: 'rt. ; ; rt- ' iVrtin rti* v'-’ ■ • • ' . ■ ' ' ' U rt-;.rt- . rt.')vf-‘' ; ; i- i