VPLIV IZBORA PROSTORSKE ENOTE NA REZULTATE GEOGRAFSKIH STATISTIČNIH ANALIZ Marko Krevs* Izvleček Predstavljene so nekatere ugotovitve raziskave učinkov izbora prostorske enote na rezultate geografskih statističnih analiz in na njihovo razlago. V obravnavo vključujemo 26 spremenljivk z naslednjih vsebinskih področij: naravnogeografske značilnosti, prebivalstvo, stanovanja in poselitev, gospodarstvo in zaposlenost, kmetijstvo in kmetijska zemljišča, dohodki prebivalstva ter prostorska dostopnost. Analizirali smo podatke za celotno Slovenijo, zbrane po naslednjih območjih (prostorskih enotah): krajevnih skupnostih, občinah, območjih upravnih enot, naravnogeografskih regijah in ekonomsko-geografskih regijah. Učinek izbora prostorske enote ocenjujemo na podlagi primerjave rezultatov različnih metod: opisnih statistik, korelacijske analize, multiple regresijske analize in analize glavnih komponent. Številni rezultati se s spreminjanjem velikosti prostorskih enot spreminjajo v skladu z našimi domnevami. Vendar pa precejšen del rezultatov odstopa od teh domnev. Na podlagi rezultatov korelacijske analize je mogoče za različne prostorske enote priti celo do nasprotujočih si spoznanj. Zato je nujno, da smo pri razlagi rezultatov pozorni tudi na možne učinke velikosti območij, po katerih so agregirani podatki, in na način opredelitve teh območij. Ključne besede: izbor prostorske enote, območni podatki, statistične analize v geografiji, Slovenija. THE EFFECT OF CHOICE OF SPATIAL UNITS ON THE RESULTS OF GEOGRAPHICAL STATISTICAL ANALYSIS Abstract Presented are certain findings of an investigation about the effects of selecting spatial unit on the results of geographical statistical analyses and their explanation. Included into the discussion are 26 variables of the following subject fields; physico-geogra-phical features, population, dwellings and settling pattern, economy and employment, agriculture and farming lands, incomes and spatial accessibility. Analysed were the data for entire Slovenia, gathered by the following areas (i.e., spatial units): local communities, municipalities, administrative-unit areas, physico-geographical regions, econo-mico-geographical regions and regional planning communities. The effect of selecting spatial units is assessed through the comparison of results of different methods: descriptive statistics, correlation analysis, multiple regression analysis, and principal components analysis. Numerous results change when spatial units are changed which is in accordance with our anticipations based on a premise that correlation exists between * Mag., Oddelek za geografijo, Filozofska fakulteta, Aškerčeva 2, Univerza v Ljubljani, 1000 Ljubljana, Slovenija. the area size and the results of analyses. Yet, a significant percentage of results deviate from these anticipations. In some cases, it is possible to obtain on the basis of correlation analysis even the controversial findings for the same area when using different spatial units. Therefore, it is necessary to pay attention at the explanation of results also on the possible effects of the size of spatial units and the mode of their determination, according to which the data are aggregated. Key words: The choice of spatial unit, areal data, statistical analysis in geography, Slovenia. Uvod V geografskih statističnih analizah, s pomočjo katerih ugotavljamo značilnosti pojavov in procesov ali povezanost med različnimi pojavi in procesi na določenem območju, uporabljamo podatke, zbrane za prostorske enote (največkrat območja) znotraj obravnavanega območja. Z raziskavo, v katero smo zajeli raznovrstne podatke za celotno Slovenijo, smo želeli pokazati, da lahko z odločitvijo o tem, za katere prostorske enote zberemo podatke, pomembno ali eelo odločilno vplivamo na rezultate analize in s tem tudi na raziskovalna spoznanja. Seveda ne poskušamo dokazati, da bomo na primer s proučevanjem izbranega pojava ali povezanosti med pojavi na podlagi podatkov za krajevne skupnosti nujno prišli do bistveno različnih spoznanj, kot s proučevanjem podatkov za naravnogeografske regije. Vendarle pa želimo na pregleden način potrditi dosedanje raziskovalne izkušnje, da so tovrstni učinki izbora prostorske enote na rezultate geografskih statističnih analiz mogoči in pogosto tudi veliki. Problem je v literaturi večkrat predstavljen (npr. Robinson, 1950, Alker, 1969, Openshaw, 1977, 1984, v nekaterih učbenikih statistike za geografe), vendar se zdi, da opozarjanje nanj ni imelo opaznega vpliva na geografske raziskave. Poleg tega so v literaturi opozorila največkrat zelo splošna. Na primer, ne podajajo načina vpliva izbora prostorskih enot na rezultate analiz, največkrat so omejena le na posamezno statistično metodo ali le na proučevanje enega samega pojava. V nasprotju s takšnimi predstavitvami problema smo se njegove obravnave lotili bolj celovito in sistematično: • v vseh primerih analiziramo podatke za celotno Slovenijo; • izbrali smo kazalce (spremenljivke), ki so v rabi v različnih vejah družbene in fizične geografije ter v regionalnem in prostorskem načrtovanju; na ta način smo želeli opozoriti, da ne gre za problem, ki bi bil omejen le na neko ozko družbenogeografsko ali fizičnogeografsko raziskovalno področje, temveč se lahko pojavi v raziskavah na najrazličnejših področjih; • analizirali smo podatke zbrane za prostorske enote različne velikosti — od krajevnih skupnosti, do ekonomskogeografskih regij; • proučili smo učinke izbora prostorske enote na rezultate več metod, ki so pogoste v geografskih raziskavah. Celotni rezultati raziskave so predstavljeni v elaboratu (Krevs, 1997). V tem prispevku predstavljamo le nekatera bolj izstopajoča ali presenetljiva spoznanja. Slovenske raziskovalce, prostorske načrtovalce, politike in učitelje želimo na ta način opozoriti na problem, ki ga morda niso poznali ali se niso zavedali njegovega pomena. Izbor prostorskih enot in območni podatki Vsi podatki, ki smo jih uporabili v raziskavi, so območni. To pomeni, da se nanašajo na območja oziroma razmere na območjih. V besedilu območja določenega velikostnega razreda (merila) in opredeljena po določenih vsebinskih merilih, imenujemo prostorska enota. Prostorske enote, kijih obravnavamo, so krajevna skupnost (stanje 1994), občina (stanje 1997), upravna enota (nekdanja občina), naravnogeografska regija (Gams, Kladnik, Orožen Adamič, 1994) in ekonomskogeografska regija (Vrišer, 1990). Izbor prostorske enote enačimo z odločitvijo o prostorskem merilu in vsebinskih merilih prostorskega agregiranja statističnih enot, na primer prebivalcev, podjetij ali manjših območij. Geografi večkrat govorimo o načinu delitve večjega območja na manjše prostorske enote, kar je le drug pogled na isto odločitev. O prostorskih enotah, po katerih nameravamo proučiti določeno tematiko, se odločimo že med snovanjem raziskave. Odločitev je običajno odvisna od cilja raziskave, željene podrobnosti raziskave in njenih rezultatov ter dostopnosti podatkov. Le redki raziskovalci se zavedajo, da z izbiro prostorske enote vplivajo tudi na rezultate raziskave. Razlike med prostorskimi enotami so velikostne in vsebinske. Velikostne razlike (preglednica 1) so dvojne. Različno opredeljene prostorske enote se razlikujejo v povprečni velikosti. Občine so na primer v povprečju večje od krajevnih skupnosti, te pa od popisnih okolišev. Vendar pa obstajajo razlike tudi med območji “iste vrste”, določenimi na podlagi istih meril (izjema so hektarska kvadratna območja v t.i. rasterskih podatkih). Obstajajo na primer precejšne velikostne razlike med občinami, nekaj je celo manjših od nekaterih krajevnih skupnosti. Preglednica 1: Glavne velikostne značilnosti izbranih prostorskih enot. Table 1: Main size characteristics of the selected spatial units. Število enot Povprečna velikost enot (ha) Standard, odkl. velikosti enot (ha) Koef. variac. velikosti enot (ha) Krajevne skupnosti 1201 1688 2008 119 Občine 147 13791 10979 80 Naravnogeog. regije 91 22276 20182 91 Nekdanje občine (seda- nje “upravne enote”) 62 32697 20320 62 Ekonomskogeog. regije 12 168935 86154 51 Vsebinske razlike se nanašajo na razlike med značilnostmi območij. Z metodološkega vidika je predvsem pomembno, da območja ustrezno zajamejo pojav, ki ga proučujemo. To pomeni, da bi morala biti območja z vidika določenega pojava notranje čim bolj homogena, med seboj pa naj bi se izrazito razlikovala. Takšna območja bi bilo mogoče opredeliti, če bi proučevali en sam pojav oziroma pojave, katerih prostorske razmestitve so si zelo podobne. V geografiji pa praviloma proučujemo več raznovrstnih pojavov hkrati. Statistične metode zahtevajo, da jih predstavimo po istih prostorskih enotah. To nas pripelje do problema, ko so nekateri pojavi po izbranih prostorskih enotah predstavljeni ustrezneje kot drugi. Z drugimi besedami, z vidika nekaterih pojavov so območja notranje homogena, z vidika drugih pa bolj ali manj heterogena. V primeru notranje heterogenih območij obstaja nevarnost t.i. ekološke napake, ki je postala skupna oznaka za probleme pri sklepanju o značilnostih posameznikov na podlagi agregatnih podatkov. Robinson (1950) in Alker (1969) navajata šest “ekoloških napak”, katere najdemo v geografskih raziskavah, ki uporabljajo agregirane podatke. Z vidika naše raziskave sta med njimi pomembni zlasti naslednji: • možnost napačnega sklepanja na predpostavki, da celota ni nič drugega kot vsota njenih sestavnih delov, • možnost ugotavljanja napačne smeri in stopnje korelacijske povezanosti na podlagi agregiranih podatkov. V naši raziskavi smo upoštevali predvsem razlike v povprečni velikosti območij. Vsebinske razlike v opredelitvah območij in njihovo povezanost z rezultati analiz obravnavamo le mimogrede, večinoma pri razlagi mer spremenljivosti. Izbor spremenljivk in metod V raziskavo smo vključili 26 spremenljivk (preglednica 2) z naslednjih vsebinskih področij: naravnogeografske značilnosti, prebivalstvo, stanovanja in poselitev, gospodarstvo in zaposlenost, kmetijstvo in kmetijska zemljišča, dohodki prebivalstva ter prostorska dostopnost. Obravnavali smo torej različne vrste “agregatnih” podatkov (agregiranih po prostorskih enotah), kakršne pogosto uporabljamo v regionalnogeo-grafskih, družbenogeografskih in regionalnoplanerskih raziskavah. Njihovo uporabo zasledimo tudi v drugih vedah, na primer v (prostorski) sociologiji ali ekonomiji, ter na področju oblikovanja in izvajanja politik. Kljub temu daje bil izbor spremenljivk zaradi željene širine razprave opravljen precej arbitrarno, menimo, da smo z njimi vsaj v vsebinskem smislu “pokrili” velik del glavnih področij v omenjenih raziskavah. Učinek izbora prostorske enote ocenjujemo na podlagi primerjave opisnih statistik, rezultatov korelacijske analize, multiple regresijske analize in analize glavnih komponent. Navedene metode so tako široko uporabljane, da jih ne predstavljamo (multivariatne statistične metode predstavlja na primer Johnston, 1989). Preglednica 2: Izbrane spremenljivke po vsebinskih področjih. Table 2: Variables selected by contents. Vsebinsko področje Spremenljivke (kratice v prikazih) A. Naravnogeografske značilnosti povprečna nadmorska višina (NV), povprečni naklon (NAK), delež gozdnih površin od vseh površin 1991 (GOZD) B. Prebivalstvo indeks števila prebivalcev 1991/1981 (19181), indeks staranja 1991 (do 15 let / nad 65 let) (1STAR), gostota prebivalcev 1991 (G91), gostota prebivalcev na poseljenih območjih* 1991 (GP91P), delež kmečkega prebivalstva 1991 (DKM), delež prebivalstva starejšega od 15 let z visoko izobrazbo 1991 (DVIS), delež prebivalcev, ki niso slovenske narodnosti (osebna opredelitev pri popisu prebivalstva) 1991 (DNESLO) C. Stanovanja, poselitev delež poseljenih površin 1991 (DPOSEL) *, delež stanovanj brez centralne kurjave, vodovoda, kanalizacije in elektrike 1991 (DNEOPR), število prebivalcev na sobo 1991 (PR/SOBA), število počitniških stanovanj na 100 stanovanj (VIK/STA), delež “novih” stanovanj (zgrajenih v obdobju 1981-1991) (NOVSTA), delež zasebnih stanovanj 1991 (ZASSTA) D. Gospodarstvo, zaposlenost delež zaposlenih v terciarnih in kvartarnih dejavnostih 1991 (TERK.VAR), delež nezaposlenih 1991 (DNEZAP) E. Kmetijstvo, zemljišča obdelovalnih zemljišč na kmečko gospodarstvo 1991 (OBDZEM), količina umetnih gnojil na kmečko gospodarstvo 1991 (UMGNOJ) F. Dohodki prebivalstva bruto osnova dohodnine na prebivalca 1993 (DOH), delež davčnih zavezancev z visokimi dohodki (v 3., 4. in 5. davčnem razredu) 1993 (ZAV345) G. Dostopnost ** oddaljenost poseljenih površin* od najbližje zdravstvene ambulante 1996 (ZDR), oddaljenost poseljenih površin* od najbližje srednje šole 1996 (SOLSRE), oddaljenost poseljenih površin* od najbližjega kinematografa 1996 (KINO), oddaljenost poseljenih površin* od najbližjih gozdnih površin 1996(RGOZD) * Ocena s pomočjo geografskega informacijskega sistema na podlagi števila stanovanj po hektarskih območjih (rasterskih celicah 100*100 m) v Sloveniji. ** Ocenc s pomočjo geografskega informacijskega sistema na podlagi podatkov v rasterski obliki z osnovno celico velikosti 100x100m. Pričakovani učinki uporabe različnih prostorskih enot Na podlagi statistične teorije in literature pričakujemo, da bodo učinki različnih prostorskih enot na rezultate statističnih analiz na splošno takšni, kot jih prikazujemo v preglednici 3. Tem splošnim pričakovanjem dodajamo še nekaj razmišljanj. Za izračun slovenskega povprečja za določeno spremenljivko na podlagi agre-giranih podatkov bi morali uporabiti metodo obtežene (ponderirane) aritmetične sredine. V tem primeru bi dobili enak rezultat, ne glede na to, katere prostorske enote bi izbrali. Vendar tega v raziskavah, ki temeljijo na prostorsko agregiranih podatkih, skoraj nikdar ne storimo. To je lahko posledica zavestne odločitve, še večkrat pa se tega niti ne zavedamo. V prvem primeru se odločimo ali predpostavimo, da so enote obravnavana območja (oziroma agregatni podatki za ta območja), in ne tiste enote, za katera so bili zares zbrani podatki. Problema pa se največkrat ne zavedamo pri uporabi območnih podatkov v korelacijski, multipli regresijski analizi ali metodi glavnih komponent. Navedene metode namreč temeljijo na korelacijskih koeficientih, ti pa, vsaj posredno, na aritmetičnih sredinah (izračunanih iz že agregiranih podatkov) in odklonih območnih podatkov od njih. Napake, ki lahko nastanejo zaradi neustreznega načina računanja povprečij, so torej lahko vir napak v rezultatih tovrstnih metod, ki lahko vodijo do napačne razlage proučevane tematike. Mere spremenljivosti (variabilnosti) so zelo pomembna informacija pri izbiri prostorske enote v raziskavi. Večja mera spremenljivosti (v tem primeru koeficient variacije, ki omogoča neposredne primerjave) namreč pove, da je neka prostorska enota v informacijskem smislu primernejša za prikaz prostorskih razlik z vidika določene spremenljivke (pojava) kot prostorska enota, za katero je mera spremenljivosti manjša. Večji koeficient variacije pomeni večjo notranjo homogenost območij (z vidika določene spremenljivke) in večje razlike med njimi. Večje koeficiente variacije lahko na primer pričakujemo v analizah podatkov, ki so vsebinsko ali statistično sorodni merilom, po katerih so bila opredeljena območja. Uporabna je tudi informacija, ki jo dobimo s primerjavo spremenljivosti spremenljivk med seboj, za iste prostorske enote. Večji koeficient variacije za določeno spremenljivko pomeni, da njene prostorske razlike bolje prikažemo po izbranih območjih kot za spremenljivke z nižjim koeficientom variacije (po istih območjih). Na podlagi literature in lastnih izkušenj poznamo občutljivost korelacijskega koeficienta za normalnost frekvenčnih porazdelitev spremenljivk, način medsebojnega vpliva dveh obravnavanih pojavov ali za posredne (zunanje) vplive na njuno (morda le navidezno) povezanost. Zato lahko pričakujemo različna odstopanja od “pričakovanih vrednosti” koeficienta. Koeficienti lahko v posameznih primerih kažejo celo različno smer povezanosti dveh spremenljivk, če jih izračunamo na podlagi podatkov za različne prostorske enote. Domnevamo lahko, da takšna spremenljivost korelacijskih koeficientov lahko v posameznih primerih vpliva tudi na prispevke posameznih neodvisnih spremenljivk h kakovosti multiplega regresijskega modela, oziroma na “sestavo” komponent v rezultatih metode glavnih komponent. Preglednica 3: Pričakovano spreminjanje rezultatov izbranih statističnih metod s povečevanjem prostorskih enot. Table 3: The expected changing of results in the selected statistical methods, due to the increase of spatial units. S povečevanjem prostorskih enot pričakujemo: povprečja nihanja izračunanih (neobteženih) povprečij okoli “pravega” povprečja za Slovenijo, predvsem zaradi razlik v nesimetričnosti frekvenčnih porazdelitev podatkov mere spremenljivosti zmanjševanje mer spremenljivosti zaradi vse večje notranje heterogenosti območij in vse manjših razlik med njimi korelacijski koeficienti povečanje korelaeijskih koeficientov in zmanjševanje ali ohranjanje njihove statistične pomembnosti multipli regresijski model izboljševanje kakovosti multiplega regresijskega modela (večanje multiplega korelacijskega koeficienta, zmanjševanje ali ohranjanje njegove statistične pomembnosti) metoda glavnih komponent povečevanje deleža variance, ki ga pojasnjujejo “najmočnejše” komponente (“faktorji”) Rezultati analiz Rezultati analiz podatkov po različnih prostorskih enotah se na splošno, za velik del spremenljivk in prostorskih enot, spreminjajo na način, ki smo ga predvideli v preglednici 3. Vendar pri uporabi različnih metod ugotavljamo precej večjih odstopanj od teh “pravil”. Nekatere, zlasti izrazito izstopajoče ali vsaj na videz protislovne ugotovitve kar kličejo k iskanju vzrokov, zlasti vsebinskih. Vendarle to presega naš namen. Upamo le, da bodo zadostna spodbuda za tovrstna raziskovalska razmišljanja v prihodnje. Rezultati analiz so podrobneje prikazani v že omenjenem raziskovalnem poročilu (Krevs, 1997); na tem mestu si oglejmo le nekatere izstopajoče primere. Dvajset in celo več odstotne razlike med povprečji (za celotno Slovenijo), izračunanimi na podlagi podatkov za različne prostorske enote, se zdijo “normalne” oziroma “pričakovane”. Povprečja za posamezno spremenljivko, izračunana na podlagi območnih podatkov, smo primerjali tudi s “pravim” (obteženim) povprečjem za Slovenijo. Za večino spremenljivk ugotavljamo, da se z večanjem prostorskih enot pov- prečja približujejo “pravemu” povprečju. Na grafikonu (slika 1) je prikazanih nekaj izbranih primerov večjih odstopanj od navedenih “pravil”: • povprečna gostota prebivalstva je za krajevne skupnosti skoraj desetkrat višja kot “pravo” povprečje za celotno Slovenijo in kot povprečja za ostale prostorske enote; • povprečni delež kmečkega prebivalstva in delež stanovanj brez centralne kurjave, vodovoda, kanalizacije in elektrike sta za krajevne skupnosti, občine in naravnogeografske regije do 62 % oziroma 77 % večja kot “pravo” povprečje za Slovenijo in kot povprečja za ostale prostorske enote; • povprečni deleži visoko izobraženih in prebivalcev, ki niso slovenske narodnosti, so za krajevne skupnosti, občine in naravnogeografske regije do 49 % oz. 33 % manjši kot “pravo” povprečje za Slovenijo in kot povprečja za ostale prostorske enote; Slika 1: Primerjava povprečij izbranih spremenljivk, izračunanih iz podatkov za različne prostorske enote, s “pravimi” povprečji za Slovenijo. Fig. I: The selected-variable averages calculated from the data for diverse spatial units, compared with the “correct" averages for Slovenia. GP91 (KS/Slo)=990 250 o ' o ^ 200 --II .o i * c ■ ^ ro CL KS OBC NARREG UPRENO EKONREG SLO Prostorske enote 0--------- GP91 - - A- - DVIS DPOSEL 4---- VIK/STA □ DKM O DNESLO ■ DNEOPR Rezultati za različne prostorske enote so podani od najmanjših proti večjim enotam. Oznake prostorskih enot: KS krajevna skupnost, OBC občina, NARREG naravnogeografske regije, UPRENO nekdanja občina, zdaj upravna enota, EKGEOREG ekonomskogeografska regija, SLO celotna Slovenija. Oznake kazalcev so enake kot v preglednici 2. • povprečno število počitniških stanovanj na 100 stanovanj je za krajevne skupnosti in naravnogeografske regije do 83 % oz. 113 % večje, za občine pa do 53 % večje kot “pravo” povprečje za Slovenijo in kot povprečja za ostale prostorske enote. Mere spremenljivosti se z velikostjo prostorskih enot na splošno spreminjajo bolj v skladu s pričakovanji kot povprečja. Ugotovili smo, daje vpliv velikosti prostorskih enot na koeficiente variacije večji kot na standardne odklone. Za pretežni del spremenljivk ugotavljamo, da se koeficienti variacije z večanjem izbrane prostorske enote bolj ali manj enakomerno znižujejo (primer: spreminjanje koeficienta variacije za delež prebivalcev, ki niso slovenske narodnosti; glej grafikon). Izbrana odstopanja prikazujemo na grafikonu (slika 2): Slika 2: Spreminjanje koeficientov variacije izbranih spremenljivk, izračunanih iz podatkov za različne prostorske enote. Fig. 2: The changing of variation coefficients of selected variables calculated from the data for diverse spatial units. 3.5 2.5 Ö > c o> 'o o 0.5 KS NARREG UPRENO EKONREG OBC Prostorske enote O 19181 ---A- - DVIS •.... DPOSEL □— • GP91 o----------- DNESLO ----------■----PR/SOBA -----------♦---- ZDR Rezultati za različne prostorske enote so podani od najmanjših proti večjim enotam. Oznake prostorskih enot: KS krajevna skupnost, OBC občina, NARREG naravnogeografske regije, UPRENO nekdanja občina, zdaj upravna enota, EKGEOREG ekonomskogeografska regija, SLO celotna Slovenija. Oznake kazalcev so enake kot v preglednici 2. • podobno kot pri povprečjih, se najbolj “nenavadno” spreminja koeficient variacije gostote prebivalstva, ki je izredno visok za upravne enote, krajevne skupnosti in naravnogeografske regije, za druge prostorske enote pa znatno nižji; • spremenljivost indeksa števila prebivalcev 1991/1981 je za občine in druge večje prostorske enote izrazito manjša kot za krajevne skupnosti; • koeficient variacije deleža visoko izobraženih prebivalcev in deleža poseljenih površin je višji za naravnogeografske regije in upravne enote kot za občine in večje prostorske enote; • koeficient variacije oddaljenosti poseljenih površin od najbližje zdravstvene ambulante je višji za občine kot za krajevne skupnosti, sicer pa se znižuje z velikostjo prostorskih enot; • koeficient variacije števila prebivalcev na sobo je med najnižjimi v primerjavi z drugimi spremenljivkami; z večanjem prostorske enote se skoraj ne spreminja. Prikaz korelacijske analize med vsemi obravnavanimi spremenljivkami presega namen prispevka. Izbrali smo dva povsem različna kazalca, bruto osnovo dohodnine na prebivalca in delež prebivalcev, ki niso slovenske narodnosti, ter ugotavljali njuno korelacijsko povezanost z vsemi ostalimi obravnavanimi spremenljivkami, predstavljenimi v preglednici 2, za vsako prostorsko raven (velikost prostorske enote) posebej. Slednji kazalec v veliki meri kaže narodnostno, posredno tudi etnično in kulturno raznolikost prebivalstva po prostorskih enotah. Številne raziskave, tudi na slovenskih primerih (na primer Špes, 1994) kažejo, da je kazalec povezan tudi z drugimi vidiki kakovosti družbenega in “fizičnega” bivalnega okolja. Prvi kazalec posredno prikazuje dohodek na prebivalca, ki sodi med najpogosteje uporabljane ekonomske kazalce življenjske ravni prebivalstva. V slovenskih raziskavah se kazalec šele uveljavlja (Piry, 1994, 1996; Krevs, 1996). Ugotavljamo, daje korelacijska povezanost večine spremenljivk z bruto osnovo dohodnine na prebivalca izrazito odvisna od izbora prostorskih enot. Izbrani primeri izrazitejših odstopanj od približno enakomernega naraščanja korekcijskih koeficientov z večanjem prostorskih enot prikazujemo na sliki 3: • za naklon površja je korelacijski koeficient negativen za krajevne skupnosti in naravnogeografske regije, za občine in upravne enote je približno nič, za eko-nomskogeografske regij pa pozitiven; • za indeks števila prebivalcev je koeficient skoraj enak nič za krajevne skupnosti, velik za občine in ekonomskogeografske regije, za naravnogeografske regije in upravne enote pa je znatno nižji, kot bi pričakovali; • za gostoto prebivalcev je koeficient za ekonomskogeografske regije približno nič, za druge prostorske enote pa srednje visok; • za delež prebivalcev, ki niso slovenske narodnosti, je koeficient nizek za krajevne skupnosti in med najvišjimi za ekonomskogeografske regije; • za količino umetnih gnojil na kmečko gospodarstvo je koeficient nizek (negativen) za krajevne skupnosti in med najvišjimi (negativnimi) za ekonomskogeografske regije; • za oddaljenost poseljenih površin od gozda je koeficient srednje visok (pozitiven) za vse prostorske enote, le za občine je približno nič; • za delež poseljenih površin je koeficient srednje visok (pozitiven) za krajevne skupnosti in upravne enote, okoli nič za občine in naravnogeografske regije, visok (negativen) pa za ekonomskogeografske regije. Slika 3: Korelacijska povezanost bruto osnove dohodnine na prebivalca z izbranimi kazalci, za različne opredelitve prostorske enote. Fig. 3: Correlational relation between the gross income per capita and the selected indicators, presented for diverse definitions of spatial units. 0.6 C 0) O 0.4 Q) O jx: o- 0.2 cn o 03 -0.2 > o c o CO -0.4 03 CD Q- -0.6 KS OBC NARREG UPRENO EKONREG Prostorske enote 0-------- NAK - - A- - GP91 ...............•...... DPOSEL □--------19181 -.--o---- DNESLO ■ UMGNOJ -------------------------±------- RGOZD Rezultati za različne prostorske enote so podani od najmanjših proti večjim enotam. Oznake prostorskih enot: KS krajevna skupnost, OBC občina, NARREG naravnogeografske regije, UPRENO nekdanja občina, zdaj upravna enota, EKGEOREG ekonomskogeografska regija, SLO celotna Slovenija. Oznake kazalcev so enake kot v preglednici 2. Ugotavljamo, da tudi na korelacijsko povezanost med deležem prebivalstva, ki niso slovenske narodnosti (“Neslovenci”), in drugimi obravnavanimi spremenljivkami, vpliva izbor prostorske enote. Izbrani primeri izrazitejših odstopanj od približno enakomernega naraščanja korelacijskih koeficientov z večanjem prostorskih enot prikazujemo na sliki 4: Slika 4: Korelacijska povezanost deleža prebivalcev, ki niso slovenske narodnosti, z izbranimi kazalci, za različne opredelitve prostorske enote. Fig. 4: Correlational relation between the percentage of non-Slovenian inhabitants and the selected indicators, presented for diverse definitions of spatial units. 1 0.8 C (D 0.6 O <1) O 0.4 C/) 0.2 o 03 0 0 O > o -0.2 c o cn -0.4 m LL -0.6 -0.8 KS OBC NARREG UPRENO EKONREG Prostorske enote JI -a■ 0--------- GOZD - - A- - GP91 •..... NOVSTA -- ZAV345 □— 19181 O-- PR/SOBA ---------■----ZASSTA ---------A----- SOLSRE Rezultati za različne prostorske enote so podani od najmanjših proti večjim enotam. Oznake prostorskih enot: KS krajevna skupnost, OBC občina, NARREG naravnogeografske regije, UPRENO nekdanja občina, zdaj upravna enota, EKGEOREG ekonomskogeografska regija, SLO celotna Slovenija. Oznake kazalcev so enake kot v preglednici 2. • za delež gozdnih površin je korekcijski koeficient najvišji (negativen) za upravne enote; • za indeks števila prebivalcev je koeficient za naravnogeografske regije višji, kot za upravne enote; izrazito najvišji je za ekonomskogeografske regije; • za gostoto prebivalstva koeficient upada; • za število prebivalcev na sobo je koeficient približno nič za krajevne skupnosti in naravnogeografske regije, izrazito visok (negativen) pa za ekonomskogeografske regije; • za delež novih stanovanj je koeficient srednje visok za ekonomskogeografske regije, za druge prostorske enote pa približno nič; • za delež zasebnih stanovanj je koeficient visok (negativen; najvišji za naravno-geografske regije), razen za ekonomskogeografske regije (nizek in negativen); • za delež davčnih zavezancev z visokimi dohodki je koeficient srednje visok za manjše in visok za večje prostorske enote. Zaradi pogoste uporabe korelacijske analize v geografskih raziskavah (ki pomeni tudi temelj za številne multivariatne statistične metode) je ta del rezultatov še posebno zanimiv. Tej tematiki je bilo tudi sicer v literaturi namenjene največ pozornosti (na primer Robinson, 1950, Openshaw, Taylor, 1979, Openshaw, 1984). Kljub temu da številni rezultati terjajo podrobnejšo raziskavo in razlago, pa to presega namen tega prispevka. Podobno kot pri korelacijski analizi, smo se tudi pri multipli regresijski analizi odločili le za izbrani primer regresijskega modela. Na podlagi obravnavanih spremenljivk (iz preglednice 2) bi bilo seveda mogoče izdelati še veliko število smiselnih regresijskih modelov. V našem primeru smo izdelali model za napovedovanje gostote prebivalcev na poseljenih območjih (“odvisna spremenljivka”) na podlagi sledečih (“neodvisnih”) spremenljivk: indeksa staranja, deleža kmečkega prebivalstva, deleža prebivalstva, starejšega od 15 let, z visoko izobrazbo, deleža prebivalcev, ki niso slovenske narodnosti, bruto osnove dohodnine na prebivalca in deleža davčnih zavezancev z visokimi dohodki. Zaradi medsebojne primerljivosti kazalcev “kakovosti modela” (R2 in “statistično tveganje”) smo v vseh primerih uporabili t.i. “neposredno” {“enter") metodo izdelave multiplega regresijskega modela, ki v model vključi vse izbrane neodvisne spremenljivke. V zadnjem stolpcu preglednice 4 pa so navedene spremenljivke, ki pri uporabi t.i. “metode po korakih” ustrezajo statističnim pogojem za vključitev v multipli regresijski model. V skladu z našo domnevo (v preglednici 3) se delež variance gostote prebivalcev na poseljenih območjih, ki jo uspemo pojasniti z izbranimi “neodvisnimi spremenljivkami”, povečuje s povečevanjem povprečne velikosti prostorske enote, od 49 % za krajevne skupnosti do 91 % za ekonomskogeografske regije. Kljub izredno velikemu deležu pojasnjene variance “odvisne spremenljivke” pa je multipli regresijski model za ekonomskogeografske regije zaradi majhnega števila območij (prostorskih enot) statistično nekoliko manj zanesljiv. Na podlagi rezultatov doslej obravnavanih metod srno pričakovali, da se bo seznam spremenljivk, ki največ prispevajo k pojasnjevanju spremenljivosti gostote prebivalcev na poseljenih območjih, spreminjal z izborom različnih prostorskih enot. Predvidevanja so se uresničila. Na ravni “manjših” prostorskih enot sta med takšnimi spremenljivkami delež prebivalstva, starejšega od 15 let, z visoko izobrazbo in delež prebivalcev, ki niso slovenske narodnosti, za krajevne skupnosti še delež “novih” stanovanj in indeks staranja, za naravnogeografske regije še indeks staranja ter za upravne enote še delež davčnih zavezancev z visokimi dohodki. Za ekonomskogeografske regije je med takšne spremenljivke uvrščen le delež kmečkega prebivalstva. Preglednica 4: Kazalci kakovosti linearnih multiplih regresijskih modelov za napovedovanje gostote prebivalcev na poseljenih območjih. Table 4: Quality indicators of the linear multiple regression models for prognosticating the population density in the inhabited areas. Metoda “enter” Prostorska enota R2 Tveganje (F preizkus) Metoda “po korakih”: vključene spremenljivke * krajevne skupnosti 0,493 0,000 DVIS, 1STAR, -NOVSTA, DNESLO občine 0,631 0,000 DVIS, DNESLO naravnogeografske regije 0,764 0,000 DVIS, DNESLO, ISTAR nekdanje občine (sedanje “upravne enote”) 0,878 0,000 DVIS, DNESLO, -ZAV345 ekonomskogeografske regije 0,907 0,058 -DKM * Oznake spremenljivk so enake kot v preglednici 2. Spremenljivke so označene s predznakom glede na način korelacijske povezanosti s kazalcem gostote prebivalcev na poseljenih območjih. Z metodo glavnih komponent (preglednica 5) smo ugotavljali, katere so tri najpomembnejše “komponente” (“razsežnosti”), ki jih je mogoče izračunati iz podatkov za vse obravnavane spremenljivke za posamezno prostorsko enoto. Zaradi velike količine spremenljivk in tudi zaradi posebnega cilja naše raziskave se ne spuščamo v podrobnejšo vsebinsko razlago rezultatov analize glavnih komponent, kar je običajno osrednji namen uporabe te metode. Na splošno ugotavljamo, da se delež skupne variance, ki ga pojasnjujejo najpomembnejše tri glavne “komponente”, povečuje z večanjem povprečne velikosti prostorske enote, in sicer od 48 % za krajevne skupnosti, do 71 % za ekonomskogeografske regije. Pri analizi glavnih komponent je zaradi majhnega števila območij (prostorskih enot) ter še večjega števila vključenih spremenljivk kot v multipli regresijski analizi statistična zanesljivost ugotovitev za ekonomskogeografske regije še manjša. Ugotavljamo, da ima izbor prostorske enote precejšen vpliv na sestavo “komponent”. Opazne so zlasti razlike v sestavi druge in tretje “komponente”, pa tudi v zaporedju spremenljivk glede na njihov “prispevek” k prvi, najpomembnejši “komponenti”. Pojasnilo zapisa v preglednici št. 5: spremenljivke so urejene od najbolj povezane z določenim “faktorjem” proti šibkeje povezanim ter označene s predznakom glede na način korelacijske povezanosti s “faktorjem”. Oznake spremenljivk so enake kot v preglednici 2. Preglednica 5: Sestava treh najpomembnejših komponent, dobljenih z analizo glavnih komponent na izbranih podatkih, za različne prostorske enote v Sloveniji. Table 5: Composition of the three most important components obtained through the analysis of main components at selected data, presented for different spatial units in Slovenia. .2, a o ‘Z — C3 C3 C ^ Cj S I O o. 3 C o * oZ m < > f- O 22 Z i— D n Q < O £ aZ D N g J »O > UJ z od r t/5 _J ■—1 UJ O CO C/) o v a. c- Q < • N O' ^ a. Z O Q ji * j ž a o N H 2 s ^ °.8| < e- , Z < Q • N N - tu o 7 Z O I O Di > o z > z o s UJ UJ § gg > oN. < o O' -J d ^ ° z Q Q O * d ~ uj N . N O^Q O < CD C* Z O 0 S & 2 1 £ * z O 0£ < > ^ O oz -J uj — ^ UJ § cd . 00 —i cd o a c/) N CL Z O Q < ui-H OL C/2 C/) C/) _J < o N c/) S d 2 - -J y ^ W Q 1« UJ . 3 Z - - S UJ ? . OJ 00 < H < O oö ii X > O D D. * O' ^ O. cd O uj o c/) < cž Cj *— C ^ ž i S* S &£ &£ ^ O *- •--> U — Q. ° P o 3 « 'g sr* ■n a Ü ^ -o © O i z ^ S c o CD C ’3d & 1/5 u E u o c o -L Vn- os L. U &£ Izbor prostorske ravni proučevanja torej vpliva tudi na ugotovitve o glavnih vsebinskih razsežnostih podatkov o obravnavanih območjih (prostorskih enotah). Poseben problem je lahko običajni način podajanja ugotovitev analize glavnih komponent, tj. raziskovalčevo subjektivno poimenovanje komponent na podlagi njihove korelacij-ske povezanosti s posameznimi spremenljivkami (na podlagi t.i. sestave komponent). Zavedati se moramo, da se z različno prostorsko ravnijo proučevanja lahko pomembno spremeni sestava komponent, zato pa tudi njihovo poimenovanje. Izbor prostorske enote in možnosti zlorabe statističnih rezultatov V besedilu smo že nakazali, daje včasih mogoče na podlagi rezultatov za različne prostorske enote priti do različnih spoznanj oziroma je rezultate mogoče različno razlagati. Če se tega zavedamo in poznamo dovolj statistične teorije, ter če rezultate ustrezno razumemo in razlagamo, je skrb glede večjih raziskovalnih napak ali zlorab odveč. Zloraba je lahko zavestno prikrivanje izbora (prostorskih) enot, kadar ta izbor opazneje vpliva na rezultate analize. Tovrstni etični problemi niso omejeni le na politiko, temveč so lahko tudi plod pretirane želje po “dokazovanju” določenih raziskovalnih domnev ali zgolj želje po odmevnosti v javnosti. Navajamo le nekaj primerov tovrstnih možnosti, kijih omejujemo le na izračune povprečij in korelacijskih koeficientov kot izhodiščnih izračunov za številne nadaljnje analize. Če bi želeli posebej opozoriti na problem neopremljenosti stanovanj s komunalnimi priključki, bi to neopremljenost prikazali s povprečjem, izračunanim po majhnih prostorskih enotah. S podobnimi nameni bi na primer veliko število počitniških stanovanj na sto stanovanj prikazali na podlagi podatkov po naravnogeografskih regijah, nizek delež visoko izobraženega prebivalstva po občinah, velik delež poseljenih površin po krajevnih skupnostih, majhen delež najpremožnejših davčnih zavezancev po občinah ali naravnogeografskih regijah. Korelacijska analiza nam kaže, da si lahko ugotovitve za različne prostorske enote za nekatere spremenljivke nasprotujejo. To spoznanje marsikoga preseneča in utemeljeno krha “brezpogojno zaupanje” raziskovalcev v nekatere ugotovitve dosedanjih in prihodnjih raziskav. Če bi na primer želeli poudariti, da se bruto osnova dohodnine na prebivalca spreminja z deležem poseljenih površin, bi prikazali koeficient korelacije, izračunan za krajevne skupnosti. V nasprotnem primeru bi lahko poudarjali, da je bruto osnova dohodnine na prebivalca z naraščanjem deleža poseljenih površin vse manjša, in prikazali koeficient, izračunan po ekonomskogeografskih regijah. Na podoben način bi lahko zlorabili tudi rezultate korelacijske analize med deležem prebivalstva, ki ni slovenske narodnosti, in oddaljenostjo poseljenih površin od najbližje srednje šole ali deležem novih stanovanj. Sklepna spoznanja Konkretna spoznanja o učinkih izbora prostorske enote na rezultate izbranih geografskih statističnih analiz nas seznanjajo z obstojem, velikostjo in raznolikostjo teh učinkov. Na ta način srno dosegli namen te raziskave. Sprožili pa smo tudi nekatera nova vprašanja. • Ali so konkretni vplivi izbora prostorske enote na rezultate geografskih statističnih analiz bolj posledica razlik v velikosti enot, ali je bolj pomembna povezanost med vsebinskimi merili opredelitve območij prostorskih enot in obravnavanimi pojavi ali procesi? • Ali ugotovitve na primerih podatkov za celotno Slovenijo — vsaj na plošno — veljajo tudi za manjša ali večja območja proučevanja? • Ali ugotovitve veljajo tudi za spremenljivke, ki jih nismo upoštevali? Odgovori na zastavljena vprašanja so lahko predvsem načelni, saj njihova utemeljitev zahteva nadaljnje empirične raziskave. V naši raziskavi smo se omejili na spremljanje učinkov izbora različno velikih prostorskih enot, torej izbora prostorskega merila na rezultate analiz. Če bi želeli ugotavljati tudi vpliv vsebinskih meril za opredeljevanje prostorskih enot na rezultate analiz, bi morali proučiti vsaj približno enako velike prostorske enote, opredeljene po različnih vsebinskih merilih. V geografskih raziskavah pogosto proučujemo območja, ki so manjša ali večja od Slovenije. Splošne značilnosti vplivov izbora prostorske enote na rezultate statističnih analiz, kakršne navajamo v preglednici 3, načeloma veljajo tudi v takšnih raziskavah. Vendar pa brez dodatnega empiričnega preverjanja veljavnosti teh splošnih spoznanj ne moremo z gotovostjo trditi, da veljajo tudi v konkretnem primeru, ko uporabimo določeno metodo in določene spremenljivke. Tudi veljavnost naših spoznanj za spremenljivke, ki jih nismo vključili v raziskavo, je omejena. Domnevamo lahko, da so v primeru analize spremenljivk, ki so sorodne predstavljenim v raziskavi, podobni tudi učinki izbora prostorske enote na rezultate geografskih statističnih analiz. Za ostale spremenljivke bi morali te učinke ugotoviti na empiričen način. Obravnavali srno problematiko, ki seji v raziskavah običajno poskušamo izogniti, ali jo zatajiti. Ker smo iz preteklih raziskovalnih izkušenj imeli le skope predstave o učinkih izbora prostorske enote na rezultate geografskih statističnih analiz, smo bili nad izrazitostjo nekaterih razlik med rezultati presenečeni. Tovrstne razlike se pojavljajo pri vseh uporabljenih metodah ter pri tolikšnem delu izbranih spremenljivk, da ne moremo govoriti o izjemah ali slučaju, temveč o precej razširjenem problemu. Pojav imenujemo problem, ker ga ne moremo predvideti ali vnaprej oceniti, prav tako ga tudi ne moremo odpraviti. Lahko ga le omilimo, na primer z naslednjimi prijemi: • izbiri podatkov (spremenljivk) in prostorske enote za analizo moramo nameniti večjo pozornost; ali območni podatki res prikazujejo tisto, kar želimo izmeriti ali pa je negativni učinek agregiranja na vsebino območnih podatkov tolikšen, da zamegli ali celo zabriše “pravo sliko” ter tisto medsebojno prepletenost, ki jo želimo prikazati, proučiti ali razložiti? • kadar podatki za določeni pojav (spremenljivko) niso normalno frekvenčno porazdeljeni, jih moramo ustrezno spremeniti (normalizirati) oziroma iz analize izločiti skrajno izstopajoče podatke; • med podajanjem in razlago rezultatov analize moramo vedno navesti, na podlagi kakšnih podatkov, med drugim tudi na podlagi katerih prostorskih enot so opravljeni izračuni; če je le mogoče, je koristno navesti vsaj ocene o možnosti drugačnih rezultatov in zato tudi raziskovalnih sklepov ob izboru druge prostorske enote. Viri in literatura Alker, H.R., 1969: A typology of ecological fallacies. V: Dogan, M., Rokkan, S. (urednika), Quantitative ecological analysis in the social sciences. The MIT Press, Cambridge, MA; 69-86. DMR 100, digitalni model reliefa Slovenije, po celicah 100x100 metrov. Geodetska uprava RS, Ljubljana; popravki Geografski inštitut ZRC SAZU, Ljubljana, stanje 1992. Gams, L, Kladnik, D., Orožen Adamič, M., 1994: Naravnogeografske regije Slovenije. Digitalna vektorska karta, digitalizirano s karte v merilu 1 : 400000. Po Gabrovec, M. 1994, gradivo za doktorsko disertacijo. Geografski inštitut ZRC SAZU, Ljubljana. Johnston, R.J., 1989: Multivariate Statistical Analysis in Geography. A primer on general linear model. Longman Scientific & Technical, Essex, John Wiley & Sons, New York. Krevs, M., 1996: Geografski vidiki življenjske ravni prebivalstva. V: Spodnje Podravje s Prlekijo. Možnosti regionalnega in prostorskega razvoja. Zveza geografskih društev Slovenije, Ljubljana; 335-350. Krevs, M., 1997: Vpliv izbora prostorske enote na rezultate geografskih statističnih analiz na primeru Slovenije. Raziskovalno poročilo. Univerza v Ljubljani, Filozofska fakulteta, Oddelek za geografijo. Ljubljana; 34 strani. Krevs, M., 1998: Geografski vidiki življenjske ravni prebivalstva v Sloveniji. Doktorska disertacija (pred zagovorom). Oddelek za geografijo, Filozofska fakulteta, Univerza v Ljubljani. Openshaw, S., 1977: A geographical study of scale and aggregation problem in region-building, partitioning and spatial modelling. Trans. Inst. Br. Geogr. 2, 459^172. Openshaw, S., 1984: The modifiable areal unit problem. Concepts and techniques in modem geography 38. Geo Books, Norwich. Openshaw, S., Taylor, P.J. 1979: A million or so correlation coefficients: three expe- riments on the modifiable areal unit problem. V: Bennett, R.J., Thrift, N.J., Wri-gley, N. (uredniki), Statistical applications in the spatial sciences. Pion, London. Piry, I., 1994: Uporaba G1S pri oblikovanju spodbujanja regionalnega razvoja v Republiki Sloveniji. Geografski informacijski sistemi v Sloveniji 1993-1994. Zveza geografskih društev Slovenije in Zveza geodetov Slovenije, Ljubljana; str. 117-126. Piry, I., 1996: Ocena gospodarske moči prebivalstva in lokalnih skupnosti (občin) na osnovi vira dohodka. Prispevek za objavo v zborniku projekta “Možnosti regionalnega in prostorskega razvoja Spodnjega Podravja s Prlekijo” (v pripravi za tisk). Zveza geografskih društev Slovenije, Ljubljana; 351-360. Podatki o dohodnini za leto 1993 po krajevnih skupnostih v digitalni obliki. Statistični urad RS, Ljubljana. Popis prebivalstva in gospodinjstev 1991: podatki po krajevnih skupnostih v digitalni obliki. Statistični urad RS, Ljubljana. Poslovni register v digitalni obliki, stanje junij 1996. Statistični urad RS, Ljubljana. Robinson, W.S., 1950: Ecological correlations and the behavior of individuals. Am. Soc. Rev. 15, 351-357. SSKJ, Slovar slovenskega knjižnega jezika, 1994. SAZU, ZRC SAZU, Inštitut za slovenski jezik Frana Ramovša. DZS, Ljubljana. Špes, M., 1994: Degradacija okolja kot dejavnik diferenciacije urbane pokrajine (na izbranih slovenskih primerih). Doktorska disertacija. Univerza v Ljubljani, Filozofska fakulteta, Oddelek za geografijo. Ljubljana. Verbinc, F., 1970: Slovar tujk. Cankarjeva založba, Ljubljana. Vrišer, I., 1990: Ekonomskogeografska regionalizacija republike Slovenije (na podlagi vplivnih območij centralnih naselij in dejavnostne sestave prebivalstva). Geografski zbornik (Acta Geographica). Slovenska akademija znanosti in umetnosti, Ljubljana; str. 129-247. Summary Do geographers believe in the usefulness of areal data, i.e. the data aggregated by spatial units? Do they really believe that despite the aggregation these data present a sufficiently accurate picture of “landscape reality”, and they can be used in investigations and make a basis for the findings which further serve in numerous cases as a basis for spatial interventions or the formation of various policies? The answer seems controversial. A large percentage of regional-geographical, socio-geographical and also physico-geographical surveys and investigations confirm such a belief. Yet, at rare discussions about the investigation methods and findings, which are mainly restricted to the presentations of diploma, master’s, or doctoral theses only, doubts are most often expressed, about the suitability of the used aggregated data. This doubt is justified and useful, which is also confirmed by the current investigation. Different effects have been established, of the spatial unit selection which can be ascribed to the size of spatial units, or, to the relation between the criterium of determining the size of spatial units and the individual discussed phenomena or processes, which is often even more important The problems were discussed which are, if possible, usually avoided or denied in investigations. From hitherto investigation experience one could not get an idea about the extent of differences in the results and findings, which can originate in the selection of spatial units; however, the explicitness of differences was surprising. Such differences occur in all the applied methods and in a large percentage of chosen variables, so that one cannot talk about the exceptions or a coincidence but rather about an expanded problem. This phenomenon is called the problem because it cannot be foreseen or evaluated in advance, and it can neither be suppressed. It can only be mitigated, for example, with the following methods: • a greater attention must be paid to the selection of data (variables) and spatial unit for the analysis. Do the areal data really present the item which is to be measured, or is the negative effect of aggregation on the contents of areal data already as strong as to blur or even erase the “real picture” and that particular intertwining which we try to present, study or explain? • when the frequency distribution of data for a certain phenomenon (variable) is not normal, the data must be adequately transformed (normalized) and the most outstanding of them eliminated from the analysis; • during the presentation and explanation of analysis results the data (including the spatial data) on which the calculations were based must always be stated; it is useful to state, if possible, at least the assessments of possibilities of other results and also the research conclusions at the selection of another spatial unit.