PSIHOLOŠKA OBZORJA Slovenska znanstveno-strokovna psihološka revija (uradna revija Društva psihologov Slovenije) Glavna in odgovorna urednica doc. dr. Anja Podlesek HORIZONS OF PSYCHOLOGY Official Journal of the Slovenian Psychological Association Editor-in-Chief Assist. Prof. Dr. Anja Podlesek Izdaja / Published by Društvo psihologov Slovenije (Slovenian Psychological Association) Ljubljana ISSN 1318-1874 Letnik (Volume) 14, številka (Number) 3, 2005 PSIHOLOŠKA OBZORJA HORIZONS OF PSYCHOLOGY Slovenska znanstveno-strokovna psihološka revija Official Journal of the Slovenian Psychological Association Letnik (Volume) 14, številka (Number) 3, 2005, ISSN 1318-1874 Izdaja / Published by Društvo psihologov Slovenije / Slovenian Psychological Association Ulica Stare pravde 2, 1000 Ljubljana, Slovenija Glavna in odgovorna urednica / Editor-in-Chief doc. dr. Anja Podlesek Univerza v Ljubljani, Filozofska fakulteta Oddelek za psihologijo Aškerčeva 2, 1000 Ljubljana, Slovenija Tel. +386 (0)1 42 13 595, Fax: +386 (0)1 42 59 301 email: anja.podlesek@ff.uni-lj. si Uredniški odbor / Editorial Board Valentin Bucik Luka Komidar Dare Kovačič Tatjana Samec Mojca Vizjak Pavšič Urška Žugelj Uredniški svet / Scientific Board Tiziano Agostini Lidija Magajna Gregor Sočan Karin Bakračevič Vukman Aljoscha Neubauer Irena šinigoj Batistič Gašper Cankar Sonja Pečjak Lea šugman Bohinc Robert Cvetek Cveta Razdevšek Pučko Vladimir Takšič Darja Kobal Grum Argio Sabadin Predrag Zarevski Igor Kranjc Meta Shawe-Taylor Maja Zupančič Brigita Kričaj Korelc Vera Slodnjak Lektoriranje angleških ključnih besed, vsebinska obdelava in razvrstitev besedila: asist. Urška Žugelj, univ. dipl. psih., INDOK služba Oddelka za psihologijo Oblikovanje ovitka: Jana Leskovec Prelom: asist. Luka Komidar, univ. dipl. psih. Tisk: Tiskarna Pleško d.o.o., Ljubljana Pogostost izhajanja: Na leto izidejo štiri številke Ustanovitelj, izdajatelj in založnik: Društvo psihologov Slovenije Naročniški naslov: Psihološka obzorja, Društvo psihologov Slovenije, Ulica Stare pravde 2, 1000 Ljubljana, Slovenija, telefon/fax: +386 (0)1 282 1086 Davčna številka: 51264218; Poslovni račun: 02010-0091342732 © 2005 Društvo psihologov Slovenije. Revija je zaščitena z zakonom o avtorskih pravicah. Revija v celoti ali katerikoli njen del ne smeta biti razmnoževana ali posredovana na noben način (fotokopije, mikrofilmi, elektronsko posredovanje, snemanje, prevajanje) brez predhodnega pisnega privoljenja izdajatelja. Bibliografski zapisi o prispevkih, objavljenih v reviji Psihološka obzorja, so ustrezno kategorizirani in vključeni v slovensko podatkovno zbirko COBIB. Revija je opredeljena kot pomembna in odmevna znanstvena in strokovna periodična publikacija v psihološki znanosti, torej so objave v njej visoko referenčne za napredovanje v znanstvenih in strokovnih nazivih. Psihološka obzorja so indeksirana v PsycINFO, svetovni bibliografski bazi psihološke literature. Revija izhaja s finančno podporo Ministrstva za šolstvo in šport, Ministrstva za znanost in visoko šolstvo ter Znanstvenoraziskovalnega inštituta Filozofske fakultete Univerze v Ljubljani. Vsebina Beseda urednice 5 Empirično-raziskovalni in teoretsko-pregledni znanstveni prispevki Christina Bachmann, Riccardo Luccio in Emilia Salvadori 7 Statistična pomembnost in njen pomen Janez Bečaj 41 Socialne predstave psihologov o konformiranju: Konformnost - rojstvo ali smrt individualnosti Darko Zupanc 69 Standardi znanja v edukaciji Katarina Kompan Erzar, Christian Gostečnik in Tomaž Erzar 89 "I remember checking on my mother to see if she was still breathing" - How a relationship maintains, regulates, and helps resolve traumatic experiences: relational family integration Empirični in pregledni strokovni prispevki Tanja Repič 107 Fizična zloraba v otroštvu in strah pred intimnostjo v partnerskem odnosu Tanja Milovanovič 125 Spolna vloga in otrokovo zaznavanje ter presojanje različnih tipov televizijskih oglasov za otroke Novi doktorati in magisteriji Drago Žagar 141 Predstavitev doktorske disertacije "Učna motivacija v odnosu do učenja in učne uspešnosti učencev" (dr. Mojca Juriševič) Janek Musek 145 Ocena magistrske raziskave "Vpliv čustvenega delovanja na zdravstveno stanje otrok" (mag. Kristine Dankic) Mnenja, polemike, razprave, poročila Luka Komidar 149 Poročilo s 37. Letnega splošnega srečanja evropskega združenja za preučevanje možganov in vedenja v Dublinu na Irskem Dušan JamSek 157 O urednikovemu opravičilu ga. Weissovi za zaplet s člankom o POS-u Predvideni prispevki v številki 4 letnika 14 (2005) Psiholoških obzorij 160 Navodilo avtorjem prispevkov 167 Contents Editorial 5 Scientific papers (empirical research and theoretical papers /reviews) Christina Bachmann, Riccardo Luccio and Emilia Salvadori 7 Statistical significance and its meaning Janez Bečaj 41 Psychologists' social representations of conformity: Conformity - birth or death of individuality Darko Zupanc 69 Standards in education Katarina Kompan Erzar, Christian Gostečnik and Tomaž Erzar 89 "I remember checking on my mother to see if she was still breathing" - How a relationship maintains, regulates, and helps resolve traumatic experiences: relational family integration Technical/professional papers (empirical and theoretical papers/reviews) Tanja Repič 107 Physical abuse in childhood and fear of intimacy in adult intimate relationships Tanja Milovanovič 125 Sex role and children's perception and judging of different types of television advertisements for children New MA and PhD dissertations Drago Žagar 141 Presentation of the doctoral dissertation "Role of learning motivation in learning and academic achievement ofprimary school pupils" (Mojca Juriševič, Ph. D.) Janek Musek 145 Presentation of the doctoral dissertation "Effect of emotional functioning on children's health" (Kristina Dankic, MA) Opinions, discussions, essays and reports Luka Komidar 149 Report from the 37th Annual General Meeting of European Brain and Behaviour Society, Dublin, ireland Dušan JamSek 157 on Editor's apology to Ms. Weiss regarding the inconviniences with the paper on TSR Content of the next issue, No. 4, Vol. 14 (2005), of Horizons of Psychology 160 information for contributors 169 5 Beseda urednice Spoštovane bralke, spoštovani bralci! V prejšnji številki Psiholoških obzorij ste že lahko prebrali »poslovilno« besedo zdaj že bivšega glavnega urednika revije dr. Valentina Bucika. Novembra 2005 sta bila na občnem zboru Društva psihologov Slovenije potrjena nov uredniški odbor in uredniški svet revije. Uredniški odbor je po novem operativno telo, ki skrbi za tehnične in administrativne vidike urejanja in izdajanja revije ter njeno promoviranje, uredniški svet pa skupina eminentnih strokovnjakov z različnih psiholoških področij, tako iz akademske sfere kot iz prakse, ki odloča o usmeritvah in vsebini revije. Funkciji glavnega in odgovornega urednika sta se združili v eno samo. Kot nova urednica bi se najprej rada zahvalila za izkazano čast in zaupanje. Že pri izdajanju »svoje« prve številke pa čutim, da ta položaj prinaša ogromno organizacijskega in administrativnega dela. Zato se kot bralka Psiholoških obzorij in članica Društva psihologov Slovenije zahvaljuj em bivšemu glavnemu uredniku in nj egovim sodelavcem za ves čas in energij o, s katero so revijo (v veliki meri ali povsem) prostovoljno ne le držali pri življenju, ampak jo ves čas razvijali in dvigovali njeno kvaliteto. Cestitamjim za odlično opravljeno delo, saj so jo novi uredniški zasedbi prepustili v zelo dobrem stanju. S tem, da so dosegli, da je vstopila v mednarodno bazo psiholoških periodičnih in knjižnih publikacij PsycINFO, si je revija pridobila velik ugled tako doma kot v tujini, slovenskim psihologom pa so se razširile možnosti poročanja o ugotovitvah svojega raziskovalnega in praktičnega dela bralcem širom po svetu. Tako je revija presegla osnovni domet revije nacionalnega pomena, kar je bil eden od razlogov, da so v novem uredniškem svetu mesta dobili tudi tuji strokovnjaki. Ob taki popotnici najverjetneje ni pričakovati, da bi v bližnji prihodnosti pri reviji prišlo do večjih vsebinskih sprememb. V operativnem smislu pa bomo takoj poskusili uvesti nekaj majhnih posodobitev. Prva sprememba bo pri obliki komuniciranja med avtorji, uredništvom in recenzenti, nekaj majhnih sprememb pa bo tudi pri oblikovni pripravi rokopisov, o čemer lahko avtorji natančneje preberejo kar v Navodilih avtorjem prispevkov na koncu revije. Avtorje od zdaj naprej vabimo, naj že prvo verzijo rokopisa oddajo tudi v elektronski obliki po elektronski pošti, enako pa velja tudi za recenzente in njihove preglede prispevkov. Tako bo lahko komunikacija med avtorji, recenzenti in uredniškim svetom ter odborom hitrejša in morebiti tudi bolj interaktivna. Menim, da je čas že povsem dozorel za prehod na tako obliko oddajanja rokopisov. Morda nam bo kdaj v prihodnosti uspelo celo omogočiti v celoti avtomatizirano oddajanje rokopisov in bodo avtorji rokopise z vsemi potrebnimi podatki prijavljali in oddajali preko svetovnega spleta v revialno bazo prispevkov, kot je že v navadi pri nekaterih mednarodnih revij ah. V prihodnosti se obeta še boljša dostopnost revije bralcem v različnih delih sveta, saj smo bili pred kratkim povabljeni tudi k sodelovanju v dLib - Digitalni knjižnici 6 Slovenije. Na tem prosto dostopnem spletnem portalu so/bodo dosegljiva polna besedila prispevkov z različnih strokovnih področij. Slovenska baza je povezana z enakimi bazami v tujini, tako da bodo polna besedila prispevkov dosegljiva mnogo lažje in še širšemu krogu bralcev kot zdaj. Kaj prinaša številka 3 v 14. letniku Psiholoških obzorij? Prvi prispevek je prevod italijanskega dela avtorjev Christine Bachmann, Riccarda Luccia in Emilie Salvadori o tem, kako nerodno je za psihološko znanost, da si je v nekem trenutku začela napačno razlagati pojem statistične pomembnosti in je povsem pozabila na t. i. praktično pomembnost. Avtorji opozarjajo, naj se razvoj znanosti ne zaustavlja pri p-ju 0,05 oz. naj ta ne deli sveta na črnega in belega, kot se vse prepogosto dogaja. Bodoči avtorji rokopisov naj obljubijo, da bodo navedeni prispevek zelo podrobno prebrali in upoštevali njegova priporočila, predvsem glede dodajanja mer velikosti učinka, intervalov zaupanj a in analize moči testa osnovnim rezultatom statističnih testov, jaz pa jim obljubim, da se bom v vlogi glavne in odgovorne urednice trudila preseči običajno forsiranje privzgojenega in zaradi izredne razširjenosti ter podpore že kar avtomatiziranega interpretiranja rezultatov statističnih postopkov in se poskušala izogibati fenomenu »predala«, tj. pospravlj anju prispevkov, v katerih učinki ne presežej o ravni statistične pomembnosti, v predal. V nadaljevanju številke lahko preberete o tem, (i) kako danes pojmujemo konformnost in kako so nanjo gledali veliki socialni psihologi, ki jim pripisujejo definicije tega pojma, (ii) da v Sloveniji še nimamo izdelanih standardov dosežkov, to je tiste vrste standardov znanja, ki bi nam omogočili znanje tudi meriti, (iii) zakaj se določena travmatična izkušnja lahko prenaša od staršev na otroke in od teh naprej na njihove potomce ter kako lahko tak prenos prekinemo, (iv) da je strah pred intimnostjo v partnerskih odnosih povezan s fizično zlorabo v otroštvu, spolom (moški imajo na splošno več takega strahu kot ženske) in statusom (pri ločenih je tak strah višji kot pri drugih skupinah), in (v) kako dečki in deklice zaznavajo in odobravajo spolno stereotipne televizijske oglase. V zadnjem delu številke sledijo, kot običajno, predstavitve nekaj podiplomskih del in konferenc, dodano pa je tudi polemično pismo bivšemu uredniku. Številka pred vami je nastala z nekaj zamude, delno zaradi menjave uredniških struktur, delno pa tudi zato, ker v zadnjem času ni bilo tako velikega pritoka prispevkov, kot bi si želeli. Verjamem pa, da bodo vse štiri številke letnika 2006 pokale po šivih, saj prihaja V. kongres psihologov Slovenije, ki bo od 8. do 11. novembra 2006 v hotelu Mons v Ljubljani. Aktivne udeležence kongresa pozivam, naj nikar ne čakajo na pokongresni čas, ko bosta prevladala zimska utrujenost ali »veseli december«. Prispevke v celoti pripravite kar letos spomladi, da bodo lahko zainteresirani kolegi dobili že objavljeno polno besedilo vašega prispevka v roke takoj po njegovi predstavitvi na kongresu. Pričakujemo jih! Vaša Anja Podlesek Psihološka obzorja / Horizons of Psychology, 14, 3, 7-40 (2005) © Društvo psihologov Slovenije 2005, ISSN 1318-187 Znanstveni teoretsko-pregledni prispevek Statistična pomembnost in njen pomen# Christina Bachmann, Riccardo Luccio in Emilia Salvadori* Oddelek za psihologijo, Katedra za metodologijo, Univerza v Firenzah Povzetek: Glede na najbolj uporabljeno metodo v psihologiji, in sicer testiranje ničelne hipoteze (TNH), je namen tega prispevka izpostaviti napačna razumevanja in napake, ki izhajajo iz »neprimerne« uporabe hibridnega pristopa, nastalega z združevanjem Fisheijevega (1925) »pristopa p-vrednosti« (PVA) ter Pearsonovega in Neymanovega (1933) pristopa »določene alfa verjetnosti« (FAA). V prispevku želimo prispevati h kritični razpravi o uporabi statističnih testov in interpretaciji rezultatov s strani raziskovalcev ter tudi o sami logiki TNH pristopa. Poleg tega smo, kot je nedavno predlagala delovna skupina APA Task Force, pregledali metode analize podatkov, ki jih moramo priključiti TNH, da bi zagotovili večjo zanesljivost rezultatov. Te metode so intervali zaupanja, mere velikosti učinka, analiza moči testa in prevzorčenje. Ključne besede: testiranje ničelne hipoteze, statistična pomembnost, analiza moči, velikost učinka Statistical significance and its meaning Christina Bachmann, Riccardo Luccio and Emilia Salvadori Dipartimento di Psicología, Sezione di Metodología, Universita di Firenze, Italia Abstract: The most frequently method of data analysis in psychology is null hypothesis significance testing (NHST); this work identifies the misunderstandings and consequent biases due to the unwitting use of this hybrid approach, derived by the fusion of the p-value approach (PVA) of Fisher (1925) and the fixed alpha approach (FAA) of Neyman and Pearson (1933). The aim of this work is to contribute to the critical debate about the use of this test, how researchers interpret test results, and the logic of the NHST approach. In the same vein of recent recommendations of the APA Task Force, we examine different methods of data analysis, that are used with NHST including confidence intervals, effect size measures, power analysis, and resampling. Key-words: null hypothesis testing, statistical significance, power analysis, effect size (statistical) CC = 2240 # Prispevek je bil predstavljen na konferenci 16. dani Ramira Bujasa v Zagrebu, 11.-13.12.2003 (kot vabljeno predavanje avtorja R. Luccia), in je izvleček iz knjige La verifica della significativita dell'ipotesi nulla in psicologia istih treh avtorjev, izdane leta 2005 pri založbi Firenze University Press. Besedilo je iz italijanskega izvirnika prevedla Janja Tomšič. Besedilo prevoda sta strokovno pregledala Gregor Sočan in Anja Podlesek. * Naslov / address: Emilia Salvadori, Dipartimento di Psicologia, via S. Niccola 93, 50125 Firenze, Italia; email: lmsalv@tin.it 8 C. Bachmann, R. Luccio in E. Salvadori Testiranje ničelne hipoteze (TNH) v psihologiji Prevladujoča paradigma pri analizi podatkov psiholoških raziskav je t.i. testiranje ničelne hipoteze (v angleščini NHST, Null Hypothesis Significance Testing). TNH je produkt združevanja pristopa p-value approach (PVA, Fisher, 1925) in pristopa fixed alpha approach (FAA, Neyman in Pearson, 1933), ki imata skupne poteze, a z opaznimi razlikami. Vendar pa se citirani avtorji niso strinjali niti s pristopom drugega avtorja niti z mešanico obeh pristopov. Za razlago metode TNH študentom pri lekcijah statistike za psihologe navadno uporabljamo sledečo shemo, ki omogoča vizualizacijo procesa odločanja. Samo Bog ve, ali je v naravi resnična ničelna hipoteza H0 (ki taji učinek obravnave ali korelacijo med spremenljivkami itd.) ali alternativna hipoteza H1 (ki potrjuje učinek obravnave itd.). Statistik skuša na osnovi računane verjetnosti uganiti, kar ve Bog. Bog Ho Hi Ho Pravilna (ustrezna) zavrnitev Napačna zavrnitev Napaka II tipa 3 Hi Napačna potrditev Napaka I tipa a Zadetek Moč (1- 3) Opomba: Tabela govori o zavrnitvi in potrditvi obstoja pojava (učinka itd.) in ne o zavrnitvni in potrditvi ničelne hipoteze (op. ur.). Inferenčni proces naj bi vključeval naslednje stopnje: (i) določiti vrednost verjetnosti a (običajno 0,05); (ii) privzeti, da je H0 resnična; (iii) določiti verjetnost dejanskih podatkov, če je H0 resnična [tj, p (podatki | H0)]; (iv) če je p > a, sprejeti H0; (v) v nasprotnem primeru zavrniti H0 in sprejeti H1. Ta postopek imamo lahko za »fisherjanskega«, za vse matematično orodje pa imata zasluge Neyman in Pearson (1933), ki sta med drugim predlagala bistveno drugačno strategijo odločanja. Da si stvari nekoliko razjasnimo, je koristno, da si pobliže pogledamo pristopa PVA in FAA. Pristop PVA (p-value approach) Fisher je pristop PVA najbolj jasno predstavil v delu Statistical Methods for Research Workers (1925), kjer je trdil, da če ob poznavanju karakteristik določene populacije iz nje vzamemo vzorec in ta krši naša pričakovanja, »...lahko rečemo, da je bil vzet iz druge populacije. [... Ce] imamo na razpolago kritične teste za pomembnost, lahko ugotovimo, ali je drugi vzorec pomembno drugačen od prvega ali ne« (str. 44). Nekoliko kasneje se pojavi meja verjetnosti 0,05, ki »je koristna [...] za presojanje, ali Statistična pomembnost in njen pomen 9 je določeno odstopanje pomembno ali ne« (str. 48). Kasneje je Fisher (1955, 1956) trdil, da moramo raven pomembnosti računati po tistem, ko je bil test že izveden, in je to torej lastnost podatkov. Pristop FAA (fixed-alpha approach) Zgoraj predstavljena shema pa izhaja predvsem iz Neymanovega in Pearsonovega (1933) pristopa FAA. Neyman in Pearson sta gledala na teste pomembnosti kot na metodo za izbiro ene od dveh možnih hipotez. Ta teorija je dobila svojo dokončno obliko v znani lemi, ki ga v zgoščeni obliki predstavljamo v Prilogi. Neyman in Pearson sta najprej jasno definirala ničelno in alternativno hipotezo, v nasprotju z njima pa se je Fisher omejil na ničelno hipotezo (čeprav je ni imenoval tako). Ce privzamemo, da je bil vzorec vzet iz določenega univerzuma, se parameter 0, za katerega menimo, da je relevanten (npr. povprečje pri normalni porazdelitvi univerzuma in vzorca), ne bo pomembno razlikoval od ustreznega parametra populacije, če je resnična H0, ter se bo od le-tega pomembno razlikoval, če je resnična H Neyman in Pearson sta torej trdila, da je treba določiti raven a za prvo hipotezo. Iz tega izhaja tudi ime pristopa. Nato nadaljujemo z ocenjevanjem parametra z metodo največjega verjetja. Izračunamo odnos med koeficienti največjega verjetja pod pogojem, da bi bila resnična H0, in pod pogojem, da bi bila resnična H1. Glede na to, da a ustreza neka določena kritična vrednost tega odnosa, se v primeru, da je dosežena vrednost nižja od določene, zaključi v prid ničelni hipotezi, v nasprotnem primeru pa v prid alternativni hipotezi. Za Neymana in Fisherja to ni bila končna odločitev, ampak le prvi korak, ki ga uporabimo kot izhodišče plodne poti, na kateri se dokopljemo do nadaljnjih potrditev. Metodo TNH imamo lahko za »fisherjansko«, ker se pri sprejetju ali zavrnitvi ničelne hipoteze, za katero privzamemo, da je resnična, naslanjamo na verjetnost podatkov. Vendar pa je gotovo ne moremo imeti za »fisherjansko« glede koncepta dveh nasprotnih si hipotez, čeprav lahko v nekem smislu le-ti obravnavamo kot implicitno vsebovani v Fisherjevi razlagi. Koristna je lahko shema, ki poudarja glavne razlike med obema pristopoma. Ce delno sledimo Hubertyju (1993), lahko rečemo, da (i) je pri pristopu PVA verjetnost variabilna, pri pristopu FAA pa je a vnaprej določena (fiksirana); (ii) imamo pri pristopu PVA samo H0, pri FAA pa tudi H1; (iii) se pri pristopu PVA določi p (podatki | H0 resnična), pri pristopu FAA pa se določi napaka I. tipa in kritično območje C; (iv) pri PVA H0 zavrnemo, če je p majhen, sicer jo dopustimo, pri FAA pa H0 zavrnemo v prid H, če se T nahaja v kritičnem območju distribucije, sicer jo dopustimo; (v) na tej točki se za Fisherja eksperiment konča, medtem ko se za Neymana in Pearsona ponovi - če je možno na novih vzorcih. V naslednjem poglavju bomo videli, kako je bilo vse to združeno v en sam pristop. 10 C. Bachmann, R. Luccio in E. Salvadori Obravnava TNH V štirih glavnih mednarodnih revijah eksperimentalne psihologije so med letoma 1930 in 1940 TNH uporabili samo v štirih člankih, med letoma 1940 in 1955 pa so to metodo uporabili za analizo podatkov v 80 % člankov (Sterling, 1959) in se je uveljavila kot »paradigma« (Kuhn, 1962). Kot je opazil Yates (1951, str. 33), so jo »raziskovalci pogosto imeli za cilj eksperimenta«. Že od 30-ih let je metoda TNH sprožila veliko kritičnih razprav o njeni uporabi in logiki. Veliko matematičnih psihologov, z Duncanom Luceom na čelu, je ni sprejelo in so jo imeli za oviro znanstvenemu napredku. Tudi v sami eksperimentalni psihologiji so obstajala nasprotovanja metodi TNH: Skinner je ustanovil revijo Journal of Experimental Analysis of Behavior ravno zato, da bi ubežal poniževanju TNH. Ne glede na kritike pa je bilo v praksi malo sprememb (Cohen, 1994). Izpostaviti je treba objavo posebne številke revije Journal of Experimental Education,Vol. 61, št. 4, in revije Psychological Science, Vol. 8, št. 1, ter knjige, posvečene prihodnjim perspektivam testov pomembnosti v psihologiji, s prispevki »za« in »proti« (Harlow, Mulaik in Steiger, 1997; za pregled glej Nickerson, 2000; Sullivan, 2000). Kot glavni problemi so se pokazali naslednji. Moč testa Prvi od problemov (Cohen, 1977, 1988) je zanemarjanje moči uporabljenega testa. Le-to bi morali, tudi zaradi določanja optimalne velikosti uporabljenih vzorcev, določiti pred zbiranjem podatkov, kar pa raziskovalci skoraj nikoli ne naredijo (k tej temi se bomo še vrnili). Strogost "binarne" odločitve Določitev kritičnega praga izbire med dvema alternativama je problematična. Tako je treba sprejeti H0, ker je dobljena vrednost p enaka 0,052. Ta vrednost pa je tako blizu pomembnosti, da kljub sprejetju ničelne hipoteze pušča dvom o tem, ali ni morda učinek vseeno dejansko prisoten. Pomislimo na metaanalize, ki predpostavljajo, da se rezultati povzetih raziskav porazdeljujejo vzdolž določenega kontinuuma. "Poljubnost" a Vrednost a je običajno določena na 0,05 (5 %), včasih pa na 0,01 (1 %). Za to odločitev ni nobene teoretične motivacije. Kot pravita Rosnow in Rosenthal (1989, str. 1277): »Bog ima 0,06 ravno toliko rad kot 0,05«. Primerno je imeti nizko raven a v raziskavah, ki imajo lahko resne posledice na zdravstveni in ekonomski ravni. Bolj kot je raziskava pomembna, bolj bi morali biti pozorni na moč testa in na ponovljivost rezultatov, torej na probleme, neodvisne od ravni a. Statistična pomembnost in njen pomen 11 Precenitev p Običajno verjamemo, da nižja kot je vrednost p, manj je H0 sprejemljiva. Vendar pa p računamo glede na predpostavko, da je ničelna hipoteza resnična. Ni dovolj, da razberemo samo, ali je p večji ali manjši od a, saj obstoj razlike ne prispeva nobene informacije o ničelni hipotezi. V osnovi te napake je ideja, da p meri stopnjo, v kateri je rezultat dosežen po slučaju (Carver, 1993; Daniel, 1998):p 0,03 naj bi pomenil, da obstaja 3-odstotna verjetnost, da so rezultati posledica slučaja, medtem ko naj bi bila 97-odstotna verjetnost, da je to resničen učinek. Statistična pomembnost nasproti praktični pomembnosti Težimo tudi k temu, da vrednost pomembnosti interpretiramo kot kazalec velikosti učinka. Za vrednosti p, ki so precej manjše od 0,05, se uporabljajo izrazi kot »zelo pomembni rezultati«. Statistična pomembnost ne ustreza velikosti učinka. Pusti nam domnevati, da obstaja določen učinek, vendar nam o njegovih značilnostih ne pove ničesar. Vrednost p ni odvisna le od upoštevanega učinka (0), ampak tudi od velikosti vzorca. Poleg tega sam odnos med 0 in p ni linearen - majhnemu povečanju učinka lahko ustreza mnogo večji upad vrednosti p in obratno. Izraz »pomembnost« tako samovoljno razumemo kot »pomembnost (relevantnost)« (primerjaj Schafer, 1993; Meehl, 1997). Predvsem nekateri ugledni člani združenja American Educational Research Association (prim. Thompson, 1996, 1997; Cahan, 2000) so predlagali, naj izraz »pomembnost« vedno spremlja pridevnik »statistična«, da bi izločili učinek nejasnosti, ki ga spremlja (za drugačno mnenje glej Robinson in Levin, 1997; Levin in Robinson, 1999). Thompson (2003) razlikuje tri tipe pomembnosti: statistično, praktično in klinično. Statistična pomembnost ne pove, ali so rezultati praktično pomembni. Obstajajo določeni redki in nenavadni dogodki, ki niso relevantni, in nekateri pogosti in verjetni dogodki, ki pa so zelo pomembni. Precenitev rezultatov Ničelna hipoteza H0 vsebuje predpostavko, da so učinki ničelni, torej da vzorčna ocena 0 povsem ustreza »pravi« 0*. Vendar pa je težko, da bi učinek, četudi zelo majhen, imeli za neobstoječega, in prav tako je samovoljno misliti, da je podobnost med ocenjenim in pravim 0 lahko popolna. Sprejetje ničelne hipoteze: težka in neprijetna odločitev Raziskovalec praviloma, če je njegov p (podatki | H0) večji od vnaprej določene vrednosti a, meni, da bo njegovo delo verjetno končalo v košu za star papir, in zaradi lastne cenzure del s takimi »negativnimi« izidi ne bo objavil (Hubbard in Armstrong, 1997). Wilson, Smoke in Martin (1973) so pri pregledu člankov, objavljenih v letih 1969 in 1970 v revijah American Journal of Sociology, American Sociological 12 C. Bachmann, R. Luccio in E. Salvadori Review in Social Forces, ugotovili, da je bila ničelna hipoteza zavrnjena v 80,3 % primerov, v katerih je bila uporabljena metoda TNH. Greenwald (1975) je pri pregledu letnika 1972 revije Journal of Personality and Social Psychology ugotovil, da se je tu enako zgodilo v 87,9 % člankov. V člankih o marketingu ta odstotek naraste na 92,2 % (Hubbard in Armstrong, 1992, 1994), po Lindsayu (1994) pa na 84,2 %. Sterling, Rosenbaum in Weinkam (1995) so pokazali, da je z metodo TNH zavrnjena ničelna hipoteza v 95,6 % objavljenih psihološskih delih, v medicinskih revijah pa je ta odstotek 85,4 %. Hubbard in Armstrong (1992) sta pregledala moč v maloštevilnih raziskavah, v katerih je bila ničelna hipoteza sprejeta. Ugotovila sta, da so bile povprečne verjetnosti, da ima lahko obravnava velik (p = 0,01) ali samo srednje velik učinek (p = 0,11), zelo nizke, kar je nedvomno informativno. Pri politiki objavljanja revij obstaja celo odpor zoper objave del, kjer je raven p samo 0,05, tako da se daje prednost ravni p 0,01 ali manjšsi, kot je iskreno priznal Melton (1962), ko se je po 12 letih poslovil od vodenja revije Journal of Experimental Psychology. Posebnost (omejitve) ničelne hipoteze v naravi Hipoteza H0 v splošno priznani praksi testiranja hipotez, vsebuje premiso, da so predvidevani učinki nični, torej da je razlika med povprečij populacij nič, da je korelacija nič, da je odstotek moških in žensk v kateri koli populaciji 50 %, vendar je to arbitrarno določeno (Bakan, 1966; Loftus, 1996). Chow (1996, 1998), Rindskopf (1997) ter Levin in Robinson (1999) dvomijo, da je problem resnično pomemben. Kot opozarja Tukey (1991, str. 100), noben raziskovalec ne privzame, da je razlika med dvemi povprečji ali korelacija med dvema spremenljivkama točno 0. Mulaik, Raju in Harshman (1997) menijo, da problem prej predstavljajo odkloni od ničelne hipoteze zaradi velikosti obravnavanega vzorca. Vpliv velikosti vzorca Velikost vzorca vpliva na pomembnost dobljenih rezultatov: »Pri velikem številu podatkov vrednosti p težijo k majhnosti« (Berkson, 1938, str. 526; glej Nunnally, 1960; Kerlinger, 1979; Hays, 1963; Cohen, 1994). Vrednost r 0,6 ni statistično pomembna pri 10 osebah, pri 500 osebah pa bi, za p manjši od 0,05, zadostoval r 0,088 (0,77 % pojasnjene variance) (Daniel, 1998). Pri 10000 osebah bi zadostovala vrednost r, ki bi bila enaka 0,0196! Razmerje med dvema %2, ki ju dobimo na vzorcih velikosti N1 in N2, je (prim. Long, 1983, str. 75) enako: N2 -1 (1) N -1 Tako bi npr., če je N1 enak 100 in N2 enak 1000, z eno stopnjo svobode %2 prvega vzorca 1,64, kateremu bi ustrezala vrednost p 0,20, v drugem vzorcu postal Statistična pomembnost in njen pomen 13 16,55, z vrednostjo p manjšo od 0,001! Podobno lahko razmišljamo tudi pri Studentovem t in ANOVA-i. Bonferronijev problem Določiti raven a na 0,05 je enako kot reči, da obstaja verjetnost 0,95, da bomo prišli do »nepomembnega« zaključka. Ce pa preverjamo dve neodvisni ničelni hipotezi in če je raven a za obe enaka, je verjetnost, da ni nobena od dveh pomembna, enaka 0,95 x 0,95 = 0,90. In če je neodvisnih ničelnih hipotez 15, je verjetnost, da ni nobena od teh pomembna, enaka 0,9515 = 0,46, z verjetnostjo 0,54 (večjo od slučaja), da bomo morali zavrniti vsaj eno. Z 20 ničelnimi hipotezami bi bila verjetnost celo 1 (pravzaprav 0,64; op. ur.). To je znan Bonferronijev problem (1936; prim. Bland, 2000; za drugačno mnenje glej Perneger, 1998). Bonferroni je predlagal, da bi določili popravljen a, ac = a/k, kjer je k število neodvisnih ničelnih hipotez, ki jih preverjamo. Tako bi bil s petnajstimi ničelnimi hipotezami ac = 0,05/15 = 0,003. Vendar pa se ta popravek skoraj nikoli ne uporablja. Ponovljivost rezultatov Falsifikacijo (zavrnitev) ničelne hipoteze pogosto interpretiramo kot dokaz ponovljivosti dobljenih rezultatov (Carver, 1978, govori o želji po ponovljivosti). Vendar bi morala biti moč statističnega testa zadovoljiva (vsaj 0,80; prim. Cohen, 1988), da bi upravičeno mislili, da bi v enakih pogojih ponovitev zajemala iz istih dveh med seboj različnih univerzumov, iz katerih smo dobili dva obravnavana vzorca. Intenziteta in smer učinka Pri TNH pomembnost ne more potrditi drugega kot obstoj in smer neke razlike. Ce je povprečje vzorca, izpostavljenega obravnavi A, večje od povprečja vzorca, izpostavljenega obravnavi B, in če je ničelna hipoteza falsifikabilna, očitno lahko potrdimo, da A proizvaja naraščanje učinka v primerjavi z B, vendar pa ne moremo povedati, kolikšen je ta prirastek. Logika testa pomembnosti in formalna logika Logika, na kateri temelji zavrnitev ničelne hipoteze in posledično sprejetje alternativne hipoteze, se opira na pravila silogističnega razmišljanja (Cohen, 1994), še posebej na modus tollens, po katerem negacija sledečega implicira negacijo predhodnega. Na videz bi bila logika testa hipotez naslednja: Pri vsaki ničelni hipotezi, ki je resnična, ni učinka obravnave. Našli smo učinek obravnave. Torej je ničelna hipoteza napačna. 14 C. Bachmann, R. Luccio in E. Salvadori Vendar je testiranje hipotez po naravi verjetnostno in to pravilo v formalni logiki ni uporabno. To je lahko razumljivo z naslednjim silogizmom: Za vsakega italijanskega prebivalca je malo verjetno, da bo predsednik republike. Ciampi je predsednik republike. Torej je malo verjetno, da je Ciampi italijanski prebivalec. Problem linearnosti modelov Klasičen linearen model v »fisherjanski« statistiki predpostavlja, da je opazovani podatek linearna kombinacija, določena s pripadnostjo podatka določenemu univerzumu (predstavljeno s 0), vpliva j-te obravnave (a.) in napake i-te osebe (e.): Ji, j = 0 + a j + e (2) Ta model vzdrži kot linearen, vendar ga nič ne zagotavlja. Jasno je, da v veliko primerih odnosi (npr. pri interakciji obravnav) niso linearni. Zato so potrebne vsaj tri dopolnilne postavke: i) da se napake porazdeljujejo normalno; ii) da napake med seboj niso korelirane; iii) da je varianca porazdelitev napak enaka za vsako eksperimentalno situacijo. Vendar tudi tu nič ne zagotavlja, da bodo stvari šle na tak način (glej Micceri, 1989). V bran metode TNH Ne želimo pa dati vtisa, da statistiki TNH smatrajo kot že zastarel pristop. Se vedno ima privržence. Eden izmed njih je Chow (1996, 1998, 1999), ki meni, da so kritike ponavljajoča se »litanija«, ki je štirideset let predlagala vedno znova enake in netehtne argumente. Kot opozarja Abelson (1997), je problem vezan predvsem na to, da je TNH treba uporabljati previdno, v okviru omejitev in predvsem tveganja pri njeni nekritični uporabi. Po Sullivanu (2000) lahko glavne argumente v bran TNH razvrstimo v naslednje kategorije. Odločitve na nominalni ali ordinalni ravni TNH je koristna, kadar želimo delati na ravni neurejenih kategorij (nominalne lestvice) in asimetričnih odnosov (ordinalne lestvice). V teh primerih ni pomembna velikost učinka, ampak samo njegova smer. Tu je falsifikacija ničelne hipoteze zadostna. Statistična pomembnost in njen pomen 15 Pomanjkanje alternativnih analiz podatkov Raziskovalci niso zadovoljni s predlaganimi alternativnimi analizami. Zaradi zahtev raziskave (npr. glede števila oseb) ni vedno možno dobiti zadovoljive moči in pogosto se zato s tem ni vredno ukvarjati. Večji del psiholoških raziskav se ne ukvarja z razvojem modelov (napovedjo funkcije, na primer, v odvisnosti od časa) kot je to v drugih znanostih. Prav tako se ne ukvarja npr. s študijami kovariančnih struktur, kot v LISREL-u. Odgovornost raziskovalcev za napake in napačna razumevanja TNH je bila primarno zasnovana kot logičen in dobro utemeljen način statistične analize. Raziskovalci so krivi, če je metoda TNH slabo uporabljena in je povzročila veliko napak. Pomanjkanje alternativnih oblik analize Čeprav je to šibka metoda, ne smemo pozabiti, da je pogosto edina analiza, ki nam je resnično na razpolago. Temu lahko le pritrdimo. Priporočila Ameriškega psihološkega združenja (APA) Po sledeh teh razprav in predvsem zaradi obširne razprave, ki jo je povzročila objava Cohenovega članka The earth is round (p < .05) v letih 1994 in 1996, je na burni razpravi na konvenciji Ameriškega psihološkega združenja (APA) (Abelson, 1997, meni, da je bilo videti, kot bi »skupina radikalnih aktivistov« vzela za talce »10 statistikov in 6 direktorjev revij, pod geslom 'Podpri popolno opustitev testov (pomembnosti)' in 'razveljavi ničlo!'«) Znanstveni svet APA zaupal komisiji strokovnjakov, imenovani Task Force on Statistical Inference (TFSI), nalogo, naj preuči situacijo in pokaže na možne alternative. TFSI je identificirala predvsem dva povezana, a različna predmeta študija: (i) vlogo TNH v psihološkem raziskovanju; (ii) spremembe, ki so se zgodile skozi čas kot posledica obravnave podatkov v psihologiji. TFSI je predlagala vrsto akcij za izboljšanje stanja, in sicer najprej revizijo APA priročnika (APA, 1994). Ta opažanja so združena v reviziji priročnika (APA, 2001). Glede na TFSI (Wilkinson in TFSI, 1999) je potrebno pri objavi rezultatov (i) natančno poročati o vseh problemih, ki so se pojavili med zbiranjem podatkov (npr. o manjkajočih podatkih ali osamelcih), s priporočili za preprečitev njihovega ponovnega pojavljanja; (ii) zbrati preproste in parsimonične analize, ne pa sofisticiranih metod, ki k znanju dodajo malo; (iii) odpovedati se dihotomni izbiri med sprejetjem in zavrnitvijo H0 ter podati le vrednost p, še bolje pa je podati intervale zaupanja in indekse velikosti učinka; (iv) pri prikazovanju rezultatov uporabljati slike z grafično predstavitvijo intervalov zaupanja. 16 C. Bachmann, R. Luccio in E. Salvadori Problem velikosti učinka Kot dopolnilo TNH je bilo predlaganih več indeksov, t. i. mer velikosti učinka (Maxwell in Delaney, 1990), ki jih lahko razdelimo v dve kategoriji (Nix in Barnette, 1998): (i) moč odnosa med spremenljivkami (mere povezanosti); (ii) velikost učinka (v ožjem pomenu izraza). Mere povezanosti Mere povezanosti navadno kažejo odstotke pojasnjene variance (Maxwell in Delaney, 1990), oziroma, koliko variance odvisne spremenljivke je povezane z variiranjem neodvisne spremenljivke. ANOVA Pri ANOVI ponavadi uporabljamo štiri tipe mer povezanosti: (i) eta kvadrat (n2); (ii) delni eta kvadrat (np2); (iii) omega kvadrat (ro2); (iv) intraklasna korelacija (p.). Indeksa ro2 in p. sta oceni stopnje povezanosti, računane na populaciji, medtem ko sta n2 in np2 oceni stopnje povezanosti, računane na vzorcu. Eta kvadrat (n2), imenovan korelacijsko razmerje (correlation ratio), predstavlja odstotek totalne variance, ki ga lahko pripišemo učinku. Dobimo ga z odnosom med odklonom zaradi učinka (SSeff) in totalnim odklonom (SSt). Računanje n2 je naslednje: SS n2 = ^ (3) SSt Eden od problemov, povezanih z uporabo n2, izvira iz dejstva, da je vrednost tega indeksa pri enem od učinkov odvisna od števila in velikosti ostalih preučevanih učinkov. Tako bi se, če bi dvema neodvisnima spremenljivkama dodali še tretjo, vrednost učinka, pripisana interakciji med prvima dvema, zmanjšala, medtem ko bi varianca, pripisana tej isti interakciji, ostala nespremenjena. Parcialni eta kvadrat (np2) se od n2 razlikuje v tem, da v imenovalcu enačba ne uporablja totalne variance (SSt), ampak vsoto med varianco zaradi učinka (SSeff) in varianco zaradi napake (SS ). V enačbi: 2 SS„ n2 =-^-el (4) lp (SSeff + SSerr ) Indeks omega kvadrat (ro2) ocenjuje količino variance, pojasnjene z neodvisno spremenljivko v populaciji. Temelji na parametrih populacije, ki pa so ponavadi nepoznani Statistična pomembnost in njen pomen 17 in jih je treba oceniti na osnovi vzorčnih podatkov. Ocenjen ro2 indeks ( ro2 ) je izražen z enačbo: 0)2 = (k - l1)F -l) (5) (k - 1)(F -1)+ kn kjer k pomeni število skupin, n je število oseb v skupini in F vrednost testa. Teh enačb ne moremo uporabiti pri ponovljenih merjenjih. Indeks intraklasne korelacije (p:) ocenjuje povezanost med neodvisno in odvisno spremenljivko v populaciji za model random effects (model naključnih učinkov, op. prev.): Pi MSf - MSeII (6) MSf + glf MSeu Analogno koeficientu determinacije je kvadrat indeksa p: indeks deleža variance odvisne spremenljivke, ki ga pojasni neodvisna spremenljivka. Povezanost in korelacija Koeficiente korelacije lahko pojmujemo kot mere velikosti učinka. Bravais-Pearsonov koeficient r (kot tudi točkovno biserialni koeficient rpb in O) lahko računamo na osnovi vrednosti Studentovega t testa in %2: 2 X_0) (7) N r = ! ^ (8) t2 + df Koeficienta r in rpb lahko dobimo tudi iz mer velikosti učinka v ožjem pomenu izraza, ki bosta podrobno predstavljeni v naslednji točki: Cohenovega d in Hedgesovega g. Za celovitost razlage pa prikazujemo tudi enačbe, ki omogočajo izračun r iz teh indeksov. Za pretvorbo r v d se uporablja naslednja enačba: r= 4? + 4 (9) 18 C. Bachmann, R. Luccio in E. Salvadori Če je vzorec majhen ali so numerusi vzorcev zelo različni, je bolj natančna naslednja enačba (Aaron, Kromrey in Ferron, 1998): d2 + N2 - 2 N (10) nin2 Za izračun r iz Hedgesovega g se uporablja naslednja enačba: r = ■ g g2 + 4 (11) N Povezanost in kontingenčne tabele Najbolj uporabljena mera povezanosti v kontingenčnih tabelah je Pearsonov koeficient kontingence C, ki variira med 0 (odsotnost učinka) in 1 (zgornja meja). Enačba je: C = X X2 + N (12) Kot smo videli pri prejšnjih enačbah, lahko tudi koeficient korelacije uporabimo za določitev velikosti učinka. Na koncu prikazujemo še Cramerjev indeks, ki ga uporabljamo za X2, dobljen iz kontingenčnih tabel, in ki ima to prednost, da ga lahko uporabljamo s tabelami katere koli dimenzije: X2 (13) N ■ g{ kjer je glmin = k - 1, k pa je tista vrednost števila stolpcev ali števila vrstic, ki je manjša. Povezanost in regresija Pogosto uporabljena mera povezanosti v regresijski analizi je koeficient determinacije r2 (pogosto označen z R2). Ta daje kvantifikacijo deleža variance odvisne Statistična pomembnost in njen pomen 19 spremenljivke, določenega z njenim odnosom z neodvisno spremenljivko. SS r2 = ^ (14) SSt Koeficient r2 lahko zavzema vrednosti, ki variirajo med 0 (odsotnost učinka -vsa pojasnjena varianca je posledica napake) in 1 (popoln učinek ali popolna predikcija - vsa pojasnjena varianca je posledica neodvisne spremenljivke). Mere velikosti učinka Te mere predvidevajo analizo razlike med povprečji, ki bi, glede na ničelno hipotezo, morala biti ničelne velikosti. Poglejmo nekatere. Dva neodvisna vzorca Mere velikosti učinka, ki se uporabljajo pri neodvisnih skupinah, temeljijo na standardiziranih razlikah med povprečji. Najbolj uporabljeni indeksi so: (i) Cohenov d; (ii) Hedgesov g; (iii) Glassov A. Indeks d je odnos med razliko povprečij (M1 - M2) in standardno deviacijo (a) ene od dveh skupin (Cohen, 1988): d = (15) a Ta oblika enačbe naj bi se uporabljala samo za homogene variance. Ker homogenost ni vedno zagotovljena, se v praksi (Rosnow in Rosenthal, 1996) namesto a uporablja skupna standardna deviacija (pooled) (ap, Cohen, 1988), ki jo dobimo s kvadratnim korenom povprečja varianc. Izračun d temelji na vzorčnih podatkih. Pri vzorcih z manjšim numerusom Hedges in Olkin (1985) predlagata uporabo popravljene enačbe: dc = d 1 - 4(n + n2)-9 (16) Indeks d lahko izračunamo tudi na podlagi vrednosti Studentovega t za dva neodvisna vzorca (Rosenthal in Rosnow, 1991): 3 d = t (ni + n2) Jgl X n X ni (17) 20 C. Bachmann, R. Luccio in E. Salvadori Indeks d lahko izračunamo iz F testa za univariatno analizo z dvema skupinama ali iz koeficienta korelacije r (Friedman, 1968): d = (18) V£tr Iz enačbe (9) lahko dobimo d iz katerega koli koeficienta korelacije. Hedgesov (1981) indeks g dobimo z enačbo: M - M2 (19) ki ima v imenovalcu srednji kvadrat znotraj skupin (within) iz ANOVA-e za dve skupini. Hedgesov g lahko izračunamo iz t za neodvisne vzorce (Rosenthal in Rosnow, 1991): g = (20) Glassov (1976) A indeks je odnos med razliko povprečij eksperimentalne in kontrolne skupine (M -M2) in standardno deviacijo kontrolne skupine (le-ta je privzeta kot najbolj podobna populacijski): Mi - M2 D = -1-2 (21) Dva odvisna vzorca Za izračun indeksa d pri ponovljenih merjenjih na istem vzorcu bi lahko uporabili: (i) vrednost t za ponovljena merjenja za pridobitev Cohenovega indeksa d (Rosenthal, 1991 - vendar bo vrednost indeksa d, doblj enega iz t za ponovlj ena merj enj a, ki vključuj e korelacijo, vedno večja od vrednosti d, dobljene iz t za neodvisne vzorce); (ii) standardni deviaciji obeh originalnih povprečij (prim. Dunlap, Cortina, Vaslow in Burke, 1996 - vendar tukaj napaka ne teži k izničenju, ampak k seštevanju). Enak problem bi se pojavil, če bi se odločili za oceno indeksa d z uporabo testa F, izhajajoč iz ANOVAe za ponovljena merjenja za dve skupini. Alternativo predstavlja Cohenov (1988) indeks f Statistična pomembnost in njen pomen 21 my f = (22) 5 y kjer je my povprečje razlik med povprečji in je sy dobljen z enačbo: 5y = V s2a + S2S - 2 rsA sB (23) Drugi indeksi velikosti učinka Obstajajo tudi drugi indeksi velikosti učinka. Cohenov (1988) indeks q uporablj amo, da bi dobili velikost učinka pri razlikah med koeficienti korelacij e. Dobimo ga z naslednjo enačbo: q = z - Z2 (24) kjer so r spremenjeni v točke z s sledečo enačbo: 1, 1 + r z = - loge (25) 2 e1 - r Indeks h (Cohen, 1988) uporabljamo za velikost učinka pri razlikah med proporci. Izmerimo neko dihotomno odvisno spremenljivko na dveh neodvisnih vzorcih in dobimo za vsakega proporc uspeha (P in P2). Uporabili bomo nelinearno transformacijo P, kot npr. arcus sinus: f = 2arcsin Indeks h torej dobimo z enačbo: h = fi - f2 (27) Indeks w uporabljamo za velikost učinka za %2 test pri preverjanju prileganja porazdelitve in pri analizi kontingenčnih tabel. V prvem primeru imamo frekvence kategorij (empirične) in jih želimo primerjati s frekvencami iste skupine kategorij, za katere poznamo porazdelitev na osnovi H0 (pravokotna ali normalna porazdelitev itd). V drugem primeru so frekvence računane hkrati na več ravneh več spremenljivk, za katere H0 predvideva, da so med seboj neodvisne. Za vsako celico imamo dva proporca, ki ju predvidevata ničelna in alternativna hipoteza. Indeks w meri diskrepanco med proporcema v celicah: 22 C. Bachmann, R. Luccio in E. Salvadori W = 1 (Pi - P )2 P (28) kjer je P0i proporc v i-ti celici, ki ga predvideva ničelna hipoteza, P1. proporc v i-ti celici, ki ga predvideva alternativna hipoteza in m število celic. Indeks f (Cohen, 1988) je mera velikosti učinka pri ANOVA-i in ANCOVA-i. Lahko ga pojmujemo kot razširitev indeksa d na primere, v katerih imamo več kot dve skupini. Lahko ga izračunamo z naslednjo enačbo: =i f = 1 t (m, - m)2 (29) =i kjer so mi povprečja k skupin, m pa je skupno povprečje. Indeks f 2 (Cohen, 1988) uporabljamo za velikost učinka v multipli regresiji in v drugih multivariatnih metodah. Glede na to, da te temeljijo na F porazdelitvi, je v resnici indeks f2 vsebinsko enak že obravnavanemu indeksu f. Za izračun indeksa f 2 se uporablja naslednja enačba: f 2 = PVf ' PV (30) err kjer je PVeff delež variance, ki je posledica obravnave, PVerr pa rezidualna varianca. Rosenthalova in Rubinova BESD Rosenthal in Rubin (1982) sta predlagala metodo za interpretacijo velikosti učinka, imenovano Binomial Effect Size Display (BESD), z namenom, da bi postala očitna sprememba v deležu uspeha (izboljšanje, ozdravitev, izboljšanje samovrednotenja), ki je posledica obravnave. Metoda predpostavlja možnost dihotomizacije odvisne spremenljivke, kar pojasnjuje njen uspeh v raziskavah, ki ocenjujejo učinkovitost terapevtskih obravnav ali psihopedagoških metod, pa tudi njen uspeh v metaanalizah. Za izračun ustreznih vrednosti prirastka uspeha izhajamo iz točkovno biserialnega koeficienta r in koeficienta r2. Delež uspeha v kontrolni skupini (ali v primeru samo enega vzorca delež uspeha pred ali v odsotnosti obravnave) in delež uspeha v eksperimentalni skupini (ali v primeru enega vzorca delež uspeha po Statistična pomembnost in njen pomen 23 obravnavi) sta dana po naslednjih enačbah: 0,50 - 2 (31) 0,50 + - (32) 2 Tabela 1 prikazuje prirastek uspehov na osnovi vrednosti r in r2. Pojasnimo metodo z enim primerom. Predstavljajmo si, da delamo raziskavo za preverjanje učinka kirurškega posega na preživetje pacientov, ki imajo resno kardiopatijo. Točkovno biserialni koeficient korelacij e, izračunan na zbranih podatkih, znaša rpb = 0,33. Ce v enačbah 31 in 32 zamenjamo r s to vrednostjo, dobimo naslednji vrednosti: 0 33 0,50 —= 0,50 - 0,165 = 0,335 2 0 33 0,50 + = 0,50 + 0,165 = 0,665 2 To pomeni, da delež uspeha, torej verjetnost preživetja pacientov, naraste s 33,5 % na 66,5 % za tiste, ki so izpostavljeni posegu. Metodo podpira možnost pretvorbe najbolj uporabljenih statističnih testov v r, še bolj pa jo podpira enostavnost spremembe mer velikosti učinka v BESD v metaanalizah (prim. Lyons in Woods, 1991). Poleg uporabe pri dihotomnih odvisnih spremenljivkah (uspeh vs. neuspeh) lahko BESD uporabljamo tudi pri odvisnih Tabela 1. Deleži prirastka uspehov, izhajajoč iz nekaterih vrednosti r in r2. r r2 Prirastek deleža uspeha od do Razlika v deležu uspeha 0,10 0,01 0,45 0,55 0,10 0,20 0,04 0,40 0,60 0,20 0,30 0,09 0,35 0,65 0,30 0,40 0,16 0,30 0,70 0,40 0,50 0,25 0,25 0,75 0,50 0,60 0,36 0,20 0,80 0,60 0,70 0,49 0,15 0,85 0,70 0,80 0,64 0,10 0,90 0,80 0,90 0,81 0,05 0,95 0,90 1,00 1,00 0,00 1,00 1,00 24 C. Bachmann, R. Luccio in E. Salvadori spremenljivkah, ki so na metrični lestvici, če je varianca v skupinah s skoraj enakim numerusom približno enaka (glej Rosenthal, Rosnow in Rubin, 2000; za previdnost pri uporabi metode glej Thompson and Schumacker, 1997). Interpretacija velikosti učinka Ne obstaja splošno sprejeto pravilo za interpretacijo velikosti učinka. V odvisnosti od problemov raziskave se lahko zgodi, da je velik učinek irelevanten, majhen učinek pa pomemben (Rosenthal, 1993). Literatura ponuja določene referenčne vrednosti, ki pa jih moramo uporabljati previdno. Referenčne vrednosti za posamezne indekse Tabela 2 povzema referenčne vrednosti za veliko indeksov velikosti učinka (prim. Cohen, 1988, 1992a, 1992b; Cooper in Findley, 1982; Haase, Waechter in Solomon, 1982; Sedlmeier in Gigerenzer, 1989). Cohen (1988) interpretira velikost učinka na osnovi prekrivanja porazdelitev dosežkov dveh vzorcev (eksperimentalnega in kontrolnega). Transformacijo d lahko interpretiramo s standardno normalno porazdelitvijo. Narejenih je bilo nekaj poskusov, da bi dobili kritične točke ali razpone za interpretacijo vrednosti indeksov. Vendar pa se je dobro izogniti rigidni uporabi le-teh. Velikost učinka je treba najprej interpretirati v odnosu do rezultatov predhodnih raziskav (Wilkinson in TFSI, 1999; Welkowitz, Ewen in Cohen, 1982; Thompson, 2002). Kot pravi Thompson (2001): če je tu rigidnost enaka kot pri uporabi 0,05 pri metodi TNH, naredimo enako napako na drugi lestvici. Tabela 2. Pomen velikosti učinka pri najpogosteje uporabljenih indeksih. Tip analize Test Velikost učinka Majhen Srednji Velik 0,20 0,50 0,80 0,10 0,25 0,40 0,10 0,25 0,40 0,01 0,06 0,15 0,10 0,25 0,40 0,10 0,30 0,50 0,02 0,15 0,35 0,10 0,30 0,50 0,10 0,30 0,50 0,20 0,50 0,80 t test za neodvisne vzorce t test za odvisne vzorce ANOVA ANCOVA Korelacija Multipla regresija in multivariatne metode Hi kvadrat Razlike med koeficienti korelacije Razlike med proporci ff f r r2 q h Statistična pomembnost in njen pomen 25 Intervali zaupanja Eden od predlaganih načinov za integracijo informacij metode TNH so intervali zaupanja. Širino intervala določa verjetnost, imenovana koeficient zaupanja, da interval vsebuje parameter. To pomeni, da bolj kot se poveča velikost vzorca n, bolj se zmanjša meja napake, in se torej poveča natančnost ocene. Bolj kot se zmanjša koeficient zaupanja, bolj se pri nespremenjenem n interval zoži. S povečanjem koeficienta zaupanja se poveča tudi interval, ki pa postane malo informativen. Intervale zaupanja lahko izračunamo za vsak parameter: povprečje, varianco, proporc, mediano itd. Za povprečje: ne glede na porazdelitev izvorne populacije, po centralnem limitnem izreku pri n, večjem ali enakem 30, teži vzorčna porazdelitev povprečij k normalni obliki. Ce je a = 0,05, je kritična vrednost z (pri dvostranskem testiranju) ±1,96. Ce a ne poznamo, jo ocenimo na osnovi standardne deviacije vzorcev (s) in vzorčna porazdelitev povprečij dobi obliko Studentove t porazdelitve z n-1 stopnjami svobode. Porazdelitev za varianco je %2 porazdelitev: %n—1 = (n — l)š2 / a2 Ce moramo oceniti proporc n, s katerim je določena lastnost prisotna v populaciji, je porazdelitev naključne spremenljivke p normalna standardizirana porazdelitev, s povprečjem ^p = np in standardno napako proporcev ap = ^pq/ n, če je n dovolj velik. Ce je n vzorca med 1 in 10, je dobro uporabiti metodo grafičnega postopka, ki sta jo predlagala Clipper in Pearson (1934). Do sedaj predstavljeni postopki se nanašajo na vzorec, ki smo ga vlekli iz neskončne populacije, medtem ko moramo za končno populacijo ocenjeno varianco popraviti, saj bi bila sicer večja od dejanske (prim. Burstein, 1975). Tudi za velikost učinka je ustrezna uporaba intervalov zaupanja. Ce interval zaupanja vključuje vrednost 0, je to enakovredno temu, da imamo rezultat, ki ni statistično pomemben. Nasprotno, če vrednost 0 ni vključena v intervalu, je to statistično pomembno. Primer Cohenovega d je posebno lahko rešljiv. Ta indeks je namreč normalno porazdeljen in ima standardno deviacijo enako: (33) n + n2 d 1 2 + 2 nin2 2(ni + n2 ) kjer sta n1 in n2 numerusa eksperimentalne in kontrolne skupine (Hedges in Olkin, 1985). Lahko torej določimo desne in leve z vrednosti, ki ustrezajo prej določeni ravni a. Na žalost se velika večina ostalih pregledanih indeksov ne porazdeljuje normalno, kar implicira nujnost uporabe drugih metod. V teh primerih uporabimo lahko dostopno programsko opremo, kot je SPSS ali STATISTICA (glej Smithson, 2001; Steiger in Fouladi, 1997). Glede tega problema glej Fidler in Thompson (2001). 26 C. Bachmann, R. Luccio in E. Salvadori Za neparametrične teste vzemimo za primer Kendallov koeficient korelacije rangov T (tau), na katerega za razliko od r in p ne vpliva nenormalnost porazdelitve vzorcev, zaradi česar ga raziskovalci pogosto raje uporabljajo (Long in Cliff, 2004). Če bi vmesne korake izpeljali po šolski metodi - na dolgo (prim. Siegel, 1956), bi videli, da interval dobimo z naslednjo enačbo: V2(2n + 5) < < _ V2(2n + 5) (34) ^vncn—i) - -krit Tako se privzame, da je n! možnih razvrstitev rangov enako verjetnih. Ce ocenjujemo T »parametrično« (Cliff in Charlin, 1991), moramo zamenjati vrednost zkrit z vrednostjo iktit. Vendar se zdi, da te simulacije niso prinesle velikih prednosti (prim. Long in Cliff, 2004). Moč statističnega testa Moč, vezana direktno na napako drugega tipa, je zmožnost prepoznati učinek, kadar pride do njega. Dobimo jo z 1 - p. Pomembno se je zavedati, da določiti a implicira določiti hkrati tudi p. Ti dve verjetnosti sta med seboj povezani. H0 in Hx namreč ustrezata dogodkom z »nepopolno diskriminativnostjo«, torej se ustrezni porazdelitvi delno prekrivata. Npr. pri primerjavi povprečij z določitvijo a določimo področje zavrnitve v porazdelitvi H0 (pri enostranskem testiranju je to področje desno od odločitvene osi). Vendar odločitvena os preseka tudi porazdelitev, ki ustreza H1 in področje na levi strani osi ustreza p. Parametri porazdelitev H0 in H1 ter razdalja med njima (ki je enaka Cohenovemu d) so podani, in če hočemo najti optimalen p, moramo spremeniti velikost vzorca. Če že poznamo |0, |lp c0 in cp torej povprečja in standardne deviacije univerzumov, ki ustrezajo H0 in H1, bodo področja zavrnitve ničelne in alternativne hipoteze ustrezala odgovarjajočim z točkam (enosmernim). Če bomo torej določili a na 0,05 in p na 0,2, bodo ustrezne točke z 1,645 in -0,845. Lahko bomo torej postavili naslednji sistem enačb, katerega neznanki sta M (kritično povprečje, nad katerim zavrnemo ničelno hipotezo in sprejmemo alternativno, ki ustreza a = 0,05) in ravno N: M^m = i,645 s0 ^ (35) =-0,845 s0 ■Jn Statistična pomembnost in njen pomen 27 Moč določajo trije viri: (i) raven a (in usmerjenost ničelne hipoteze); (ii) velikost vzorca; (iii) velikost učinka (razdalja med || in ^1). Na splošno z njihovim povečanjem raste tudi vrednost moči. Simon (1999) je predlagal uporabo neformalnega pravila, ki predvideva določitev a na 0,05 in P na 0,2. To pomeni, da bi morala biti vrednost moči najmanj 0,80, da bi bila sprejemljiva, medtem ko bi morala biti verjetnost, da naredimo napako drugega tipa, 20 %. Odnos q med vrednostmi P in a določa tudi težo, pripisano obema tipoma napak (Cohen, 1988). Če bi npr. imeli a = 0,001 in P = 0,50, bi bil odnos q enak (0,50/0,001) = 500, kar bi pomenilo enako kot trditi, da je zmotna zavrnitev ničelne hipoteze 500-krat hujša kot njeno sprejetje. Če sledimo Simonovemu nasvetu, bi odnos q ustrezal vrednosti (0,20/0,005) = 4, kar pomeni, da je zavrnitev ničelne hipoteze zaradi napake štirikrat hujša od njenega zmotnega sprejetja. Na moč vpliva tudi usmerjenost ničelne hipoteze (Cohen, 1988). V normalni porazdelitvi z a = 0,05 je kritična vrednost z pri enosmernem testiranju 1,654 in pri dvosmernem testiranju 1,96. Z dvosmerno a bo imel test manjšo moč določanja učinka v primerjavi z načrtom raziskave z enako vrednostjo a, ampak enosmerno, pod pogojem, da gre rezultat v predvideni smeri. Povezanost med močjo in velikostjo vzorca nas pripelje do problema zanesljivosti dobljenih rezultatov. Večji kot je numerus vzorca, manjša je napaka in večja je zanesljivost ali natančnost rezultatov. Velikost učinka najbolj pomembno določa moč. Večja kot je velikost učinka pri enaki ravni a in velikosti vzorca, večja je moč testa (Cohen, 1988). Analiza moči se nanaša še na en temeljni cilj velike večine raziskav: ponovljivost (Ottenbacher, 1996). Muller in Lavange (1992) sta odkrila pogoste napake raziskovalcev pri izbiri ustrezne analize moči glede na uporabljen načrt. A priori analizo moči uporabljamo za določitev velikosti vzorca, ki je potrebna, da jamči določeno moč testa. A posteriori analizo moči uporabljamo, da bi spoznali moč testa, ki je bil uporabljen. A priori ali a posteriori analize moči se je možno lotiti z uporabo tabel (Kraemer in Thiemann, 1987; Cohen, 1988; Lipsey, 1990; Zar, 1996) ali statističnih programov. V apriornih analizah je treba poznati a, moč in velikost učinka, bodisi na osnovi poznanega iz literature bodisi na osnovi posebnih vidikov raziskave. V aposteriornih analizah je postopek enak, saj poznamo a, velikosti vzorca in učinka, ki so vsi vnaprej določeni (izbor a in N pri definiciji načrta raziskave, velikost učinka pa izračunamo na zbranih podatkih). V obeh primerih kontroliramo križanje vrednosti, podanih v tabelah, ki je relevantno za pridobitev moči testa. Predvsem Cohen (1988) predstavlja veliko tabel za analizo moči a priori in a posteriori z veliko statističnimi testi, za katere navaja referenčne vrednosti glede na tri različne ravni a (0,01, 0,05 in 0,10), z izpeljankami na osnovi uporabljenega testa. Obstaja veliko programov za analizo moči: (i) Power and Precision (Borestein, Cohen in Rothstein, 1997), v SPSS kot Sample Power (ne za ponovljena merjenja in za MANOVA-o); (ii) PASS (NCSS Statistical Software, 1999), tudi za ponovljena merjenja, a ne za MANOVA-o; (iii) G*Power (2000), ki je, poleg tega, da je brezplačen, tudi preprost za uporabo; (iv) SAS Macro (Friendly, 1991), imenovan mpower, samo 28 C. Bachmann, R. Luccio in E. Salvadori za aposteriome analize. Tudi dva zelo uporabljena programa ponujata analize moči: (i) SPSS, samo aposteriorno, za ANOVA-o; (ii) Systat 10, tako za apriorne kot za aposteriorne analize, za veliko večino statističnih testov. Prevzorčenje Obstajajo alternativni načini spopadanja s problemom metode TNH, ki temeljijo na tehnikah simulacije, imenovani na splošno načini ponovnega vzorčenja (resampling) (Simon, 1969; Simon, Atkinson in Shevokas, 1976). V resnici ti segajo nekaj desetletij nazaj, k Fisherju (1935), ki je zasnoval t. i. eksaktne teste. Se pred njim pa je v dvajsetih letih to idejo zasnoval von Mises (1928; prim. von Mises, 1964). Randomizacijski test Znan je Fisherjev t. i. test eksaktne verjetnosti za kontigenčne tabele, ki ga ponavadi računamo s hipergeometričnim koeficientom. Logiko, ki je v osnovi tega testa, lahko posplošimo. Imamo vzorec x: {x1,x2, ..., xn}, sestavljen iz vrednosti, ki so na metrični ravni. Pogledamo, ali je tistih nad povprečjem več (ali manj) od tistih pod povprečjem. Ni pomemben odklon od povprečja, ampak samo frekvenca nadpovprečnih (ali podpovprečnih) vrednosti. H0 predvideva, da je verjetnost, da bomo imeli pozitiven dogodek p(P), enaka verjetnosti negativnega dogodka p(N), in glede na to, da je to Bernoullijev univerzum, sta obe verjetnosti enaki 0,5. Verjetnost, povezano s pojavljanjem k pozitivnih in n - k negativnih dogodkov, dobimo z naslednjo enačbo: Fisher (1935) meni, da mora raziskovalec izračunati vse verjetnosti, povezane z vsemi možnimi izidi eksperimenta. Te verjetnosti mora urediti po vrstnem redu pripisovanja k izidom, ki so progresivno vedno bolj oddaljeni od ničelne hipoteze. Najti mora točko, v kateri je verjetnost opazovanega dogodka. Ta razdeli na dva dela prostor verjetnosti vseh izidov, ki se jih da realizirati, in sicer je na eni strani opazovana verjetnost in vse verjetnosti, povezane z bolj neugodnimi izidi za ničelno hipotezo (vsota, ki jo moramo podvojiti za dvosmerne hipoteze), na drugi strani pa so verjetnosti, ki prištete k prejšnjim dajo 1. Primer lahko razširimo na bolj kompleksne situacije. Vzemimo, da imamo dva neodvisna vzorca in dve ravni obravnave, in da lahko za primerjavo povprečij uporabimo t. Vzorci so majhni, učinek in moč nista velika in zato tudi pomembna vrednost t pušča dvome o možnosti dokončne odločitve. Zato kot naključno spremenljivko obravnavamo uporabljeno statistiko (v našem primeru t), tako da s podatki, ki jih imamo na razpolago, (36) Statistična pomembnost in njen pomen 29 povečamo pare vzorcev za primerjavo. Tako ustvarimo veliko t-jev, preučimo njihovo porazdelitev in pogledamo, kje se nahaja na začetku opazovani t. Vzamemo torej prvi vzorec in zamenjamo eno njegovo vrednost z vrednostjo iz drugega vzorca. Tako bomo imeli dva nova vzorca, za katera bomo lahko izračunali t. Nato sistematično zamenjamo s prvo vse ostale vrednosti drugega vzorca, eno naenkrat, tako da vsako vsakokrat postavimo na svoje mesto in vsakokrat izračunamo ustrezni t. Potem naredimo enako z drugo, tretjo vrednostjo itd. do zadnje vrednosti. Ce ima vsak vzorec n oseb, bomo dobili populacijo z n2 statistikami, katerih porazdelitev bomo preučevali in znotraj nje pogledali intervale zaupanja ter kje se nahaja originalni t. Neeksaktni testi randomizacije uporabljajo Fisherjevo intuicijo, ampak omejujejo število vzorcev, uporabljenih za preučevanje porazdelitve uporabljene statistike. Dovolj naj bi bilo 1000 vzorcev (vzetih slučajno), če hočemo postaviti intervale zaupanja na ravni 0,05, in vsaj 5000 vzorcev, če hočemo preiti na raven 0,01 (Manly, 1997). Cross-validation (navzkrižna validacija) Prvo praktično realizacijo povedanega predstavlja metoda cross-validation, ki so jo razvijali od štiridesetih let naprej na korelacijskih načrtih in ki ima izvor v študijah zanesljivosti (reliability) testov. Prvo sistematizacijo metode je podal Mosier (1951). V enostavni navzkrižni validaciji originalen vzorec naključno razdelimo na dva podvzorca enake velikosti. Izračunamo parametre regresijske premice v prvem podvzorcu, s katerimi izračunamo napovedane vrednosti drugega podvzorca. Tako dobimo koeficient navzkrižne validacije - koeficient korelacije med dejanskimi in napovedanimi vrednostmi. V dvojni navzkrižni validaciji izračunamo regresijsko premico in napovedane vrednosti v obeh podvzorcih. Napovedane vrednosti v prvem podvzorcu izračunamo prek regresijske premice, dobljene na drugem vzorcu, in nasprotno naredimo za drugi podvzorec. Koeficient navzkrižne validacije je torej koeficient korelacije med opazovanimi in napovedanimi vrednostmi za celoten vzorec. Pomemben napredek pa pomeni uporaba večkratne navzkrižne validacije. V tem primeru vzorec razdelimo na dva slučajna podvzorca. Postopek nadaljujemo kot pri dvojni navzkrižni validaciji in ga nato velikokrat ponovimo. Koeficient navzkrižne validacije je povprečje dobljenih korelacijskih koeficientov. Poleg tega lahko preučujemo porazdelitev dobljenih koeficientov. Navzkrižna validacija ima še vedno določene privržence, kot je Thompson (1993). Vendar pa je zaradi verjetnosti artefaktov, ki so posledica majhnosti vzorcev, veliko raziskovalcev previdnih in predlagajo raje uporabo tehnike jackknife (npr. Ang, 1998). Jackknife V tehniki jackknife, ki sta jo predlagala Quenouille (1949) in Tukey (1958), imamo vzorec x, na katerem računamo našo statistiko 0. Ce vzorec x sestavlja n vrednosti, ustvarimo n podvzorcev vzorca x, vsakega z n - 1 vrednostmi, kot če bi s 30 C. Bachmann, R. Luccio in E. Salvadori pipcem izrezali (jackknife) vsakokrat po eno vrednost iz originalnega vzorca. Na teh vzorcih računamo statistiko 0', in za vsak vzorec dobimo t. i. psevdovrednost (PV): PV = n X q -(n - l) (37) Tako bomo imeli en vzorec z n psevdovrednostmi, katerega povprečje je jack-knifed coeficient (jc). Če jc delimo s standardno napako ocene, dobimo t, katerega pomembnost bomo lahko preverjali. Tehnikajackknife minimizira učinek osamelcev. Diskusija o primernosti izločitve teh točk iz podatkov je vedno aktualna, tudi zato, ker je proizvedeno popačenje tesno povezano z velikostjo vzorca (prim. Miller, 1991). Jackknife nam ta problem reši brez stranskih učinkov, ker učinek osamelcev izgine v velikem številu uporabljenih vzorcev. Bootstrap Bistvena razlika med tehnikama bootstrap, ki sta jo neodvisno razvila Simon (1966; prim. Simon, 1969) in Efron (1979), in jackknife je v tem, da pri slednji uporabljamo vzorčenje brez vračanja, pri tehniki bootstrap pa vzorčenje z vračanjem. Pri tehniki bootstrap vsak element, ki ga izvlečemo, takoj nato spet vrnemo v originalno celoto, zato se lahko zgodi, da je ponovno izvlečen. To znatno poveča univerzum možnih vzorcev, medtem ko smo pri tehniki jackknife omejeni na število vzorcev, ki je lahko zmanjšano. Po našem mnenju je tehnika bootstrap zelo učinkovita pri neodvisnih vzorcih, medtem ko je lahko pri paroma odvisnih vzorcih precej manj zanesljiva kot randomizacija. To velja predvsem za majhne vzorce (ki po navadi psihologa bolj zanimajo), medtem ko moramo pri velikih vzorcih na problem verjetno gledati na drugačen način. Zaključki Naše delo lahko zaključimo na sledeč način: v inferenčnih analizah upoštevajmo okvir, ki je na razpolago raziskovalcu, v vsej njegovi širini in kompleksnosti ter (skladno s priporočili APA) naj pomembnost vedno spremljajo indeksi, o katerih smo govorili (velikost, intervali zaupanja in moč). K temu dodajamo priporočilo, naj analizo spremlja katera od mer prevzorčenja. Dodatno, četudi le na kratko, moramo preudariti še tri probleme: (i) v kolikšni meri so to razpravo ustvarili prav raziskovalci; (ii) kako učimo inferenčno statistiko; (iii) ali je res treba prekomerno uporabljati te tehnike za analizo podatkov. Statistična pomembnost in njen pomen 31 Metoda TNH v objavljenih raziskavah Analize v glavnih psiholoških revijah so pokazale, da so raziskovalci neobčutljivi na problem, in predvsem to, da v zadnjih letih, kljub obširni razpravi o tej temi, ni prišlo do izboljšanja. Skoraj trideset let od prve pionirske raziskave Cohena (1962) v reviji Journal of Personality and Social Psychology je analiza Sedlmeierja in Gigerenzerja (1989) dala skoraj enake rezultate: videti je, da raziskovalci (in uredništva znanstvenih revij) v tridesetih niso opazili problema in so nadaljevali z delom na enak način. Pozornost raziskovalcev je bila predvsem osredotočena na moč uporabljenih statističnih testov, vendar je ta običajno zelo nizka, s sredino manjšo od 0,5, torej, kot poudarja Hunter (1997), na ravni slučaja. Pomembnost je splošno privzeta kot potrditev alternativne hipoteze. Pri tem raziskovalci ne razmišljajo o moči (zgoraj omenjene vrednosti so rezultati post hoc analiz, ki so jih izvedli citirani raziskovalci in ne avtorji raziskav), izjemo pa predstavlja prisotnost drugih indeksov, od tistih glede velikosti učinka do intervalov zaupanja. Tudi v Italiji je imela diskusija glede metode TNH slab odmev. En prispevek (ki se nanaša na sociologijo) je dal Pisati (2002), na kongresu AIP iz Barija pa je zanimanje sprožilo poročilo Angolija (2002). V juniju 2003 je bil v Firenzah en dan posvečen obravnavi tega problema. Srečanja so se udeležili skoraj vsi italijanski učitelji disciplinskega združenja M.PSI/03, ki združuje psihometrijo in sorodne predmete. Diskusija je bila omejena na krog metodologov. Ali je to, da raziskovalci ne zaznajo problema, lahko odvisno od načina, na katerega so se med usposabljanjem naučili analizirati podatke raziskav? To bomo zdaj skušali dognati. Učenje statistike bodočih psihologov in metoda TNH Kot opažata Haller in Krauss (2002), bi bilo »učenje metode TNH upravičeno le, če so študenti zmožni razumeti pomen tistega, kar počnejo« (str. 2). Vendar do zdaj opravljene raziskave kažejo, da po povprečnih predavanjih iz statistike študent nima najmanjše ideje o tem, kaj TNH dejansko pomeni (Falk in Greenbaum, 1995; Gigerenzer in Krauss, 2001) in je v najboljšem primeru osvojil postopek računanja (Gigerenzer, 1998). Na žalost pa, kot je pokazal Oakes (1986), akademskim psihologom pogosto stvari niso bolj jasne kot študentom. Haller in Krauss (2002) sta želela ugotoviti, ali se taka zmotna razumevanja prenesejo pri učenju, prek napak ali zmede v priročnikih ali celo prek zmotnih razumevanj pri učiteljih. Glede priročnikov tako Haller in Krauss kot Sedlmeier in Gigerenzer (1989) predstavljajo »muzej grozot«, ki ne izvzema niti produktov take »svete krave« statistike, kot je Nunnally (1975). Le-ta je na treh straneh (194-196) podal kar osem različnih definicij pomembnosti, ki pa so vse napačne. Kar se tiče učiteljev statistike, predvsem praktikov, so podatki, ki jih 32 C. Bachmann, R. Luccio in E. Salvadori predstavljajo Haller in Krauss za Nemčijo in Oakes za ZDA, še bolj brezupni. Za Italijo podatkov nimamo na razpolago, vendar moramo upoštevati, da je razširitev univerzitetnih programov psihologij e na nacionalnem območju močno povečala potrebo po psihometričnem poučevanju, ki se pogosto zaupa mladim izvrstnim raziskovalcem, ki pa žal nimajo zadovoljive specifične izobrazbe. Je metoda TNH obvezna pot? Na tej točki se zdi, da bi lahko sklenili tudi takole: TNH se zdi skoraj obvezna pot, ker je njena logika nedvoumna in linearna ter so za raziskovalca s slabim osnovnim znanjem kompleksnejši pristopi težko razumljivi. Poleg tega ta postopek obravnave problema dobiva neprestane podkrepitve. Tako narejen članek znanstvena revija prej sprejme, pri predstavitvi rezultatov na določenem kongresu uporaba te metode ne vzpodbudi ugovorov, temveč celo pohvale kolegov. Vendar, ali je ta način postopanja nujen? Povedali smo že, da v splošnem znanost meni, da je ta način obdelovanja podatkov nenavaden in poleg psihologije ni veliko disciplin, v katerih ima privilegiran položaj. Toda tudi psihologija je že od začetka 20. st. naprej razvijala alternativne načine za obdelovanje svojih podatkov, npr. faktorsko analizo. Vendar je ta razumljena kot raziskovalna analiza, mati vseh multivariantnih analiz in na splošno vseh tistih analiz, ki temeljijo na strukturah kovariance, od konfirmatornih analiz do modelov strukturnih enačb. Na osnovi tega bi lahko rekli, da te analize zahtevajo velike vzorce, v primerjavi s TNH, ki lahko dela na majhnih vzorcih (čeprav ne tako majhnih, kot jih pogosto vidimo objavljene). Res je, vendar pa obstaja skupen vidik teh in drugih vedno bolj uporabljenih analiz (kot npr. log-linearni modeli ali logistična regresija), pri katerem se je vredno ustaviti, in sicer preverjanje modelov. Če izvzamemo posebna področja (kot je npr. psihofizika), je preverjanje modelov glavna aktivnost pri analizi podatkov večjega dela naravoslovnih znanosti. Znanstvenik na osnovi literature ali lastnih inovativnih hipotez in na koncu tudi po pregledu podatkov predpostavlja, da je narava urejena tako, da podatki sledijo določenemu modelu in da lahko njihovo pojavljanje določimo na osnovi določene matematične funkcije ali skupka funkcij. Model je lahko Fechnerjev zakon, a tudi strukturna enačba pri faktorski analizi ali pa skupek enačb multiple regresije, ki v modelu strukturnih enačb povezujejo med seboj eksogene in endogene spremenljivke ter napake. Preverjanje modelov v priročnikih ni zelo prisotno in je omejeno na povzete informacije o oceni goodness of fit testa prileganja podatkov predpostavljeni funkciji. Ta nepozornost pripelje raziskovalce do napak pri formulaciji modelov, ki jih je treba preveriti. Najbolj pogosta napaka je, da raziskovalci poskušajo razložiti pojav s funkcijo, ki vsebuje preveč parametrov. To povzroči, da funkcija natančno sledi modelu in je ne moremo zavrniti. Vendar pa zaradi prevelike količine parametrov funkcija izgubi svoj pomen (Forster in Sober, 1994). Toda pomislimo na to, kako koristno bi bilo boljše poznavanje različnih pristopov preverjanja modelov - kot npr. tistega, ki ga je trideset Statistična pomembnost in njen pomen 33 let nazaj predlagal Akaike (1973; prim. Bozdogan, 1987) - ki dovoljujejo na informaciji utemeljeno preverjanje (po Kullback in Leibler, 1951), kot npr. razdaljo med opazovanimi podatki in modelom. Vse omenjeno pa se v psihologijo vpeljuje s težavo. Veliko lažje je zastaviti raziskave v smislu eksperimentalne in kontrolne skupine ali podobnih načrtov ter interpretirati podatke s pomočjo varnih postopkov metode TNH. Prednost je tudi ta, da celo ni nujno, da razumemo, kar delamo! (klicaj dodala prev.) Literatura Aaron, B., Kromrey, J. D. in Ferron, J. M. (1998, November). Equating r-based and d-based effect size indices: Problems with a commonly recommended formula. Prispevek, predstavljen na letnem srečanju Florida Educational Research Association, Orlando, FL. (ERIC Document Reproduction Service No. ED 433 353). Abelson, R. P. (1997). On the surprising longevity of flogged horses: Why there is a case for the significance test. Psychological Science, 8, 12-15. Agnoli, F. (2002). Comepresentare i risultati di ricerche sperimentali: ambiguita, errori, controversie. Congresso AIP, Sez. Psicologia Sperimentale, Bari. Akaike, H. (1973). Information Theory and an extension of the Maximum Likelihood Principle. V B. N. Petrov in F. Csaki (ur.), 2nd International Symposium on Information Theory (str. 267-281). Budapest: Akademiai Kiado. American Psychological Association (1994). Publication Manual of the American Psychological Association (4. izd.). Washington, DC: Author. American Psychological Association (2001). Publication Manual of the American Psychological Association. Washington, DC: Author. Ang, R. P. (1998). Use of Jackknife statistic to evaluate result replicability. Journal of General Psychology, 125, 218-228. Bakan, D. (1966). The test of significance in psychological research. Psychological Bulletin, 66, 423-437. Berkson, J. (1938). Some difficulties of interpretation encountered in the application of the chi-square test. Journal of the American Statistical Association, 33, 526-542. Bland, J. M. (2000). An Introduction to Medical Statistics. New York: Oxford University Press. Bonferroni, C. E. (1936). Teoria statistica delle classi e calcolo delle probabilita. Pubblicazioni R. Istituto Superiore Scienze Economiche e Commerciali di Firenze, 8, 3-62. Borestein, M., Cohen, J. in Rothstein, H. (1997). Power andprecision. Dataxiom, Inc., [Online] Dostopno na URL: http://www.dataxiom.com. Bozdogan, H. (1987). Model selection and Akaike's information criterion (AIC): The general theory and its analytical extensions. Psychometrika, 52, 345-370. Burstein, H. (1975). Finite population correction for binomial confidence limits. Journal of American Statistic Association, 70, 67-69. Cahan, S. (2000). Statistical significance is not a "kosher certificate" for observed effects: A critical analysis of the two-step approach to the evaluation of empirical results. 34 C. Bachmann, R. Luccio in E. Salvadori Educational Researcher, 29, 31-34. Carver, R. P. (1978). The case against significance testing. Harvard Educational Review, 48, 378-399. Carver, R. P. (1993). The case against statistical significance testing, revisited. Journal of Experimental Education, 61, 287-292. Chow, S. (1996). Statistical Significance: Rationale, Validity, and Utility. London: Sage. Chow, S. (1998). Précis of statistical significance: Rationale, validity, and utility. Behavioral and Brain Sciences, 21, 169-240. Chow, S. (1999). In defense of significance tests. Commentary on Krüeger on social bias. Psycoloqui, 10 (006). Dostopno na: http://www.cogsci.soton.ac.uk/cgi/psyc/ newpsy? 10.006. Cliff, N. in Charlin, V. (1991). Variances and covariances of Kendall's tau and their estimation. Multivariate Behavioural Research, 26, 693-707. Clipper, C. J. in Pearson, E. S. (1934). The use of confidence or fiducial limits illustrated in the case of binomial. Biometrika, 26, 404-413. Cohen, J. (1962). The statistical power of abnormal social psychology research. Journal of Abnormal and Social Psychology, 65 (3), 145-153. Cohen, J. (1977). Statistical power analysis for the behavioral sciences (rev. izd.). New York: Academic Press. Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2. izd.). Hillsdale, NJ: Erlbaum. Cohen, J. (1992a). A power primer. Psychological Bulletin, 112, 155-159. Cohen, J. (1992b). Statistical Power Analysis. Current Directions in Psychological Science, 1, 98-105. Cohen, J. (1994). The earth is round (p < .05). American Psychologist, 49, 997-1003. Cooper, H. in Findley, M. (1982). Expected effect sizes: Estimates for statistical power analysis in social psychology. Personality and Social Psychology Bulletin, 8, 168173. Daniel, L. G. (1998). Statistical significance testing: A historical overview of misuse and misinterpretation with implications for the editorial policies of educational journals. Research in the School, 5 (2), 23-32. Dunlap, W. P., Cortina, J. M., Vaslow, J. B. in Burke, M. J. (1996). Meta-analysis of experiments with matched groups or repeated measures designs. Psychological Methods, 1, 170-177. Efron, B. (1979). Bootstrap methods: Another look at the jackknife. The Annals of Statistics, 7, 1-26. Falk, R. in Greenbaum, C. (1995). Significance tests die hard: The amazing persistence of a probabilistic misconception. Theory & Psychology, 5, 75-98. Fidler, F. in Thompson, B. (2001). Computing correct confidence intervals for ANOVA fixed-and random-effects effect sizes. Educational and Psychological Measurement, 61, 575-604. Fisher, R. A. (1925). Statistical Methods for Research Workers. Edinburgh: Oliver & Boyd. Fisher, R. A. (1935). The Design of Experiments. Edinburgh: Oliver & Boyd. Fisher, R. A. (1955). Statistical methods and scientific induction. Journal of Royal Statistic Society, B, 17, 69-78. Fisher, R. A. (1956). Statistical methods and scientific inference. Edinburgh: Oliver and Statistična pomembnost in njen pomen 35 Boyd. Forster, M. in Sober, E. (1994). How to tell when simpler, more unified, or less ad hoc theories will provide more accurate predictions. British Journal for the Philosophy of Science, 45, 1-35. Friedman, H. (1968). Magnitude of experimental effect and a table for its rapid estimation. Psychological Bulletin, 70, 245-251. Friendly, M. (1991). SAS macro programs: mpower. [On-line] Dostopno na URL: http: // www.math.yorku. ca/SCS/sasmac/mpower.html. GPower (2000). [Online]. Dostopno na URL: http://www.psychologie.uni-trier.de:8000/ projects/ gpower.html. Gigerenzer, G. (1998). We need statistical thinking, not statistical rituals. Behavioral and Brain Sciences, 21, 199-200. Gigerenzer, G. in Krauss, S. (2001). Statistisches Denken oder statistische Rituale? Was sollte man unterrichten? V M. Borovcnik, J. Engel in D. Wickmann (ur.), Anregungen zum Stochastikunterricht: Die NCTM-Standards 2000, Klassische und Bayesische Sichtweise im Vergleich (str. 53-62). Franzbecker: Hildesheim. Glass, G. V. (1976). Primary, secondary, and meta-analysis of research. Educational Researcher, 5, 3-8. Greenwald, A. G. (1975). Consequences of prejudice against the null hypothesis. Psychological Bulletin, 82, 1-20. Haase, R. F., Waechter, D. M. in Solomon, G. S. (1982). How significant is a significant difference? Average effect size of research in Counseling Psychology. Journal of Counseling Psychology, 29, 58-65. Haller, H. in Krauss, S. (2002). Misinterpretation of significance: a problem students share with their teachers? Methods of Psychological Research Online, 17(1), 1-20. Harlow, L. L., Mulaik, S. A. in Steiger, J. H. (ur.). (1997). What if there were no significance tests? Mahwah, NJ: Erlbaum. Hays, W. L. (1963). Statistics for psychologists. New York: Holt, Rinehart & Winston. Hedges, L. V. (1981). Distributional theory for Glass's estimator of effect size and related estimators. Journal of Educational Statistics, 6, 107-128. Hedges, L. V. in Olkin, I. (1985). Statistical methods for meta-analysis. San Diego; Academic Press. Hubbard, R. in Armstrong, J. S. (1992). Are null results becoming an endangered species in marketing? Marketing Letters, 3, 127-136. Hubbard, R. in Armstrong, J. S. (1994). Replicationss and extensions in marketing: Rarely published but quite contrary. International Journal of Research in Marketing, 11, 233-248. Hubbard, R. in Armstrong, J. S. (1997). Publication bias against null results. Psychological Reports, 80, 337-338. Huberty, C. J. (1993). Historical origins of statistical testing practices: The treatment of Fisher versus Neyman-Pearson views in textbooks. Journal of Experimental Education, 61, 317-333. Hunter, J. E. (1997). Needed: A ban on the significance test. Psychological Science, 8, 3-7. Kerlinger, F. N. (1979). Behavioral Research: A conceptual approach. New York, NY: Holt, Rinehart and Winston. Kraemer, H. C. in Thiemann. S. (1987). How Many Subjects? London, UK: Sage Publica- 36 C. Bachmann, R. Luccio in E. Salvadori tions. Kuhn, T. S. (1962). The Structure of Scientific Revolutions, Chicago: Chicago University Press. Kullback, S. in Leibler R. A. (1951). On information and sufficiency. Annals of Mathematical Statistics 22, 79-86. Levin, J. R. in Robinson, D. H. (1999). Further reflections on hypothesis testing and editorial policy for primary research journals. Educational Psychology Review, 11, 143-155. Lindsay, R. M. (1994). Publication system biases associated with the statistical testing paradigm. Contemporary Accounting Research, 11, 33-57. Lipsey, M. W. (1990). Design Sensitivity: Statistical Power for Experimental Research. Newbury Park, California: Sage. Loftus, G. R. (1996). Psychology will be much better science when we change the way we analyze data. Current Directions in Psychological Science, 5, 161-170. Long, J. S. (1983). Covariance Structure Models. Newbury Park, CA: Sage. Long, J. S. in Cliff, N. (2004). Confidence intervals of Kendall's tau. British Journal of Mathematical and Statistical Psychology, 57, 31-41. Lyons, L. C. in Woods, P. J. (1991). The efficacy of rational emotive therapy: A quantitative review of the outcome research.. Clinical Psychology Review, 11, 357-369. Manly, B. F. J. (1997). Randomization, Bootstrap and Monte Carlo Methods in Biology. New York, NY: Chapman & Hall. Maxwell, S. E. in Delaney, H. D. (1990). Designing experiments and analyzing data. A model comparison perspective. Belmont, CA: Wadsworth. Meehl, P. (1997). The problem is epistemology, not statistics: Replace significance tests by confidence intervals and quantify accuracy of risky numerical predictions. V L. L. Harlow, S. A. Mulaik in J. H. Steiger (ur.), What if there were no significance tests? (str. 393-426). Mahwah, NJ: Erlbaum. Melton, A. (1962). Editorial. Journal of Experimental Psychology, 64, 553-557. Micceri, T. (1989). The unicorn, the normal curve, and other improbable creatures. Psychological Bulletin, 105, 156-166. Miller, J. (1991). Reaction time analysis with outliers exclusion: Bias varies with sample size. Quarterly Journal of Experimental Psychology, 43A, 907-912. Mosier, C. I. (1951). Problems and designs of cross-validation. Educational and Psychological Measurement, 11, 5-11. Mulaik, S. A., Raju, N. S. in Harshman, R. A. (1997). There is a time and a place for significance testing. V L. L. Harlow, S. A. Mulaik in J. H. Steiger (ur.). What if there were no significance tests? (str. 65-115). Mahwah, NJ: Lawrence Erlbaum. Muller, K. E. in Lavange, L. M. (1992). Power calculations for general linear multivariate models including repeated measures applications. Journal of the American Statistical Association, 87, 1209-1216. NCSS Statistical Software (1999). PASS. [On-line] Dostopno na: http://www.ncss.com. Neyman, J. in Pearson, E. S. (1933). On the problem of the most efficient tests of statistical hypotheses, Philosophical Transactions of the Royal Society of London, A 231, 289-337. Nickerson, R. S. (2000). Null hypothesis significance testing: A review of an old and continuing controversy. Psychological Methods, 5, 241-301. Nix, T. W. in Barnette J. J. (1998). The data analysis dilemma: ban or abandon. A review of Statistična pomembnost in njen pomen 37 null hypothesis significance testing. Research in the Schools, 5(2), 3-14. Nunnally, J. C. (1960). The place of statistics in psychology. Education and Psychological Measurement, 20, 641-650. Nunnally, J. C. (1975). Introduction to statistics for psychology and education. New York: McGraw-Hill. Oakes, M. (1986). Statistical Inference: A Commentary for the Social and Behavioral Sciences. New York: Wiley. Ottenbacher, K. J. (1996). The power of replications and replications of power. American statistician, 50, 271-275. Perneger, T. V. (1998). What's wrong with Bonferroni adjustments? British Medical Journal, 316, 1236-1238. Pisati, M. (2002). Nelle stime non c'c certezza. Uso, abuso e non uso dell'inferenza statistica nella ricerca sociale. Rassegna Italiana di Sociologia, 63 (1), 115-141. Quenouille, M. (1949). Approximate tests of correlation in time series. Journal of the Royal Statistical Society, Soc. Series B, 11, 18-84. Rindskopf, D. M. (1997). Testing "small," not null, hypotheses: classical and Bayesian approaches. V L. L. Harlow, S. A. Mulaik in J. H. Steiger (ur.), What if there were no significance tests? (str. 319-332). Mahwah, NJ: Lawrence Erlbaum. Robinson, D. in Levin, J. R. (1997). Reflections on statistical and substantive significance, with a slice of replication. Educational Researcher, 26 (5), 21-26. Rosenthal, R. (1991). Effect sizes: Pearson's correlation, its display via the BESD and alternative indices. American Psychologist, 46, 1086-1087. Rosenthal, R. (1993). Cumulating evidence. V G. Keren in C. Lewis (ur.), A handbookfor data analysis in the behavioral sciences: Methodological issues (str. 519-559). Hillsdale, NJ: Erlbaum. Rosenthal, R. in Rosnow, R. L. (1991). Essentials of behavioral research: Methods and data analysis (2. izd.). New York: McGraw Hill. Rosenthal, R., Rosnow, R. L. in Rubin, D. B. (2000). Contrasts and effect sizes in behavioral research. Cambridge University Press. Rosenthal, R. in Rubin, D. B. (1982). A simple, general purpose display of magnitude of experimental effect. Journal of Educational Psychology, 74, 166-169. Rosnow, R. L. in Rosenthal, R. (1989). Statistical procedures and the justification of knowledge in psychological science. American Psychologist, 44, 1276-1284. Rosnow, R. L. in Rosenthal, R. (1996). Computing contrasts effect sizes, and counternulls on other people's published data: General procedures for research consumers. Psychological Methods, 1, 331-340. Schafer, J. P. (1993). Interpreting statistical significance and nonsignificance. Journal of Experimental Education, 61 (4), 383-387. Sedlmeier, P. in Gigerenzer, G. (1989). Do studies of statistical power have an effect on the power of studies? Psychological Bulletin, 105 (2), 309-316. Siegel, S. (1956). Nonparametric Methods for Behavioral Sciences. New York, NY: McGraw-Hill. Simon, J. L. (1969). Basic Research Methods in Social Science. New York, NY: Random House. Simon, J. L., Atkinson, D. T. in Shevokas, C. (1976). Probability and Statistics: Experimental Results of a Radically Different Teaching Method. The American Mathematical 38 C. Bachmann, R. Luccio in E. Salvadori Monthly, 83, 733-739. Simon, S. (1999, 7. januar). Re: Type I and Type II error. Educational Statistics Discussion List (EDSTAT-L). [Online]. Dostopno na E-mail: edstat-l@jse.stat.ncsu.edu [1999, January 7]. Smithson, M. (2001). Correct confidence intervals for various regression effect sizes and parameters: The importance of noncentral distributions in computing intervals. Educational and Psychological Measurement, 61, 605-632. Steiger, J. H. in Fouladi, R. T. (1997). Noncentrality interval estimation and the evaluation of statistical models. V L. L. Harlow, S. A. Mulaik in J. H. Steiger (ur.), What if there were no significance tests? (str. 221-257). Mahwah, NJ: Erlbaum. Sterling, R. (1959). Publications decisions and their possible effects on inferences drawn from tests of significance - or vice versa. Journal of the American Statistical Association, 54, 30-34. Sterling, T. D., Rosenbaum, W. L. in Weinkam, J. J. (1995). Publication decisions revisited: The effect of the outcome of statistical tests on the decision to publish and vice versa. The American Statistician, 49, 108-112. Sullivan, J. R. (2000). A Review of Post-1994 Literature on Whether Statistical Significance Tests Should be Banned. Prispevek, predstavljen na letnem srečanju Southwest Educational Research Association, Dallas, TX, 29.1.2000. Thompson, B. (1993). The use of statistical significance tests in research: Bootstrap and other alternatives. Journal of Experimental Education, 61, 361-377. Thompson, B. (1996). AERA editorial policies regarding statistical significance testing: Three suggested reforms. Educational Researcher, 25 (2), 26-30. Thompson, B. (1997). Editorial policies regarding statistical significance tests: Further comments. Educational Researcher, 26, 29-32. Thompson, B. (2001). Significance effect sizes, stepwise methods, and other issues: strong arguments move the field. Journal of Experimental Education, 70, 80-93. Thompson, B. (2002). What future quantitative social science research could look like: confidence intervals for effect sizes. Educational Researcher, 31 (3), 24-31. Thompson, B. (2003). "Statistica", "pratica", "clinica": quanti tipi di significativita deve considerare chi opera nel counseling? Bollettino di Psicologia applicata, 240, 313. Thompson, K. N in Schumacker, R. E. (1997). An evaluation of Rosenthal and Rubin's binomial effect size display. Journal of Educational and Behavioral Statistics, 22, 109-117. Tukey, J. W. (1958). Bias and confidence in not quite large samples. Annals of Mathematical Statistics, 29, 614. Tukey, J. W. (1991). The philosophy of multiple comparison. Statistical Science, 6, 100-116. von Mises, R. (1928/1957). Probability, statistics, and truth. London: Macmillan. von Mises, R. (1964). Mathematical theory of probability and statistics. New York, NY: Academic Press. Welkowitz, J., Ewen, R. B. in Cohen, J. (1982). Introductory statistics for the behavioral sciences. San Diego, CA: Harcourt Brace Jovanovich, Publishers. Wilkinson, L. in The Task Force on Statistical Inference. (1999). Statistical methods in psychology journals: Guidelines and explanations. American Psychologist, 54, 594604. Statistična pomembnost in njen pomen 39 Wilson, F. D., Smoke, G. L. in Martin, J. D. (1973). The replication problem in sociology: A report and a suggestion. Sociological Inquiry, 43, 141-149. Yates, F. (1951). The influence of Statistical Methods for Research Workers on the development of the science of statistics. Journal of the American Statistical Association, 46, 19-34. Zar, J. H. (1996). Biostatistical analysis (3rd Ed.). Upper Saddle River, New Jersey: Prentice-Hall. Priloga Neymanova in Pearsonova (1933) lema Izhajamo iz naključne zvezne spremenljivke ki se porazdeljuje na osnovi verjetnostne gostote oz. verjetnostne porazdelitve z(^; 0), kjer je 0 parameter in pripada prostoru D. Razdelimo množico D v podmnožici C in A, kjer je A komplement podmnožice C znotraj D (A = D - C). Podmnožica A se lahko ponovno razdeli na nove podmnožice C'. Če predpostavimo, da z velja v obeh primerih, parameter pa se lahko spreminja, je naša naloga določiti, ali vzorec x = [X, X, ..., XJ, za katerega velja funkcija verjetnostne gostote z(x; 0), pripada populaciji. V primeru, da velja H0, potem ko smo določili funkcijo delitve množice D, t(x), je pogojna verjetnost a, da 0 pripada podmnožici C, enaka verjetnosti, da 0 pripada katerikoli drugi podmnožici C' iz D: (A1) p [x)e C|H0]= p [x)e C'|H0]= a V primeru, ko pa je resnična alternativna hipoteza H1, bo imel parameter večjo verjetnost, da bo padel v podmnožico C kot pa v katerokoli od podmnožic C': (A2) p [[(x)e C|Hi > p [[(x)e C'|H ] Ko smo definirali funkcijo verjetja L kot funkcijo skupne (združene) verjetnostne gostote n-tih naključno vzetih (torej neodvisnih) in enako porazdeljenih spremenljivk iz univerzuma, je naša naloga oceniti parameter, za katerega je verjetnost, da bodo komponente vektorja, ki predstavlja vzorec x, zavzele točno določene vrednosti (x1, x2, ..., xn), največja. Ta vrednost, označena kot 0, se imenuje »ocena največjega verjetja« in se razlikuje od katerekoli druge možne vrednosti parametra 0. Kot smo videli pri analizi, ta vrednost ustreza točki, v kateri je vrednost njenega prvega odvoda enaka nič, hkrati pa je njen drugi odvod negativen. Pri določanju C predpostavimo, da lahko določimo tako konstanto ka, da velja: 40 C. Bachmann, R. Luccio in E. Salvadori P ka|H L(x;0i) a| 0 = a (A3) V enačbi A3 je 00 vrednost parametra za H0 in 01 vrednost parametra za H Kritično območje C prostora parametrov lahko določimo tako: C = {x : LMk ia' 1 L(x; 0o) a_ (A4) Podobno lahko območje sprejetja določimo na naslednji način: ' = |x:S))> ia (A5) To je znana Neymanova in Pearsonova (1933) lema. Prispelo/Accepted: 01.08.2005 Sprejeto/Received: 30.01.2005 Psihološka obzorja / Horizons of Psychology, 14, 3, 41-68 (2005) © Društvo psihologov Slovenije 2005, ISSN 1318-187 Znanstveni teoretsko-pregledni prispevek Socialne predstave psihologov o konformiranju: Konformnost - rojstvo ali smrt individualnosti Janez Bečaj* Univerza v Ljubljani, Oddelek za psihologijo, Ljubljana Povzetek: Sodobna socialno psihološka literatura se pri obravnavanju konformnosti praktično brez izjeme sklicuje na klasične tekste iz sredine prejšnjega stoletja, ki so jih prispevali zlasti Sherif, Festinger, Asch ter Deutsch in Gerard. Vendar pa nam analiza teh tekstov pokaže, da mnogih danes splošno znanih in sprejetih 'spoznanj' v njih ni mogoče najti. Poleg tega pa nam pokaže tudi presenetljivo dejstvo, da je od treh metateoretičnih naravnanosti, ki so obstajale v tistem času, na poznejše razumevanje konformnega vedenja skoraj izključno vplivala le individualistična, ki se s konformiranjem sploh ni ukvarjala niti ga ni definirala. Posledica tega utegne biti, da tudi danes konformiranje razumemo predvsem kot spopad med individualnim in socialnim, pri čemer pa ni jasno, s katerimi teoretičnimi izhodišči in tudi empiričnimi podatki je tako gledanje utemeljeno. Očitno bo potrebno ta pojav na novo teoretično utemeljiti in definirati. Ključne besede: konformnost, socialno vplivanje, informacijsko vplivanje, normativno vplivanje, individualnost Psychologists' social representations of conformity: Conformity - birth or death of individuality Janez Becaj University of Ljubljana, Department of Psychology, Ljubljana, Slovenia Abstract: When discussing conformity, modem social psychological literature draws its conclusions mostly from the classical sources written by the mid twentieth century authors such as Muzafer and Carolyn Sherif, Leon Festinger, Solomon Asch, Morton Deutsch, and Harold B. Gerard. A detailed scrutiny of these texts, however, reveals that many of today's widely accepted "findings" from that era are in fact not supported by the classical literature. Surprisingly, this analysis also shows that from the three metatheoretical orientations that coexisted at the time, namely the social-interactionistic, the interindividual, and the individualistic, only the latter survived to the present time, despite the fact that the authors pertaining to this orientation never really dealt with conformity, let alone defined it. Today, as a consequence, conformity is generally understood as a clash between the individual and society, * Naslov / adress: izr. prof. dr. Janez Bečaj, Univerza v Ljubljani, Oddelek za psihologijo, Aškerčeva 2, 1000 Ljubljana, Slovenija, e-mail: janez.becaj@guest.arnes.si 42 J. Bečaj although it is not at all clear which theoretical positions and empirical data could support such a view. It seems rather obvious that conformity will sooner or later have to be based on a new theoretical perspective and redefined. Keywords: conformity, social influence, informational influence, normative influence, individuality CC = 3020 Živimo v času, ki ceni posameznika, njegovo racionalnost in avtonomnost. Oznaka 'konformist' zato ne more biti nič drugega kot slabšalna. To je človek, ki ne misli s svojo glavo, nima svojega mnenja in se raje, kot da bi iskal svojo pot, podreja večini in avtoritetam. V skrajnem pomenu je konformist nekritičen človek, ki s suženjsko vdanostjo kot ovca sledi tropu in njenemu vodniku. Zdi pa se, da konformnost nima slabšalnega pomena le v vsakdanjem življenju, pač pa tudi v socialni psihologiji in celo, da je prav ta stroka v pomembni meri prispevala k takemu razumevanju konformnega vedenja. Turner v Blackwellovi enciklopediji socialne psihologije (Manstead in Hewstone, 1995, str. 119) takole povzema današnje razumevanje tega pojava: "... konformnost se običajno razume kot približevanje deviantne osebe ali podskupine skupinski normi (večini), kar je posledica skupinskega pritiska, da bi se ponovno vzpostavilo stanje uniformnosti. Temu nasprotno je bodisi neodvisno ali pa antikonformno vedenje.« Ta definicija jasno govori o posameznikovem podrejanju skupini, čeprav je vrednostno še dokaj nevtralna. Vse pa niso take. Howit in dr. (1989, str. 40) npr. ugotavljajo, da je konformiranje v strokovni literaturi največkrat razumljeno kot "konflikt med privzetim (angl. adopted) vedenjem in željami ali prepričanji, ki jih je posameznik imel pred tem - spopad socialnega in individualnega.« Gre torej za spopad posameznika in skupine, v katerem je posameznik seveda precej na slabšem. Zlasti v primeru normativnega vpliva lahko to pomeni prav suženjsko podrejanje skupinskemu pritisku - pa čeprav je to zvečine le taktične narave (Turner, 1991, str. 37). Na drugi strani pa najdemo tudi nekaj avtorjev, ki ugotavljajo, da je tako skrajno razumevanje konformiranja pretirano. Howit in sod. so prepričani, da je razumevanje konformiranja preveč vezano na Aschev eksperiment s črtami in prav na tej osnovi naj bi se oblikovalo zmotno ali vsaj pretirano prepričanje, da se ljudje vedemo kot ovce (Howit in dr.. 1989, str. 54). Ljudje se namreč ne vedemo enako zgolj zato, ker smo v to prisiljeni, pač pa tudi zato, ker sami tako hočemo. To naj bi zlasti veljalo za vsa tista pravila vedenja, ki so bila pridobljena v procesu socializacije (prav tam, str. 55). Pa tudi Turner je v svoji knjigi Social influence (1991) konformiranje definiral drugače kot v Blackwellovi enciklopediji. Tu naj bi bilo konformiranje oblika socialnega vplivanja (Turner, 1991, str. 143), ki je tesno vezana na socialne norme. Te pa so bistven del človekovega socialnega življenja, ker omogočajo red, koherentnost in stabilnost tako na makro kot tudi na mikrosocialni ravni. Ljudje jih oblikujemo v skupinah in se z njimi Socialne predstave psihologov o konformiranju 43 konformiramo brez formalnega pritiska (prav tam, str. 16). Konformiranje je v tem primeru spontan skupinski proces, ki vsaj delno poteka brez prisile, njegova funkcija pa je zaščita socialnih norm in vrednot. In nič ne kaže, da bi lahko v tem primeru govorili o spopadu posameznika in skupine. Navedene definicije kažejo, da je konformiranje lahko razumljeno precej različno. Ker gre za pojav, ki na področju socialnega vplivanja zavzema eno osrednjih mest, take razlike seveda niso nepomembne in na mestu je vprašanje, zakaj je do njih prišlo. Odgovor ni preprost in zahteva obširnejše obravnavanje celotnega področja socialnega vplivanja in še posebej socialne motivacije. Na tem mestu se s tem še ne bomo ukvarjali, pač pa se zdi za začetek koristno pogledati, na katerih teoretičnih in empiričnih temeljih pravzaprav stoji današnje razumevanje konformiranja. Zanimivo je namreč, da se avtorji, ne glede na medsebojne razlike, sklicujejo na iste vire. Kot opozarja Turner (1991), današnje razumevanje konformiranja temelji še vedno predvsem na teoretičnih modelih, ki so nastali v petdesetih letih prejšnjega stoletja. Zlasti trije so imeli izreden vpliv na socialno psihologijo: Festingerjev članek o neformalni socialni komunikaciji iz leta 1950, njegova teorija socialnega primerjanja iz leta 1954 ter Deutschevo in Gerardovo razlikovanje informacijskega in normativnega socialnega vpliva (Turner, 1991, str. 18). Poleg naštetih avtorjev pa praktično v vseh učbenikih socialne psihologije pod poglavjem 'konformiranje' najdemo še Aschev poskus s črtami (1952) in Sherifov opis oblikovanja norm (Sherif, 1967). Poleg teh avtorjev se zdi pomemben še Kelley (1952), ker naj bi bilo njegovo ločevanje dveh funkcij referenčnih skupin osnova za poznejšo delitev normativnega in informacijskega vpliva pri Deutschu in Gerardu. Poglejmo, kaj so navedeni avtorji prispevali k današnjemu razumevanju konformnega vedenja. Klasični teksti iz petdesetih let Leon Festinger, 1950/1993a, 1954/1993b Za razumevanje konformiranja je zlasti pomemben Festingerjev tekst iz leta 1950, čeprav se to na prvi pogled morda zdi nekoliko nenavadno. Avtorja so v članku z naslovom »Neformalna socialna komunikacija« zanimali pogoji, ki spodbujajo neformalno komunikacijo v malih skupinah. In sicer naj bi se ta okrepila, (1) kadar je ogrožena skupinska uniformnost, (2) zaradi sil, ki so povezane s spreminjanjem posameznikovega položaja v skupini (osebna lokomocija) in (3) zaradi izražanja čustev. Za nas je pomembna seveda predvsem skupinska uniformnost. Učinkovite skupine jo morajo doseči na dveh področjih: pri doseganju formalno postavljenega cilja (skupinska lokomocija) in pri oblikovanju t. i. socialne resničnosti. Ker oboje zahteva socialno interakcijo, naj bi Festinger s tem člankom postavil teoretični temelj za razlikovanje dveh osnovnih oblik socialnega vplivanja, ki sta ju pozneje Deutsch in Gerard imenovala 44 J. Bečaj normativni in informacijski vpliv (Jones in Gerard, 1967). Ta povezava naj bi ostala značilna za razumevanje socialnega vplivanja vse do danes in Turner (1991) jo je imenoval 'model dvojnega procesa' (angl. dual-process model). Za nas je posebej zanimiva socialna resničnost, ki naj bi bila povezana z informacij skim socialnim vplivom. Po Festingerju morajo naša prepričanja, stališča in mnenja sloneti na nekih temeljih, ki jim zagotavljajo potrebno subjektivno veljavnost. Te temelje je mogoče razvrstiti na kontinuum med fizično in socialno resničnostjo. V fizični je preverjanje veljavnosti (angl. reality testing) naštetih kategorij1 enostavno, saj se lahko vsak neposredno in sam prepriča, kaj je res in kaj ne. Ce npr. nekoga zanima, ali je neka snov krhka ali ne, vzame kladivo in udari po njej. V socialni resničnosti pa veljavnosti stališč, mnenj in prepričanj ni mogoče preveriti neposredno. Primer za to je prepričanje, da bi bilo bolje, ko bi na volitvah zmagala nasprotna stran. Pravilnosti takega prepričanja na objektiven način ni mogoče dokazati. Pač pa se v takih primerih posameznik lahko primerja z drugimi ljudmi. Ce ugotovi, da tudi oni mislijo enako, postane zanj prepričanje veljavno. »Stališča, mnenja in prepričanja v socialni resničnosti so torej veljavna, pravilna ali ustrezna takrat, ko tako misli večina ljudi, ki imajo tudi sicer podobna stališča, mnenja in prepričanja« (Festinger, 1950/1993a, str. 272-2732). Se pravi, da ni potrebno strinjanje prav vseh ljudi ali skupin. Pomembne so le tiste, ki imajo za posameznika pomen referenčne skupine. Obe resničnosti sta po Festingerju komplementarni: manj kot si pri preverjanju veljavnosti prepričanj, mnenj in stališč lahko pomagamo s fizično resničnostjo, bolj pomembna je referenčna skupina in močnejše so sile, ki v primeru razhajanj v njej spodbujajo komunikacijo (prav tam). V primeru fizične resničnosti je gotovo razumljivo, zakaj so potrebna točna prepričanja, mnenja in stališča, manj je pa zadeva jasna, ko gre za socialno resničnost. Kakšna je njena motivacijska osnova, oziroma zakaj je sploh pomembna? Festinger glede tega v članku iz leta 1950 ni jasen. Očitno je, da naj bi človek imel potrebo po veljavnih mnenjih, prepričanjih in stališčih, ni pa jasno, od kje naj bi se vzela. Gotovo je le, da potrebno gotovost v socialni resničnosti prinaša skladnost s podobnimi ljudmi. Tudi teorija iz leta 1954 v tem pogledu ne prinaša kaj bistveno novega. Pravzaprav Festinger v njej le bolj jasno zapiše, da brez primerjanja z drugimi ljudmi ne gre. Teorija namreč temelji na predpostavki, da pri človeku obstaja poseben gon (angl. drive) po primerjanju3, ki pa se, za razliko od članka iz leta 1950, tu poleg mnenj, stališč in prepričanj nanaša še na zmožnosti (angl. abilities). Ceprav nejasna, pa je ta potreba zelo pomembna, saj naj bi bila eden od ključnih dejavnikov človekove gregarnosti. Pomembna naj bi bila za oblikovanje skupin in za prehajanje posameznikov 1 Stališča, prepričanja in mnenja se ponavadi razume kot del socialne resničnosti, zato je tukaj potrebno posebej opozoriti, da je Festinger uporabljal te pojme tudi za fizično resničnost. 2 "An opinion, a belief, an attitude is 'correct', 'valid', and 'proper' to the extent that it is anchored in a group of people with similar beliefs, opinions, and attitudes". 3 »There exists, in the human organism, a drive to evaluate his opinions and his abilities« (Festinger, 1954/ 1993b, str. 117). Socialne predstave psihologov o konformiranju 45 med njimi (Festinger, 1954/1993b, str. 135-136). V zaključku članka Festinger ugotavlja, da iz njegovih teoretičnih izvajanj, če so pravilna, sledi, da so procesi socialnega vplivanja in nekatere oblike tekmovalnega vedenja posledica istega socialnopsihološkega procesa, ki izhaja neposredno iz potrebe po samovrednotenju (angl. drive for self evaluation) in dejstva, da lahko to poteka zgolj na osnovi primerjanja z drugimi osebami (prav tam, str. 138). Nekoliko bolj natančen je bil na simpoziju o motivaciji v Nebraski istega leta (1954), kjer je zastopal tezo, da »naj bi bil človekov organizem motiviran za to, da ima pravilna mnenja, prepričanja in ideje o svetu, v katerem živi in da natančno pozna svoje zmožnosti (angl. abilities), kar mu omogoča znajdenje v tem svetu« (Jahoda, 1959/1965, str. 105, poudarka pri Festingerju). Bistvenega pomena je torej učinkovito znajdenje v okolju, česar brez subjektivnega občutka točnih in pravilnih mnenj, prepričanj in stališč ne more biti. Z vidika konformnega4 vedenja je posebne pozornosti vreden način zadovoljevanja te potrebe v socialni resničnosti. Za razliko od fizične namreč posameznik v njej po Festingerjevi definiciji nima nobene možnosti, da bi veljavnost podatkov lahko preveril sam. Potrebo po pravilnih in točnih sodbah mu lahko izpolni šele primerjava z drugimi in ugotovitev, da obstaja potrebno soglasje. Brez tega so posameznikove subjektivne ocene nestabilne (Festinger, 1954/1993b, str. 119). Bistvenega pomena je torej socialno soglasje, katerega pa najdemo pravzaprav tudi v fizični resničnosti, le da ima tam precej drugačen pomen. Predstavlja le ugotovitev, da so individualne sodbe enake -ni pa soglasje pogoj za njihovo veljavnost, saj do nje pridejo posamezniki samostojno.5 V socialni resničnosti pa je zadeva obrnjena. Tu je namreč soglasje pogoj za veljavnost sodb in posameznikomje šele z njim zagotovljen potreben občutek točnosti, primernosti in trdnosti. Brez njega potreba po pravilnih mnenjih, prepričanjih in idejah o svetu, v katerem živimo, ne more biti izpolnjena. Iz tega sledi, da ima človek potemtakem vsaj v socialni resničnosti prej potrebo po socialnem soglasju, kot pa po pravilnih mnenjih, prepričanjih in idejah. Da je soglasje pomembnejše od pravilnosti same po sebi, se je moral zavedati tudi Festinger, saj je eksplicitno zapisal, da se lahko v različnih socialnih prostorih oblikujejo različne socialne resničnosti (Festinger, 1954/1993b, str. 136). Ker lahko kljub različnosti vse izpolnijo svojo funkcijo, je seveda nujno, da je pravilnost sodb v socialni resničnosti pravzaprav socialna konstrukcija. Očitno je namreč, da je mogoče o istih stvareh imeti različna mnenja, stališča ali prepričanja, ki so lahko vsa 'točna' in 'pravilna', če so le podprta z zadostnim soglasjem. Potreba po točnih sodbah torej v resnici pomeni le potrebo po subjektivnem občutku točnosti in pravilnosti, ki je zagotovljen s socialnim soglasjem. Ce je to res, potem primerjanje že samo po sebi pomeni tudi medsebojno usklajevanje oz. oblikovanje socialne resničnosti. Ugotovljene neskladnosti morajo namreč nujno sprožiti prizadevanje po doseganju soglasja, saj bi posameznikova potreba po 'pravilnih' mnenjih, prepričanjih in stališčih brez tega ostala 4 Festinger tega termina praviloma ne uporablja, pač pa govori o uniformnosti. 5 Kaj se zgodi, kadar takega soglasja ni, je pokazal Aschev poskus s črtami. Poskusne osebe so se v njem znašle v konfliktu dveh virov, ki sta ponavadi soglasna: lastna čutila in enotno mnenje drugih ljudi. 46 J. Bečaj neizpolnjena, učinkovito znajdenje v okolju pa ne bi bilo mogoče. To je razvidno npr. iz Festingerjeve hipoteze, da večja kot je pomembnost določenega mnenja ali zmožnosti, močnejši je pritisk k uniformnosti (Festinger, 1954/1993b, str. 132). Ti izpeljavi iz Festingerjevega teksta se zdita spregledani ali vsaj premalo upoštevani, čeprav sta izredno pomembni: (1) človekovo 'potrebo po pravilnih mnenjih, prepričanjih in stališčih' je potrebno razumeti kot potrebo po socialnem soglasju, ki zagotavlja subjektivni občutek njihove veljavnosti in (2) socialno primerjanje ob ugotovljenih neskladnostih nujno sproži proces(e), katerega (-ih) funkcija je oblikovanje potrebnega soglasja. To je seveda nujno, če človek iz kateregakoli vzroka potrebuje socialno resničnost oz. pojave, ki jo sestavljajo. Poleg mnenj, prepričanj in stališč, o katerih govori Festinger, spadajo vanjo še vsi socialno psihološki pojavi, katerih veljavnost je določena s soglasjem (npr. vrednote ali pa socialne predstave).6 Za razumevanje socialnega vplivanja in še posebej informacijskega vpliva pa iz teh ugotovitev izhaja še ena pomembna ugotovitev: procesi, katerih funkcija je oblikovanje socialne resničnosti, izključujejo konfliktne odnose. Posamezniki v njej namreč ne morejo samostojno preveriti veljavnosti mnenj, stališč in prepričanj, zaradi česar so konfliktna pogajanja in barantanje izključena. V medsebojno dogovarjanje namreč ne morejo vstopiti vsak s svojo resnico, v katero bi lahko trdno verjeli in na osnovi česar bi se lahko pogajanja šele začela.7 Soglasje v socialni resničnosti začnejo oblikovati enako izgubljeni in negotovi posamezniki. Ker je veljavnost določena šele s soglasjem, posameznik pred tem ne more imeti uporabnega individualnega mnenja, stališča ali prepričanja. Ima ga lahko samo skupina in šele z dovolj trdnim soglasjem postane taka kategorija uporabna tudi za njene člane!8 Vse to nujno sledi iz trditve, da v socialni resničnosti veljavnost njenih kategorij posameznikom ni dostopna neposredno, pač pa je lahko dosežena le s socialnim soglasjem. To pa obenem pomeni tudi, da v socialni resničnosti dihotomizacija posameznika in socialnega okolja potemtakem ni možna! Navedene izpeljave iz Festingerjevega pojmovanja socialne resničnosti so za razumevanje socialnega vplivanja izredno pomembne, saj razumevanje 'pravilnosti' in 'točnosti' kategorij iz socialne resničnosti postavljajo v precej drugačno luč, kot smo navajeni. V resnici gre za soglasje in ne za pravilnost, ki bi jo lahko mnenja, prepričanja 6 Izpeljavi sta pomembni tudi zato, ker ju je mogoče razumeti tudi kot utemeljitev za nujnost konstrukcije socialnega sveta, kot to npr. razume konstrukcionizem. Zanimivost je v tem, da Festinger brez vsakega dvoma spada v 'main stream' psihologijo, ki jo konstrukcionizem tako prezira. Seveda pa je pri tem potrebno povedati, da Festinger z ničemer ne kaže, da bi to možnosti videl ali jo celo zagovarjal. Tukajšnja ugotovitev je le logična izpeljava njegovih definicij. 7 Ta trditev seveda velja le za izoliran socialni sistem, ki nima podsistemov s specifičnimi socialnimi resničnostmi. Pač pa so tovrstni konflikti možni v medskupinskih odnosih, ko se srečajo predstavniki različnih socialnih sistemov z različnimi socialnimi resničnostmi in torej tudi različnimi prepričanji o tem, kaj je točno in pravilno. 8 O tem govorita na bolj ekspliciten način Sherifa in tudi poskus z avtokinetičnim učinkom temu ustreza. Skupina oblikuje norme, ki jih nato posamezniki prevzamejo kot svoje osebne. Njihovo oblikovanje pa ne poteka po načelu pogajanj in barantanj, pač pa primerjanja. Socialne predstave psihologov o konformiranju 47 ali stališča imela sama po sebi. Same po sebi tovrstne kategorije ne morejo biti niti točne niti napačne. Pač pa iz Festingerjevih tekstov ne izvemo, zakaj naj bi bil za človeka občutek 'pravilnosti' tako pomemben. Z drugimi besedami: ni jasno, zakaj človek potrebuje socialno usklajene vrednote in prepričanja in zakaj si ne izmisli vsak svojih. Edini odgovor, kakršnega najdemo pozneje tudi pri Jonesu in Gerardu (1967), je, da je to potrebno zaradi učinkovitega znajdenja v okolju ali, kot zapišeta omenjena avtorja, da so tovrstne informacije potrebne za odločanje, se pravi za oblikovanje vedenja, ko je potrebno izbirati med različnimi možnostmi. Tekst iz leta 1954 pa v sebi skriva še eno zanimivo formulacijo. Festinger namreč pravi, da kadar posameznik skupine ne more zapustiti ne fizično ne psihološko in je privlačnost te skupine zanj ničelna ali pa celo negativna, skupina nima moči, da bi nanj učinkovito vplivala. Namesto tega je enotnost lahko dosežena le s prisilo, se pravi z grožnjami ali kaznovanjem. V takem primeru bo zaradi različnih mnenj po Festingerju prišlo do navideznega popuščanja ali navidezne konformnosti (angl. overt compliance or overt conformity) (Festinger, 1954/1993b, str. 138, poudarka JB). Ta formulacija kaže, da je Festinger očitno ločil vpliv od prisile, pri čemer lahko pravo koformnost povzroči le prvi, medtem ko drugi povzroči le navidezno. Normativni vpliv Deutscha in Gerarda, katerega je strokovna literatura povezala s Festingerjevo skupinsko lokomocijo, po tem avtorju potemtakem sploh ni oblika socialnega vplivanja, pač pa prisila, ki povzroča navidezno konformnost. Kot smo že omenili, je imelo Festingerjevo razlikovanje skupinske lokomocije in socialne resničnosti izreden vpliv na poznejše ukvarjanje s socialnim vplivanjem. Prva se je povezala s socialnim priznanjem (angl. social reward), druga pa z veljavnostjo mnenj (Jones, 1985, str. 79). Različni avtorji so tema dvema kategorijama dali nato različna imena. Jones in Gerard (1967) sta npr. ugotavljala, da je posameznik od socialnega okolja odvisen zaradi učinkovitosti in zaradi dobivanja informacij (angl. 'effect'-'information' dependence). Kelley (1952) je v zvezi z referenčnimi skupinami govoril o normativni in primerjalni funkciji in ta delitev je bila nato osnova za Deutschevo in Gerardovo ločevanje normativnega in informacijskega vpliva (Jones in Gerard, 1967). Muzafer in Carolyn Sherif Kot smo že omenili, strokovna literatura povezuje Sherifa s konformiranjem predvsem kot avtorja, ki je pokazal, kako nastajajo norme. Te naj bi bile namreč osnova za pritisk h konformnosti. Norme so bile za oba Sherifa9 v resnici zelo pomemben pojav, brez katerega po njunem mnenju ni mogoče razumeti delovanja skupin in posameznikov: »Norme služijo kot osrednje orientacijske točke v izkušnjah 9 Z navajanjem obeh Sherifov je nekaj težav. Veliko dela sta namreč opravila skupaj in nekatere definicije, ki jih navaja samo M. Sherif, včasih izhajajo iz del, ki sta jih objavila skupaj. Zaradi tega se ime Sherif v tekstu pojavlja pogosto v dvojini, s čemer je poudarjeno skupno delo obeh avtorjev. 48 J. Bečaj posameznika in so vodilo za njegovo dejavnost" (Sherif, 1967, str. 136)10. So del nematerialne kulture (prav tam, str. 59), standardizirane s skupinsko interakcijo (Sherif in Sherif, 1956, str. 170) in vrednostna kategorija (prav tam, str. 241), ki določa primernost oz. neprimernost vedenja. Zlasti je to razvidno iz odnosa, ki ga imajo konformni člani skupine do odklonskega vedenja. Označujejo ga kot 'nespametnega', 'ogrožujočega', 'nevarnega' ali 'izdajalskega' (prav tam, str. 244). Slabše kot je strukturirana dražljajska situacija, v kateri se človek znajde, več težav mu povzroči. Ne ve namreč, kako naj si jo razloži in kakšno vedenje bi bilo najbolj primerno. Slabo strukturirane situacije zato pri ljudeh povzročijo anksioznost, negotovost, doživljanje osebne neustreznosti, osamljenost ali sram (Sherif in Sherif, 1969, str. 412). Za normalno eksistenco potrebujemo ljudje stabilno ter enoznačno okolje in tu je za Sherifa motivacijska osnova za nastajanje norm. To je negotovost, ki jo povzroči nova, še neznana in ogrožujoča situacija (Sherif in Sherif, 1956, str. 248), za katero še niso oblikovana jasna vedenjska pravila. Norme zato ne zagotavljajo le temeljnega občutka varnosti posameznikom, pač pa tudi stabilnost socialnih sistemov (Sherif, 1967). Na tej ugotovitvi je bil utemeljen slavni poskus z avtokinetičnim učinkom. Gre za ugotovitev, da se v nestrukturirani situaciji norme oblikujejo z medsebojnim primerjanjem in da skupaj ustvarjena norma za sodelujoče postane osebna norma.11 Iz te ugotovitve je izpeljana definicija konformnosti: "Konformnost, če smo natančni, pomeni vedenje, ki je skladno s standardi (normami), ki so se utrdili v predhodni interakciji. Koliko so skupinske norme psihološko zavezujoče za posamezne člane, lahko preverjamo z opazovanjem njihovega vedenja, ko niso v stiku z ostalimi člani skupine ... Posameznik lahko pod neposrednim pritiskom drugih ljudi popusti (angl. comply) ali pa tudi v novi situaciji ostane konformen z že poprej oblikovanimi standardi" (Sherif, 1967, str. 258). Ta definicija je več kot zanimiva, ker je ravno obratna od tega, kar si pod konformiranjem predstavljamo danes. Po njej je namreč posameznik konformen v primeru, da se tudi izven svoje referenčne skupine vede skladno z njenimi standardi, čeprav to ni skladno s pričakovanji novega okolja. Zelo pomembno pa je tudi, da je po Sherifih posameznikova psihološka zavezanost skupinski normi prostovoljna in da taka norma predstavlja njegov osebni vedenjski standard. Niti govora torej ne more biti o kakšnem spopadu med individualnim in skupinskim. Ravno obratno: posameznik dobi potrebno stabilno orientacijo v socialnem prostoru šele s pomočjo skupinskega izdelka. Ta naravnanost se lepo vidi tudi v avtorjevi kritičnosti do naraščajočega čaščenja nekonformnega vedenja. To zanj ni bilo sprejemljivo in vzroke zanj je videl v napačni dihotomizaciji posameznika in skupine: "Povzdigovanje nekonformnosti ima svoje korenine v nevzdržni dihotomiji posameznika in skupine in v vnaprejšnjem prepričanju, 10 Vse navedene letnice se nanašajo na uporabljene vire. Navedene definicije pa so pogosto starejše. Tu je npr. uporabljen vir iz leta 1967, poglavje, v katerem je navedena definicija, pa je bilo objavljeno leta 1936 (The Psychology of social norms, Harper and brothers)! 11 Poskus je podrobneje opisan v Bečaj (1997). Socialne predstave psihologov o konformiranju 49 da je spopad med obema neizogiben" (Sherif, 1967, str. 186). Tako razumevanje norm se zelo dobro ujema z našo analizo Festingerjeve definicije socialne resničnosti, v kateri smo ugotovili, da oblikovanje soglasja v referenčni skupini ne more potekati kot pogajanje ali barantanje, ker posamezniki v socialni resničnosti po definiciji ne morejo imeti veljavnih individualnih mnenj, stališč in prepričanj. Definicija konformnosti obeh Sherifov je danes pozabljena. Glavni razlog za to bi lahko bil v tem, da se je izključevala s prevladujočim 'Zeitgeistom' socialne psihologije petdesetih let, ko so se oblikovale tu obravnavane teorije. Pač pa se je s kasnejšim razumevanj em konformnega vedenj a povezal nj egov poskus z avtokinetičnim učinkom. Pri tem pa je spregledano, da je bilo teoretično izhodišče obeh Sherifov za razumevanje odnosa med posameznikom in socialnim okoljem bistveno drugačno kot pri ostalih avtorjih tistega časa, med katere spada tudi Asch. Solomon Asch (1952) Verjetno ni učbenika socialne psihologije, kjer na začetku poglavja o konformnosti ne bi bil naveden Aschev poskus s črtami. Vendar pa nič ne kaže, da bi bil ta poskus lahko v resnici prototip konformnega vedenja. Med drugim kažejo na to tudi razlogi, zakaj se je Asch tega poskusa sploh lotil. V tedanjem času se je uveljavilo prepričanje, da se ljudje prav nekritično podrejamo zunanjim manipulacijam, tako da nam je mogoče 'prodati' kakršnokoli idejo (Asch, 1955/1992, str. 14). Socialnim okoliščinamje bila v tistem času pripisana izjemno velika moč in posameznik se je zdel od različnih sil v skupinah prav suženjsko odvisen (Asch, 1952, str. 451). Za Ascha tako močna posameznikova odvisnost od socialnega okolja ni bila sprejemljiva. Strinjal se je sicer, da smo ljudje pomembno odvisni drug od drugega, ko gre za razumevanje, občutenje in doživljanje resničnosti, zaradi česar je oblikovanje socialnega soglasja tudi po njegovem mnenju nepogrešljiv pogoj za družbeno življenje (Asch, 1955/1992, str. 21). Toda obenem je bil prav tako prepričan, da je soglasje lahko učinkovito zgolj takrat, ko vsak posameznik k njegovemu oblikovanju prispeva svoje lastne kritične izkušnje in poglede. Če se vsak le podredi drugim, nastane situacija, ki jo poznamo iz Andersenove pravljice o cesarjevih novih oblačilih. Socialno soglasje je torej nujno, ker zagotavlja družbeno učinkovitost, vendar le pod pogojem, da ga oblikujejo kritični posamezniki, ki pošteno poročajo o svojih občutenjih: "S socialnega vidika je neodvisnost produktivna, saj je edino sredstvo za odpravljanje zmot in usmerjanje socialnih procesov v potrebno smer. Na drugi strani pa je popuščanje (orig. yielding) antisocialno, ker vnaša zmote in zmedo. Golo pristajanje na nekaj ni dovolj; povzroči lahko spektakularno korakanje milijonov pod zastavo grozljivega 'Weltanschauunga'. Enotna akcija, ki temelji na prostovoljni ali neprostovoljni potlačitvi individualne izkušnje, je zločest sociološki proces" (Asch, 1952, str. 495). Odnos med posameznikom in socialnim okoljem razume Asch bistveno drugače kot Sherifa. Po njegovem mnenju ima vsakdo možnost, da se dvigne nad skupino in do nje zavzame kritičen odnos. Sposobnost kritične razdalje ga varuje pred tem, da bi ga 50 J. Bečaj skupina posrkala vase in bi bil na milost in nemilost prepuščen njenim silam (Asch, 1952, str. 257-258). Obenem pa s tem postane tudi osebno odgovoren za učinkovito delovanje skupnosti. Posameznikova kritičnost do dogajanja v socialnem okolju tako postane bistvenega pomena in to je bil miselni okvir, v katerem je nastal Aschev poskus s črtami. V nasprotju z empiričnimi ugotovitvami tistega časa, je bil Asch prepričan, da se je posameznik sposoben upreti večini in da je bila ta sposobnost v predhodnem raziskovanju podcenjena ali sploh spregledana: "Izoblikovalo se je mišljenje, da socialni dejavniki s svojo močjo lahko povzročijo poljubne psihološke spremembe. Pri tem se je suženjsko podrejanje skupinskim silam razumelo kot splošno veljavno dejstvo, prezrla ali implicitno zanikala pa se je posameznikova sposobnost za neodvisno ravnanje, s katerim se pod določenimi pogoji lahko dvigne nad skupinske strasti in predsodke. Naša naloga je neposredno opazovanje interakcije med posamezniki in skupinami, ko je vprašanje popuščanja socialnemu pritisku ali ohranjanja neodvisnosti bistvenega pomena" (prav tam, str. 451). Ascha torej niso zanimali vzroki ali okoliščine, v katerih se posameznik podredi skupinskemu pritisku, pač pa ravno obratno, njegova sposobnost, da se takim pritiskom upre. Da bi jo lažje dokazal, je izbral jasno strukturirano situacijo, v kateri ni smelo biti dvomov o tem, kateri odgovori so pravilni. To je bilo torej ravno obratno od poskusa z avtokinetičnim učinkom, kjer je bila dražljajska situacija nestrukturirana. V skladu s Festingerjevo terminologijo je Aschev poskus s črtami potekal v fizični, Sherifov poskus z avtokinetičnim učinkom pa v socialni resničnosti12. Razlika gre predvsem na račun dveh bistveno drugačnih pogledov na odnos posameznika in socialnega okolj a. Sherifa sta bila prepričana, da dihotomizacija posameznika in socialnega okolja oz. skupine ni mogoča, medtem ko se za Ascha zdi, da jo je kar zahteval, saj je nekritično sledenje skupini označil kot antisocialno vedenje in zločest sociološki proces. Da Aschev namen ni bil raziskovanje konformnega vedenja, kaže tudi uporabljena terminologija. V svoji socialni psihologji iz leta 1952, v kateri obširneje predstavlja izsledke svojega poskusa s črtami, termina konformnost ni niti definiral niti uporabljal. V poročilu o poskusu je odgovore poskusnih oseb označeval kot pravilne ali neodvisne ('correct', 'independent responses', npr. na str. 457), kot napake ('errors', npr. na str. 458) ali kot zmote zaradi vpliva večine ('erroneous announcements contaminated', npr. na str. 457). Poskusne osebe so bile neodvisne ali podrejene (npr. 'independence and submission', str. 465) ali pa so na različne načine popuščale večini (npr. 'forms of yielding', str. 469).13 Na to, da je Asch raziskoval neodvisnost, ne pa konformiranja, je med starejšimi avtorji opozoril npr. Jones (1985, str. 79). Pa tudi v novejši literaturi lahko najdemo taka opozorila (npr. Friend, Rafferty in Bramel, 1990). 12 Za socialno resničnost je šlo v tem smislu, da poskusne osebe niso mogle same preveriti, kateri odgovor je pravilen, so pa verjele, da tak odgovor obstaja. Zato je prišlo do zgoščanja individualnih odgovorov (oblikovanje soglasja na osnovi medsebojnega primerjanja) in oblikovanja norme, ki so jo potem sprejele kot 'pravilen' odgovor. 13 Asch v povzetku npr. zapiše: "some remained independent in their judgements despite the pressure of the majority; others abandoned their personal viewpoint for that of the group" (Asch, 1952, str. 473). Socialne predstave psihologov o konformiranju 51 Asch z izsledki svojega poskusa ni bil zadovoljen. Leta 1955 je npr. zapisal: "Ko v soglasju začne prevladovati konformnost14, postanejo socialni procesi neustrezni in posameznik se tedaj preda silam, ki začnejo določati njegovo čutenje in mišljenje. To, kar smo ugotovili, bi nas moralo skrbeti: namreč da je nagnjenost h konformiranju v naši družbi tako močna, da so popolnoma razumni in dobronamerni mladi ljudje pripravljeni belo imenovati črno. Vprašamo se lahko, kakšna je naša vzgoja in kakšne so vrednote, ki določajo naše vedenje" (Asch, 1955/1992, str. 21). Navajanje Aschevega poskusa s črtami kot začetek raziskovanja konformnega vedenja je torej napačno. Ravno obratno: Asch je hotel z njim v resnici dokazati posameznikovo sposobnost kritičnega odnosa do skupine in njegovo sposobnost samostojnega odločanja, kljub enotni drugačni večini. Konformiranja ni definiral in tega pojma v zvezi s tem poskusom vsaj na začetku petdesetih let ni uporabljal. Prav tako pa ni na mestu povezovanje njegovega poskusa s Sherifovim, ker sta imela ta dva avtorja pomembno različen pogled na odnos posameznik - skupina, zaradi česar sta razumela različno tudi norme in odnos članov skupine do njih. Ni torej mogoče reči, da je Sherif pokazal, kako norme nastajajo, Asch pa, kako se vzdržujejo.15 Harold H. Kelley (1952) Kelleyjev tekst o dveh funkcijah referenčnih skupin (Kelley, 1952) običajno ni razumljen kot eden temeljnih za razumevanje konformnosti. Na kratko ga bomo vseeno omenili, ker naj bi prav to delitev pozneje uporabila Deutsch in Gerard za ločevanje normativnega in informacijskega socialnega vpliva (Jones in Gerard, 1967). Zanimivo pa je tudi, kot navajata ista avtorja, da se je Kelley zgledoval po Festingerjevemu ločevanju skupinske lokomocije in socialne resničnosti (prav tam, str. 309), čeprav v obravnavanem članku Festingerjevo ime ni omenjeno. Takoj je potrebno poudariti, da Kellyjev osrednji raziskovalni problem ni bilo delovanje referenčnih skupin in kako se v njih oblikujejo vedenjski standardi, pač pa, kako pod njihovim vplivom posameznik oblikuje svoja stališča. Zanimala ga je torej izrazito individualno psihološka problematika in ne referenče skupine same po sebi. Sicer pa Kelley na začetku svojega članka ugotavlja, da se v tedanji literaturi termin "referenčna skupina" uporablja največkrat v dveh pomenih. Označuje lahko skupine, ki bi jim posameznik rad pripadal oz. v njih obdržal članstvo, ali pa skupine, ki mu služijo le kot primerjalna točka, brez želje ali potrebe po članstvu. Na tej razliki je nato utemeljil dve funkciji, ki ju lahko imajo referenčne skupine pri oblikovanju posameznikovih stališč. V prvem primeru, ko si posameznik prizadeva, da bi dosegel ali zadržal sprejetost v skupini, mu lahko ta svoje vedenjske standarde vsili. Ker se tako vsiljeni standardi ponavadi imenujejo "skupinska norma", je Kelley to funkcijo poimenoval "normativna 14 Tu je Asch uporabil termin konformnost, vendar nič ne kaže, da bi bil uporabljen kot tehnični pojem. 15 Podrobneje je razlika med obema poskusoma analizirana v Bečaj (2000). 52 J. Bečaj funkcija referenčnih skupin". Ker je posameznik zaradi svoje želje ali potrebe po članstvu od skupine odvisen, lahko ta njegovo "konformnost ali nekonformnost ustrezno nagradi oz. kaznuje" (Kelley, 1952, str. 412). Izražanje drugačnega stališča ima lahko za posledico odklanjanje in posmeh, strinjanje pa odobravanje in sprejetost. O normativni funkciji referenčne skupine torej govorimo vedno, ko posameznik sprejme drugačno mnenje z namenom, da obdrži ali pridobi članstvo v določeni skupini. Bolj kot je zaradi določenih potreb in ciljev odvisen od skupine, večja je moč, ki jo ima ta nad njim in večja je njegova pripravljenost, da se podredi. Ključne besede so v tem primeru 'sprejetost', 'skupinska norma' ter 'prisila'. V drugem primeru pa skupina posamezniku pomeni zgolj primerjalno točko. Ker članstvo v njej zanj ni pomembno, ta nad njim nima nobene moči in drugačno mnenje, stališče ali prepričanje lahko sprejme le prostovoljno. V tem primeru Kelley govori o primerjalni funkciji referenčnih skupin (comparison function of reference groups) (prav tam, str. 413). Skupina, s katero se primerj a, je torej vsaj v nekaterih pogledih zanj nekakšen vzor ustreznosti in primernosti, vendar brez doživljanja odvisnosti. Ključni besedi sta 'primerjanje' in 'vrednotenje' oz. 'presojanje'. Kelleyeva normativna funkcija referenčnih skupin naj bi ustrezala normativnemu socialnemu vplivu. Ker naj bi imel ta običajno za posledico le posameznikovo navidezno prilagajanje, je morda zanimivo pogledati, kako je to funkcijo razumel Kelley. Pravzaprav je ta avtor zapisal le, da posameznik sprejme drugačno mnenje zaradi svoje odvisnosti oz. zaradi moči, ki jo ima skupina nad njim. Ker pa je Kelleya zanimalo, kako posameznik oblikuje svoja stališča pod vplivom referenčnih skupin, bi lahko to razumeli predvsem kot resnično spremembo. Njegov raziskovalni problem ni bil, kako posameznik pod vplivom skupine prikrije svoje mnenje, pač pa, kako ga oblikuje. Torej je mislil na dejanska in ne na prikrita oz. navidezna stališča. Kelley je sicer poznal tedaj splošno znano ugotovitev, da človek pod pritiskom največkrat popusti le navidez, vendar nič ne kaže, da bi normativno funkcijo referenčnih skupin razumel (samo) na ta način. Bolj se zdi verj etno, daj e tudi v prisili videl izvor resničnih in ne le navideznih sprememb. Trditev, da normativni vpliv povzroča praviloma le navidezne spremembe, v Kelleyj evem delu potemtakem nima prav trdne osnove. V zvezi s Kelleyjevim delom se zdi pomembno še nekaj. Normativni funkciji je dal ime po »vsiljenih standardih, ki se ponavadi imenujejo 'skupinska norma'«. Termin norma pa je bil uporabljen kot nadredni pojem za vse, kar lahko v skupini predstavlja vedenjske standarde. V Kelleyjevem primeru so torej v to vključena zagotovo tudi stališča, saj je raziskoval, kako se oblikujejo. Termin 'normativna' funkcija zato ne izhaja iz 'norme' v smislu tehničnega pojma, pač pa iz prisile, s katero lahko skupina vsili vse svoje vedenjske standarde, med katerimi so tudi norme. Normativni vpliv torej izvirno ne izhaja iz 'norme', pač pa iz prisile. Morton Deutsch in Harold B. Gerard (1955/1993) Od vseh klasičnih tekstov, ki naj bi pojasnjevali konformno vedenje, je gotovo največkrat omenjen tekst Deutscha in Gerarda. Toda zdi se, da ima ta članek z današnjim Socialne predstave psihologov o konformiranju 53 razumevanjem tega pojava presenetljivo malo skupnega. Najprej je potrebno opozoriti, da sta Deutsch in Gerard v bistvu le dopolnila Aschev poskus s črtami in to z enako miselno naravnanostjo, se pravi s pričakovanjem, da je posameznik do skupinskega soglasja kritičen in neodvisen. Na koncu svojega članka na primer pravita takole: "Najine ugotovitve ... nakazujejo, da lahko normativni socialni vpliv posameznikovo integriteto tako podpira kot tudi ogroža. Z drugimi besedami, normativni socialni vpliv lahko posamezniku pomaga, da je v resnici posameznik in ne zgolj skupinsko ogledalo ali njena lutka. Skupine lahko od svojih članov zahtevajo samospoštovanje, da cenijo lastne izkušnje in da so sposobni ravnanja, ki ni suženjsko podrejanje zaradi popularnosti. Ce skupine svojim članom ne pomagajo izraziti lastnega in neodvisnega mnenja, je njihovo soglasje le prazen dosežek. Skupinski proces, ki temelji na pačenju individualnih izkušenj, onemogoča skupinsko izvirnost in učinkovitost" (Deutsch in Gerard, 1955/ 1993, str. 635). Tudi tu imamo torej opraviti z jasno dihotomizacijo posameznika in socialnega okolja. To seveda ne gre skupaj s tem, kar smo izpeljali iz Festingerjeve definicije socialne resničnosti. Ce se namreč posameznik ne more sam prepričati o veljavnosti mnenja, stališča ali prepričanja in je to odvisno šele od doseženega soglasja, potem individualna kritičnost sploh ni možna - vsaj v primeru pojavov socialne resničnosti. Zato je toliko bolj nenavadna formulacija, da lahko skupine od svojih članov samospoštovanje ter neodvisno vedenje kar zahtevajo. Sicer pa je bila izhodišče Deutscha in Gerarda kritika dotedanjih eksperimentov, s katerimi so različni avtorji raziskovali, kako socialni dejavniki vplivajo na individualne16 psihološke procese: "Večina raziskovalcev ni ločila med različnimi vrstami socialnih vplivov; pri tem pa so brezskrbno uporabljali termin ' skupinski' vpliv za opisovanje zelo različnih socialnih dejavnikov. Pregled glavnih poskusov s tega področja - npr. poskusov Sherifa, Ascha, Bowarda - nam na primer pokaže, da poskusne osebe v njih ne tako ne drugače niso delovale kot člani skupin" (prav tam, str. 629, poudarka v orig.). Da bi to popravila, sta ponovila Aschev poskus s črtami in sicer tako, da sta z navodilom, da bo najuspešnejša skupina nagrajena, ustvarila vtis, da gre za pravo skupino, v kateri so posamezniki odvisni drug od drugega. Pričakovala sta, da bo v teh okoliščinah predvsem normativni vpliv pomembno močnejši, kar se je v resnici tudi zgodilo. Tako kot Asch tudi Deutsch in Gerard konformiranja nista niti raziskovala in ga tudi nista definirala. Prava tako pa nista empirično dokazovala obstoja dveh procesov socialnega vpliva in vsaj v članku iz leta 1955 nista pojasnila, kako sta do tega razlikovanja sploh prišla. V uvodu k oblikovanju hipotez pravita, da verjameta, da sta bili obe obliki vplivanja v predhodnih poskusih prisotni.17 Gerard skupaj z Jonesom šele pozneje zapiše, da se je z dotedanjim eksperimentiranjem pokazalo, kako sta informacijski ter normativni vpliv tesno prepletena in kako oba prideta do izraza v isti 16 V originalu: "By now, many experimental studies ... have demonstrated that individual psychological processes are subject to social influence" (Deutsch in Gerard, 1955, str. 629). 17 V originalu: »The purpose of this paper is to consider two types of social influence, 'normative' and 'informational', which we believe were operating in the experiments mentioned above ...« (Deutsch in Gerard, 1955, str. 629). 54 J. Bečaj eksperimentalni situaciji. To naj bi Deutsch in Gerard ugotovila po analizi opravljenih raziskav, nato pa s svojim poskusom pokazala, kako je mogoče posledice enega in drugega ovrednotiti ločeno. S tem pa naj bi prišla do enakega razlikovanja, do kakršnega je prišel Kelley s pomočjo analize neeksperimentalne literature o referenčnih skupinah (Jones in Gerard, 1967, str. 315). Tudi iz tega sledi, da Deutsch in Gerard empirično nista dokazovala obeh vrst vpliva, pač pa le uporabila shemo, ki je bila v tistem času očitno splošno sprejeta. Definiciji obeh vrst vpliva sta zato pri Deutschu in Gerardu najverjetneje zgolj njuna formulacija tedaj splošno znanega in sprejetega prepričanja, da posameznik prevzame drugačna stališča, mnenja in prepričanja prostovoljno in zares ali pa pod prisilo in navidez. Njuni definiciji sta znani: »Normativni socialni vpliv bova definirala kot vpliv, ki spodbuja h konformnosti s pozitivnimi pričakovanji drugega (angl. another). Informacijski socialni vpliv pa je mogoče definirati kot vpliv, ki spodbuja sprejemanje informacije drugega kot podatek o resničnosti« (Deutsch in Gerard, 1955/1993, str. 629). V oči nam pade, da je termin 'konformiranje' uporabljen le v zvezi z normativnim vplivom, medtem ko naj bi informacijski vpliv povzročil sprejemanje (angl. to accept) informacije. Da morda ne gre za slučaj, kaže opis posledic obeh vplivov, kjer najdemo enako razlikovanje: "S pričakovanji drugih se je mogoče konformirati samo navzven in reči stvari, v katere človek sicer ne verjame ... Prav tako pa je možno, da nekdo sprejme nasprotnikova prepričanja kot resnična, ne da bi za strinjanje obstajala kakšna drugačna motivacija" (prav tam, str. 629).18 Ce bi termin 'konformiranje' razumeli kot tehnični pojem, potem iz definicij in opisa posledic sledi, da tovrstno vedenje povzroča le normativni vpliv, ne pa tudi informacijski. Vendar pa avtorja o tem razlikovanju ne zapišeta ničesar. Kaže, da se je trditev, da tako normativni kot tudi informacijski vpliv vodita v konformiranje, pojavila šele pozneje. Najdemo jo na primer pri Kelmanu (1964, str. 266), ki pravi, da se posameznik konformira z osebo ali skupino, ki nanj vpliva, tako v primeru normativnega kot informacijskega vpliva.19 Deutsch in Gerard se torej s konformiranjem nista ukvarjala in ga tudi nista definirala. Prav tako nista dokazovala obstoja dveh vrst socialnega vpliva in sta s konformiranjem povezovala le normativnega. Njun članek pa skriva v sebi še kup drugih zanimivosti. Najprej lahko opazimo, da obe obliki vpliva ne pomenita le prilagajanja skupinam, pač pa tudi posameznikom. Se več, avtorja dopuščata, da gre lahko v obeh primerih tudi za prilagajanje lastnemu selfu, saj pojem "another", ki ga uporabljata v obeh definicijah, lahko vključuje "drugo osebo", "skupino" ali "posameznikov self'.20 Po njunem mnenjuje normativni socialni vpliv povezan s skupino 18 Deutsch in Gerard torej ne govorita o prisiljevanju, pač pa le o posameznikovem prilagajanju pričakovanjem skupine. Tako skrajne formulacije, kot jo poznamo iz sodobne literature, da namreč normativni vpliv pomeni spopad socialnega in individualnega, v izvirniku ni. 19 V sodobni literaturi najdemo enako formulacijo npr. v Martin in Hewstone (2001, str. 211). 20 V originalu: "The term another is being used inclusively to refer to "another person", to a "group" or to one's self." (Deutsch in Gerard, 1955, str. 629). Socialne predstave psihologov o konformiranju 55 le praviloma (Deutsch in Gerard, 1955/1993, str. 468-634). Zdi se, da se je v literaturi vendarle uveljavilo mnenje, da konformiranje velja le za odnos posameznik - skupina, ne pa za odnos posameznik - avtoriteta. Izrecno na to opozarja npr. Milgram (1985) ob svojem poskusu z elektrošoki.21 Deutsch in Gerard takega razlikovanja nista poznala. Druga posebnost je še veliko bolj pomembna. V opombi pod črto (Deutsch in Gerard, 1955/1993, str. 630) ugotavljata, da bi moral biti v situaciji Aschevega tipa zelo močan informacijski socialni vpliv. To pa predvsem za to, ker se je v jasno strukturiranih situacijah, kakršna je bila Ascheva, običajno mogoče popolnoma zanesti na to, da je odgovor enotne večine veljaven. To, kar v takem primeru vidijo brez izjeme vsi enako, mora biti gotovo res, saj se toliko ljudi pri tako preprosti nalogi ne more zmotiti. Težava, ki so jo poskusne osebe imele, pa je bila v tem, da je bil ta odgovor v nasprotju s tem, kar so jim sporočale lastne oči. Tudi nanje se je mogoče v tako jasno strukturirani situaciji popolnoma zanesti. Poskusne osebe so se torej znašle v skrajno nemogoči situaciji, saj so se morale odločiti med dvema viroma, ki sta običajno skladna. Do sledenja večini je po Deutschu in Gerardu lahko prišlo na dvojni osnovi. Če je poskusna oseba sledila (angl. to accept) večini, ker je pri sebi presodila, da se toliko ljudi ne more motiti, je šlo za informacijski vpliv. Če pa je večini sledila (angl. to conform) zato, da bi se "izognila posmehu, negativni oceni ali pa celo zaradi občutka dolžnosti" pa je to bil normativni vpliv (prav tam, str. 631). Ta formulacija ne pomeni nič drugega kot to, da se o tem, za kakšen vpliv gre, odloča na intraindividualni ravni. Če posameznik, ki sledi napačnemu odgovoru večine, presodi, da ima večina prav, gre za informacijski vpliv, če pa presodi, da se moti, pa gre za normativnega. Obe vrsti vpliva potemtakem nista dva skupinska procesa, niti nista dve obliki zunanjega vpliva na posameznika, pač pa dve različni individualni interpretaciji iste situacije. V tem primeru tudi ni mogoče govoriti, da bi normativni socialni vpliv moral biti kakorkoli povezan z objektivno obstoječo močjo skupine. Očitno namreč zadostuje, da posameznik misli, da je tako. V objektivno popolnoma enaki situaciji se torej različni posamezniki lahko odzovejo različno: nekateri vztrajajo pri svojem odgovoru (neodvisno vedenje), drugi se raje prilagodijo, ker mislijo, da se toliko ljudi pri tako konkretni nalogi pač ne more motiti (informacijski vpliv) ali pa to storijo iz popolnoma praktičnega razloga, da bi se izognili neprijetnemu izpostavljanju (normativni vpliv). Če torej sledimo zapisani interpretaciji Aschevega poskusa, lahko ugotovimo, da za Deuscha in Gerarda potemtakem normativni in informacijski socialni vpliv sploh nista (nujno) procesa socialnega vplivanja, ki poteka med posamezniki ali med skupino in posameznikom, pač pa predvsem intraindividualni pojav. In če je tako, je seveda vprašanje, če smo sploh upravičeni govoriti o 'socialnem' vplivanju. Opisana interpretacija Aschevega poskusa s črtami pa nam postreže še z eno zanimivostjo. Kot smo videli, Deutsch in Gerard v njej dopuščata možnost, da je do 21 Po Milgramu se konformnost in poslušnost (obedience) razlikujeta v tem, da gre pri prvem za odnos z ljudmi na isti ravni, pri poslušnosti pa za podrejanje avtoriteti. V obeh primerih pa ima vedenje svoj izvor zunaj posameznika (Milgram, 1985, str. 134-136). 56 J. Bečaj informacijskega vpliva prišlo takrat, ko so poskusne osebe pri sebi presodile, da se toliko ljudi ne more motiti in da so se torej morale iz nekega razloga zmotiti same. Iz Aschevega poročila (Asch, 1952) pa vemo, da so se poskusne osebe tudi takrat, ko so sledile napačnemu odgovoru večine, popolnoma zavedale razlike med lastno zaznavo in odgovorom večine. Po končanem poskusu so povedale, da so si nemogočo situacijo, v kateri so se znašle, razložile tako, da morda niso dobro slišale navodil, da so kaj preslišale, napačno razumele ali pa jih je morda zavedel specifičen zorni kot. Toda praktično v vseh primerih so še vedno videle nekaj drugega, kot je govorila enotna večina. Ce je torej v takem primeru šlo za informacijski vpliv, so poskusne osebe le verjele, da ima enotna večina bolj prav, niso pa tega tudi videle. To pa pomeni, da so se prilagodile le navidez, tako kot pri normativnem vplivu, le na drugačni osnovi. Ce sledimo tej interpretaciji, informacijski vpliv potemtakem ne pomeni resničnega sprejemanja drugačnega mnenja v tem smislu, da zamenja predhodno drugačno mnenje. Razlika med posameznikom in skupino ostane, posameznik se je zaveda, le interpretirana je v korist skupine. Informacijski vpliv po Deutschu in Gerardu potemtakem ne povzroča nujno resničnih sprememb. Zadostuje, da posameznik presodi, da ima skupina iz nekega razloga bolj prav kot on sam. S tega vidika pa je zanimiva primerjava informacijskega vpliva s Festingerjevo socialno resničnostjo. Vprašamo se namreč lahko, kako posameznik v tem primeru pravzaprav preveri veljavnost drugačnega mnenja, stališča ali prepričanja. V bistvu se le zanese, da ima druga oseba ali skupina prav. Iz definicije ne sledi, da bi kakorkoli preverjal, če je podatek o resničnosti veljaven. Tako kot pri Festingerjevi socialni resničnosti je potemtakem tudi tukaj pomembno soglasje, ne pa veljavnost sama po sebi. Kot bomo videli pozneje, je Kelman predvidel še dve možnosti, in sicer, da je drugačno mnenje sprejeto kot veljavno, ker ustreza že oblikovanemu subjektivnemu vrednotnemu sistemu, ali pa zato, ker je z njegovo pomočjo mogoče rešiti neko nalogo. Veljavnost je v prvem primeru posledica kognitivnega ujemanja, v drugem pa ugotovljena učinkovitost. Kelman torej vendarle zahteva nekaj več kot golo zaupanje. Deutsch in Gerard teh možnosti ne predvidevata in zato pravzaprav tudi v primeru informacijskega vpliva govorita o podrejanju. Za razliko od normativnega pa tu do njega ne pride zaradi prisile, pač pa na osnovi zaupanja. Enake formulacije najdemo v zvezi z informacijskim vplivom tudi v sodobni literaturi. Posameznik se konformira z drugačnim mnenjem, ker presoji drugih ljudi zaupa bolj kot svoji (van Avermaet, 1996, poudarek JB), ali pa zato, ker so drugi (podobni, ekspertni, kredibilni) zaupanja vreden vir podatkov o resničnosti (Turner, v Manstead in Hewstone, 1995). V nobenem primeru torej posameznik veljavnosti sprejetega mnenja ne preverja, pač pa verjame oz. zaupa. Tudi informacijski vpliv je potemtakem neke vrste podrejanje. Današnja prepričanja, da sta Deutsch in Gerard dokazala obstoj dveh procesov socialnega vplivanja, da sta se ukvarjala s konformiranjem, da oba procesa vodita v konformnost, da gre za interindividualen pojav, da se konformiranje nanaša na odnos posameznik - skupina in da informacijski vpliv povzroča resnične spremembe, v članku Deutscha in Gerarda iz leta 1955 torej nimajo zadostne podpore. Res je, da v tekstu Socialne predstave psihologov o konformiranju 57 najdemo tudi nekatere formulacije, ki kažejo v to smer, vendar tu obravnavani citati kažejo, da avtorja s tem člankom zagotovo nista oblikovala logično konsistentega modela socialnega vplivanja, s katerim bi bilo mogoče navedena prepričanja ustrezno utemeljiti. Najverjetnejši razlog za to je, da se Deutsch in Gerard s konformiranjem pač nista ukvarjala in zato na ta vidik obeh procesov preprosto nista bila pozorna. Strokovna literatura jima morda dela krivico v tem smislu, da v njunem delu vidi stvari, s katerimi se nista ukvarjala niti nista kazala takih namer. Njun cilj je bil le dokazati, da je v pravih skupinah pritisk na drugačne posameznike večji kot v skupinah, kakršna je bila Ascheva, in da so se ti zaradi tega pripravljeni podrediti v še večji meri kot v primeru poskusa s črtami. To sta tudi dokazala in tako kot Asch sta tudi onadva mislila, da za učinkovito delovanje skupin to ni dobro. Herbert C. Kelman (1961), John W. Thibaut in Harold H. Kelley (1959) Med klasične avtorje, ki so pomembni v zvezi s konformiranjem, spadajo tudi Kelman ter Thibaut in Kelley, ki jih bomo tukaj omenili le na kratko. Kelman (1961) se je tako kot Kelley, Asch, Deutsch in Gerard zanimal predvsem za posameznika, zlasti za to, pod kakšnimi pogoji ljudje opuščamo in spreminjamo svoja mnenja. Pri tem je razvil svojo klasifikacijo procesov socialnega vplivanja. Kot večina avtorjev tistega časa je tudi on na začetku ločeval le dva načina odzivanja posameznika na drugačno mnenje: 'privatno sprejemanje' in 'javno konformiranje'. S to delitvijo pa je postal nezadovoljen, ker z njo ni mogel pojasniti dveh pomembnih pojavov socialnega vplivanja: to so bile ideološke spreobrnitve (angl. ideological conversion of 'true believers') in pa pranje možganov v tedanji komunistični Kitajski (Kelman, 1961). Tako so nastali trije procesi: popuščanje, identifikacija in internalizacija. Prva dva skupaj ustrezata normativnemu vplivu po Deutschu in Gerardu, tretji pa njunemu informacijskemu vplivu. Ti procesi so tudi pri Kelmanu razumljeni predvsem kot intrapsihološki pojavi, na kar kaže formulacija v uvodu: »... Tu je teorija treh procesov, s katerimi se osebe odzivajo na socialno vplivanje« (Kelman, 1964, str. 263).22 Morda je zanimivo, da pri opisovanju procesov tudi ta avtor termina 'konformiranje' ni uporabljal. V vseh primerih oseba sprejme vpliv (angl. accepts influence) ali pa vedenje posvoji (angl. adopts behavior) (prav tam, str. 266-269). Tudi iz tega lahko sklepamo, da 'konformnost' v pretežnem delu literature tistega časa ni bila tehnični pojem, čeprav jo je pred tem že definiral Sherif, v približno istem času pa temeljito obdelala tudi Marie Jahoda (1959/1965). Kelmanovo popuščanje (angl. compliance), tako kot javno konformiranje oz. normativni socialni vpliv, pomeni, da posameznik mnenje izvora vpliva sprejme le navidez, svoje drugačno mnenje pa prikrije. S tem si poskuša zagotoviti potrditev s strani izvora vpliva, ki je lahko skupina pa tudi posameznik, ki razpolaga z zadostno močjo. Tako kot Deutsch in Gerard tudi Kelman predpostavlja, da za tak odziv ni potreben resničen pritisk. Posameznik lahko popusti tudi, ko le misli, da izvor to od 22 V orig.: »... Here is a theory of three processes by which persons respond to social influence.« 58 J. Bečaj njega pričakuje (Kelman, 1964, str. 267). Posebne pozornosti pa sta vredni Kelmanova internalizacija in identifikacija. Do prve pride, "kadar posameznik sprejme vpliv zato, ker je posredovano vedenje skladno z njegovim vrednotnim sistemom, oziroma zato, ker lahko s pomočjo novega vedenja učinkovito razreši določen problem " (prav tam, str. 268).23 Za posameznika je torej res to, kar se ujema s tistim, kar že ve, kar posredno pomeni, da so posamezni deli kognitivnega sistema med seboj uravnoteženi. Gre torej za enako načelo, kot ga je Festinger uporabil za socialno resničnost, le da je tukaj 'soglasje' doseženo na intraindividualni ravni med različnimi kognitivnimi vsebinami. Pri identifikaciji gre pa za resnično sprejemanje mnenja, kljub temu da ni skladno z obstoječim kognitivnim sistemom. Do tega pride, kadar se posameznik znajde v odnosu, ki je zelo pomemben za njegovo samopodobo (angl. self-image; self-defining relationship) in je od njega izrazito odvisen (prav tam, str. 267). Thibaut in Kelley (1959) v strokovni literaturi ne veljata za raziskovalca konformiranja, sta pa za razumevanje tega pojava vendarle pomembna, ker spadata med redke avtorje, ki so v petdesetih letih jasno definirali socialno normo in njen obstoj povezali s konformiranjem. Bila sta značilna funkcionalistično naravnana predstavnika teorij socialne izmenjave. V uvodu v svojo Socialno psihologijo skupin sta zapisala, da sta bila sicer nekajkrat v skušnjavi, da bi si pri oblikovanju svoje teorije pomagala s specifičnimi socialnimi motivi, kot sta npr. potreba po moči ali potreba po statusu (Thibaut in Kelley, 1959, str. 5), vendar pa je bila situacija na tem področju po njunem mnenju tedaj še vse preveč nejasna in sta se zato odločila za izrazito funkcionalističen pristop. Izhajala sta iz predpostavke, da lahko človek vsaj določene potrebe, ne glede na to, kakšne so in od kje so se vzele, zadovolji le v socialni interakciji. Iz tega sledi zelo pomemben sklep: socialna interakcija pomeni pogajanja in barantanje, s katerim poskuša vsak doseči zase najbolj ugoden rezultat in je torej po svoji naravi konfliktna. Norme, ki so rezultat pogajanj, zato niso nič drugega kot zamrznjena kombinacija razmerja moči pogajalcev. Thibaut in Kelley sta jih definirala kot stabilna pravila o vedenju, ki temeljijo na soglasju in so nadosebna. V odnosu se namreč pojavijo kot 'tretja oseba', ki začne obvladovati diado. V tem smislu dobijo normativno moč (prav tam, str. 129)24, saj delujejo na oba člana diade tudi mimo njunih specifičnih osebnih interesov. 'Tretja oseba' pa za vzdrževanje norm ni dovolj. Thibaut in Kelley sta bila prepričana, da se lahko obdržijo le, če obstajajo procesi, ki zagotavljajo konformnost 23 Kelman uporablja termin vrednotni sistem, ki pa ni jasno definiran. Zato bomo v nadaljnjem tekstu poleg tega izraza uporabljali tudi »miselni« in »kognitivni« model. V vseh treh primerih bomo s tem mislili na posameznikov vedenjski sistem. 24 Tako kot pri Kelleyju je tudi tukaj termin 'normativno' povezan z močjo in pomeni prisilo (normative power). Toda to je prisila v smislu podrejanja normi kot »tretji osebi« in ne partnerju! Norma mora imeti namreč ustrezno soglasje in če je nekdo v določeno ravnanje prisiljen, vsaj v diadnem odnosu ni mogoče govoriti o normi (Thibaut in Kelley, 1959, str. 129). V takem primeru gre za 'nadzor nad usodo' (angl. fate control) in pomeni, da je posameznik zaradi potrebe, ki je ne more izpolniti nikjer drugje, svojemu partnerju prepuščen na milost in nemilost. Socialne predstave psihologov o konformiranju 59 (prav tam, str. 239). Do tega pripeljejo trije procesi, ki sta jih povzela po Kelmanu. To so popuščanje, identifikacija in internalizacija. Prva dva procesa sta, tako kot pri Kelmanu, v svojem bistvu 'normativna', kar pomeni, da povzročita vedenje, ki se samo od sebe ne bi pojavilo. Posameznik se konformira, da bi prišel do nagrade (identifikacija), ali pa zato, da bi se izognil kazni (popuščanje). V obeh primerih je vedenje povzročeno z zunanjim dejavnikom in se tako tudi vzdržuje: če kaznovanje ali nagrajevanje preneha, preneha tudi vedenje. Z internalizacijo, ki ustreza informacijskemu vplivu, pa je drugače. Tu ima skupina ali druga oseba vlogo eksperta, ki osebi pomaga, da se lahko uspešno spoprime z neko nalogo. 'Nagrada', ki ima pomen ojačevalca vedenja, je tu doživeta lastna učinkovitost, zaradi česar se sprejeto vedenje ohrani samo od sebe brez nadaljnje zunanje spodbude (prav tam, str. 243245). Zanimivo pa je, da sta Thibaut in Kelley pri internalizaciji izpustila Kelmanovo idejo, da je za posameznika res to, kar se ujema z njegovim že obstoječim vedenjskim sistemom. Konformiranje v šestdesetih letih Gotovo je res, kot zapiše Turner (v Manstead in Hewstone, 1995), da je današnje razumevanje konformnega vedenj a določeno predvsem s klasičnimi teksti iz petdesetih let. Toda ugotovili smo, da se ti teksti s konformiranjem v glavnem sploh ne ukvarjajo in da je do 'spoznanj', ki so jim danes pripisana, očitno prišlo šele pozneje. Iz tega razloga se zdi vredno na kratko pogledati še v literaturo s konca šestdesetih in začetka sedemdesetih let, da bi ugotovili, kakšen pomen so imeli klasični članki v tem obdobju. V tem času namreč učbeniki socialne psihologije konformiranje že obravnavajo kot razmeroma samostojen pojav. Krech, Crutchfield in Ballachey (1972) so npr. ločevali konformno vedenje od uniformnosti in konvencionalnosti in njegovo bistvo videli v posameznikovem popuščanju pod pritiskom skupine, zaradi česar po njihovem mnenju konformnega vedenja brez konflikta ne more biti (prav tam, str. 514). Posledica je lahko resnična ali navidezna konformnost. Tudi nekonformno vedenje ima dve obliki: posameznikje lahko neodvisen ali pa antikonformen. Podobno je razumel konformiranje tudi Hollander (1971), ki je ločil konformno, neodvisno in antikonformno vedenje. Zanimiva pa je tale njegova misel: Ce konformnost razumemo kot pristajanje na socialna pričakovanja, je gotovo, da si organizirane družbe brez nje ne moremo predstavljati ne glede na kritične trditve, da živimo v 'obdobju konformnosti', ki ogroža individualnost. Nad tem se sicer lahko zamislimo, nima pa smisla kar vnaprej obsojati vsako tako dejanje, saj bi svet, v katerem živimo, brez predvidljivih načinov vedenja postal kaotičen. (str. 549) Citat kaže, da se je konec šestdestih let očitno že utrdilo prepričanje, da konformiranje pomeni konflikt med posameznikom in skupino ter da ogroža posameznikovo individualnost. No, Hollander vseeno misli, da konformno vedenje posamezniku vendarle prinaša tudi različne ugodnosti, med njimi tudi oblikovanje 60 J. Bečaj psihološke identitete, socialne resničnosti in nasploh predstavlja podporo individualnosti (prav tam, str. 551). Zanimivo je, da Krech, Crutchfield in Ballachey (1972, str. 515) obširno navajajo Aschev poskus s črtami, katerega označijo kot preučevanje konformnosti. Pač pa ne navedejo Deutscha in Gerarda, medtem ko je Sherifov poskus z avtokinetičnim učinkom le omenjen. Deutscha in Gerarda v zvezi s konformiranjem ne omenja niti Hollander. Pač pa ju navaja v poglavju »Skupinska dinamika in skupinska učinkovitost« in podpoglavju »Socialna resničnost in splošno sprejeta stališča« (Hollander, 1971, str. 522). Ta dva avtorja sta postala glavna predstavnika raziskovanja konformnega vedenja očitno šele pozneje. Posebne pozornosti je vredna Socialna psihologija Jonesa in Gerarda iz leta 1967, še posebej zato ker je Gerard pred tem skupaj z Deutschem napisal slavni članek o dveh oblikah socialnega vpliva. Navedli smo že, da sta ta dva avtorja povezovala Festingerjevo skupinsko lokomocijo, Kelleyevo normativno funkcijo referenčnih skupin ter normativni vpliv na eni ter socialno resničnost, primerjalno funkcijo referenčnih skupin in informacijski vpliv na drugi strani (Jones in Gerard, 1967, str. 309-315). V svojo socialno psihologijo sta vključila kar obsežno poglavje o konformnosti, z značilnim naslovom »The conformity conflict«. Zanimiva pa je tudi definicija na koncu knjige: »Konformnost je splošen pojem, ki pomeni predanost normam (prepričanjem, vrednotam, stališčem ali vedenju) neke skupine. Za tem se skrivajo mnogi psihološki procesi« (prav tam, str. 709). Po naslovu sodeč je konformiranje torej povezano s konfliktom, po definiciji pa gre za splošen pojem, ki označuje stanje uniformnosti, do katerega lahko pripeljejo različni procesi. Individualistično naravnanost kaže uvod v poglavje o konformnosti: »Čeprav imajo poskusi s skupinami prednost, ker je z njimi mogoče ustvariti kompleksne situacije, kakršne najdemo v resničnem življenju, pa prav ta kompleksnost preprečuj e natančno analizo individualnega vedenj a. Da bi lahko bolj natančno opazovali, kako se oseba odziva na razhajanja med lastnimi in tujimi mnenji in sposobnostmi, je potrebno skrbno nadzirati naravo in smer takih razhajanj« (prav tam, str. 387). Pomeni, da skupinski kontekst ni predmet raziskovanja, pač pa prej ovira za razumevanje posameznika. Šestdeseta in začetek sedemdesetih let torej prinesejo definicije konformnosti, ki očitno dobi pomen tehničnega pojma, čeprav o poj avu ni bilo nobene konsistentne in celostne teorije, podprte z ustreznimi empiričnimi podatki. Normativni in informacijski vpliv Deutscha in Gerarda pri večini avtorjev še ne nastopata kot dva procesa, ki vodita v konformnost.25 Pač pa je Asch že prepoznan kot avtor, ki naj bi raziskoval konformiranje, prav tako pa Sherif kot raziskovalec nastajanja norm. Vendar pa ta dva avtorja med seboj še nista povezana tako kot v sodobnih učbenikih socialne psihologije. Očitna pa je težnja, da se konformiranje povezuje s prisilo in konfliktom ter da so avtorji naravnani predvsem individualistično. 25 Pač pa se ta ugotovitev v tem času vendarle že začenja pojavljati. Leta 1972 npr. Berkowitz v okviru konformiranja že povezuje Sherifa, Ascha in tudi Deutscha in Gerarda na način, kot ga poznamo danes (Berkowitz, 1977). Socialne predstave psihologov o konformiranju 61 Enostransko razumevanje konformnosti (angl. conformity bias) je v začetku sedemdesetih let kritiziral Moscovici, ko je s sodelavci začel raziskovati vplivanje manjšin (Moscovici in Faucheux, 1972). Z ločevanjem prisile in vplivanja je na področju socialnega vplivanja povzročil pomembne premike, ki so vplivali tudi na razumevanje konformiranja. Zanimivo je, da sta se Moscovici in Faucheux v svoji predstavitvi modela vplivanja manjšin v največji meri oprla na Aschev poskus s črtami, ne pa npr. na Sherifa ali pa Deutscha in Gerarda. Z Moscovicijem se pojavi tudi zanimiva razlikovalna definicija treh glavnih oblik socialnega vplivanja: normalizacija pomeni izogibanje konfliktom, konformiranje vzdrževanje doseženega premirja, inovacija pa vnašanje konflikta v premirje (Moscovici in Ricateau, 1975). Pri tem pa je zanimivo implicitno razumevanje odnosa med posameznikom in socialnim okoljem, ki se skriva v teh definicijah. Normalizacija, kot proces oblikovanja norm, je »... pritisk, ki ga osebe izvajajo druga na drugo z namenom, da bi prišle do presoje, ki bi bila sprejemljiva za vse ali ki bi se temu vsaj čim bolj približala« (Moscovici in Faucheux, 1972, str. 171). Iz te formulacije izhaja, da je oblikovanje norm konflikten proces, ki poteka v obliki pogajanj in barantanj, kar je veliko bližje Thibautu, Kelleyju in tudi Aschu kot pa Sherifoma. S tem je skladna tudi definicija konformiranja, po kateri naj bi šlo za uspešno izveden (normativni) pritisk na posameznika ali podskupino, ki se ne more umakniti iz "skupinske kulture", posledica česar je zunanja (angl. behavioral or external compliance) ali pa notranja podreditev (angl. belief oriented or internal compliance). Funkcija tega pritiska je zaščita skupinske enotnosti (prav tam, str. 166). Vplivanje manjšinje v sodobno strokovno literaturo prineslo kar nekaj sprememb. Vse pogosteje se namesto o konformiranju govori o vplivanju večine, ki povzroča popuščanje (angl. compliance) za razliko od manjšin, ki povzročajo spreobrnitev (angl. conversion) (prim. van Avermaet, 1996). Je konformnost proces ali stanje? Primerjava klasičnih tekstov in sodobnih definicij konformiranj a pa nam pokaže še eno značilnost, ki tudi pomembno prispeva k nejasnosti obravnavanega pojava. Ugotovili smo, da 'klasiki' termina konformnost in konformiranje večinoma niso uporablj ali kot tehnični poj em, pač pa v navadnem pogovornem pomenu. V samostalniški obliki (konformnost) je zato pomenil preprosto enako vedenje, v glagolski (konformirati se) pa, da je posameznik svoje vedenje prilagodil pričakovanjem socialnega okolja. To se zgodi zaradi pritiska skupine oz. zaradi posameznikove presoje, da je to potrebno ali pametno storiti. Sherifa sta konformnost razumela kot zvestobo vedenju, kakršno se je oblikovalo v referenčnih skupinah, Thibaut in Kelley pa kot stanje, do katerega lahko pripeljejo tri vrste socialnega vpliva. Ti avtorji, kot pozneje tudi Jones in Gerard, konformnosti torej niso razumeli kot interindividualni proces, pač pa kot posledico inter ali intraindividualnega dogajanja, ki se vidi kot izenačenost skupinskih članov, se pravi kot določeno stanje. Podobno so ga razumeli tudi ostali avtorji iz petdesetih let. 62 J. Bečaj Med njimi ni pravzaprav nikogar, ki bi konformiranje opisal kot proces, ki poteka v skupini in pripelje do uniformnosti. Drugače je z definicijami, ki so navedene na začetku tega teksta. Turner v Blackwellovi enciklopediji (Manstead in Hewstone, 1995) pravi, da gre za približevanje deviantne osebe (podskupine) skupinski normi, medtem ko Howit in dr. (1989) po literaturi povzamejo, da gre za spopad med individualnim in socialnim. Na drugem mestu Turner zapiše, da konformiranje spada med procese socialnega vplivanja, »s pomočjo katerih se s socialno interakcijo in komunikacijo pri ljudeh spreminja in nadzira njihova prepričanja, mnenja, stališča, vrednote in vedenje« (v Manstead in Hewstone, 1995, str. 562, poudarek JB). Ostali procesi socialnega vplivanja so še oblikovanje socialnih norm, vplivanje manjšin, pokoravanje avtoriteti, moč in podrejanje, spreminjanje stališč in prepričevanje ter skupinska polarizacija. Za Moscovicija pa je konformiranje eden od treh temeljnih procesov socialnega vplivanja, s katerimi se oblikujejo, vzdržujejo in spreminjajo socialne norme. Ostala dva sta normalizacija in vplivanje manjšin (Moscovici in Faucheux, 1972). Skratka, tudi v tem pogledu lahko med klasičnimi teksti in sodobnimi definicijami konformiranja ugotovimo pomembno razliko. Medtem ko se je v petdesetih letih pod konformnostjo razumelo predvsem stanje izenačenosti, pa ga večina sodobnih avtorjev popolnoma jasno označuje kot interindividualni proces. Po Moscoviciju in Turnerju lahko povzamemo, da konformiranje pomeni proces, ki se sproži ob ugotovljeni neskladnosti posameznega člana ali manjšine z že pred tem oblikovano normo ali katero drugo za skupino pomembno kategorijo socialne resničnosti in je njegova funkcija obnovitev ali vzdrževanje uniformnosti. Kako točno ta proces izgleda, ni prav jasno, očitno pa je, da je večina tista, ki z zmožnostjo nagrajevanja in kaznovanja obvladuje položaj. Pri tem pa naj mimogrede opozorimo še na eno pomembno zanimivost, ki se skriva v takem razumevanju odnosa med posameznikom (ali manjšino) in večino. Posameznik se namreč praviloma pojavi vedno v vlogi tistega, ki ogroža enotnost skupine, zaradi česar postane žrtev njenega pritiska. Toda, kdo je ta večina, ki pritiska na deviantnega člana? V resnici je sestavljena prav tako iz posameznikov in samo ti so lahko tisti, ki silijo drugačnega člana k upoštevanju skupinskih norm. Že zavedanje tega preprostega dejstva nam pove, da je večina članov skupine potemtakem nujno večkrat izvajalec pritiska kot pa njegova žrtev! To mora biti še posebej res, kadar gre za kategorije socialne resničnosti, katerih veljavnost je zagotovljena s soglasjem. V tem primeru je konformiranje proces, s katerim se zagotavlja dovolj visoka stopnja soglasja, kar z drugimi besedami pomeni veljavnost socialne resničnosti. In od kje bi se lahko vzelo prepričanje, da je posameznik v spopadu s socialnim okoljem, v zameno za sprejetost, obsojen na žrtvovanje svoje individualnosti? Formulacija ustreza individualistični metateoretični paradigmi in prav tukaj najdemo zanimivo zvezo med današnjim razumevanjem konformiranja in klasičnimi teksti iz petdesetih let. Socialne predstave psihologov o konformiranju 63 V 50. letih so obstajali trije pomembno različni teoretični modeli socialnega vplivanja Analiza klasičnih tekstov, ki naj bi bili osnova za današnje razumevanje konformnega vedenja, nam je pokazala, da mnogih danes splošno znanih in sprejetih 'spoznanj' v njih ni mogoče najti. Splošno znana 'dejstva', da se Sherif in Asch dopolnjujeta, da je Aschev poskus s črtami klasični poskus s področja konformiranja, da tako normativni kot informacijski vpliv vodita v konformno vedenje, ali pa, da je konformiranje spopad individualnega in socialnega, v klasični literaturi nimajo kritja. Sherifova definicij a konformnosti kot tudi prispevek Thibauta in Kelleya sta pozablj ena, prezrti so zaključki, ki jih je mogoče izpeljati iz Festingerjevega teksta iz leta 1950: da konflikt med posameznikom in skupino v socialni resničnosti ni možen in da za potrebo po podatkih o resničnosti v resnici tiči potreba po soglasju. Prav tako je prezrto njegovo ločevanje prisile in vpliva in ugotovitev, da različne skupine lahko oblikujejo različne socialne resničnosti. Kako se je lahko vse to zgodilo? Primerjava implicitnih teoretičnih izhodišč obravnavanih avtorjev nam lahko ponudi zanimivo razlago. Kakorkoli že razumemo konformno vedenj e, je v ozadju vedno vprašanj e odnosa med posameznikom in socialnim okoljem. Zakaj je potrebna enotnost in kaj pomeni za skupino odklonsko vedenje posameznih članov? Zakaj posameznik potrebuje socialno resničnost in zakaj je veljavnost kategorij, ki jo sestavljajo, določena s soglasjem? Taka in podobna vprašanja spadajo na področje socialne motivacije in zahtevajo pojasnilo izvorov človekovega socialnega vedenja, s čimer pa se klasični teksti eksplicitno ne ukvarjajo. Ce pa smo pozorni na implicitno razumevanje odnosa med posameznikom in socialnim okoljem, dobimo zanimivo sliko. Vidimo lahko namreč, da imamo opraviti s tremi dokaj različnimi teoretičnimi naravnanostmi. Prvo skupino predstavljata oba Sherifa, drugo Thibaut in Kelley, tretjo pa Kelley, Asch, Deutsch in Gerard ter Kelman. Pri Sherifih je norma skupinski izdelek, ki nastane kot socialni produkt v nestrukturirani situaciji z medsebojnim primerjanjem. S tem se odpravlja negotovost posameznikov in v tem je tudi razlog, da skupinski izdelek posamezniki sprejmejo kot svoja osebna vodila. Norme torej ne nastajajo z barantanjem in pogajanji, pač pa s primerjanjem in njihova veljavnost je v soglasju. Posameznik in skupina nista dihotomizirana elementa in med njima ni konflikta. Ta pogled na odnos posameznika in socialnega okolja ustreza izpeljavam iz Festingerjevega opisa socialne resničnosti. Thibaut in Kelley razumeta norme kot zamrznjeno optimalno stanje konfliktnega odnosa, procesi, ki zagotavljajo konformno vedenje, pa so nujni za njihov obstoj. Norme so produkt pogajanj ter barantanj in njihova veljavnost je določena s funkcionalnostjo. Učinkovite so, kadar obe strani z njihovo pomočjo v danih razmerah najbolje zadovoljujeta svoje specifične individualne potrebe. Nastajanje norm kot tudi zagotavljanje konformnega vedenja je tesno povezano s socialno močjo. Ceprav sta avtorja usmerjena v interakcijo, pa je v njunem teoretičnem modelu posameznik jasno dihotomiziran od svojega socialnega okolja oziroma od drugih posameznikov. 64 J. Bečaj Tretja skupina avtorjev (zlasti Asch ter Deutsch in Gerard) se je z normami, mnenji, stališči in prepričanji v obravnavanih klasičnih tekstih komaj kaj ukvarjala. Ti avtorji niso razložili, kako razumejo njihovo nastajanje, funkcijo in vzdrževanje, ter jih za razliko od Sherifov ter Thibauta in Kelleyja tudi niso definirali. Vsi, brez izjeme, so usmerjeni v posameznika in njegovo odzivanje na socialno okolje, nihče pa v skupino in skupinske procese. Malo verjetno se zdi, da so 'normo' in 'konformnost' sploh uporabljali kot tehnični termin. Asch, Deutsch in Gerard so od posameznika zahtevali avtonomno presojo in kritičen odnos do skupine, kar kaže na dihotomiziranost obeh elementov. Skladno s tem je posamezniku implicitno pripisana zmožnost avtonomne presoje veljavnosti posameznih mnenj, stališč in prepričanj. Ta skupina tudi dopušča možnost, da sta normativni in informacijski socialni vpliv intrapsihološki kategoriji. Razlika med navedenimi tremi skupinami avtorjev je očitna in zelo pomenljiva, če jo presojamo z vidika odnosa posameznik - socialno okolje. Sherifa sta usmerjena v socialno interakcijo enako negotovih ljudi, katere funkcija je skupinsko strukturiranje okolja, kar ne pomeni nič drugega kot skupinsko zagotavljanje varnosti posameznikom, do katere ti sami ne morejo priti. Z interindividualno dimenzijo se ukvarjata tudi Thibaut in Kelley, vendar, za razliko od Sherifov, med avtonomnimi posamezniki, ki se ravno zaradi svoje avtonomnosti lahko znajdejo v medsebojnem konfliktu. Najmočnejša tretja skupina pa je usmerjena v posameznika, se pravi na intraindividualno raven. Za to skupino lahko ugotovimo, da pripada izrazito individualistični metateoretični paradigmi. Zraven pa spadata tudi Thibaut in Kelley, saj tudi onadva izhajata iz dihotomiziranega posameznika in njegovih potreb, socialno interakcijo pa razumeta kot konflikt, ki se razrešuje s pogajanji in oblikovanjem norm. Le Sherifa imata pomembno drugačno metateoretično paradigmo, ki pa jo je težko imenovati. Gotovo je, da ni individualistična kot pri ostalih avtorjih, ni pa tudi le interakcionistična, saj bi ta oznaka lahko vsaj na prvi pogled veljala tudi za Thibauta in Kelleyja. Bistvo drugačne naravnanosti pri Sherifih ni interakcija sama po sebi, pač pa njena specifična funkcija. Ta je v nekonfliktnem skupinskem strukturiranju okolja, brez dihotomizacije posameznika in socialnega okolja. Glede na nekatere formulacije bi morda lahko sem uvrstili vsaj deloma tudi Festingerjev model skupinske uniformnosti iz leta 1950. Smo pa že omenili, da jih on sam skoraj zagotovo ni razumel na enak način, kot so bile razumljene tukaj. Zaključek Ugotovitev, da so na današnje razumevanje konformnega vedenja najbolj vplivali individualistično naravnani klasični avtorji, ki se z njim sploh niso ukvarjali, je gotovo presenetljiva. Pravzaprav lahko rečemo, da ima današnje vedenje o konformnem vedenju vse značilnosti Moscovicijevih socialnih predstav. V resnici gre za sveženj znanj, prepričanj, mnenj in stališč, ki jih imamo psihologi o tem pojavu, in dober primer mešanice reificiranega in zdravorazumskega univerzuma. Empirični podatki, ki so nam jih posredovali Asch, Sherifa, Deutsch in Gerard, so razumljeni, interpretirani in Socialne predstave psihologov o konformiranju 65 uporabljeni skupaj s prepričanji, ki s temi avtorji in njihovimi ugotovitvami nimajo nobene prave povezave. Prispeval jih je Zeitgeist zadnjih desetletij, ki časti posameznika in njegovo avtonomnost. Objektivnosti zavezana znanost je tu očitno popustila in se 'konformirala' ne le navidez, ampak pa tudi zares. Očitno je, da individualistična naravnanost iz klasičnega obdobja še vedno prevladuje, z njo pa tudi implicitna dihotomizacija posameznika in socialnega okolja, nad katero se je svoj čas pritoževal Sherif. Pri tem pa ni jasno, s katerimi empiričnimi podatki je to prepričanje utemeljeno. Zdi se, da obilica socialno psihološkega gradiva veliko bolj dokazuje visoko stopnjo posameznikove občutljivosti in odvisnosti od socialnega okolja kot pa njegovo avtonomnost in izvirno individualnost. O tem ne govorijo le tu obravnavani klasični, pač pa tudi drugi izstopajoči poskusi, kot npr. Milgramov poskus z elektrošoki ali pa Zimbardov zaporniški poskus. Prav tako človekovo odvisnost in visoko občutljivost na socialno okolje dokazujejo sodobnejše teorije, kot npr. teorije vplivanja manjšin, socialne identitete, samokategorizacije, še posebej pa Gergenov socialni konstrukcionizem (Gergen, 1999). V okviru t. i. 'main stream' socialne psihologije npr. avtorji, ki so zbrani okrog teorije socialne identitete in samokategorizacije, odklanjajo dihotomiziranje posameznika in socialnega okolja, kakršnega je poznala klasična socialna psihologija, in namesto individualistične zagovarjajo interakcionistično metateorijo (npr. Turner in Oakes, 1997; Turner in Reynolds, 2001a, 2001b). Skrajnost pa gotovo predstavljajo nekatere konstrukcionistične smeri, kjer lahko preberemo tudi trditev, da je posameznikova individualna avtonomnost enostavno fikcija, kot ugotavljata npr. Lisa Blackman in Valerie Walkerdine (2001; prim. tudi Bečaj, 2003; Burr, 1955; Gergen, 1999). Kljub tem podatkom in teorijam pa konformiranje vendarle še vedno pomeni prilagajanje drugačnega posameznika skupinski normi, pri čemer je vsaj implicitno ta posameznik začuda vedno le žrtev pritiska, nikoli pa nj egov izvajalec. To zoprno in nečastno nalogo opravlja nekakšna abstraktna večina, ki z avtonomnim posameznikom očitno nima nikakršne zveze. Tu seveda ne bomo načeli vprašanja posameznikove socialne avtonomnosti, ker tema bistveno presega namen tega pisanja. To pa ne pomeni, da to vprašanje ni pomembno. Ravno obratno, zdi se, da je za socialno psihologijo osrednjega pomena, saj gre za razumevanje odnosa med posameznikom in socialnim okoljem in brez odgovora nanj o pomembnejših socialno psiholoških pojavih enostavno ni mogoče govoriti. Problem je star in prepoznamo ga lahko v odnosu med različnimi socialno psihološkimi smermi, ki nikakor ne najdejo skupnega imenovalca. Na prelomu 19. in 20. stoletja je bila človekova socialnost razumljena bistveno drugače kot v času, v katerem so nastajali tu obravnavani teksti. Dovolj je, da se spomnimo Durkheima, Meada, Le Bona in seveda Wundtove Völkerpsychologie. To so avtorji, ki jih klasika, zaznamovana z bratoma Allport, ni priznavala. Današnje sodobnejše smeri se na nek način vračajo k bolj 'socialni' socialni psihologiji, vendar zaenkrat nič ne kaže, da bi to lahko prineslo bistveno drugačen pogled na konformno vedenje. Zdi se, da je glavna težava tudi pri teh smereh, še posebej pri konstrukcionizmu, v nepojasnjeni človekovi 66 J. Bečaj socialni motivaciji. Osrednje vprašanje, na katerega eksplicitno nihče ne odgovarja, je enostavno: je človek biološko samozadostno bitje s cepljeno socialno opremo ali pa je ta bistvenega pomena tudi za biološko preživetje? Če je res, da je človekova vedenjska oprema, brez katere ni mogoča učinkovita orientacija v okolju, socialno ustvarjena, potem utegne biti druga možnost vsaj za določene dimenzije človekovega socialnega življenja bolj točna od prve (prim. Bečaj, 1993a, 1993b, Černigoj 2002, Piaget, 1971). Iz te možnosti namreč sledi, da je človekovo vedenje socialna konstrukcija simbolne narave, ki lahko nastane le v razmeroma omejenem socialnem sistemu in katere veljavnost je določena s socialnim soglasjem. To je socialna resničnost in njeno vzdrževanje je za človekovo eksistenco potemtakem bistvenega pomena. V tej dimenziji človekovega socialnega življenja konformiranje zato nikakor ne more biti spopad med individualnim in socialnim, ker prvega brez drugega sploh ni. Ravno obratno, konformno vedenje je nujno zaradi vzdrževanja eksistenčno pomembne socialne resničnosti. Če si pomagamo s Festingerjevo terminologijo, lahko na koncu ugotovimo, da je medsebojna odvisnost v okviru socialne resničnosti v literaturi spregledana, za razumevanje konformnega vedenja pa bistvena. Ugotovili smo, da je nakazana pri Sherifih in da jo je možno izpeljati iz Festingerjevega opisa socialne resničnosti, da pa ji zgodovinski razvoj socialne psihologije ni bil naklonjen. Očitno pa je, da iz te perspektive konformiranje lahko dobi popolnoma drugačen pomen, kot smo ga navajeni. Je namreč eden od osrednjih procesov, s katerim se ohranja socialna resničnost. In če je ta bistvenega pomena tudi za človekovo biološko in ne le socialno preživetje, imamo opraviti z enim od temeljnih procesov socialnega vplivanja, ki posameznikove individualnosti ne zatira, pač pa ravno obratno, šele vzpostavlja. Očitno bo temu procesu potrebno v bodoče posvetiti precej več in tudi drugačne pozornosti, kot je je bil deležen v preteklosti. Zahvala Ko je tekst nastajal, ga je večkrat pregledal dr. Matej Černigoj in mi dal mnoge koristne pripombe, za kar se mu najlepše zahvaljujem. Literatura Asch, S. (1952). Social psychology. New York: Prentice-Hall. Asch, S. (1992). Opinions and Social Pressure. V E. Aronson (ur.), Readings about The Social Animal (6. izd., str. 13-22). New York: W. H. Freeman and Company, 1992 (ponatis iz Scientific American, 1955, 193 (5), 31-35) van Avermaet, E. (1996). Social influence in small groups. V M. Hewstone, W. Stroebe, G. M. Stephenson (ur.), Introduction to social psychology. Oxford: Blackwell Publishers. Bečaj, J. (1993a). Dvojna funkcija socialne interakcije - I. del [The twofold function of social interaction I]. Anthropos, 25 (1-2), 90-105. Bečaj, J. (1993b). Dvojna funkcija socialne interakcije - II. del [The twofold function of Socialne predstave psihologov o konformiranju 67 social interaction II]. Anthropos, 25 (3-4), 138-153. Bečaj, J. (1997). Temelji socialnega vplivanja [Foundations of social influence]. Ljubljana: Filozofska fakulteta. Bečaj, J. (2000). Solomon Asch - Muzafer in Carolyn Sherif: dve socialni psihologiji? [Solomon Asch - Muzafer in Carolyn Sherif: two social psychologies?]. Psihološka obzorja, 9 (3), 7-24. Bečaj, J. (2003). Socialni konstrukcionizem in socialna psihologija [Social constructionism and social psychology]. Psihološka obzorja, 12 (3), 43-64. Berkowitz, L. (1977). Introduzione allapsicologia sociale [An introduction to social psychology]. Milano: Franco Angeli. Blackman, L. in Walkerdine, V. (2001). Mass hysteria, critical psychology and media studies. Houndmills: Palgrave. Burr, V. (1995). An introduction to social constructionism. London: Routledge. Cernigoj, M. (2002). Struktura in dinamika socialne resničnosti z vidika odnosa med posameznikom in socialnim okoljem [Structure and dynamics of social reality from the viewpoint of the relationship between the individual and society]. Neobjavljena doktorska disertacija [Unpublished PhD dissertation]. Univerza v Ljubljani, Filozofska fakulteta. Deutsch, M. in Gerard, H. B. (1993). A study of normative and informational social influences upon individual judgement. V E. R. Aronson in A. R. Pratkanis (ur.), Social psychology, Vol. II. Aldershot: Edward Elgar Publishing Company. (ponatis iz Journal of Abnormal and Social Psychology, 1955, 51 (3), 629-636) Festinger, L. (1993a). Informal social communication, V E. R. Aronson in A. R. Pratkins (ur.), Social psychology, Vol. III. Aldershot: Edward Elgar Publishing Company. (ponatis iz Psychological Review, 1950, 57 (5), 271-282) Festinger, L. (1993b). A theory of social comparison processes. V E. R. Aronson in A. R. Pratkins (ur.), Social psychology, Vol. II. Aldershot: Edward Elgar Publishing Company. (ponatis iz Human Relations, 1954, 7 (2), str. 117-140) Friend, R., Rafferty, Y. in Bramel, D. (1990). A puzzling misinterpretation of the Asch 'conformity' study. European Journal of Social Psychology, 20, 29-44. Gergen, J. K. (1999). An invitation to social constructionism. London: Sage. Hollander, P. E. (1971). Principles and methods of social psychology (2. izd.). Oxford: Oxford University Press. Howit, D., Billig, M., Cramer, D., Edwards, D., Kniveton, B., Potter, J. in Radley, A. (1989). Social psychology, Conflicts and Continuities. Philadelphia: Open University Press. Jahoda, M. (1965). Conformity and Independence: A Psychological Analysis, V E. E. Sampson (ur.), Approaches, Contexts, and Problems of Social Psychology. A Book of Readings. Engelwood Cliffs, NJ: Prentice Hall. (ponatis iz Human Relations, 1959, 12, 99-120) Jones, E. (1985). Major developments in social psychology during the past five decades. V G. Lindzey in E. Aronson (ur.), Handbook ofsocial psychology, Vol 1 (3. izd.). New York: Random House. Jones, E. in Gerard, H. (1967). Foundations ofsocial psychology. New York: John Wiley & Sons. Kelley, H. H. (1952). The two functions of reference groups. V G. E. Swanson, T. M. Newcomb in E. L. Harley (ur.), Readings in social psychology (2. izd.) (str. 410-414). 68 J. Bečaj New York: Holt. Kelman, H. C. (1964). Processes of opinion change. V E. E. Sampson (ur.), Contexts, and Problems of Social Psychology (str. 263-277). Englewood Cliffs: Prentice Hall. Korn, H. J. (1997). Illusions of reality. A history of deception in social psychology. New York: State University of New York Press. Krech, D., Crutchfield, R. in Ballachey, E. (1972). Pojedinac u drustvu [Individual in society]. Beograd: Zavod za udzbenike i nastavna sredstva Srbije. Manstead, A. in Hewstone, M. (ur.) (1995). The Blackwell encyclopedia of social psychology. Oxford: Blackwell. Martin, R. in Hewstone, M. (2001). Conformity and independence in groups: majorities and minorities. V M. A. Hogg in S. Tindale (ur.), Group processes, Blackwell Handbook of Social Psychology (str. 209-234). Oxford: Blackwell. Milgram, S. (1985). DasMilgram-Experiment. Reinbek: Rowohlt. Moscovici, S. in Faucheux, C. (1972). Social influence, conformity bias, and the study of active minorities. V L. Berkowitz (ur.), Advances in Experimental Social Psychology, Vol. 6 (str. 149 - 202). London: Academic Press. Moscovici, S. in Ricateau, P. (1975). Konformität, Minderheit und sozialer Einfluss. V S. Moscovici (ur.), Forschungsgebiete der Sozialpsychologie 1 (str. 155-213). Frankfurt: Fischer Athenäum Taschenbücher. Piaget, J. (1971). Biology and knowledge, An essay on the relations between organic regulations and cognitive processes. Chicago: The University of Chichago Press. Sherif, M. (1967). Social interaction, process and products. Chicago: Aldine Publishing Company. Sherif, M. in Sherif, C. (1956). An Outline of social psychology (rev. izd.). New York: Harper & Row. Sherif, M. in Sherif, C. (1969). Social Psychology. New York: Harper & Row. Thibaut, J. in Kelley, H. (1959). The social psychology ofgroups. New York: John Wiley & Sons. Turner, J. C. (1991). Social influence. Buckingham: Open University Press. Turner, J. in Oakes, P. (1997). The socially structured mind. V C. McGarty in S. A. Haslam (ur.), The message of social psychology (str. 355-373). Oxford: Blackwell Publishers. Turner, J. in Reynolds, K. (2001). The social identity perspective in intergroup relations: theories, themes, and controversies. V R. Brown in S. Gaertner (ur.), Blackwell handbook of social psychology: intergroup processes (str. 133-152). Oxford: Blackwell Publishers. Prispelo/Received: 10.10.2005 Sprejeto/Accepted: 30.1.2006 Psihološka obzorja / Horizons of Psychology, 14, 3, 69-88 (2005) © Društvo psihologov Slovenije 2005, ISSN 1318-187 Znanstveni teoretsko-pregledni prispevek Standardi znanja v edukaciji" Darko Zupanc* Državni izpitni center, Ljubljana Povzetek: Sodobni edukacijski sistemi temeljijo na standardih znanja. Izobraževalni sistemi po svetu so različni, imajo različno tradicijo in možna so različna poimenovanja podobnih stvari. Standardi že v fiziki pomenijo nekaj empiričnega - merljivega in takšno vlogo morajo imeti tudi v edukaciji. Standardi znanja se lahko razdelijo na vsebinske oz. kurikularne standarde in na standarde dosežkov oz. dejavnosti, bistvo standardov pa je v slednjih. Opredelitev učnih ciljev oz. vsebinskih standardov je šele prvi korak v postopku merjenja znanja. Namesto izraza vsebinski standardi bi lahko uporabljali tradicionalni pojem - učni cilji. Ce naj izobraževalni sistem temelji na standardih, je pri posameznih predmetih na različnih stopnjah šolanja potrebno (šele) priti do standardov dosežkov. Ključne besede: standardi dosežkov, standardi dejavnosti, vsebinski standardi, kurikularni standardi, znanje, preverjanje, ocenjevanje, merske lestvice Standards in education Darko Zupanc National Examination Centre, Ljubljana, Slovenia Abstract: Modern educational systems are based on standards. Systems in countries all over the world differ and have different tradition, so different terms are used for similar concepts. In education, standards should have a similar role as in physics, where they are empirical and measurable. Two types of standards can be defined: content or curriculum standards and performance standards, with the latter being essential. Setting educational goals or content standards is the first step in the construction of knowledge measurement procedures. In Slovenia, the traditional term 'performance objective' or 'instructional objective' can be used instead of the term 'content standards'. For each school subject on different levels in Slovenian educational system, performance standards have to be set in the future, if educational system is to be based on standards. Key words: performance standards, content standards, curriculum standards, knowledge, assessment, grading, levels of measurement CC = 3530 # Stališča, zapisana v prispevku, izkazujejo avtorjev pogled na vprašanja, povezana s preverjanjem znanja, in ne odražajo stališč institucije, v kateri je avtor zaposlen. * Naslov / address: mag. Darko Zupanc, Državni izpitni center, Ob železnici 16, tel.: 01 5484 616, email: darko.zupanc@guest.arnes.si 70 D. Zupanc Glass (1978) je že skoraj pred tridesetimi leti zapisal, da je problem vzpostavitve standardov temeljni problem izobraževanja, ki je še danes nerešen, kot je bil že pred 20 leti. Torej se o problemu standardov piše in govori že najmanj pol stoletja. Britanska akademija je leta 1998 organizirala poseben simpozij na temo standardov v edukaciji. Med povabljenimi uglednimi akademiki in raziskovalci nihče ni ponudil enostavne rešitve problema definicije standardov znanja in spretnosti, merjenja le-teh, niti recepta za uradno šolsko politiko (Goldstein in Heath, 2000). Cannell (1987) je prepričljivo vzbudil pozornost javnosti v ZDA, kar je znano kot efekt Lake Wobegon (Gipps, 2000; Koretz, 1988), ko je ugotovil, da so pravzaprav vse države v ZDA in večina okrožij objavljali, da njihovi učenci dosegajo nadpovprečne rezultate glede na nacionalne normative. Na osnovi svojih podatkovnih preglednic je zaključil, da učencem, staršem, šolskemu sistemu, zakonodajalcem in sredstvom javnega obveščanja prikazujejo napihnjena in zavajajoča poročila o doseženih nivojih pri standardiziranih, nacionalno normiranih testih dosežkov. Standardi znanja so bili osrednja iniciativa v izobraževanju v ZDA že v Clintonovi administraciji. Tudi ključna oblika aktualne reforme vzgoje in izobraževanja v ZDA je prizadevanje za izdelavo standardov (Goals 2000: Educate America Act). S tem se na takšen ali drugačen način ukvarjajo tudi v drugih državah. Večina držav centralne in vzhodne Evrope je imela v preteklosti zapisane t.i. izobraževalne standarde; šlo je za naslove in podnaslove vsebinskih področij in število ur, ko naj bi to obravnavali, redko pa je bilo napisano, kakšne dosežke naj bi učenci dosegli (West in Crighton, 1999). V Sloveniji se pojem 'standard znanja' uporablja zelo različno (Zupanc, 2005). V veljavnih katalogih znanja za srednje strokovne šole 'standardov znanja' pri strokovno-teoretičnih predmetih sploh (še) ni. V učnih načrtih za predmete v gimnaziji obstojajo zapisi o standardih znanja, med različnimi predmeti pa je očitno razumevanje le-tega zelo različno, celo znotraj posameznega predmeta je uporaba tega termina nekonsistentna. V učnih načrtih za osnovno šolo je besednjak o standardih bogatejši in celo šolski predpisi govorijo o njih. Razen redkih izjem termin 'standard znanja' nadomešča ali celo podvaja termin 'učni cilj' (Zupanc, 2005). Ce termin 'standard znanja' v izobraževanju v Sloveniji predstavlja novost, je za dobro umestitev le-tega potrebno pogledati vire. Pregledati je potrebno zapise v državah in vzgojno-izobraževalnih sistemih, kjer se ta izraz že dolgo uporablja. Gre predvsem za področja z angleško govorečim prebivalstvom: ZDA, Anglija, Kanada in Avstralija. Po drugi strani pa je preverjanje znanja področje merjenja v psihologiji in o standardih se eksaktno govori pri merjenjih v naravoslovju. V različnih šolskih sistemih zaradi lastne zgodovine in tradicije podobne stvari različno poimenujejo. Tako kot je bilo v zgodovini znanosti, tehnike in nenazadnje trgovine in gospodarstva za pretok blaga, ljudi in idej pomembno natančno definiranje in prevajanje pojmov, je to pomembno tudi pri edukacijskih sistemih. Poimenovanje določenega izraza samo po sebi ni pomembno, pomembno je, da je razumevanje vsaj med strokovnjaki enako. Ce različni strokovnjaki določen temeljni pojem razumejo in interpretirajo različno, je to slabo in povzroča nejasnosti. Standardi znanja v edukaciji 71 Ob analizi tujih virov lahko ugotovimo, da 'standardi znanja' v edukaciji niso enovit pojem; ravno nasprotno, ob široki uporabi, razumevanju in interpretaciji tega pojma je nujno postaviti razmejitev na t. i. vsebinske ali kurikularne standarde znanja in na standarde dejavnosti ali dosežkov. Tudi postopki pri opredelitvi in postavitvi enih in drugih standardov znanja so različni. Metoda Pojem 'standard znanja' v edukaciji ni tako jasno opredeljen, kot je pri uporabi v naravoslovju. V Sloveniji je to najbrž še bolj izrazito, ker je uporaba standardov znanja v edukaciji terminologija, kije včasih niso uporabljali. Vendar tudi v izobraževalnih sistemih v drugih državah ti pojmi niso enoznačni. Namen prispevka je s primerjavo tujih in domačih virov določiti bolj enotno oz. manj dvoumno poimenovanje podobnih stvari s sorodnimi izrazi. Za dobro opredelitev standardov znanja v edukaciji je potrebna primerna umestitev le-teh v širši sklop psihološkega testiranja, ki se ukvarja z merjenjem znanja učencev. Ker imajo standardi korenine v naravoslovju, je osnova razumevanja proučitev in uporaba pojma(ov) v temeljni naravoslovni znanosti - fiziki - in preko razumevanja pojma(ov) na tem področju smiselna transformacija na področje edukacije. Iz zgledov z osnovnimi fizikalnimi količinami in merj enj em le-teh lahko z analogij o poskušamo opredeliti učne cilje oz. kurikularne (vsebinske) standarde in kot osnovo za merjenje znanja in spretnosti uporabimo standarde dosežka(ov). Predstavljena študija je zasnovana na deskriptivni metodi. Za tehniko in instrumentarij je bila uporabljena analiza tuje literature z iskanjem podobnosti in razlik v pojmovanju in konceptualnih pristopov pri standardih znanja oz. vsebinsko sorodnih pojmih. Ob preučevanju fizikalnih pristopov v temeljni naravoslovni znanosti, poznavanju osnov merj enja v psihologiji in pregledu sistemov edukacij e v različnih državah prispevek s primerjanjem ugotavlja podobnosti in analogije. V prispevku so poleg slovenskih izkušenj obravnavani še sistemi edukacije v ZDA, Angliji, Kanadi, Avstraliji in mednarodna raziskava znanja matematike in naravoslovja TIMSS 2003. Opredelitev pojma 'standardi znanja' V slovarjih se standard1 pojavlja kot norma, pravilo, merilo; enotna mera ali teža; vzorec, vzor, splošno veljaven tip; smernica ipd. V posebnem slovarju s področja preverjanja znanja v edukaciji so standardi navedeni kot dogovorjena vrednotenja, ki 1 Pojem 'standard' se v angleških zapisih prvič pojavi leta 1138, v povezavi z bitko 'Battle of the Standard', med Angleži in Skoti, 22. avgusta 1138 (Aldrich, 2000). 'Standard' v angleškem jeziku pomeni prapor, posebno zastavo, ki se ji izkazuje lojalnost; kraljevska zastava ('the royal standard') plapola, ko je kraljica v rezidenci. Figurativno 'standard' predstavlja prominentnega vodjo v določeni stvari. (Hornby, 1975). 72 D. Zupanc jih uporablj amo pri merj enju kakovosti dej avnosti učenca, metod poučevanj a ali kurikula (Glossary of Educational Assessment, 2003). Standardi so ključni pojem sodobne diskusije v edukaciji in če raziščemo kontekst, v katerem se pojem uporablja, ugotovimo, da je bistvo predvsem kvantitativno (Bartholomew, 2000). Ocenjevanje znanja v edukaciji je merjenje (Grgin, 1994). Vključuje vse nujne komponente, ki so pri vsakem merjenju. Vsako merjenje predpostavlja: predmet (vsebino, pomen) ali tisto, kar merimo, instrument, s katerim merimo, in tehniko merjenja. Merilo umerimo; navadno za to uporabimo natančnejše merilo. Tudi tega umerimo, navadno s še natančnejšim merilom. Ta veriga se konča pri dogovorjeni enoti, pri njeni izvedbi, etalonu ali standardu. Izboljšave v edukaciji se morajo začeti z jasnimi pojmi, kaj se od učencev pričakuje, da se (na)učijo. To izhodišče je osnova za izboljšanje ameriškega sistema izobraževanja (Linn in Gronlund, 2000). Navedbe (zapisi) določajo, kaj naj se poučuje in kaj naj se učenci (na)učijo. Standardi določajo pričakovane cilje za učence, vendar ne opredeljujejo določenega učnega načrta, učbenika ali učnega pristopa. Lahko je veliko načinov, kako doseči cilje. Busheva zakonodaja v ZDA iz leta 2001, znana pod geslom 'No Child Left Behind'' (NCLB), zahteva od vseh držav v ZDA, da imajo teste znanja, ki temeljijo na standardih, in da so vsi učenci do dvanajstega leta šolanja testirani (Morgan in Perie, 2004). Pooblastilo o testiranju na osnovi standardov v več razredih in iz različnih vsebinskih področij ter določeno poročanje o dosežkih na več ravneh povečuje potrebo po trdno postavljenih procesih postavitve standardov, ki se jih lahko tudi uspešno zagovarja. Standardi znanja so povezani s kriterijsko uporabo oz. interpretacijo preverjanja znanja (Nacionalna komisija za uvajanje in spremljanje novosti in programov v vzgoji in izobraževanju, 2000; American Educational Research Association, American Psychological Association in National Council on Measurement in Education, 1999), kjer je izbran kriterij tista kritična točka, ki razdeli preizkušance na one, ki so dosegli, in na tiste, ki niso dosegli določenih standardov znanja. Natančna opredelitev v učnem načrtu zapisanih operativnih ciljev je pri tem nujna. Za nacionalno oz. državno določene učne cilje se uporablja tudi izraz (vsebinski) standardi (Medveš in Svetlik, 2002; American Educational Research Association, American Psychological Association in National Council on Measurement in Education, 1999). V strokovni literaturi s področja preverjanja v edukaciji (Cresswell, 2000; Linn in Gronlund, 2000; Morgan in Perie, 2004; International Center for Technology in Learning, 2004); American Educational Research Association, American Psychological Association in National Council on Measurement in Education, 1999; Taylor, 2002) se govori o dveh vrstah standardov, vsebinskih standardih in standardih dejavnosti oz. dosežkov. Vsebinski standardi navajajo, kaj je pomembno, da učenci znajo oz. naredijo, kakšne vrste veščin in katero znanje naj bi bili učenci sposobni prikazati. Standardi dejavnosti oz. dosežkov pa so vezani na empirično izmerjene vrednosti znanja in spretnosti. Standardi dosežkov kvantificirajo vsebinske standarde; koliko in v kakšni meri mora učenec znati in narediti glede na vsebinske standarde, tj. koliko in v kakšni meri učenec dosega vsebinske standarde, da se ga lahko prišteva med poznavalca oz. med tiste, ki so standard dosegli. Standardi znanja v edukaciji 73 Vsebinski standardi (se) niso standardi dosežka(ov) Svetovna banka za zgled vzgoje in izobraževanja, ki temelji na standardih, ponuja primere iz Avstralije, Kanade in ZDA (Standards & testing, 2001). V ameriški (Linn in Gronlund, 2000) in britanski (Cresswell, 2000) strokovni literaturi je nesporno, da morajo biti učinkoviti standardi postavljeni tako, da opredelijo dvoje: - kaj se mora učenec (na)učiti oz. kaj se bo preverjalo in - določiti, kdaj je standard dosežen, oz. določiti nivo dosežkov, ki so primerljivi s tistimi, ki so potrebni za vsako oceno pri drugih izpitih iz iste družine. Za razumevanje izpitnih standardov je potrebno upoštevati oboje. Oba namena - opredelitev, kaj se mora učenec (na)učiti, in določitev, kdaj je standard dosežen -sta v povezavi z dvema vrstama standardov, ki jih običajno ločimo na vsebinske standarde in standarde dosežkov oz. dejavnosti. Vsebinski standardi določajo »kaj«, medtem ko standardi dejavnosti določajo »kako dobro«. Vsebinski standardi so javne navedbe (izjave, angl. statements), ki določajo, kaj naj bi učenec znal in bil sposoben narediti pri določeni vsebini ali šolskem predmetnem področju na določeni stopnji izobraževanja in usposabljanja (npr. pri branju v 4. razredu, pri matematiki v 8. razredu). Standardi dejavnosti (angl. performance) so odvisni od vsebinskih standardov, vezani so na empirično izvedena merjenja znanja in dodajo specifikacijo nivoja dejavnosti, ki jo pričakujemo od učencev v povezavi z vsebinskimi standardi. Z drugimi besedami, odgovarjajo na vprašanje: »Kako dobro je dovolj dobro?« Nabor vsebinskih standardov razvijemo z namenom obsežnega opisa učenčeve dejavnosti z razmejitvijo vsebin in splošnih veščin, ki jih merimo. Vsebinskim standardom sledi razvoj opisov in empirično ugotovljenih (izmerjenih) ciljev ali nivojev dosežkov. Takšni standardi dosežkov imajo namen definirati potrebna znanja in veščine za vse različne kategorije znanja ali sposobnosti. (American Educational Research Association, American Psychological Association in National Council on Measurement in Education, 1999) Pavešic (2005) v prevodu ameriškega članka o standardih razpravlja, da brez dobro izbranih vzorčnih nalog celo skrbno izdelani standardi ne zmorejo natančno posredovati različnih spoznavnih ravni, potrebnih za doseganje ustreznega matematičnega znanja. Samo besede, četudi jasne in pravilne, ne morejo v celoti opisati matematičnega razumevanja. Na primer, »reši sistem dveh linearnih enačb z dvema neznankama« je povsem jasna naloga, vendar ne pove nič o zahtevnosti, ki izvira iz tipa neznank ali koeficientov. Dobro premišljeni problemi lahko posredujejo to značilno enovitost matematike na način, ki ga naštevanje in opisovanje standardov nikoli ne more. Matematiki lahko najbolje pomagajo gibanju za standardizacijo znanja v preduniverzitetni matematiki s ponujanjem problemov - problemov, ki so izzivalni, ki presenečajo, ki širijo obzorja - torej z nadgradnjo opisov učnih ciljev oz. vsebinskih standardov h konkretnim empiričnim standardom dejavnosti (Pavešic, 2005). 74 D. Zupanc Udeleženci mednarodnega posveta v okviru projekta JONAS (JOint National ASsessment project) so ugotovili, da obstajajo različna pojmovanja izrazov »cilj« in »standard« (National Examinations and their meaning for Quality Assessment, 2001, str. 5). Dogovorili so se, da bodo pojem »standard« uporabljali le za vrednotenje rezultatov preverjanja znanja. Vse vhodne »standarde« (angl. input standards), ki se v procesu edukacije poj avlj aj o pred konkretnim preverj anj em, naj bi poimenovali »izpitne cilje« (angl. examination objectives). Ce že je uporabljen izraz »vsebinski standardi«, pomeni le-ta široko dogovorjena pričakovanja, kaj naj bi učenec znal, razumel in bil sposoben narediti za določeno oceno pri določenem predmetu (International Center for Technology in Learning, 2004). Nekateri avtorji menijo, da ni nujno, da učni cilji vključujejo tudi standarde izvedbe oz. rezultata za zadostno oceno (Oosterhof, 2001). Drugi (npr. Mager, 1984) pa zagovarjajo, da bi morali vsi učni cilji vsebovati tudi standard izvedbe oz. definirano uspešnost izvedbe. Oosterhof (2001) meni, da to ni vedno možno niti ni nujno. Preverjanje znanja lahko služi različnim namenom: certificiranju dosežkov, selekciji ali nadzoru doseganja izobraževalnih standardov (The Nature Of Public Examinations, 2002). Nadzor nad doseganjem standardov v vzgoji in izobraževanju najbolje dosežemo z nacionalnimi preverjanji (angl. national assessment). Gre za sistematično merjenje tipičnega nivoja dosežkov učencev oz. standarde dosežkov na nacionalni ravni. Pri nacionalnem preverjanju ugotavljamo doseganje nacionalnih vzgojno-izobraževalnih standardov. Običajno ga izvajamo na reprezentativnem vzorcu učencev (Glossary of Educational Assessment, 2003). Pri opredeljevanju ciljev na nacionalni ravni je potrebno imeti v mislih dvoje (National Educational Goals Panel, 1991): - vrsto dokaza oz. evidence (npr. esej, matematični dokaz, znanstveni eksperiment, projekt, izpit ali kombinacijo naštetih), ki je potrebna za prikaz doseganja vsebinskega standarda, in - kakovost opravljene dejavnosti učenca, ki bo pri presojanju sprejemljiva (s čim si učenec prisluži zadostno, dobro ali odlično oceno). Standardi dosežkov v drugih državah in v Sloveniji Sistem nacionalnega preverjanja znanja v šolstvu ZDA (NAEP - National Assessment of Educational Progress) je zelo znan in velja kot primer dobrega poročanja o rezultatih. V bogati dokumentaciji je podrobno zapisano, kaj se pri NAEP preverja pri določenem predmetu - t. i. vsebinski standardi. Z umerjenimi preizkusi znanja, ki jih dograjujejo in izvajajo že več kot trideset let, imajo dobro določene standarde dosežkov za posamezno starostno skupino na treh stopnjah oz. štirih, če se šteje še neuspešne (NCES - National Center for Education Statistics, 2004). S t. i. ravnmi dosežkov ('basic', 'proficient', 'advanced') so podrobno opisani standardi dosežkov, ki opredeljujejo matematično znanje učencev. Standardi znanja v edukaciji 75 V Angliji in Walesu so v nacionalnem kurikulu zapisani standardi znanj a z ravnmi zahtevnosti, ki jih vsako leto preverjajo z nacionalnimi preizkusi v različnih starostnih obdobjih ('Key Stage 1' pri 7 letih, 'Key Stage 2' pri 11 letih, 'Key Stage 3' pri 14 letih). Za celotno obdobje obveznega šolanja so ravni znanja - standardi dosežkov -opredeljeni na 9 oz. 10-stopenjski lestvici (Statistics of Education, 2001). V Kanadi izvajajo nacionalno preverjanje (SAIP - School Achievement Indicators Program) pri 13- in 16-letnikih (Council of Ministers of Education of Canada, 1996). Dosežki v znanju - standardi dosežkov - s posameznega predmetnega področja so razvrščeni na pet ravni, ki predstavljajo kontinuum znanja in spretnosti, ki jih dosegajo učenci v osnovni in srednji šoli (Council of Ministers of Education of Canada, 2002). V Avstraliji so postavili nacionalne profile ravni znanja za obdobje obveznega šolanja učencev. Preverjanja izvajajo v 3., 5. in 7. letu šolanja. Z zgodnjim preverjanjem znanja si pridobijo informacije, ki so potrebne za ukrepanje, še posebej pri učencih, ki ne dosegajo minimalno potrebnih standardov znanja. Merijo napredek v znanju glede na nacionalne profile ravni in poročajo o dosežkih (Ministerial Council on Education, Employment Training and Youth Affairs, 2003). Pri raziskovanju dosežkov učencev pri posameznem predmetu v mednarodnih raziskavah (npr. TIMSS) v poglobljenih analizah proučujejo in ločujejo načrtovani kurikulum (angl. intended curriculum) in izvedbeni kurikulum (angl. implemented curriculum) od doseženega kurikuluma (Mullis, Martin, Gonzales in Chrostowski, 2004; Straus, 2005). Pri tem že izrazi poudarjajo, da načrtovane vsebine in učni cilji pri določenem predmetu v praksi še ne pomenijo, da se vse to pri poučevanju tudi izvaja. Kaj od načrtovanega in s strani učitelja izvedenega pa se učenci naučijo, pa se brez preverjanja znanja in spretnosti ne more ugotoviti. V raziskavi o znanju matematike in naravoslovja TIMSS so raziskovalci kot enega od možnih načinov uporabili opisovanje znanja na štirih mejnikih, tako da so učence po znanju razdelili v pet skupin (Mullis, Martin, Gonzales, Chrostowski, 2004). Po večletnih pripravah in izvedbi preverjanja znanja v 51 državah in deželah po svetu so s kompleksno obdelavo rezultatov preverjanja znanja prišli do standardov - kaj učenci znajo in so sposobni narediti. Poleg opisov dosežkov znanja na vsaki od štirih ravni v TIMSS-u empirično prikažejo primere konkretnih nalog iz preverjanja, ki jih učenci na določeni ravni dosežkov tipično rešijo pravilno oz. jih tisti, ki ne dosegajo določenih standardov dosežkov, ne dosežejo. Gre za odgovore na vprašanja, kako dobro je dovolj dobro za doseganje določenega mejnika znanja. To razvijejo z metodo sidrnih nalog na različnih točkah zahtevnosti v celotnem območju merjenja znanja za vsak predmet in vsako starostno skupino posebej. Preko mednarodne raziskave množica držav pride do standardov dosežkov za učne cilje, ki jih takšna raziskava preverja. TIMSS je preverjal več učnih ciljev matematike in naravoslovja za učence po štirih in osmih letih šolanja. Slovenija se je ob prenovi vzgoje in izobraževanja zavezala, da bo svoj sistem in spremembe v njem vrednotila. V Izhodiščih za evalvacijo kurikularne prenove vzgoje in izobraževanja v Republiki Sloveniji (1999) je na prvem mestu med problematiko, na 76 D. Zupanc katero se bodo na vsebinskem področju znanja vezale evalvacijske študije, navedena mednarodna primerljivost standardov znanja. Slovenija se je vključila v raziskavo TIMSS in je s tem pridobila bogato zbirko informacij o doseženih standardih za matematiko in naravoslovje v dveh starostnih obdobjih učencev v osnovni šoli. Poleg tega so zbrani podatki o dosežkih v znanju matematike in slovenščine pri nacionalnem preverjanju znanja (NPZ). Dosežki v znanju za t. i. tretje predmete pri NPZ za obdelavo v smeri standardov dosežkov niso bili uporabni, ker jih niso pisali vsi učenci oz. primeren vzorec učencev osnovne šole. Pri skupinskem preverjanju znanja ob koncu osemletne osnovne šole se je opravljalo preverjanje iz matematike in slovenščine, pa vendar v ta ocenjevanja niso bili vključeni vsi učenci oz. dogovorjen vzorec celotne populacije. Podobno velja za srednješolsko izobraževanje: rezultati pri slovenščini kot obveznem predmetu na splošni in poklicni maturi bi se lahko uporabili za obdelave, ki bi pripeljale do standardnih dosežkov, pri splošni maturi pa velja enako tudi za matematiko in podobno za prvi tuj jezik. Pri poklicni maturi pri tretjem predmetu kandidati izbirajo med tujim jezikom in matematiko. Pri vseh drugih predmetih splošne mature po opravljenem preverjanju ni nikakršnih podatkov o mejnem, tipičnem ali povprečnem dosežku in znanju slovenskega srednješolca. V skladu s teorijo o postavljanju standardov in ob poudarku, da pojem standard pomeni merljiv standard dejavnosti oz. dosežka (angl. performance standard), v Sloveniji ni postavljenih nacionalnih standardov znanja. Ne samo, da v Sloveniji ne zbiramo podatkov v smeri, da bi lahko prišli do nacionalnih standardov dosežkov, ampak je bilo pri analizi učnih načrtov in katalogov znanja za osnovne in srednje šole ugotovljeno, da prihaja tudi do konceptualne zmede pri razumevanju pojma 'standard znanja' (Zupanc, 2005). Zmotno je mišljenje, da tisto, kar je o standardih zapisano in sprejeto z učnimi načrti in katalogi znanj, že uvršča Slovenijo med izobraževalne sisteme, kjer imamo standarde dosežkov v izobraževanju določene in lahko doseženo znanje posamezne generacije učencev ali dosežke v znanju in spretnostih posameznega učenca primerjamo z opredeljenimi nacionalnimi standardi dosežkov. Sistem tudi ni zastavljen tako, da bi lahko doseganje standardov znanja spremljali in vrednotili longitudinalno, med leti. Države gredo skozi procese, ki spreminjajo razmere: liberalizacijo šolske politike in predpisov, kurikula, učbenikov in izobraževanja učiteljev ter usmerjanje k bolj centraliziranemu sistemu eksternega preverjanja z namenom najprej vzpostaviti in nato zaščititi nacionalne standarde (West in Crighton, 1999). Razvoj in uporaba nacionalnih standardov pri preverjanjih ob zaključkih šolanja neizogibno vodi do vzpostavitve nacionalnega ali osrednjega organa za nadzor nad standardi in priznavanjem (Crighton, 1993). Golo dejstvo je, da 'decentralizirani standardi' ne obsojajo, to je pojmovno protislovje. Določena stopnja nadzora in kontrole je neizogibna, če želimo zagotoviti kakovost. Standardi znanja v edukaciji 77 Opredelitev učnih ciljev ('vsebinskih standardov') je (šele) prvi korak v postopku merjenja znanja Pri merjenju v družboslovju, psihologiji in edukaciji gre za gradnjo teoretičnih pojmov, konceptov, modelov tega, kar želimo meriti; kar se prepleta z izkustvom, opazovanjem in beleženjem. Empirična faza vpliva nazaj na potrditev, dopolnitev ali spremembe v konceptih in teoretičnih modelih. Med teoretičnim pojmom (konceptom), ki ga želimo meriti, in merskim postopkom (instrumentom) mora biti ustrezna usklaj enost (Ferligoj, Leskošek in Kogovšek, 1995). Merjenje je proces, ki se začne z opredelitvijo teoretičnega pojma in nadaljuje z razvojem merskega postopka, s katerim je mogoče proučevani pojem operacionalizirati. Natančno je potrebno opredeliti predmet merjenja, to je konceptualizirati teoretični pojem, na drugi strani pa določiti merske metode, tehnike in postopke, s katerimi se bo mogoče temu teoretičnemu pojmu najlažje empirično približati (Bucik, 1997). V prvem koraku se z razjasnitvijo teoretičnega pojma (konceptualizacijo) opravi predvsem pregled različnih definicij pojma in izbor najustreznejše, če ni ustrezne definicije, pa izdelava le-te ter razgradnja pojma z določitvijo razsežnosti teoretičnega pojma (dimenzioniranjem) (Ferligoj, Leskošek in Kogovšek, 1995). V naslednjem koraku sledi operacionalizacija, kjer se za teoretične spremenljivke opredeli specifične operacije, merske instrumente ali postopke. Operacionalizacija povezuje teorijo z empiričnim merjenjem, z realnostjo, ki jo lahko opazujemo. Naslednji korak je izvajanje konkretnega merjenja, ko se dobi izmerjene spremenljivke. Sledijo analize empirično dobljenih meritev, popravki, razreševanje problemov z merskimi napakami, zanesljivostjo in veljavnostjo merjenja idr. Ko se v edukaciji za učne vsebine pri vsakem predmetu razmišlja o preverjanju znanja in spretnosti, tj. o merjenju, je tudi potrebno prehoditi vse faze. Z natančno opredelitvijo učnih ciljev oz. vsebinskih standardov (»kaj«) je postavljen šele teoretični konstrukt - dimenzioniranje oz. razsežnost pojma znanja in spretnosti. Samo z zapisi, kaj naj bi učenec znal in bil sposoben narediti, v učnih načrtih in katalogih znanj, brez konkretnih nalog za preverjanje, postopkov in metod, ni opravljen niti drugi korak -operacionalizacija, da bi se preverjanje znanja obravnavalo kot merjenje. Od tu naprej je za postavitev standardov dosežkov (standardov znanja) še dolga pot, kjer se empiričnemu delu, tj. preverjanju znanja kandidatov s konkretnimi nalogami, ne da izogniti. Nunnally in Bernstein (1994) merjenje opredelita s pravili pri določanju simbolov objektom s pripisovanjem številčnih vrednosti za določene lastnosti (lestvičenje, angl. scaling) ali z opredelitvijo, če se objekti razvrščajo v isto ali različne kategorije glede na določeno lastnost (razvrščanje, angl. classification). Pri tem je za merjenje lastnosti (angl. attributes) pomembno, da imajo objekti določene značilnosti (angl. features). Meri se lastnosti pri objektih, tj. osebah, ne pa oseb. Različne osebe morajo za merjenje določene lastnosti imeti različne značilnosti, da se le-te lahko razvrsti ali oštevilči v določeni merski lestvici. 78 D. Zupanc Merske lestvice (nominalno, ordinalno, intervalno in razmernostno) lahko v zapisanem vrstnem redu razumemo nivojsko (Nunnally in Bernstein, 1994). Z izmerjenimi vrednostmi v lestvici, ki je uvrščena na višji merski nivo, so dovoljene zahtevnejše temeljne operacije (primerjanje, razvrščanje po velikosti, računanje razlik, razmerij ipd.), pretvarjanja in statistike. Če obravnavamo fenomen, ki ga lahko opisujemo z nominalno lestvico, gre samo za poimenovanje stvari, dogodkov ali pojmov in klasifikacijo le-teh na osnovi nekih lastnosti. Ne moremo opredeljevati, kaj je večje ali manjše, boljše ali slabše. Lestvica, ki omogoča vsaj rangiranje (večje - manjše, boljše - slabše ipd.), razlike med rangi pa niso določene, je ordinalna lestvica. Sele intervalna lestvica omogoča izražanje velikosti in enakosti intervalov ter računanje razlik med vrednostmi. V edukaciji poskušamo meriti znanje in spretnosti učencev oz. doseganje opredeljenih učnih ciljev. Če naj bo preverjanje znanja merjenje, se je potrebno zavedati, da je nujno potrebno različne dosežke v znanju učencev razlikovati in jih enoznačno razvrstiti v določene kategorije znanja (standardne dosežke) ali določiti številčne vrednosti glede na doseženo znanje. V kateri od naštetih štirih merskih lestvic bi lahko merili znanje? Opisane učne cilje v učnih načrtih in katalogih znanj, pa četudi jih imenujemo (vsebinski) standardi in jih morda celo opredelimo za manj in bolj zahtevne, minimalne, temeljne, višje ipd., brez empiričnega merjenja znanja težko prikazujemo v merski lestvici, ki bi bila višje kot nominalna. Preverjanje znanja učencev naj bi potekalo v skladu z zapisanimi cilji (standardi) v učnih načrtih. Znanje geografije se pri učencu ob koncu osnovne šole preverja tako, da na primer »s pomočjo ustrezne karte opredeli lego Slovenije«; ali da »ovrednoti lego Slovenije z vidika odprtosti in prehodnosti v prometnem in gospodarskem smislu«; ali da »opiše lego Slovenije na stičišču Alp, Dinarskega gorstva, Panonske kotline in Jadranskega morja« (Ministrstvo za šolstvo in šport, 1998a). Pri slovenščini »učenec po poslušanju dramskega besedila z imenovanjem prvin zvočne opreme zvočnega posnetka pove, kako je to doživel« ali »po ogledu in branju prikaže doživljanje dramskega besedila, kar pokaže tako, da pisno primerja dramsko besedilo in uprizoritev« (Ministrstvo za šolstvo in šport, 1998b). Učitelji na osnovi množice takšnih zapisov v učnih načrtih lahko večrazsežnostni pojem - znanje neke učne snovi - dimenzionirajo in pristopijo k operacionalizaciji, tj. pripravijo naloge in načine preverj anj a. Ko učenci pri opravlj enem preverj anju prikažej o različne konkretne dosežke oz. izdelke, jih najverjetneje učitelji na osnovi takšnih zapisov v učnih načrtih težko enoznačno rangirajo na ordinalni merski lestvici. Kakšen opis lege Slovenije ali katero doživljanje dramskega besedila, ki je izraženo s pisno primerjavo prebranega in uprizorjenega besedila, je boljše in katero slabše? O tem takšni zapisi v učnih načrtih ne povedo nič. Takšni zapisi naj bi zagotavljali, da bi za vse šole, učitelje določenega predmeta in učence veljalo enako (kaj se (na)učijo), v učnih načrtih pa ni odgovorov na vprašanja o rangiranju dosežkov (na ordinalni lestvici) in na vprašanja: »Kako dobro je dovolj dobro za...?« Učitelj je bolj ali manj prepuščen samemu sebi, da si ustvari svojo »mersko lestvico«. Namen standardov znanja, še posebej v razsežnosti nacionalnih standardov dosežkov, ni dosežen. Standardi znanja v edukaciji 79 Pri postavitvi standardov znanja v edukaciji se ne moremo izogniti nekaterim ključnim aktivnostim, ki so značilna za vsako merjenje. Postopek izdelave psihološkega testa kot merskega instrumenta se lahko strne v šest aktivnosti (Bucik, 1997): (i) opredelitev testa, (ii) izbiro vrste in ravni lestvice, (iii) sestavo testnih nalog in zbiranje podatkov za delovno verzijo testa, (iv) analizo reševanih testnih nalog, (v) na podlagi opravljenih analiz popravek testa in (vi) izdajo testa. Pred izdajo končne verzije testa je potrebno testiranje izvesti na reprezentativnem vzorcu posameznikov in v tem delu govorimo o določanju standardov. Količine, merske enote in standardi v fiziki Cresswell (2000) se zaveda kočljivosti termina 'standardi' v edukaciji in primerja izpitne in izobraževalne standarde s standardnimi merami v fiziki. Zgodovina fizike je tudi zgodovina merjenja in razprav o fizikalnih količinah in enoznačnih definicijah le-teh. Včasih so imeli v vsakem okrožju, na razdaljah nekaj deset ali sto kilometrov, drugačne enote (mere) za iste količine (dolžino, maso, prostornino). Mednarodni sistem merskih enot (SI), ki ga uporabljajo skoraj vse države sveta, je vpeljal osnovne fizikalne količine in njim pripadajoče osnovne merske enote (Bueche, 1986). Enake merske enote omogočajo enostavno sporazumevanje med ljudmi po vsem svetu. To velja za vsa področja, od znanosti in tehnike do trgovine. Z državami, ki uporabljajo druge sisteme merskih enot, moramo pri prenašanju podatkov poznati pretvornike med enotami. Zanimivo je, da se samo iz sedmih fizikalnih količin in njim pripadajočih merskih enot lahko izpelje vse ostale. To je razlog, da se tem sedmim reče osnovne fizikalne količine, ki imajo svoje osnovne merske enote. To so: dolžina z mersko enoto meter [m], čas z enoto sekunda [s], masa z enoto kilogram [kg], temperatura z enoto kelvin [K], električni tok z enoto amper [A], množina snovi z enoto mol [mol] in fizikalna količina svetilnost z mersko enoto kandela [cd]. Merske lestvice fizikalnih količin so vsaj intervalne ali celo razmernostne, kjer ima vrednost nič svoj absolutni pomen. V izrazu 'merska enota' v fiziki ni poudarek na enoti kot enici in merski lestvici kot taki, ampak na dogovoru in postopku za enoznačno merjenje npr. metra, kilograma, sekunde itd. Z mersko enoto je enoznačno opredeljena fizikalna količina, tako da navedba fizikalne količine ni več nujna. Ce izmerimo neko vrednost in jo zapišemo z mersko enoto, npr. 1,75 [m], 73 [kg] in 45 [s], je nesporno, da gre v prvem primeru za fizikalno količino dolžino, v drugem za maso in v tretjem za čas. Pomembno je natančno in dobro opredeliti in definirati vsako fizikalno količino, da je vsebina in lastnost dobro opisana ter lahko natančno merljiva. Pri opredelitvi fizikalne količine ali vpeljavi nove je potrebno znati odgovoriti na vprašanja vrste »Kaj?«. Ko se ukvarjamo z merljivostjo fizikalne količine, mislimo na njeno mersko enoto. Ko poročamo o meritvi, poročamo o obeh skupaj. Izmerjeno vrednost katerekoli količine moramo vedno zapisati z mersko enoto. Za vsako mersko enoto, še posebej 80 D. Zupanc pomembno je to za osnovnih sedem, je opredeljen in definiran poseben (primarni) standard. Pri opredelitvi standardov za merske enote fizikalnih količin je potrebno znati ponovljivo izmeriti in odgovoriti na vprašanja vrste »Koliko?«. Za merjenje časa so v zgodovini znanosti vedno izbrali periodičen pojav: vrtenje Zemlje, kroženje Lune ali vrtenje Zemlje okrog lastne osi (Strnad, 1985). Že stari antični narodi so za merjenje časa vpeljali merske enote: leto, mesec, dan. Za osnovno časovno mersko enoto je bila kasneje izbrana sekunda, kot 86.400-ti del povprečnega sončnega dne. Merska enota za čas, standard za 1 [s], je sedaj določen z 9.192.631.770 nihajnimi časi sevanja enobarvne svetlobe atomov cezija (55Cs133). Za dolžino so včasih ljudje uporabljali različne merske enote: ura hoda, čevelj, palec ... Prvi pravi mednarodni standard je leta 1790 določila Francoska akademija znanosti in sicer so za meter izbrali 1/10.000.000 dolžine pariškega poldnevnika od ekvatorja do pola. Izdelali so traverzo iz platine in iridija in vanjo vrezali dve črtici (Giancoli, 1991). Razdalj a med njima pri temperaturi tališča ledu j e predstavljala dolžino 1 [m] - prameter. Primarni standard je bil osnova za sekundarne, ki so bili shranjeni v večjih državah sveta. Od leta 1983 je 1 [m] definiran s potjo, ki jo svetloba prepotuje v vakuumu v 1/299.792.458 delu sekunde. Za merjenje mase so v Franciji leta 1889 izdelali valj iz platine in iridija -prakilogram, ki še danes velja kot primarni standard (Zupanc, 1995). Kot izhodišče so vzeli maso 1 litra vode pri 4 °C. Hkrati so izdelali več identičnih valjev iz platine in iridija, ki so shranjeni v različnih državah sveta in veljajo kot sekundarni standardi za merjenje mase. Pri merjenju električnega toka se fizika osredotoči na učinke usmerjenega gibanja nosilcev električnega naboja (Breuer, 1993). V okolici vodnikov, po katerih teče električni tok, nastaja magnetno polje, ko teče električni tok skozi upornike, se zaradi njega sprošča toplota, v elektrolitih pa električni tok povzroča elektrolizo. Standard za električni tok 1 [A] je določen kot konstanten tok, ki teče po dveh zelo dolgih ravnih vzporednih vodnikih z majhnim presekom, ki sta v razmiku 1 [m], če delujeta vodnika drug na drugega s privlačno oziroma odbojno silo 2107 [N] na vsak meter dolžine. Temperaturo se lahko vpelje kot količino, s katero je sorazmerna prostornina razredčenega plina ali s katero j e sorazmerna prenesena toplota pri idealnem toplotnem stroju ali s katero je sorazmerna povprečna kinetična energija molekule v razredčenem plinu. Merjenje v kelvinih so vpeljali, ko so ugotovili, da se ničesar ne da ohladiti pod določeno temperaturo. Tej temperaturni točki se reče 0 [K] = - 273,15 °C. Temperatura v kelvinih je določena s temperaturo trojne točke vode Ttrojne točke = 273,15 [K]. Voda je pri temperaturi T. („. in pri tlaku ptr. („. = 6,1 [mbar] v vseh treh agregatnih J r r trojne točke r r trojne točke 7 L J o o stanjih hkrati: plin, kapljevina in trdno. Fizikalno količino priredimo lastnosti telesa ali posebnosti pri pojavu ali stanju telesa, ki ga želimo opazovati (Strnad, 1985). Za vsako količino je potrebno navesti postopek za merjenje in standard za mersko enoto. Zanimiva je zgodovina vsakega standarda, kako se je spreminjal z razvojem znanosti, tehnike, metod in natančnosti Standardi znanja v edukaciji 81 merjenja. Že sv. Avguštin (Bartholomew, 2000) naj bi o vprašanju časa govoril: »Kaj je čas? Ce nihče ne vpraša o tem, potem vem, če pa moram na vprašanje, kaj je to, nekomu odgovoriti, pa ne vem.« V podobni zadregi smo pri vsem znanih fizikalnih količinah: masi, električnem toku, temperaturi, toploti, energiji ... in v nič manjši zadregi nismo, če želimo definirati učne cilje oz. kurikularne standarde znanja. V fiziki opisovanje posamezne (fizikalne) količine prav tako ni (bila) preprosta stvar. Vsekakor pa količine ne enačimo s standardom za mersko enoto, s katerim jo izmerimo, npr. dolžine z metrom, mase s kilogramom, temperature s kelvinom. Najbrž je v primerjavi s fiziko v edukaciji fenomene oz. količine težje definirati. Ce v fiziki merimo vsaj na intervalni, če ne na razmernostni lestvici, je pri opredelitvah merjenja znanja pogosto težko zadostiti pogojem za uporabo ordinalne, kaj šele intervalne lestvice. Težko časovno absolutno vpeljemo mero za določeno količino, npr. znanje nečesa, ki je odvisno od stanja v družbeni(ih) sredini(ah) in se z razvojem družbe z generacijami spreminja. Pa vendarle bi morali operativne učne cilje v edukaciji poskušati opredeliti tako, da bi bili merljivi vsaj na ordinalnih lestvicah, in za njihovo merjenje pristopiti k izdelavi merskih instrumentov, ki vodijo do standardov znanja. Učni cilji kot merljive količine, standardi dosežkov kot merske enote Izraz preverjanje znanja velikokrat uporabljamo le kot stilistično različico merjenja znanja (Zupanc, 2004b). Iz opisa fizikalnih količin in merjenja le-teh v fiziki lahko prikažemo mnogo podobnosti z učnimi cilji in standardi znanja v vzgoji in izobraževanju. Za definicijo količine moramo specificirati pravilo ali postopek, kar se v naravoslovju imenuje 'operativna definicija' (angl. operational definition) (Giancoli, 1991). Podobno morajo biti operativni učni cilji za preverjanje (merjenje) znanja podrobno opisani tako, da so merljivi na lestvici, ki je višja od zgolj nominalne. Ce se izraz standard znanja (že) uporablja za te namene, je najbolje uporabiti besedno zvezo 'vsebinski standard' oz. 'kurikularni standard' znanja (Linn in Gronlund, 2000). Merjenje vsake fizikalne količine je v resnici relativno - je primerjanje izmerjene vrednosti z dogovorjenim standardom za določeno mersko enoto (Giancoli, 1991). Včasih je osnova za dogovor neka naravna lastnost, stalna vrednost ali pojav: standard za dolžino [m] je definiran z zvezo s hitrostjo svetlobe v vakuumu, ki je nespremenljiva; standard za čas [s] je določen z nihajnimi časi sevanja svetlobe atomov cezija ipd. V zgodovini fizike pa ni bilo vedno tako in še danes za nekatere količine veljajo dogovori, katerih glavna vrednost je, da vzdržijo primerljivost v času in/ali na različnih mestih. Primera takih dogovorov med osnovnimi merskimi enotami sta enota za električni tok - amper - in, morda za sodobni čas še najbolj »starinska«, enota za maso - (pra)kilogram. Pomembno dejstvo, ki je razpoznavno tudi iz standardov za merske enote v fiziki, je, da so lahko standardi določeni posredno - preko lastnosti 82 D. Zupanc snovi, učinkov pojava ipd. Standard za dolžino je določen kot pot, ki jo prepotuje svetloba v vakuumu v določenem času. Standard za celzijevo temperaturno lestvico je bil določen ob upoštevanju dejstva, da je voda v različnih agregatnih stanjih, razlika temperatur pa je bila določena z merjenjem raztezanja snovi pri segrevanju. Tudi v naravoslovnih znanostih so nekateri standardi za merske enote določeni oz. (še) veljajo zaradi tradicije. Standard za maso j e najbrž dober primer preprostega in tradicionalnega standarda, tudi stopinje celzija se še uporabljajo za merjenje temperature, čeprav danes zaradi kasneje odkrite naravne zakonitosti v znanosti uporabljamo kelvine. Pri odločitvah za postavitev (novih) standardov igra pomembno vlogo zanesljiva izvedba meritve, ki je ponovljiva in natančna. Za katero lastnost, pojav ali učinek se odločimo, katero posredno meritev uporabimo za določitev standarda, je v naravoslovju odvisno od matematično eksaktnega zapisa posledic pojava. Zveze med fizikalnimi količinami zapišemo s funkcijskimi zvezami - matematičnimi formulami. Za merjenje dolžine ob znani stalni hitrosti svetlobe v vakuumu in določenem času je funkcijska zveza preprosta - dolžino poti izračunamo s produktom hitrosti in časa. Pri računanju sile med dvema vzporednima vodnikoma, po katerih teče električni tok, v fiziki poznamo funkcijsko zvezo med električnim tokom in silo med vodnikoma. Zaželena je izbira takšnih posrednih pojavov, da so funkcijske zveze, ki te pojave opisujejo, matematično »enostavne«, najbolje premosorazmerne. Ker so merske lestvice v fiziki (vsaj) intervalne, lahko uporabljamo funkcijske zapise (npr. linearne funkcije), računamo razlike vrednosti, povprečja ipd. Pri merjenju znanja pa se je potrebno pri ordinalnih lestvicah zadovoljiti z razvrščanjem, računanjem rangov, median ipd. (Nunnally in Bernstein, 1994). Tako kot ima vsaka fizikalna količina svojo mersko enoto, bi morali operativni Tabela 1. Učni cilji kot merljive količine, standardi dosežkov kot merske enote - analogije med učnimi cilji in fizikalnimi količinami ter standardi znanja in merskimi enotami fizika edukacija fizikalne količine učni cilji oz. vsebinski ali kurikularni standardi operativna definicija - podroben opis operativni učni cilj - podroben in merljiv pravila ali postopka opis vsebine znanja ali spretnosti - cilja merske enote standardi dosežkov (dejavnosti) relativno merjenje količine glede na relativno merjenje dosežkov glede na standard standard dogovori dogovori posredne definicije posredne definicije tradicija tradicija ponovljivost ponovljivost funkcijske zveze - opisi stopenj, ravni, lestvice ocen (premo)sorazmernost merjenje na intervalnih ali merjenje na ordinalnih in (morda) razmernostnih lestvicah intervalnih lestvicah Standardi znanja v edukaciji 83 učni cilji oz. vsebinski ali kurikularni standardi imeti svoje standarde dosežkov oz. dejavnosti. Ce preverjanje znanja in spretnosti obravnavamo kot merjenje znanja, so očitno meritve takšne, da se tisti, ki meri, pri interpretaciji rezultatov sklicuje na nekaj -najbolj pogosto na primerljivo skupino drugih učencev ali na vnaprej postavljene kriterije. V ameriški literaturi se uporabljajo izrazi 'norm-referenced measurement' ali 'criterion-referenced measurement' (Linn in Gronlund, 2000). Gre za relativno meritev, primerjanje dobljenih vrednosti znanja z dosežki drugih oz. drugimi dosežki. Ceprav se včasih za razliko od interpretacije rezultatov s sklicevanjem na norme interpretacija s sklicevanjem na kriterije omenja kot absolutna (Nacionalna komisija za uvajanje in spremljanje novosti in programov v vzgoji in izobraževanju, 2000), je kot absolutni mišljen nek apriorno postavljen kriterij. Pri vrednotenju znanja nekega učenca je tudi v tem primeru meritev relativna, ker pri interpretaciji rezultatov dosežek učenca primerjamo z nekim vnaprej postavljenim kriterijem. Pri preverjanju znanja so že učni cilji postavljeni z dogovorom, prav tako je stopnja doseženih ciljev dogovor. V določenem času, na določeni stopnji se ljudje v družbi ustrezno dogovorijo glede standardov znanja pri doseganju učnih ciljev. Naravnih standardov znanja ni, tudi apriorni kriteriji morajo biti dogovorjeni. Dull (po Westu in Crightonu, 1999) je zabeležil trditev učenca, kako je včasih kakšen učitelj postavil »standard«: »Bog zna za 5, jaz znam za 4, učenci pa lahko znate največ za 3. Mogoče boste lahko tudi vi znali za 4, če boste znali to, kar vam bom jaz povedal.« Takšni časi postavljanja »standardov« so najbrž minili. Pri preverjanju znanja in spretnosti je očitno, da ju ne moremo meriti neposredno. Ne moremo »pogledati v glave« učencev in izmeriti njihovega znanja. Merjenje znanja in/ali spretnosti vedno poteka posredno: preko neke dejavnosti učencev, reševanja nalog pri testih, odgovarjanja na zastavljena vprašanja, nastopov ipd. V državah z uglednimi in urejenimi šolskimi sistemi pri učnih ciljih na določeni stopnji izobraževanja in pri doseganju standardov znanja pomembno vlogo igra tradicija. Ceprav se časi spreminjajo in z njimi tudi vzgoja in izobraževanje, se zelo pogosto postavlja vprašanje zahtevnosti šole v časovni dimenziji in pogosto se pojavljajo vprašanja, kot so: »Kako je s ponovljivostjo?« in »Ali standardi padajo?« Anglija je primer, kjer ob razglasitvi rezultatov eksternih izpitov vsako leto potekajo javne diskusije o tem. A. Paterson (2003) razumevanje pojma standard ponazori z dialogom med učencem in ravnateljem v angleški šoli. Učenec: »Ravnatelj, ali ste kdaj pomislili, da so vasi standardi morda malo 'za časom'?« Ravnatelj: »Seveda so 'za časom'. Standardi so vedno 'za časom'. To je tisto, kar jih naredi za standarde.« Ko preverjamo doseganje učnih ciljev, moramo odgovore učencev objektivno vrednotiti. Na voljo moramo imeti enoznačna pravila za presojanje in ocenjevanje 84 D. Zupanc (Bucik, 1997). Boljše znanje pri učencih naj bi pri preverjanju pomenilo višji dosežek, rezultati pri izmerjenem znanju naj bi bili enoznačno razvrščeni v ravni ali lestvice ocen, morda celo v (so)razmerju z doseženimi učnimi cilji. Težko je zagotoviti funkcijski zapis oz. (premo)sorazmerje, pa vendarle z mejniki, opisi stopenj ali lestvico ocen lahko vsaj na ordinalnih lestvicah izrazimo različne ravni doseženega znanja. Pri preverjanju znanja bi bilo bolje, če bi t. i. 'vsebinske standarde' oz. 'kurikularne standarde' poimenovali drugače, brez besede 'standard', ker gre za opisovanje nekega znanja oz. količine, ki jo merimo pri izpitih, in je to šele prvi korak na poti do merjenja znanja. V Sloveniji in njeni šolski tradiciji bi bil najbližji izraz 'merljivi oz. operativni učni cilji'. Za 'standarde' pri merjenju rezultatov vzgoje in izobraževanja pa naj se uporabljajo t. i. 'standardi dejavnosti' (angl. performance standards), ki so merljivi in jih lahko kvantificiramo ali razvrščamo (Nunnally in Bernstein, 1994). Na primer, učenec za določeno raven znanja (oceno) pri testu z 'določenimi' nalogami doseže 'določen' rezultat. Merilni instrumenti Čeprav se o standardih znanja veliko govori, ni enostavnega merilnega instrumenta, ki bi ga uporabili za šolo ali za otroka in potem enostavno z njega prebrali določeno vrednost (Bartholomew, 2000). Prav tako ni nobene 'naravne' enote za merjenje. V fiziki se z definiranjem standarda oz. merske enote za določeno količino določi merilni postopek in gradi merilni instrument. Podobno se pri merjenju znanja in spretnosti s testnim ali drugim postopkom določa preverjanja znanja in gradi merilni instrument za merjenje doseganja učnih ciljev. Vsak merilni instrument je potrebno umeriti. Če je primarni standard neke vrste dogovor, se mora vse druge merilne instrumente, sekundarne in etalone, umeriti po primarnem oz. bolj zanesljivem. Standardi dosežkov pri merjenju znanja morajo dobro opredeliti kategorije ali vrednosti, ker predstavljajo neke vrste standardno enoto oz. mero pri preverjanju doseganja določenih učnih ciljev. Različni testi znanja morajo biti umerjeni s standardnimi dosežki, če se uporabijo v različnih časih oz. na različnih mestih. Tako v fiziki in psihologiji kakor tudi v edukaciji se je potrebno zavedati, v katerih pogojih je merilni instrument uporaben. Če pogoji niso izpolnjeni, meritve z merilnim instrumentom niso veljavne oz. uporabne. Obseg delovanja določenega instrumenta ima svoje meje. Kakor isti termometer ni uporaben za merjenje temperature pri zelo nizkih in zelo visokih temperaturah in v različnih drugih pogojih, tudi instrument za preverjanje določenega znanja običajno ni uporaben za preverjanje zelo različnih stopenj znanja ali za preverjanje v zelo različnih sredinah. Vsako merjenje s seboj nosi tudi napake merjenja. Vsak merilni instrument ima določene tolerance oz. odstopanja, kar je potrebno pri zanesljivosti merjenja upoštevati. Standardi znanja v edukaciji 85 Razprava Ali je oz. naj bo preverjanje znanja in spretnosti v šolstvu merjenje? Med nekaterimi strokovnjaki in praktiki s šolskega področja v Sloveniji je najbrž še dvom, če standarde znanja in standarde dosežkov sploh potrebujemo. Učiteljem preverjanje kot merjenje, ocenjevanje in vse, kar je povezano s standardi, pogosto ni najbolj všeč. Mihajlovska (2003) pravi, da »... učitelj sprašuje in ugotavlja le napredek pri svojih urah. Ocene niso primerljive, ker vsak učitelj podaja učno snov in ocenjuje znanje drugače, eni s srcem, veselo in bogato, drugi suhoparno, le s predpisanimi učnimi standardi« (str. 5). Ce že enkrat presežemo dilemo, ali je preverjanje in ocenjevanje znanja sestavni del poučevanja in učiteljevega dela, in prenehamo s stalnim odpiranjem vprašanja o tem, ali so standardi znanja v šolstvu potrebni ali ne, moramo vseeno ugotoviti, da zapisani učni cilji oz. vsebinski standardi o tem, kaj naj bi se v šoli (na)učili, še niso standardi (dosežkov). Bolje bi bilo, če t. i. vsebinskim oz. kurikularnim standardom ne bi rekli 'standardi', ampak kako drugače, morda 'merljivi učni cilji'. Postopek opredeljevanja le-tehje bolj podoben določanju učnih ciljev, razvrščanju in dimenzioniranju večrazsežnostnega pojma znanja. V teh postopkih ni konkretnih testnih nalog, (še) ni opravljenih meritev znanja in spretnosti in ni podatkov, kako so kandidati reševali konkretne naloge, ni opredeljeno, kaj je boljše, kaj slabše. O standardih naj se govori šele na ravni merljive dejavnosti oz. dosežkov kandidatov po konkretnem empiričnem merjenju znanj a. Cetudi iz raznih razlogov kurikularni standardi v terminologiji ostanejo, naj se imenujejo kakorkoli že, ostaja dejstvo, da je določitev merljivih učnih ciljev, pa četudi se jih proglasi za kurikularne oz. vsebinske standarde, proces, ki s tem še ni zaključen. Z zamenjavo imena učnih ciljev v učnih načrtih za (vsebinske) standarde ni bilo narejeno (še) nič ključnega na poti merjenja znanja. Se vedno je potrebno priti do standardov dejavnosti oz. dosežkov. To v Sloveniji (še) ni bilo narejeno. Da bi bilo preverjanje znanja v edukaciji merjenje znanja, je potrebno še veliko postoriti. Postavlja se tudi vprašanje, če sta dva procesa lahko ostro ločena. Ali je lahko določanje merljivih učnih ciljev oz. vsebinskih standardov neodvisno od določanja standardov dejavnosti oz. dosežkov? Najbrž ne. Pri določanju standardov dejavnosti oz. dosežkov se pri empiričnih ugotovitvah v praksi lahko pokaže marsikaj, tako da to lahko vpliva na odločitve o nekaterih konkretnih učnih ciljih. To je običajen proces pri graditvi vsakega merskega instrumenta, ko se je po že obdelanih empiričnih podatkih in analizah potrebno vrniti na začetek, preveriti izhodiščne opredelitve in narediti popravke in dopolnitve. 86 D. Zupanc Literatura American Educational Research Association, American Psychological Association in National Council on Measurement in Education (1999). Standards for Educational and Psychological Testing. Washington, DC: American Educational Research Association. Bartholomew, D. J. (2000). The measurement of standards. V H. Goldstein in A. Heath (ur.), Educational Standards (str. 121-149). London: The British Academy. Breuer, H. (1993). Atlas klasične in moderne fizike (J. Strnad, prevod in priredba) [Atlas of classical and modern Physics]. Ljubljana: Državna založba Slovenije. (originalno delo objavljeno 1987) Bucik, V. (1997). Osnove psihološkega testiranja [Essentials of psychological testing]. Ljubljana: Filozofska fakulteta. Bueche, F. J. (1986). Introduction to physics for scientists and engineers. New York: McGraw-Hill Book Company. Council of Ministers of Education of Canada (1996). School Achievement Indicators Program. Science Assessment. Framework and Criteria. Toronto, Ontario: Avtor. Council of Ministers of Education of Canada (CMEC) (2002). SAIP Mathematics III Assessment 2001: The Public Report (str. 1-137). Toronto, Ontario:Avtor. Cannell, J. J. (1987). Nationally normed elementary achievement testing in America's public schools: How all 50 states are above the national average (2nd ed.). Daniels, WV: Friends of Education. Cresswell, M. (2000). The Role of Public Examinations in Defining and Monitoring Standards. V H. Goldstein in A. Heath (ur.), Educational Standards (str. 69-104). London: The British Academy. Crighton, J. (1993). Poland - National Standards in Education: the creation of a national assessment and examination service - a proposal. Washington D.C.: World Bank. Ferligoj, A., Leskošek, K. in Kogovšek, T. (1995). Zanesljivost in veljavnost merjenja [The measurement reliability and validity]. Ljubljana: Fakulteta za družbene vede. Giancoli, D. C. (1991). Physics - Principles with Applications. London: Prentice-Hall International. Gipps, C. V. (2000). Beyond Testing: Towards a Theory of Educational Assessment. London - Washington, D.C.: The Falmer Press. Glass, G. V. (1978). Standards and criteria. Journal of Educational Measurement, 15, 237261. Glossary of Educational Assessment, Examination and Testing Terms (2003). Posneto 22.6.2003 s strani Open Society Institute, Budapest, Education Support Program: http://194.149.10.80/bin/common/course.pl?course_id=_15_1&frame=top Goals 2000: Educate America Act (2000). Posneto 4.10.2004 s http://www.ed.gov/legisla-tion/GOALS2000/TheAct/index.html Goldstein, H. in Heath, A. (ur.) (2000). Educational Standards. Proceedings of The British Academy - 102. London: The British Academy. Grgin, T. (1994). Skolska dokimologija: procenjivanje i mjerenje znanja (2. izd.) [School docimology: assessment and measurement of knowledge]. Jastrebarsko: Naklada Slap. Standardi znanja v edukaciji 87 Hornby, A. S. (1975). Oxford Advanced Learner's Dictionary of Current English. London: Oxford University Press. International Center for Technology in Learning. (2004). PALS guide - Glossary. Posneto 4.10.2004 s http://pals.sri.com/pals/guide/glossary.html Koretz, D. (1988). Arriving in Lake Wobegon: Are standardized tests exaggerating achievement and distorting instruction? American Educator, 12.(2), 8-15. Linn, R. L. in Gronlund, N. E. (2000). Measurement and Assessment in teaching.(8. izd.). New York: Upper Saddle River, Merrill/Prentice Hall. Mager, R. (1984). Preparing instructional objectives (2nd ed.). Belmont, CA: David S. Lake. Medveš, Z. in Svetlik, I. (2002). O splošni izobrazbi v poklicnem in strokovnem izobraževanju [General education in vocational and professional schools]. Sodobna pedagogika, 53 (2), 182-191. Mihajlovska, J. (2003). Zgodba strahov in primerjanj; Nacionalni preizkusi znanja [The story about fear and comparison; National assessment]. Šolski razgledi, 54 (11), 5. Ministrstvo za šolstvo in šport (1998a). Geografija [Geografy]. Posneto 13.10.2004 s http:// www.mszs.si/slo/solstvo/razvoj_solstva/viprogrami/os/9letna/ucni_nacrti/pdf/ geo.pdf Ministrstvo za šolstvo in šport (1998b). Slovenščina [Slovenian language]. Posneto 13.10.2004 s http://www.mszs.si/slo/solstvo/razvoj_solstva/viprogrami/os/9letna/ ucni_nacrti/pdf/sl.pdf Morgan, D. L. in Perie, M. (2004). Setting Standards in Education: Choosing the Best Method for Your Assessment and Population. (Neobjavljeno gradivo). Prispevek na konferenci International Association for Educational Assessment - 30th Annual Conference, Assessment in the Service of Learning, junij 2004, Philadelphia, Pennsylvania, USA. Nacionalna komisija za uvajanje in spremljanje novosti in programov v vzgoji in izobraževanju. (2000). Izhodišča za pripravo nacionalnih preizkusov znanja v devetletni osnovni šoli [Starting-point for national assessment in the nine-grade primary school]. (2000). Ljubljana: Avtor. Nunnally, J. C. in Bernstein, I. H. (1994). Psychometric theory. New York: McGraw-Hill. Mullis, I. V. S., Martin, M. O., Gonzales, E. J. in Chrostowski, S. J. (2004). TIMSS2003 International Mathematics Report. International Association for the Evaluation of Educational Achievement - IEA. Chestnut Hill, MA: TIMSS & PIRLS International Study Center. National Educational Goals Panel. (1991). The national educational goals report, 1991: Building a nation of learners. Executive summary (str. 22). Washington, DC: Avtor. National Examinations and their meaning for Quality Assessment, Quality Assessment in Primary and Secondary Education. (2001). Report on the third meeting of JONAS project. Posneto 15.8.2003 s http://download.citogroep.nl/pub/e_cens/ JONAS_reports/JONAS_Report_2001-3_Ljubljana.pdf Ministerial Council on Education, Employment Training and Youth Affairs. (2003). National Report on Schooling in Australia: National Benchmark Results: Reading, Writing and Numeracy Years 3, 5 and 7 - Preliminary Paper 2003. Carlton South: Avtor Oosterhof, A. (2001). Classroom applications of Educational measurement (3. izd.). New Jersey: Merrill Prentice Hall, Inc. Paterson, A. (2003). Standards. V K. Tattersall (ur.), Setting the Standard. A century of 88 D. Zupanc public examining by AQA and its parent boards (str. 139-160). Manchester: The Assessment and Qualifications Alliance. Pavešic, P. (prev.) (2005). Kako lahko matematiki prispevamo k preduniverzitetnemu izobraževanju. Obzornik za matematiko in fiziko, 52 (3), 94-96. Standards & testing. (2001). Posneto 4.10.2004 s strani Public Examination System, The World Bank Group: http://www1.worldbank.org/education/exams/ standards. asp#Australia Statistics of Education: National Curriculum Assessment of 7, 11 and 14 year olds in England - 2000 (2001). Posneto 15.1.2002 s http:/www.dfes.gov.uk/statistics/DB/ SBU/b0262/index/html Strnad, J. (ur.). (1985). Fizika - leksikon [Physics - lexicon]. Ljubljana: Cankarjeva založba. Straus, M. (2005). Izvedbeni in doseženi kurikulum za matematiko v višjih razredih osnovne šole med 1995 in 2003 [Implementational and achieved curriculum for mathematics in higher grades of primary school between 1995 and 2003]. Šolsko polje, XVI (3/4), 1940. Taylor, A. R. (2002). Setting Curriculum and Performance Standards for Gains in Achievement and in the Meaning of Results. Prispevek na konferenci 28-th Conference of International Association for Educational Assessment, Reforming Educational Assessment to Meet Changing Needs, September 2002, Hong Kong SAR, Kitajska. NCES - National Center for Education Statistics. (2004) The NAEP Mathematics Achievement Levels. Posneto 13.10.2004 s http://nces.ed.gov/nationsreportcard/mathemat-ics/achieve.asp The Nature Of Public Examinations (2002). Posneto 4.10.2004 s strani Public Examination System, The World Bank Group: http://www1.worldbank.org/education/exams/ nature/ Zupanc, D. (1995). Fizika - interaktivni učbenik [Physics - electronic 'textbook'] [CD]. Ljubljana: Gekko. Zupanc, D. (2004a). Nekatere dileme šolskega ocenjevanja v Sloveniji [Certain dilemmas of assessment in Slovenian schools]. Sodobna pedagogika, 55 (1), 92-111. Zupanc, D. (2004b). Funkcije preverjanja znanja, interpretacija rezultatov, poročanje o dosežkih [The functions of knowledge assessment, interpretation of the results, reporting on achievements]. Sodobna pedagogika, 55 (4), 148-167. Zupanc, D. (2005). Standardi znanja v slovenski šoli [Knowledge standards in the Slovenian schools]. Sodobna pedagogika, 56 (1), 124-147. West, R. in Crighton, J. (1999). Examination Reform in Central and Eastern Europe: issues and trends. Assessment in Education, 6 (2), 271-289. Prispelo/Received: 23.11.2005 Sprejeto/Accepted: 10.02.2005 Psihološka obzorja / Horizons of Psychology, 14, 3, 89-105 (2005) © Društvo psihologov Slovenije 2005, ISSN 1318-187 Znanstveni teoretsko-pregledni prispevek "I remember checking on my mother to see if she was still breathing." How a relationship maintains, regulates, and helps resolve traumatic experiences: relational family integration Katarina Kompan Erzar*, Christian Gostečnik in Tomaž Erzar Franciscan Family Institute, Ljubljana, Slovenia Abstract: Traumatic experience is one of the most devastating experiences the family can endure. In order to understand why an experience maintains its traumatic nature we must take into account that trauma could be used as a powerful regulative mechanism in the family system precisely because of its organic component. For the first time in the history of psychology, this enables us to connect interpersonal relations with a person's organic nature and to establish that this nature is subordinated to the relationship or space between "I" and "you," which opens an extensive area and continually makes new discoveries possible. In the following vignette we will see that family systems, marked by trauma, develop very specific affective dynamics for affect regulation, which maintains the trauma. Trauma is transferred into interpersonal relations through basic affect and through the development of attachment; traumatic experiences remain present and powerful through multiple generations. The discovery of a new perspective on trauma lies in the fact that a trauma, for which no one takes responsibility, remains unmanageable. Key words: emotional trauma, families, affect regulation, secondary traumatization, attachment behavior "Spominjam se, kako sem preverjal, ali mama se diha. " Kako družinski odnosi ohranjajo, regulirajo in razrešujejo travmatične izkušnje: relacijsko družinska integracija Katarina Kompan Erzar, Christian Gostečnik and Tomaž Erzar Frančiškanski družinski inštitut, Ljubljana Povzetek: Travmatična izkušnja je ena najbolj uničujočih izkušenj, ki lahko zadenejo družinski sistem. Ce hočemo razumeti, zakaj določena izkušnja ohranja travmatične razsežnosti, moramo vedeti, da je travma lahko zelo učinkovit mehanizem regulacij e afekta v družinskem sistemu prav zaradi svoj e organske narave. In prav to spoznanje nam odpira vpogled v organsko naravo medosebnih odnosov in prostora, ki se ustvari med »jaz« in »ti«. Na primeru terapije bomo pokazali, kako dinamika regulacije afekta ohranja travmo znotraj sistema skozi več generacij. Odkritje novega pogleda na travmo je namreč, da travma, ki je nihče ne vzame nase, torej zanjo ne prevzame odgovornosti, ohranja svojo neobvladljivost in se z nezmanjšano močjo preko okrnjenega sočutja in neobvladljive tesnobe do otrok prenaša iz * Naslov / address: Katarina Kompan Erzar, Frančiškanski družinski inštitut, Prešernov trg 4, 1000 Ljubljana, tel.: 01/200-67-60, fax.: 01/200-67-66, e-mail: lia-katarina.kompan@guest.arnes.si 90 K. Kompan Erzar, C. Gostecnik and T. Erzar generacije v generacijo ter preko sekundarne travmatizacije od partnerja k partnerju. Šele odnos, ki bo omogočil sprejemanje odgovornosti za travmo, bo tako ustvaril zdrave razmejitve ter zaustavil prenašanje travmatičnih afektov. Ključne besede: čustvena travma, družine, nadzor čustev, sekundarna travmatizacija, navezanost CC = 3310 Systemic level: mutual affect and the trauma family system Family systems that are marked by trauma develop very specific affective dynamics for regulating this trauma. This paper examines how trauma is transferred into interpersonal relations through basic affect and how, through the development of attachment, traumatic experiences remain present and powerful through multiple generations. The power and intensity of affect is preserved, and only its manifestation changes. Every level of the system and every relationship reflect affect in a different manner or regulate affect through different mechanisms. The discovery of a new perspective on trauma lies in the fact that a trauma that no one takes upon himself, and thus does not take responsibility for, remains unmanageable. This trauma passes with undiminished strength from generation to generation through impaired empathy toward children and, through secondary traumatization, from partner to partner. Only a relationship that makes it possible to accept responsibility for a trauma can create healthy boundaries and halt the transfer of traumatic affects. In the relational family paradigm (Gostecnik, 2004), affect is understood as a basic mutuality, atmosphere, feeling, or the organic foundation of every interpersonal contact that allows a person to maintain connectedness with others. It is unconsciously and deeply ingrained in the organic structure of our brains. This fundamental mutual affect thus supports the entire psychic structure of thought, feelings, and behavior and is expressed in even the slightest elements of interpersonal dynamics. Through affective psychological constructs, we can therefore recognize basic affect in individuals' thought, behavior, and feelings - and especially from the atmosphere created by a particular relationship. Affect is therefore always systemic as well, which means that it pervades the entire family without the family being aware of this (Gostecnik, 2004). Affects always have a physical root, which means that they are always linked to bodily sensations and illnesses, and they create the basic dynamics of an attachment mechanism, and thus unconscious mechanisms for preserving a feeling of belonging, security, or fixedness in a network of interpersonal relations (Siegel, 1999). This interpersonal quality itself, or the ability to be connected, is the foundation of humanity and is the most powerful survival impulse that a person knows (Bowlby, 1982). Based on this, it is easy to understand the persistence of the most painful Relational family integration 91 forms of relations, abuse, and neglect, which are destructive, dangerous, and sometimes terrifying by nature. Mutual affect makes it possible for an individual to continually reestablish relationships that are indissoluble because they include and are based on attachment mechanisms. Relational trauma or attachment injury is thus the most powerful attractor in family systems (Bradeley, 2000). At the systemic level, attachment injury or trauma manifests itself as a blockage in the system or an inability to develop basic compassion and an effective parental relation towards children at a particular developmental level. In the following vignette we will see how parents find themselves frustrated and unable to respond to the minor trouble with their son. H (husband): We're still worried. Our child has been ill for so long and he's still running a temperature. We 're really worried and we just don't know what to do. W (wife): We were at the doctor's and she said they did all that could be done. They said that he's all right, physically. All the tests showed that there's nothing wrong with him. H: And the thing that worries us the most... W: Yes. H: ...is that there might be something serious behind all this. That they won't be able to figure out what's wrong with him. There might be something seriously wrong and we won't even know about it. The doctor said that there's nothing physically wrong with him, but I'm still worried that there could be something serious, maybe even life-threatening. (They express a feeling of concern and they also act as if they feel guilty. The therapist will contain the underlying affect of fear by addressing guilt and concern.) T (therapist): There's a deep concern here. It seems like it's a connection between the two of you. W: Because it's a big problem that we would like to resolve. So we know where we stand. T: (to the wife) How are you feeling? W: I'm very scared and concerned. It's the uncertainty that's the worst. The feeling of not knowing. If I knew that he was physically 100% all right, that he was healthy, it would be easier because then I would at least know that it could be psychological. Now I'm not really convinced. What if it's a disease that they just don't know about and they'll say in a year's time that now it's just too late? T: It would be easier for you to understand if it were a disease that could be cured at the physical level... W: Yes, I would at least know how to fight it. T: Because these psychological things... W: Even if it were psychological, it would be easier because I would at least know. T: How do you feel? Guilty? There's a lot of guilt here. (By addressing guilt the 92 K. Kompan Erzar, C. Gostecnik and T. Erzar therapist allows them to reach the fear) W: No, I'm more or less scared. T: Scared. And you, sir? H: I don't know. I'm thinking of what the doctor said that it might be psychological. I really don't know... is it something that's between the two of us that's not being addressed and so our child then needs to..., are we pushing our child into an illness? T: So the guilt has its home here. H: I guess a little. I'm asking myself... Maybe I wasn't home enough or didn't spend enough time with him. T: It's just not fair to the two of you. This is not something you could have caused. This child should have gotten better. Jernej should be healthy. We talked about this a lot in the last session. Where did you feel like this? (When affect undergoes the situation the therapist will try to find its real origin) H: I guess I felt like this at home when I ... my parents were often ill. T: Your parents? H: Yes. T: And what's it like being the child of parents like that? H: I always... there was always something you needed to worry about. Ifit'd be okay or not, would they... The worst part was thinking that they'd just die. There were heart failures and my mother had some kind of seizures, we didn't know if she would survive or not. I remember checking on her to see if she was still breathing. We have seen that the family system is blocked at this point. The husband is scared and not able to connect with the child because at this point he became connected with his family of origin, namely with his own family system. In the family, mutual affect may thus appear as a block to the system. When this blockage is manifested, the interpersonal level of the traumatic system opens up, which is made possible by the valence of the partners toward the affect of the trauma. We are talking here about the traumatic experience (as is for example an accident) that happened long ago in the primary family system of one of the parents of the family presented here. And we are considering the prerequisite that allows that an annoying experience retains its traumatic effect through the generations. At the interpersonal level, the trauma can be recognized according to the typical pattern of secondary traumatization or unusual relational stress between the partners accompanying children's minor problems. Interpersonal level: secondary traumatization and dissociation Reshaping the trauma at the interpersonal level requires first recognizing the source of the traumatization - that is, who has the trauma, who the source of the Relational family integration 93 trauma is, whose trauma it is (i.e., returning the trauma to the original families), and seeking mutual affect on the basis of which the link of non-secure attachment between the partners can then be broken. As long as the basic affect is unconscious and unrecognized, it is frightening and does not allow the relationship to grow. When this occurs through the continual repetition of one and the same pattern of relationships, something actually unites two individuals - that is, mutual affect - the relationship relaxes and each of the partners in it can begin to seek new hitherto inconceivable responses to the situations encountered in the relationship. Flexibility in feelings, thoughts, and behaviour are the main sign of secure attachment, while the criterion is the genuineness of emotional responses (Kompan Erzar, in press). The following shows what happened between the man and woman in the previous example and how the trauma took root between them. When the husband and wife could not work through their anxiety about children, this means that they are trapped into some affective loop, maintaining the same affect: H: Well, the situation is a little more complicated. Time-wise, if I want to do all these things then it's normal that I have to finish up some things at home. I can't always fit everything in even though I would sacrifice everything for my child. To think that there would be something wrong with my child. I'm willing to sacrifice everything for my child. Even work, but at the same time it seems a little unfair that I should have to choose between all these things. T: Hmmm. H: I don't know how to manage all of this. T: We'll come back to this later There's a different atmosphere here that was just created. (to the wife) What are you feeling now? There's something new here. W: How can you say sacrifice! You can't say that you sacrifice things for your child. You have to want these things. Isn't it human nature to want to spend time with your son and with me? T: Just a minute. We'll go ahead with this in a minute. You have a situation here from home that is repeating itself. You took care of your parents. It was terrible for you, totally unpredictable, and you couldn't even count on anyone else. They would die and leave you. Constant fear... H: This fear... T: ...and now you have a child that is continuously ill and he doesn't know whether his father will come for him or not. I don't know why there's so much of this here. We'll see. Your wife is telling another story that is filled with emotions and horror You have to want it. You're actually telling his story. These parents should have wanted to be there for the child, but the child had to keep checking up on them to see if they were still alive. They didn't give you any safety and security. This child is now obviously forcing something that you never had -security. There isn't any here. (to the wife) What do you think? There's your child and there's you on the other hand. W: Yes, he really tries too hard and he tries to do everything. 94 K. Kompan Erzar, C. Gostecnik and T. Erzar T: He's very hardworking, your husband. W: But he's never really there. T: How much do you miss him? W: A lot. T: We're doing this dance between parenthood and your partnership. There's your marriage on the one hand and your parenthood on the other. I don't know where the answer lies. It's probably complex. How do you feel when he's not there? W: I feel... it's so humiliating how you have to try so hard and sacrifice everything. T: Who had to try this hard? W: Probably someone at home, my parents, who... T: You had the feeling that they tried so hard to be there for you. W: They did everything for me. They just didn't do anything for themselves. T: They didn't want to do anything for themselves. And you felt this? Was being ill allowed? W: No, not really. We can easily see that they could not connect easily to each other. That means that they are reaching mutual attachment injury. Research on the structure of attachment and its development (Solomon, 1994) has revealed seven levels at which the emergence of pathological attachment occurs - which has also been called secondary, and only seems to be a secure attachment - that can be traced in the partners' relations. These layers extend from the core part of personality, shaped by the more-or-less secure attachment to parents, to concrete forms of interpersonal relations, in which false attachment predominates. In the most difficult cases, seemingly secure attachment is rooted in the core part of personality. From the perspective of attachment, such a disorder is not difficult to explain, because only attachment to the parents gives a child security, but if that attachment is non-secure it demands that the child gradually adapts to the distorted and abusive bond with his or her parents. We must acknowledge that there is no direct casual relationship between trauma, abuse and insecure attachment, but that an individual with insecure attachment bond is more prone to the traumatic experience and more vulnerable to become the victim of the abuse, while in cases of severe abusive parenthood it is common to find insecure attachment as well. Of course the traumatic or abusive experience is much more likely and easily to be resolved if the person is securely attached. Every "secure attachment" disturbance caused by an unsuitable relationship with the parents, unresolved trauma, abuse, or triangulation threatens secure attachment and causes the emergence of "primitive aggressive ego organizations". As Fonagy (2001) points out, "The early environment is crucial not because it shapes the quality of subsequent relationships (for which the evidence is lacking, as we have seen) but because it serves to equip the individual with a mental processing system that will subsequently Relational family integration 95 generate mental representations, including relationship representations. The creation of this representational system is arguably the most important evolutionary function of attachment to a caregiver" (p. 31). This is, of course, multi-layered because it arises gradually, through recurrent behaviour at various levels of development. These degrees or layers are the following: 1. Secure (also primary or prenatal) attachment is the foundation of personality; on top of this there emerges: 2. The pain of trauma (separation from parents, loss, absence of contact), producing 3. Sadness, regret, and despair, which leads to: 4. An unconscious rage toward people that the child is attached to; however, because the expression of rage and aggression toward loved ones threatens contact with such persons, during such rage the child is also overcome by 5. Anxiety, which always accompanies aggressive reactions; both are covered and masked by 6. A feeling of shame and guilt and perception of oneself as bad, which is one of the main signs of primitive aggressive ego organization. Because this rage is repressed and they remain alone in their emotional rage, anxiety, and shame, such children now try to seek contact that lays blame on them and they hate themselves. This hatred and recourse to guilt is expressed outwardly as 7. An inability to maintain emotional closeness and a freezing of all initiative in intimate relationships or extreme fear of intimacy (Solomon, 1992). In the words of Donald Winnicott, this involves the development of a false ego, or an extreme form of avoiding attachment, through which the trauma is preserved (Winnicott, 1990). Dissociation at the moment when it is necessary to establish contact is the main sign of traumatization at the interpersonal level. Breaking off contact through dissociation is the most painful attachment injury. One of the most powerful interpersonal responses to trauma is dissociation. We could see many kinds of dissociative responses to highly emotionally laden triggers. We are talking here about dissociative stance that the husband is not able to respond when the basic attachment is addressed. It ponders him with so much stress, that he doesn't react. He freezes. We will see that he doesn't enter into the conversation, doesn't interrupt his wife or the therapist when they are talking about him. W: It showed that we're not really that close. T: And that hurts. W: Yes. T: He doesn't want to be there when you're experiencing this? W: Not that he doesn't want to, it... 96 K. Kompan Erzar, C. Gostecnik and T. Erzar T: He needs to try. W: That you have to try so hard. It's actually not that hard. You come home and you're there. He can finish the article any other time. And at home you can ask questions like "How are you? Anything new?" Just basic everyday questions. You're relaxed and not occupied with planning and thinking about other things. You're just there (at home). T: You're feeling hurt? Confused? W: Yes, if it's lacking, it's hard. T: It's difficult to trust... Sir... H: There's always something that comes up. I wish there were someone that would tell me what to do so I would know, and then have the information. I want someone to say "Do that. Go home. This will take this much time to do...", and then it'd be ok. W: It doesn't matter how it's done, just do it and get it done. T: Sir, we'll talk more about what your wife is saying later. This child never got instructions how to do things. He was just scared. And he probably didn't have the courage to say anything because if he were to do something... What would happen? H: You don't know. You don't have enough information. T: Because this child lost his spontaneity, his playfulness. He just has to be careful not to do anything wrong. You 're a grown man and you can't do anything the way you'd like to, only listen. And it's never all right, it's never enough. You're always guilty of something. Yes? H: I always expect some sort of catastrophe to happen. I can't do this anymore. The intrapsychic level: Relational trauma as attachment injury and its neurobiological aspects Let us now turn to the consequences of trauma for organic development and the development of attachment, which sheds light on the origins of the persistence and indestructibility of relationships marked by attachment injury. Trauma that is not acknowledged is transferred into the system as a constant source of relational stress. A child that is included in a system of trauma, or even becomes the bearer of a traumatic experience, will build the trauma into his nervous system because there will not be anyone to aid him in processing the stress of the trauma and to prevent the secondary traumatization experiences by those closest to the traumatized individual (Van der Kolk, 1996). External trauma (e.g., an accident) is thus transformed into relational trauma, because this is the only way of regulating stress that a traumatized individual is capable of. For children that grow up with traumatized parents, this means that they will grow up with permanent attachment stress, because parents that regulate traumatic stress through parenthood are unable to regulate their children's affect Relational family integration 97 or stressful emotional states. The child is thus permanently traumatized. Allan Schore in his revolutionary work discovered, that in conditions of continual traumatic assaults, more than dendritic fields may be lost, rather the neuronal components of one or both of the limbic circuits may undergo extensive programmed cell death (Schore, 2001). When acute attacks occur in turn, the neurons loose their movement towards the neurons that are connected with them in synapses. This intersynaptic advancement of neural death is strongly reminiscent of degenerative neural diseases in which "systematic degeneration" includes the expansion of cell loss to neurons that are connected in the same functional circuit (Schore, 2003). The limbic system is the area where psychology and neurology meet. In the most recent psychiatric discussions, the seriousness of the trauma is no longer a decisive cause of posttraumatic stress disturbances, but is dependent on the characteristics of the individual, especially his or her reaction to trauma (Schore, 2003). A pathological response to stress reveals an excessively sensitive, excessively responsive amygdale and the memory processes in the amygdale are also strengthened (Schore, 2003). In such a case, subliminally processed weak interpersonal stressors will also trigger unmodulated threatening and painful emotional experiences from an individual's early past that are recorded in the amygdale-hypothalamic circuit. These fear-torpidity responses will be intense because they are mostly unregulated by the orbitofrontal areas, which is inaccessible for the correction and fine-tuning of emotional responses. In ideal circumstances, the amygdale and the orbitofrontal cortex are connected through the hypothalamus, the area that is responsible for activation of the parasympathetic nervous system. This is the area that makes it possible to play dead or invisible when confronted with danger. That is, to dislocate oneself and therefore flee from a situation that has no exit, to disconnect oneself from an unbearable situation and, in Bowlby's terms, to fall into a state of deep unconsciousness (Schore, 2003). The amygdale defines the emotional meaning of a threatening stimulus; the ventromedial prefrontal cortex uses this information to examine and provide feedback on the organism's internal state, and to adjust the response to the stimulus with regard to the internal state. Without this feedback on the internal state as well as the danger level of the stimulus, for survival reasons the organism could remain in defense mode for longer than is necessary (Schore, 2003). We have already ascertained that a traumatic painful event, in contrast to non-traumatic pain, triggers an intense emotional reaction with an accompanying auto-nomic and somatic cycle, and creates increased sympathetic activity and noticeable responses in the limbic system - that is, in the hypothalamus, the gray areas of the brain, and the prefrontal cortex. Positron emission tomography (PET) shows that the right interior cingulate gyrus plays a central role in the sensorial affective aspects of pain, while the orbitofrontal area modulates the indirect processing of pain - thus 98 K. Kompan Erzar, C. Gostecnik and T. Erzar facing pain and not the pain itself. What is therefore very interesting is that direct pain is not connected with its emotional affective sense; that these two processes are anatomically separate! The orbitofrontal system is sufficiently developed as to be able to regulate both sympathetic-adrenomedullary catecholamine and the corticosteroid level - that is, both hypo- and hyper-excitation (Schore, 2003). This means that an insufficient frontolimbic system will not process pain signals that come from the body itself. The non-activation of the orbitofrontal cortex creates an analgesic effect, and its disappearance then causes the suppression of behaviour associated with pain and the increased threshold for pain associated with affect (Schore, 2003). It has been argued that the theory of attachment is a theory of the regulation of affect. "What cannot be regulated within the relationship, for example the emotional pain of abandonment and shame the child experiences with the parents, is regulated through the relationship, which means that the pain is transmitted via fantasy bonding to the next generation. There is no middle ground, so to say, between sufficient and insufficient regulation of those two core affects, since they are both included in the way mutuality is established in the relationship. The paradox of bonding lies in the fact that the bonding relationship is guaranteed by the very affects, whose differentiation and regulation the relationship promises to achieve. On the one side, this partial solution prevents the total breakdown of the network of intimate relationships, but on the other, opens the door to repeating of traumatic affects in future relationships.« (Erzar & Kompan Erzar, in press) Attachment can therefore be understood as interactive regulation between psycho-biologically regulated organisms. In this manner the unconscious dynamics of attachment is the basis for a dyadic regulation of affect. Emotions are therefore the highest direct expression of the bioregulation of complex organisms. From this perspective, the stress of separation can be understood as the loss of the maternal regulation of the child's immature behavioural and physiological systems, which then expresses itself as an attachment pattern of protest, despair, and detachment. The period of synchrony that follows the period of stress makes the reestablishment of equilibrium or the healing of the wounded relationship possible. The child learns to handle stress through this pattern. Flexibility and plasticity in facing traumatic stress is the last and final sign of secure attachment, which is expressed as flexibility in regulating emotional stress through self-regulation and regulation during interaction with others. It may be said that unsuitable regulation of affect means the inability to integrate various neurobiological systems. Each of these then operates on its own and creates confusion in the individual, a feeling of total loss of control over life, dread, and fear. The individual feels normal, understands things normally, and reacts normally, but all of these systems are completely disconnected and it is therefore impossible to arrive at the true meaning of specific events, feelings, and affects (Siegel, 1999). Relational family integration 99 Moreover, the maternal style of caring for the child becomes a process for the direct transfer of individual differences in facing stress, which are stronger because of genetic predispositions. "In the child, maternal care therefore serves as a program for children's behavioral response to stress" (Schore, 2003, p. 179). The most significant discovery of attachment theory and the neuropsychology of regulating emotions is that these processes are always unconscious and that they represent an ingrained and built-in foundation for later behaviour, experiences, feelings, and activity (Schore, 2003). Just as the mother is decisive in the early maturation of the ability to handle stress, after the third year, when the development of the right hemisphere is complete, the role of the father is of key significance for expansion of and greater flexibility in children's ability to deal with stress. In the case of a trauma (after the third year of childhood), a child with secure attachment that does not have this flexibility therefore also develops dissociation and other pathological mechanisms for the preservation of a traumatic experience. The orbitofrontal region of the brain retains its plasticity throughout a person's life and is therefore the basis for all emotional learning. Non-secure attachment can therefore change or be built into secure attachment through this learning and psychobiological regulation in later relationships. This means that flexibility and connection between individual brain systems is increased, and the individual thus obtains control over external and internal experience and is capable of making a suitable response to external and internal stimuli. The first such relationship is an adult intimate relationship (Siegel, 1999). The relationship of psychobiological regulation from attachment between the child and the mother has now become the foundation for every empathic relationship, including the therapeutic one, because it clarifies and addresses the deepest affective mechanisms for the development of secure attachment in therapy (Schore, 2003). Trauma that is not acknowledged, or the transfer of trauma to children, is therefore manifested in a greatly curtailed ability to regulate emotions, which at a moment of stress created by a trauma operates similarly to a disorganized form of attachment. There are two circuits for regulating emotion: the parasympathetic and the sympathetic - one driving activation, and the other blocking it. In this type of attachment - that is, the disorganized, chaotic type - both are impaired or function incorrectly and therefore both poles for regulating affect are nonfunctional or overloaded. Simultaneous overloading of activation and non-activation results in the release of calcium in cells, which kills them. Neuropsychologists call this mechanism apoptosis or "programmed cell death" (Schore, 2003). The conditions of this stress are analogous to being in a car and pressing hard on the accelerator and the brakes at the same time. Brains to which this regularly happens gradually lose their flexibility. When these two mechanisms operate at the same time, especially independently of each other, this creates dissociation. We can conclude that the more we know about how the relationship between 100 K. Kompan Erzar, C. Gostecnik and T. Erzar children and parents determines how the brain circuits that are responsible for the healthy regulation of emotions will develop, the better we can understand how one mind shapes the development and functioning of another, which is the core of interpersonal connectedness. The awareness that a mind is composed of a flow of information and energy allows one to conceive the complex nervous system that creates it. Just as the brain is composed of parts of neurons, groups of neurons, synaptic connections, individual neurons connected in various circuits, all the way up to large subsystems such as the left and right hemispheres, relationships are also a system composed of individual relationships, subsystems, and internal psychological systems connected in various interpersonal ties, together creating a family system that then has an influence on every minute part of the system (Siegel, 1999). Contact between two minds takes place directly through physical proximity as hidden regulators (e.g., through warmth and touch) and, in addition, it has been shown that physical proximity directly shapes electrical activity in the brains of both individuals. Even in the case of physical distance one mind can directly influence another through the transfer of energy and information. Contact is established both at the verbal as well as at the prosodic, nonverbal levels. Nonverbal signals such as facial expressions, gestures, tone of voice, and the timeframe of responses have a direct influence on socially responsive parts of the brain - the amygdale and hippocampus, i.e., the structures of the central part of the brain (Siegel, 1999). These signals excite the brain circuits that determine emotional responses - that is, directing attention, seeking meaning, and determining excitement levels. This emotional connection with another person creates an entire group of complete and differentiated processes for receiving stimuli in the brain, and these processes directly orient the flow of energy and information in an individual's brain (Siegel, 1999). The emotional state of the sender thus directly shapes the emotional state of the receiver. In other words, external restraint such as nonverbal signals received from another person has a strong and immediate effect on the flow of one's state of consciousness (Siegel, 1999). Children's patterns of energy and information transfer between two people organize relationship strategies, which are seen as behavioural responses to situations connected with attachment (and therefore also with trauma, which is the greatest injury to these connections). Children's minds adapt to specific emotional communication that they receive from their parents. In the course of development, such patterns of relationships are established as behaviour strategies in the broader context of relations. Certain aspects of children's regulation of emotions (such as adaptation to stress), cognitive processes (memory and attention), and social skills (including relationships with their age-mates) stem from the history of an attachment. Among adults, one can observe basic features of early attachment in the characteristic approach to interpersonal privacy and the shaping of autobiographical narratives that express the entire history of these early experiences, which harden into generalized states of mind through life experiences (Siegel, 1999). The persistence of a trauma is therefore a sign that a system is not functioning, Relational family integration 101 that it is based on the dissociation of traumatic feelings and thus does not provide any relational changes, departure, growth, or transformation of relationships, because the system thereby loses the mechanisms of regulating trauma through children. A family that has experienced a trauma and regulated it through children will react in a very traumatic manner to each of the child's developmental steps - starting school, adolescence - and preserve itself through the parenthood of those children. H: Well, you said that it could be easier to understand for the sake of our child and our relationship because living under such pressure and constant fear... It's not easy. T: (to the wife) You waited your whole life for your father to do something, right? And he didn't. And your mother went her own way. (to the husband) And you also patiently waited for your father and your mother also had to go her own way. H: Yes, but emotionally... T: She fell ill. H: Yes, they went their separate ways. T: Who fell ill? H: Both of them. T: Did they meet each other in sickness? H: When there were problems they got along very well. Actually they got along. T: But some sort ofphysical pain had to be there. And emotionally, they couldn't... H: There were some painful things there, at least I think so. T: Yes. H: I don't know if they had enough information to be able to resolve their issues. I don't know. When my sister died. I don't know. If they knew how to resolve these emotionally issues. T: Is it her death that's still in the air? But there is hope here. H: I'm sure we can do something for our relationship. T: This issue here is very painful. (to the wife) You would like only one thing and that's for him to be at home because he wants to and also that he would do what he wants because he wants to. W: Right. T: And that there would be something there for you two. W: That it would be spontaneous and that it would feel right, natural. T: Natural. And you 're afraid to be that because you need instructions. You would like someone to tell you what to do. H: Yes, because what I do is then done right. T: So it's done correctly. You doubt you can do something spontaneously. H: If I don't have the adequate information then it's pointless to do anything because you can then worsen the situation. T: Who should have given you these instructions but didn't? 102 K. Kompan Erzar, C. Gostecnik and T. Erzar H: My parents. But maybe they didn't even know. The doctors. And then they didn't know. T: There were a lot of people who should have given these instructions but... H: Those who have certain roles and certain qualifications are there to give you the needed information. I don't want to do something or put myself in a position where I don't have the information to do the right thing. T: This angers you, doesn't it? H: Yes because if you're in a certain position you should know things. T: Did your father know? H: No. The doctors should have known, in my opinion. T: And your father? H: What about him? T: Because the doctors should have known about your sister and today about your son. Of course, this is its own kind of frustration but you weren't ill there. Your father, did he give you the information? H: I'm totally lost. If the children are able to start their own families, the traumatic experience and relational stress will be repeated in every otherwise completely normal stress in their children. In the way that they perceive basic emotional content, relations, and events from their childhood, the parents (the children of the parents that experienced the trauma) recreate for their children an atmosphere similar to the one that they themselves experienced with their own parents. For the time being, the best answer to this question is that the function of attachment is always the same - that is, the capacity to regulate emotions with the help of another and with the help of recognizing, understanding, and dealing with the stress caused by emotions. It is in the area of affect regulation that an individual form of attachment is transferred and at the same time created (Shaver & Cassidy, 1999). Conclusion: When a system speaks from within, relational family integration Intimate relations - that is, relations based on psychobiological harmony and compassion - are a unique space in which we shape ourselves and develop. The structure of a family's activity or relationship system is directly reflected in and dictates the directions of development of basic organic structures. Not a single process in the human body is immune to contact with others because the system of relations defines their form, direction, and responsiveness. It could even be said that children do not "learn" from their parents, but that they internalize their manner of activity through contact with their parents, adapting this to their bodies and their characteristics. Thus, children that have a very sensitive nervous system will be very responsive Relational family integration 103 and will imitate many of their parents' emotions in detail, more so than children that are born with a less responsive nervous system. The intenseness of this connection and the colouring of its development will depend on the breadth of responsiveness and capability of the parents or adults that represent the external framework or range within which the child will be able to develop. The basic affects that we seek in relational family therapy represent the basic dynamics that creates and sustains both functionality and pathology in the most diverse relations. There is always some constitutive affect present, most often preserved deep in an unconscious level of psychological experience, and it is therefore often difficult to perceive, recognize, and reveal this in the multi-layered entanglement of the most various relations that the individual participates in (Gostecnik, 2004). The organic basis that makes it possible to understand the mutuality and affective basis of human activity is the mechanism for regulating affects and the dynamics of attachment, which are the core of the organic formation of the human brain. If we understand mutuality between two persons at such a complex level, we quickly see that it is not only a matter of the transfer of feelings between two people, but the actual organic growth and development of those nerve cells that form the central information system of the human brain (Siegel, 1999). Traumatic experiences enter into the family system at all levels through strong affects and extreme relational stress through interpersonal regulation mechanisms, and these directly shape the development and formation of the brain's operation. From the pattern of relationships between family manners, especially through the regulation of stress and the manner of establishing and breaking off contact between them, we can get a sense of the depth of mutuality and connection. A new professional understanding of a person arises on the basis of this integration, one that is more complete and especially more natural, because it can integrate both intrapsychic dynamics as well as interpersonal and systemic dynamics. This is where the professional search for a response to the following questions begins: What is the basic motive of family systems, Why is trauma preserved in a particular family, When does stress have traumatic extensions, and Why are traumatic experiences transferred from generation to generation? It especially reveals the systemic nature of the inner psychological world, offering the beginning of a response to the question of why an individual and, at the same time, an individual part of every relationship can be a fractal of the entire system. To date, integration between neuropsychology and psychotherapy has not been completely developed, although the relational family paradigm makes this possible. "For the first time in the history of psychology, this enables us to connect interpersonal relations with a person's organic nature and to establish that this nature is subordinated to the relationship or space between "I" and "you," which opens an extensive area and continually makes possible new discoveries - that is, leads to the very core of nonlinear understanding" (Siegel, 1999, p. 13). We may conclude that: "Based on the model of relational family therapy, the affective space between 'I' and 'you' or other, between a father and mother, and between a father or mother and child, represents one of the 104 K. Kompan Erzar, C. Gostecnik and T. Erzar subsystems or psychic structures in an entire system that is located in a broader system - that is, in the entire family affect that leads and guides the entire family atmosphere (Gostečnik, 2004, p. 25), which in a very strong manner marks the entire family and also has an influence on individual relationships within it. References Bowlby, J. (1982). Attachment. Tavistock, NY. Bradley, S. (2000). Affect regulation and the development of psychopatology. New York: Guilford. Brown, N. in Amatea, E. (2000). Love and intimate relationships. Philadelphia, PA: Brunner/ Mazel. Carlson, J. in Sperry, L. (1999). The Intimate couple. Philadelphia, PA: Brunner/Mazel. Cvetek, R. (2004). Predelava disfunkcionalno shranjenih stresnih izkušenj ter metoda desenzitizacije in ponovne predelave z očesnim gibanjem [Restructuring of traumatic experience with EMDR]. Neobjavljena doktorska disertacija [Unpublished doctoral dissertation]. Ljubljana: Univerza v Ljubljani, Oddelek za psihologijo. Erzar, T. (1999). Izgubljeno sočutje [The lost compassion]. Filozofski vestnik, 20 (3), 147152. Erzar, T. (2002). Slovo od Freuda [The Farewell to Freud]. Ljubljana: Brat Frančišek in Frančiškanski družinski inštitut. Erzar, T. in Kompan Erzar, K. (in press). The Idea of Mutual Affect. Fonagy, P. (2001). Attachment theory and psychoanalysis. London: Karnac. Gostečnik, C. (2000). The operative mechanism in family scapegoating. American Journal of Pastoral Counseling, 3 (2), 3-20. Gostečnik, C. (2004). Relacijska družinska terapija [Relational Family Therapy]. Ljubljana: Brat Frančišek in Frančiškanski družinski inštitut. Kompan Erzar, K. (2001). Nevropsihologija in relacijska terapija [Neuropsychology and relational therapy]. Psihološka obzorja, 10 (4), 119-134. Kompan Erzar, K. (2001). Odkritje odnosa [The discovery of the relationship]. Ljubljana: Brat Frančišek in Frančiškanski družinski inštitut. Kompan Erzar, K. (in press). Relacijska družinska razvojna teorija [Relational family developmental theory]. Schore, A. (2001). The effects of a secure attachment relationship on right brain development, affect regulation, and infant mental health. Infant Mental Health Journal, 22, 201-269. Schore, A. (2003). Affect disregulation and disorders of the Self. New York: Norton. Shaver, P. in Cassidy, J. (1999). Handbook of attachment. New York: Guilford. Siegel, D. (1999). The developing mind. New York: Guilford. Solomon, M. (1992). Narcisism and intimacy: Love an marriage in an Age of confusion. New York: Simon & Schuster. Solomon, M. (1994). Lean on me: The power of positive dependency in intimate relationships. New York: Simon & Schuster. van der Kolk, B. (1996). The complexity of adaptation to trauma: self-regulation, stimulus discrimination, and characterological development. V B. van der Kolk, A. Relational family integration 105 McFarlaine in L. Weisaeth (ur.), Traumatic stress (pp. 182-213). New York: Guilford. Winnicott, D. W. (1990). The Maturational Process and the Facilitating Environment. New York: New York University Press. Prispelo/Received: 03.11.2005 Sprejeto/Accepted: 28.12.2005 106 PSIHOLOGIJA Filozofske fakultete Psihološka obzorja / Horizons of Psychology, 14, 3, 107-124 (2005) © Društvo psihologov Slovenije 2005, ISSN 1318-187 Strokovni empirično-raziskovalni prispevek Fizična zloraba v otroštvu in strah pred intimnostjo v partnerskem odnosu Tanja Repič* Osnovna šola Hinka Smrekarja, Šiška, Ljubljana Povzetek: V raziskavi smo poskušali ugotoviti, kakšna je povezanost med fizično zlorabo v otroštvu (merjeno z lestvico avtorja M. Strausa) in strahom pred intimnostjo v partnerskih odnosih (merjeno z lestvico Fear-of-Intimacy Scale avtorjev C. J. Descutner in M. N. Thelen). Vprašalnik je izpolnilo 355 oseb, od tega 123 moških in 232 žensk. Udeleženci so bili iz štirih skupin: skupina ločenih (N = 42); poročenih (N = 79); skupina tistih, ki živijo v izvenzakonski skupnosti (N = 58), in skupina fantov in deklet, ki so v partnerskem odnosu, vendar ne živijo skupaj (N = 179). Zanimale so nas razlike v strahu pred intimnostjo v partnerskih odnosih pri moških in pri ženskah, tako pri fizično zlorabljenih kot pri nikoli fizično zlorabljenih v času otroštva. Te razlike smo preučevali tako znotraj posameznih skupin kot tudi med skupinami. Prav tako smo preučevali, ali je pogostost fizične zlorabe v otroštvu povezana s stopnjo strahu pred intimnostjo v partnerskih odnosih. Ugotovili smo, da je bilo med vsemi udeleženci raziskave 80 % fizično zlorabljenih v otroštvu (glede na kriterije Strausovega vprašalnika), od tega več moških kot žensk. Moški, ki niso bili fizično zlorabljeni, imajo večji strah pred intimnostjo v partnerskih odnosih kot moški, ki so bili fizično zlorabljeni. Pri ženskah je ravno obratno - večji strah pred intimnostjo v partnerskih odnosih imajo tiste, ki so bile v otroštvu fizično zlorabljene, kot tiste, ki niso bile. V splošnem se večji strah pred intimnostjo v partnerskih odnosih kaže pri moških kot pri ženskah (ne glede na fizično zlorabo). Prav tako so rezultati pokazali, da je strah pred intimnostjo v partnerskih odnosih večji pri v otroštvu fizično zlorabljenih kot pri nikoli fizično zlorabljenih osebah, vendar razlika ni statistično pomembna. Skupina ločenih ima bistveno večji strah pred intimnostjo v partnerskih odnosih kot ostale tri skupine; sledi ji skupina poročenih, potem skupina fantov in deklet, ki so v partnerskem odnosu, pa ne živijo skupaj. Najmanjši strah pred intimnostjo v partnerskih odnosih ima skupina tistih, ki živijo v izvenzakonski skupnosti. Ključne besede: intimnost, telesna zloraba, relacijska družinska teorija, razlike med spoloma, navezanost Physical abuse in childhood and fear of intimacy in adult intimate relationships Tanja Repič Hinko Smrekar Primary School, Šiška, Ljubljana, Slovenia Abstract: In the present study we analyzed the relation between physical abuse in childhood (measured with scale developed by M. Straus) and fear of intimacy in adult intimate relationships (measured with Fear-of-intimacy Scale made by C. J. Descutner and M. N. Thelen). The sample included 355 respondents, among them 123 men and 232 women. They were divided into four study groups: divorced (N = 42), * Naslov / address: Tanja Repič, univ. dipl. socialna pedagoginja, Žapuže 21a, 5270 Ajdovščina, e-mail: tanja.repic1@guest.arnes.si 108 T. Repič married (N = 79), cohabitants (N = 58), and those who are dating, but do not live together (N = 179). We were interested in how both groups, namely physically abused in childhood and never physically abused male and female respondents differ in fear of intimacy in adult intimate relationships. These differences were examined within each study group and also between different study groups. We also studied whether there is any relation between the frequency of physical abuse in childhood and the fear of intimacy in adult intimate relationships. The results demonstrated that 80% of participants were physically abused in childhood (according to the criteria of Straus' questionnaire). Among them more men were abused than women. Men, who were not physically abused, exert less fear of intimacy than those who were abused. The opposite trend was observed in women: women, who were physically abused, have more fear of intimacy than those who were not. In general, men manifested more fear of intimacy then women (regardless of physical abuse). The results also indicated that the abused express larger fear of intimacy than those who were not abused, but the difference is not statistically significant. The greatest fear of intimacy is demonstrated by divorced participants, followed by married participants, then those who are dating but do not live together. The least fear of intimacy is demonstrated by cohabitants. Key words: intimacy, physical abuse, relational family theory, gender differences, attachment behavior CC = 3310 Otroci, ki niso dobili varnosti od staršev, ne v fizičnem ne v psihološkem smislu, ali pa so bili kakorkoli zlorabljeni, bodo za vedno priklenjeni na notranji svet ogrožujočih doživetij z drugimi, ki so jih ponotranjili (Framo, 1992). Travmatične in močnejše stresne izkušnje v otroštvu in navezanosti imajo dolgotrajen vpliv na človekovo doživljanje, posledice takih izkušenj se kažejo v večji anksioznosti, neprimerni regulaciji afekta, depresiji, zlorabi substanc, kompulzivnem ponavljanju travmatičnih scenarijev, občutkih sramu in krivde, destruktivnosti do sebe, pa tudi v slabšem telesnem zdravju (Cvetek, 2002, 2004). Ponotranjene izkušnje navezanosti iz zgodnjega otroštva pa predvsem določajo in začrtajo model prihodnjih odnosov (Cvetek, 2004; Gostečnik, 2002). Relacijsko družinski model (Cvetek, Kompan Erzar, Erzar in Gostečnik, 2004; Gostečnik, 2004) poudarja, da motnje v zgodnjih odnosih s pomembnimi drugimi resno vplivajo na kasnejše težave v odraslih odnosih, ker zgodnji odnosi oblikujejo način, na katerega otrok, in kasneje odrasli, s pomočjo mehanizma projekcijske identifikacije gradi svoj notranjepsihični in medosebni svet odnosov, dojemanja in regulacije afekta. Vse več je tudi raziskav, ki kažejo na številne posledice zanemarjanja ter fizičnih in spolnih zlorab. Otroci, ki so bili zanemarjeni s strani staršev, so tudi kasneje nagnjeni k zavrnitvi s strani sovrstnikov in npr. izbirajo romantične partnerje, ki so tudi naravnani k neprilagojenim medosebnim odnosom, in zato podobno doživljajo konfliktne situacije v njihovih romantičnih navezavah (Downey in Feldman, 1996). Prav tako pretirano fizično kaznovanje, ki mu sledi starševska moč, v smislu zapovedi in prepovedi, ki so preostre in vsebujejo poniževanje, povečuje vedenjske probleme, agresijo in poznejše težave v interpersonalnih odnosih (Cohen in Brook, 1995, po Ehrensaft in dr., 2003; Fergusson in Linskey, 1997, po Ehrensaft in dr., 2003). Poleg fizične zlorabe otrok, ki Fizična zloraba in strah pred intimnostjo 109 se odraža v pretepanju, fizičnem poškodovanju kot posledica suvanja, klofutanja, brcanja, dušenja (Connelly in Straus, 1992), pa tudi izpostavljenost otroka partnerskemu nasilju, povzroča izkrivljeno regulacijo afekta in neprimerno pričakovanje o tem, kako naj bi izgledal partnerski odnos (Dodge in dr., 1990). Podobno tudi Gostečnik (2004) trdi, da lahko tako družinsko vzdušje, ki ga doživlja otrok, kasneje pri odraslem vodi v zelo groba vedenja in reakcije v zakonskem odnosu. Prav tam lahko kruto fizično ravnanje sozakonca obljublja najmočnejši, včasih celo edini stik med njima. Raziskave so pokazale, da so očetje, ki so fizično zlorabljali svoje otroke, bili v primerjavi z očeti, ki jih niso, tudi do žen verbalno ali celo fizično nasilni (Coohey, 2000). Strokovnjaki (npr. Boney-McCoy in Finkelhor, 1995; Thompson, Kingree in Desai, 2004) ugotavljajo, da dečki pogosteje doživljajo fizične zlorabe v otroštvu kot deklice, vendar je fizična zloraba kljub temu, da ima negativne posledice tako za fante kot za dekleta, veliko bolj škodljiva za dekleta, ker močneje vpliva na njihovo samopodobo in tudi na doživljanje intimnosti. Nekateri (npr. Rubin, 1983) v tem vidijo tudi razlike v razvoju spolne identitete med deklicami in dečki. Slednji morajo potlačiti svojo emocionalno navezanost na mater, ne pa spolne privlačnosti, zato je pozneje spolna oziroma telesna povezava dominantna v njihovih romantičnih odnosih. Pri deklicah je ravno obratno; ker potlačijo svojo seksualno privlačnost na mater, emocionalna pa ostane, bodo zato prav prek čustev lahko doživljale najglobljo intimnost v odnosih (Rubin, 1983). Zaradi teh razlik v otroškem doživljanju ženske iščejo intimnost, zavezo in varnost v intimnih odnosih, moški pa romantično privlačnost in intimnost doživlja bolj preko fizične privlačnosti (Pines, 1999). Fizično zlorabljeni otroci se nagibajo k izogibajočemu stilu navezanosti, k večji anksioznosti, agresiji, primitivnim obrambnim mehanizmom, suicidalni in depresivni simptomatologiji (Finzi in dr., 2002; Kent, Waller in Dagnan, 1999; Lipschitz, Bernstein, Winegar in Southwick, 1999). Študije kažejo, da je klinična depresija pogostejša pri fizično in spolno zlorabljenih dekletih kot pa pri tistih, ki so bile le fizično zlorabljene (Green, Russo, Navratil in Loeber, 1999). Tako fizične kot spolne zlorabe pa kažejo na pogostejše travmatične odzive v medosebnih odnosih, ob tem pa je možno zaslediti tudi pogostejše disociativne motnje, misli vsiljivke in različne »flashbacke« ter večji strah pred intimnostjo (Davis, Petretic-Jackson in Ling, 2001). Kolko (1992, po Davis in dr., 2001) ugotavlja, da so fizično zlorabljeni otroci kot odrasli veliko bolj agresivni in občutljivi na vsako stvar. Mullen (1996, po Davis in dr., 2001) dodaja, da imajo vsi ti odrasli v partnerskih odnosih veliko več težav. Kljub temu, da odrasli posamezniki ne govorijo vedno o problemih, ki jih imajo v medosebnih odnosih, je kvaliteta njihovih odnosov lahko bistveno slabša, predvsem zaradi njihovega vedenja, samovrednotenja in doživljanja sebe, ki pa vedno bistveno vplivajo na vsako interakcijo z drugimi (Davis in dr., 2001). Čeprav obrambni mehanizmi, kot so disociacija in izogibanj e, lahko na zelo učinkovit način znižaj o »flashbacke« in spomine na travmatična doživetja, pa ravno ti mehanizmi obenem tudi povzročajo in ohranjajo strah pred intimnostjo ter s tem znižujejo možnost, da bi posameznik lahko izkusil drugačne, pozitivne odnose (Davis in dr., 2001). 110 T. Repič Relacijsko družinski model (Gostečnik, 2004) govori o pravem začaranem krogu, ki se zdi usodno neizogiben, saj posameznik, ki je bil kot otrok zlorabljen, ne more »ne iskati« partnerja, ki mu ne bi ponovil vzdušja zlorabe iz otroštva. Vse to pa poteka na nezavedni ravni z namenom, da bi prišlo do razrešitve afektivnega psihičnega konstrukta, ki je najgloblja gonilna sila vsakega nefunkcionalnega odnosa, zato postane tudi bistveni sestavni del regulacije afekta. K. Kompan-Erzar (2003) piše, da se pri partnerjih, ki se ranljivosti izrazito bojijo, vzpostavi močan strah pred intimnostjo. V tistem partnerskem odnosu, kjer ni dovolj varnosti, da bi lahko partnerja drug pred drugim izrazila lastno šibkost, nemoč, strah in bolečino, bosta ranljiva čutenja pri sebi zanikala, pri drugem pa nehote spodbujala in povzročala. To čustveno dinamiko nerazrešenega konflikta bosta zakonca ponavljala v začaranem krogu enih in istih čustvenih stanj, ki pa ne bodo spodbujala odnosa k razvoju, ampak ravno nasprotno -varovala ju bodo pred ranljivostjo oziroma intimnostjo, ki si jo oba želita (Gostečnik, 1997, 1998, 2000, 2001, 2002, 2004). Afekti, ki so vezani na najzgodnejša doživetja, najgloblje zaznamujejo posameznikov dostop in pristop k intimnim odnosom ter predstavljajo jedro otrokove osebnosti (Solomon, 1992). Ce takrat ni bilo čustvene varnosti, je vzpostavitev srečnega in zdravega intimnega partnerskega odnosa precej tvegana in težavna. Naseli se strah pred intimnostjo, ki pri možu in ženi preprečuje ravno tisto, kar si oba najbolj želita, saj tudi ob svojih starših nista bila slišana in sprejeta v najglobljih potrebah ter se zato strahovito bojita bližine, kajti s tem lahko tvegata ponovno zavrnitev, razočaranje in ranjenost (Gostečnik, 2001). Podobno tudi Napier (1998) piše, da smo najglobljo intimnost doživljali, ko smo bili še otroci v naročju svojih mater. Ce smo bili takrat pogosto porinjeni v ogrožujoče, boleče vzdušje, smo se že zgodaj naučili, da je intimnost zelo nevarna in prav te zgodnje emocionalne rane so ene izmed prvenstvenih blokad pri intimnosti v odraslosti. Na nezavednem nivoju bodo ti pari ponovili travme iz otroštva in neizogibno razočarali drug drugega. V tej najzgodnejši dobi se oblikujejo tudi obrambni mehanizmi, ki pozneje na vseh mogočih področjih bistveno prispevajo k strahu pred intimnostjo. Ceprav se mnenja o definiciji intimnosti razlikujejo, se mnogi teoretiki strinjajo, da je intimnost večdimenzionalna in da je sestavljena iz psihičnih komponent, kot so ljubezen in naklonjenost, osebnostno prepoznanje (nekdo te ima rad, si mu blizu, si te želi), zaupanje in odkrivanje sebe drugemu (Berscheid, 1985; Hatfield in Rapson, 1993; Levine, 1991; Prager, 1995, 1999; po Hook in dr., 2003). Bagarozzi (1997) piše, da je intimnost najbolj vitalna, centralna in kritična dimenzija vsakega bližnjega odnosa, kjer vlada zaveza, zato je prava intimnost sestavljena iz sedmih komponent: emocionalne, intelektualne, socialne, spolne, rekreativne, duhovne in estetične. K. Kompan-Erzar (2003) meni, da lahko intimnost med dvema odraslima osebama nastane samo v ozračju medsebojne iskrenosti, odprtosti in ranljivosti. Intimnost po Waringu in Reddonu (1983) vljučuje način reševanja konfliktov, izražanje čustvene bližine, predanost zakonu, seksualnost, samozaupanje in samozavest partnerjev, zmožnost delati in se zabavati skupaj, medsebojno deljenje misli, prepričanj in čutenj Fizična zloraba in strah pred intimnostjo 111 ter neodvisnost partnerjev od primarne družine. Napier (1998) intimnost opisuje kot most med dvema osebama, ki se ne počutita prisiljeni, da morata biti skupaj, ampak je to njuna odločitev, da se bosta skupaj predali in doživljali najlepše trenutke. Raziskave kažejo, da zlorabljeni pogosteje menjajo spolne partnerje in iščejo predvsem samozavest ter samovrednotenje zaradi strahu pred intimnostjo (Traeen in Sorensen, 2000; Chu in Bowman, 2002; Meston in Heiman, 1999; Noll, Trickett in Putnam, 2003). Martin in Ashby (2004) ugotavljata, da tisti, ki so nagnjeni k perfekcionizmu, doživljajo večji strah pred intimnostjo, medtem ko Lutwak, Panish in Ferrari (2003) trdijo, da ima sram, ter z njim povezano samoobtoževanje in obtoževanje drugih, največjo vlogo pri tem strahu. Podobno tudi Blavier in Glenn (1995) menita, da ponotranjen sram, ki ga čutita partnerja, zamegli realno dojemanje tako sebe, partnerja, kot tudi partnerskega odnosa, kar pa vpliva na večji strah pred intimnostjo. Iz zgoraj navedenih raziskav o fizični zlorabi v otroštvu in strahu pred intimnostj o v odrasli dobi lahko vidimo, da imajo posamezniki, ki so bili fizično zlorabljeni kot otroci, poleg drugih posledic tudi več težav in strahu pred intimnostjo v partnerskih odnosih. Primanjkuje pa raziskav, kjer bi ugotavljali izključno korelacijo med fizično zlorabo v otroštvu in strahom pred intimnostjo v partnerskih odnosih, s čimer se ukvarja pričujoči prispevek. Predvidevam, da bodo fizično zlorabljeni imeli večji strah pred intimnostjo kot tisti, ki niso bili fizično zlorabljeni, ter da sta pogostost in intenzivnost fizične zlorabe pozitivno povezani s strahom pred intimnostjo. Zlasti pa se želim v raziskavi osredotočiti na štiri raziskovalne skupine, ki doslej še niso bile predmet raziskovanja, vsaj kar se tiče fizičnih zlorab v povezavi s strahom pred intimnostjo. Te štiri skupine so: 1. skupina fantov in deklet, ki hodijo skupaj in ne živijo skupaj, 2. skupina fantov in deklet, ki so neporočeni in že živijo skupaj (skupina kohabitantov), 3. skupina ločenih in 4. skupina poročenih. Te štiri skupine bom med seboj primerjala in predvidevam, da bom odkrila razliko v strahu pred intimnostjo med tistimi, ki so bili fizično zlorabljeni, in med tistimi, ki niso bili fizično zlorabljeni. Obenem tudi predvidevam, da bo v 1. skupini, kjer partnerja še ne živita skupaj, manjši strah pred intimnostjo kakor v ostalih treh. Poleg tega predvidevam, da bo največji strah pred intimnostjo v 3. skupini, saj imajo ločeni še dodatno izkušnjo prevare, izdajstva in zavrženosti. Znotraj teh skupin se bom osredotočala tudi na razlike med spoloma. Na podlagi ugotovitev literature (Pines, 1999; Rubin, 1983) tudi predvidevam, da bodo fantje, ki so bili fizično zlorabljeni, načeloma iskali več telesnega stika, kar bodo lahko doživljali kot manjši strah pred intimnostjo. 112 T. Repič Metoda Udeleženci Vprašalnik je prejelo 500 oseb. V obdelavi smo upoštevali 355 vprašalnikov, ki so bili vrnjeni do zaključka zbiranja odgovorov in so bili obenem tudi v celoti izpolnjeni. V raziskavi je sodelovalo 123 moških (35 % vzorca) in 232 žensk (65 % vzorca). Pogoj sodelovanja ni bil, da udeleženci izpolnjujejo vprašalnik skupaj s partnerjem, ampak je lahko to storil samo eden izmed njiju, s tem da so se njegovi odgovori nanašali na odnos, v katerem je. Razdeljeni so bili v štiri skupine: v 1. skupini so bili fantje in dekleta, ki hodijo skupaj in ne živijo skupaj (skupina SH, 176 oseb), v 2. skupini so bili fantje in dekleta, ki živijo skupaj (skupina IZS, 58 oseb), v 3. skupini so bili poročeni (skupina P, 79 oseb) in v 4. skupini so bili ločeni (skupina L, 42 oseb). Skupina ločenih je odgovarjala na vprašanja glede na odnos, ki so ga imeli z bivšim partnerjem, od katerega so se ločili. Povprečna starost znotraj skupine SH je bila 24 let, trajanje odnosa pa 3 leta (SD = 1,99); povprečna starost v skupini IZS je bila 31 let, trajanje odnosa 7 let (SD = 5,24); povprečna starost v skupini P je bila 43 let, trajanje odnosa 20 let (SD = 8,32) in povprečna starost v skupini L je bila 42 let, trajanje odnosa pa 16 let (SD = 8,68). Upoštevala sem samo tiste vprašalnike, kjer je bilo trajanje odnosa daljše od enega leta, ker je bil tako bolj verjetno izključen vpliv zaljubljenosti, ki bi zagotovo bistveno spremenil realne rezultate. Instrumenti Strah pred intimnostjo (SPI) smo merili z lestvico Fear-of-Intimacy Scale (Descutner in Thelen, 1991). Lestvica je bila prevedena iz angleškega jezika v slovenski jezik. Originalna lestvica v prvem delu (A) zajema 30 vprašanj o zamišljenem partnerskem odnosu, v drugem (B) pa 5 vprašanj o preteklih partnerskih odnosih. Drugi del (B) oziroma zadnjih pet trditev smo v našem vprašalniku izločili iz lestvice, ker se navezuje na pretekle partnerske zveze vprašanih in bi zato lahko prihajalo do kakšnih primerjav med sedanjim in preteklimi partnerji, nas pa je zanimal le en intimen partnerski odnos. V prvem delu lestvice (delu A) si vprašani lahko zamišljajo, da so v intimnem partnerskem odnosu in na petstopenjski lestvici odgovarjajo, kako močno se strinjajo oziroma se ne strinjajo z vsako trditvijo. Trditve, ki predpostavljajo, da vprašani trenutno ni v intimnem partnerskem odnosu, smo priredili tako, da kažejo na to, da vprašani v takem odnosu je. Npr. trditev: »Partnerju bi mi bilo neprijetno pripovedovati o stvareh iz moje preteklosti, ki se jih sramujem,« smo zamenjali s trditvijo »Neprijetno mi je pripovedovati partnerju o stvareh iz moje preteklosti, ki se jih sramujem.« Izločili smo 9. trditev, ki se glasi: »Del mene bi se bal vzpostaviti resno dolgoročno partnersko zvezo,« kajti udeleženci so že v taki zvezi in ta tematika zanje ni smiselna. Izjema je bila skupina ločenih, ki so na vseh 29 vprašanj v prvem delu našega vprašalnika odgovarjali glede na pretekli odnos s svojim bivšim partnerjem. Fizična zloraba in strah pred intimnostjo 113 Descutner in Thelen (1991) sta pokazala, da je angleška verzija lestvice veljaven in zanesljiv inštrument (z enomesečno test-retest korelacijo 0.89) za merjenje tesnobe posameznika glede čustvene intimnosti v partnerskem odnosu. Višji kot je rezultat, večji je strah pred intimnostjo. Fizično zlorabo v otroštvu (FZ) smo merili z lestvico avtorja Strausa (1979), ki je narejena za namene odkrivanja fizičnih zlorab, sestavljena pa je iz 12 vprašanj. Vprašani so odgovarjali, če so kot otroci (otroštvo ni bilo posebej definirano) izkusili katero izmed 12 nasilnih obnašanj s strani mame, očeta, učitelja v šoli, sorodnikov ali drugih oseb. Med nasilna obnašanja so spadala naslednja dejanja: grobo suvanje ali porivanje, metanje predmetov v otroka, puljenje las, udarci ali klofutanje, brcanje ali grizenje, dušenje, davljenje ali poskus utopitve, grobo pretepanje z roko, pretepanje s predmeti, grožnje s pištolo, grožnje s kakim drugim orožjem, uporaba pištole nad otrokom na kakšen drug način ter uporaba drugega orožja nad otrokom na kakšen drug način. Ce so udeleženci odgovorili na eno izmed vprašanj pritrdilno, smo jih po navodilih avtorja lestvice Strausa obravnavali kot fizično zlorabljene v otroštvu. Na koncu lestvice pa smo dodali še vprašanje: »Kako pogosto ste bili fizično kaznovani kot otroci?« Udeleženci so izbirali med odgovori redko, občasno, pogosto in nikoli. S temi odgovori smo lahko ocenjevali povezavo med pogostostjo fizične zlorabe v otroštvu in strahom pred intimnostjo v partnerskih odnosih. Postopek Postopek zbiranja udeležencev je deloma potekal s pomočjo dveh skupin, ki potekata v okviru Frančiškanskega družinskega inštituta v Ljubljani - skupine za »predzakonce« in skupine za »razporočene« (ločene). Prisotni na skupinah (57 %) so spadali v skupine SH, IZS ter L, bili pa so iz cele Slovenije. S strani vodstva obeh skupinje bilo pridobljeno dovoljenje, da se prisotne lahko zaprosi za udeležbo v raziskavi. Vodja jim je povedal, kaj se bo v raziskavi ugotavljalo in predstavil raziskovalko, ki je razložila, da je udeležba prostovoljna in da bodo vsi odgovori anonimni ter uporabljeni izključno v raziskovalne namene. Na začetku enega od srečanj skupine so vprašalnik skoraj vsi izpolnili, razen nekaterih posameznikov, ki že vnaprej niso želeli sodelovati. Ostali udeleženci (43 %) pa so bili izbrani izmed študentov 1. letnika Teološke fakultete v Mariboru in Ljubljani. Nepopolno izpolnjene vprašalnike in vprašalnike udeležencev, pri katerih je bilo trajanje odnosa krajše od enega leta (N = 145), smo izločili, ostale (N = 355) pa smo na osnovi statusa razvrstili v štiri skupine. Za analizo rezultatov smo uporabili predvsem statistični metodi t-testa za neodvisne vzorce z neenako varianco in t-testa za neodvisne vzorce z enako varianco. Oblikovali smo skupine glede na spol, glede na dejstvo ali je bila oseba fizično zlorabljena ali ne ter glede na status (ločeni, poročeni, skupina fantov in deklet, ki hodijo skupaj, pa ne živijo skupaj ter skupina fantov in deklet, ki hodijo skupaj in živijo skupaj) ter jih s t-testi primerjali med seboj. Zaradi večjega razumevanja rezultatov smo za vsako polje izračunali še mero učinka. 114 T. Repič Rezultati Rezultati vseh udeleženih v raziskavi (N = 355) kažejo, da je bilo 285 (80 %) udeležencev fizično zlorabljenih v otroštvu, od tega 167 (47 %) redko, 91 (25 %) občasno in 27 (8 %) pogosto. Le 70 (20 %) udeležencev ni bilo nikoli fizično zlorabljenih. Moški so bili nekoliko pogosteje žrtve fizične zlorabe kot ženske (od vseh moških jih je bilo 83 % fizično zlorabljenih, od vseh žensk pa 79 %), vendar ta razlika ni statistično pomembna. Največji strah pred intimnostjo imajo osebe, ki so bile pogosto fizično zlorabljene (M = 68, SD = 20), sledijo občasno fizično zlorabljene osebe (M = 64, SD = 16) in potem še redko fizično zlorabljene osebe (M = 60, SD = 18). Najmanjši strah pred intimnostjo imajo nikoli fizično zlorabljene osebe (M = 59, SD = 18). Med tistimi, ki so bili redko, občasno ali pogosto fizično zlorabljeni obstajajo torej razlike v strahu pred intimnostjo, vendar te niso statistično pomembne (pogosto fizično zlorabljeni in občasno fizično zlorabljeni: t(116) = 0,926, p > 0,05; pogosto fizično zlorabljeni in redko fizično zlorabljeni: t(192) = 1,89, p > 0,05; občasno fizično zlorabljeni in redko fizično zlorabljeni: t(256) = 1,630, p > 0,05). Če te skupine primerjamo še s tistimi, ki niso bili nikoli fizično zlorabljeni, podobno ne pride do statistično pomembnih razlik, čeprav se razlike statistični pomembnosti približujejo (npr. med pogosto fizično zlorabljenimi in nikoli fizično zlorabljenimi je t(95) = 1,96, p = 0,053). Mere učinka pri razlikah med pogosto fizično zlorabljenimi in redko fizično zlorabljenimi (d = 0,40) ter med pogosto fizično zlorabljenimi in nikoli fizično zlorabljenimi (d = 0,44) kažejo na srednje velike učinke skupine, medtem ko so mere učinka pri ostalih primerjavah skupin nižje. Tabela 2 kaže, da imajo moški, ki niso bili fizično zlorabljeni, večji strah pred intimnostjo kot moški, ki so bili fizično zlorabljeni, vendar razlika ni statistično pomembna, t(121) = -0,592, p > 0,05. Pri ženskah je ravno obratno - večji strah pred intimnostjo imajo tiste, ki so bile fizično zlorabljene, kot tiste, ki niso bile, vendar razlika prav tako ni statistično pomembna, t(230) = 1,749, p > 0,05. Te ugotovitve veljajo tako za posamezne skupine kot za vse udeležence raziskave skupaj. Pri vseh vprašanih smo ugotovili tudi, da imajo fizično zlorabljeni moški večji (vendar ne statistično pomembno) strah pred intimnostjo kot fizično zlorabljene ženske, t(283) = -0,653, p > 0,05. Enako velja tudi za nikoli fizično zlorabljene moške, ki imajo ravno tako večji (vendar ne statistično pomembno) strah pred intimnostjo kot nikoli fizično zlorabljene ženske, t(68) = -1,91,p > 0,05. Tabela 1. Število in odstotek udeležencev glede na pogostost fizične zlorabe. nikoli FZ redko FZ občasno FZ pogosto FZ Moški 21(17%) 62(50%) 30(24%) 10(9%) Ženske 49(21%) 105(45%) 61(26%) 17(8%) Vsi (m+ž) 70(20%) 167(47%) 91(25%) 27(8%) Opomba. FZ - fizično zlorabljeni. m+ž - skupaj moški in ženske Fizična zloraba in strah pred intimnostjo 115 Tabela 2. Strah pred intimnostjo (SPI) pri fizično zlorabljenih in nikoli fizično zlorabljenih moških in ženskah. ločeni poročeni SH IZS VSE SKUP. m. ž. m+ž m. ž. m+ž m. ž. m+ž m. ž. m+ž m. ž. m+ž FZ M 76 77 76 68 62 64 61 60 60 58 55 56 63 62 62 SD 14 21 20 19 17 18 16 17 17 13 14 13 17 18 18 NFZ M / 76 76 70 59 61 65 53 57 64 50 56 65 57 59 SD / 22 22 24 21 21 18 15 17 16 11 15 17 18 18 pombe. FZ - fizično zlorabljeni, NFZ - nikoli fizično zlorabljeni, m. - moški, ž. - ženske, m+ž - skupaj moški in ženske, SH - skupna hoja fant/punca (ne živijo skupaj), IZS - skupna hoja fant/punca (živijo skupaj), VSE SKUP. - vse skupine skupaj. Raziskava je tudi pokazala, da je strah pred intimnostjo večji pri (pogosto, občasno in redko skupaj) fizično zlorabljenih osebah kot pri nikoli fizično zlorabljenih osebah, vendar ta razlika ni statistično pomembna (glej tabelo 4, polje FZvsi udelež.-NFZvsi udelež.). Skupina ločenih (L) ima največji strah pred intimnostjo, sledi skupina poročenih (P), potem skupina fantov in deklet, ki hodijo skupaj in ne živijo skupaj (SH), in nazadnje še skupina fantov in deklet, ki so neporočeni in že živijo skupaj (IZS; glej tabelo 2). Ker večsmerne ANOVA-e nismo mogli izvajati (eno polje, NFZmL, je prazno, vsi ločeni moški v našem vzorcu so bili namreč fizično zlorabljeni, glej tabelo 3), smo s t-testi preverili znotraj vseh štirih skupin (skupine SH, IZS, P in L) morebitne razlike v strahu pred intimnostjo med fizično zlorabljenimi in nikoli fizično zlorabljenimi moškimi in ženskami (glej tabelo 3). Prav tako smo preverjali s t-testi pomembnost razlik med vsemi skupinami (iz vsake skupine smo fizično zlorabljene/nikoli fizično zlorabljene moški in ženske primerjali še z vsemi ostalimi tremi skupinami fizično zlorabljenih in nezlorabljenih moških in žensk; glej tabelo 3). Potem pa smo z isto metodo ugotavljali, če obstajajo statistično pomembne razlike med skupinami (med skupino SH, IZS, P in L), vendar ne glede na spol, ampak samo glede na dejstvo, ali je šlo za fizično zlorabo ali ne (glej tabelo 4). Ker je bilo izvedenih veliko število t-testov na istih podatkih (tabela 3 in 4), je verjetnost napake tipa I najverjetneje podcenjena, vendar smo se v izogib napaki tipa II odločili, da popravka za število testov v naši analizi ne bomo uporabili1. Zaradi boljše primerljivosti smo nato izračunali še mero učinka (Cohenov d) za vsako polje (glej tabelo 3 in 4), ki kaže na praktično pomembnost razlike (npr. 1 Pri velikem številu i-testov na istih podatkih je verjetnost napake tipa I večja, kot bi bila v primeru izvajanja enega samega t-testa. Pri izračunu bi lahko uporabili Bonferronijev popravek, pri katerem zahtevano raven tveganja dobimo tako, da zahtevanih 5 % delimo s številom vseh i-testov, vendar bi to v našem primeru pomenilo, da bi bila potrebna raven zelo restriktivna in zahtevna in bi težko prišlo do statistične pomembnosti pri kateremkoli testu. Zaradi tega je uporaba Bonferronijevega popravka tudi vprašljiva, saj je zelo konzervativen in je vsak individualen test podvržen nerazumljivo visokemu standardu, kar povečuje verjetnost za napako tipa II in onemogoči, da bi bili legitimno pomembni rezultati odkriti (npr. Walld, 2003). Tabela 3. Rezultat t-testa, stopnje svobode, vrsta testa in mera učinka (Cohenov d) pri testiranju razlik v strahu pred intimnostjo znotraj skupin in med skupinami, ločenimi tudi glede na spol. FZm NFZm FZž NFZž FZm NFZm FZž NFZž FZm NFZm FZž NFZž FZm NFZm FZž L L L L P P P P SH SH SH SH IZS IZS IZS NFZm(L) Vsi FZ FZž(L) 0,960 Vsi FZ dt=34 a d= 0.05 NFZž(L) -0,013 Vsi FZ 0,067 cffM2 a df=32 a d=0 d= 0,05 FZmfP) 1,017 Vsi FZ 1,551 0,924 df=rll a cffM7 a rf/^25 a d= 0,44 rf=0,43 ci=0,40 NFZmfP) 0.509 Vsi FZ 0,512 0,375 df=9 a df=29 a df^l a d= 0.38 rf= 0,33 d=0,29 FZž(P) 2,197» Vsi FZ 3,280** 1,858 df=:50 a rf/^70 a cffMSa d= 0.82 rf= 0,75 cH>, 78 NFZž(P) 2,003 Vsi FZ 2,393* 1,612 df=\l a rf/^37 a , 77 FZmfSH) 2,493* Vsi FZ 3,832** 2,117* dt=65 a d£=85 a rf/^63 a d= 0,94 rf=0,84 d=0,SS NFZmfSH) 1,477 Vsi FZ 1,743 1,187 df=19 a rf/^39 a ,58 FZž(SH) 2,708»» Vsi FZ 4,425** 2,318* dM6a cffM06 a rf/^84 d= 1,00 rf=0,90 d=0,94 NFZž(SH) 3,370»» Vsi FZ 4,603** 3,074* df=30 a cffK50 a d/=2 8 a cM,28 cM ,09 ,12 0,104 -0,426 -0,558 -0,776 -0,771 rf^32a ,18 d=0 cH>,12 2,861** 1,745 2,170* -0,953 2,142* cffM3 a rf/^25 a rf/^66 a rf/^33 a cff^Sl a d=0,79 cM ,00 rf= 0,53 d=0,35 d=0,50 -1,627 1,289 0,774 0,108 0,650 rf/^33 a ,36 0,049 -0,686 -1,539 -0,912 ,14 rf= 0,23 d=0,64 2,107* 1,474 0,477 1,500 -1,919 0,885 ,21 rf= 0,67 d=0,93 cH>,38 Opombe: FZm - fizično zlorabljeni moški, FZž - fizično zlorabljene ženske, NFZm - nikoli fizično zlorabljeni moški, NFZž - nikoli fizično zlorabljene ženske, P - poročeni, L - ločeni, SH - skupna hoja fant/punca (ne živijo skupaj), IZS - skupna hoja fant/punca (živijo skupaj), a - Mest za neodvisne vzorce z enako varianco, b - Mest za neodvisne vzorce z neenako varianco. *p < 0,05. "p < 0,01. Fizična zloraba in strah pred intimnostjo 117 Cankar in Bajec, 2003). Rezultati so pokazali, da znotraj posameznih skupin ni bilo statistično pomembnih razlik v strahu pred intimnostjo pri fizično zlorabljenih in tistih, ki niso bili fizično zlorabljeni (glej tabelo 3), razen v skupini SH se kaže statistično pomembna razlika med nikoli fizično zlorabljenimi moškimi in nikoli fizično zlorabljenimi ženskami (glej tabelo 3, polje NFZmSH-NFZžSH). To razliko označuje srednja vrednost mere učinka (d = 0,50). Mere učinka so pri razlikah med spoloma podobne tudi v skupini poročenih (dosegajo srednje vrednosti). Bistveno več statistično pomembnih razlik pa se kaže med posameznimi skupinami. Omenila bom samo najpomembnejše. Med vsemi fizično zlorabljenimi ženskami daleč najbolj izstopa skupina fizično zlorabljenih ločenih žensk (FZž(L)), saj so med njo in ostalimi tremi skupinami fizično zlorabljenih žensk statistično pomembne razlike na nivoju 1 -odstotnega tveganja (glej tabelo 3, polje FZžL-FZžSH, polje FZžL-FZžP in polje FZžL-FZžIZS). Mere učinka med to skupino in ostalimi skupinami imajo večje vrednosti (tabela 3). Presenetljivo je, da se prav ta skupina fizično zlorablj enih ločenih žensk statistično pomembno razlikuje od fizično zlorabljenih moških iz skupine SH (glej tabelo 3, polje FZžL-FZmSH) in IZS (polje FZžL-FZmIZS). Skupina nikoli fizično zlorabljenih ločenih žensk je manj izstopajoča, čeprav rezultati kažej o, da so razlike med slednj o skupino in nikoli fizično zlorablj enimi ženskami iz skupine SH (glej tabelo 3, polje NFZžL-NFZžSH) ter nikoli fizično zlorabljenimi ženskami iz skupine IZS (polje NFZžL-NFZžIZS) prav tako statistično pomembne. Mere učinka te skupine fizično zlorabljenih ločenih žensk v primerjavi z drugimi skupinami dosegajo večinoma visoke vrednosti. Prav tako so rezultati pokazali, da so nikoli fizično zlorabljene ženske iz skupine IZS imele med vsemi udeleženci raziskave najmanjši strah pred intimnostjo, kar posledično, v primerjavi z drugimi skupinami prinaša precejšnje statistično pomembne razlike na ravni 1-odstotnega tveganja. Naj omenim to razliko samo med dvema skupinama - med fizično zlorabljenimi moškimi iz skupine L (glej tabelo 3, polje FZmL-NFZžlZS) in med fizično zlorabljenimi ženskami iz skupine L (polje FZžL-NFZžIZS). Mere učinka te skupine nikoli fizično zlorabljenih žensk v skupini IZS v primerjavi z drugimi skupinami kažejo tudi visoke vrednosti (predvsem v primerjavi s skupino ločenih in poročenih). Med vsemi moškimi udeleženci pa so imeli največji strah pred intimnostjo ločeni, kar tudi nakazuje na mnoge statistično pomembne razlike v primerjavi z drugimi skupinami, in sicer na nivoju 1-odstotnega tveganja. Fizično zlorabljeni ločeni moški se razlikujejo od: fizično zlorabljenih žensk iz skupine SH (glej tabelo 3, polje FZmL-FZžSH), fizično zlorabljenih moških iz skupine IZS (polje FZmL-FZmIZS), nikoli fizično zlorabljenih žensk iz skupine SH (polje FZmL-NFZžSH), fizično zlorabljenih žensk iz skupine IZS (polje FZmL-FZžIZS) ter še od mnogih drugih skupin. Če sedaj v splošnem pogledamo še rezultate za vse skupine udeležencev skupaj (tabela 4), lahko vidimo, da imajo daleč največji strah pred intimnostjo tisti, ki so ločeni 118 T. Repič Najmanjši SPI Največji SPI ^ NFZz FZz FZm NFZm ■ Slika 1. Stopnja strahu pred intimnostjo glede na spol in dejstvo, ali je bila oseba fizično zlorabljena ali ni bila. Oznaka NFZž predstavlja nikoli fizično zlorabljene ženske, FZž fizično zlorabljene ženske, FZm fizično zlorabljene moške, NFZm nikoli fizično zlorabljene moške in SPI strah pred intimnostjo. Tabela 4. Rezultat t-testa, stopnje svobode, vrsta testa in mera učinka (Cohenov d) pri testiranju razlik v strahu pred intimnostjo med skupinami, vendar ne glede na spol. NFZ FZ NFZ FZ NFZ FZ NFZ FZ VSE ž m+ž m+ž m+ž m+ž m+ž m+ž m+ž Vsi FZ+NFZ _L_L_P_P_SH_SH IZS udelež._ FZm+ž -0,054 L df=40 a d=0,02 NFZm+ž 1,430 2,427* P df=18 a df=48 a d=0,68 d=0,73 FZm+ž 1,595 3,336** -0,464 P df=69 a df=99 a df=77 a d=0,67 d=0,66 d=0,14 NFZm+ž 2,45* 4,534** 0,722 1,839 SH df=41 a df=71 a df=49 a df=100 a d=1,02 d=0,94 d=0,23 d=0,37 FZm+ž 2,310* 5,159** 0,267 -1,488 -0,925 SH df=143 a df=173 a df=151 a df=202 a df=174 a d=0,95 d=0,90 d=0,08 d=0,22 d=0,17 NFZm+ž 2,444 3,504** 0,796 1,541 -0,282 0,911 IZS df=17 a df=47 a df=25 a df=76 a df=48 df=150 a d=1,07 d=1,02 d=0,31 d=0,46 d=0,09 d=0,26 FZm+ž 2,243 5,449** 0,915 -2,559* 0.399 1,551 -0,030 IZS df=6 b df=59 b df=16 b df=108 a df=67 b df=182 a df=56 a d=1,30 d=1,08 d=0,35 d=0,48 d=0,09 d=0,27 d=0,01 NFZ -1,246 Vsi df=353 a udelež. d=0,17 VSI m -1,471 FZ+NFZ df=353 a _d=0,16 O lombe. NFZm+ž - nikoli fizično zlorabljeni moški in ženske, FZm+ž - fizično zlorabljeni moški in ženske, P - poročeni, L - ločeni, SH - skupna hoja fant/punca (ne živijo skupaj), IZS - skupna hoja fant/punca (živijo skupaj): a - t test za neodvisne vzorce z enako varianco, b - t test za neodvisne vzorce z neenako varianco. *p < 0,05. **p < 0,01. in so bili kot otroci fizično zlorabljeni. Razlika med njimi in vsemi ostalimi, tako fizično zlorabljenimi kot tudi nikoli fizično zlorabljenimi udeleženci raziskave, je statistično pomembna na nivoju 1-odstotnega tveganja in tudi mera učinka je velika (glej tabelo 4, stolpec FZm+žL). V nasprotju s tem pa ni statistično pomembnih razlik v strahu pred intimnostjo med moškimi in ženskami (polje VSEžFZ+NFZ-VSImFZ+NFZ), niti med fizično zlorabljenimi in tistimi, ki niso bili nikoli fizično zlorabljeni v otroštvu (FZ Vsi udelež.-NFZ Vsi udelež.), čeprav rezultati kažejo na nekoliko večji strah pred Fizična zloraba in strah pred intimnostjo 119 intimnostjo pri moških kot pri ženskah (pri raziskovalnih udeležencih; glej tabelo 2). Slika 1 prikazuje, kaj v splošnem velja za vse udeležence raziskave brez skupine ločenih (za skupino SH, IZS in P; N = 313), glede na spol in fizično zlorabljenost. Razprava Rezultati presenetljivo kažejo, da je bilo 80 % vprašanih fizično zlorabljenih (glede na kriterije Strausovega vprašalnika, ki meri fizično zlorabo), iz česar bi lahko sklepali, da je fizična zloraba kot vzgojno sredstvo še zelo prisotna. Na podlagi relacijske paradigme (Gostečnik, 2004) bi lahko razlagali, da starši še v veliki meri regulirajo afekte jeze, besa in nasilja preko fizičnega kaznovanja. Tako kot druge raziskave (Boney-McCoy in Finkelhor, 1995; Thompson, Kingree in Desai, 2004), tudi naša raziskava opozarja na dejstvo, da so bili moški nekoliko pogosteje žrtve fizične zlorabe v otroštvu kot ženske. V splošnem je naša študija pokazala trend, da je strah pred intimnostjo večji pri fizično zlorabljenih osebah kot pri nikoli fizično zlorabljenih osebah, res pa je, da ta razlika ni statistično pomembna (glej tabelo 4, polje FZ Vsi udelež.-NFZ Vsi udelež.). Ce vključimo še pogostost fizičnega kaznovanja, lahko rečemo, da imajo udeleženci v naši raziskavi, ki so bili pogosteje fizično zlorabljeni, večji strah pred intimnostjo od tistih, ki so bili občasno fizično zlorabljeni, slednji pa večji strah pred intimnostjo kot redko fizično zlorabljene osebe. Te razlike prav tako niso statistično pomembne, se pa razlika med pogosto fizično zlorabljenimi in nikoli fizično zlorabljenimi približuje statistični pomembnosti, velikost učinka je srednja. Do ugotovitev, da imajo fizično zlorabljene osebe v splošnem večji strah pred intimnostjo, so prišli prej že nekateri drugi avtorji (Cohen in Brook, 1995, po Ehrensaft in dr., 2003; Davis, Petretic-Jackson in Ling, 2001; Fergusson in Linskey, 1997, po Ehrensaft in dr., 2003). Naša raziskava sicer nakazuje to povezanost, vendar pa ni odkrila tako velikih razlik. Iz tega bi lahko sklepali, da je verjetno strah pred intimnostjo v veliki meri odvisen tudi od drugih dejavnikov, kot so npr. možna spolna zloraba v otroštvu, čustveno vzdušje in zapleti v družini, nasilje med zakoncema, predelava takih (travmatičnih) izkušenj itd., ki pa jih v tej raziskavi nismo zajeli. Možno je tudi, da so majhne razlike v naši raziskavi posledica omejitev raziskave, ki so opisane v nadaljevanju. Glede različnega pomena, ki ga ima fizična zloraba na moške in na ženske, lahko omenimo, da Boney-McCoy in Finkelhor (1995) in Thompson, Kingree in Desai (2004) poudarjajo, da ima fizična zloraba, ne glede na pogostost, v vsakem primeru negativne posledice (tako za fante kot dekleta), čeprav je veliko bolj škodljiva za deklice, saj močneje vpliva na njihovo samopodobo in doživljanje intimnosti. Naši rezultati pa presenetljivo kažejo, da imajo fizično zlorabljeni moški manjši strah pred intimnostjo v primerjavi z nikoli fizično zlorabljenimi moškimi (čeprav razlika ni statistično pomembna). Ugotovitev, da imajo fizično zlorabljeni moški celo nekoliko (čeprav ne statistično) manjši strah pred intimnostjo, bi lahko nekoliko razjasnili s tem, da je za 120 T. Repič poročanje o strahu treba biti v »stiku« s tem strahom (npr. Gostečnik, 2004), ki pa so ga lahko morali ti fizično zlorabljeni potlačiti. Možno je tudi, da so fizično zlorabljeni moški nekoliko zamenjevali čustveno bližino ali intimnost s telesno. Relacijska družinska paradigma (npr. Gostečnik, 2004) namreč trdi, da fizično zlorabljeni moški bolj intenzivno iščejo navezanost in intimnost preko telesnosti (ker je preko telesnosti - fizičnega kaznovanja bil mnogokrat vzpostavljen odnos s pomembnimi drugimi; gredo hitreje v telesno intimnost in na tem področju doživljajo manj ovir - strahu), kar lahko tudi pomeni, da zamenjujejo telesno intimnost s čustveno (Gostečnik, 2004). Tako bi rezultat bolj odražal strah tudi pred telesno bližino v skupini zlorabljenih moških (kjer morda lahko predvidevamo, da je manjši od strahu pri nezlorabljenih moških), ne pa toliko v skupini žensk. Mogoče bi lahko to razlagali tudi iz teoretičnih predvidevanj o razvoju moške spolne identitete, ko dečki potlačijo čustveno navezavo na mamo in ohranijo fizično, seksualno navezavo nanjo, kar pa pozneje preusmerijo na druge ženske (Rubin, 1983). Posledično bi to lahko tudi v našem primeru pomenilo, da moški vstopajo v odnose bolj preko fizičnega kontakta, zato so tudi manj dovzetni za čustven svet (Pines, 1999), zanikajo bolečino in strah, saj je to morda način, na katerega so se naučili priti v stik. Prav tako bi nam lahko razvoj ženske spolne identitete pomagal razumeti, zakaj ženske vstopajo v odnose bolj preko čustev. Kot deklice so morale potlačiti telesno navezavo na mamo, čustveno pa so lahko ohranile (Rubin, 1983), zato morda tudi kasneje v odnosih z moškimi najprej iščejo čustveno intimnost in telesno varnost (Pines, 1999), ki jimje verjetno bolj pomembna, lahko so bolj v stiku tudi s problemi, ki zadevajo to področje intimnosti. Zaradi vsega zgoraj opisanega lahko torej prihaja do razlik (čeprav, kot rečeno, statistično nepomembnih) med moškimi in ženskami glede tega, kakšna je povezava med fizično zlorabo in strahom pred intimnostjo. Med skupinami po strahu pred intimnostjo izstopa skupina ločenih, predvsem fizično zlorabljenih, ki ima največji strah pred intimnostjo (fizično zlorabljeni ločeni imajo v primerjavi z vsemi ostalimi skupinami statistično pomembno višjo stopnjo strahu pred intimnostjo (glej tabelo 4, stolpec FZm+žL). Mere učinka dosegajo večje vrednosti tako v skupini fizično zlorabljenih ločenih (v primerjavi z ostalimi skupinami) kot tudi v skupini nikoli fizično zlorabljenih ločenih (glej tabelo 4, stolpec FZm+žL in NFZm+žL). Možno je, da so imeli ločeni že pred ločitvijo večji strah pred intimnostjo in je to tudi pripomoglo k njihovi izbiri partnerja, k zapletom in ločitvi, možno pa je, da je tudi sama ločitev vplivala na njihov strah pred intimnostjo. Če primerjamo štiri skupine oseb med sabo, lahko ugotovimo, da so tudi med njimi bistvene razlike. Največji strah pred intimnostjo imajo ločeni, potem poročeni, potem udeleženci iz skupine SH in nato iz skupine IZS (glej tabelo 2). Najbolj presenetljivo je, da imajo najmanjši strah pred intimnostjo ženske iz skupine IZS (razlikuj ej o se celo od fizično zlorablj enih poročenih žensk in fizično zlorablj enih ločenih žensk, glej tabelo 3). Pričakovali bi, da bodo imele večji strah pred intimnostjo od poročenih, ker so (ženske iz skupine IZS) neporočene. Mogoče bi lahko tak rezultat razlagali tudi s tem, kar piše K. Kompan-Erzar (2003), ki pravi, da če v partnerskem odnosu ni dovolj varnosti, da bi partnerja drug pred drugim lahko izrazila lastno šibkost, Fizična zloraba in strah pred intimnostjo 121 nemoč, strah in bolečino, bosta ranljiva čutenja (torej v našem primeru strah pred intimnostjo) pri sebi zanikala. Možno je tudi, da imajo v skupini IZS (tako moški kot ženske) manjši strah pred intimnostjo med drugim zato, ker so mlajši in je njihov odnos verjetno bolj v začetnih fazah (povprečno trajanje odnosa je 5 let) kot odnos poročenih (povprečno trajanje odnosa je 20 let). Vendar pa imajo v skupini SH v primerjavi s skupino IZS večji strah pred intimnostjo, čeprav sta obe skupini po dolžini trajanja odnosa primerljivi. To morda lahko razlagamo tudi s tem, da je verjetno večji strah pred intimnostjo povezan z dejstvom skupnega bivanja - v skupini IZS živijo skupaj, ker imajo manjši strah pred intimnostjo od skupine SH, kjer ne živijo skupaj. Ce torej povzamemo rezultate naše raziskave, lahko vidimo, da imajo največji strah pred intimnostjo nikoli fizično zlorabljeni moški, sledijo fizično zlorabljeni moški, potem fizično zlorabljene ženske, nato pa nikoli fizično zlorabljene ženske. Izjema je skupina ločenih, kjer so bili vsi moški fizično zlorabljeni in so imeli manjši strah pred intimnostjo kot fizično zlorabljene ločene ženske, kar bi lahko glede na relacijsko družinsko paradigmo (Gostečnik, 2004) razlagali, da so ženske bolj ozavestile fizično zlorabo in s tem v zvezi strah pred intimnostjo. Ta skupina ločenih zelo izstopa in kaže na mnoge statistično pomembne razlike in tudi na visoke mere učinka, omenili bomo le nekatere. Daleč največ statistično pomembnih razlik na nivoju 1 -odstotnega tveganja je med fizično zlorabljenimi ločenimi ženskami ter fizično zlorabljenimi in nikoli fizično zlorabljenimi moškimi ter ženskami iz ostalih skupin, kar lahko razlagamo z že omenjeno možnostjo, da so bile verjetno fizično zlorabljene tudi v zakonu in so po izgubi navezanosti oziroma ločitvi bile sposobne ozavestiti fizično zlorabo in lahko sedaj odprto o njej govorijo (Gostečnik, 2001). To predpostavko mogoče samo še potrjuje rezultat, ki kaže, da imajo fizično zlorabljene ločene ženske večji strah pred intimnostjo kot fizično zlorabljene ženske iz skupine SH ter IZS, kar je lahko tudi posledica slabe izkušnje v zakonu. Pri vrednotenju rezultatov je potrebno upoštevati nekaj omejitev raziskave. Verjetno so na rezultate vplivale tudi specifične lastnosti skupin udeležencev (del udeležencev so bili študentje ene same fakultete). Tam, kjer smo dobili statistično pomembne razlike, se je pomembno tudi zavedati, da je bilo potrebno izvesti več t-testov in je zato verjetnost napake tipa I v naših rezultatih podcenjena. Fizična zloraba v otroštvu tudi ni edini dejavnik, ki vpliva na strah pred intimnostjo, kar pomeni, da nekatere osebe morda nikoli niso bile fizično zlorabljene, so pa lahko doživele spolno ali čustveno zlorabo, zanemarjanje ali kako drugo travmo in zaradi teh faktorjev doživljajo večji strah pred intimnostjo. Vprašalnik o strahu pred intimnostjo se je nanašal le na čustveni del, zato ne moremo vedeti, kakšni bi bili rezultati, če bi se vprašanja navezovala tudi na druge komponente intimnosti (seksualna, duhovna, intelektualna, socialna...), ki jih omenja npr. Bagarozzi (1997), na samozavest itd. Poleg tega je bil vprašalnik nekoliko spremenjen in je zato njegova zanesljivost in veljavnost lahko bolj vprašljiva, kot je bila ugotovljena za originalno verzijo. Prav tako je bil zaradi pogostosti fizične zlorabe numerus pri nikoli fizično zlorabljenih manjši (N = 70), če pa upoštevamo še delitev v tri skupine (pri ločenih so bili vsi moški fizično zlorabljeni), je teh oseb še 122 T. Repič manj in težje analiziramo, primerjamo ter posplošujemo rezultate. Pri ločenih bi bilo dobro vedeti, koliko časa je preteklo, odkar so ločeni, saj bi verjetno tudi to dejstvo vplivalo na njihov strah pred intimnostjo. Za nadaljnje raziskovanje bi bilo potrebno izdelati primernejši vprašalnik (in preveriti njegove merske značilnosti), ki bo bolje razdelal, povezal obravnavani dimenziji - fizično zlorabo in strah pred intimnostjo. Zlasti bi bilo potrebno k intimnosti vključiti tudi druge komponente, predvsem telesno (spolno) in ne samo čustvene, saj bi tako lažje in bolj natančno videli doživljanje intimnosti med spoloma ter povezavo s fizično zlorabo. Problem, ki se je izkazal pri ocenjevanju v tej raziskavi in ki bi ga v nadaljnjih raziskavah tudi morali nasloviti, pa je razlikovanje med afekti, povezanimi z intimnostjo, o katerih udeleženci poročaj o na merskih instrumentih, tistimi, ki jih udeleženci doživljaj o, in tistimi, ki so jih potlačili oz. odcepili. Literatura Bagarozzi, D. A. (1997). Marital Intimacy Needs Questionnaire: Preliminary Report. American Journal of Family Therapy, 25 (3), 285-290. Blavier, D. C. in Glenn, E. (1995). The Role of Shame in Perceptions of Marital Equity, Intimacy, and Competency. The American Journal of Family Therapy, 23 (1), 73-82. Boney-McCoy, S. in Finkelhor, D. (1995). Psychosocial sequelae of violent victimization in a national youth sample. Journal of Consulting and Clinical Psychology, 63, 726736. Cankar, G. in Bajec, B. (2003). Velikost učinka kot dopolnilo testiranju statistične pomembnosti razlik [Effect size as an addition to statistical significance testing]. Psihološka obzorja [Horizons of Psychology], 12 (2), 97-112. Chu, J. A. in Bowman, E. S. (ur.) (2002). Trauma and Sexuality: The Effects of Childhood Sexual, Physical, and Emotional Abuse on Sexual Identity and Behavior. New York: The Haworth Press. Connelly, C. D. in Straus, M. A. (1992). Mother's age and risk for physical abuse. Child Abuse and Neglect, 16, 709-718. Coohey, C. (2000). The role of friends, in-laws, and other kin in father-perpetrated child physical abuse. Child Welfare, 79 (4), 373-403. Cvetek, R. (2002). Učinkovitost metode EMDR pri zmanjševanju anksioznosti, ki jo povzroča priklic nepredelanega spomina [Efficacy of the method EMDR in reduction of anxiety, caused by recall of unprocessed memory]. Anthropos, 34 (1/3), 117-128. Cvetek, R. (2004). Predelava disfunkcionalno shranjenih stresnih izkušenj ter metoda desenzitizacije in ponovne predelave z očesnim gibanjem [The processing of disfunctionally stored stressful experiences and Eye Movement Desenzitization and Reprocessing method]. Neobjavljena doktorska disertacija [Unpublished doctoral dissertation]. Ljubljana: Univerza v Ljubljani, Oddelek za psihologijo. Cvetek, R., Kompan Erzar, K., Erzar, T. in Gostečnik, C. (2004). Family relational therapy. V D. Trampuž in M. Rus-Makovec (ur.), Upreti se zlorabi: od sramu do samorealizacije : zbornik prispevkov [From shame to self-empowerment: book of contributions] (pp. 88-97). Ljubljana: Psihiatrična klinika, Slovensko društvo za družinsko terapijo. Fizična zloraba in strah pred intimnostjo 123 Davis, J. L., Petretic-Jackson, P. A. in Ling, T. (2001). Intimacy Dysfunction and Trauma Symptomatology: Long-Term Correlates of Different Types of Child Abuse. Journal of Traumatic Stress, 14 (1), 63-179. Descutner, C. J., in Thelen, M. H. (1991). Development and Validation of a Fear-of-Intimacy Scale. Psychological Assessment, 3, 218-225. Dodge, K. A., Bates, J. E., in Pettit, G. S. (1990). Mechanisms in the cycle of violence. Science, 250, 1678-1683. Downey, G., in Feldman, S. I. (1996). Implications of Rejection Sensitivity for Intimate Relationships. Journal of Personality and Social Psychology, 70, 1327-1343. Ehrensaft, M. K., Cohen, P., Brown, J., Smailes, E., Chen, H. in Johnson, J. G. (2003). Intergenerational Transmission of Partner Violence: A 20-Year Prospective Study. Journal of Consulting and Clinical Psychology, 71 (4), 741-753. Finzi, R., Har-Even, D., Shnit, D. in Weizman, A. (2002). Psychosocial characterization of physically abused children from low socioeconomic households in comparison to neglected and nonmaltreated children. Journal of Child and Family Studies, 11, 441-453. Framo, J. L. (1992). Family of origin therapy: An intergenerational approach. New York: Brunner/Mazel. Gostečnik, C. (1997). Človek v začaranem krogu [Human in perpetual cycle]. Ljubljana: Brat Frančišek in Frančiškanski družinski inštitut. Gostečnik, C. (1998). Ne grenite svojih otrok [Don 't be the Bane of your Children's Lifes]. Ljubljana: Brat Frančišek in Frančiškanski družinski inštitut. Gostečnik, C. (2000). Psihoanaliza in religija [Psychoanalysis and Religion]. Ljubljana: Brat Frančišek in Frančiškanski družinski inštitut. Gostečnik, C. (2001). Poskusiva znova [Let's try it again]. Ljubljana: Brat Frančišek in Frančiškanski družinski inštitut. Gostečnik, C. (2002). Sodobna psihoanaliza [Modern Psychoanalysis]. Ljubljana: Brat Frančišek in Frančiškanski družinski inštitut. Gostečnik, C. (2004). Relacijska družinska terapija [Relational Family Therapy]. Ljubljana: Brat Frančišek in Frančiškanski družinski inštitut. Green, S. M., Russo, M. F., Navratil, J. L. in Loeber, R. (1999). Sexual and Physical Abuse Among Adolescent Girls with Disruptive Behavior Problems. Journal of Child & Family Studies, 8 (2), 151-168. Hook, M. K., Gerstein, L. H., Detterich, L. in Gridley, B. (2003). How close we are? Measuring intimacy examing gender differences. Journal of Counseling & Development, 81 (4), 462-474. Kent, A., Waller, G. in Dagnan, D. (1999). A greater role of emotional than physical or sexual abuse in predicting disordered eating attitudes: The role of mediating variables. International Journal of Eating Disorders, 25 (2), 159-167. Kompan-Erzar, K. (2003). Skrita moč družine [The Secret Power of the Family]. Ljubljana: Brat Frančišek in Frančiškanski družinski inštitut. Lipshitz, D. S., Bernstein, D. P., Winegar, R. K. in Southwick, S. M. (1999). Hospitalized Adolescents' Reports of Sexual and Physical Abuse: A Comparison of Two Self-Report Measures. Journal of Traumatic Stress, 12 (4), 641-654. Lutwak, N., Panish, J. in Ferrari, J. (2003). Shame and guilt: characterological vs. behavioral self-blame and their relationship to fear of intimacy. Personality & Individual 124 T. Repič Differences, 35 (4), 909-916. Martin, J. L. in Ashby, J. S. (2004). Perfectionism and Fear of Intimacy. Family Journal, 12 (4), 368-374. Meston, C. M. in Heiman, J. R. (1999). The relation between early abuse and adult sexuality. Journal of Sex Research, 36 (4), 385-395. Napier, A. Y. (1998). Experential approaches to Creating the Intimate Marriage.V J. Carlson in L. Sperry (ur.), The Intimate Couple (pp. 298-327). Philadelphia, PA: Brunner/Mazel. Neumark-Sztainer, D., Story, M., Hannan, P. J., Beughring, T. in Resnick, M. D. (2000). Disordered eating among Adolescents: Associations with sexual/physical abuse and other familial/psychosocial factors. International Journal of Eating Disorders, 28 (3), 249-258. Noll, J. G., Trickett, P. K. in Putnam, F. W. (2003). A prospective investigation ofthe impact of childhood sexual abuse on the development of sexuality. Journal of Consulting and Clinical Psychology, 71 (3), 575-586. Pines, A. M. (1999). Falling in love: why we choose the lovers we chose. New York: Routledge. Rubin, L. B. (1983). Intimate strangers: men and women together. New York: Harper and Row. Solomon, M. (1992). Narcissism and Intimacy. New York: W. W. Norton. Straus, M. (1979). Measuring intrafamily conflict and violence: The Conflict Tactics (CT) scales. Journal of Marriage and Family Therapy, 47, 75-88. Thompson, M. P., Kingree, J. B. in Desai, S. (2004). Gender differences in long-term health consequences of physical abuse of children: Data from a nationally representative survey. American Journal of Public Health, 94 (4), 599-604. Traeen, B. in Sorensen, D. (2000). Breaking the speed of the sound of loneliness: sexual partner change and the fear of intimacy. Culture, Health & Sexuality, 2 (3), 287-301. Walld, R. (2003). Bonferroni Correction. Posneto 29.12.2005 s http://www.umanitoba.ca/ centres/mchp/concept/dict/Statistics/bonferroni.html. Waring, E. M. in Reddon, J. R. (1983). The Measurement of Intimacy in Marriage: The Waring Intimacy Questionnaire. Journal of Clinical Psychology, 39, 53-57. Prispelo/Received: 01.08.2005 Sprejeto/Accepted: 03.01.2006 Psihološka obzorja / Horizons of Psychology, 14, 3, 125-140 (2005) © Društvo psihologov Slovenije 2005, ISSN 1318-187 Strokovni empirično-raziskovalni prispevek Spolna vloga in otrokovo zaznavanje ter presojanje različnih tipov televizijskih oglasov za otroke Tanja Milovanovič* Maribor, Slovenija Povzetek: Rezultati številnih raziskav opozarjajo, da se danes televizija s svojimi oglasi vključuje v proces socializacije otrok, med drugim tudi na področju razvoja spolnih vlog. Današnji oglaševalci z oblikovanjem različnih televizijskih oglasov za dečke in deklice še dodatno vplivajo na razvoj oziroma na utrjevanje obstoječih tradicionalnih spolnih shem pri otrocih. Namen raziskave, predstavljene v prispevku, je bil ugotoviti, v kolikšni meri so otroci sami sposobni zaznati razlike v vsebini, stilu in strukturi sporočila različnih tipov televizijskih oglasov (in različnih vidikov njihove oblike) ter ali te razlike v skladu s svojo spolno vlogo tudi odobravajo. V raziskavi je sodelovalo 68 udeležencev (35 dečkov in 33 deklic), starih povprečno 10 let, ki so na podlagi namensko sestavljenega vprašalnika ocenjevali pet televizijskih oglasov za otroke. Raziskava je pokazala, da udeleženci v skladu z osvojeno spolno shemo zaznavajo in celo odobravajo številne razlike med televizijskimi oglasi za dečke in za deklice. Ključne besede: socializacija, spolne vloge, televizijsko oglaševanje, razlike med spoloma Sex role and children's perception and judging of different types of television advertisements for children Tanja Milovanovič Maribor, Slovenia Abstract: A lot of research has pointed out that television with its advertisements represents a part of the children's socialization, including the development of the sex roles. By designing different advertisements for boys and girls, today's advertisers additionally affect development and reinforcement of the children's traditional sex roles. The purpose of this study was to examine whether children are able to perceive differences in the content, style and structure of the message in different types of television advertisements (and different aspects of their form) and whether children approve of these differences according to their sex roles. Sixty-eight participants (35 boys and 33 girls) with a mean age of 10 years judged five television advertisements with a previously constructed questionnaire. The study has shown that, according to their sex roles, participants perceived and even approved of many of the differences between television advertisements for boys and television advertisements for girls. Key words: socialization, sex roles, television advertising, gender differences CC = 3040, 2840 * Naslov / address: Tanja Milovanovič, univ. dipl. psih., Klinetova ulica 10, 2000 Maribor, e-mail: tanja.milovanovic@amis.net 126 T. Milovanovič Klasifikacija otrok v spolne vloge, na osnovi njihovega biološkega spola, se začne že v zgodnjem otroštvu (Berns, 1993). Otroku je že ob rojstvu pripisano ime, ki velja v njegovi družbi za žensko oziroma moško. Nato se ga njegovemu spolu ustrezno tudi obleče. Poleg tega ima skozi celo otroštvo na razpolago tiste igrače, ki naj bi bile primerne za njegov spol. Dekliške igrače so ponavadi vezane na negovalne ali gospodinjske aktivnosti, deške igrače pa so ponavadi vezane na akcijo ali delovne aktivnosti. Prelomni trenutek, ko otroci začnejo sebe in druge konsistentno označevati kot pripadnike moškega oziroma ženskega spola, se pojavi pri približno dveh letih starosti (Golombok in Fivush, 1994). Kmalu zatem začnejo otroci povezovati določena vedenja in lastnosti z enim ali drugim spolom. Po obstoječih stereotipih (Golombok in Fivush, 1994) naj bi bila za moško spolno vlogo značilna usmerjenost h kontroli in manipuliranju z okoljem. Od moških se pričakuje, da so neodvisni, asertivni, dominantni in tekmovalni. Od žensk pa se pričakuje, da so bolj pasivne, ljubeče, občutljive in da nudijo podporo v socialnih odnosih, še posebej v svoji vlogi žene in matere. Za ženske naj bi bilo tudi značilno izražanje topline v medosebnih odnosih, pojavljanje anksioznosti v primeru zunanjega pritiska ter zatiranje občutkov jeze in seksualnosti. Po Bandurini (1969) teoriji socialnega učenja se otroci svojih spolnih vlog učijo prek posnemanja modelov v okolici (poleg učenja prek nagrade in kazni), zaradi česar se oglaševalci že dalj časa poslužujejo različnih tipov TV-oglasov: TV-oglasi za dečke, TV-oglasi za deklice in nevtralni TV-oglasi (Smith, 1994). Glede na tip oglaševanega izdelka izdelajo ustrezen tip TV-oglasa, ki v mnogih vidikih ustreza stereotipni spolni vlogi ciljnega občinstva, s čimer še dodatno vplivajo na razvoj oziroma utrjevanje obstoječih stereotipnih spolnih vlog pri otrocih. Obstajajo različni kriteriji, po katerih ločimo TV-oglase na tiste, ki so namenjeni dečkom, in na tiste, ki so namenjeni deklicam. L. J. Smith (1994) na primer loči ta dva tipa TV-oglasov na podlagi tega, ali se v oglasu pojavljajo zgolj deklice ali zgolj dečki. TV-oglase, v katerih se pojavljajo otroci obeh spolov, pa označuje kot nevtralne TV-oglase. Avtorica se je pri izbiri kriterija opirala na raziskavo vedenja otrok, ki so jo izvedli Ruble, Balaban in Cooper (1981) in katero potrjujejo tudi kasnejše raziskave (npr. Luecke-Aleksa, Anderson, Collins, Schmitt, 1995). Raziskava je pokazala, da otroci z visoko izoblikovanim konceptom spolne konstantnosti (otroci, stari vsaj 5 let) neposredno posnemajo vedenje otrok v oglasih, v katerih so navzoči otroci zgolj njihovega spola. Razlike v vsebini med TV-oglasi za dečke in TV-oglasi za deklice Analize vsebine televizijskih oglasov so pokazale, da se TV-oglasi, namenjeni dečkom, v mnogih vidikih razlikujejo od TV-oglasov, namenjenih deklicam. V nadaljevanju je navedenih nekaj najbolj prepoznavnih razlik med obema tipoma TV-oglasov za otroke. Spolna vloga in zaznavanje TV oglasov pri otrocih 127 1. V TV-oglasih, namenjenih dečkom, se pogosteje pojavljajo otroci le enega (moškega) spola kot v TV-oglasih, namenjenih deklicam. Rezultati mnogih raziskav kažejo na to, da se moški bolj izogibajo izdelkom, namenjenim ženskam, kot ženske izdelkom, namenjenim moškim (Barthel, 1988, po Smith, 1994), kar pa velja tudi za otroke pri njihovi igri: deklice so se bolj pripravljene igrati deške igre kot dečki dekliške (Majnovič Umek in Zupančič, 2001). Zato se oglaševalci pri snovanju TV-oglasov, namenjenih otrokom, pogosto raje odločajo za nastop moških modelov. Pri tem je treba opozoriti na izsledke novejših raziskav (Larson, 2001; Smith, 1994), ki v primerjavi s preteklimi (Doolittle in Pepper, 1975; Verna, 1975) kažejo, da se je v TV-oglasih za otroke z leti povečal delež ženskih modelov, pri čemer pa je še zmeraj več TV-oglasov namenjenih dečkom kot deklicam. 2. Spol pripovedovalca v TV-oglasu je enak spolu tistih otrok, katerim je ta TV-oglas namenjen. Ker so v TV-oglasih za otroke nastopajoči pogosteje pripadniki moškega spola, to velja tudi za pripovedovalce, katerih glas spremlja prikazovane oglase. TV-oglase, namenjene otrokom, torej pogosteje spremljajo moški kot ženski glasovi, kar pa ne velja za TV-oglase, namenjene otrokom enega spola. Analize vsebine TV-oglasov, namenjenih zgolj dečkom oziroma zgolj deklicam (npr. Smith, 1994; Welch, Huston-Stein, Wright in Plehal, 1979), so namreč pokazale, da TV-oglase, namenjene deklicam, za razliko od TV-oglasov, namenjenih dečkom, in nevtralnih TV-oglasov večinoma spremlja glas pripovedovalca ženskega spola. 3. Liki v TV-oglasih, namenjenih deklicam, so pogosteje vključeni v pasivne aktivnosti ter redkeje v fizične in antisocialne aktivnosti kot liki v TV-oglasih, namenjenih dečkom. Analize vsebine so pokazale razlike v vedenju deških in dekliških likov v TV-oglasih, namenjenih otrokom, ki naj bi ustrezale tradicionalni spolni vlogi teh likov (Courtney in Whipple, 1983, po Smith, 1994; O'Connor 1989; Verna, 1975). Deklice v TV-oglasih v svoji igri večinoma prevzemajo vloge, kot sta na primer gospodinja in stevardesa, dečki pa se pogosto vključujejo v aktivnosti, kot sta na primer nogomet in šotorjenje. Deklice v TV-oglasih nastopajo v bolj pasivnih in odvisnih vlogah ter si pogosto želijo biti lepe in popularne, dečki pa so nagnjeni k izražanju moči, tekmovalnosti, hitrosti in fizični aktivnosti. 4. TV-oglasi, namenjeni deklicam, se pogosteje odvijajo znotraj doma, TV-oglasi, namenjeni dečkom, pa se pogosteje odvijajo v okolju zunaj doma. Ker različne aktivnosti dečkov in deklic zahtevajo različne pogoje, je tudi okolje v TV-oglasih, v katerem nastopajo deklice, drugačno od okolja, v katerem nastopajo dečki (Larson, 2001; Smith, 1994). Zato so deklice med izvajanjem svojih aktivnosti, kot sta na primer igra s punčkami in pogovor po telefonu, pogosto prikazane znotraj doma, saj se te aktivnosti tudi dejansko ponavadi izvajajo doma. Dečki pa so med izvajanjem aktivnosti, kot je na primer šport, postavljeni v okolje izven doma, saj tudi v realnem svetu poteka izvajanje tovrstnih aktivnosti zunaj doma. 128 T. Milovanovič Razlike v obliki med TV-oglasi za dečke in TV-oglasi za deklice Poleg vsebine lahko tudi oblika TV-oglasov vpliva na oblikovanje spolne vloge pri otrocih (Chandler in Griffiths, 2000; Smith, 1994; Welch in dr., 1979). TV-oglasi, namenjeni deklicam, se namreč po svoji obliki v mnogih vidikih razlikujejo od TV-oglasov, namenjenih dečkom. Med različne vidike oblike TV-oglasov, po katerih se ločijo TV-oglasi, namenjeni deklicam, od TV-oglasov, namenjenih dečkom, med drugim sodi nivo aktivnosti, v katerega so vključeni prikazani izdelki (Smith, 1994; Welch in dr., 1979). V TV-oglasih, namenjenih dečkom, se namreč prikazani deški modeli z igračami precej bolj aktivno (zlasti fizično) ukvarjajo, kot to počno dekliški modeli v TV-oglasih, namenjenih deklicam, ki so v svoji igri tudi sicer bolj umirjeni. Naslednja razlika v obliki TV-oglasov, namenjenih dečkom, od TV-oglasov, namenjenih deklicam, je ta, da se v TV-oglasih, namenjenih dečkom, pojavljajo večje spremembe pri izmenjavi posameznih scen (Chandler in Griffiths, 2000; Welch in dr., 1979). Poleg tega se v TV-oglasih za dečke scene med seboj hitreje izmenjavajo kot v TV-oglasih za deklice. Te izmenjave so tudi bolj odsekane in nenadne kot v TV-oglasih za deklice, v katerih so prehodi med posameznimi scenami bolj počasni in gladki. Obliko TV-oglasov, namenjenih deklicam, pogosto zaznamuje uporaba pastelnih, pogosto rožnatih barv in meglic ter nežna glasba v ozadju, kar pri otroku vzbuja občutke mehkobe, nežnosti, predvidljivosti in počasne, postopne spremenljivosti (Marjanovič Umek in Zupančič, 2001; Smith, 1994; Welch in dr., 1979). Na tak način se v TV-oglasih utrjujejo stereotipi o ženskah kot o tihih, mehkih, nežnih in neaktivnih bitjih. Za razliko od TV-oglasov za deklice pa v TV-oglasih za dečke pogosto prevladujejo zvočni učinki in glasna glasba, kar je v skladu s stereotipi o moških kot o dominantnih in aktivnih bitjih. Welch in dr. (1979) opozarjajo, da so sporočila o primernem vedenju dečkov in deklic, ki so posredovana skozi obliko TV-oglasov, morda celo bolj vplivna kot očitni stereotipi, predstavljeni v vsebini TV-oglasov. Ker so ta sporočila prikrita, so lahko s strani odraslih velikokrat neprepoznana in zato ne morejo preprečiti njihovega vpliva na oblikovanje spolnih vlog pri svojih otrocih. Za ta sporočila obstaja torej večja verjetnost, da jih bodo otroci pasivno in podzavestno sprejeli ter jih tudi pogosteje posplošili na druge situacije. Namen raziskave je bil odgovoriti na dve problemski vprašanji: 1. Ali se TV-oglasi za otroke v vsebini, strukturi in stilu sporočila razlikujejo v takšni meri, da bodo razlike v tipih TV-oglasov (TV-oglas za dečke, TV-oglas za deklice oziroma nevtralni TV-oglas) ter različnih vidikih njihove oblike (kot so glasba, barve, okolje in prikazane aktivnosti v TV-oglasu) zaznali tudi udeleženci in udeleženke? 2. Ali bodo udeleženci v skladu s svojimi osvojenimi spolnimi vlogami presojali predvajane TV-oglase, kar se bo pokazalo v pojavu statistično pomembnih razlik med dečki in deklicami v njihovih ocenah všečnosti različnih tipov TV-oglasov in različnih vidikov njihove oblike (kot so glasba, barve, okolje in prikazane aktivnosti v TV-oglasu)? Spolna vloga in zaznavanje TV oglasov pri otrocih 129 Metoda Udeleženci Vzorec je predstavljalo 68 udeležencev in udeleženk, tj. dva razreda učencev OS Majde Vrhovnik v Ljubljani (20 udeležencev in 19 udeleženk) in dva razreda učencev OS Tabor II v Mariboru (15 udeležencev in 14 udeleženk). Udeleženci in udeleženke so v času raziskave obiskovali 5. razred devetletke in so bili v povprečju stari 10 let. Pripomočki V namen izvedbe raziskave je bil sestavljen anketni vprašalnik, namenjen ugotavljanju vpliva otrokove spolne vloge na njegovo zaznavanje in presojanje posameznega TV-oglasa. Sestavljene so bile tri različice osnovnega vprašalnika glede na tip predvajanega TV-oglasa (TV-oglas za dečke, TV-oglas za deklice in nevtralni TV-oglas). Pri sestavi vprašanj sem se zgledovala po rezultatih različnih analiz vsebine TV-oglasov, namenjenih otrokom, in po izsledkih že izpelj anih raziskav o vplivu otrokove spolne vloge na otrokovo zaznavanje TV-oglasov. V vprašalniku sem namesto izraza »TV-oglas« uporabila izraz »reklama«, saj sem v predhodnih pogovorih z otroci ugotovila, da jim je ta izraz bolj znan in domač. Posamezen vprašalnik (ne glede na različico) je zajemal naslednje vsebinske kategorije: 1. opredelitev tipa vsakega izmed petih predvaj anih TV-oglasov in njihove oblike, posredovane skozi glasbo, barve, aktivnosti otrok in okolje v TV-oglasu. Za vsakega izmed TV-oglasov so udeleženci določili, ali je namenjen za dečke, deklice oziroma je nevtralen, prav tako so za njegovo glasbo, barve, aktivnosti in okolje posamezno določili, ali so bolj značilni za dečke, deklice oziroma so nevtralni, ter svoje presoje na mojo prošnjo tudi utemeljili; 2. stališče do posameznega TV-oglasa ter do njegove glasbe, barv, aktivnosti otrok in okolja na petstopenjski ocenjevalni lestvici (1 - sploh mi ni všeč, 5 - zelo mi je všeč); 3. oceno, v kolikšni meri lahko posamezni TV-oglas opišemo z določenimi atributi (junaškost, vsakdanjost, moškost, umirjenost, razumskost, aktivnost, veselost in ženskost), na petstopenjski ocenjevalni lestvici (1 - sploh ne drži, 5 - popolnoma drži); 4. odobravanje videza in vedenja otrok posameznega spola v TV-oglasu na petstopenjski ocenjevalni lestvici (1 - sploh ne drži, 5 - popolnoma drži); 5. strinjanje z nastopom deklic v TV-oglasih za dečke in z nastopom dečkov v TV-oglasih za deklice (pri vprašalniku pri nevtralnem TV-oglasu te postavke ni, saj v njem že nastopajo otroci obeh spolov); 6. oceno podobnosti lastnega videza in vedenja z videzom in vedenjem otrok istega 130 T. Milovanovič spola v TV-oglasu na petstopenjski ocenjevalni lestvici (1 - sploh ne drži, 5 -popolnoma drži). Različice vprašalnika so se med seboj razlikovale v vprašanjih v sklopu zadnjih treh kategorij, saj je bilo pri postavljanju teh vprašanj potrebno upoštevati spol nastopajočih otrok v posameznem TV-oglasu. Vprašanja v vprašalniku so bila zaprtega in odprtega tipa. Odprti tip vprašanj se je pojavil zgolj v okviru prve vsebinske kategorije, ko sem otroke povprašala po utemeljitvi njihove opredelitve tipa posameznega TV-oglasa ter opredelitvah njegove glasbe, barv, okolja in prikazanih aktivnosti kot značilnih za dečke, deklice oziroma kot nevtralnih. Na podlagi analize vsebine sem dobljene odgovore razvrstila v manjše število kategorij, ki so predstavljene v tabelah 2, 5, 6, 7 in 8. Postopek V okviru raziskave, ki je bila izpeljana marca 2004, sem otrokom v zmeraj enakem vrstnem redu predvajala serijo izbranih TV-oglasov. Po vsakem predvajanem TV-oglasu so udeleženci v setu vprašalnikov izpolnili tisti vprašalnik, katerega zaporedna številka je ustrezala zaporedni številki predvajanega TV-oglasa. V setu so bili vprašalniki razvrščeni tako, da je različica zaporednega vprašalnika odgovarjala tipu pravkar predvajanega TV-oglasa. TV-oglasi, ki so bili udeležencem predvajani, so bili izbrani izmed TV-oglasov, namenjenih otrokom, ki so se v času raziskave predvajali v okviru jutranjega otroškega programa različnih nemških televizijskih postaj (SAT 1, SUPER RTL, PRO 7 in KABEL 1). TV-oglasi so bili posneti na nemških programih zato, ker se v času raziskave na slovenskih programih ni predvajalo zadostnega števila TV-oglasov, namenjenih otrokom, med katerimi bi lahko izbrali TV-oglase, ki bi ustrezali namenu izpeljane raziskave. Iz posnetega materiala je bilo izbranih šest TV-oglasov, med katerimi sta bila dva TV-oglasa namenjena dečkom, dva TV-oglasa namenjena deklicam in dva TV-oglasa namenjena dečkom in deklicam, tj. nevtralna TV-oglasa. Pri izbiri TV-oglasov sem bila pozorna na to, da bo njihova vsebina vizualno dovolj bogato predstavljena in bodo otroci torej lahko dojeli njihovo bistvo ne glede na to, da so predvajani v nemškem jeziku. Izbrani TV-oglasi so bili predvajani po spodnjem zaporedju in so prikazovali naslednje izdelke: 1. kocke znamke »Lego«, iz katerih se sestavi gasilska postaja - TV-oglas, namenjen dečkom, 2. karte znamke »Uno« - nevtralni TV-oglas, 3. plastična kuhinja znamke »Barbie« - TV-oglas, namenjen deklicam, 3. ledena steza za avtomobile - TV-oglas, namenjen dečkom, Spolna vloga in zaznavanje TV oglasov pri otrocih 131 5. musli znamke »Cookie Crisp« - nevtralni TV-oglas in 6. kočija znamke »Barbie« - TV-oglas, namenjen deklicam. Pri določanju tipa TV-oglasa sem se držala kriterija, ki se pogosto uporablja pri analizi vsebine TV-oglasov, namenjenih otrokom (Smith, 1994). Med TV-oglase, namenjene dečkom, sem uvrstila tiste TV-oglase, v katerih so bili vsi nastopajoči otroci moškega spola, med TV-oglase, namenjene deklicam, pa sem uvrstila tiste TV-oglase, v katerih so bili nastopajoči otroci zgolj ženskega spola. TV-oglase, v katerih so nastopali otroci obeh spolov, sem označila za nevtralne TV-oglase. Klasifikacija TV-oglasov na izbrane tipe oglasov je bila še dodatno potrjena z raziskavo, izvedeno med študenti tretjega letnika psihologije. Vzorec desetih študentov sem namreč prosila, da predvajane TV-oglase razvrstijo glede na njihov tip. Vsi študenti so se strinjali s klasifikacijo izbranih TV-oglasov, do katere pridemo z uporabo zgoraj navedenega kriterija. Vprašalnik je bil preliminarno preizkušen na štirih otrocih (dva dečka, dve deklici) iz petega razreda osnovne šole Tabor II v Mariboru, od katerih dva nista razumela nemškega jezika. Tako je bilo še dodatno preverjeno, ali otroci razumejo zastavljena vprašanja, ali kljub tujemu jeziku dojemajo bistvo predvajanih TV-oglasov, ali zmorejo zbrano odgovarj ati na vseh šest predloženih vprašalnikov in ali je lahko preizkus izveden v eni šolski uri, ki je bila pri vsakem razredu dana na razpolago. Preliminaren preizkus je pokazal, da otroci razumejo vprašanja in zlahka dojemajo bistvo predvajanih TV-oglasov. Težava pa se je pojavila pri samem trajanju preizkusa, saj je trajal skoraj 50 minut. Poleg tega so bili vsi štirje otroci proti koncu preizkusa že nekoliko naveličani odgovarjanja na zastavljena vprašanja, kar je vplivalo tudi na zmanjšanje njihove koncentracije. V skladu s temi ugotovitvami sem se odločila zmanjšati število ocenjevanih atributov TV-oglasov (predhodno so bili vključeni še atributi zanimivost, poučnost in modernost) ter opustiti predvajanje enega izmed nevtralnih TV-oglasov (TV-oglas za musli Cookie Crisp). S tem se je končno število predvajanih TV-oglasov in uporabljenih vprašalnikov pri vsakem otroku zmanjšalo na 5. Otroke sem preizkušala skupinsko in sicer sem vsakokrat preizkusila en razred otrok. Vsak razred otrok sem preizkušala v učilnici, ki je bila opremljena s televizijo in videorekorderjem, tako da sem lahko predvajala posnetke izbranih petih TV-oglasov. Na začetku preizkusa so bili otrokom razdeljeni seti petih vprašalnikov, ki so jih individualno izpolnili tekom preizkusa. Otroci so dobili navodilo, naj pozorno spremljajo prikazane TV-oglase in po vsakem predvajanju izpolnijo vprašalnik, katerega zaporedna številka ustreza zaporedni številki predvajanega oglasa. Poleg tega jim je bilo naročeno, naj se ne obremenjujejo z morebitnim nerazumevanjem nemškega jezika, saj je za odgovarjanje na vprašanja pomembno zgolj to, da dojamejo njegovo bistvo. Na samem začetku preizkusa, so otroci na prvem vprašalniku v setu s črko M ali Z označili, kateremu spolu pripadajo. 132 T. Milovanovič Rezultati Udeleženci so se večinoma strinjali z mojo predhodno opredelitvijo tipa prikazanih TV-oglasov, kar je razvidno iz tabele 1. Večina udeležencev je, enako kot jaz, opredelila TV-oglasa »gasilci« in »avtomobili« kot TV-oglasa za dečke, TV-oglasa »kuhinja« in »kočija« kot TV-oglasa za deklice ter TV-oglas »karte« kot nevtralni TV-oglas. Na podlagi česa so otroci določali tip posameznega TV-oglasa, je razvidno iz kategorij njihovih utemeljitev, ki so zbrane v tabeli 2. Iz tabele 2 je razvidno, da so otroci svojo izbiro tipa TV-oglasa najpogosteje utemeljevali z vrsto izdelka, ki ga posamezen TV-oglas prikazuje. Med TV-oglase za dečke so uvrstili TV-oglasa, ki Tabela 1. Število udeležencev, ki so posamezni TV-oglas pripisali določenemu tipu. za dečke za deklice nevtralen TV-oglas »gasilci« 62 0 6 TV-oglas »karte« 1 3 64 TV-oglas »kuhinja« 2 64 0 TV-oglas »avtomobili« 60 0 8 TV-oglas »kočija« 1 64 1 Tabela 2. Odgovori udeležencev pri opredelitvi določenega tipa TV-oglasa. f % TV-oglas »gasilci« je TV-oglas za dečke, ker: so gasilci, lego kocke in avtomobili igrača za dečke 36 52,9 v oglasu nastopajo dečki in moški glas govori spremljevalno besedilo 7 10,3 so bojevanje in junaška dejanja značilna za dečke 3 4,4 je gasilec moški poklic 2 2,9 TV-oglas »karte« je TV-oglas za dečke in deklice, ker: so karte namenjene vsem ljudem 41 60,3 v oglasu nastopajo otroci obeh spolov 7 10,3 je oglas zabaven za otroke obeh spolov 6 8,8 TV-oglas »kuhinja« je TV-oglas za deklice, ker: so izdelki znamke »Barbie« igrača za deklice 34 50,0 je kuhanje žensko delo 6 8,8 se deklice igrajo bolj mirno kot dečki 3 4,4 v oglasu nastopajo le deklice 2 2,9 TV-oglas »avtomobili« je TV-oglas za dečke, ker: so avtomobili igrača za dečke 34 50,0 imajo dečki radi hitrost in dirke 7 10,3 v oglasu nastopajo le dečki 1 1,5 TV-oglas »kočija« je TV-oglas za deklice, ker: so izdelki znamke »Barbie« igrača za deklice 22 48,5 v TV-oglasu nastopajo le deklice 2 2,9 se deklice igrajo bolj mirno kot dečki 1 1,5 so deklice bolj dojemljive za lepoto 1 1,5 Opomba. Naveden odstotek je izračunan glede na število vseh udeležencev in torej udeležencev, ki so na posamezno vprašanje podali odgovor. ne glede na število Spolna vloga in zaznavanje TV oglasov pri otrocih 133 Tabela 3. Aritmetične sredine (in standardne deviacije v oklepajih) ocen atributov posameznih TV-oglasov. TV-oglas 1 TV-oglas 2 TV-oglas 3 TV-oglas 4 TV-oglas 5 junaškost 3,61 (1,32) 2,07 (1,29) 1,54 (1,03) 3,60 (1,33) 1,50 (1,00) vsakdanjost 2,77 (1,31) 3,25 (1,27) 3,10 (1,40) 3,03 (1,40) 2,70 (1,44) moškost 3,97 (1,06) 2,23 (1,23) 1,10 (0,39) 4,56 (0,65) 1,25 (0,56) umirjenost 1,47 (0,67) 3,03 (7,04) 2,52 (1,22) 1,58 (1,05) 4,13 (1,23) razumskost 2,49 (1,30) 2,57 (1,40) 1,83 (0,95) 1,96 (1,19) 1,86 (1,16) aktivnost 4,02 (1,08) 2,04 (1,27) 1,59 (1,51) 4,14 (1,15) 1,33 (0,86) veselost 2,95 (1,16) 4,43 (0,91) 3,85 (1,31) 3,16 (1,38) 3,58 (1,43) ženskost 1,58 (0,85) 2,34 (1,36) 4,74 (0,72) 1,49 (0,95) 4,81 (0,55) Opomba. N = 68; TV-oglas 1 je TV-oglas »gasilci«, TV-oglas 2 je TV-oglas »karte«, TV-oglas 3 je TV-oglas »kuhinja«, TV-oglas 4 je TV-oglas »avtomobili«, TV-oglas 5 je TV-oglas »kočija«. sta prikazovala gasilne avtomobile, sestavljene iz lego kock, in avtomobilsko stezo, med TV-oglase za deklice so uvrstili TV-oglasa, ki sta prikazovala plastično kuhinjo in kočijo, med nevtralne TV-oglase pa so uvrstili TV-oglas, ki je prikazoval karte. Zgornjo ugotovitev potrjujejo tudi ocene posameznih atributov predvajanih TV-oglasov, ki so prikazane v tabeli 3. Iz tabele 3 je razvidno, da so udeleženci TV-oglase Tabela 4. Število udeležencev, ki so izbrani vidik oblike pri posameznem TV-oglasu pripisali določenemu tipu. za dečke za deklice nevtralen TV-oglas »gasilci« glasba 19 0 0 barve 16 0 20 aktivnosti 40 0 4 okolje 14 0 4 TV-oglas »karte« glasba 0 2 11 barve 0 3 26 aktivnosti 0 1 41 okolje 0 4 23 TV-oglas »kuhinja« glasba 0 12 0 barve 0 43 0 aktivnosti 0 44 0 okolje 0 11 5 TV-oglas »avtomobili« glasba 25 0 0 barve 15 0 9 aktivnosti 38 0 0 okolje 11 0 8 TV-oglas »kočija« glasba 0 28 0 barve 0 31 0 aktivnosti 0 31 0 okolje 0 24 0 134 T. Milovanovič za dečke (TV-oglas 1 in TV-oglas 4) v primerjavi z drugimi TV-oglasi višje ocenjevali v sklopu atributov junaškost, moškost in aktivnost, TV-oglase za deklice (TV-oglas 3 in TV-oglas 5) pa so višje ocenjevali v sklopu atributov umirjenost, veselost in ženskost. Ocene atributov sem obdelala z MANOVA-o, vendar dobljeni rezultati zaradi svoje obsežnosti niso predstavljeni v prispevku. V nadaljevanju so navedene zgolj pomembnejše ugotovitve, zainteresirani bralci se naj za natančnejše rezultate obrnejo na avtorico raziskave. Rezultati MANOVA-e so pokazali, da so udeleženci (ne glede na spol) ocenili TV-oglase, namenjene dečkom, kot statistično pomembno bolj junaške, razumske, aktivne in moške kot TV-oglase, namenjene deklicam in nevtralne TV-oglase. TV-oglase, namenjene deklicam, so ocenili kot statistično pomembno bolj umirjene, vesele in ženske od TV-oglasov, namenjenih dečkom, in nevtralnih TV-oglasov. Izjemo v dobljenih rezultatih predstavljajo ocene atributa vsakdanjost, kjer se niso pojavile pomembne razlike glede na tip TV-oglasov. Da otroci zaznavajo številne razlike med TV-oglasi za dečke, TV-oglasi za deklice in nevtralnimi TV-oglasi, potrjujejo rezultati v tabeli 4, ki kažejo, da so udeleženci tudi glasbo, barve, okolje in prikazane aktivnosti predvajanih TV-oglasov ločili glede na to, ali so bolj značilni za dečke, za deklice ali pa so nevtralni. Vidimo, da ocene posamičnih vidikov oblike večinoma sovpadajo s tipi TV-oglasov. Pri TV-oglasih za dečke (TV-oglas »gasilci« in TV-oglas »avtomobili«) so namreč otroci kot deške večinoma ocenili tudi njihovo glasbo, barve, prikazane aktivnosti in okolje, pri TV-oglasih za deklice pa so omenjene vidike oblike večinoma ocenili kot dekliške. Tabela 5. Odgovori udeležencev pri opredelitvi glasbe v posameznih TV-oglasih. f % TV-oglas »gasilci« ima glasbo, značilno za dečke, ker: je akcijska, pustolovska glasba 11 16,2 je divja, zelo živahna glasba 7 10,3 poje moški 1 1,5 TV-oglas »karte« ima glasbo, značilno za dečke in deklice, ker: je poskočna, vesela, živa glasba 11 16,2 TV oglas »karte« ima glasbo, značilno za deklice, ker: poje ženska 2 2,9 TV-oglas »kuhinja« ima glasbo, značilno za deklice, ker: je umirjena glasba 7 10,3 je nežna glasba 2 2,9 je vedra glasba 2 2,9 je osladna glasba 1 1,5 TV-oglas »avtomobili« ima glasbo, značilno za dečke, ker: je divja, zelo živahna glasba 13 19,1 je akcijska, pustolovska glasba 12 17,7 TV-oglas »kočija« ima glasbo, značilno za deklice, ker: je umirjena glasba 14 20,6 je nežna glasba 9 13,2 je čarobna glasba 2 2,9 je lepa glasba 2 2,9 je osladna glasba 1 1,5 Spolna vloga in zaznavanje TV oglasov pri otrocih 135 Tabela 6. Odgovori udeležencev pri opredelitvi barv v posameznih TV-oglasih. f % TV-oglas »gasilci« ima barve, značilne za dečke, ker: prevladujejo temne, modre, moške barve 15 22,1 prevladujejo žive barve 1 1,5 TV-oglas »gasilci« ima barve, značilne za dečke in deklice, ker: prevladujejo pisane, zelo različne barve (za vsak okus) 16 23,5 so temne, modre barve všeč vsem 4 5,9 TV-oglas »karte« ima barve, značilne za dečke in deklice, ker: prevladujejo pisane, zelo različne barve (za vsak okus) 16 23,5 prevladujejo vesele, živahne, tople barve 10 14,7 TV-oglas »karte« ima barve, značilne za deklice, ker: izstopajo svetle barve (roza in rumena) 3 4,4 TV-oglas »kuhinja« ima barve, značilne za deklice, ker: izstopa roza in druge svetle, ženske barve 39 57,4 prevladujejo nežne barve 3 4,4 prevladujejo pastelne barve 1 1,5 TV-oglas »avtomobili« ima barve, značilne za dečke, ker: prevladujejo temne, modre, moške barve 12 17,6 prevladujejo žive barve 3 4,4 TV-oglas »avtomobili« ima barve, značilne za dečke in deklice, ker: za oboje - pisane, zelo različne barve (za vsak okus) 9 13,2 TV-oglas »kočija« ima barve, značilne za deklice, ker: izstopa roza in druge svetle barve 23 33,9 prevladujejo nežne barve 8 11,8 Tabela 7. Odgovori udeležencev pri opredelitvi aktivnosti v posameznih TV-oglasih. f % TV-oglas »gasilci« prikazuje aktivnosti, značilne za dečke, ker: so gasilci, lego kocke in avtomobili igrača za dečke 23 33,8 je gasilec moški poklic 7 10,3 so bojevanje in junaška dejanja značilna za dečke 5 7,4 se v oglasu igrajo le dečki 3 4,4 dečki bolje rešujejo probleme 2 2,9 TV-oglas »gasilci« prikazuje aktivnosti, značilne za dečke in deklice, ker: so lego kocke igra za vse 4 5,9 TV-oglas »karte« prikazuje aktivnosti, značilne za dečke in deklice, ker: so karte namenjene vsem ljudem 40 58,8 v oglasu nastopajo otroci obeh spolov 1 1,5 TV-oglas »karte« prikazuje aktivnosti, značilne za deklice, ker: v oglasu izstopajo deklice 1 1,5 TV-oglas »kuhinja« prikazuje aktivnosti, značilne za deklice, ker: so izdelki znamke »Barbie« igrača za deklice 24 35,3 je kuhanje žensko delo 16 23,5 v oglasu nastopajo le deklice 2 2,9 se deklice igrajo bolj mirno kot dečki 1 1,5 TV-oglas »avtomobili« prikazuje aktivnosti, značilne za dečke, ker: so avtomobili igrača za dečke 33 48,5 imajo dečki radi hitrost in dirke 5 7,4 TV-oglas »kočija« prikazuje aktivnosti, značilne za deklice, ker: so izdelki znamke »Barbie« igrača za deklice 29 42,6 v TV-oglasu nastopajo le deklice 1 1,5 so deklice bolj dojemljive za lepoto 1 1,5 136 T. Milovanovič Tabela 8. Odgovori udeležencev pri opredelitvi okolja v posameznih TV-oglasih. f % TV-oglas »gasilci« prikazuje okolje, značilno za dečke, ker: je prikazano akcijsko, pustolovsko, živahno okolje 10 14,7 okolje sestavljajo ceste in avtomobili 2 2,9 prikazuje odprto okolje 2 2,9 TV-oglas »gasilci« prikazuje okolje, značilno za dečke in deklice, ker: je otroška soba primerna za igro vseh otrok 4 5,9 TV-oglas »karte« prikazuje okolje, značilno za dečke in deklice, ker: je dom primerno okolje za igro vseh otrok 23 33,8 TV oglas »karte« prikazuje okolje, značilno za deklice, ker: prikazuje mirno, varno, zaprto okolje 4 5,9 TV-oglas »kuhinja« prikazuje okolje, značilno za deklice, ker: sta kuhinja oziroma dekliška soba primernejši za igro deklic 8 11,8 prikazuje mirno, varno, zaprto okolje 3 4,4 TV-oglas »kuhinja« prikazuje okolje, značilno za dečke in deklice, ker: je dom primerno okolje za igro vseh otrok 5 7,4 TV-oglas »avtomobili« prikazuje okolje, značilno za dečke, ker: okolje predstavlja deška otroška soba 4 5,9 prikazuje akcijsko, pustolovsko, živahno okolje 4 5,9 okolje sestavljajo ceste in avtomobili 3 4,4 TV-oglas »avtomobili« prikazuje okolje, značilno za dečke in deklice, ker: je dom primerno okolje za igro vseh otrok 7 10,3 TV-oglas »kočija« prikazuje okolje, značilno za deklice, ker: prikazuje pravljično, domišljijsko, čarobno okolje 6 8,8 prikazuje romantično, ljubezensko, nežno okolje 5 7,4 je gozd primernejše okolje za igro deklic 4 5,9 TV-oglas »kočija« prikazuje okolje, značilno za dečke in deklice, ker: je gozd primerno okolje za igro vseh otrok 9 13,2 Iz tabel 5, 6, 7 in 8 je razvidno, kako so udeleženci utemeljili zgoraj predstavljene presoje glasbe, barv, aktivnosti in okolja prikazanih TV-oglasov. Iz tabele 5 je razvidno, da so otroci drugače opisovali glasbo v TV-oglasih za dečke kot v TV-oglasih za deklice. V TV-oglasih za dečke so jo večinoma opisovali kot akcijsko, zelo živahno in jo zato večinoma označili kot deško, v TV-oglasih za deklice pa so jo opisovali kot umirjeno, nežno in jo zato večinoma označili kot dekliško. Iz tabele 6 je razvidno, da so udeleženci barve v TV-oglasih za dečke pogosto opisovali kot temne oziroma moške barve, pa tudi kot pisane, za vse okuse sprejemljive barve. Pri TV-oglasih za deklice pa so pogosto navajali roza in druge svetle, nežne, ženske barve. Iz tabele 7 je razvidno, da so udeleženci aktivnosti v TV-oglasih za dečke večinoma ocenjevali kot deške, kar so utemeljevali s tem, da so igre, kot so igra z avtomobili, lego kockami in gasilci, s poudarkom na borbah in hitrosti veliko bolj značilne za dečke kot za deklice. Aktivnosti v TV-oglasih za deklice pa so ocenili kot dekliške, saj naj bi umirjena igra s punčkami in kuhanje veljali za izključno dekliški aktivnosti. Iz tabele 8 je razvidno, da so udeleženci tudi okolje večinoma ocenjevali skladno Spolna vloga in zaznavanje TV oglasov pri otrocih 137 Tabela 9. Razlike med dečki in deklicami v njihovih ocenah všečnosti posameznih TV-oglasov in izbranih vidikov njihove oblike. dečki deklice M SD M SD df t TV-oglas »gasilci« splošna všečnost 3,55 1,30 3,23 1,06 65 0,99 glasba 3,21 1,41 3,35 1,17 65 -0,17 barve 3,70 1,16 3,48 1,21 65 0,98 aktivnosti otrok 3,21 1,24 3,03 1,20 66 0,28 okolje 3,33 1,27 3,39 1,20 64 0,02 TV-oglas »karte« splošna všečnost 4,00 1,12 4,41 0,91 66 -1,74 glasba 3,58 1,28 3,91 1,35 65 -1,34 barve 3,70 0,95 4,31 0,86 66 -3,06** aktivnosti otrok 3,70 1,26 4,34 0,94 61,22# -2,42* okolje 3,42 1,20 3,90 1,06 65 -1,81 TV-oglas »kuhinja« 47,35# splošna všečnost 1,71 1,00 3,27 1,74 -4,60** glasba 1,94 1,28 3,47 1,55 58,19# -4,62** barve 2,09 1,29 3,48 1,62 54,95# -3,96** aktivnosti otrok 1,91 1,11 3,33 1,71 50,74# -4,24** okolje 2,24 1,18 3,40 1,57 55,96# -3,62** TV-oglas »avtomobili« splošna všečnost 4,03 1,17 2,47 1,41 65 ** 4,76** glasba 3,64 1,38 2,75 1,39 66 2,75* barve 3,94 1,06 2,97 1,26 65 3,27** aktivnosti otrok 3,61 1,28 2,84 1,35 64 2,64* okolje 3,48 1,34 2,69 1,33 65 2,83* TV-oglas »kočija« 53,33# splošna všečnost 1,56 1,04 3,23 1,68 -4,32** glasba 1,91 1,23 3,33 1,73 53,65# -4,06** barve 1,84 1,22 3,43 1,61 55,02# -4,75** aktivnosti otrok 1,75 1,19 3,33 1,65 51,38# -4,52** okolje 2,12 1,50 3,67 1,54 63 -4,01** Opombe. Ocene dečkov in deklic smo primerjali s i-testom. Oznaka # pomeni, da je Levenov test pokazal statistično pomembno razliko (p < 0,05) med variancama primerjanih aritmetičnih sredin; *p < ,05. **p < ,01. s tipom TV-oglasa. V TV-oglasih, namenjenih dečkom, so okolje večinoma ocenili kot deško, saj naj bi bilo akcijsko, živahno in odprto okolje, sestavljeno iz avtomobilov in cest, primerno za igro dečkov. V TV-oglasih, namenjenih deklicam, pa so okolje večinoma ocenili kot dekliško, saj naj bi bila kuhinja in gozd kot prizorišče ljubezenskega dogajanja še posebej primerna za igro deklic. Otroci, ki so sodelovali v naši raziskavi, zgoraj opažene razlike med TV-oglasi za dečke in TV-oglasi za deklice tudi odobravajo, na kar kažejo razlike med dečki in deklicami v njihovih ocenah všečnosti posameznih TV-oglasov ter njihove glasbe, barv, aktivnosti in okolja, ki so prikazane v tabeli 9. Razvidno je, da so se pomembne razlike (p < .05) med dečki in deklicami pojavile pri ocenjevanju všečnosti vseh TV-oglasov in večine izbranih vidikov njihove oblike z izjemo TV-oglasa »gasilci«. 138 T. Milovanovič Zaradi pomanjkljivih in večinoma ekstremnih odgovorov v sklopu zadnjih treh vsebinskih kategorij rezultati zadnjih treh oz. štirih postavk (pri nevtralnem TV-oglasu) niso bili obdelani. Razprava Rezultati raziskave kažejo na obstoj razlik med TV-oglasi za dečke, TV-oglasi za deklice in nevtralnimi TV-oglasi, te razlike pa so v skladu s svojo spolno vlogo sposobni zaznati tudi otroci sami. Udeleženci so namreč skladno s predhodno klasifikacijo opredelili TV-oglas »gasilci« in TV-oglas »avtomobili« kot TV-oglasa za dečke, TV-oglas »kuhinja« in TV-oglas »kočija« kot TV-oglasa za deklice ter TV-oglas »karte« kot nevtralen TV-oglas. Z utemeljitvijo otrok, da so dečkom namenjeni TV-oglasi, ki vključujejo igre s poudarkom na borbi, hitrosti in junaštvu, kot je na primer igra z avtomobili, deklicam pa so namenjene bolj umirjene aktivnosti, kot sta kuhanje in igra s punčkami, so bili torej v naši raziskavi potrjeni izsledki preteklih raziskav (npr. O'Connor, 1989), po katerih TV-oglasi za otroke še dodatno utrjujejo tradicionalne spolne vloge. Zgornjo ugotovitev potrjujejo tudi ocene atributov, saj so udeleženci ocenili, da pri TV-oglasih, namenjenih dečkom, izstopajo atributi, značilni za moški spol, zato so te TV-oglase označili kot junaške, razumske, aktivne in moške. Na drugi strani pa so ocenili, da pri TV-oglasih, namenjenih deklicam, izstopajo atributi, značilni za ženski spol, zato so jih označili kot umirjene, vesele in ženske. Pri nevtralnih TV-oglasih pa so udeleženci večino atributov ocenili s srednjimi, manj ekstremnimi vrednostmi, kar se zdi razumljivo, če upoštevamo, da v teh TV-oglasih nastopajo tako dečki kot deklice, s čimer nudijo model za obe spolni vlogi. Dejstvo, da se pomembne razlike glede na tip TV-oglasa niso pojavile pri atributu vsakdanjost, lahko morda pripišemo neustrezni izbiri naziva atributa, saj vsakdanjost ne sodi niti med tipične moške niti med tipične ženske lastnosti. Kot je razvidno iz predstavljenih rezultatov, so bili udeleženci poleg razlik v tipih predvajanih TV-oglasov sposobni zaznati celo razlike v izbranih vidikih njihove oblike (glasba, barve, prikazane aktivnosti otrok in okolje) in to večinoma skladno s predhodno ocenjenim tipom posameznega TV-oglasa. Otroci so namreč pri TV-oglasih za deklice navajali prisotnost nežne glasbe, svetlih dekliških barv, upočasnjeno dogajanje in mirno, romantično okolje, kar se sklada z rezultati predhodnih analiz oblike TV-oglasov za otroke, glede na katere naj bi v TV-oglasih za deklice prevladovala uporaba pastelnih, pogosto rožnatih barv in meglic, nežna glasba, predvidljivost in počasna, postopna spremenljivost, pasivnost ter zaprto okolje (Larson, 2001; Marjanovič Umek in Zupančič, 2001; Smith, 1994; Welch in dr., 1979). Pri TV-oglasih za dečke pa so otroci navajali prisotnost »akcijske« glasbe, temnih, tudi pisanih moških barv, hitro, »akcijsko« dogajanje in temu primerno okolje, kar se ponovno sklada z rezultati preteklih analiz, po katerih naj bi v TV-oglasih za dečke prevladovala bučna glasba, hitre izmenjave scen, moč, hitrost, fizične aktivnosti in odprto okolje (Larson, 2001; Smith, Spolna vloga in zaznavanje TV oglasov pri otrocih 139 1994; Welch in dr., 1979). V raziskavi se torej ni potrdila trditev Welcha in dr. (1979), da naj bi sporočila posredovana skozi obliko TV-oglasov ostala otrokom bolj ali manj prikrita. Razlog za neujemanje te ugotovitve z našimi rezultati lahko morda iščemo v dejstvu, da sem v okviru vprašalnika od udeležencev eksplicitno zahtevala usmeritev njihove pozornosti tudi na samo obliko TV-oglasov, posredovano skozi glasbo, barve, aktivnosti in okolje, s čimer sem jim onemogočila zgolj pasivno, podzavestno sprejemanje tovrstnih informacij. Na podlagi rezultatov lahko torej sklepamo, da se TV-oglasi za dečke, TV-oglasi za deklice in nevtralni TV-oglasi med seboj dejansko razlikujejo glede na vsebino, strukturo ter stil sporočila, in sicer celo v takšni meri, da so to zaznali tudi udeleženci in udeleženke. Odgovori udeležencev torej kažejo na njihove že globoko usidrane stereotipne spolne vloge, v skladu s katerimi zaznavajo tudi svoje okolje, med drugim tudi TV-oglase. Le-ti pa so namensko oblikovani tako, da še dodatno utrjujejo razlike med tradicionalno moško in žensko spolno vlogo s ciljem, da otroci posnemajo vedenje prikazanih modelov. Statistično pomembne razlike v ocenah všečnosti prikazanih TV-oglasov in izbranih vidikov njihove oblike kažejo na to, da udeleženci v skladu z osvojenimi stereotipnimi spolnimi vlogami ne le zaznavajo, temveč tudi presojajo svet okrog sebe. Dejstvo, da dečki kot bolj všečne ocenjujejo TV-oglase za dečke, deklice pa TV-oglase za deklice, se zdi razumljivo, če se spomnimo na proces socializacije, v okviru katerega otroke že v zgodnjem otroštvu učimo, da so za pripadnike moškega spola značilne druge lastnosti (kot so neodvisnost, dominantnost in tekmovalnost) kot za pripadnice ženskega spola (kot so pasivnost, občutljivost in ljubeča narava) (Golombok in Fivush, 1994). V skladu s tem spodbujamo dečke in deklice k igranju z različnimi igračami, k poslušanju različne glasbe, izbiri različnih barv, k različnim aktivnostim in k igri v različnem okolju. V tem procesu pa poleg staršev sodeluje tudi širše družbeno okolje, med drugim tudi oglaševalci s svojim prilagajanjem načina oglaševanja socializaciji otrok. Njihovo uspešnost pri tem dokazujejo dobljeni rezultati, saj so dečki bistveno bolj kot deklice sprejeli TV-oglase za dečke (TV-oglas »avtomobili«), deklice pa so bistveno bolj sprejele TV-oglase za deklice (TV-oglasa »kuhinja« in »kočija«). S tem, ko oblikujejo svoje TV-oglase tako, da v največji možni meri ustrezajo osvojenim stereotipnim vlogam njihovih gledalcev, si poleg posnemanja zagotovijo tudi njihovo odobravanje, saj otroci občutijo podobnost in povezanost s predstavljenimi modeli. Izjemo pri dobljenih rezultatih so predstavljale dobljene nepomembne razlike med rezultati dečkov in deklic pri ocenah všečnosti za TV-oglas »gasilci«, katere pa morda lahko razložimo z dejstvom, da se deklice pogosteje igrajo igre za dečke kot dečki igre za deklice (Marjanovič Umek in Zupančič, 2001). Dejstvo, da se deklice rade igrajo z igračo, prikazano v TV-oglasu za dečke (v TV-oglasu »gasilci« so to lego kocke), je torej morda vplivalo na njihovo podajanje višjih ocen všečnosti tudi samega TV-oglasa. Predstavljena raziskava je še ena v nizu raziskav, ki kažejo na močan vpliv TV-oglasov na oblikovanje tradicionalne spolne vloge pri otrocih. Izvedena raziskava je poleg tega pokazala, da so otroci sposobni zaznati številne razlike v vsebini in obliki med različnimi tipi TV-oglasov. Se več, raziskava je celo pokazala, da otroci opažene 140 T. Milovanovič razlike, prilagojene tradicionalnim spolnim vlogam, ne le zaznavajo, temveč jih celo odobravajo. Predstavljeni rezultati lahko torej predstavljajo koristno orientacijo pri zasnovi nadaljnjih raziskav. Tako bi bilo med drugim pomembno ugotoviti, v kolikšni meri se starši zavedajo močnega vpliva TV-oglasov, še zlasti prikritih sporočil posredovanih skozi njihovo obliko. Pri tem pa je ključno vprašanje, ali starši in drugi ljudje iz otrokove okolice odobravajo in spodbujajo razlike med TV-oglasi za dečke in TV-oglasi za deklice ter s tem morda še dodatno povečujejo vpliv predvajanih TV-oglasov. Sele sistematične raziskave nam bodo torej pokazale, kolikšen je dejanski vpliv samih TV-oglasov na oblikovanje stereotipnih spolnih vlog pri otrocih in nam poleg tega nakazale smernice, po katerih bi se naj ravnali pri socializaciji otrok na potrošniškem področju. Literatura Bandura, A. (1969). Principles of Behavior Modification. New York: Holt, Rinehart and Winston. Berns, R. M. (1993). Child, Family, Community: Socialization and Support. Orlando: Holt, Rinehart and Winston. Chandler, D. in Griffiths, M. (2000). Gender-Differentiated Production Features in Toy Commercials. Journal of Broadcasting and Electronic Media, 44(3), 503-520. Doolittle, J in Pepper, J (1975). Childrens TV Ad Content: 1974. Journal of Broadcasting, 19 (2), 131-142. Golombok, S. in Fivush, R.(1994). Gender development. Cambridge: Cambridge University Press. Larson, M. S. (2001). Interactions, Activites and Gender in Children's Television Commercials: A Content Analysis. Journal of Broadcasting and Electronic Media, 45 (1), 41-57. Luecke-Aleksa, D., Anderson, D. R., Collins, P. A., Schmitt, K. L. (1995). Gender Constancy and Television Viewing. Developmental Psychology, 31(5), 773-780. Marjanovič Umek, L. in Zupančič, M. (2001). Psihologija otroške igre: od rojstva do vstopa v šolo [Psychology of the childrens' play: from birth until the childs' entry to school] . Ljubljana: Znanstveni inštitut Filozofske fakultete. O'Connor, J. J. (1989). What are TV Ads Selling to Children? Advertising Age, 60, 34-38. Ruble D. N., Balaban T. in Cooper, J. (1981). Gender constancy and the effects of sex-typed televised toy commercials. Child Development, 52 (2), 667-73. Smith, L. J. (1994). A Content Analysis of Gender Differences in Children's Advertising. Journal of Broadcasting and Electronic Media, 38 (3), 323-337. Verna, M. E (1975): The Female Image in Children's TV Commercials. Journal of Broadcasting, 19 (3), 301-309. Welch, R. L., Huston-Stein, A., Wright, J. C. in Plehal, R (1979). Subtle Sex-Role Cues in Children's Commercials. Journal of Communication, 29 (3), 202-209. Prispelo/Received: 08.11.2005 Sprejeto/Accepted: 13.01.2006 Psihološka obzorja / Horizons of Psychology, 14, 3, 141-144 (2005) © Društvo psihologov Slovenije 2005, ISSN 1318-187 Predstavitev Predstavitev doktorske disertacije "Učna motivacija v odnosu do učenja in učne uspešnosti učencev" (dr. Mojca Juriševič)" Drago Žagar* Univerza v Ljubljani, Oddelek za psihologijo, Ljubljana Presentation of the doctoral dissertation "Role of learning motivation in learning and academic achievement of primary school pupils" (Mojca Juriševič, PhD) Drago Žagar University of Ljubljana, Department of Psychology, Ljubljana, Slovenia Ključne besede: učenci, učenje, učna motivacija, motivacija, učna uspešnost, doktorske disertacije, predstavitve Key words: pupils, learning, learning motivation, motivation, academic achievement CC = 3550 Juriševič, M. (2005). Učna motivacija v odnosu do učenja in učne uspešnosti učencev (neobjavljena doktorska disertacija). Ljubljana: Univerza v Ljubljani, Filozofska fakulteta, Oddelek za psihologijo (COBISS-ID: 222699776). Dr. Mojca Juriševič, univ. dipl. psihologinja, je v oktobru 2005 pred komisijo v sestavi izr. prof. dr. Sonja Pečjak, red. prof. dr. Drago Žagar, izr. prof. dr. Cveta Razdevšek Pučko in red. prof. ddr. Barica Marentič Požarnik uspešno zagovarjala doktorsko disertacijo z naslovom "Učna motivacija v odnosu do učenja in učne uspešnosti učencev ", ki jo je opravila na Oddelku za psihologij o Filozofske fakultete v Ljublj ani pod mentorstvom red. prof. dr. Draga Žagarja in somentorstvom izr. prof. dr. Cvete Razdevšek Pučko (PeF v Ljubljani). Po vsebini doktorska disertacija sodi na področje pedagoške psihologije oz. # Disertacijo si lahko ogledate v knjižnici Oddelka za psihologijo Filozofske fakultete Univerze v Ljubljani pri ge. Mileni Vukic. * Naslov / address: red. prof. dr. Drago Žagar, Univerza v Ljubljani, Filozofska fakulteta, Oddelek za psihologijo, Aškerčeva 2, 1000 Ljubljana, Slovenija, e-mail: drago.zagar@ff.uni-lj.si 142 D. Žagar ožje na področje učne motivacije. Namen disertacije je bil določiti latentno strukturo učne motivacije; identificirati, opisati in primerjati motivacijske vzorce različnih skupin učencev; preučiti odnose med učno motivacijo in nekaterimi drugimi dejavniki učne uspešnosti; ugotoviti prispevek različnih dej avnikov k učni uspešnosti; oblikovati smernice za izboljšanje učne motivacije učencev v šoli. Ti cilji izhajajo iz njenega integrativnega modela učne motivacije, ki ga preverja v disertaciji. Doktorska disertacija je na splošno razdeljena v dva dela: uvodni (teoretični) in empirični. V uvodnem delu so predstavljena dosedanja spoznanja, ki se povezujejo z raziskovalnim problemom disertacije, empirični del pa zajema: opredelitev raziskovalnih ciljev in problema, hipoteze, spremenljivke, metodo raziskovanja, predstavitev rezultatov z razpravo in sklepe. V uvodnem delu kandidatka najprej razloži različne poglede na motivacijo skozi razvoj psihologije motivacije in pedagoške psihologije. Posebej izpostavi Greenovo klasifikacijo prevladujočih teoretičnih paradigem znotraj pedagoške psihologije, kot so: behaviorizem, kognitivizem in situacionizem (Green in sod., 1996). Behavioristi razlagajo motivacijo z vidika spodbud iz okolja, kognitivisti poudarjajo posameznikov osebni interes na določenem področju, situacijska perspektiva pa predstavlja neke vrste sintezo kognitivne in behavioristične perspektive; učna motivacija je odraz interakcijskih vplivov med učencem in socialnim okoljem oz. njegovim učnim kontekstom. Nato kandidatka opozori na terminološka razhajanja v psihologiji v zvezi z motivacijo. Terminološka neenotnost namreč lahko vpliva na izbor metodologije in na razlago raziskovalnih rezultatov. Zato izraze, ki jih uporablja v disertaciji, pomensko razloži. Poglobljeno obravnava odnos med motivacijo in učenjem, ki j e osnovni problem njene doktorske disertacije. Predstavi Pintrichov in Walbergov model vplivanja različnih dejavnikov na učenje oz. učno uspešnost, pri čemer je kritična zlasti do Walbergovega modela, ki motivacijo postavi v neposredni odnos do učenja in je ne obravnava kot pomembno mediatorsko spremenljivko, ki na učno uspešnost deluje preko različnih kvantitativnih in kvalitativnih kazalnikov učnega procesa ter v povezavi z nekaterimi drugimi učenčevimi osebnostnimi in demografskimi značilnostmi. Slednje upošteva Rheinbergov model, ki si ga kandidatka izbere kot osnovo za oblikovanje lastnega modela, katerega empirično preverja v disertaciji. V nadalj evanju razpravlj a o odnosih med motivacij o in kognitivnimi sposobnostmi, učnimi strategijami in samouravnavanjem motivacije, kot posredniškimi spremenljivkami na poti do učnih dosežkov. Motivacijo pa obravnava tudi v povezavi z učnim kontekstom. Kandidatka sprejema situacijsko perspektivo, ki poudarja, da je razumevanje socialnega okolja bistveno za razumevanje motivacije, zato pri preučevanju učne motivacije, poleg nekaterih osebnostnih dejavnikov pri učencih, zajame tudi učni kontekst. Nato beremo o sestavinah učne motivacije. Kandidatka zaradi večje konceptualne preglednosti sestavine motivacije obravnava v dveh sklopih. Po zgledu drugih avtorjev (npr. Eccles in Wigfield, 1995) posebej izpostavi skupino sestavin, ki se povezuje z razlogi za določeno učno vedenje (motivacijski pobudniki), in skupino sestavin, ki se nanaša na energiziranje med samim učnim procesom, do zaključka naloge (motivacijski Predstavitev 143 ojačevalci). Pobudnike učnega vedenja razdeli na tiste, ki jih običajno označujemo s terminom notranja motivacija, in tiste, ki sodijo v področje zunanje motivacije. Podrobno predstavi naslednje motivacijske pobudnike: cilje, interese, zaznano pomembnost učenja in zaznano težavnost naloge. Med ojačevalci učnega vedenja pa podrobno obravnava samopodobo in kognicije, ki vedenje ojačujejo posredno oz. ciklično preko učenčevih razlag trenutne uspešnosti. Te sestavine učne motivacije tudi sama preučuje. V posebnem poglavju obravnava modele in metode preučevanja motivacije. Razloži različne klasifikacije modelov in metod ter njihove prednosti in slabosti, ki sta jih dobro opredelila Pintrich in Schunk (1996). Kandidatka se zaveda težav pri preučevanju motivacije, zlasti pri mlajših učencih, zato v disertaciji posebno pozornost nameni metodologiji raziskovanja. Uvodni del sklene s vprašanjem aplikativnosti teoretičnih spoznanj o učni motivaciji. Najprej razpravlja o dejavnikih, ki vplivajo na učno motivacijo učencev. Nato pa predstavi različne pedagoške pristope za spodbujanje motivacije učencev v šoli. Le-te skladno z dihotomijo zunanja-notranja motivacija razdeli v dve široki skupini: pedagoški pristopi, ki temeljijo na notranjih motivacijskih spodbudah, in pedagoški pristopi, ki temeljijo na zunanjih motivacijskih spodbudah. V nadaljevanju analizira omejitve obeh omenjenih klasičnih pristopov, podrobno pa predstavi tudi novejši Brophyjev koncept območij bližnjega kognitivnega in motivacijskega razvoja (Brophy, 1999). Uvodni del disertacije daje dober pregled dosedanjih spoznanj o učni motivaciji. Zasnovan je na pregledu obsežne relevantne literature. Kandidatka je dobro analizirala dosedanja vedenja in še nepojasnjena vprašanja v zvezi z učno motivacijo in tako utemeljila potrebo po preučevanju problema doktorske disertacije. Empirični del disertacije je metodološko dobro načrtovan. V vzorec je bilo zajetih 198 učencev četrtega razreda in 217 učencev sedmega razreda osnovne šole. Podatki so bili pridobljeni iz naslednjih virov: Vprašalnik učne motivacije, Vprašalnik učnih pristopov, Vprašalnik socialno-motivacijskih spodbud, Ravenove Standardne progresivne matrice, šolske ocene in učiteljevo mnenje o učni aktivnosti učencev. Vprašalnike je kandidatka sama pripravila, Standardne progresivne matrice pa je za naše razmere priredil Center za psihodiagnostična sredstva v Ljubljani. Zanesljivost merskih pripomočkov je na splošno zadovoljiva. Statistična obdelava podatkov je temeljita in korektna. Uporabljene so bile statistične metode na različnih ravneh analize: faktorska analiza, klastrska analiza, hi-kvadrat preizkus, enosmerna analiza variance, post-hoc preizkus, diskriminantna analiza in regresijska analiza. Doktorska disertacij a je prispevala naslednj e najpomembnej še ugotovitve: Na osnovi multivariatne analize je bilo identificiranih 23 sestavin učne motivacije, ki so se v manifestnem prostoru združile v tri latentne motivacijske usmerjenosti: nemoč in izogibanje, zunanja motivacijska usmerjenost in notranja motivacijska usmerjenost. S tem je bil potrjen obstoj relativno stabilne latentne strukture učne motivacije. Ta ugotovitev razširja znano dihotomijo ''zunanja-notranja motivacija" s tretjo enako pomembno motivacijsko usmerjenostjo, imenovano ''nemoč in izogibanje". S klastrsko analizo so bili učenci glede na kombinacijo njihovih motivacijskih 144 D. Žagar usmerjenosti razvrščeni v specifične motivacijske skupine, ki predstavljajo homogene motivacijske vzorce. Pri učencih četrtega razreda so bili določeni štirje, pri učencih sedmega razreda pa pet motivacijskih vzorcev. Mlajši učenci oblikujejo manj izrazite, a vsebinsko podobne motivacijske vzorce kot starejši. Tako v četrtem kot v sedmem razredu so bile identificirane naslednje skupine učencev z različnimi motivacijskimi vzorci: učno tekmovalni učenci, učno aktivni učenci, učno nesamozavestni učenci in učno pasivni učenci. Pri učencih sedmega razreda pa je bil identificiran še dodaten motivacijski vzorec: učno nemotivirani učenci. Primerjava skupin učencev z različnimi motivacijskimi vzorci je pokazala, da se te skupine učencev razlikujejo tudi v nekaterih drugih spremenljivkah: v učnih pristopih, motivacijskih spodbudah, ki jih za učenje dobivajo od svojega socialnega okolja, ter v tem, kako učitelji ocenjujejo njihovo učno uspešnost in aktivnost. Te razlike so se pokazale tako pri učencih četrtega kot sedmega razreda. Učenci četrtega razreda z različnimi motivacijskimi vzorci so se razlikovali še v sposobnostih, učenci sedmega razreda pa v zastopanosti spola. Glede deleža, ki ga imajo posamezni dejavniki pri učni uspešnosti učencev, pa rezultati kažejo, da je delež učne motivacije kot samostojnega dejavnika majhen in se pokaže šele pri učencih sedmega razreda. Enako velja tudi za sposobnosti in za učiteljevo oceno aktivnosti učencev. Po mnenju kandidatke to navaja k sklepu, da je učna motivacija dejansko mediatorska spremenljivka in ni neposredno povezana z učenčevo učno uspešnostjo, vsaj do sedmega razreda. Kandidatka na osnovi dobljenih rezultatov zaključuje, da odpirajo več novih vprašanj, kot pa dajejo jasnih odgovorov glede manifestiranja učne motivacije v učnem vedenju. Zagotovo pa po njenem mnenju lahko izluščimo naslednje: različni učenci (po starosti, spolu, sposobnostih) so za učenje motivirani na osnovi različnih motivacijskih vzorcev; ti vzorci so kontekstno pogojeni; učence usmerjajo k različnemu učnemu vedenju; povezani so z različnimi učnimi pristopi; med izobraževanjem se jasneje oblikujejo in postajajo vedno bolj stabilni; zaradi različnih motivacijskih vzorcev so učenci različno učno uspešni. K temu lahko dodamo še ugotovitev, da je učna motivacija pomembna mediatorska spremenljivka v odnosu do učne uspešnosti učencev. Omenjene ugotovitve so pomembne za psihološko stroko, saj prispevajo dodatna znanja o specifični učni motivaciji posameznih skupin učencev, njenem razvoju in vplivanju na učenje. Ugotovitve pa so zanimive tudi za pedagoško prakso. Kandidatka jih operacionalizira v smernicah učiteljem za uspešnejše motiviranje učencev. Doktorska disertacija dr. Mojce Juriševič je izvirno znanstveno delo, ki je pomembno za psihološko stroko in ima tudi določene pedagoške implikacije. Odlikujejo ga teoretična preglednost, metodološka utemeljenost in analitična prodornost. Prispelo/Received: 8.11.2005 Psihološka obzorja / Horizons of Psychology, 14, 3, 145-147 (2005) © Društvo psihologov Slovenije 2005, ISSN 1318-187 Predstavitev Ocena magistrske naloge »Vpliv čustvenega delovanja na zdravstveno stanje otrok« Kristine Dankič" Janek Musek* Univerza v Ljubljani, Oddelek za psihologijo, Ljubljana Presentation of the MA thesis "Effect of emotional functioning on children's health" (Kristina Dankič, MA) Janek Musek University of Ljubljana, Department of Psychology, Ljubljana, Slovenia Ključne besede: čustva, zdravje, razvoj otroka, magistrska dela, predstavitve Key words: emotions, health, childhood development, MA thesis, reviews CC = 3360 Dankic, K. (2005). Vpliv čustvenega delovanja na zdravstveno stanje otrok (neobjavljeno magistrsko delo). Ljubljana: Univerza v Ljubljani, Filozofska fakulteta, Oddelek za psihologijo (COBISS-ID: 30897762). V novejšem času se v psihologiji stopnjuje število raziskav odnosa med osebnostnimi značilnostmi in različnimi spremenljivkami mentalnega in telesnega zdravja. Kristina Dankic se je v svoji magistrski raziskavi pridružila tem prizadevanjem. Zanimalo jo je vprašanje, kako in v kakšni meri so značilnosti telesnega zdravja povezane in tudi odvisne od temeljnih dimenzij osebnosti (predvsem ekstravertnosti in nevroticizma) in temeljnih dimenzij emocionalnosti oziroma afekta (pozitivni in negativni afekt). Vloga temeljnih dimenzij osebnosti in afekta tako pri mentalnem kot pri telesnem zdravju se je sicer že v dosedanjem raziskovanju zanesljivo dokazala, vendar pa so pri raziskovanju te problematike ostala še mnoga nerazčiščena vprašanja. Omenjena # Magistrsko nalogo si lahko ogledate v knjižnici Oddelka za psihologijo Filozofske fakultete Univerze v Ljubljani pri ge. Mileni Vukic. * Naslov / address: red. prof. dr. Janek Musek, Univerza v Ljubljani, Filozofska fakulteta, Oddelek za psihologijo, Aškerčeva 2, 1000 Ljubljana, Slovenija, e-mail: janek.musek@ff.uni-lj.si 146 J. Musek vloga je namreč veliko temeljiteje raziskana pri odrasli in mladostniški populaciji kot pri otrocih, vključno s predšolskimi otroki. Poleg tega ni docela razjasnjeno, kako je sestavljen vpliv osebnosti na telesno zdravje, koliko gre za neposredni vpliv temeljnih dimenzij osebnosti in koliko je ta vpliv lahko posreden, mediiran preko tretjih spremenljivk. Avtorica je utemeljeno domnevala, da bi utegnil biti levji delež posrednega vpliva osebnosti posredovan preko pozitivnega in negativnega afekta. Za oba je namreč znano, da korelirata tako s temeljnimi dimenzijami osebnosti kot z značilnostmi telesnega zdravja. Tako je torej avtorica kot svoj temeljni hipotetični model postavila model odnosa osebnosti, afekta in telesnega zdravja pri otrocih, v tem modelu pa je implicirala neposredni vpliv dimenzij osebnosti na telesno zdravje, neposredni vpliv afekta na telesno zdravje, neposredni vpliv dimenzij osebnosti na afekt in pa tudi posredni vpliv osebnosti na telesno zdravje (mediiran preko afektivnih stanj). Avtorica je spremenljivke, zajete v modelu, merila z ustreznim psihološkim instrumentarijem, ki je bil uporabljen pri 130 starših otrok in 16 zdravnikih (otroci v starostnem razponu od 4 do 7 let). Starši so bili informatorji za osebnostne dimenzije in dimenzije afekta, starši in zdravniki pa za zdravstveno stanje otrok. Pozitivni in negativni afekt je avtorica merila z Lestvico razpoloženja, ki sta jo skonstruirala Kardum in Bezinovic (1992). Lestvica meri dimenziji pozitivnega in negativnega afekta in ima dobre merske karakteristike, po vsej verjetnosti je kompleksnejša in zato občutljivejša od najbolj znanega instrumenta za merjenje afekta v svetu, lestvice PANAS. Dimenzije osebnosti je avtorica merila s pomočjo Eysenckovega vprašalnika osebnosti za otroke (Junior EPQ), ki meri ekstravertnost, nevroticizem, psihoticizem in težnjo k dajanju socialno zaželenih odgovorov. Tudi ta vprašalnik ima dobre merske karakteristike, ne glede na to pa je avtorica preverila tudi ad hoc zanesljivost pri samem vzorcu raziskovancev in ta se je izkazala za zadovoljivo. Za merjenje telesne zdravstvene simptomatike je avtorica uporabila Pennebakerjev inventar limbične medlosti (PILL), ki ga je za ta namen tudi prevedla (translacija in retranslacija) in modificirala. Vprašalnik meri tako jakost kot pogostost telesne zdravstvene simptomatike. S pomočjo omenjenega instrumentarija je avtorica pridobila raziskovalne podatke, ki jih je obdelala s pomočjo korelacijskih in multivariatnih analiz. Te so pokazale, da se zdravstvena simptomatika na ravni korelacijskih koeficientov pri otrocih povezuje tako z negativnim kot s pozitivnim afektom, v nekoliko manjši meri pa tudi z osebnostnima dimenzijama nevroticizma in psihoticizma. Med temeljnimi dimenzijami osebnosti in afekta so se pokazale pričakovane korelacije pozitivne ekstravertnosti s pozitivnim afektom ter nevroticizma in psihoticizma z negativnm afektom, prav tako pa negativne korelacije nevroticizma in psihoticizma s pozitivnim afektom. Ti podatki torej kažejo, da se osnovne povezave med osebnostjo, afektom in telesnim zdravjem, ki jih poznamo pri odrasli in mladostniški populaciji, pojavijo že pri otrocih v predšolskem obdobju. Vzročne odnose med spremenljivkami, njihovo smer in kompozicijo glede na neposredni in posredni vpliv je avtorica preverjala s pomočjo modelov strukturnih Predstavitev 147 enačb (analize poti in LISREL). Preverjeno je bilo več modelov od začetnih redundantnih do bolj parsimoničnih in to na podlagi iteracij, v katerih so bili izločeni redundantni parametri modelov. Potrjeni modeli odnosov med spremenljivkami so ponovno potrdili signifikantno povezanost osebnosti in afekta (ekstravertnosti s pozitivnim, ter nevroticizma in psihoticizma z negativnim afektom). Kar zadeva odnose osebnosti in afekta s telesnim zdravjem, pa so modeli pokazali, da obstaja statistično pomemben skupni učinek nevroticizma na telesno zdravstveno simptomatiko, pri čemer nevroticem vpliva na telesno zdravje tako neposredno kot posredno preko negativnega afekta. Od obeh dimenzij afekta ima le negativni afekt trdno izkazan vpliv na telesno zdravje. Dobljeni rezultati so zelo zanimivi in zanesljivo kažejo na povezanost osebnosti, afekta in zdravstvenega stanja pri predšolskih otrocih. Ta povezanost se kaže v signifikantnem vplivu nevroticizma, psihoticizma in negativnega afekta na telesno zdravje. Najpomembnejši smeri tega vpliva na telesne zdravstvene simptome potekata od nevroticizma preko negativnega afekta in od psihoticizma preko negativnega afekta. Po teh rezultatih sodeč so torej nevroticizem in psihoticizem na osebnostni ravni in negativni afekt na ravni emocionalnosti ključni dejavniki telesnega počutja in zdravja; ekstravertnost in pozitivni afekt pa s telesnimi počutjem in zdravjem nista pomembno povezana. Omenjene ugotovitve magistrice Kristine Dankic pomenijo vsekakor tehten znanstveno raziskovalni prispevek, ki jasneje in temeljiteje kot vse dosedanje raziskave pojasnjuje odnose med temeljnimi dimenzijami osebnosti in afektom pri moderiranju psihičnega in telesnega počutja in zdravja otrok. Prispelo/Received: 6.11.2005 fil0z0f5ka fakulteta univerze v ljubljani Oddelek za psihologijo Anja PODLESEK, Klas BRENK OSNOVE PSIHOLOŠKEGA MERJENJA: PSIHOFIZIKALNA METODOLOGIJA Psihološka obzorja / Horizons of Psychology, 14, 3, 149-155 (2005) © Društvo psihologov Slovenije 2005, ISSN 1318-187 Poročilo s konference Poročilo s 37. letnega splošnega srečanja evropskega združenja za preučevanje možganov in vedenja v Dublinu na Irskem Luka Komidar* Univerza v Ljubljani, Oddelek za psihologijo, Ljubljana Report from the 37th Annual General Meeting of European Brain and Behaviour Society, Dublin, Ireland Luka Komidar University of Ljubljana, Department of Psychology, Ljubljana, Slovenia CC = 2500 Združenje EBBS (European Brain and Behaviour Society) je bilo ustanovljeno leta 1968 z namenom povezovanja in izmenjave informacij med evropskimi znanstveniki, ki se ukvarjajo z odnosi med možganskimi mehanizmi in vedenjem. V skladu s tem ciljem združenje vsako leto priredi splošno srečanje, ki na liha leta poteka samostojno, na soda pa v okviru srečanja federacije evropskih nevroznanstvenih združenj (FENS; The Federation of Neuroscience Societies). EBBS ima v tem kontekstu ključno vlogo, saj je eden izmed ustanovnih članov FENS-a. Letošnje srečanje je potekalo v zgradbi družbenih znanosti v kampusu Trinity College-a, ki se nahaja v centru Dublina. Začetki Trinity College-a segajo v leto 1592 in je najstarejša univerza na Irskem. Čeprav se nahaja v strogem središču mesta, vseeno daje močan občutek študentskega kampusa. Celotno področje je precej obsežno in vključuje veliko starejših in tudi novejših stavb, tlakovan trg, veliko zelenih površin in dve igrišči za rugby in nogomet. Skratka, okolje Trinity College-a je čudovito in obiskovalca navdaja s posebnim občutkom tradicije, učenosti in spoštovanja do prostora, ki te obdaja. Na tokratnem srečanju EBBS se je zbralo okoli 450 udeležencev iz 33 držav, pri čemer smo lahko prisluhnili šestim plenarnim predavanjem, šestinpetdesetim predstavitvam in si ogledali 243 posterjev. Časovna struktura konference je bila vzorna * Naslov / address: asist. Luka Komidar, ml. razisk., Univerza v Ljubljani, Filozofska fakulteta, Oddelek za psihologijo, Aškerčeva 2, 1000 Ljubljana, Slovenija, e-mail: luka.komidar@ff.uni-lj.si 150 L. Komidar - predstavitve v simpozijih in ogledi posterjev so bili od 9:00 do 17:30 razdeljeni na dopoldanski in popoldanski del. Kot je na konferencah v navadi, sta tako dopoldne kot popoldne hkrati potekali dve sekciji simpozijev, za ogled posterjev pa smo v obeh terminih imeli na razpolago eno uro. Dnevno so torej potekale štiri sekcije simpozijev, dve plenarni predavanji in dve sekciji posterjev. Srečanje EBBS 2005 nam je ponudilo naslednje glavne teme: kontrastni in komplementarni 'in vivo' in 'in vitro' pristopi k preučevanju subikularne funkcije (subiculus je del hipokampalnega girusa in predstavlja ventralno nadaljevanje hipokampusa), plastičnost vidne možganske skorje, nadzor vedenja s pričakovano nagrado, mehanizmi kortikalne obdelave čustvenih obraznih izrazov, možganski opiati in hranjenje, funkcije talamičnega retikularnega jedra, učenje, spomin in plastičnost korteksa, FEF (angl. frontal eye fields) v vidni analizi in očesnih premikih, primerjalni pristop k nevrovedenjskemu ocenjevanju razvoja učenja, nevrobiologija senzornega odločanj a, ekonometrični in verj etnostni modeli učenj a v možganih primatov, kanaboidni sistem v možganih - nagraj evanj e in odvisnost ter pritegnitev pozornosti. V nadalj evanju se bom najprej osredotočil na plenarna predavanja, nato pa na izbrane predstavitve v simpozijih. Program se je začel v soboto (24.9.2005), vendar samo popoldanski termin. Po uvodnem pozdravu in dobrodošlici organizatorjev smo poslušali prvo plenarno predavanje Patricie Churchland Smith, ki je govorila o nevrobiološkem pristopu k samonadzoru (angl. self-control). Prvi del govora je bil bolj filozofsko obarvan, saj je avtorica razpravljala o naravi moralne odgovornosti in o problematiki zakonskih aktov, ki določajo mejo med zakonsko odgovornostjo in neodgovornostjo posameznika za (kaznivo) dejanje. Z drugimi besedami, skušala je podati teoretično izhodišče za vprašanje, kdaj opredelimo neko vedenje, kot da je 'pod našim nadzorom' (angl. 'in control'), in kdaj ga opredelimo kot 'izven našega nadzora' (angl. 'out of control'). V nadaljevanju se je nato osredotočila na nevrološke parametre, ki ločujejo med dejavniki oziroma procesi, ki so 'pod nadzorom' in tistimi, ki so 'izven nadzora'. Med te parametre po eni strani prišteva organizacijo nevronov v strukturah, kot so ventromedialna prefrontalna skorja, cingulatna skorja, amigdala in hipotalamus, po drugi strani pa parametre na molekularni ravni, ki vključujejo hormone, nevromodulatorje in specifične proteine, kot je npr. leptin. Na koncu je vse predstavljeno povezala v razpravo o biološki osnovi etike in najustreznej ših sredstvih za vzdrževanj e civilne družbe. V drugem plenarnem predavanju nam je James McGaugh predaval o vplivu čustvene vzburjenosti, stresnih hormonov in aktivacije amigdale na utrjevanje dolgoročnih spominov. V povzetku izsledkov, do katerih so prišli v njegovem laboratoriju, smo izvedeli, da stresni hormoni regulirajo utrjevanje spominov preko združevanja vplivov na b-noradrenergično aktivacijo znotraj bazolateralnega kompleksa amigdale (BLA). Aktivacija BLA, ki jo po učenju (angl. posttraining) induciramo z vnosom adrenoreceptorskih agonistov, vpliva na spomin preko projekcij v hipokampus, striatum in kortikalna področja. Ti izsledki so skladni s fiziološkimi dognanji, da aktivacija Poročilo s konference 151 BLA igra ključno vlogo v regulaciji nevroplastičnosti v hipokampusu in možganski skorji. Z drugimi besedami, aktivacija nevromodulatornih sistemov, ki vplivajo na BLA in njene projekcije v druge predele možganov, ki sodelujejo pri obdelavi spominov, zagotavlja, da si pomembne izkušnje dobro zapomnimo. Tudi tema tretjega plenarnega predavanja je bila spomin, in sicer smo lahko prisluhnili predavanju z naslovom 'V iskanju spominske sledi: primer vidnega vtisnjevanja (angl. visual imprinting). Predavatelj nas je v uvodnih minutah popeljal vse do 17. stoletja, saj je takrat Descartes prvi omenil možnost, da spomin tvorijo sledi v možganih, ki jih puščajo predhodne (naučene) izkušnje. Sledil je pregled glavnih hipotez o lastnostih spominskih sledi, ki so jih skozi zgodovino podali veliki umi, kot sta npr. Cajal in Hebb. Glavnino predavanja so predstavljali izsledki raziskav vidnega vtisnjevanja pri piščancu. Vidno vtisnjevanje je pojav, pri katerem se novorojen piščanec naveže in nauči prepoznavati svojo mater ali nadomestno mater, ki je lahko tudi umetni predmet. Prednost tovrstnih raziskav leži v dejstvu, da se pri vtisnjevanju vidno neizkušena žival nauči značilnosti prvega predmeta, kateremu je izpostavljena -spominska sled 'matere' tako predstavlja edino vidno naučeno izkušnjo v živčnem sistemu. Večina predavanja je bila nato posvečena natančni analizi rezultatov eksperimentov s piščanci (o področjih, v katerih so shranjene informacije, pridobljene z vtisnjevanjem, in povezavah z drugimi možganskimi področji). V razpravi je opisal nekatere spremembe, ki se dogajajo na celični ravni (pre- in postsinaptične spremembe z ozirom na število receptorjev) in molekularni ravni (glede na prisotnost in količino specifičnih proteinov v dendritskih končičih). Navkljub izredni zahtevnosti predavanja smo dvorano zapustili z nasmeškom, saj je predavatelj na zadnjem diapozitivu ironično priredil znan rek Alexandra Pope-a: The proper study of mankind is man the domestic chick. Četrto predavanje je bilo navkljub dokaj neobetavnemu naslovu (Hippocam-pal place units: Why they fire where they fire?) odlično. Bruce Naughton nam je najprej predstavil petindvajset let star poskus O'Keefa in Conwaya, ki sta želela razjasniti, zakaj se hipokampalni nevroni prožijo na določenih mestih, in na podlagi njunega predloga še vedno trajajočo razpravo, ali hipokampalni nevroni predstavljajo predmete ali odnose med predmeti in njihovimi položaji ali morda celo kakšno bolj abstraktno reprezentacijo, kot je npr. prostorska karta. Avtor je uvod povzel z besedami, da še vedno nimamo dokončnega odgovora na vprašanje izvora visoke selektivnosti hipokampalnih nevronov, saj nobena od prej omenj enih možnosti ni niti povsem pravilna niti povsem napačna. Problem pri hipokampalnih nevronih je namreč njihova izredna selektivnost in lokaliziranost proženja, pri čemer pa je množica eksperimentov pokazala, da nimajo a priori nespremenljivih odzivov na določene predmete ali okoljske značilnosti (kot npr. specifične populacije nevronov vidne skorje, ki se vedno in na enak način odzivajo na točno določene lastnosti predmetov ali jasno opredeljenih okoljskih značilnosti). Kaj torej kodirajo nevroni v hipokampusu? Da bi odgovoril na to vprašanje, je predavatelj analiziral nekatere starejše in novejše podatke, ki poudarjajo pomembnost vpliva signalov o gibanju organizma v okolju (angl. self-motion signals) na spremembe 152 L. Komidar v vzorcu proženja hipokampalnih nevronov z ozirom na položaj organizma v prostoru. Ugotovil je, da glede na moč signalov gibanja v prostoru variacije v moči in položaju proženja nevronov odražajo dejanske spremembe položaja organizma v okolju (bodisi spremembe v usmerjenosti glave ali položaja v prostoru; npr. ko je podgana premikala glavo levo ali desno, se je na podoben način premikala tudi aktivacija nevronov). Kateri hipokampalni nevroni se bodo prožili v določenem trenutku, je torej (vsaj v novi situaciji) odvisno od tega, kateri nevroni so bili aktivni nekaj trenutkov prej, ter od smeri gibanja in razdalje, ki jo je podgana v tem času prehodila. V skladu s tem modelom je aktivnost posameznih prostorskih področij hipokampusa (angl. place fields) določena predvsem na osnovi trenutnega stanja aktivnosti hipokampalne mreže, asimetrij v trenutni sinaptični matriki, trenutnih signalov o usmerjenosti glave in signalov gibanja organizma v prostoru, ki narekuje hitrost, s katero se bo spreminjala aktivnost v hipokampusu. Poleg ravnokar opisanega predavanja je name naredilo močan vtis tudi peto plenarno predavanje, v katerem je Giacomo Rizzolati govoril o zrcalnem nevronskem sistemu (angl. mirror neuron system) in njegovih implikacijah za kognitivno funkcioniranje. Sposobnost ljudi (in tudi drugih bitij), da ustrezno interpretiramo motorična dej anj a drugih, j e odlična in tako očitna, da nam predstavlj a nekaj povsem vsakdanj ega. Ostane pa seveda vprašanje, kaj nam to omogoča, kakšna je nevrofiziološka osnova za tako učinkovito sposobnost razumevanja dejanj drugih. Predavatelj se je ukvarjal prav s tem vprašanjem, pri čemer je najprej poudaril, da je ta sposobnost lahko osnovana zgolj in povsem na vidni analizi opazovanega vedenja. Ta vidik pa v zadnjem času v precejšnji meri izpodrivajo spoznanja nevrofizioloških eksperimentov na opicah in raziskav na ljudeh, ki uporabljajo tehnike slikanja možganov. Vedno več je namreč dokazov, da ima ta sposobnost osnovo v transformaciji vidnih informacij opazovanega vedenja v notranjo motorično reprezentacijo istega vedenja. Dokazi za zrcalni nevronski sistem so precej prepričljivi, saj je v vseh raziskavah na opicah, kjer se proženje nevronov meri neposredno z elektrodami, pojav izredno robusten in izrazit. Avtor je vseeno kritično razpravljal o vseh razpoložljivih dokazih za takšen sistem, podal pregled njegovih lastnosti ter razmišljal o implikacijah za ostale kognitivne funkcije, kot so posnemanje vedenja, razumevanje namer drugih in jezik. Pri tem je poudaril, da je človeški zrcalni nevronski sistem najverjetneje zelo bogat in kompleksen, saj bi nam naj naše mentalne reprezentacije omogočale 'zrcaljenje' ne samo gibov in osnovnih motoričnih dejanj, temveč tudi precej kompleksnih dogodkov. Zadnje plenarno predavanje (Kako evolucija zgradi kompleksne možgane?) je bilo posvečeno vprašanjem, kako nastanejo možgani z več funkcionalnimi deli, kakšen je pri tem evolucijski (genetski) prispevek in kakšno vlogo igra aktivnost iz perifernih receptorjev pri razvoju kortikalne organizacije. Krubitzer Leah je za doseganje odgovorov na ta vprašanja uporabila primerjalni pristop k raziskovanju produktov evolucijskega procesa, ki hkrati omogoča oblikovanje zaključkov o procesu samem. Primerjalne raziskave, ki jih je izvedla v svojem laboratoriju, so ji omogočile določitev podobnosti v kortikalni organizaciji različnih vrst in na ta način določiti značilnosti in Poročilo s konference 153 področja neokorteksa, ki ustrezajo določeni funkcionalni strukturi (npr. kje se nahaja in kako je strukturirana vidna skorja pri različnih vrstah). V nadaljevanju se je predavateljica osredotočila bolj na možnosti, ki nam jih ponujajo tovrstne raziskave, in manj na konkretne rezultate takšnih študij. Teorije, ki izhajajo iz izsledkov primerjalnih raziskav, lahko preverjamo tako, da vplivamo na razvijajoč se živčni sistem in tako posnemamo naravne spremembe, ki so se zgodile tekom evolucije. Ta postopek se seveda uporablja z namenom oblikovanja neokorteksa, ki je organiziran skladno s tipom organizacije, ki se pojavlja v naravnih pogojih. Ta pristop omogoča ločevanje med genetskimi in od izkušenj odvisnimi prispevki k razvoju neokortikalne organizacij e, pri čemer lahko tudi ugotovimo, kako ta dva mehanizma sodelujeta pri tvorbi možganov, ki jih lahko najdemo v sodobnih sesalcih. V nadaljevanju bom predstavil raziskave iz dveh simpozijev, ki sta se mi zdela najzanimivej ša. V prvem, ki ga bom komentiral, so avtorji predstavitev govorili o vidni kortikalni plastičnosti (Visual cortical plasticity: from environment to molecules). Za raziskovanje plastičnosti vidne skorje večina raziskovalcev preučuje očesno dominantnost oziroma premik očesne dominantnosti (angl. ocular dominance shift), saj je ta pojav dovolj enostaven in robusten ter se odvija v relativno kratkem časovnem obdobju. Najbolj zanimiv prispevek je imel naslov Strukturni korelati hitre funkcionalne plastičnosti v vidnem korteksu. Končiči na dendritih (angl. spines) v možganski skorji so venomer migotajoče postsinaptične strukture, na katerih se oblikuje večina ekscitatornih (glutamatergičnih) sinaps v skorji. Spremembe v teh končičih najverjetneje odražajo sinaptično plastičnost nevronov možganske skorje. Raziskovalna skupina, katere član je tudi avtor prispevka, je preučevala strukturo in dinamiko 'vedenja' končičev med kritičnim obdobjem1 za plastičnost očesne dominantnosti v primarni vidni skorji (V1) mladih miši in dihurjev. Meritve so potekale 'in vivo', in sicer s pomočjo dvofotonske mikroskopije, ki ima v navezi s tehnikami označevanja posameznih skupin nevronov osupljivo ločljivost - na predstavitvenih filmčkih smo lahko nazorno videli migotanje dendritskih končičev. Raziskave so bile načrtovane tako, da so omogočale odgovoriti na dve vprašanji: (i) kako se sprememba v funkciji skupine nevronskih povezav kaže na ravni njihove strukture in (ii) kako hitro se te spremembe pojavijo, oziroma kako hitro lahko induciramo spremembo v očesni dominantnosti. V splošnem so v teh raziskavah ugotovili, da se strukturne spremembe (plastičnost) odvijajo na ravni končičev (torej na zelo 'mikro' ravni; pri odraslih možganih ne more priti do sprememb v večjem obsegu), da so končiči v nenehnem gibanju, izginjanju in nastajanju. Končiči dinamično spreminjajo velikost in obliko, pri čemer sledijo dokaj enostavnemu pravilu - povečana aktivnost vodi do debelejših končičev, katerim se mobilnost (migotanje) zmanjša, medtem ko zmanjšana aktivnost vodi do tanjših končičev, ki se jim mobilnost poveča (kar ob nezmanjšani deprivaciji vodi do 1 Obdobje, v katerem lahko v večji meri prihaja do relativno korenitih sprememb v nevronskih povezavah, ki jih opredeljujemo kot plastičnost. Gre predvsem za obdobje zgodnjega razvoja možganov oziroma možganske skorje. 154 L. Komidar izgube končiča). Glede časovnih značilnosti sprememb v končičih pa so v predavateljevi skupini prišli do precej presenetljivih rezultatov. Namreč, strukturne in posledično funkcionalne spremembe se začnejo odvijati veliko hitreje, kot so sprva predvidevali. Premik očesne dominantnosti (npr. z zakritjem dominantnega očesa) se tako lahko zgodi v nekaj urah. Skratka, te raziskave so pokazale, da obstaja visoka povezanost med dinamiko končičev ter velikostjo sprememb in odzivnimi časi funkcionalne plastičnosti očesne dominantnosti v V1. Tema zadnjega prispevka v simpoziju o plastičnosti se je nanašala na plastičnost vidne skorje v odraslih mišjih možganih. Plastičnost nevronskih povezav v skorji je visoka v razvijajočih se možganih in nato upada s starostjo, pri čemer so celični in molekularni faktorji, ki omejujejo plastičnost v odraslosti, do nedavnega bili še precej neznani in neraziskani. Raziskovalna skupina predavateljice Nicolette Berardi je zato preverila hipotezo, da ravnovesje med ekscitacijo in inhibicijo (E/I ravnovesje) v intrakortikalnem omrežju nadzira trajanje in dinamiko kritičnega obdobja plastičnosti v razvoju vidne skorje, in da torej E/I ravnovesje aktivno zavira plastičnost vidne skorje pri odraslih možganih. S spreminjanjem E/I ravnovesja (bodisi z zmanjšanjem intrakortikalne inhibicije bodisi s povečanjem ekscitatornega draženja) so ugotovili, da več ekscitacije izboljša oziroma ponovno omogoči plastičnost očesne dominantnosti v odrasli vidni skorji. Zame najbolj zanimiv simpozij je imel naslov Frontal eye fields2 (FEFs) in visual analysis and eye movements. Prvo predavanje je predstavljalo nekakšen uvod v simpozij, saj nam je Alan Cowey najprej podal pregled starejših raziskav o delovanju FEF in nato še hiter pregled sodobnih študij (Discovery and rediscovery of frontal eye fields). Na osnovi raziskav, ki so bile opravljene do sedemdesetih let prejšnjega stoletja, je vladalo prepričanje, da so FEF zgolj motorična skorja za očesne premike, čeprav so se že takrat pojavljali rezultati, ki so to prepričanje postavljali pod vprašaj. V naslednjih dvajsetih letih je preučevanje FEF nekoliko upadlo, v devetdesetih pa se je začela pojavljati množica raziskav, katerih izsledki konsistentno konvergirajo k zaključku, da je funkcija FEF veliko več kot le premikanje oči (te raziskave vključujejo meritve na ravni posameznih nevronov, merjenje s fMRI in transkranialno magnetno stimulacijo - TMS). Po tem uvodnem predavanju so se zvrstile tri predstavitve, katerih zaključki so si bili precej podobni. Jedro problema funkcije FEF predstavlja vprašanje, ali FEF sodelujejo samo pri nadzoru očesnih premikov ali se v njih vrši tudi obdelava vidnih dražljajev. Ob predpostavki, da FEF opravljajo obe nalogi, je pomembno tudi, ali sta ti dve funkciji med seboj neodvisni. V kontekstu pozornostnih mehanizmov lahko problem parafraziramo na naslednji način: ali sta premik pozornosti na predmet zanimanja in očesni premik na isti predmet med seboj neodvisna procesa? S pomočjo nalog vidnega iskanja (opazovalec mora v množici distraktorjev poiskati tarčo, ki se od distraktorjev loči po neki lastnosti; npr. iskanje rdeče pike med zelenimi pikami) in z merjenjem aktivnosti posameznih nevronov v možganih opic in TMS raziskavami na 2 FEFs se nahajajo med šestim in osmim Brodmannovim področjem oziroma na stičišču precentralnega in superiornega frontalnega sulkusa. Poročilo s konference 155 ljudeh so raziskovalci ugotovili, da FEF dejansko sodelujejo pri vidni obdelavi dražljajev (FEF zanima, kje je dražljaj, ki je za organizem v nekem trenutku najbolj pomemben), pri čemer se ta obdelava izvrši precej zgodaj (40 - 80 ms po predvajanju dražljaja) in neodvisno od očesnih premikov (nevroni v FEF so se prožili tudi ob iskanju tarče v prikazu, ki zaradi majhnosti od opazovalca ni zahteval očesnih premikov). Na osnovi nedavnih raziskav lahko potrdimo, da naloga FEF ni samo priprava in izvršitev očesnih premikov, ampak tudi iskanje za opazovalca pomembnih dražljajev. Obdelava vidnega polja v FEF, ki torej služi iskanju določenega predmeta, se lahko izrazi zgolj kot preusmeritev pozornosti na iskani dražljaj, oziroma z drugimi besedami, ni nujno, da premiku pozornosti sledi očesni premik, saj sta procesa med seboj neodvisna. S FEF bom zaključil strokovni del tega poročila. Ce povzamem svoj splošni vtis o konferenci, lahko rečem, da sem prisostvoval še eni konferenci, ki je bila odlična tako iz strokovnega kot iz organizacijskega vidika. Morda bi se lahko bolj potrudili pri organizaciji družabnih dogodkov, kateri predvsem za nove obiskovalce niso omogočali lahkotnega spoznavanja ostalih udeležencev, ki so se med seboj že od prej zelo dobro poznali. Rad bi dodal še eno misel, ki me je spremljala skozi celotno konferenco. Namreč, bil sem izredno presenečen nad razmerjem med raziskavami na živalih in ljudeh. Po grobi oceni bi lahko rekel, da je na področjih nevrofiziologije in nevropsihologije več kot tri četrtine raziskav narejenih na živalih (na miših, podganah, piščancih, mačkah in opicah), zaradi česar se mi je včasih zazdelo, da prisostvujem bolj konferenci o preučevanju možganov živali kot možganov ljudi. Seveda so te raziskave zelo pomembne tudi za razumevanje delovanja človeških možganov (saj obstaja veliko ekvivalentnih možganskih področij in funkcij), vendar se mi je na trenutke zazdelo, da so raziskovalci premalo kritični pri prenašanju spoznanj, ki so jih pridobili na npr. miših, v kontekst delovanj a človeških možganov. Kot psihologu in torej zunanj emu opazovalcu se mi je situacija včasih zazdela prav bizarna, sploh po simpozijih, v katerih ni bilo niti ene raziskave na ljudeh. Ta občutek je bil najmočnejši, ko sem po eni predstavitvi prisostvoval razpravi med dvema raziskovalcema, ki je že mejila na prepir - ne boste verjeli, ampak prerekala sta se o tem, ali bi lahko neke rezultate, pridobljene na miših, prenesli na mačke (oz. eden od razpravljalcev je trdil, da bi na mačkah zagotovo dobil drugačne rezultate). Naslednji samostojni EBBS (torej ne v okviru srečanja FENS-a) bo čez dve leti v Trstu. Morda je bližnja lokacija dobra priložnost tudi za kakšnega (nevro)psihologa, da predstavi rezultate svoje raziskave na konferenci, ki ima izredno dolgo tradicijo in je strokovno na zelo visoki ravni. Morda bi ta apel bil bolj primeren za nevrologe ali nasploh strokovnjake s področja medicine, ki imajo večje možnosti za dostop do opreme (MRI, EEG ipd.), ki je nujno potrebna za tovrstne raziskave. Slovenski psihologi imamo zaenkrat na tem področju na žalost zelo omejene možnosti. Prispelo/Received: 4.11.2005 156 Psihološka obzorja / Horizons of Psychology, 14, 3, 157-159 (2005) © Društvo psihologov Slovenije 2005, ISSN 1318-187 Polemika O urednikovem opravičilu ga. Weissovi za zaplet s člankom o POŠ-u1 (1. del pojasnila predsednika sekcije šolskih psihologov)2 Dušan Jamšek* Raziskovalni inštitut 2020, Ljubljana On Editor's apology to Ms. Weiss regarding the inconviniences with the paper on TSR Dušan Jamšek Research Institute 2020, Ljubljana, Slovenia V razpravi k 2. točki dnevnega reda 4. sestanka IO-ja sem razložil predsednik sekcije šolskih psihologov s treh zornih kotov že več kot dve leti star sekcijski predlog društvenim organom o razmerju 80:20 med teoretičnimi in aplikativnimi prispevki v reviji Psihološka obzorja. Gre za sklep, ki je bil društvenim organom prvič predstavljen na sestanku uredniškega odbora revije 26. 02. 2002, 31. 03. 2002 pa sem ga posredoval glavnemu uredniku še v pisni obliki kot pripombo na neverodostojen zapisnik tega sestanka. Sklep izhaja na eni strani iz najbolj splošne delitve (psihološkega) znanja na bazično (teoretično) in uporabno (aplikativno), na drugi strani pa iz tedanje ocene v šolski sekciji (ki so jo v dveletnih razpravah na IO-ju potrdile preko svojih predstavnikov še nekatere druge sekcije), da je za psihologe, ki delujemo na aplikativnih psiholoških področjih (v razpravi sem uporabljal zanje termin 'psihologi-praktiki'), sedanji nabor 1 prim. dr. Valentin Bucik, Pojasnilo in opravičilo, Psihološka obzorja, letnik 14, številka 2, str. 8-10 2 Pričujoče pojasnilo je kar priloga k 1. točki zapisnika 5. sestanka izvršnega odbora Društva psihologov Slovenije z dne 31. 05. 2004, v okviru katere je IO potrjeval zapisnik 4. sestanka 02. 03. 2004. Na 4. sestanku sem predsednik šolske sekcije pojasnil svoje dvoletna prizadevanja v organih Društva za realizacijo sklepa številka 7, ki sta ga sprejela šolski IO in zbor sekcije na skupnem sestanku 12. 03. 2002. O pričujočem pojasnilu je v zapisniku 5. sestanka zapisano: »Zapisnik je bil s to prilogo soglasno sprejet.« Ker gre za prvi del mojega pojasnila, naj napovem, da bo drugi del osvetlil tisto navedbo dr. Bucika v opravičilu, po kateri prispevek kolegice Weissove »(...) sploh ni bil namenjen ne objavi v reviji ne ocenam recenzentov«. Za dokumentirano osvetlitev te navedbe namreč potrebujem dokumente, za pridobitev katerih že teče ta trenutek v Društvu postopek, preko katerega bodo, tako upam, prišli nazaj v moje roke. * Naslov / address: Dušan Jamšek, Kladezna ul. 9, 1000 Ljubljana, e-mail: dusan_jamsek@yahoo.com 158 D. Jamsek prispevkov v reviji za tekoče praktično delo več ali manj nekoristen in to ne glede na kategorijo znanstvenosti oz. strokovnosti, v katero je bil razvrščen. Razmerje 80:20 izhaja iz pogoja Ministrstva za šolstvo, znanost in šport, ki reviji še omogoča njegovo dotacijo iz naslova znanstvenih publikacij, izhodiščni kriterij razvrščanja prispevka v kategorijo teoretičnega oz. aplikativnega znanja pa naj bi bilo kar področje psihološke dejavnosti, na katero se nanaša vsebina prispevka (za ponazoritev sem včasih navajal primer, da sodi npr. prispevek o ugotavlj anju strukture delovnih nalog šolskih psihologov med teoretične prispevke, prispevek o npr. projektnem spreminjanju te strukture na določeni šoli pa med aplikativne). Navedeno razmerje med teoretičnimi in aplikativnimi prispevki sem v razpravi na 4. sestanku najprej utemeljil z vidika uporabe Psiholoških obzorij za študijske namene (zaradi česar revija ravno tako dobiva del dotacije s strani MSZS). Opozoril sem, da bi morala slediti spremenjena uredniška zasnova revije ne samo potrebam sedanjega univerzitetnega dodiplomskega in podiplomskega izobraževanja, ampak sedaj že tudi uradno sprejeti viziji bolonjskega koncepta izobraževanja, v okviru katerega imamo svoje jasno mesto tudi 'psihologi-praktiki'. Konkretno naj bi to pomenilo, da naj bi uporabljali bodoči ('bolonjski') študenti revijo kot študijsko gradivo na enak način, kot jo uporabljajo njihovi sedanji 'nebolonjski' predhodniki, kar bo seveda možno samo pod pogojem, da nam bo 'psihologom - aplikativcem' v njej zagotovljen ustrezen prostor za publiciranje našega psihološkega znanja, ki ustreza - gledano z vidika visokošolskega izobraževalnega sistema - bolj visoko strokovnemu (praktičnemu), manj pa univerzitetnemu (znanstveno-teoretičnemu). Prav zaradi drugačne narave nastajanja aplikativnega znanja smo v sekciji že leta 2002 oblikovali izhodišča za recenziranje teh prispevkov in jih posredovali skupaj z navedenim predlogom v razmislek društvenim organom, na zadnjih dveh sestankih društvenih organov o reviji pa sem šolski sekcijski predsednik iz tega razloga predlagal tudi drugačno strukturno sestavo uredniškega odbora (sveta). Drugi argument, s katerim sem utemeljil navedeni sekcijski predlog, je dejstvo, da s(m)o začeli prav psihologi-aplikativci kot večinski naročniški, to je nedotacijski oz. nedružbeni lastnik revije (in hkrati njen glavni ciljni uporabnik) opuščati v okoliščini simbioze članarina-naročnina članstvo v društvu prav zaradi za naše tekoče praktično delo pretežno nekoristne vsebine revije. Ali rečene drugače: po legalnem mnenju šolske sekcije, ki so se ji pridružila kasneje še bolj ali manj javno artikulirana mnenja nekaterih drugih sekcij, je prav večja uporabnost (berljivost) revije za 'praktike' na eni strani in razmejitev članarine od naročnine v razmerju 3/7:4/7 na drugi strani eden od načinov realizacije (v obstoječi obliki za nikogar zavezujočega) devetega sklepa k razpravi o reviji na 4. sestanku IO-ja, ki pravi: "Dela naj se na povečanju članov DPS /.../". Brez opredelitve konkretnih načinov izvršitve bo namreč ostal ta sklep le pobožna želja na enak način, kot se je to zgodilo z isto pobudo v društvu lansko leto potem, ko je bila ta konkretizirana v smernici, naj bi pridobivali nove člane po desetiškem ključu predsedniki sekcij (čemur sem se 'šolski' predsednik odpovedal, ker bi moral pridobivati novo-stare člane namesto z akvizitiranjem v društvenih organih jasno opredeljenih, to Polemika 159 je transparentnih ugodnosti kar z akvizitiranjem lastnih, iz položaja v društvu in družbi bolj ali manj praznih ugodnosti). Kot zadnji, pa zato nikakor ne najmanj pomemben razlog za upoštevanje sekcijskega predloga "80:20" sem navedel enako možnost kariernega razvoja med psihologi, ki delujejo pretežno na znanstveno-izobraževalnem psihološkem področju (zanje sem uporabljal termin 'psihologi-teoretiki') in 'psihologi-aplikativci'. Nesporno dejstvo je namreč, da je s tega vidika interes 'psihologov-teoretikov' za publiciranje v najbolj elitni slovenski psihološki reviji enak kot pri praktikih, le ta smo 'praktiki' večinski naročniški lastnik revije, 'teoretiki' pa večinski potrošnik za karierno osebnostno napredovanje potrebnih revijinih referenc v razmerah, v katerih je poskrbel glavni urednik ne samo za njihovo publiciranje ter državno znanstveno in izobraževalno subvencioniranje, ampak v prvi vrsti za sedanji mednarodni status revije (za kar je bil s strani 'šolnikov' že pred tremi leti izrecno javno pohvaljen na blejskem občnem zboru društva!). Kot primer, da se tako nepravično stanje neustrezno brani z bojaznijo po padcu ugleda revije, če bi prišlo do uresničevanja predloga "80:20", sem opozoril v razpravi na primer edinega prispevka, katerega objava je bila do sedaj zavrnjena. Gre za prispevek kolegice Weissove, katerega vsebina naj bi bila izhodišče za razčiščevanje strokovne dileme v društvu, ali se lahko dr. Toličiča POS uporablja ne samo za ugotavljanje novinčeve šolske pripravljenosti, ampak tudi za normalizacijo oddelkov. Situacija, v kateri smo pridobili 'šolniki' na eni strani pozitivno mnenje strokovnega sveta, na drugi strani pa je razvojna katedra temu mnenju oporekala, je bila kot nalašč ne samo za fizično, ampak tudi intelektualno širitev psiholoških obzorij, pa je bila dilema rešena v nikogaršnjo korist tako, da je glavni urednik brez uredniškega odbora po posvetovanju z vodjem 'razvojnikov'3 odločil, da prispevek ni primeren za rubrike, za katere pa je resnici na ljubo potrebno pojasniti, da sploh ni kandidiral! ' Solski' predsednik sem namreč posredoval prispevek za tisto rubriko revije, ki naj bi imela po februarski razpravi uredniškega odbora leta 2002 delovno ime "praksa za prakso" potem, ko sem odboru posredoval v razmislek tudi izhodiščne recenzijske kriterije, ki smo jih opredelili na sekcijskem IO-ju ravno zato, da ne bi bili v elitni psihološki reviji objavljani prispevki, ki sodijo npr. v revijo Ciciban. Prispelo: 29.11.2005 3 Glede na teleološki, ne pa pravdni cilj razčiščevanja opravičila naj opozorim, da je vodja v narekovaju zapisane besede 'razvojnik' od 5. sestanka izvršnega odbora DPS-ja 31. 05. 2004 dalje kar predsednik uredniškega sveta revije in to zaradi sklepa k 2. točki, ki se glasi: »IO je sprejel sklep, da priporoča uredniškemu svetu, da izdela kriterije za izbiranje prispevkov iz aplikativnega področja. Uredniškemu odboru pa priporoča, da zagotovi do 20 % objavljenih člankov iz aplikativnega področja.« 160 V naslednji številki (letnik 14, številka 4, 2005) Psiholoških obzorij bodo predvidoma objavljeni naslednji prispevki [Forthcoming articles] : Shlomit Levy Israelis in the Gulf war in the light of a longitudinal analysis of varieties of morale Milena Vuk in Anja Podlesek The effect of inner and outer context figures on the Ebbinghaus illusion *Bor Sojar Voglar Zaznavanje hitrosti kroženja zvoka Vesna Lešnik in Ljubica Marjanovič Umek Kakovost predšolske vzgoje v vrtcu in socialna kompetentnost otrok Robert Cvetek Trends and problems in marital and family therapy research: Possible use of action research *Anja Simonič Odnos navezanosti in nadaljevanje vezi v procesu žalovanja *Sonja Čotar Čustvena klima v družini: primerjava med slovenskimi in španskimi študenti Ana Krevh Vloga anksioznosti pri spolnih motnjah Marko Polič Ocena knjige "Psihološke in kognitivne študije osebnosti" (Janek Musek) Drago Žagar Predstavitev doktorske disertacije dr. Roberta Cvetka Valentin Bucik Predstavitev doktorske disertacije dr. Aleša Friedla Darja Kobal Grum Predstavitev magistrskega dela mag. Mateje Zupančič Članek, označen z zvezdico (*), je uvrščen v proces, ki smo ga imenovali "ocena kolegov" (angl. "peer review"). Prispevek, ki je predviden za tovrstno ocenjevanje, je seveda že prestal dvojno slepo recenzijo in jezikovno lekturo. Odločitev o objavi prispevka v uredniškem odboru je že sprejeta, vendar je končna avtorjeva verzija prispevka v obliki rokopisa še pred objavo na voljo vsakemu strokovnjaku, ki bi želel prispevek prebrati, še predno bo objavljen, in nanj podati pisne strokovne pripombe, mnenja, priporočila, kritiko itd. na eni do dveh tipkanih straneh. Vse pravočasno prispele kritike, mnenja, pripombe so nato posredovane avtorju, ki ne glede na kritike ocenjevalcev nima več pravice popravljati svojega prvotnega besedila, pač pa v kratkem končnem besedilu poda integralni odgovor vsem ocenjevalcem. V reviji so nato objavljeni (i) avtorjev osnovni prispevek, (ii) besedila vseh sodelujočih ocenjevalcev in (iii) avtorjev odgovor na mnenja ocenjevalcev. Ta način predstavlja poskus konstruktivnega in podrobnega razjasnjevanja problematike, o kateri govori osnovni prispevek. Tovrstna graditev kakovosti posredovanega prispevka je lahko koristna tako za avtorja osnovnega prispevka kot tudi za kolege - ocenjevalce (še posebej, kadar gre za konstruktivno kresanje mnenj različno mislečih strokovnjakov), zlasti pa za bralca revije, ki ima pred seboj vsa besedila, iz katerih si lahko ustvari lastno kritično mnenje o obravnavani problematiki in o načinu obravnave, kot ga je izbral avtor. Vse, kar mora zainteresirani bralec storiti, je, da željo po rokopisu prispevka in svoj naslov sporoči (pošta, telefon, telefaks, elektronska pošta) glavni in odgovorni urednici Psiholoških obzorij in takoj mu bomo poslali en izvod avtorjevega rokopisa. Torej, če bi radi sodelovali pri "oceni kolegov" predlaganega prispevka v Psiholoških obzorjih, vas prosimo, da nam to čimprej sporočite! Filozofska fakulteta Univerze v Ljubljani Oddelek za psihologijo Gregor SOČAN POSTOPKI KLASIČNE TESTNE TEORIJE 162 163 Psihologija športa Ljubljana 2001 164 165 O/ PUBLIKACIJE ZNANSTVENEGA INSTITUTA FILOZOFSKE FAKULTETE Založniška dejavnost Znanstvenega inštituta Filozofske fakultete Znanstveni inštitut Filozofske fakultete je leta 1980 v okviru financiranja raziskovalnega dela iz lastnega vira razvil založniško dejavnost. Začetki so bili skromni, že leta 1985 pa je oblikoval lastno zbirko Razprave FF, v kateri je do danes izšlo 94 publikacij. Besedila so rezultat znanstveno raziskovalnega dela raziskovalcev, ki ga avtorji uresničujejo v okviru raziskovalnega programa Filozofske fakultete in tako pokrivajo vse stroke na področju humanistike in družboslovja. Poleg tega je inštitut soizdajatelj in sofinancer številnih publikacij, ki so izšle pri drugih založbah ali v okviru založniške dejavnosti kulturnih in znanstvenih inštitucij. Ni zanemarljiv niti delež sofinanciranja prevodov publikacij in posameznih prispevkov naših sodelavcev, ki so izšli v tujini. CENIK nekaterih del ZIFF s področja psihologije in sorodnih ved Razprave Filozofske fakultete Leto Avtor Naslov dela Cena 1985 Musek, J. Narava in determinante zavestnega odločanja 966,00 1990 Musek, J. Simboli, kultura, ljudje 1.932,00 1997 Kovačev, A.N. Govorica telesa 1.200,00 1997 Tušak, M. Risanje v psihodiagnostiki I (3. dop. izdaja) 840,00 1998 Kline,M., Polič,M. in Zabukovec,V. Javnost in nesreče 1.200,00 1999 Šumijev zbornik Raziskovanje kulturne ustvarjalnosti na Slovenskem 3.700,00 1999 Pečjak, S. Osnove psihologije branja 1.200,00 2000 Marjanovič Umek,L. in Zupančič,M. Psihologija otroške igre 2.000,00 2001 Tušak, M. in Tušak, M. Psihologija športa (2. dopolnjena izdaja) 3.000,00 2001 Strmčnik, F. Didaktika: osrednje teoretične teme 4.000,00 2002 Marjanovič Umek, L. in dr. Kakovost v vrtcih 2.800,00 2002 Tušak, M. in Tušak, M. Psihologija konja 3.500,00 2002 Polič, M., in dr. Spoznavni zemljevid Slovenije 3.800,00 V ceni je upoštevan 8,5 % DDV. Prodajalna knjig: Knjigarna »Rimljanka« na Rimski cesti 11v Ljubljani. 166 PANIKA ŽE DESET LET ŠIRIMO PSIHOLOŠKA OBZORJA Osrednja tema Manipulacija Ali kdaj manipulirate? Barbara Malečkar Seks na terapevtskem kavču: medsebojna privlačnost ali zloraba položaja Ana Jerman Pogovor s Tinkaro Pavšič Mravlje: Manipulacija v trgovini z ljudmi Matevž Tratnjek Argumentiranje dr. Sreča Dragoša in dr. Ivana Štuheca: Manipulacija in katoliška cerkev Tina Vuri in Gregor Konstantinovic Hipnoza in medijske sugestije Ana Jereb 0 ženskem telesu in oblasti Katja Košir Je res kriva mama? Ana Ožura Psihonevroimunologija pri bolezni HIV Nagovor profesorice Cirile Peklaj in študenta Uroša Roškerja. Intervju s Petrom Praperjem, Aleksandrom Bratino, MašoVidmar in Matejo Svet. Da ne boste zmanipulirani, prberite Paniko! PANIKA je časopis študentov psihologije. Izdaja ga skupina za časopis v okviru Društva študentov psihologije Slovenije. druŠtoentov psihologij slovenljt? Navodilo avtorjem prispevkov Opredel itev prispevkov V Psiholoških obzorjih so objavljeni prispevki, napisani v slovenskem ali angleškem jeziku (izjemoma, po presoji uredniškega sveta, še v kakšnem drugem svetovnem jeziku). Znanstveni in strokovni prispevki morajo biti napisani v jedrnatem, razumljivem, jasnem in logičnem ter jezikovno ustreznem slogu. Avtorji morajo sami poskrbeti za jezikovno lekturo prispevkov. Empirični članek avtor napiše kot poročilo o raziskavi. Vsebovati mora vse značilne dele, ki odslikujejo korake raziskovalnega procesa: uvod, metoda (s podpoglavji udeleženci, pripomočki oziroma inštrumenti ter postopek), rezultati, razprava in literatura. Za teoretski članek se predvideva, da v podrobnostih preuči in kritično analizira določene modele ali teorije. Empirični podatki so predstavljeni le, če so v neposredni zvezi s teorijo. Pregledni članek kritično ovrednoti na različnih mestih že objavljene prispevke. Značilni deli preglednega članka so opredelitev in razlaga problema, povzetek predhodnih raziskav, pojasnitev medsebojnih odnosov, protislovij, pomanjkljivosti in na koncu predlogi za nadaljnje raziskovanje. Metaanalitična študija predstavlja posebno vrsto članka, v katerem avtor s pomočjo posebne raziskovalne metodologije, značilne za metaanalitične študije, pregledno predstavi rezultate številnih empiričnih študij na temo nekega raziskovalnega problema. Struktura prispevka Prispevek mora vsebovati v slovenskem in angleškem jeziku napisane: naslov prispevka, ključne besede (okrog pet), ki najbolje opredeljujejo vsebino, in povzetek prispevka, ki vsebuje bistvene informacije o prispevku. Povzetek naj obsega do 300 besed (če je članek po dogovoru napisan v katerem od drugih svetovnih jezikov, morajo biti navedene informacije v tem, a tudi nujno v slovenskem in angleškem jeziku). V besedilu naj (zaradi postopka slepe recenzije) ne bo navedeno ime in/ali naslov avtorjev. Empirični prispevek naj v nadaljevanju sledi naslednjim splošnim pravilom: 1. Uvodni del ne sme biti preobširen, vendar mora ponuditi glavno teoretično ali konceptualno ogrodje, v katerega je vpet raziskovalni problem. 2. Raziskovalni problem mora biti jasno formuliran, predstavljati mora logično nadaljevanje uvodnega dela prispevka. Problem mora biti relevanten in v zastavljeni obliki še neraziskan. Poudarjeno mora biti, katere nove dileme odpira. 3. Raziskovalne hipoteze in spremenljivke morajo biti operacionalizirane in postopki opazovanja in merjenja morajo biti natančno opisani. Kratek, a natančen opis izbire udeležencev, uporabljenih psiholoških inštrumentov in raziskovalnega načrta je nujen. 4. Uporabo statističnih postopkov in rezultate morajo avtorji opisati s potrebno natančnostjo. Tabele morajo vsebovati le nujne informacije. Ce je potrebno, so podrobnosti lahko predstavljene v dodatku (prilogi). 5. Razprava in interpretacija izsledkov se mora nanašati na znane koncepte in teorije, ne glede na to, ali jih dobljeni rezultati podpirajo ali ne. 6. Trditev ali dognanja drugih avtorjev so v besedilu potrjena z referenco. Na koncu prispevka je priložen seznam literature, na katero se besedilo sklicuje. Za druge vrste sestavkov se ta struktura ustrezno in smiselno prilagodi. Tehnična navodila za predložitev prispevkov APA standardi Oblika poslanih rokopisov naj sledi standardom in priporočilom, opisanim v priročniku za pisanje raziskovalnih poročil, ki ga je izdalo ameriško združenje psihologov (APA Publication Manual, 5. izd., 2001) in je že pred leti postal mednarodni standard, ki ga upoštevamo tudi slovenski psihologi. Vsak rokopis, ki bo prispel v objavo v revijo Psihološka obzorja, ki bo ustrezal tehničnim (oblikovnim) zahtevam in ki bo sodil v okvir »namena in ciljev revije«, bo po postopku dvojne slepe recenzije poslan v oceno dvema kompetentnima ocenjevalcema. Oblikovni izgled Avtorji besedilo prispevka pripravijo v enem od standardnih računalniških programov za obdelavo besedil (npr. Word za Windows) in ga shranijo v datoteki standardnega formata, npr. .doc ali .rtf. Besedilo naj bo napisano z dvovrstičnim ali 1,5 vrstičnim razmikom, z razločnimi naslovi, podnaslovi in oštevilčenimi stranmi. Napisano naj bo z eno osnovnih oblik pisave (Times Roman, Arial, Helvetica, Courier) velikosti 12, besedilo naj bo levo poravnano. Začetki odstavkov naj ne bodo umaknjeni navznoter, pač pa naj bo pred vsakim novim odstavkom, naslovom, podnaslovom, predvidenim mestom za sliko ali tabelo vrinjena prazna vrstica. Prispevek naj praviloma ne bo daljši kot ena avtorska pola (16 strani po 32 vrstic z okoli 60 znaki v vrstici oziroma okoli 30.000 znakov, vključno z razmiki). Tabele, slike, opombe Za vsako tabelo in sliko mora biti v prispevku nakazano približno mesto, kjer je predvidena (npr. 'vstaviti sliko 1' ali 'vstaviti tabelo 1'). Tabel in slik avtorji ne vstavljajo v besedilo, pač pa jih pripravijo v ločeni datoteki, v katero najprej vstavijo vse tabele in nato vse slike, vsak prikaz na svoji strani (če je potrebno, lahko slike shranijo tudi v več ločenih datotekah). Zaporedna številka slike in besedilo, ki sliko opisuje, naj bosta v besedilo vstavljena takoj za mestom, kjer je označen predvideni položaj slike (npr. najprej v svoji vrstici podamo informacijo: 'vstaviti sliko 1', pod njo pa ime in za piko naslov slike: 'Slika 1. Odnos med X in Y ...'). Slike morajo biti izdelane brezhibno in z dovolj velikimi črkami, številkami in ostalimi znaki (nabora Arial ali podobno), ki omogočajo pomanjševanje brez večje izgube preglednosti. Avtorji ne uporabljajo barv, pač pa, če je potrebno, različne dobro razločljive rastre, sivine in/ali vzorce. Avtorji naj grafe v datoteko s tabelaričnimi in grafičnimi prikazi prilepijo v taki obliki, da jih bo možno urejati v izvornem programu (npr. Excelov grafikon naj prilepijo kot predmet in ne kot sliko ali metadatoteko). Fotografije z visoko ločljivostjo (> 300 dpi) naj bodo shranjene v kar najboljši kvaliteti grafičnega formata JPG, TIF ali PNG. Sheme in diagrami naj bodo iz izvornega programa prilepljene v datoteko kot predmet, izjemoma kot slike navedenih grafičnih formatov z visoko ločljivostjo. V primeru posebnih zahtev (npr. pri uporabi manj običajnih programov za generiranje slik ali če se določene slike ne da izdelati računalniško), naj se avtorji o načinu priprave slik predhodno posvetujejo s tehničnim urednikom revije (e-naslov: luka.komidar@ff.uni-lj.si). Tabele naj bodo natipkane z enojnim razmikom. Nad tabelo naj bo (v datoteki s tabelaričnimi in slikovnimi prikazi) izpisana zaporedna številka tabele in za piko njen naslov (npr. Tabela 1. Korelacijskamatrika ...). Tabela mora biti informativna brez posebnega sklicevanja na besedilo, torej opremljena s potrebnimi informacijami in po potrebi z opombami. Avtorji se v besedilu sklicujejo na sliko ali tabelo (npr. z 'glej sliko 1', 'v tabeli 2' ...), saj prikaz ne bo nujno na mestu, ki ga je predvidel avtor. V poglavju o rezultatih naj bo isti podatek vedno prikazan le enkrat. Avtorji naj se odločijo, kateri način (slika, tabela ali prikaz v vezanem besedilu) je najbolj primeren in informativen. Opombe pod črto naj bodo vključene v prispevek le izjemoma. Citiranje, literatura Uporabljene reference drugih avtorjev naj bodo v besedilu citirane po harvardskem sistemu: npr. Rostohar (1952) ali (Rostohar, 1952). Kadar je citiranih več avtorjev, so navedeni v abecednem redu, npr. (Bujas, 1953; Rostohar, 1952; Trstenjak, 1953). Citati posameznih referenc so ločeni s podpičjem, npr. (Petrič, 1970; Petrovič, 1969). Kadar so citirano delo napisali trije avtorji ali več (do vključno šest), so pri prvem citiranju vedno navedena imena vseh soavtorjev, npr. (Toličič, Šebek, Pečjak in Zorman, 1957), pri morebitnih naslednjih citatih pa le ime prvega avtorja, za druge pa je dodano le 'in dr.'; drugi citat bi se tako glasil (Toličič in dr., 1957). Kadar je citiranih več del istega avtorja, napisanih v istem letu, so letnicam dodane male črke po abecednem redu, npr. (Peršič, 1968a, 1968b). V seznamu literature na koncu prispevka so navedena po abecednem redu avtorjev (in brez zaporednih številk) vsa v besedilu citirana dela (in samo ta). Celoten seznam literature mora biti napisan v skladu z APA standardi citiranja. Pri navedbi vira so vedno izpisana imena vseh avtorjev prispevka, ne glede na to, koliko jih je. Navedki prispevkov v revijah morajo vsebovati priimek avtorjev, začetnice imena, leto izdaje, naslov prispevka, polno (neokrajšano) ime revije, letnik, če se v vsakem zvezku znotraj istega letnika število strani začne z 1, tudi številko zvezka (v oklepaju), in navedbo strani, na katerih je natisnjen prispevek (pri tem uporabljamo pomišljaj -, ne vezaj -). Pri tem je potrebno paziti na ločila, ki ločijo posamezne enote navedka. Ime revije in letnik izhajanja pri navajanju prispevkov v revijah ter naslov knjige (tako pri avtorskih kot pri urejenih knjigah) so v poševnem tisku. Primer navedbe: Plomin, R. in Caspi, A. (1998). DNA and personality. European Journal of Personality, 12, 387^-07. Navedba avtorske knjige vsebuje priimek avtorjev, začetnice imena, leto izdaje, naslov knjige, kraj izdaje in založbo. Primer navedbe: Lazarus, R. S. (1991). Emotion and adaptation. Oxford: Oxford University Press. Navedba poglavja avtorja v knjigi z urednikom (»edited book«) vsebuje priimek avtorjev, začetnice imena, leto izdaje, naslov poglavja v knjigi, začetnice imena ter priimek urednikov, označbo, da gre za urednike, naslov knjige, strani, na katerih je natisnjeno poglavje, kraj izdaje in založbo. Primer navedbe: Schutz, R. W. in Gessaroli, M. E. (1993). Use, misuse and disuse of psychometrics in sport psychology research. V R. N. Singer, M. Murphey in L. K. Tennant (ur.), Handbook of research in sport psychology (str. 901-917). New York: Macmillan. Vsaka navedba prispevka, katerega naslov ni v enem od pogosto uporabljanih svetovnih jezikov (npr. angleškem, nemškem, francoskem, italijanskem, španskem) mora imeti v seznamu referenc v oglatem oklepaju dodan tudi naslov prispevka, preveden v angleški jezik. Primera navedbe: Pogačnik, V. (1995). Pojmovanje inteligentnosti [Conceptions of intelligence]. Radovljica: Didakta. Tušak, M. (1998). Barvne preference, simbolika barv in osebnost [Colour preferences, colour symbolism and personality]. Psihološka obzorja, 7 (4), 67-79. Oddajanje prispevkov Avtorji besedilo in druge dele prispevka pripravijo v elektronski in natisnjeni obliki, ki morata biti identični. Datoteke, ki naj bodo poimenovane s priimkom prvega avtorja in dodano specifično oznako (npr. novak-besedilo.doc; novak-tabeleslike.doc), avtorji pošljejo glavni in odgovorni urednici na elektronski naslov anja.podlesek@ff.uni-lj.si (namesto tega lahko po navadni pošti na naslov urednice pošljejo CD). Natisnjeno obliko prispevka pošljejo na naslov: dr. Anja Podlesek, Univerza v Ljubljani, Filozofska fakulteta, Oddelek za psihologijo, Aškerčeva 2, 1000 Ljubljana. Ob prvem pošiljanju prispevka avtorji pripravijo dodatno datoteko (npr. novak-kontaktnipodatki.doc) z osnovnimi podatki o prispevku in avtorjih: izpišejo naslov prispevka, ime in priimek avtorjev, strokovne nazive, ime inštitucije, v kateri so zaposleni, in natančen naslov tistega avtorja, s katerim bo uredništvo revije komuniciralo (tudi elektronski naslov, številko telefona in, če je možno, telefaksa ter URL naslov). Datoteke z besedilom, tabelami in slikami avtorji natisnejo z računalniškim tiskalnikom v treh izvodih. Vsaka stran naj bo natisnjena na posebnem listu. Po koncu besedila naj bodo dodane tabele in nato slike, vsaka na posebnem listu papirja (pri slikah naj bo na hrbtni strani lista s svinčnikom zapisana zaporedna številka slike). Po končanem redakcijskem postopku in strokovnih recenzijah bo izvod prispevka vrnjen avtorjem, skupaj z recenzijama in kratkim mnenjem urednice glede sprejetja besedila v objavo. V primeru, da je prispevek sprejet v objavo, avtorji upoštevajo vse prejete pripombe, popravke in sugestije ter pripravijo končno verzijo prispevka. V končni verziji naj bo prva stran besedila takoj za naslovom prispevka dopolnjena še z imenom in priimkom avtorjev, imenom inštitucije, kontaktnimi podatki in morebitnimi dodatnimi informacijami o financerju študije, o tem, da je bil prispevek predstavljen na kakšnem od kongresov, ali zahvalo. Pri oddaji končne verzije prispevka avtorji natisnejo en izvod prispevka. Natisnjeno in elektronsko obliko pošljejo na naslov glavne in odgovorne urednice. Tipkopis in slike bodo mesec dni po objavi uničeni, če avtorji ne bodo posebej pisno zahtevali vrnitve originalnih gradiv. Zaključne opombe Poslana končna verzija rokopisa pomeni tudi potrditev avtorjev, da prispevek v enaki ali podobni obliki ni bil objavljen v kateri drugi domači ali tuji publikaciji in da tudi v bodoče ne bo brez poprejšnjega soglasja izdajatelja Psiholoških obzorij. Uredniški odbor, uredniški svet ter izdajatelj ne prevzemata odgovornosti za strokovna mnenja in trditve oziroma zaključke, ki so jih podali avtorji v posameznih prispevkih. Instructions for Authors Papers should be written either in Slovenian or English language (occasionally, the Scientific Board might also accept for publication papers in other languages). Scientific and technical papers should be written in economic, intelligible, clear and concise style. An empirical paper should report original research, presenting all the standard elements of scientific investigation (introduction, method — including participants, instruments and procedure - results, discussion, references). A theoretic paper is expected to examine in detail and critically analyse selected models and/or theories, and empirical data are described only if they are directly related to the theory. A review paper is expected to evaluate previously published work and it is typically composed of the following sections: problem definition, summary of previous research, explanation of subject matter inter-relations, contradictions, problems, and suggestions for further research. Meta-analytic study is a particular type of article, based on the established meta-analysis methodology, comparing different empirical investigations addressing a common problem. Manuscript Structure The manuscript must contain the English and Slovenian version of the title, keywords (about five, defining the contents), and abstract of up to 300 words (the authors that do not speak Slovene should ask the Editor for help). If the paper is written in some other world language, the title, keywords, and abstract must be provided in that language in addition to the English and Slovenian version. A typical empirical paper should be written in accordance with the following guidelines: 1. Introduction should not be too extensive, yet it should provide the necessary conceptual framework. 2. The problem should be clearly and consistently defined, following logically from the introduction. It should be of sufficient relevance and novelty, whereby the new dilemmas opened should be emphasised. 3. Research hypotheses and variables of interest should be concisely defined; the observation and measurement procedures should be precisely described. A short but accurate description of psychological instruments applied and of the methodology in general (research design, selection of participants) is mandatory. 4. Application of statistical techniques and the results should be described in sufficient detail. The tables and figures may only contain essential information (if necessary, details can be presented separately in appendix). 5. Discussion and interpretation of the findings should refer to the established concepts and theories, regardless of whether they are supported by the findings or not. 6. Whenever possible, statements should be supported by citing work and findings of other authors, and the list of references should be included at the end of the paper. Editorial and Scientific Boards assume no responsibility for the expert opinions, claims, and conclusions stated by the authors in their papers. Technical Aspects of Manuscript Preparation The manuscripts should be prepared in accordance with the APA Publication Manual (Fifth Edition, 2001). Each manuscript, meeting the technical standards and falling within the aims and scope of the journal, will be subject to double-blind review by two reviewers. The manuscript must be typeset in a standard font (Times Roman, Arial, Helvetica, or Courier, 12 pt size), with left justification and double spacing. Titles and subtitles must be clearly indicated and pages must be numbered (no other header/footer information is allowed). The paragraphs must not be indented and they must be separated by a blank line. The paper should normally not exceed 16 standard pages (32 rows by 60 characters) in length. The main text, without author(s) name(s) and institution(s), should be saved in a .doc or .rtf file (e.g., in MS Word - if non-Windows software is used, the author must perform the necessary conversion to assure seamless operation on the Windows platform). Tables and figures should not be included in the text (but their position should be indicated). They should be added as one or more separate files. Figures should be provided in camera-ready format without excessively small details. Graphs, schemes, and diagrams should be pasted from the original program into a .doc file as objects. Photographs should be supplied in high-resolution (> 300 dpi) graphic files as JPG, TIF, or PNG. Manuscript Submission The files containing the text, tables and figures should be named by the first author's surname and a short description of the file (e.g. novak-text.doc, novak-tables&figures.doc). In another separate file (e.g. novak-about authors.doc) the basic information on the paper should be provided - title of the paper, name(s) of the author(s), title(s), institution(s), and exact address of the author the Editorial Board will contact for further correspondence (including telephone number, fax number, e-mail address, home page URL if possible etc.). All the files should be sent by e-mail to anja.podlesek@ff.uni-lj.si The manuscript should also be printed in three copies on a single side of paper and sent to the Editor-in-Chief: Dr. Anja Podlesek, University of Ljubljana, Faculty of Arts, Department of Psychology, Aškerčeva 2, 1000 Ljubljana, Slovenia. Each table and/or figure with the proper caption should be provided on a separate sheet. The manuscript will be destroyed one month after publication unless the author submits a request in writing for the originals to be return to her/him. After editorial consideration and review process, a copy of the manuscript will be returned to the author together with the two reviews and editorial opinion on acceptability. In case the manuscript is accepted for publication, the author must take into account all the suggestions (including language and style changes) while preparing the final version. The text in the final version should include (after the title of the paper) the authors' names and institutions, contact information, and potential additional information on funding, congress presentation and/or acknowledgements. The files and a single copy of the final version should be mailed to the Editor-in-Chief. Submission of the final version implies author's declaration that the paper has not been published in any other Slovenian or foreign publication in its present (or similar) form. At the same time it implies author's consent that the paper or its parts can only be reproduced in any other publication by permission of the publisher of the Horizons of Psychology. For any additional correspondence please make use of e-mail.