FILOZOFSKA FAKULTETA V LJUBLJANI METODA ZAPOREDNEGA TESTIRANJA ZA POVEČANJE ZANESLJIVOSTI PSIHO MOTORNIH TESTOV Raziskava izvršena s testom zvijanja žice Disertacija MIRAN ČUK V Ljubljani 1965 2JL2-? I. SPLOŠNO 0 MERSKIH INSTRUMENTIH IN MERJENJU 1 II. SPLOŠNO O MERSKIH KARAKTERISTIKAH V PSIH OME TRIJI 2 III. PSIH OHO TO RNI TESTI IN ZANESLJIVOST 10 dolžina psihomotornih testov občutljivost psihomotornih testov vpliv treninga na uspeh pri psihomotornih testih 2JLY-.IL2-.5-i:___P_R_O_B__L_S_M__A METODA 12 14 I. IZBOR PSIHOMOTORIČNEGA TESTA 15 kratek pregled dosegljive literature, ki obravnava podobno problematiko zgodovinski razvoj psihomotorične preizkušnje zvijanja žice v obliki ključa vsebina psihomotorične preizkušnje - opis sposobnosti, ki jih test meri II. OPIS GRUPE NA KATERI JE BIL IZVRŠEN POSKUS 17 število poskusov, katere je moral posameznik narediti Čas trajanja poskusa v celoti čas trajanja posameznega poskusa način motiviranja poskusnih oseb III. DOSEDANJI NAČIN OCENJEVANJA 21 IV. KONSTRUKCIJA OCENJEVALNE PREDLOGE 22 vzorec ključev, na osnovi katerih je "bila konstruirana ocenjevalna predloga število ocenjevalcev vzorca in način ocenjevanja kriterij, na osnovi katerega je prišel posamezen izdelek v ožji izbor za predlogo konstrukcija predloge in razpored izdelkov število kategorij, ki jih vsebuje predloga za ocenjevanje tehnični izgled predloge in način razmnoževanja način ocenjevanja na osnovi ocenjevalne predloge z metodo primerjanja upravičenost uporabe omenjene metode ocenjevanja 28 I. PRIKAZ STATISTIČNIH TABEL IN GRAFIČNIH PRIKAZOV 29 deskriptiven opis posameznih tabel in grafikonov prikaz vseh rezultatov ugotavljanje zveze med posameznimi poskusi pomembnosti razlik med aritmetičnimi sredinami pomembnosti razlik med variancami ugotavljanje zveze med sukcesivno dodanimi poskusi in prvim naslednjim ugotoviti kakšen je odnos med sukcesivno dodajanimi poskusi in poskusom, ki je eliminiran učinka rezlične priva jenosti ugotavljanje zveze med prvo in drugo polovico poskusa ugotavljanje zveze med sukcesivnim odvzemanjem poskusa na začetku preizkušnje in platojem storilnosti ugotoviti koliko in kateri poskusi dajejo najbolj zanesljivo oceno psihomotoričnih sposobnosti II. OMEJITI VREDNOST DOBLJENIH REZULTATOV 48 DISKUSIJA O REZULTATIH IN _I_N T E' R_P_R E_T_A_C_I J_A_ 49 ZAKLJUČEK 57 PREGLED STATISTIČNIH OBRAZCEV UPORABLJENIH 5g V NAŽIJRAZISKAVT PREGLED L I TERATUE 63 PRILOGE 66 UVOD SPLOŠNO O MERSKIH INSTRUM2NTIH IN MERJENJU Učinkovitost našega opisa nekega pojava je odvisna v veliki meri od lastnosti, ki jih hočemo opisati. Prav tako pa je učinkovitost odvisna od kako in koliko smo uspeli teh lastnosti oceno opisati. Vsako opisovanje ima omejeno vrednost, posebno pa še tedaj, kadar so neprecizno opisane lastnosti za katere smo opisovanje opredelili. Opisovalci različno precizno opisujejo isto lastnost. Pri tem igra zelo važno vlogo predhodnje znanje opazovalca, sposobnost opazovanja, v enaki meri pa tudi sposobnost njegovega izražanja. Glede na samo sposobnost in preciznost opazovalca in na pojav, ki ga mora opazovalec opisati, ločimo več stopenj prefinjenosti opisovanja. Najpreprostejša oblika opisovanja je dihotomna klasifikacija, ki opisuje pojav s amo v dveh sicer kontinuiranih kategorijah. Nekoliko preciznejsi način opisovanja je primerjanje v pridevniški obliki. Ta oblika opisovanja ima omejeno število opisov, vsi opisi pa so daleč od enoznačnosti. Nekaterih lastnosti mi nikdar ne moremo bolje opisati kakor dihotomo. To je odvisno od naše nesposobnosti, da precizno predstavimo stopnjo atributa. Nekateri atributi pa zaradi svoje bistvene prirode ne dovolijo podrobnejše klasifikacije. Znatno višji nivo opisovanja je rangiranje na osnovi neke lastnosti. Rangiranje ima omejeno vrednost. Adekvatno lahko razporedimo nosilce opisane lastnosti samo znotraj iste grupe.Nikoli ne moremo sklepati z ran ga p o s ameznika v eni grupi na eventualni njegov rang v drugi grupi. Tudi numerična označba je povsem odvisna in se nanaša na isto grupo. Za grupo pa je tudi važno koliko ima predstavnikov. Najvažnejši nivo opisovanja je kvantifikacija. Lastnosti, ki jih želimo opisati izrazimo v kvantitativnih iznosih, med različnimi posamezniki pa jih celo primerjamo. Ta način opisovanja je označen v enotah. To se pravi, da vsi opisovalci na osnovi tega opisovanja enoznačno opredeljujejo lastnosti, in s tem celoten pojav Merjenje nam na osnovi kvantifikacije omogoča primerjanje posamez nika z drugim posameznikom, ki je izven prvotne grupe. Znano je dejstvo, da nobena kvantiteta ne obstaja brez kvalitete. Potemtakem pa lahko zaključujemo, da s spoznavanjem kvantitete nekega pojava posredno spoznavamo tudi kvaliteto. Merjenje je v najboljšem primeru samo informacija in nikakor ne sodba. Informacijo, ki nam jo daje vsak merski - opisovalni pošto pek, je omejen. Pogoji v katerih je merjenje izvršeno, omejujejo tudi informacijo. SPLOŠNO O MURSKIH KARAKTERISTIKAH V PSIH: METRIJI_ Psihometriiski merski instrumenti so s a mo s pecifično pripravljeni obči merski instrumenti. Prilagojeni so objektu merjenja. Rezultate merjenja v psihologiji izražamo v najrazličnejših enotah, od fizikalnih pa vse do tistih, ki so povsem specifične za psihologijo. Znano pa je, da mora vsak merski instrument zadovoljiti nekaterim obče veljavnim kriterijem, da ga lahko smatramo za merski instrument. Najvažnejše merske karakteristike, ki jih mora zadovoljiti vsak merski instrument, pa bi bile naslednje: Vsak merski instrument mora biti sposoben objektivnega merjenja. Objektivnost merjenja je osnovna zahteva vsakega merskega opazovalčevega instrumenta. Izraža se z odsotnostjo učinka v merskem rezultatu. Z drugimi besedami bi lahko rekli: merski instrument je objektiven samo takrat, če so kvantitativni iznosi determinirani samo z veličino merjene lastnosti. ✓ Ra mersko karakteristiko objektivnosti vplivajo: 1. struktura samega merskega instrumenta, ki mora izključevati vsako nejasnost v zvezi s pojavom merjenja, 2. točn' in standardizirano izvajanje eksperimenta ali opa zevanja. 3» privajenost in izvežbanost tistih, ki merski instrument uporabija j o. Druga karakteristika, ki jo moramo poznati za vsak merski instrument je zanesljivost. To karakteristiko avtorji rezlično definirajo: Z. Bujass "Mera zanesljivosti nekega merskega instrumenta je variabilnost zaporedno dobljenih rezultatov," (1) L,J. Gronbach: "Dobljeni skor le v grobem nakazuje stopnjo sposobnosti ali tipičnega obnašanja neke osebe... zanesljivost vselej pove koliko zaupanja lahko polagamo v meritev... zanesljivost se vselej nanaša na konsistentnost v seriji meritev..." (2) 1) Z.Bujas: Psihofiziologija rada, Zagreb 1959 2) L.J, Gronbach: Essentials of Psychologieal Testing, New York 1960 J. P, G-uilford: "Pod pojmom zanesljivost razumemo točnost s katero skor predstavlja status nekega individua in to pri tistem aspektu, ki ga test meri... zanesljivost je proporc resnične variance v dobljenih testnih skorih... (3) R.L. Thorndike: "Ocenjevanje zanesljivosti vsebuje določevanje koliko variance v nizu gre na račun resničnih razlik med posamezniki in koliko na račun netočnosti merjenja,,, funkcija zanesljivosti nam kaže, ali je ta test konsistenten z drugimi merami, ne pa ali ta test nekaj meri konsistentno.. , važno je določiti, kako zanesljivo mero imamo o posamezniku kakršen v določenem trenutku eksistira... (4) Instrument je zanesljiv v kolikor pri ponovnem merjenju posameznik ostane isti, kar nam kaže majhna napaka merjenja ali visok koeficient korelacije," (5) G-uilfords Psychometric Methods ,. New York 1954 Thorndikes Personnel Selection Test and Measurement Techniqs, New York 1949 Thorndike in Elizabeth Hagen: Merenje i evaluacija u psihologiji i pedagogici, Beograd (neautorizirana skripta) 3) J.P. 4) R. L. 5) R.L. Mersko karakteristiko zanesljivosti lahko kvantitativno izražamo, ali s koeficientom korelacije, ali s proporcom pojasnjene variance. Obe meri v končni konsekvenci izražata isto. Zanesljivost je odvisna od veeih činiteljev. Resnično sposobnost katere koli osebe ostane od merjenja do merjenja enaka, vendar pa dobljeni skor na osnovi istega merskega instrumenta aplicira-nega na isti osebi variira. Variabilnost skorov je pogojena z napako merjenja. Napaka merjenja je zelo važna in pereča predvsem takrat, kadar so razlike v sposobnosti med različnimi subjekti majhne. -Sredina napake merjenja je v velikih populacijah enaka nič. Napaka merjenja se po zakonu velikih števil pojavlja v enaki meri v pozitivno kot v negativno smer. Enako se tudi ne javlja tendenca, da bi osebe z visokimi skori težile k manjši napaki merjenja in osebe z majhnimi skori k veliki. Nekateri avtorji pa tudi dokazujejo, da napaka merjenja na eni formi testa ni v nikakršni korelaciji z napako merjenja na ekvivalentni ali paralelni formi istega testa, R. L. Thorndike je ugotovil, da je vsak individualen rezultat obremenjen s tremi vrstami variance: a) varianca v reagiranju na test v nekem konkretnem trenutku b) varianca individua od trenutka do trenutka c) varianca, ki izhaja iz vzorca nalog, ki so izbrane kot predstavniki nekih sposobnosti. Za ugotavljanje kvantitativnega iznosa zanesljivosti poznamo več tehnik izračunavanja. Vsaka tehnika izračunavanja zajema samo določen del variance individualnih skorov in je zaradi tega.tudi koeficient zanesljivosti izračunan z vsako tehniko nekoliko drugačen. Retest metoda računanja zanesljivosti obsega varianco, ki se nanaša na reagiranje v testu za določen trenutek, enako pa tudi varianco individua od trenutka do trenutka. To metodo uporabljamo takrat kadar isti merski instrument uporabljamo v dveh različnih priložnostih na istih osebah. Na osnovi tega postopka dobimo koeficient stabilnosti in nam kaže, kako stabilna je dejavnost, ki srno jo merili. Občasni činitelji lahko poskusni osebi ob eni priložnosti pomagajo, v drugi pa ga ovirajo in mu znižujejo njegov rezultat. Koeficient stabilnosti izraža trajne karakteristike. Navedenih koeficientov lahko izračunamo toliko v kolikor časovnih intervalih smo merski instrument aplicirali. Druga tehnika, ki se jo često uporablja za ugotavljanje zanesljivosti je na osnovi dveh ekvivalentnih form testa, S to tehniko lahko zajamemo varianco, ki je pogojena z vzorčenjem nalog za določeno sposobnost. Ta rezultat je determiniran z omenjeno varianco predvsem tedaj kadar si formi sledita neposredno druga za drugo, V primerih pa, da je med obema aplikacijama daljše časovno obdobje pa vsebuje vse tri variance, S to tehniko dobimo indeks ekvivalentnosti. Dosežek na obe . ekvivalentnih testih je pogojen s splošnimi atributi, korelacijo pa znižujejo predvsem specifični atributi. Zaradi svoje praktičnosti se često uporablja tudi metoda notranje konsistence. Koeficient notranje konsistentnosti odraža tako stabilnost kot tudi ekvivalentnost mer. Tu znižujejo korelacijo tako spremembe, ki so v zvezi s samo osebo kot tudi substitucija Q novih nalog, Da lahko ugotovimo prvo zanesljivost moramo uporabiti Spearman-Brownovo formulo. Navedena metoda ni uporabna za hitrostne časovno omejene teste, kajti lahko se zgodi, da se poskusna oseba dalj Časa zadrži na neki nalogi in ne bo mogla reševati zadnjih nalog v testu.V tem primeru tudi oba dela testa nista nezavisna. Splošno je znano dejstvo, da je daljši merski instrument bolj zanesljiv. Seveda moramo za daljšanje testa uporabljati naloge, ki so podobne starim in imajo enake interkorelacije med seboj, kakor tudi z ostalimi nalogami. Če test podvojimo je potemtakem enako kakor da smo sešteli totalna skora dveh ekvivalentnih form istega testa, S 3pearman-3rownovo formulo lahko izračunamo kolikšen koeficient zanesljivosti lahko pričakujemo, če bomo dolžino testa homogeno spreminjali. Zanesljivost je tudi v veliki meri odvisna od težavnosti nalog. Najbolje je,da je koncentracija težavnosti okoli 0,5, zlasti pa še pri kratkih testih. Znana je ugotovitev, da je zanesljivost _ najvišja, če je težavnost malo manjša od polovice poti od 0 - 1, Razlog je predvsem v tem, da slučaj zmanjša zanesljivost predvsem v nižjih skorih, kjer imamo mnogo ugibanj. Na zanesljivost vpliva tudi objektivnost ocenjevanja in vrednotenja, Lahko bi rekli, da vplivajo Činitelji, ki so karakteristič ni za sam merski instrument, metodo administracije in podajanja, Enako vplivajo tudi motivacija poskusnih oseb, katera je v enem primeru lahko visoka in teži k dosegi najvišjega rezultata, v drugem primeru pa je povsem povprečna. Poznanje zanesljivosti nekega merskega instrumenta je osnovna informacija o merskem sredstvu. Zanesljivost, nam v končni kon-sekvenci omejuje maksimalno možno veljavnost. Znano je, da ne more biti koeficient veljavnosti večji od kvadratnega korena koeficienta zanesljivosti. Sama razpršenost rezultatov nam nikdar ne zadošča, kajti lahko je determinirana■ s samo slučajno variabilnostjo, ki je pogojena s Čisto slepim izbiranjem odgovorov. Pri zanesljivosti pa nam gre predvsem za pojasnjeno varianco. Merski instrument je lahko zanesljiv za en nivo in nezanesljiv za drugega. Vsako merjenje je v najtesnejši zvezi z veljavnostjo. Veljavnost merjenja je potemtakem zelo važen cilj. Navajamo nekaj definicij veljavnosti: Z. Bujas: "Za neki test bomo rekli, da je veljaven, če stvarno meri tisto kar smatramo da meri."(l) L.E. Oronbach; "čim bolj popolno in prepričljivo test lahko interpretiramo, tem večja je njegova veljavnost." (2) R.L. Thorndike: "Ali test meri resnično to kar želimo in ne meri nič drugega kar ne .želimo da meri," (3) Navedene definicije se med seboj dopolnjujejo. Veljavnost nam v najširšem smislu odgovarja na vprašanje kaj skori merijo in kaj napovedujejo. Če dva testa kažeta interkorelacij o, potem sta tudi delno identična. Zanesljivost je pomembna samo kot nujni predpogoj za nek merski instrument, da ta razpolaga z veljavnostjo« Maksimalna veljavnost, ki jo lahko ima nek merski instrument je enaka kvadratnemu korenu koeficienta zanesljivosti. Merski instrument je lahko zanesljiv, s tem pa še ni nujno, da je tudi veljaven. Z daljšanjem merskega instrumenta sicer zanesljivost narašča, vendar narašča veljavnost v tem primeru izredno počasi, Veljavnost je znatno širša merska karakteristika kakor pa sama zanesljivost. Cilj in smoter vsakega merskega instrumenta je posredovati veljavne informacije. 1) Z,Bujas; Psihofiziologija rada, Zagreb 1959 2) L.E. Cronbach: Essentials of Psychology Testing,New York 1960 3) R.L. Thorndike° Merenje i evaluacija u psihologiji i pedagogici, Beograd (neautorizirana skripta) Ločimo naslednje vrste veljavnosti: Veljavnost na osnovi predpostavke. V tem primeru sprejmemo kriterijsko mero "brez prigovarjanja za ugotavljanje veljavnosti merskega instrumenta. Pri tem pa moramo biti zelo previdni, ker moramo poznati tudi veljavnost kriterija, ki pa je telo važna. Resnična veljavnost. Stopnjo do katere test meri, kar želimo da test meri lahko imenujemo resnično veljavnost, To veljavnost je možno izraziti tudi v smislu, kako dobro dobljeni skori merijo resnične komponente testnih skorov. Praktična veljavnost skora, ki jo kaže korelacija med skorom in nekim praktičnim kriterijem je odvisna od skupnih činiteljev, ki nastopajo v testu in v kriteriju. Lahko bi rekli, da je praktična veljavnost enaka stopnji do katere test mari činitelje, ki so skupni drugim meram. Informacije, ki jih dajemo z nekim merskim instrumentom morajo razlikovati različne veličine merjenih lastnosti. Lahko bi rek]i da je potrebna občutljivo s t me r s k o ga I n s trumenta. Samo občutljiv instrument lahko razlikuje različne kvantitativne iznose lastnos ti, ki jih meri. Rezultat, ki smo ga dobili z merskim instrumentom pa je potrebno izraziti v standardnih vrednostih. Standardne vrednostiw.omogočaj o primerjanje različnih merskih rezultatov med seboj, Z drugimi besedami lahko rečemo, da mora merski rezultat omogočati primerjanje različnih lastnosti pri isti osebi in istih lastnosti pri različnih osebah. . V psihologiji se uporablja za merjenje sposobnosti, znanja in lastnosti psihološke teste. Test mora imeti ugotovljene in poznane vse navedene karekteristike. Testni rezultati, ki so veljavni, zanesljivi, objektivni, občutljivi in standardizirani imajo vse neobhodno potrebne lastnosti merjenja. P SIHGMOT ORNI _TE3 TI __I K ZANESLJIV OS T_ V vsakdanji psihološki praksi se cesto uporablja tudi psihomo-torne teste, s katerimi skušamo izmeriti specifične psihomotor-ne sposobnosti. Cesto imajo kritike., ki so usmerjene proti uporabnosti in k pomanjkljivostim psihomotornih testov v marsičem tudi realno osnovo. Glavna ost kritike je usmerjena predvsem na področje zanesljivosti psihomotornih testov. Ako bi želeli odgovoriti na dokaj kompleksno vprašanje zanesljivosti psihomotornih testov potem vidimo, da je nižja stopnja zanesljivosti pogojena z več činitelji. Psihomotorni testi običajno vsebujejo samo po eno nalogo, katero, pa v nekaterih testih, poskusna oseba nekajkrat zaporedno rešuje. V primerjavi z ostalimi sposobnostnimi testi, pri katerih vsak vsebuje znatno večje število nalog, je gotovo zanesljivost psihomotornih testov nujno manjša. Zanesljivost je pogojena tudi s številom informacij, to se pravi s številom nalog. Vsaka naloga v testu doprinaša k večji zanesljivosti. Z večanjem informacij o sposobnosti manjšamo napako merjenja, saj je napaka merjenja .pogojena s slučajnimi_.činitelji in je torej njen vpliv obojestranski in oslabljen. Na niž^o zanesljivost psihomotornih testov vpliva bolj kot na ostale sposobnostne teste različna stopnja privajenosti poskusnih oseb. Znano je več inteligentnostnih testov, kateri vključujejo vajo za posamezni podtest. Uspeh na vaji sicer ne upoštevajo v končnem rezultatu, vendar poskusne osebe v izdatni meri glede merjene sposobnosti izenačijo. Sposobnostni testi imajo med ostalim tudi progresivno naraščajočo težavnost nalog, pri vsaki reševani nalogi pa poskusna oseba pridobi na izkušnjah in privajenosti na test. Psihomotorni testi v večini primerov ne razpolagajo s progresivno težavnostjo, privajanje pa je tudi minimalno in ne daje nikakršne garancije za enaka izhodišča vsem poskusnim osebam. Vpliv izkušnje je znatno večji pri psihomotornih testih, kakor pa pri ostalih sposobnostih, Psihomotorne naloge so pod zelo močnim vplivom specifične vsebine in so dober prediktor samo za kriterij, za katerega je veljavno specifično znanje. Na sorazmerno nižjo zanesljivost v velikem primeru testov s področja psihomotorike vpliva tudi nižja objektivnost merjenja. Ker je objektivnost znižana , je posledica tega tudi znižana zanesljivost. Enako imajo običajno tudi slabšo občutljivost, to se pravi, da so rezultati razvrščeni v manjše število kategorij. Zanesljivost, kot korelacijski koeficient med dvema testiranjima pa je pogojena tudi z variabilnostjo rezultatov, Nekateri avtorji definirajo zanesljivost tudi kot pozicijo posameznika v grupi. Zanesljivo merjenje vključuje v vsakem primeru konstanten rang posameznika znotraj grupe. Končni testni rezultat pa je determiniran v psihomotornih sposobnostih po potencialnih sposobnostih in po sposobnosti motoričnega učenja, Poskusne osebe, ki hitro ali počasi napredujejo v motoričnem učenju znižujejo samo zanesljivost, S hitrim ali počasnim napredovanjem, znotraj grupe menjajo svoj rang, to pa že negativno vpliva na zanesljivost. Zaradi navedenih težav pri zanesljivosti psihomotornih testov, bi bilo povsem upravičeno in priporočljivo, če bi vedeli, v koliki meri je posamezni testni rezultat odvisen od predhodnega znanja in izkušenj. Važno bi bilo vedeti to predvsem zaradi dejstva, ker so lahko enaki končni testni rezultati po svoji kvaliteti različni ravno s tega vidika. Dve poskusni osebi sta lahko dosegli povsem enak kvantitativen rezultat, samo da ga je ena oseba dosegla na osnovi znanja, druga pa na osnovi sposobnosti. Na osnovi dosedanjega razglabljanja bi v našem primeru lahko definirali problem, na katerega bomo skušali odgovoriti. NAVEDBA PROBLEMA Zanima nas v kakšni mari in koliko časa vpliva neenaka privajenost poskusnih oseb na storitve v psihomotorni preizkušnji in s tem na zanesljivost preizkušnje. a) Na kakšen način lahko eliminiramo vpliv neenake pri-va jenosti? b) Ali lahko z eliminacijo različne privajenosti poskusnih oseb izboljšamo objektivnost in zanesljivost ocene psi-homotorne preizkušnje? V zvezi z reševanjem osnovnega problema pa lahko rešujemo tudi problem zanesljivosti in globalne ocene. Kako zvečati zanesljivost globalne ocene dosežkov na psihomotorni preizkušnji? a) Ali je globalna ocena psihomotorne preizkušnje dobljena na osnovi najboljšega izdeDka resnično tudi najbolj zanesljiva ? b) Ali je bolje uporabljati za globalno oceno psihomotorne preizkušnje večje število izdelkov? ■ METODA IZBOR_PSIHOMOTORIČNSGA__TESTA R.L. Thorndike je ugotovil, da kažejo poskusni skori pri dvo-rocni koordinaciji progresivno in znatno izboljšanje od poskusa do poskusa, tako da je uspeh pri končnih poskusih močno odvisen od nivoja pri prejšnjih poskusih. Posamezna poskusna doba ne samo da začne na različnih nivojih dejavnosti, ampak tudi napreduje z različno hitrostjo. Posameznikova dejavnost ni določena samo z enim samim parametrom, ampak z dvema ali še večimi. Problem ocenjevanja zanesljivosti naloge izhaja iz dejstva, medtem ko istočasno napaka merjenja v zaporednih poskusih ni nujno neodvisna, Nalogo ni mogoče ponavljati že zaradi lastne narave. Ko je poskusna oseba enkrat na nalogi naredila določen napredek, se naloga zanjo v neki meri spremeni, čeprav je naloga na zunaj ista, ni ista subjektu, ki mu jo dajemo, ker se je on sam spremenil. Zaradi omenjenega retest predstavlja dokaj nezanesljivo osnovo za ocenjevanje zanesljivosti. Spremembe na osnovi učenja, ki so na različne osebe lahko vplivale v različni meri in na različne načine, povzročajo, da obe meri nista ekvivalentni. Za naloge, ki ne predstavljajo vzorčnega univerzuna, ampak eno samo integrirano dejavnost, je iskanje zanesljivosti z ekvivalentnima formama nemogoče. J.C. Nunnally trdi, da je značilnost motoričnih testov v tem, da nizko korelirajo drug z drugim. Podobne motorične manipulacije imajo običajno malo skupnega. Faktorsko-analitična študija testov psihomotornih spretnosti je odkrila malo splošnih skupnih faktorjev. Zaradi majhnega prekrivanja med testi motoričnih sposobnosti, ni kakšnih splošnih mer motoričnih sposobnosti. Psihomotorični testi se običajno uporabljajo pri industrijski selekciji, kjer določeno delo zahteva določen niz motoričnih spretnosti in je odvisno od hitrosti. Psihomotorni testi kažejo v najboljšem primeru samo zmerno prodiktivno veljavnost in se na j čenče uporabljajo v sklopu z ostalimi testi« A.E. Fleishman: V svojih študijah avtor dokazuje s faktorsko analizo udeleženost sposobnosti v začetku in na koncu psihomo-tornega treninga. Posamezne kombinacije sposobnosti, ki sodeluje-jo v individualnih razlikah na kompleksnih psihomotoričnih nalogah, se lahko spremenijo, ko se praksa na nalogi podaljšuje. Sposobnosti, ki se zahtevajo za aktivnosti postajajo naraščajoče šele, ko se praksa podaljšuje. Določeni nemotorični čini-telji so največ deležni v varianci začetnih stopenj prakse, dočim so določeni motorni faktorji udeleženi v varianci kasnejših stopenj. Individualne razlike v aktivnosti na psihomotornih nalogah, po določeni količini prakse so bolj odvisne od drugih sposobnosti in manj od tistih kot v začetku.Specifičnost je bila močneje zastopana v zadnjem delu prakse. J,A. Adams je ugotovil, da mere iz progresivnih stopenj treninga na različnih ~ psihomotornih nalogah korelirajo višje med seboj, kot mere izračunanih stopenj. Obstaja tudi verjetnost, da predstavlja ta specifični faktor "učenje" sposobnosti posamezne vrste. G-.A. Lienert je standardiziral preizkus zvijanja žice v test psihomotorične sposobnosti. Ugotovil je vse merske karakteristike testa, ki so sorazmerno visoke. Za objektivnost ocenjevanja pa daje šablono s tolerantnim intervalom. P. Kogej je objavil informacije o testu "Upogibanje žice". V informacijah je izražena osnovna težnja po enotni uporabi psihomotorične preizkušnje. Podana je kratka zgodovina preizkušnje in osnovni kriterij za impresivno ocenjevanje. Za našo raziskavo smo uporabili test "Upogibanja žice" v obliko ključa. Ta t st smo uporabili predvsem zaradi tega, ker je zelo specifičen glede vsebine sposobnosti ki jih meri in je "obremenjen" še z vsemi pomanjkljivostmi, ki smo jih našteli. Prvi, ki je v diagnostične in prognostične namene začel uporabljati žico je bil W. Moede. Pri njem je vsaka poskusna oseba imela drugačno predlogo in drugačno žico. S takim načinom mer-s e/ jenja razumljivo ni'moglo doseči vidnejših uspehov. Z. Bujas je izoblikoval dokončno obliko omenjenega testa. Prvi so ga začeli uporabljati na Poklicni svetovalnici v Zagrebu, od tam pa se je razširil tudi na Slovensko in ga vrsta psihologov s pridom uporablja. Test sam meri psihomotorično koordinacijo, je pa tudi pod močnim vplivom splošne inteligentnosti. Manjši vpliv imajo še sposobnosti občutljivosti za material, spretnosti prstov in spacialne sposobnosti. OPIS-GRUPEJTA KATERI_JS BIL IZVRŠEN IOSKIJS_ Grupo na kateri je bil izveden naš poskus so sestavljali učenci* I, letnika Industrijske kovinarske šole "Litostroj". Poskus je bil izvršen oktobra meseca 1963. Pogoji izvajanja poskusa so bili ugodni. Poskusne osebe so bile zdravstveno sposobne in nobena se ni pritoževala nad slabo zdravstveno konaicijo. Vse poskusne osebe so uspešmo dokončale redno osnovno šolo. To se pravi, da je bila naša grupa selekcionarna. Imeli smo samo tiste poskusne osebe, ki so imele svoje sposobnosti na nivoju, ki omogoča uspešno dovršitev redne osnovne šole. Naša grupa, na kateri smo izvajali poskus, je vsebovala 20 slučajno izbranih poskusnih oseb. Vsaka poskusna oseba je morala narediti 12 izdelkov. Ocenjevalna serija je torej vsebovala 240 izdelkov. Smatrali smo, da je število poskusnih oseb dovolj veliko, na osnovi katerega bomo lahko ugotavljali splošne zakonitosti fenomena, ki ga nameravamo raziskovati. Dvanajst poskusov, ki jih .je morala opraviti vsaka poskusna oseba, pa smo smatrali za dovolj dolgo psihomotorično preizkušnjo, na osnovi katere se bodo individualne razlike, ki so pogojene s slučajnimi faktorji lahko eliminirale. To se pravi, na o snovi avana is tih poskusov naj bi vsaka poskusna oseba dosegla relativno konstanten rang znotraj (eksperimentalne) lastne grupe. To pa bi že pomenilo, da obstoječe razlike med posameznimi poskusnimi osebami niso determini-rane z različno stopnjo privajenosti, temveč na osnovi sistematičnih faktorjev, kar je v našem primeru različna stopnja psihomotorične sposobnosti. V našem eksperimentu nismo nameravali ugotavljati maksimalne psihomotorične sposobnosti pri posamezni poskusni osebi, temveč samo eliminirati vpliv različne privajenosti, ali izenačiti izkušnje na psihomotorični preizkušnji, Z eksperimentom, ki smo ga naredili, smo želeli eliminirati odnosno omejiti do največje mere vpliv slučajnih faktorjev. Poskusne osebe smo skušali motivirati na osnovi razlage o primerjanju naših rezultatov prihomotorične preizkušnje z njihovimi prakticn i mi u s pehi v šoli in na delovnem mestu. Poudarili smo (strogo tajnost naših rezultatov, kajti na osnovi dobljenih rezultatov bomo ugotavljali samo stopnjo ujemanja med našimi in šol- ■ skimi rezultati. Enako želimo tudi uporabiti dobljene rezultate pri svetovanju bodočim gojencem šole, za njih same pa po potrebi najti kakšno bolj ustrezno delovno mesto. Neposredno pred pričet-kom poskusa smo vsem poskusnim osebam razdelili pole papirja , na katere so morali napisati osebne podatke, enako pa je bil na polah tudi pripravljen prostor za lepljenje posameznih izdelkov po zaporednem vrstnem redu. Za vsak poskus je bil oštevilčen prostor. Vsaka poskusna oseba je dobila tudi 36 lepilnih lističev papirja, s katerimi so prilepili vsak izdelek posebej. Nadalje smo razdelili tudi vsem po 12 komadov bakrene žice, dolge 25 cm in debele 0,8 mm. Za izvedbo eksperimenta smo rabili belo papirnato predlogo, na kateri je bil s črnim tušem narisan ključ, Debel-ina črte na predlogi je 4 mm, dolžina celotne črte je znašala 1 m. Dolžina ključa je bila 41 cm, premir krožnice 14 cm, razdalja od krožnice do brade je znašala 18 cm, ostanek pri bradi 6 cm, brada 6x6 cm, gib brade do sredine 3 cm. Velikost predloge je znašala 40 x 50 cm. Celoten poskus je trajal 68 minut. Posamezen izdelek so poskusne osebe oblikovale dve minuti, nato pa so morale z delom prekiniti, izdelek pa nalepiti s tremi lepilnimi lističi na ustrezno mesto na polo papirja, čas dela, tj, 2 minuti je že ustaljen za to psihomotorično preizkušnjo, in zaradi tega smo ga tudi mi upoštevali, Med posameznimi poskusi so imele poskusne osebe 4 minutni odmor, V tem času so morali izdelek nalepiti na odgovarjajoče mesto, enako pa so se tudi nekoliko relaksirali. Odmor smo morali uvesti, ker bi drugače lahko prišlo do utrujenosti, ki bi nam kot dodaten faktor negativno vplivala na našo zanesljivost. Dolžino odmora 4 minute smo smatrali, da je dovolj dolga za pridobitev ravnotežja v mišičnih skupinah in ne predolga, da bi negativno vplivala na sledečo nalogo. Poskusne osebe so za vse poskuse uporabile 24 minut, odmori med poskusi pa so znašali 44 minut. Navodilo, ki smo ga dali poskusnim osebam pred pričetkom dela se je glasilo takole: Sedaj boste delali preizkušnjo vaše ročne spretnosti. Po predlogi, ki vam jo bom pokazal, boste prostoročno oblikovali žico. Bodite pozorni in skušajte vaše izdelke narediti enake oblike kakor jo predstavlja slika. (Tu smo obesili sliko na, osnovi katere so poskusne osebe prostoročno oblikovale žico). Za sedaj pustite žico še na miru. Prijeli jo boste šele tedaj, ko vam bom rekel začnite in prav tako morate svoj izdelek takoj odložiti, ko vam bom rekel dovolj. Kakor vidite je to slika nekega ključa, vi boste seveda delali v pomanjšanem merilu, toda oblika mora biti podobna Čim bolj tej z istimi razmerji in linijami. Pri upogibanju ne smete uporabljati nobenih pripomočkov, kot so svinčnik, nož in podobno. Žico morate oblikovati prosto v zraku, ne da bi imeli roke oprte na mizo. Ali ste navodilo vsi razumeli? Ali vidite vsi dobro predlogo? Vzemite komad žice v roke in začnite. Po preteku dveh minut s Dovolj, prilepite vaš izdelek na papir v prostor št, ....... s tremi lepilnimi papirčki, na bradi, krožnici in vratu. (Pokazati na predlogi kje se prilepi). Odmore in delo smo merili s štoparico. Po 4 minutah odmora pa so poskusne osebe pričele z drugim poskusom. Rezultate našega preizkusa smo nalepili posamezno na poseben kartonček, kjer pa smo na hrbtno stran kartončka vpisali tudi številko poskusne osebe in zaporedno številko poskusa. Vse kartončke z izdelki smo na osnovi tablice slučajnih številk razporedili v ocenjevalno serijo. Slučajni razpored v ocenjevalni seriji smo uporabili zato, da bi se izognili kakršnemu koli subjektivnemu faktorju pri sestavljanju serije, odnosno zato, ker smo hoteli eliminirati vpliv vrstnega reda na ocenjevalce. Ocenjevanje je izvršilo pet nezavisnih ocenjevalcev. Svoje rezultate so pisali na posebne formularje, kjer je bila navedena samo zaporedna številka kartončka v ocenjevalni seriji. Ocenjevalci niso vedeli niti za število poskusnih oseb, niti za število poskusov, ki jih je poskusna oseba naredila. DOSEDANJI NAČIN OCENJEVANJA Dosedanja praksa ocenjevanja izdelkov psihomotorične preizkušnje kaže večje število pomanjkljivosti. Ocenjevanje na osnovi nestalnih individualnih kriterijev, ki so bili sicer okvirno formulirani, niso dajali zadovoljivih uspehov. V bistvu je bilo to ocenjevanje na osnovi impresije. Za to vrsto ocenjevanja pa nam je znano, da je zelo nizko objektivno. Nizka objektivnost ocenjevanja je pogojevala nizko zanesljivost in je v splošnem znizevala praktično vrednost psihomotorične preizkušnje. Povprečna objektiv nost med nezavisnimi ocenjevalci je na osnovi impresivnega ocenje vanja le redko presegala vrednost r = 0,71. Zaradi nizke stopnje objektivnosti ocenjevanja smo morali izboljšati metodo ocenjevanja v smislu večje objektivnosti. V ta namen smo se poslužili metode primerjanja individualnega psihomotoričnega izdelka s standardno predlogo. Na osnovi navedene metode smo zvečali, povprečno objektivnost med nezavisnimi ocenjevalci na r = 0,84. konstrukcija^OCSNJSVALNE^PRE5l2g5 Ocenjevalno predlogo smo sestavili na osnovi 342 izdelkov. Poskusne osebe so bili kandidati za vpis v industrijsko kovinarsko šolo na Jesenicah. Skupno je bilo 114 kandidatov. Vsak kandidat je delal troje poskusov. Preizkušnja je bila grupna. Vsaka grupa je obsegala po 25 do 28 kandidatov. Posamezen poskus je trajal 2 minuti. Individualen izdelek smo nalepili na svoj kartonček. Kartončke, smo razporedili po slučajnem vrstnem redu v ocenjevalno serijo. Za ocenjevanje smo uporabili štiri nezavisne ocenjevalce. Ocenjevali so v pet kvalitativnih kategorij, ki so progresivno naraščale. Posamezna kategorija je bila opisana. Vsak ocenjevalec je lahko v času ocenjevanja dodatno gledal formulacijo kategorij. Med vsemi ocenjevalci smo zračunali interkorelacije in ugotovili da so korelacijski koeficienti v mejah od 0,66 do 0,79. Povprečen koeficient objektivnosti je znašal 0,71. Na osnovi dobljenih rezultatov lahko zaključimo, da je bilo v zvezi z objektivnostjo ocenjevanja skupnih samo 50 fo čini tel jev, ostalih 5-0 fo variabilnosti pa je bilo individualnih in se nepojasnjeni. Na osnovi take vrste ocenjevanja smo dobili 8.3 izdelkov, ki so bili enoznačno uvrščeni v posamezne kategorije. Po kategorijah je bila frekvenca enoznačno ocenjenih izdelkov naslednja« Kategorijo kvalitativno najslabših izdelkov smo označili z I in je imela frekvenco 44. Nekoliko boljšo kvalitativno kategorijo smo označili z II in je imela frekvenco 19.Nadaljna kategorija III je imela frekvenco 10, IV je imela frekvenco 4 in V, k a t egor i j a kot kvalitativno najboljša, je imela frekvenco 7. V ocenjevalni predlogi smo želeli imeti v posamezni kvalitativni kategoriji 10 tipičnih izdelkov. Zaradi omenjene težnje smo morali v kategorijah, ki so imele večjo frekvenco od 10 po slučaju izbrati 10 tipičnih predstavnikov kategorije. V kategorijah, kjer pa je bila frekvenca enoznačno ocenjenih izdelkov manjša od 10, pa smo jo dopolnili na osnovi tistih izdelkov, ki so bili ocenjeni pri treh ocenjevalcih enoznačno, četrti ocenjevalec pa se ni razhajal za več kot eno kvalitativno kategorijo. Na osnovi tega postopka smo izbrali vse izdelke, ki so zadostili navedenim pogojem v posamezni kategoriji. Iz tako izbranih primerov pa smo za pos amezno kategorijo slučajno izbrali toliko tipičnih izdelkov, da smo dopolnili kategorijo do deset primerov. Naša ocenjevalna predloga je v končni obliki vsebovala 50 tipičnih izdelkov. Razpored izdelkov znotraj posamezne kategorije smo določili na osnovi petih nezavisnih ocenjevalcev,katerih naloga je bila razporediti izdelke znotraj vsake kategorije od kvalitativno najslabšega pa vse do kvalitativno najboljšega izdelka. Izračunali smo interkorelacije med posameznimi ocenjevalci in ugotovili, da se gibljejo v mejah od 0,76 pa do 0,97. Povprečen korelaeijski koeficient med vsemi ocenjevalci je znašal 0,87. Na osnovi dobljenih rezultatov lahko zaključujemo, da je pri razporejanju tipičnih izdelkov znotraj posamezne kategorije 76 c/o faktorjev skupnih. Na osnovi ugotovljene objektivnosti pa nas je zanimala tudi veljavnost našega razporeda. Za kriterij veljavnosti razporeda posameznega ocenjevalca smo smatrali povprečno oceno vseh ostalih ocenjevalcev, brez tistega ocenjevalca, katerega smo korelirali s povprečno oceno. Znano nam je bilo dejstvo, da je povprečna ocena bolj veljavna (ker je tudi bolj zanesljiva in bolj objektivna) od ocene individualnega ocenjevalca in zato smo na tej osnovi tudi lahko ugotavljali veljavnost ocene posameznega ocenjevalca. Koeficienti veljavnosti se nahajajo v mejah od 0,86 do 0,97. Končni razpored izdelkov smo uredili na osnovi tistega ocenjevalca, ki je imel najvišji koeficient veljavnosti 0,97 in je imel tudi najvišje interkorelacije pri. objektivnosti med vsemi ostalimi ocenjevalci. Zaradi praktičnih razlogov smo celotno ocenjevalno predlogo, to je vse posamezne izdelke prefotografirali. v razmerju 1 s 1. Izkušnje ocenjevanja so nam kazale, da je pet kvalitativnih kategorij sorazmerno groba klasifikacija. Pri nas se je pojavila bojazen, da bi zaradi premajhnega števila kategorij imeli slabo diskriminativnost, enako pa tudi, da bi bila variabilnost znotraj kvalitativnih kategorij večja od variabilnosti med kategorijami. V ta namen smo izvedli ocenjevanje 444 izdelkov na osnovi 50 kategorij, skratka, smatrali smo vsak izdelek v ocenjevalni predlogi za svojo kategorijo. Ocenjevanje je izvršilo pet nezavisnih ocenjevalcev. Objektivnost ocenjevanja na tej osnovi je bila sorazmerno nizka in se ni pomembno razlikovala od impresivnega ocenjevanja. Nadalje smo tipične izdelke združili po pet v posamezno kategorijo. Zopet smo dali petim nezavisnim ocenjevalcem oceniti 240 individualnih izdelkov. Iziačunali smo Pearsonove koeficiente korelacije med vsemi ocenjevalci. Ugotovili srno povprečno objektivnost vseh ocenjevalcev 0,85. Koeficienti interkorelacij med vsemi ocenjevalci so bili v mejah med 0,74 in 0,92. Razlika med povprečnimi koeficienti objektivnosti ocenjevanja za impresivno ocenjevanje in ocenjevanje na osnovi ocenjevalne predloge je bila statistično visoko pomembna. Enako smo v tej situaciji računali veljavnost ocen posameznega ocenjevalca z grupno oceno vseh ostalih ocenjevalcev brez navedenega ocenjevalca. Koeficienti veljavnosti so bili v mejah ■ - med 0,85 in 0,92, kar kaže zadovoljivo mero veljavnosti ocen. Povprečen koeficient veljavnosti je znašal 0,88. Predno smo lahko nadaljevali z delom, smo morali tudi preveriti upravičenost računanja Pearsonovuga koeficienta korelaeije. Za kontrolo smo uporabili koeficient kontingence, kot merilo zveze ,ki je neodvisen od regresije in merske lestvice. Izračunali smo zvezo med koeficienti kontingence in Pearsonovimi koeficienti korelaeije. Zveza med obema merama- objektivnosti je pomembna in znaša Spearmanov koeficient korelaeije za vezane range ro = 0,88. G-lede na rezultate, ki smo jih dobili po navedenih postopkih, smo smatrali, da je ocenjevalna predloga dovolj dobra osnova za objektivno ocenjevanje. Posamezni ocenjevalec je ocenil individualen izdelek na osnovi primerjave konkretnega izdelka z izdelkom v predlogi. Predloga je vsebovala deset kvalitativnih kategorij, ki so progresivno naraščale. Najslabšo kvalitativno kategorijo smo označili z 1 in najboljšo z 10, Pri tem ocenjevanju je ocenjevalec primerjal globalno, to se pravi celoten izdelek s celotno predlogo. Naloga mu je bila poskati posameznemu izdelku, ki ga je imel za oceniti, najbolj podoben sličen izdelek v predlogi. Ko je primerjavo med izdelkom in predlogo izvršil in se odločil, kateremu izdelku je bil najbolj sličen, je vpisal kategorijo, v kateri se je nahajal sličen izdelek v predlogi. Tako' je ocenjeval celotno serijo izdelkov, ki so bili produkt našega poskusa. Upravičenost uporabe omenjene metode ocenjevanja je predvsem v tem, da je posamezni ocenjevalec primerjal konkreten izdelek v celoti z ocenjevalno predlogo. Smatrali smo, da so bili v tej situaciji kriteriji ocenjevanja bolj enoznačno definirani. To trditev nam podkrepljuje tudi večja objektivnost ocenjevanja, je/ „ Vsak posamezni ocenjevalec lažje in bolj točno opredelil individualen izdelek, V primerjavi z impresivnim ocenjevanjem smo imeli prednost predvsem v tem, da smo v precejšnji meri izključili možnost različnega interpretiranja ocenjevalnih kategorij. Nepopolna objektivnost ocenjevanja na osnovi primerjanja z ocenjevalno predlogo pa ima dvojen izvor. 1. Zaradi praktičnih razlogov v našo ocenjevalno predlogo nismo mogli vključiti vseh možnih variacij in kombinacij izdelkov psihomotorične preizkušnje. Posamezen izdelek psihomotorične preizkušnje je v glavnem razdeljen na .vsaj petnajst elementov, kateri med seboj lahko variirajo, Za posamezne elemente bi seveda morali poznati pondere, da bi jih lahko pravilno vrednotili. Tega pa mi nismo imeli pri sestavljanju ocenjevalne predloge. Tako je bilo nujno, da je imel vsak ocenjevalec za vsak element lastni ponder in je bila posledica nizka objektivnost impresivnega ocenjevanja, s tem v zvezi pa je tudi manjše število enoznačno ocenjenih izdelkov, 2. Nižja objektivnost od r = 1 pa je pogojena tudi na osnovi različne občutljivosti ocenjevalcev samih. Mi bi v bistvu lahko imeli večje število ocenjevalnih kategorij, vendar različna občutljivost ocenjevalcev nam bi na tej osnovi nižala stopnjo objektivnosti ocenjevanja, Z našo metodo ocenjevanja pa smo objektivnost zvišali na uporabno stopnjo. Metodo ocenjevanja, ki smo jo v našem primeru uporabili lahko upravicujemo tudi z dejstvom, da je enako objektivna na vseh nivojih ocenjevalne serije, Z drugimi besedami lahko rečemo, da je enako objektivna ves čas ocenjevanja. Celotno ocenjevalno serijo smo razdelili na tri enake dele. Izračunali smo vse možne interkorelacije med ocenjevalci znotraj posameznega segmenta ocenjevalne serije. Ugotovili smo, da se vsi povprečni koeficienti objektivnosti med seboj ne razlikujejo = 0,84, r ^ = 0,87 in r^ = 0,83). še več, inšpekcija tabel interkorelacije nam kaže, da se relacija glede objektivnosti med različnimi nezavisnimi ocenjevalci sorazmerno visoko ujemajo ali sovpadajo. REZULTATI / • Z eksperimentom smo dobili za vsakega ocenjevalca posamezne rezultate. V preverjanju ocen na osnovi metode primerjanja z ocenjevalno predlogo pa smo lahko ugotovili, da je objektivnost sorazmerno visoka ne glede na metodo izračunavanja objektivnosti. Na osnovi toga dejstva lahko zaključujemo, da je naša predloga ocenjevanja na stopnji lestvice približno enakih intervalov. To pa nam omogoča računanje Pearsonovih koeficientov korelaeije in ostalih ocen parametrov, ki so:, dovoljeni za intervalne lestvice. Glede na omenjeno dejstvo, da smo hoteli zvečati objektivnost naših ocen na osnovi aritmetičnih sredin ocen vseh ocenjevalcev za posamezen izdelek. S tem postopkom smo dobili samo eno oceno za vsak posamezen izdelek, TABELA 1 POVPREČNE OCENE ZA VSE POSKUSE Poskusi PO T J_ 2 3 4 5 6 7 8 9 lo 11 i 12 1 3 5 5 6 3 5 5 5 5 1 5 6 2 2 4 4 3 6 3 5 4 6 5 6 7 3 7 7 7 8 8 8 9 9 8 8 8 7 4 4 6 7 5 6 7 8 7 7 9 7 8 5 1 4 5 7 7 8 7 7 8 6 8 8 6 4 5 4 4 4 8 5 4 5 5 6 7 7 5 7 6 8 7 7 7 8 8 7 7 7 8 1 1 1 4 2 3 4 4 5 3 6 6 9 2 3 3 2 2 3 4 i o čL 3 1 4 lo 2 6 5 7 3 7 6 6 8 7 7 9 11 3 4 3 7 6 5 7 4 6 7 8 4 12 6 5 6 4 6 6 7 5 7 8 9 8 13 7 8 lo 8 8 9 9 8 9 '8 lo lo 14 5 3 4 4 6 4 6 7 5 5 9 9 15 9 6 9 lo 9 9 8 lo 7 8 8 8 16 5 8 9 9 9 9 lo 9 8 7 lo 9 17 1 1 1 2 1 3 5 2 5 4 3 3 18 2 5 3 5 6 5 5 8 6 8 4 6 19 3 2 5 6 6 5 6 5 7 6 7 7 20 1 3 5 5 3 4 6 6 6 5 6 6 Tabela 1 nam prikazuje individualne ocene za posamezen poskus in poedino poskusno osebo. Glava.tabele nam kaže zaporeden poskus, predkolona pa poskusne osebe. Preglednost individualnih ocen rezultatov je sorazmerno majhna in se splošna tendenca "na oko" sploh ne opazi in je tudi ni mogoče odkriti. Z namenom, da bi videli, kako se obnaša splošna težnja naših poskusov, smo izračunali za vs ak posamezen poskus aritmetično sredino vseh poskusnih oseb. Ker pa je aritmetična sredina posameznega poskusa merilo splošne tendence in je informacija pomanjklji va v k olikor ne upoštevamo tudi razsipa ali razpršenosti okoli te vrednosti, smo v ta -namen izračunali tudi standardne deviacije za vsak poskus. TABELA 2 OSNOVNI PARAMETRI OCENJEVANJA Poskus M SJD ! 1 3,65 2,44 o,51 2 4,65 2,o9 o,46 3 5 , lo 2,45 o,53 4 5,7o 2,27 o ,5o 5 5 , 4o 2,39 o,52 6 5?9o 2,17 o,47 7 6,45 1,7o o,44 8 5,95 2,4o o,52 9 6 ,4o 1,63 o,36 lo 6 ,oo 2, lo o,46 11 6,75 2,27 o,49 12 6,95 1,82 o,40 Legenda: M = aritmetična sredina SD = standardna deviacija S5Lt = standardna napaka ocene aritmetične sredine Grafični prikaz aritmetičnih sredin vseh 12 poskusov je dan z grafikonom številka 1« x Na abscisi so nanešeni zaporedni poskusi, medtem ko je na ordinati prikazana višina aritmetične sredine posameznega poskusa v merski lestvici ocen. Grafikon številka 2 nam prikazuje velikosti standardnih deviacij za vseh 12 poskusov. 6 3.o - "' V 2.0 - l.o ~ _i_I_!_1_1_i_i__i_i-i-i-i— 1 23 4 78 9 lo 11 12 Na abscisni, osi našega diagrama so navedeni zaporedni poskusi. Velikost individualne standardne deviaeije pa je izražena v vrednosti ocene na ordinatni osi. Na osnovi izračunanih vrednosti splošne tendence in grafičnega prikaza lahko uvidimo, da je splošna tendenca v porastu z vsakim naslednjim poskusom. Od petega poskusa dalje pa vse do desetega pa se v našem primeru pojavlja znatno manjši prirastek pri vsaki naslednji aritmetični sredini. Pomemben prirastek aritmetičnih sredin pri 11. in 12. poskusu je verjetno pogojen s končnim elanom. Poskusne osebe so namreč vedele, da je samo 12 poskusov in se jim je pri zadnjih dveh poskusih toliko povečala motiviranost, da so dosegale v povprečku boljči uspeh. Zaradi verjetne neenake motiviranosti v času našega poskusa smo vse rezultate, ki so vezani na 11 in 12 poskus jemali z veliko rezervo in previdno. Po hipotezi bi lahko pričakogali, da bodo poskusne osebe imele znatno višje korelaeije med dvema zaporednima poskusoma, nižje pa v kolikor koreliramo poskus z desetim odnosno zadnjim. To se pravi, poskusne osebe menjajo svoj rang v grupi glede na oddaljenost enega poskusa od drugega, Znatno boljše naj bi se ujemali rangi med sosednjimi poskusi in slabše med oddaljenimi poskusi. V ta namen smo izračunali korelacijsko zvezo, interkorelacij o med vsemi poskusi. Tabela 3 nam kaže interkorelacijske koeficiente med posameznimi poskusi. TABELA 3 PEABSONOVI KOEFICIENTI KORELACIJE MED POSAMEZNIMI POSKUSI Poskusi 1 2 3 4 5 6 7 8 9 lo 11 12 1 o, 6 o o,7o o,34 o ,66 o,61 o,63 o,58 o, 4o o,5o o,54 0,48 2 o,79 o,68 o ,66 o,78 o,72 o,67 o,63 o,58 o,51 o,59 3 o,72 o,74 o,78 0,82 o,72 o,67 o, 56 o,64 o,7 0 4 o, 7o o,8l o,92 o,78 o,72 o, 5o o,63 o,49 5 o,68 o,78 o,77 o,66 o,69 o,71 o,59 6 o,76 o,7o o,7o o ,6o o,61 o,63 7 8 o,72 o,75 o,71 o,69 o,76 o,74 o,63 o,56 o,76 9 o,69 o,73 o,65 lo o,55 o,47 11 o,74 12 rl-12 = °>67 ; r l-lo = o,69 5 rl-5 - o,67 ; r6 -lo = ° , 7o 1 Oo povprečen korelacijski koeficient od 1. do 12. poskusa povprečen korelacijski koeficient od 1. do 10. poskusa povprečen korelacijski koeficient od 1. do 5. poskusa povprečen korelacijski koeficient od 6. do 10, poskusa. Križno polje predkolone in glave tabele nam kaže Pearsonov r za določena poskusa, kjer je naznačena ena spremenljivka v predkoloni in druga v glavi tabele. V glavi in predkoloni pričujoče tabele imamo zaporedno označene poskuse od 1 do 12, Vsak individualen korelacijski koeficient nam kaže tesnost zveze med poskusom, ki je naveden v glavi in predkoloni tabele. Pregled tabele nam jasno kaže, da sicer obstaja osnovna tendenca v skladu z našimi pričakovanji, vendar je vpliv individualnih činiteljev še vedno sorazmerno močan. Produkt individualnih vplivov se kaže predvsem v obojestranskem odstopanju naših koeficientov. Opazimo lahko, da so v splošnem korelacijski koeficienti na začetku vsake vrste in na koncu vsake kolone v večini primerov višji od vseh ostalih znotraj navedene razporeditve. Ker imamo izračunane korelacijske koeficiente na osnovi Pearsonove metode, smo s pomočjo pretvorbe v Pisherjevo "z" vrednost lahko izračunali povprečni korelacijski koeficient, ki znaša za vse poskuse r = 0,67. Ta koeficient nam kaže v bistvu, koliko so vsi poskusi skupaj zasičeni z istimi faktorji. V našem primeru znaša skupna varianca, ki je pojasnjena za vse poskuse okoli 45 celotne variabilnosti. Preostalih 55 ?<> variabilnosti je torej anonimnih in je produkt individualnih odnosno slučajnih Činiteljev. rl-10 rl-5 r6-10 Glede na popreje omenjeno dejstvo, da se aritmetični sredini 11, in 12« poskusa sorazmerno močno odklanjata od tendence ravnotežja med primarno motiviranostjo in učinkom na testu, smo izračunali povprečen korelacijski koeficient samo za prvih 10 poskusov. Ugotovili smo, da znaša r = o,69. To nam kaže predvsem na verjetnost, da je bila naša predhodnja ugotovitev povsem upravičena. Namreč zavedati se moramo, da je z odstranitvijo 11. in 12, poskusa določen del nepojasnjene variance odpadel in tako se nam je povsem upravičeno povečala pojasnjena varianca, ki znaša sedaj 4-8 $ celotne variance. Na osnovi aritmetičnih sredin vseh poskusov lahko opazimo, da so od 5. poskusa dalje razlike med aritmetičnimi sredinami manjše in da je učinkovitost na testu usmerjena k platoju. To nas je nadalje vodilo k temu, da smo izračunali povprečen korelacijski koeficient za prvih pet poskusov r = o,67 in povprečen korelacijski koeficient od 6, do 10. poskusa r = o,70. V kolikor primerjamo ta dva rezultata, lahko ugotovimo, da imamo za okoli 4- $ več znane variabilnosti v zadnjem delu našega eksperimenta, kakor pa v prvi polovici. Kontrolo ugotavljanja interkorelacij smo izvedli s Spearmanovim koeficientom korelaeije. Ta postopek smo morali storiti predvsem zaradi dejstva, ker mi ne uporabljamo rezultatov na intervalni skali, ali kakšni višji,in.smo morali preveriti upravičenost uporabe Pearsonove metode produkt - momenta. Rangirali smo Spear-manove in Pearsonove korelacijske koeficiente in ugotovili z metodo vezanih rangov, da je sovpadanje med obema metodama ro = o,85-, To nam tudi opravičuje zaključevanje in uporabo Pearsonovih koeficientov. Interkorelacijsko zveze in povprečni korelacijski koeficienti so nam nadalje narekovali potrebo po ugotavljanju pomembnosti razlik med aritmetičnimi sredinami poskusov. TABELA 4 DIFERENCE ARITMETIČNIH SREDIN MED POSKUSI 1 3 4 5 6 7 8 9 10 11 12 -1,45 -2 ,o5 -1 ,75 -2,25 -2,8o -2,3o -2,75 -2,35 -3 ,lo -3,3o -o,45 -1 ,o5 -0 ,75 -1,25 -1,8o -l,3o -1,75 -1,35 -2 ,lo -2,2o -0 , 6o -0 ,3o -o ,8o -1,35 -o,85 -l,3o -o ,9o -1,65 -1,85 + 0 ,3o -o,2o -o,75 -o,25 -o ,7o -o,3o -l,o5 -1,25 —o , 5 o -l,o5 -o,55 -1 ,00 -o,60 -1,35 -1,55 -o,55 -o,o5 -o,5o -0 , lo -o,85 -l,o5 +o ,5o +o, o5 +o ,45 -o,3o —o , 5 o -o,45 -o ,o5 -o ,8o -1, 00 +o ,4o -o,35 -o,55 -o,75 -o,95 -o,20 Navedena tabela nam kaže vse razlike med aritmetičnimi sredinami poskusov, Ze bežno pregledovanje tabele jasno kaže, da so večinoma diference negativne. Mi smo namreč odštevali od predhod -nega poskusa naslednjega (x-j - - . ..). Obstajajo tudi štiri pozitivne razlike. Do te anomalije je namreč lahko prišlo, saj j g glede na večje število diferenc verjetnost takih pojavov znatno povečana, V splošnem lahko govorimo, da je naslednji poskus običajno boljši od prejšnjega. Pomembnost razlik med aritmetičnimi sredinami posameznih poskusov smo računali s Studentovim t - testom,. Aritmetične sredine poskusov, med katerimi smo računali pomembnosti razlik so v korelaciji, saj so vse poskuse delale iste poskusne osebe. To dejstvo smo upoštevali pri računanju standardnih napak ocen diference # POMEMBNOSTE RAZLIK MED ARITMETIČNIMI SREDINAMI POSAMEZNIH POSKUSOV POMEMBNOSTI RAZLIK MED VARIANCAMI POSAMEZNIH POSKUSOV Poskus 1 2 3 4 5 6 7 8 9 lo 11 12 1 2,27 3,62 3,53 4,17 5,11 6,83 4,89 5,61 4,8o 6,46 7,o2 2 1,24 1,41 2,69 1,88 4,17 5,45 3,25 4,68 3,29 4,47 5,64 3 1,11 1,38 1±54 o,8l 2,42 4,5o 2,18 3,33 1,91 3,75 5 ,oo 4 l,o4 1,19 1,16 o^75 o,67_ 3,75 o,76 2, oo l,3o 2,5o 2,72 5 1,06 1,32 l,o5 1,11 1>25 3,28 1,57 2,56 1,54 3,46 3,69 6 1,14 l,o9 1,27 l,o9 1,21 1^72 o,13 1,52 o±24 2, o2 2,84 7 1,37 l,lo 1,52 1,31 1,45 l,2o 1,39 o,l8 1,29 £,91 1,28 8 1,06 1,32 l,o4 1,11 1,00 1,21 1,45 lj_25 o,14 1,82 3,o3 9 2, o2 1,63 2,24 1,93 2,14 1,77 1,48 1,15 1,21 1,06 72 lo 1,22 1, o2 1,35 1,17 l,3o l,o7 1,12 l,3o 1,65 1,67 2,11 11 1, o5 1,18 1,16 1 , 00 1,11 l,o9 l,3o 1,11 1,93 1,16 o,6l 12 1,63 1,31 1,81 1,56 1,73 1,43 1,19 1,73 1,24 1,33 1,55 Legenda s Zgornji del tabele nam kaže pomembnosti razlik med aritmetičnimi sredinami. Spodnji del tabele nam kaže pomembnosti razlik med variancami. Nepomembne t-vrednosti so podčrtane. Pomembne P-vrednosti so podčrtane. ^ 00 Navedena tabela nam kaže t vrednosti za vsako posamezno razliko, G-lava in predkolona tabele nam kažeta zaporedni poskus, križno polje pa odgovarjajočo t vrednost med določenima poskusoma. V našem primeru smo izhajali iz ničelne hipoteze. Predpostavljali smo, da so razlike med aritmetičnimi sredinami poskusov produkt slučajnih faktorjev in torej obojestransko variirajo. Odločili smo se za 5 riziko pri 38 stopnjah svobode. Navedeni pogoji v zvezi z našo ničelno hipotezo nam kažejo, da so razlike statistično pomembne na osnovi 5 $ rizika v večini primerov proti koncu posamezne vrste in v začetku vsake kolone. Spoznanje, ki smo ga dobili na osnovi navedene metode, nam v bistvu dopolnjuje razlago interkorelacijskih koeficientov. Odnos med interkorelacijskimi koeficienti in rezultati na t testu so obratno sorazmerni. Tam kjer je sovpadanje visoko je t nepomemben in je razlika med aritmetičnimi sredinami zelo verjetno slučajnega porekla. Enako pa velja tudi za obratno situacijo. Pomembnost razlik med aritmetičnimi sredinami poskusov je samo eden od pogledov, na osnovi katerih lahko gledamo na naš eksperiment. Nujno dopolnilo k temu je še.ugotavljanje pomembnosti razlik med variancami posameznega poskusa. Ugotavljanje teh razlik je Še toliko bolj pomembno, ker nam daje varianca odprtost naših distribucij in je merilo individualnih faktorjev. Znano nam je dejstvo, da se lahko dve distribuciji glede splošne tendence med seboj razlikujeta, dočim je vpliv individualnih faktorjev v obeh primerih enak, V tabeli št. 5 spodnji del nam kaže rezultate F testa , s katerim smo ugotavljali pomembnost razlik med variancami poskusov za vsako navedeno polje. Rezultati kažejo, da razlike med variancami na osnovi 5 $ rizika za 19-19 stopinj svobode niso statistično pomembne in so torej produkt slučajnih faktorjev. Dosedanja analiza podatkov nam je nadalje narekovala ugotavljanje zveze med postopnim dodajanjem poskusov. TABELA KOREMCIJSJ^ Zap^štTj 1 1 2 o,60 2 1+2 3 0,88 3 1+2+3 4 o,75 4 1+2+3+4 5 0,83 5 1+2+3+4+5 6 o,87 6 1+2+3+4+5+6 7 o,87 7 1+2+3+4+5+6+7 8 0,83 8 1+2+3+4+5+6+7+8 9 o,80 9 1+2+3+4+5+6+7+8+9 10 o,72 lo 1+2+3+4+5+6+7+8+9+lo 11 o,77 11 l+2+3+4+5+6+7+8+9+lo+ll 12 o,77 Navedena tabela nam kaže rezultate, dobljene na osnovi postopnega dodajanja posameznih poskusov. Grafikon št, 3 r Q .9o o .80 0.70 o .60 12 3 4 5 6 7 8 9 lo 11 1 i i Grafični prikaz korelacijskih koeficientov, dobljenih na osnovi postopnega dodajanja posameznih poskusov. Na abecisni osi imamo zaporedno navedene kombinacije poskusov, na ordinati pa je označena velikost korelacijskega koeficienta. Tendenca korelacijskih koeficientov, dobljenih po tem postopku, kaže v začetku velik porast, nato se povsem izravna, proti koncu pa celo nekoliko vpade. Pomembnost vpada statistično ni signifikantna. Na osnovi navedenega postopka mi ne dobimo maksimalne zanesljivosti, ki naj bi bila nad o,90, vendar se ji zelo približamo. Navidezni vpad zanesljivosti je verjetno v precejšnji meri pogojen z vpadom motivacije v sredini poskusa in se proti koncu zopet dvigne na osnovi povečane motiviranosti poskusnih oseb pri končnem elanu v poskusu. Natančnejši ogled tabele št. 6 nam kaže, da zanesljivost - sovpadanje narašča vse do šestega poskusa in je tudi pri sedmem poskusu enaka. Pri naslednjih poskusih pa nam vpade. Plato korelacijske zveze nam je nehote vsiljeval stopnjo sovpadanja med prvo in drugo polovico poskusov. Ugotovili smo, da znaša povezanost med prvimi petimi in drugimi petimi poskusi o,92, kar pomeni 86 °Jo skupne variabilnosti. Mi lahko na osnovi tega spoznanja z vIsoko verjetnostjo precej točno napovedujemo uspeh vsakega naslednjega poskusa na osnovi prvih petih poskusov. Točno lahko napovemo povprečen uspeh v zadnjih petih poskusih z odstopanjem individualne vrednosti v pozitivni ali negativni smeri s 5 ff> rizikom + 1,96 SE^, kar znese o,10 ocene. Zanimalo nas je tudi kakšno je sovpadanje rezultatov, če izvršimo dihotomizacij o celotnega poskusa v prvih šest in druge štiri poskuse, To smo naredili predvsem zaradi tega, ker vrh naše zveze ni pri petem, temveč pri šestem poskusu. Ugotovili smo, da znaša r= o,90, kar je sicer nepomembna razlika, vendar je stvarna zveza nekoliko nižja od zgoraj navedene. Glede na visoko stopnjo sovpadanja prve in druge polovice poskusov, bi lahko pričakovali, da mora obstajati tudi močna zveza med petim poskusom in drugo polovico poskusov. Ugotovili smo, da je r = 0,86. To nam kaže, da ne pojasnjuje v naši situaciji samo peti poskus celotne variance in da je potrebno upoštevati tudi ostale štiri poskuse. Enako je tesnost zveze manjša, če upoštevamo samo šesti poskus in ga koreliramo z ostalimi štirimi. Tu jo r = o,8l kar je nižje od zgoraj navedenega primera. Enaka težnja pa nam pokaže nižje korelacije kakor v primeru diho-tomizacije eksperimenta. Z željo, da bi lahko povečali preciznost naše globalne ocene, smo začeli iskati odgovor na osnovno vprašanje: "Koliko in katere poskuse je potrebno upoštevati, da bo naša končna ocena optimalno zanesljiva ?" Dosedanji rezultati nam kažejo smernice, kako bi lahko dobili optimalno zanesljivost končne ocene. Prvo smo vzeli v pretres prvih pet poskusov. TABELA 7 KORELACIJE MED VSOTO POSAMEZNIH OCEN IN 5. OCENO Zap^š t_. 1 2 3 4 1 1+2 1+2+3 1+2+3+4 5 5 5 o, 66 0,78 o ,80 0,83 r o.9o - o. 60 1 Grafični prikaz nam kaže rezultate iz tabele 7, kjer so na abscisi nanesene zaporedne kombinacije poskusov, na ordinati pa višine korelacijskih koeficientov. Iz tabele je razvidno, da smo zopet kombinirali postopno dodajanje poskusov in stopnjo sovpadanja s 5. poskusom, Dihotomizacija našega eksperimenta je pokazala, da je sovpadanje med prvo in drugo polovico eksperimenta največje, če jo naredimo točno na sredini. Rezultati, ki smo jih dobili s tem postopkom, nam kažejo, da z dodajanjem posameznega poskusa raste tudi zanesljivost - sovpadanje, Najvišja zveza obstaja, Če upoštevamo vse prve štiri poskuse in jih primerjamo s petim, Navedeni postopek nam kaže večanje zanesljivosti naše konene ocene v kolikor večamo število virov informacije. Poznano nam je dejstvo, da je vpliv individualnih ciniteljev največji v prvih poskusih. Zaradi preverjanja tega dejstva smo ugotavljali tudi tesnost zveze z odstranjevanjem posameznega poskusa, TABELA 8 Za p. št. X y r 1 .1+2+3+4 5 0,83 2 2+3+4 5 0,80 3 3+4 5 o,78 4 4 5 o,7o GRAFIČNI PRIKAZ št, 5 r o .9o o .80 o .70 o. 60 1 2 3 4 Na abscisni osi so nanesene zaporedne št. iz tabele št. 8, na ordinatni osi pa velikosti r-ov. Iz tabele je razvidno, da se'nam koeficienti korelacije manjšajo v kolikor število virov naše informacije manjšamo. Enako kot smo ugotavljali tesnost zveze z ozirom na peti poskus, smo naredili tudi za šesti poskus. Bo tega ravnanja nas je vodilo predvsem dejstvo, da je pri šestem poskusu korelacija - zanesljivost dosegla vrh in je torej največja. TABELA 9 KORELACIJA MED VSOTO OCEN IN 6. OCENO .št. X y r a 1 1 6 o,61 2 1+2 6 o,81 3 1+2+3 6 o,84 4 1+2+3+4 6 o,85 5 1+2+3+4+5 6 o,87 b 1 1+2+3+4+5 6 o,87 2 2+3+4+5 6 o,88 3 3+4+5 6 o,85 4 4+5 6 0,81 5 5 6 o,68 r o.9o o .80 o .70 _ o. 60 _ 1 Na abscisni osi so označene zaporedne številke kombinacij iz tabele 9, dela-a, na ordinatni osi pa velikosti korelacijskih koeficientov, G-raficni prikaz nam kaže naraščanje korelaci jske. zveze, če večamo število poskusov in jih koreliramo s 6, poskusom. r o.9o o .80 o .70 o. 60 i 1 Na abscisni, osi so označene zaporedne številke iz tabele 9, dela b, na ordinatni osi pa velikosti koeficientov korelacije. Grafični prikaz nam kaže vpadanje korelacijske zveze, če manjšamo število poskusov in jih koreliramo s 6. poskusom. Pregled tabele in grafičnih prikazov nam kažejo, da je najbolj zanesljiva končna ocena v primeru, kadar upoštevamo poskuse 2, 3» 4 in 5 ter jih koreliramo s 6. poskusom. V tem primeru znaša korelacija of88. V potrdilo nasoga zaključka smo nadalje dopolnili še dodatno z ugotavljanjem zveze med prvo polovico poskusov brez prvega poskusa, kjer je vpliv individualnih faktorjev največji in drugo polovico vseh poskusov. V tem primeru znaša korelacijska zveza o,93 in nam dodatno potrjuje poprejšen zaključek,. Končno lahko rečemo, da je za uporabo psihomotorične preizkušnje najbolje, če poskusna oseba naredi pet poskusov, končno oceno pa formuliramo, če uporabimo 2,3,4 in -5. poskus. Tako dobljena končna ocena je optimalno zanesljiva* OMEJITI VREDNOST DOBLJENIH REZULTATOV Rezultate, ki smo jih dobili sicer lahko smatramo za verodostojne, vendar nam v nobenem primeru ne dovoljujejo posploševanja na vse situacije. Potrebno je, da se v vsakem trenutku zavedamo: 1. Omejenosti grupe, na kateri je bil izvršen naš eksperiment. Mi smo namreč skušali zadovoljiti eksperimentalni metodologiji, vendar se nam lahko zgodi, da bomo na kakšni drugi grupi ali na reprezentativnem vzorcu dobili nekoliko drugačne rezultate. 2. V našem primeru verjetno nismo uporabljali najboljše - najbolj objektivne metode ocenjevanja, mi smo objektivnost večali z večanjem števila ocenjevalcev. 3. Želeli smo primarno poiskati samo metodo, s katero bi lahko v reprezentativni situaciji poiskali optimalne pogoje zanesljivosti psihomotorične preizkušnje. Zanesljivost naj bi na vsak način ne bila manjša zaradi neenake privajenosti poskusnih oseb. DISKUSIJA O REZULTATIH IN INTERPRETACIJA r Rezultate, ki smo jih dobili na osnovi našega raziskovanja, lahko kvalitativno ocenjujemo z več vidikov. V kolikor jemljemo kvalitativno osnovo za na dalnje razlaganje, potem vidimo, da nam rezultati kažejo splošno tendenco, ki je v skladu z našimi osnovnimi hipotezami. 1, Jasno nam je vidno, da imajo poskusne osebe z različno pri-vajenostjo različen napredek pri podaljševanju psihomotorične preizkušnje. Poskusne osebe, katere nimajo zadostnih izkušenj na sličnem oblikovanju kot ga vključuje naša psihomotorična preizkušnja, se z večanjem števila poskusov njihove storitve znatno hitreje izboljšujejo, kakor pa pri osebah, ki te izkušnje imajo. Neenak napredek poskusnih oseb od poskusa do poskusa pogojuje spreminjanje mesta - rang mesta znotraj eksperimentalne grupe. Spreminjanje ranga znotraj grupe pa pogojuje manjšo zanesljivost celotne psihomotorične preizkušnje. S tem, ko mi skušamo z daljšanjem psihomotorične preizkušnje odstraniti vpliv neenake privajenosti, praktično ustaljujemo rang posameznika znotraj eksperimentalne grupe, V našem primeru je nemogoče pričakovati koeficient zanesljivosti v maksimalnih vrednostih zaradi treh razlogov, a) Objektivnost metode ocenjevanja v našem primeru ni maksimalna, tako, da je še vedno določen del variabilnosti med vsemi ocenjevalci individualno pogojen, katerega pa mi nismo v stanju kontrolirati. Ta individualna variabilnost, ki gre na račun posameznega ocenjevalca, je delno pogojena tudi z različno stopnjo občutljivosti ocenjevalca, lahko se dogodi, da je nek ocenjevalec bolj sposoben ocenjevati zaradi večje sposobnosti opazovanja, boljšega treninga ali večih sličnih izkušenj. Razjasnitev individualne variance v tem primeru ni tako enostavna zadeva, ker je kompleksnega pomena. V našem primeru smo skušali objektivnost ocenjevanja zvečati z večjim številom ocenjevalcev, vendar je še vedno ostal nek določen del variance povsem nepojasnjen in plod individualnih činiteljev. b) Pri našem eksperimentu mi nismo ugotavljali maksimalne stopnje psihomotorične sposobnosti, temveč samo nivo, kjer se ra ng posamezne pos kusne osebe znotraj eksperimentalne grupe toliko ustali, da dobimo zanesljivost v uporabnih mejah. To pa pomeni, da še vedno na individualen uspeh pri posameznem poskusu vpliva različna privajenost, samo ne več v sistematičnem delu. Mi smo z daljšanjem poskusa skušali do določene stopnje odpraviti vpliv neenake priva-jenosti, Ako to naše mišljenje izrazimo s funkcijo, potem lahko rečemo, da je individualen uspeh pri p o s kusu funkcija sistematičnih faktorjev, ki jih vključuje preizkušnja in nesistematičnih, to so različni nivoji privajenosti. Kolikor bolj mi daljšamo preizkušnjo, v toliko tudi postopno eliminiramo različno privajenost, kajti poskusne osebe z manjšo izkušnjo znatno hitreje napredujejo, doČim osebe z boljšo privajenostjo kmalu dosežejo v preizkušnji plato storilnosti. c) Tu je važna tudi fizična in psihična kondicija. Poskusne osebe, ki se kasneje utrudijo, imajo vse možnosti, da dalj časa napredujejo v preizkušnji, osebe pa, ki so se že utrudile in postale manj motovirane, pa svoj rang spreminjajo zaradi vedno slabših izdelkov. Plato storilnosti v naši preizkušnji je kompromis med. stopnjo motiviranosti in naporom, ki ga preizkušnja vključuje. Na ta način lahko dobimo tudi pri poskusnih osebah s slabo privajenostj o na preizkušnjo kmalu plato njene sposobnosti v kolikor je njena stopnja motiviranosti nizka no gloda na njeno potencialne psihomotorične sposobnosti. Krivulja povprečnih dosežkov grupe se razporeja v obliki krivulje motoričnega učenja. Kolikor je naša zgornja trditev resnična, v toliko lahko nadalje zaključujemo, da je potrebno poskusno osebo naučiti na testno situacijo, če želimo pri njej izmeriti potencialne sposobnosti. To pa nam seveda nadalje narekuje, da je potrebno za dobro oceno upoštevati trend posamezne poskusne osebe in ne samo posamezno oceno, ki jo v testni situaciji lahko ugotovimo, V tem primeru gre torej primarno za naklonski kot trenda ne pa za dolžino trenda. Jasno je, da osebe, ki imajo večje potencialne sposobnosti hitreje napredujejo, to se pravi, da je razlika med dvema zaporednima poskusoma večja od oseb, ki imajo manjše potencialne sposobnosti, če sta imeli obe poskusni osebi enako privajenost. Navedena trditev pa je tudi v skladu s teorijo učenja, saj je poznano dejstvo, da sposobnejši ob enakem treningu hitreje napreduje od nesposobnega. Ob ugotavljanju osnovne zakonitosti in tendence pri več anju zanos ljivosti prihomotoriČne preizkušnje z njenim daljšanjem pa je zanimivo dejstvo, da se variabilnost malenkostno, vendar vedno "bolj in bolj podreja osciliranju. Na žalost pri zadnjih poskusih to pogrešamo zaradi zvečane stopnje motiviranosti pri vseh poskusnih osebah. Mi namreč lahko ugotovimo osnovno tendenco manjšanja vpliva individualnih faktorjev, vendar varianca kot merilo individualnih faktorjev od poskusa do poskusa oscilira od skoraj maksimalne v enem poskusu, takoj v sledečem poskusu pa se pojavi a kot minimalna. Do teh anomalij verjetno pr j de žareli tega, ker posamezne poskusne osebe v določenem poskusu naredijo izredno dober ali slab izdelek, drugič pa povsem povprečen. Glede na navedeno dejstvo lahko zaključimo, da zanesljivost z daljšanjem preizkušnje ne raste v absolutnem smislu, temveč samo v povpreČku To nam dokazuje tudi, če primerjamo odnos na prejšnji poskus najmanjše variance, vidimo, do je povprečna storitev kljub temu večja od predhodne, ICorelacijska tabela, kjer so prikazani koeficienti interkorelacij sicer kaže v jovprečku vpad tesnosti zveze med poskusi. To je naEireč pogojeno z individualnim rangom znotraj grupe, ta pa se z oddaljenostjo od prvega poskusa lahko znatno menja, Enako imamo tudi jasno prikazano pri pomembnosti razlik med sredinami, Z drugimi besedami lahko rečemo, da je skupne variabilnosti, to je potencialnih psihomotoričnih sposobnosti v začetku zelo malo zajetih pri merjenju, v primerjavi s končnim rezultatom. Variance lahko pojasnjujemo šele proti koncu, ne pa v začetku naše preizkušnje. V skladu s Pleishmanovimi odkritji, katera je dobil s faktorsko analizo lahko rečemo, da se faktorska struktura resnično menja s podaljševanjem naše preizkušnje. V začetku naše preizkušnje mi sploh v malenkostni meri izražamo z dosežkom, psihomotorično sposobnost, ampak predvsem stopnjo privajenosti. Šele kasneje ko imamo že večje število poskusov, ko se učinek različne 'privajenosti že izenači, lahko govorimo o psihomotorični sposobnosti. Naše nadaljnje analize pa so tudi pokazale, kakšna je zveza med zanesljivostjo globalne ocene in številom poskusov, ki jih v ta namen uporabimo. Videli smo namreč, da je globalna ocena dobljena tudi na še tako dobrem izdelku, kot ocena, ki je povpreček več ocen zaporednih poskusov. To je namreč povsem logično in jasno. Ocena, ki je dobljena samo na osnovi najboljšega izdelka, vključuje znatno manjše število informacij kot pa povprečna ocena, ki je dobljena na večjem številu poskusov. To pomeni, da je ocena dobljena na večjem številu poskusov (ključev) bolj stabilna kot ocena, ki jo dobimo na osnovi posameznega ključa. Ako bi govorili v umetniškem jeziku, potem bi lahko rekli, da je maksimalna storitev vsebina in v primerjavi s povprečno oceno, ki je smer pojava. Lahko je razumeti, zakaj ne upoštevamo pri globalni oceni prvega poskusa. Ta poskus je namreč pod najmočnejšim vplivom individualnih činiteljev - neenake privajenosti in je povsem razumljivo, da nam v končni konsekvenci znižuje, ne pa zvišuje zanesljivost naše globalne ocene. Navedeno misel nam v polni meri potrjuje tudi stopnja sovpadanja dihotomiziranih rezultatov našega poskusa, V primeru, ko ne upoštevamo prvega poskusa, se nam sovpadanje med 2,3>4- in 5. poskusom in drugo polovico neznatno zviša in je praktično najvišji koeficient zanesljivosti, ki smo ga v naši raziskavi sploh dobili. Razlika bi bila lahko povsem slučajna, vendar daje sum na sistematično vrednost, ker se dosledno pojavlja navedeni fenomen. Iz rezultatov je razvidno, da je zanesljivost najvišja, če koreliramo najbolj zanesljivo oceno in prvo polovico ocen brez prvega poskusa. Rezultate naše raziskave pa je potrebno tudi gledati s kritičnega stališča. Kakor zgleda j o na oko ugodna dognanja, nimamo nikakršne pravice delati vse veljavnih posplošitev. Kot smo že omenili, je naša raziskava vršena na osnovi eksperimentalne grupe, ki ni veren reprezentant osnovne populacije. Naša grupa je selekcionirana glede dveh faktorjev. Učenci v gospodarstvu so selekcionirani prvič na osnovi osnovno-šolske izobrazbe in drugič na osnovi sprejemnega izpita za sprejem v šolo ter prijavo in zainteresiranost za navedeno šolo. Navedene selekcije sicer v končni konsekvenci morda niti bistveno ne učinkujejo, vendar tega mi. nismo stvarno dokazali in nimamo nikakršne pravice zanemariti. Na tem mestu je potrebno omeniti eksperimentalne pogoje^dela na osnovi katerih smo prišli do podatkov za našo raziskavo. Znano je namreč dejstvo, da se rezultati, dobljeni na osnovi eksperimenta lmih pogojev, lahko nekoliko razlikujejo od rezultatov, dobljenih v vsakdanji praksi, Omembe pa je tudi vredno dejstvo, da je naša metoda ocenjevanja na osnovi primerjanja s predlogo samo ena od metod, ki jih lahko v ocenjevanju psihomotorične preizkušnje uporabimo. Danes še ne vemo, kakšna metoda ocenjevanja je za konkretno situacijo najugodnejša in moramo zaradi omenjenih zadržkov jemati naše rezultate kritično in s preudarkom. Namen naše raziskave je bil predvsem poizkati adekvatno metodo, s katero bomo lahko odkrili neenako privajenost poskusnih oseb in sekundarno šele stvarne razlike, ki se v eksperimentu pojavljajo, .Končno smo dolžni poudariti, da so naši rezultati verjetni in najbolj uporabni predvsem za omenjeno šolo ali vse ostale zelo slične situacije. Seveda pa se moramo tudi v tem primeru zavedati omejenosti naših rezultatov. Glede na dejstvo, da mi nismo uporabljali vzorca ,ampak samo grupo, nismo upravičeni računati standardnih napak ocen parametrov. Ta pomanjkljivost pa nam že sama tudi preprečuje računanje intervalov, zaupanja za posamezne parametre, Vsako konkretno odstopanje v drugi eksperimentalni situaciji lahko interpretiramo na več načinov. Razlika je lahko pogojena zaradi razlike eksperimentalnih grup, ali pa zaradi razlik "fenomena , ki ga raziskujemo, V taki situaciji si mi ne bi dosti mogli pomagati s kvantitativnimi analizami, ampak bi bila potrebna kvalitativna analiza obeh grup. Omenili smo že, da je potrebno razvijati odgovarjajočo metodo ocenjevanja. To pomeni, da je potrebno ugotoviti najbolj objektivno metodo ocenjevanja, ki bo ekspeditivna in objektivna, V reševanju navedenega problema bo nujno potrebno iskati kompromis med obema zahtevama, G-lede na navedena dejstva pa ne bo odveč, če omenimo tudi misel, da je naša psihomotorična preizkušnja samo eden od aspektov na osnovi katerega lahko z ostalimi testnimi rezultati dobimo bolj objektivno, zanesljivo in veljavno diagnozo za posameznika. To se pravi, da je psihomotorična preizku snja samostojno zelo malo uporabljiva, da pa lahko služi kot zelo važna informacija pri konstruiranju končnega mnenja o sposobnosti posameznika. Naša psihomotorična preizkušnja . za j ema samo ozek izsek motoričnih in intelektivnih sposobnosti. Jasno pa je, da je uspeh posameznika pogojen s splošnimi in specifičnimi sposobnostmi; v enaki meri pa se v uspehu ali neuspehu kažejo tudi osebnostne lastnosti. Lahko rečemo, da napredovanje v učenju ni odvisno samo od prizadevnosti učitelja in sposobnosti učenca, ampak tudi pogojev učenja in prizadevnosti učenca, G-lede na preizkušnjo, takšno kakršna je, ne moremo več od nje zahtevati in pričakovati, kar nam lahko nudi. Preizkušnja sama nam daje vpogled v specifične sposobnosti, ne daje nam pa splošnih sposobnosti vobče. Delno seveda dobimo vpogled tudi v ostale sposobnosti, vendar samo v minimalni meri. V kolikor se mi zavedamo v vsakdanji uporabi prihomotorične preizkušnje vseh njenih dobrin in pomanjkljivih lastnosti, v toliko je psihomotorična preizkušnja tudi koristna in uporabna. Napake, ki jih delamo na osnovi preizku snje niso pogojene z nje same, ampak izhajajo predvsem iz uporabnika. ■ ZAKLJUČEK Raziskava, ki smo 30 naredili, nam kaže nekatere dobre in slabe lastnosti psihomotorične preizkušnje. Naš glavni namen je bil, da bi z boljšim spoznanjem instrumenta izboljšali vrednost rezultatov, ki jih dobimo s preizkušnjo. Nikakršne pravice nimamo, več zahtevati od morskega instrumenta, kakor pa merski instrument zajema. To se pravi, potrebno je poznati vsebino in točnost mer-., skega instrumenta, s tem pa tudi omejimo uporabnost njega samega. Želeli smo spoznati predvsem zanesljivost psihomotorične preizkušnje. Upamo, da nam je uspelo vsaj delno zadovoljiti naši osnovni težnji. Tako vidimo, da v splošnem zanesljivost testnih rezultatov raste z da-1 jšan jem same preizkušnje. Ugotovili smo, da je za končno oceno važen predvsem trend ocen drugega, tretjega, četrtega in petega, poskusa. Torej, vsaka poskusna oseba naredi pet zaporednih poskusov, Dovolj zanesljivo oceno, ki bo eliminirala vpliv različne stopnje privajenosti poskusnih oseb pa dobimo, če upoštevamo 2,3,4-« in 5. poskus. Na tej osnovi dobimo dovolj zanesljivo oceno psihomotorične sposobnosti posameznika. Variabilnost končnih ocen je v tem primeru resnično primarno pogojena z različnimi stopnjami potencialnih psihomotoričnih sposobnosti in je neenaka privajenost samo sekundaren vir variabilnosti. Potrebno je omeniti tudi pomanjkljivosti ocenjevanja. Metoda ocenjevanja na osnovi primerjanja konkretnega izdelka s standardno predlogo sicer izboljšuje objektivnost ocenjevanja, vendar je še vedno sorazmerno majhna. Kljub navedeni pomanjkljivosti pa je objektivnost metode ocenjevanja v kombinaciji z več ocenjevalci uporabna in zadovoljiva. Za nadaljnje delo na tem področju bi bilo potrebno raziskati ali se zanesljivost poveča primarno zaradi večje objektivnosti pri ocenjevanju ključev, ali zaradi ^.boljše privajenosti poskusnih oseb pri psihomotorični preizkušnji. PREGLED STATISTIČNIH OBRAZCEV UPORABLJENIH V NAŠI RAZISKAVI S x. i M = —M = aritmetična sredina Li S x.= suma individualnih rezultatov 2 1 - M) N = število opazovanj V - ——------V = varianca N - 1 N-l = korektura za male vzorce, kadar je N manjši od 30 1/2 SD = V V - varianca za velike vzorce SD = standardna deviacija G r ~ fTR—S:--r = Pearsonov koeficient xy SD SD XV,-,.. ° x y ° korelacije C ~ kovarianca med x in y variablo ■v-t r « SD = standardna deviacija x x variable SD = standardna deviacija y y variable C = S (x. - M ) (y. - M ) xy N-l v i x7 y7 r2 2 --r - koeficient determinacije r u — = povprečen koeficient korela-ci je 1 - r2 SE^ =--y~/o SE = standardna napaka ocene kore- (N - 1)' lacijskega koeficienta Mx - M ^ - -----^ — kritično razmer je . diference KL aritmetičnih sredin L1 2 S SE^ __T>T = standardna napaka ocene ~'xl J" 2 diference med aritmetičnima sredinama 1/2 SE., t,r ~ standardna napaka diference M^ -iviQ = standardna napaka M. SE^ = standardna hapaka M^ N ~ N P2)l/2 K V _1 V P = kritično razmerje razlik 2 med variancama V0 = manjša varianca V^ = večja varianca 6 S d 2 ro = 1 - -—------r^= ro = Spearmanov koeficient N(N -1) ° korelacije 2 Sd = suma Kvadratnih razlik med rang vrstama N = numerus i (N3 - N) - (Tx + Ty) - Sd2 (N3 - N) - 2 T Ž7"2 / | (N3 - N) - JT/72 U ro = koeficient korelacije vezanih rangov N = numerus 9 Sd" = suma kvadratnih razlik med rang vrstama T 5 T = sume agregatov vezanih "V — ^ rangov znotraj posamezne rang vrste 1 3 (t.. - t..) T^ = suma agregatov vezanih rangov znotraj rang vrste 12 i i x t. = agregat vezanih rangov , . 2 N (ad - c"b)2 , , 2 -v hi = ~7——/ n \—7---T~'7T—tt hi = kritično razmerje hi (a+b) (c+d) (a+c) (fc+d) kvadrata N = numerus a,b,c,d = vrednosti polj, frekvence v posameznem polju Obrazec je uporaben samo za 2.2 tabele • m2 1/2 C = / —-t-—/ C - koeficient kontingence hi + N PREGLED LITERATURE MARJAN dr. BLEJECs Statistično metode za psihologe, Ljubljana 1959 ZORAN BUJAS: Psihofiziologija rada, Zagreb 1959 CRONBACH Lee J.: Essentials of Psyehological Testing, New York 1960 G-EORG-E A. FERG-USON: Statistical Analysis in Psyehology and Educa ti on E.A, FLEISKMAN: Bimensional Analysis of Psychomotor Abilities, Journal of Experimental Psyehology, 1954/6 E.A. FLEISHMAN: The Relation Between Abilities and Improvement Practice in a Visual Discrimination Reaetion Task, Journal of Experimental Psyehology, 1955/5 E.A. FLEISHMAN and W.E. HEMPEL% Factorial Analysis of Complex Psyehomotor Performance and Related Skills, Journal of Applied Psychology, 1956/2 E.A. FLEISHMAN: A. Comparative Study of Aptitude Patterns in Unskilled and Skilled Psychomotor Performances, Journal of Applied P:.: ychology, 1957/4 Z. PRIDMAN: Problemi covjeka u industrijskom masinizmu, Sarajevo 1964 HENRY E. GARRETT: Statistika v psihologiji in pedagogiki, Ljubljana 1957 J.P. GrUILPORD: Psychometric Methods, New York 1954 H.H. HILF: Nauka o radu, Rijeka 1963 R,L, THORNDIKE and ELIZABETE HAGEN: Merenje i evaluacija u psihologiji i pedagogici, Nov/ York 1955 Beograd, neavtorizirana skripta U.G, Yule in M.G. KENDALL: Uvod v teorijo statistike, Ljubljana 1955 - 59 P. KOGEJ: Upogibanje žice, Ljubljana 1956 GUSTAV A. LIENERT: Die Dratbigeprobe als standardisierete Teste Gbttingen 1961 GUSTAV A. LIENERTs Testaubau und Testanalize, nheim 1961 Dr. W. MOEDE: Lerbuch der Psychotechnik, Berlin 1930 N. MAIER: Industrijska psihologija, Zagreb 1964 JUM C. NUNKALLYs Test and Measurements, New York 1959 BORIS dr, PETZ: Osnovi statistieke metode, Zagreb 1964 R.L. THORNDIKE: Personnel Selection Test and Measurement Technigs, New York 1949 R.S. V/OODVORTH: Eksperimentalna psihologija, Beograd 1959 OCENA 1 OCENA 2 (7—? OCENA 3 OCENA A OCENA 5 OCENA 6 O-"inp O^V? Z) "vvf3 OCENA 7 OCENA 8 OCENA 9 -inT =\aP OCENA 10 U* NflROOfIR in IHIUERZITF.THH Mi T i2HICR 00000441471