Informatica Medica Slovenica 2007; 12(2) 29 Strokovni članek ■ Nekaj malega o računanju velikosti vzorca Basics of Sample Size Calculations Janez Stare Izvleček. V članku predstavim računanje velikosti vzorcev za nekatere preproste primere, ki pa jih v raziskovalni praksi pogosto srečamo. Abstract. Calculation of the sample size for some most commonly used statistics is presented. ■ Infor Med Slov: 2007; 12(2): 29-33 Institucija avtorja: Inštitut za biomedicinsko informatiko, Medicinska fakulteta, Univerza v Ljubljani. Kontaktna oseba: Janez Stare, Inštitut za biomedicinsko informatiko, Medicinska fakulteta, Univerza v Ljubljani, Vrazov trg 2, 1000 Ljubljana. email: janez.stare@mf.uni-lj.si. 30 Stare J: Nekaj malega o računanju velikosti vzorca Uvod Da ima velikost vzorca nekaj besede pri tem, kako značilni bodo rezultati statistične analize podatkov, je skoraj splošno znano dejstvo. Za kakšen vpliv gre pa ve že malokdo. Vendar vse več strokovnih in znanstvenih medicinskih revij zahteva izračun potrebne velikosti vzorca oz., obrnjeno, izračun moči testa. Tudi na našem inštitutu čutimo porast takšnih zahtev, zaenkrat žal prepogosto šele po tem, ko je zbiranje podatkov že zaključeno. Ko govorimo o potrebni velikosti vzorca, mislimo na določen namen. Najpreprostejši primer je ocenjevanje povprečja. Takrat želimo, da je vzorec dovolj velik, da bomo povprečje ocenili z določeno natančnostjo. Bolj pogosto pa nas zanima statistična značilnost. Recimo, želimo dovolj velika vzorca, da bo razlika med skupinama statistično značilna. Torej, če je med populacijama določena razlika, želimo, da jo naš test zazna. Ali jo bo vedno zaznal? Ne, lahko imamo smolo in izberemo vzorca, ki sta si zelo podobna, čeprav si populaciji nista. Na primer, vemo, da imajo starejši višji krvni pritisk kot mlajši, a če izberemo slučajna vzorca starejših in mlajših, se lahko zgodi, da sta si vzorčni povprečji blizu ali celo v obrnjenem razmerju kot v populaciji. Torej lahko govorimo le o verjetnosti, da bo naš test zaznal razliko, če ta obstaja. Tej verjetnosti pravimo moč testa in zanjo želimo, da je čim večja. To pa je odvisno od velikosti vzorca. Pogosto izbrana, in še sprejemljiva, moč testa je 0,8 oz. 80%. To pomeni, da bomo obstoječo razliko statistično zaznali v 80% primerov. In NE zaznali v 20% primerov! Preden začnemo s konkretnimi primeri, naj spomnim še na tole: tudi če med populacijama ni razlik, je test lahko značilen. Kolikokrat? No, to res sodi v osnove statistike pa vseeno povem - v 5% primerov. Če smo mejo statistične značilnosti postavili pri 5% seveda, sicer pa pač ustrezno drugače. V naslednjih treh razdelkih si bomo pobliže ogledali nekaj najpogostejših primerov izračunavanja velikosti vzorca. Za to potrebujemo nekaj statističnega znanja, ki ga v članku sicer ponovim, a ne razlagam. Ukvarjali se bomo samo z numeričnimi spremenljivkami, o atributivnih pa morda kdaj drugič. Ocenjevanje povprečja Kadar ocenjujemo povprečje neke numerične spremenljivke želimo predvsem čim večjo natančnost. To pomeni, da želimo, da je naša ocena z določeno verjetnostjo največ za d oddaljena od pravega povprečja. Da ne bi komplicirali, se dogovorimo, da bomo v vsakem razdelku izbrali neko konkretno verjetnost, v tem vzemimo 95%. To je sicer veliko, v praksi se ponavadi zadovoljimo z manjšo verjetnostjo. Zavedati se moramo, da bodo naše ocene v 5% primerov vendarle za več kot d oddaljene od pravega povprečja. Najprej se spomnimo, da se povprečja porazdeljujejo normalno. To je popolnoma res, če je spremenljivka v populaciji porazdeljena normalno, a dovolj dobro res tudi, če ni. Naj bo pravo povprečje j, prava standardna deviacija pa o. Standardna deviacija porazdelitve povprečij, ki ji ponavadi rečemo standardna napaka, je o/Vn. Ker za normalno porazdeljeno spremenljivko velja, da je 95% njenih vrednosti znotraj intervala, ki seže 1,96 standardne deviacije levo in desno od povprečja in ker želimo, da je v 95% primerov vzorčno povprečje za manj kot d oddaljeno od povprečja populacije, mora torej biti d=1,96o/Vn in odtod 1,962a2 d2 Pozoren bralec seveda ne bo spregledal, da v gornji formuli nastopa populacijska o, ki je v praksi praviloma ne bomo poznali. V formulo torej postavimo neko oceno in se pri tem zavedamo, da bo naš izračun pravilen le, če se pri oceni nismo zmotili. Če smo varianco precenili, ne bo hudega, saj bo zahtevani vzorec pač prevelik (toliko bolje!), n = Informatica Medica Slovenica 2007; 12(2) 31 s podcenjevanjem variance pa seveda ne kaže računati velikosti vzorcev. Primer: oceniti želimo povprečno vrednost sistoličnega krvnega pritiska v populaciji Slovencev. Pri tem hočemo, da se naša vzorčna ocena s 95% verjetnostjo ne bo razlikovala od prave vrednosti za več kot 2 mmHg. Potemtakem je d=2. Če privzamemo, da je o= 15, dobimo kot potrebno velikost vzorca n = 216. Če bi bili zadovoljni z natančnostjo na 5 mmHg, pa bi potrebovali vsega 35 ljudi. Seveda izračun lahko tudi obrnemo in vprašamo, kako natančno bi ocenili povprečje na primer pri n = 50. Dobili bi d=4,2. Naj še enkrat poudarim, da so ti rezultati zelo odvisni od tega, kaj smo privzeli za o. Slika 1: Testiranje hipoteze o povprečju populacije z enostranskim testom. Če velja ničelna hipoteza, naj bo desno od nje a (npr. 5%) vseh vrednosti pod vzorčno porazdelitvijo povprečij, če pa je pravilna alternativna hipoteza, naj P (npr. 10%) vseh vrednosti leži levo od c . Testiranje hipoteze o povprečju populacije V prvem razdelku smo se ukvarjali z ocenjevanjem populacijskega povprečja. Šlo nam je za natančnost, ničesar nismo testirali. V nadaljevanju si bomo podrobneje pogledali, kako izračunamo potrebno velikost vzorca pri dveh najpogosteje uporabljanih testih: testiranju povprečja in testiranju razlike med dvema vzorcema. Recimo, da želimo preveriti hipotezo nasprotna hipoteza pa je Označimo dejansko povprečje v populaciji z Napaka prve vrste (verjetnost, da zavrnemo pravilno ničelno hipotezo) naj bo a, napaka druge vrste (verjetnost, da sprejmemo napačno ničelno hipotezo) pa P, moč torej 1—P. Privzemimo, da je standardna deviacija enaka o, tako pod ničelno kot alternativno hipotezo. Izberimo točko c takole (glej Sliko 1): Potem je C = Mo + Za in tudi C = Ma - Z P G Vn G yfn Izraza izenačimo in razrešimo na n: n = - G (Za +zp) Če je alternativna hipoteza Ha-JUa^JUo, moramo £a v zgornjih formulah nadomestiti z za/2. Slika 2 ilustrira takšno situacijo. 32 Stare J: Nekaj malega o računanju velikosti vzorca Slika 2: Testiranje hipoteze o povprečju populacije z dvostranskim testom. Slika 3: Dva vzorca, enostranski test za H0:ju1=ju2 proti alternativni hipotezi, da je H0:^2>^1. Ocenjevanje razlike dveh povprečij Problem je enak kot pri ocenjevanju povprečja populacije, le da je standardna deviacija porazdelitve razlik povprečij enaka o--=. X1 - *2 2 2 Če ponovno d predstavlja natančnost, je d = z a/2 22 E + El. kar je izraz, iz katerega lahko izračunamo npr. n2, če določimo n1. Ponavadi se odločimo za razmerje med n1 in n2, torej n2=kn1, od koder potem sledi z1a/2(ko'2 +o22) kd2 (1) Izraz se še nekoliko poenostavi, če lahko privzamemo enakost varianc in enako velikost obeh vzorcev. Testiranje razlike povprečij dveh neodvisnih vzorcev Recimo, da želimo preveriti hipotezo nasprotna hipoteza pa je Ha:jU2>Mi. Označimo razliko med populacijskima povprečjema z 3=m1-M2. Potem lahko hipotezi zapišemo takole: H0:3=0, Ha:S>0. Situacija je enaka kot pri testiranju enega vzorca, le da gre tukaj za razlike povprečij. Spet naj bo c točka, za katero velja (glej Sliko 3): Če velja ničelna hipoteza, naj bo desno od nje a (npr. 5%) vseh vrednosti pod vzorčno porazdelitvijo razlik, če pa je pravilna alternativna hipoteza, naj P (npr. 10%) vseh vrednosti leži levo od c. Zdaj je : = 0 + ; o n n n n 2 n = + a n n in Informatica Medica Slovenica 2007; 12(2) 33 ■ = S + ; 1 ■ + - O Od tu lahko izrazimo n2 kot funkcijo n; (pa še a;, a2, za in zp). Računanje si nekoliko olajšamo, če zopet postavimo n2=kn1, kar da n1 =-2-• 1 kS2 Če je alternativna hipoteza HaVlČfa, moramo, tako kot prej, za v zgornjih formulah nadomestiti z za/2. 2 n n 2