10 Vidmar G et al.: Možnosti primerjave skladnosti meritev med skupinami Izvirni znanstveni članek ■ Možnosti primerjave skladnosti meritev med skupinami: obremenitveno testiranje kot presejalni test za zmožnost hoje po nadkolenski amputaciji Gaj Vidmar, Helena Burger, Tatjana Erjavec Izvleček. Rehabilitacija oseb po amputaciji spodnjega uda vključuje oskrbo s protezo. Pred tem je potrebno ugotoviti, kolikšno obremenitev bo hoja z nadkolensko protezo predstavljala za pacienta. V ta namen smo pri 101 pacientu po transfemoralni amputaciji uporabili 6-minutni test hoje in telesno zmogljivost testirali z obremenitvenim testiranjem z ročnim kolesom. Želeli smo ugotoviti, pri kateri stopnji obremenitve je odgovor žilnega sistema, merjen s porabo kisika, najbližje odgovoru pri testu hoje. Uporabili smo različne statistične analize skladnosti meritev. Članek podaja vpogled v množico razpoložljivih pristopov k analizi skladnosti za številske spremenljivke s poudarkom na primerjavi skladnosti med skupinami. Options for Comparing Measurement Agreement between Groups: Exercise Testing as Screening for Ability to Walk After Transfemoral Amputation Instituciji avtorjev: Univerzitetni rehabilitacijski inštitut republike Slovenije - Soča (GV, HB, TE); Medicinska fakulteta, Univerza v Ljubljani (GV, HB). Kontaktna oseba: Gaj Vidmar, URI - Soča, Linhartova 51, 1000 Ljubljana. e-pošta: gaj.vidmar@ir-rs.si. Abstract. Rehabilitation of persons after lower limb amputation includes provision of a prosthesis. Before that, it should be established how much strain would walking with a prosthesis cause to the patient. For this purpose, we performed 6-minute walk test and exercise testing using hand-wheel ergometer in 101 patients after transfemoral amputation. We wanted to establish at which level of exercise power is the vascular response, as measured by oxygen uptake, closest to the response during walk test. We used various statistical methods of agreement analysis. The article reviews the numerous available approaches to the analysis of agreement for numeric variables with an emphasis on comparing agreement between groups. ■ Infor Med Slov: 2010; 15(2): 10-20 Prejeto: 01.12.2010. Sprejeto: 14.12.2010. Informatica Medica Slovenica 2010; 15(2) 11 Uvod Osnovni namen rehabilitacije oseb po amputaciji spodnjega uda je omogočiti bolnikom čim boljše funkcioniranje in kakovost življenja, kar vključuje oskrbo s protezo. Hoja z nadkolensko protezo je gibalno zahtevna in bolnik pri njej porabi veliko energije, zato je pred oskrbo s protezo potrebno najprej ugotoviti, kolikšno obremenitev bo hoja s protezo predstavljala za bolnika. Stopnja bolnikove aktivnosti pred amputacijo je pomembna pri predpisu dokončne proteze, ki jo bolnik dobi po večmesečnem obdobju uporabe začasne proteze. Bolniki po nadkolenski amputaciji žilnega vzroka so večinoma starejši, imajo številna sočasna obolenja in so manj aktivni.1,2 Večinoma so zmožni le gibanja po stanovanju ali v ožjem bivalnem okolju; le redki lahko hodijo z različno hitrostjo, kar je poemembno za lažje gibanje v širšem bivalnem okolju. Kot objektivni in zanesljivi kriteriji pri odločanju za namestitev proteze so se v dosedanjih raziskavah pokazali rezultati obremenitvenega testiranja in 6-minutnega testa hoje ter ocene z Lestvico funkcijske neodvisnosti (FIM) ob sprejemu v rehabilitacijsko ustanovo.3 Najprimernejši pokazatelj je sicer sposobnost hoje s pripomočki (bergle, hodulja), a hoje ob sprejemu na rehabilitacijo mnogi starejši bolniki ne zmorejo. To odloži odločitev o oskrbi s protezo in s tem v programu rehabilitacije, ki je časovno omejen, skrajša obdobje za vadbo hoje. Zanesljiva hoja ob zaključku rehabilitacije pa je ključen cilj rehabilitacije in napovedni dejavnik za uspešno uporabo proteze v daljšem obdobju po prevzemu. V splošnem je energetska zahtevnost hoje odvisna od višine in vzroka amputacije, hitrosti hoje in starosti.4 Starejši bolniki z nadkolensko protezo v domačem okolju hodijo hitreje in bolj redno uporabljajo protezo s kolenom na zaklep kot protezo z gibljivim kolenom.5 Začasna proteza ima zato praviloma koleno na zaklep in pričujoča študija se nanaša le na take primere. Za testiranje hoje najpogosteje uporabljamo 6-minutni test na ravni podlagi.6,7 Ob poznavanju odgovora srca na napor, ki ga predstavlja hoja z nadkolensko protezo, lahko določimo minimalno potrebno telesno zmogljivost za možnost namestitve proteze. Telesno zmogljivost testiramo z obremenitvenim testiranjem z ročnim kolesom. Tako je bil glavni namen analiz v tem članku ugotoviti, pri kateri stopnji obremenitve je odgovor žilnega sistema, merjen s porabo kisika, najbižje odgovoru pri testu hoje. Za odgovor na to vprašanje je potrebna statistična analiza skladnosti meritev, ki pa je razmeroma mlado področje, premalo poznano med raziskovalci (ne le v zdravstvu) in torišče različnih pogledov, zato članek hkrati podaja vpogled v množico razpoložljivih pristopov in metod za statistično analizo skladnosti številskih spremenljivk. Metode Udeleženci V študijo je bil vključen 101 pacient, sprejet na primarno rehabilitacijo po transfemoralni amputaciji zaradi žilnega vzroka na Univerzitetni rehabilitacijski inštitut — Soča v Ljubljani. Vzorčenje je potekalo zaporedno v letu 2009, pri čemer so bili vključeni le pacienti, ki so bili ob zaključku programa sposobni 6-minutne hoje z nadkolensko protezo s kolenom na zaklep (po želji z uporabo pripomočkov). Postopek merjenja Obremenitveno testiranjem so pacienti opravili ob sprejemu na bolnišnično rehabilitacijo z ročnim kolesom po diskontinuiranem protokolu submaksimalne obremenitve,3 pri čemer smo neposredne meritve z analizo plinov v zraku preko obrazne maske uspeli izvesti le pri pacientih z dobro telesno zmogljivostjo, pri ostalih pa smo VO2 izračunali posredno po obrazcu ACSM.8,9 Test hoje so pacienti opravili v zadnjih treh dneh pred odpustom na razdalji 60 m v skladu s 12 Vidmar G et al.: Možnosti primerjave skladnosti meritev med skupinami priporočili ATS.6 Med hojo smo spremljali njihove metabolične parametre in EKG, pred in po zaključku hoje pa tudi krvni tlak. Vsi pacienti so bili seznanjeni s protokolom študije in so pisno pristali na sodelovanje. Študijo je odobrila Komisija za medicinsko etiko URI — Soča. na doseženo maksimalno obremenitev pri obremenitvenem testiranju. Slednja je zaradi omejitev merilne naprave ocenjena le na 10 W natančno, zato jo obravnavamo kot ordinalno spremenljivko, ki paciente razdeli v štiri skupine (20 W, 30 W, 40 W, 50 W). Statistične analize Najprej smo izračunali opisne statistike in izdelali grafični prikaz za porazdelitev največje izmerjene porabe kisika (VO2 max) pri obremenitvenem testiranju in pri testu hoje glede na največjo doseženo obremenitev pri obremenitvenem testiranju. Potem smo izvedli regresijske analize skladnosti meritev — najprej po metodi najmanjših kvadratov skozi izhodišče, nato pa z metodami za analizo meritev z napakami. Sledil je izračun koeficienta skladnostne korelacije. Na koncu smo skladnost meritev obravnavali z analizo razlik, pri čemer smo najprej uporabili metodo meja skladnosti, nato pa smo s parametričnimi in neparametričnimi oziroma robustnimi metodami analizirali opažene razlike. Vse analize smo izvedli s statističnim programskim paketom SPSS (verzija 15.0.1.1 za okolje Windows, SPSS Inc., Chicago, IL, ZDA, 2007), le analizo povprečij smo izvedli s preizkusno različico paketa Minitab® (verzija 15.1.30.0, Minitab Inc., State College, PA, ZDA, 2007). Regresijske analize za meritve z napakami in koeficient skladnostne korelacije smo izračunali z javno dostopnimi makri10 in preverili s preizkusno različico paketa MedCalc© (verzija 11.4.4.0, MedCalc Software, Mariakerke, Belgija, 2010). Rezultati Pregled podatkov Vsaka analiza podatkov naj bi se začela z ustreznimi eksploratornimi prikazi podatkov in smiselnimi pregledi opisnih statistik.11,12 V našem primeru sta to prikaz (slika 1) in številski opis (tabela 1) pogojne porazdelitve VO2 max pri obremenitvenem testiranju in pri testu hoje glede E tv 1 2H O > Opri največji doseženi obremenitvi Opri 6-minutnem testu hoje a B T 20 30 40 50 največja dosežena obremenitev (W) Slika 1 Porazdelitev največje izmerjene porabe kisika pri obremenitvenem testiranju in pri testu hoje glede na največjo doseženo obremenitev pri obremenitvenem testiranju, prikazana s škatlastimi diagrami. Srednja črta označuje mediano, škatla interkvartilni razmik (IQR), navpične črte razpon brez osamelcev, krožci pa označujejo osamelce (dlje kot 1,5 IQR od škatle). Tabela 1 Opisne statistike za največjo izmerjeno porabo kisika glede na največjo doseženo obremenitev. P 20 W 30 W 40 W 50 W n 14 46 30 11 OT Hoja OT Hoja OT Hoja OT Hoja Min 7,3 7,2 8,9 7,0 9,7 7,1 12,9 8,6 Max 12,7 15,2 13,7 16,9 15,5 14,3 19,0 17,0 M 9,5 10,5 11,6 11,3 12,9 11,5 15,8 13,5 Me 9,3 10,3 11,5 11,4 13,1 11,9 15,7 13,4 SD 1,4 2,2 1,1 2,3 1,4 1,8 1,9 2,2 CV 15% 21% 10% 20% 11% 16% 12% 16% ReRa 1,7 2,1 1,5 2,4 1,6 2,0 1,5 2,0 r 0,278 0,326 0,387 0,176 P 0,300 0,424 0,425 0,218 P = največja dosežena obremenitev; n = št. pacientov; OT = obramenilno testiranje; Me = mediana; CV = koeficient variabilnosti; ReRa = Max / Min; r = Pearsonov korelacijski koeficient, p = Spearmanov koeficient korelacije rangov. Informatica Medica Slovenica 2010; 15(2) 13 Že grafični in tabelarični prikaz porazdelitev kaže na temeljno ugotovitev, ki se je potrdila skozi večino nadaljnjih analiz: pri obremenitvenem testiranju so imeli najbolj podobno porabo kisika kot pri testu hoje tisti pacienti, ki so dosegli največjo obremenitev 30 W; pri tistih, ki so dosegli le 20 W, je bila poraba kisika večja pri testu hoje, pri tistih, ki so dosegli 40 W ali 50 W, pa pri obremenitvenem testiranju. Koeficient variabilnosti in relativni razpon sta pomembna za intepretacijo regresijskih modelov za analizo meritev z napakami, predstavljeno v nadaljevanju. Enako velja za korelacijski koeficient, ki seveda ni naveden kot mera skladnosti, česar ni odveč podkrepiti s šolskim primerom, da je korelacija med dvema nizoma meritev, ki se razlikujeta za konstanto ali za konstanten faktor, popolna, skladnosti med njima pa ni. Regresijske analize skladnosti • Preprosta linearna regresija skozi izhodišče Linearna regresija skozi izhodišče je ena od najpreprostejših metod analize skladnosti meritev. Model smo ocenili znotraj vsake skupine pacientov, določene z največjo doseženo obremenitvijo. Vsi modeli so bili statistično značilno boljši od ničelnega (tabela 2). Kot je razvidno iz tabele 2 in slike 2, je bil ocenjeni naklon najbližje vrednosti 1 (ki pomeni skladnost) za paciente, ki so dosegli obremenitev 30 W. skupine 20 W je bila mejno statistično značilna (p = 0,078), naklon skupine 40-50 W pa je statistično značilno odstopal od naklona skupine 30 W(p = 0,006). 6 9 12 15 18 VO2 max pri najv. dos. obr. (l/min) Nato smo naklone med seboj primerjali s Chowovim testom,13 ki ga lahko z vsakim statističnim programskim paketom izvedemo tako, da gnezdeno primerjamo osnovni linearni model (v našem primeru brez konstante) z modelom, ki mu dodamo dvojiško indikatorsko spremenljivko za primerjalno skupino in interakcijo (v našem primeru le naklona) s to indikatorsko spremenljivko. Opravili smo le dve primerjavi s skupino 30 W, da smo se izognili problemu mnoštva primerjav (angl. multiple comparisons), pri čemer je bila združitev skupin 40 W in 50 W vsebinsko smiselna, hkrati pa je povečala moč testa. Razlika med naklonom skupine 30 W in Slika 2 Panelni razsevni diagram največje izmerjene porabe kisika pri testu hoje v odvisnosti od največje izmerjene porabe kisika pri obremenitvenem testiranju glede na največjo doseženo obremenitev z vrisanimi regresijskimi premicami skozi izhodišče. Črtkana črta predstavlja enakost (premico z naklonom 1). Tabela 2 Rezultati linearne regresije skozi izhodišče. Najv. dos. obremenitev b SE(b) P 20 W 1,096 0,065 < 0,001 30 W 0,974 0,028 < 0,001 40 W 0,889 0,025 < 0,001 50 W 0,845 0,047 < 0,001 b = ocena koeficienta; SE = standardna napaka ocene. 14 Vidmar G et al.: Možnosti primerjave skladnosti meritev med skupinami • Regresijski modeli za analizo meritev z napakami Preprosta linearna regresija predpostavlja popolno točnost spremenljivk oziroma odsotnost merskih napak, kar je pri analizi skladnosti meritev še manj realistično kot pri običajnih statističnih podatkih. Zato se v laboratorijskih vedah, meroslovju in drugod, kjer se redno srečujejo s problemom umerjanja (kalibracije), pogosto uporablja regresijske modele za meritve za napakami.14 Literature in različnih poimenovanj istih postopkov je preveč, zato naj na tem mestu le usmerimo bralca na primerjalne preglede.15,16,17 Najprej smo uporabili regresijo Passinga in Babloka, ki temelji na Theilovem in Senovem pristopu k robustni regresiji z izračunom mediane naklonov daljic, ki povezujejo vse možne dvojice točk, določenih z danimi dvorazsežnimi številskimi podatki.18 Rezultati (tabela 2) kažejo predvsem na veliko negotovost ocenjenih modelov, saj so intervali zaupanja izredno široki (oziroma se jih v skupini 20 W sploh ni dalo oceniti). Za razliko od večine ostalih predstavljenih analiz se je ocenjena skladnost pokazala kot najnižja pri skupini 30 W, saj le pri njej interval zaupanja za oceno konstante izključuje vrednost 0 in interval zaupanja za oceno regresijskega koeficienta izključuje vrednost 1. Poleg tega je le v skupini 30 W vprašljiva linearnost povezave med obravnavanima spremenljivkama. Po drugi strani pa je porazdelitev regresijskih ostankov (slika 3) najugodnejša prav v skupini 30 W. Tabela 3 Ocene parametrov z regresijo po postopku Passinga in Babloka. Skupina a IZ(a) b IZ(b) pCUSUM 20 W -8,65 / 2,00 / > 0,10 30 W -20,98 [-40,8; -10,4] 2,76 [1,8; 4,5] 0,05 40 W -6,14 [-19,5; 2,2] 1,37 [0,8; 2,4] > 0,10 50 W -4,32 [-97,1; 12,2] 1,08 [0,1; 7,0] > 0,10 a = regresijska konstanta; b = regresijski koeficient; IZ = 95% interval zaupanja; / = ni ocenljivo; pcusuM = statistična značilnost testa linearnosti. največja dosežena obremenitev (W) o 20 A 30 • 40 □ 50 --------- Slika 3 Porazdelitev ostankov pri regresiji po postopku Passinga in Babloka. Nato smo uporabili dve metodi, ki sodita v okvir regresije modela II (navadna linearna regresija sodi v model I): 1. regresija po metodi glavne osi (angl. major axis, MA; znana tudi kot regresija po metodi glavnih komponent, angl. principal components regression; metoda najmanjših pravokotnih kvadratov, angl. least perpendicular squares; in metoda pravokotne razdalje, angl. perpendicular distance method) je osnovna in najpogostejša oblika Demingovega splošnega regresijskega modela za meritve z napakami, zato se oznaka Demingova regresija praviloma nanaša nanjo; 2. regresija po metodi zmanjšane glavne osi (angl. reduced major axis, RMA; znana tudi kot regresija po metodi standardiziranih glavnih komponent, angl. standardised principal components regression; metoda najmanjših zmnožkov, angl. ordinary least products, OLP; in regresija geometrijske sredine, angl. geometric mean regression, saj je ocenjeni naklon enak geometrijski sredini naklonov pri navadni linearni regresiji, ki ju dobimo z zamenjavo spremenljivk x in y) je ekvivalentna Demingovi regresiji za standardizirane spremenljivke. Informatica Medica Slovenica 2010; 15(2) 15 Ocene parametrov (tabela 3) kažejo podobno sliko kot postopek Passinga in Babloka v smislu, da naj bi bila skladnost najnižja v skupini 30 W. Prav tako so očitni predvsem (pre)široki intervali zaupanja, ki so sicer nekoliko bolj sprejemljivi pri metodi zmanjšane glavne osi, ki ji novejše študije s področja klinične kemije, farmakologije in biokemije dajejo prednost.16,17 Tabela 4 Ocene parametrov z regresijo po metodi glavne osi (MA) in zmanjšane glavne osi (RMA). MA a IZ(a) b IZ(b) 20 W -20,92 [-151,6; 109,8] 3,32 [-10,6; 17,3] 30 W -44,64 [-90,7; 1,4] 4,84 [0,8; 8,9] 40 W -14,62 [-41,4; 12,2] 2,03 [0,0; 4,1] 50 W -41,76 [-653,8; 570,3] 3,49 [-36,0; 43,0] RMA a IZ(a) b IZ(b) 20 W -4,57 [-17,0; 7,8] 1,59 [0,2; 2,9] 30 W -11,71 [-19,1; -4,3] 1,99 [1,3; 2,6] 40 W -4,77 [-11,4; 1,8] 1,26 [0,8; 1,7] 50 W -5,32 [-17,3; 6,7] 1,19 [0,4; 1,9] Za pojasnila glej besedilo in tabelo 3. Koeficient skladnostne korelacije Linov koeficient skladnostne korelacije19,20 (concordance correlation coefficient, CCC) je produkt mere natančnosti (angl. precision, ocene populacijske vrednosti Pearsonovega korelacijskega koeficienta) in mere točnosti (angl. accuracy, ki predstavlja faktor popravka zaradi pristranosti, angl. bias correction factor). Tako koeficient kot obe njegovi komponenti lahko zavzamejo vrednosti med 0 in 1, pri čemer 1 pomeni popolno skladnost. Ocene po skupinah največje dosežene obremenitve so zbrane v 20 W 30 W tabeli 5. Vrednosti so nizke oziroma zmerne,21 očitno pa je, da se največja izmerjena poraba kisika pri hoji vsaj v grobem sklada s porabo na obremenitvenem testiranju le pri pacientih, ki so dosegli obremenitev 30 W ali 40 W. Tabela 5 Ocene koeficienta skladnostne korelacije. Skupina CCC [95% IZ] natančnost točnost 20 W 0,21 [-0,22; 0,57] 0,28 0,77 30 W 0,26 [0,03; 0,46] 0,33 0,79 40 W 0,28 [0,02; 0,50] 0,39 0,72 50 W 0,10 [-0,27; 0,45] 0,18 0,58 CCC = Linov koeficient skladnostne korelacije; IZ = interval zaupanja (spodnja; zgornja meja). Analiza razlik med meritvama • Metoda meja skladnosti Metoda meja skladnosti (angl. limits of agreement, LOA) ali pristop Blanda in Altmana22 temelji na dejstvu, da je razlika dveh spremenljivk nekorelirana z njuno vsoto (in s tem tudi z njunim povprečjem, ki polovica vsote). Razliko meritev, ki ju primerjamo, zato narišemo v odvisnosti od njunega povprečja za vsako dvojico meritev, meje skladnosti pa ocenimo kot tolerančni interval za razlike. Tudi z metodo meja skladnosti smo meritev porabe kisika pri obremenitvenem testiranju primerjali z meritvijo pri testu hoje znotraj vsake s skupine. Rezultati (slika 4) ne kažejo jasnega neskladja pri nobeni skupini, torej ne omogočajo zanesljivega sklepa glede najprimernejše mejne obremenitve. 40 W 50 W 6421 O O ° ° r, O O o ° c - &0 o o 6 4 2 1 Slika 4 Primerjava VO2 max med obremenitvenim testiranjem z VO2 max pri testu hoje po skupinah z Blandovo in Altmanovo metodo meja skladnosti. Razpon obeh osi je zaradi primerljivosti enak pri vseh skupinah. Točke izven meja skladnosti so označene s polnimi krožci. » o a o D