Kombinirane tehnike merjenja uporabniške izkušnje namiznih spletnih aplikacij s sledenjem kurzorja miške in pogleda uporabnika Jure Trilar1, Vid Čermelj1, Tomaž Čegovnik2, Emilija Stojmenova Duh1 'Laboratorij za telekomunikacije, Fakulteta za elektrotehniko, Univerza v Ljubljani, Tržaška 25, Ljubljana 2 Laboratorij za informacijske tehnologije, Fakulteta za elektrotehniko, Univerza v Ljubljani, Tržaška 25, Ljubljana E-pošta: jure. trilar@ltfe.org Combined techniques for measuring the user experience of desktop web applications by tracking user's mouse cursor and eye gaze Abstract. The paper presents the state of the art and overview of popular approaches to measuring attention and user experience with a special focus on tracking the user's mouse cursor and eye gaze. Special focus is given on the comparison of both techniques in order to present a cost-effective option that would provide useful results along with the greatest possible simplification. 1 Uvod Skozi leta so postali spletni uporabniški vmesniki kompleksnejši, z več interaktivnimi elementi raznolikih oblik in formatov v različnih, bolj ali manj standardnih postavitvah, ki tekmujejo za pozornost uporabnika. V tem kontekstu je pozornost uporabnika omejena dobrina. Razumevanje, kako uporabniki pregledujejo strani in spletne aplikacije oz. uporabljajo digitalne uporabniške vmesnike, je pomembno za sklepanje o učinkovitosti in privlačnosti modernih informacijskih rešitev v različnih kontekstih. Pripravili smo pregled področja in popularnih pristopov k merjenju pozornosti oz. uporabniške izkušnje s posebnim poudarkom na sledenju kurzorja miške in pogleda uporabnika. Osredotočili smo se na primerjavo teh dveh tehnik, z namenom predstaviti stroškovno učinkovito rešitev, ki bi na enostaven način dajala uporabne in kvalitetne rezultate, tudi pri različnih tipih uporabnikov. 2 Pristopi in tehnologije merjenja pozornosti in uporabniške izkušnje Uporabnost (ang. usability) je s strani Mednarodnega združenja za standarde (International Standards Organisation - ISO 9241-11) [1] definirana, kot mera, ki pokaže, kako posamezen uporabnik dosega določene cilje z učinkovitostjo in zadovoljstvom [2]. Usability Professionals Association (UPA) se pri tem osredotoča na razvojni cikel rešitve, s pristopom, ki se ozira na neposreden uporabniški odziv v razvojnem procesu z namenom nižati stroške razvoja in izdelati končne rešitve, ki zadovoljujejo uporabnikove potrebe. Mere uporabnosti se nanašajo na ocenjevanje ali merjenje določenih lastnosti produkta (uporabniškega vmesnika), ki jih je mogoče opazovati in kvantificirati [2]. Mere uporabnosti zajemajo različne vidike, kot so, naprimer, uspešnost reševanja nalog, zadovoljstvo uporabnikov in napake. Za določene vidike so izdelani standardizirani vprašalniki. Vprašalnik za merjenje uporabniške izkušnje (ang. User Experience Questionnaire - UEQ) se nanaša na 6 dimenzij uporabniške izkušnje, ki jih lahko združimo v pragmatične in hedonske lastnosti. Kognitivno obremenjenost merimo s pomočjo vprašalnika NASA-TLX. System Usability Scale (ang. SUS) ponuja hitro oceno uporabnosti vmesnika. Usability Metric for User Experience (UMUX) je skrajšan in poenostavljen SUS [3]. Našteti vprašalniki vključujejo uporabnikovo subjektivno dojemanje. V primeru merjenja funkcionalne uporabnosti (uspešnost reševanja nalog) in pozornosti do elementov in sklopov v grafičnih uporabniških vmesnikih je bolj smiselna uporaba pristopa, ki ni popolnoma odvisen od uporabnikove subjektivne ocene. Takšno merjenje poskuša zajeti obnašanje, ki ga uporabnik ne more zlahka kontrolirati (npr. detektor laži), in ga brez namenske strojne ali programske opreme raziskovalec (opazovalec) ne more dobro opazovati [4]. Ti načini opazovanja delujejo bolj znanstveno in bolj zanesljivo od običajnih merjenj uporabnosti preko vprašalnikov. Potreben pa je pravilen pristop, da je mogoče podatke z dovolj veliko zanesljivostjo interpretirati v uporabne rezultate. 2.1 Izhodišča, zamejitve, predmet, in cilji merjenj Temeljno izhodišče naše analize oz. članka je predstaviti stroškovno učinkovito rešitev za zanesljivo merjenje uporabniške izkušnje, ki bo razumljiva strokovnjakom v organizacijah, kjer do sedaj še niso implementirali kvantitativnih rešitev za merjenje uporabniške izkušnje, s poudarkom na čim boljšem aplikativnem potencialu za izboljšanje uporabniških informacijskih rešitev. Določene tehnološke rešitve za merjenje pozornosti oz. usmerjenosti pogleda uporabnika omogočajo spremljanje skozi daljša časovna obdobja. Uporabljamo jih lahko v različnih okoljih, kjer ni nujno, da so prisotni digitalni zasloni ali drugi kanali za informiranje - torej v multimodalnih okoljih [5]. Primer tega je kabina avtomobila, kjer je potrebno zaznavanje več čutnih ERK'2018, Portorož, 291-294 291 kanalov in večopravilno odzivanje [6]. Za potrebe hitrega in učinkovitega merjenja uporabniškega vmesnika se bomo omejili le na eno modalnost, ki bo neposredno vplivala na iterativne izboljšave v skladu z uporabniško usmerjenim razvojem (ang. User Centered Design). Omejili se bomo na grafično prezentacijo na zaslonu naprave (praviloma osebnega računalnika), za katero je bil uporabniški vmesnik primarno načrtovan. V spletnem razvoju prepoznavamo različne načine prilagajanja razporeditve elementov grafičnega vmesnika, za potrebe hitrih aplikativnih rezultatov pa smo se pragmatično omejili na eno napravo. Upoštevali smo čas izpolnitve enega uporabniškega scenarija v vmesniku. 2.2 Sledenje kurzorja miške Za analizo obnašanja uporabnikov v spletnem uporabniškem vmesniku je sledenje kurzorja miške zelo dostopna rešitev [7]. Implementacija tovrstne rešitve običajno ne predstavlja večjega časovnega in stroškovnega vložka. Prednost je, da lahko na daljavo merimo potovanje miškinega kurzorja pravih uporabnikov, ki praviloma ne občutijo tega, da se jih spremlja. V primeru, da se uporabniki zavedajo sodelovanja v eksperimentu, lahko spremenijo obnašanje (Hawthornov efekt) [8]. Chen je leta 2001 pokazal, da je skladanje premikanja miškinega kurzorja s sledenjem pogleda visoko, od 84% do 88% [9]. Zaradi evolucije spletnih uporabniških vmesnikov domnevamo, dat ti izsledki potrebujejo osvežitev. Razlaga rezultatov je zaradi splošne dostopnosti (spletni servisi) večkrat prepuščena laičnim raziskovalcem, ki so obenem tudi razvijalci aplikacij. Miškin klik je v večini scenarijev dober indikator uporabnikovega zanimanja, vendar pa nas zanimajo še dodatne značilnosti in signali, ki bi lahko izmerili uporabnost ter tudi napovedali obnašanje, frustracijo in zadovoljstvo uporabnika na spletni strani oz. aplikaciji. 2.3 Sledenje pogledu uporabnika Sledenje pogledu uporabnika je najbolj natančna metoda za analizo pozornosti uporabnika v spletnih in drugih uporabniških vmesnikih, saj ponuja neposreden vpogled, ki z zelo malo napakami pokaže, kaj in koliko časa uporabnik dejansko opazuje, ter kakšna je pot njegovega pogleda [10]. Ta tehnika se uporablja v kognitivnih študijah, preučevanju interakcije človek-računalnik in marketinških raziskavah [7]. Ne uporablja se samo za merjenje uporabniške izkušnje, temveč tudi za dejansko navigacijo v grafičnih vmesnikih [11]. Ključna prednost je natančnost meritev. Obstajajo pa zadržki glede uporabe tehnologije za sledenje pogleda uporabnika za namene merjenja uporabniške izkušnje oz. pozornosti [12,13]. Bistvena ovira pri tem so višji stroškovni okviri, ki jih organizacije, ki nimajo specializiranih procesov za testiranje uporabniške izkušnje, ne morejo upravičiti. Ti okviri vključujejo nabavo opreme, ali pa najem zunanjih izvajalcev, ki lahko zagotovijo kvalitetno analizo merjenj. Druge zadrege vključujejo manjši vzorec testnih uporabnikov, učinek laboratorijskega okolja in pri nekaterih rešitvah tudi držo, ki ni tipična za normalno uporabo [8]. To se lahko pojavlja ob uporabi sledilnih očal ali pa ob zahtevi, da mora testni uporabnik čimbolj mirovati, kar lahko vpliva na rezultate. 2.4 Pristopi k merjenju in analizi Kombinacija sledenja premikanja miške in pogleda bi morala podati zadosten uvid v zanimanje uporabnika za določene elemente vmesnika in sklepanje o njihovih uporabnosti, tudi tam kjer uporabniki med dejanskimi testiranji morda ne ubesedijo (metoda »think aloud«) neposredne uporabniške izkušnje [14]. Analiza merjenj sledenja pogleda, kot uveljavljena znanstvena metoda, mora biti podvržena enakim sistematičnim pristopom, kot ostale raziskave uporabniških vmesnikov [4]. V začetku je potrebno prepoznati raziskovalno vprašanje, kot temeljno izhodišče za priprave in merjenje ter interpretacijo meritev. Primeri raziskovalnih vprašanj: ali uporabnik prepozna namen strani samo s pogledom, na podlagi katerih elementov uporabniki izvedejo akcijo (klik), ali uporabniki z lahkoto prepoznajo ključen element, ali uporabniki lahko hitreje opravijo nalogo z različnimi grafičnimi zasnovami? Za uporabnike ustvarimo testne naloge, ki so povezane z raziskovalnimi vprašanji. Merjenja opravimo na testnih pogledih (ang. wireframe), na interaktivnih prototipih, ali že na delujočem, produkcijskem uporabniškem vmesniku. Po merjenjih smo pri čiščenju (ang. data clean-up) podatkov pozorni na primere, kjer podatki niso popolni ali pa preveč izstopajo, saj lahko ključno vplivajo na možnost pravilne razlage uporabnikovega obnašanja. Pri analizi pogleda uporabnika, kot tudi sledenju miškinega kurzorja, tipično razberemo točke povečane pozornosti (ang. fixations). Umeščamo jih v širša področja interesa (ang. areas of interest), ki se med seboj ne prekrivajo. Izložki analitičnih orodij so največkrat posnetki poti kurzorja ali pogleda (ang. scanpaths) posameznega uporabnika, toplotni zemljevidi pozornosti več uporabnikov (ang. heatmap ali focus map) ali drugi vizualizirani rezultati, ki ponujajo splošen uvid v pomembnost elementov v vmesniku z ozirom na zasnovo scenarija uporabnikove naloge oz. širšega procesa uporabe. Rezultate interpretiramo na podlagi prej postavljenih raziskovalnih vprašanj, ki jih preoblikujemo v hipoteze, obenem pa moramo biti pozorni na tipične napake, povezane z uporabnikovo percepcijo, kot tudi tehničnim okvirom naprav za merjenje in implementacije testnega okolja, tako pri merjenju, kot med samo analizo in interpretacijo podatkov. 292 3 Različna orodja za spremljanje pogleda in kurzorja miške Za spremljanje pogleda je na voljo veliko različnih naprav in programskih rešitev [15]. V skladu s prejšnjimi izhodišči želimo predstaviti rešitev, ki je cenovno dostopna in relativno preprosta za uporabo. Zato smo se osredotočili na naprave do 1000 €. Za spremljanje premikanja kurzorja miške ne potrebujemo namenskih naprav, temveč se to izvaja preko programskih rešitev, ki so večinoma prosto dostopne. 3.1 Strojne rešitve Strojne rešitve v tem cenovnem razredu so Tobii EyeX [16], Tobii 4C [17] in GazePoint GP3 SD 60 Hz [18]. Napravi podjetja Tobii nista primerni za raziskovalne namene, saj ne omogočata shranjevanja podatkov. Za uporabo teh rešitev v raziskovalne namene je potrebno pridobiti licenco Tobii pro, ki omogoča razčlenjanje in shranjevanje podatkov. Licenco je mogoče pridobiti preko zahtevka na uradni spletni strani podjetja Tobii. Za raziskovalne institucije je primerna naprava podjetja Pupil Labs. Pupil headset so očala, ki nemoteno spremljajo pogled uporabnika, tudi, če se med uporabo aplikacije premika. Za komercialne uporabnike je naprava dražja in ne spada več v predviden cenovni razred. Programska oprema naprave je odprtokodna in omogoča prilagajanje glede na potrebe testiranja - kar zahteva določeno znanje programiranja. Trenutno edina še podprta nizkocenovna naprava za spremljanje pogleda je GazePoint GP3. Njena glavna pomanjkljivost je, da podjetje ne nudi programske podpore in jo je potrebno poiskati oz. spisati svoje algoritme za razčlenjevanje podakov. V ta cenovni okvir spada tudi naprava TheEyeTribe [19] (slika 1), ki je trenutno ni več mogoče kupiti, saj je podjetje TheEyeTribe prekinilo razvoj in prodajo te naprave. Zanjo je prav tako potrebno poiskati programsko opremo na spletu oz. napisati lastno rešitev za razčlenjanje podatkov. Slika 1. Naprava za sledenje pogledu TheEyeTribe Pogled lahko spremljamo tudi s pomočjo navadnih spletnih kamer. Ta način je najcenejši izmed vseh naštetih, a obenem tudi najmanj zanesljiv. Primeren je za raziskave, kjer nas ne zanima natančna lokacija pogleda uporabnika. 3.2 Programske rešitve Večina dražjih orodij ima svojo programsko opremo s katero obdeluje podatke. V naši raziskavi smo se osredotočili predvsem na nizkocenovna orodja, ki je nimajo in jo je potrebno poiskati ali razviti. Pri orodjih, je bilo pomembno, da niso plačljiva in tako vsem dostopna. Orodjem, ki podpirajo naprave, kot so TheEyeTribe in Gaze Point GP3 je skupno, da je bil njihov razvoj opuščen in trenutno ne prejemajo posodobitev. Orodja, ki ne omogočajo brskanja v novejših različicah spletnih brskalnikov in testiranja modernih aplikacij, so v večini primerov neuporabna. Eden izmed najboljših odprtokodnih programov za spremljanje pogleda in kurzorja miške je OGAMA (OpenGazeAndMouseAnalyzer) [20]. Program je bil zadnjič posodobljen maja 2015, zato ni primeren za strani, ki vsebujejo moderne elemente in skripte z novejšim JavaScriptom (JS). Glavna prednost tega orodja pred drugimi je, da omogoča razčlenjevanje podatkov prek uporabniškega vmesnika. Program je prirejen posamezni napravi, ki jo povežemo z računalnikom. Prek te povezave se tekom merjenja pošiljamo podatki, ki jih OGAMA prikaže in shrani. Orodje WebGazer.js [21] je JS knjižnica, ki jo lahko vključimo na spletno stran. To nam omogoča tudi oddaljeno testiranje in posledično ni učinka opazovalca. Za delovanje mora uporabnik dovoliti aplikaciji uporabo spletne kamere. Knjižnica za delovanje ne potrebuje strežnika, saj je celoten video obdelan v uporabnikovem brskalniku. Zaradi varnostnih razlogov se na strežnik pošiljajo le podatki o položaju pogleda. S podatki o zenici in očesih se oblikuje regresijski model, ki se med uporabo ves čas posodablja. Knjižnica za svoje izračune ne uporablja aktivnega prilagajanja položaja glave, ki je procesorsko zahtevno, zato lahko v realnem času deluje v spletnem brskalniku. To omogoča uporabniku prosto premikanje glave, model pa se sproti prilagaja glede na položaj zenic in oči ter koordinat zaslona. V študiji, ki so jo izvedli razvijalci knjižnice WebGazer.js so s pomočjo najboljše knjižnice za spremljanje pogleda (clmtrackr) [22] in najboljšega regresijskega modela dosegli povprečno napako 104 slikovnih točk, kar je dovolj natančno za splošno testiranje uporabniške izkušnje. Za dosego take natančnosti knjižnica domneva, da je korelacija med pogledom in položajem kurzorja visoka, saj sledenje pogleda dopolnjuje s položajem miškinega kurzorja. Spremljanje pogleda z uporabo knjižnice WebGazer.js je smiselno v primerih, ko nas zanima le približna lokacija pogleda [23]. 4 Testiranje izbranih rešitev Pri testiranju smo se osredotočili na dve različni orodji, ki predstavljajo različne načine merjenja pogleda in kurzorja. OGAMA je najbolj priročno orodje, saj omogoča rabo različnih naprav za merjenje pogleda. Z OGAMO lahko obdelujemo podatke s TheEyeTribe, Gazpoint GP3, Tobii, hkrati pa nam ponuja tudi možnost sledenja kurzorju miške. Program je preprost za namestitev. Zaradi velikega števila funkcionalnosti ga je potrebno dobro spoznati za optimalno uporabo. Ima vgrajen brskalnik, ki od 2015 ni bil posodobljen. Glavna omejitev pri uporabi orodja je bila, da z njim ni bilo mogoče testirali spletne aplikacije, ki je vključevala moderne elemente. Najlažje je testirati z visoko kakovostnimi prototipi uporabniških vmesnikov. Pri testiranju programa smo uporabili napravo 293 TheEyeTribe, ki smo jo prek USB-3.0 kabla priklopili v računalnik. Pred začetkom vsakega eksperimenta je napravo potrebno kalibrirati. Osnoven način kalibracije je z 9 točkami, če pa želimo večjo natančnost kalibracije lahko izbiramo še med 12 ali 16 točkami. Drugo orodje, ki smo ga testirali, je knjižnica WebGazer.js, ki omogoča spremljanje pogleda prek spletne kamere. WebGazer lahko vključimo v kodo spletne strani. Za začetno nastavitev je potrebno imeti nekaj programerskega predznanja. Kalibracija je 9-točkovna in se izvaja v brskalniku. S kurzorjem miške se postavimo na posamezno točko na zaslonu in petkrat pritisnemo na levi miškin gumb. Isti postopek ponovimo na preostalih točkah. Ko je postopek kalibracije končan se nam kakovost le te izpiše na zaslonu. Med samo uporabo se kalibracija ves čas posodablja in izboljšuje. 5 Zaključek Za iskanje osnovnih vzorcev uporabe uporabniških vmesnikov je merjenje z orodjema EyeTribe in WebGazer.js dovolj učinkovito in cenovno dostopno. Naša ocena je, da je sledenje miškinemu kurzorju v kombinaciji s sledenjem pogleda s pomočjo spletnih kamer dovolj dober način za testiranje uporabniških vmesnikov informacijskih rešitev z namenom postopnih izboljšav v skladu z uporabniško usmerjenim razvojem. Nizkocenovne naprave za spremljanje pogleda so primerne za točno določene primere uporabe in ne omogočajo nekaterih funkcij, ki jih imajo dražja orodja. Ta so bolj robustna in omogočajo boljšo kalibracijo ter kvalitetnejše podatke. V prihodnosti bi radi preverili, ali pri spremljanju miškinega kurzorja in uporabnikovega pogleda v različnih starostnih (ali drugih demografskih in družbenih) skupinah, nastajajo značilne razlike. Pred tem moramo ugotoviti ali predstavljeni pristopi omogočajo dovolj kvalitetno testiranje ali bi za podrobne študije o pogledu uporabnikov še vedno potrebovali dražjo namensko opremo, ki je tudi programsko podprta. Literatura [1] ISO 9241-11:2018 - Ergonomics of human-system interaction -- Part 11: Usability: Definitions and concepts [2] T. Tullis, B. Albert: Measuring the User Experience: Collecting, Analyzing and Presenting Usability Metrics, 2016, Morgan Kaufmann, Amsterdam [3] K. Finstad: The Usability Metric for User Experience, Interacting with Computers, vol. 22, no. 5, 2010, str. 323-327., doi:10.1016/j.intcom.2010.04.004. [4] A. Bojko: Eye Tracking the User Experience a Practical Guide to Research. Rosenfeld Media, 2013. [5] T. Čegovnik, J. Sodnik: Free-hand human-machine interaction in vehicles, 6th International Conference on Information Society and Technology, 2016 [6] T. Čegovnik, K. Stojmenova, G. Jakus, J. Sodnik: An analysis of the suitability of a low-cost eye tracker for assessing the cognitive load of drivers. Appl. Ergon. 2018, 68, 1-11. [7] U. Sedlar, J. Bester, A. Kos: Tracking Mouse Movements for Monitoring Users Interaction with Websites: Implementation and Applications, Electrotehnical review 74, str. 31-36, 2007, Ljubljana, Slovenija [8] Eye tracking vs. mouse tracking analytics, https://www.clicktale.com/resources/blog/eye-tracking-vs-mouse-tracking-analytics/ [9] M. C. Chen, J. R. Anderson, M. H. Sohn: What can a mouse cursor tell us more?: correlation of eye/mouse movements on web browsing, CHI '01 Extended Abstracts on Human Factors in Computing Systems, str. 281-282, 2001, Carnegie Mellon University, Pittsburgh, Pennsylvania, ZDA [10] V. Navalpakkam., L. Jentzsch, R. Sayres, S. Ravi, A. Ahmed, A. Smola. Measurement and modeling of eye-mouse behavior in the presence of nonlinear page layouts. Proceedings of the 22nd International Conference on World Wide Web - WWW 13. 2013. doi:10.1145/2488388.2488471 [11] S. Manson, L. Kne, K. R. Dyke, J. Shannon, S. Eria: Using Eye-tracking and Mouse Metrics to Test Usability of Web Mapping Navigation, Cartography and Geographic Information Science 39:1, 2013, str. 48-60, DOI: 10.1559/1523040639148 [12] Mouse Tracking vs. Eye Tracking, http://www.picnet.com.au/blogs/guido/2010/02/03/mouse -tracking-vs-eye-tracking/ [13] L. Cooke, Is the Mouse a "Poor Man's Eye Tracker"?, Usability and Information Design, 2006. str. 252-255 [14] A. Olsen, L. Smolentzov, T. Strandvall: Comparing different eye tracking cues when using theretrospective think aloud method in usability testing, 2010 [15] G. Funke, E. Greenlee, M. Carter, A. Dukes, R. Brown, and L. Menke, "Which Eye Tracker Is Right for Your Research? Performance Evaluation of Several Cost Variant Eye Trackers," Proceedings of the Human Factors and Ergonomics Society Annual Meeting, vol. 60, no. 1, pp. 1240-1244, 2016. [16] Specifications for EyeX, https://help.tobii.com/hc/en-us/articles/212818309-Specifications-for-EyeX [17] Eye Tracker 4C, https://help.tobii.com/hc/en-us/categories/201596489-Eye-Tracker-4C [18] GP3 Eye Tracker, https://www.gazept.com/product/gazepoint-gp3-eye-tracker/ [19] The Eye Tribe, http ://theeyetribe. com/theeyetribe .com/about/index. html [20] OGAMA - open gaze and mouse analyzer, http://www.ogama.net/ [21] WebGazer.js, https://webgazer.cs.brown.edu/ [22] clmtrackr: Javascript library for precise tracking of facial features via Constrained Local Models. https://github.com/auduno/clmtrackr [23] A. Papoutsaki, "Scalable Webcam Eye Tracking by Learning from User Interactions," Proceedings of the 33rd Annual ACM Conference Extended Abstracts on Human Factors in Computing Systems - CHI EA 15, 2015. 294