Elektrotehniški vestnik 80(4): 189-194, 2013 Izvirni znanstveni članek Aktivno učenje in vzajemnost med učiteljem in učencem MatjaZ Majnik, Danijel Skočaj Univerza v Ljubljani, Fakulteta za računalništvo in informatiko, Tržaška cesta 25, 1000 Ljubljana, Slovenija E-pošta: {matjaz.majnik,danijel.skocaj}@fri.uni-lj.si Povzetek. Osnovni cilj aktivnega učenja je doseči želeno uspešnost danega učnega algoritma s čim manjšim številom ucnih primerov. Vzrok te težnje je v dejstvu, da je označevanje ucnih primerov običajno drago zaradi količine časa in umskega napora človeškega označevalca. Vendar pa ima aktivno učenje pomanjkljivosti, kot so neupoštevanje stopnje učiteljevega poznavanja problema in pomanjkanje mehanizma za zagotavljanje razumljivosti aktivno izbranih učnih primerov. V tem članku predlagamo nov pristop k aktivnemu učenju, t. i. "vzajemno aktivno učenje", ki umetnemu inteligentnemu učencu pomaga, da svojemu učitelju zastavi kar se da jasna in razumljiva vprašanja. Tovrstno učenje se izkaze za bolj zanesljivo in uspešno v primerjavi z osnovnim aktivnim učšenjem. Ključne besede: aktivno učenje, socialno strojno učenje, učenje konceptualnega znanja, interakcija med čšlovekom in račšunalnikom, avtonomni razvoj Active learning and teacher-learner mutuality In active learning, the basic objective is to reach a desired performance of some learning algorithm with as little training instances as possible. The reason behind is that labeling of the training instances is typically expensive with respect to the amount of time and intellectual effort of a human annotator. However, active learning has shortcomings, for example ignoring the extent of the teacher's familiarity with the problem and absence of a mechanism for ensuring the understandability of the actively selected training instances. In this paper we propose a new approach to active learning, called "mutual active learning". It helps the artificial intelligent learner to pose questions to his human teacher, which are as clear and as understandable as possible. Such learning appears to be more reliable and successful than the basic active learning. 1 Uvod Učenje je eden temeljnih spoznavnih procesov, tako pri ljudeh kot tudi pri strojih, v katere bi radi vgradili osnovne spoznavne zmoznosti. V umetne sisteme, ki naj bi s človekom sobivali in z njim sodelovali, je namreč tako rekoč nemogoče vnaprej vgraditi celotno znanje, ki ga potrebujejo pri svojem delovanju. Veliko bolj primerno je to znanje postopoma usvajati in ga nadgrajevati v procesu učenja. Eden najbolj naravnih načinov prenosa znanja, tako s človeka na človeka kot tudi s človeka na inteligentni stroj, je interaktivno učenje v dialogu učenca z učiteljem. Pri klasičnem pristopu učenje vodi učitelj. Pri tem t. i. pasivnem učenju učitelj izbere ustrezne učne primere, s katerimi učencu ponazori in ga nauči določenih konceptov (kot je prikazano na sliki 1(a)). Poznamo tudi primere aktivnega učenja, kjer proces učenja vodi učenec. Učenec ima namreč neposreden vpogled v svoje trenutno znanje, zato lahko očeni, kje je le-to najšibkejše, in zahteva takšne učne primere, ki bi učinkoviteje pomagali zapolniti luknje v njegovem znanju (slika 1(b)). (a) Pasivno učenje (b) Aktivno učenje (c) Vzajemno aktivno učenje Slika 1: Različne vrste učenja Temeljni cilj aktivnega učenja je torej pohitritev učnega procesa. V nadaljevanju se bomo omejili na problem učenja konceptualnega znanja oz. učenja ka-tegorizačije primerov v diskretne razrede, ki sovpadajo s čšlovesškim pojmovanjem teh kategorij (npr. kategorizacija predmetov, razpoznavanje barv, razpoznavanje črk in drugih simbolov ipd.). V tem primeru učšeneč sodeluje pri aktivnem učenju tako, da izbira učne primere, ki so predani učitelju v označevanje (t. j. v dodeljevanje oznak razredov) in nato uporabljeni za učenje. Učenec navadno oceni informativnost še neoznačenih učnih primerov, torej oceni, koliko nove informacije mu bo učni primer prinesel oz. koliko bo lahko na podlagi njega izboljšal svoje znanje. Obstaja več različnih strategij za ocenjevanje informativnosti (t. i. strategij poizvedovanja, angl. query strategies) [8], [5]. V našem predhodnem delu [9], [4] smo proučevali in vrednotili razne pristope, ki delujejo na podlagi teh strategij poizvedovanja in se uporabljajo za končni izbor najprimernejšega učnega primera, ki naj bi se ga oznacšilo v vsakem koraku aktivnega učenja. Pri svojem delu predpostavljamo sočialno interaktiven sčenarij, kjer človeški učitelj interaktivno komuničira z inteligentnim sistemom. V tem sčenariju je motivačija za aktivno učenje v zmanjševanju časa in napora, ki ga učitelj vlozi v učenje, in sičer primarno z zmanjšanjem števila učnih primerov, ki morajo biti označeni. Treba pa seje zavedati, da se tezavnost klasifikačije (t. j. prirejanja primernih oznak razredov) med primeri razlikuje. Na splošno velja, da so dvoumni primeri v blizini mej med razredi (ki pa so pogosto najbolj informativni) lahko za učitelja tezavnejši, saj lahko njihovo označevanje zahteva več napora in časa. Pri aktivnem učenju, kjer učšeneč sam generira učšne primere, so lahko posamezni primeri tudi popolnoma nerazumljivi ali čelo nesmiselni v kontekstu danega učšnega problema. Rečimo, da pri učenju dovolimo predpostavko iz realnega sveta, in sičer, da človeški učitelji niso vsevedi in se lahko motijo. Tedaj spoznamo, da izbira primerov ne bi smela temeljiti le na informativnosti, temveč tudi na razumljivosti, torej na tem, kako dobro učitelj razume ponujene mu učne primere. V ta namen predlagamo nov pristop k aktivnemu učenju, poimenovali smo ga vzajemno aktivno učenje, ki naj bi tezil k temu, da bi bili informativni primeri, izbrani s pomočjo aktivnega učenja, obenem tudi razumljivi človeškemu učitelju. Končept tovrstnega učenja na področju umetne inteligenče, po našem najboljšem vedenju, še ni bil raziskan. Izraz "vzajemno" nakazuje, da ima pri predlaganem načinu učenja tudi učitelj vpliv na izbiro učnih primerov, ki mu jih v označevanje pošilja učeneč, kot je ponazorjeno na sliki 1(č). V tem članku je predstavljena idejna zasnova novega pristopa s potrditvijo njene uporabnosti. Izvedeno eksperimentalno vrednotenje je na primeru učenja končepta barv potrdilo, daje takšno učenje zanesljivejše in uspešnejše kot osnovno aktivno učenje. Zgradba članka je naslednja. V poglavju 2 najprej povzamemo sorodno delo. V poglavju 3 nato predstavimo predlagani pristop za vzajemno aktivno učenje. Sledi poglavje 4, v katerem opisšemo eksperimentalno vrednotenje, članek pa s končnimi ugotovitvami sklenemo v poglavju 5. 2 Sorodno delo Eno izmed področij, ki bi z vzajemnim aktivnim učenjem lahko veliko pridobila, je robotika osebnih pomočnikov (angl. sočially assistive robotičs). Glavni čilj robotike osebnih pomočnikov je gradnja robotov, ki so skozi sočialno interakčijo sposobni pomagati človeškim uporabnikom in tako prispevati h kakovosti njihovega življenja [10]. Tovrstni roboti naj bi bili zmožni naravne komunikacije in socialne interakcije, še zlasti pa bi prišli prav populaciji starostnikov in ljudem s kognitivnimi, razvojnimi in socialnimi hibami. Pri takšnih namenih uporabe je izjemno pomembna razumljivost robotovih vprašanj, zagotavljanju katere pa je, med drugim, namenjeno vzajemno aktivno ucenje. V našem scenariju interaktivnega ucenja komunikacija poteka v obliki izmenjevanja vprašanj in odgovorov na ta vprašanja. Da bi ucitelj lahko ustrezno odgovoril na vprašanje, mora vprašanje razumeti. Lastnosti dobrega vprašanja so s stališca strojnega in tudi cloveškega ucenja proucene v [1]. Avtorji pri tem identificirajo tri razlicne vrste poizvedb (oz. vprašanj) in jih ovrednotijo v cloveško-robotskem ucnem eksperimentu. Rezultati nakazujejo, da ljudje poizvedbe o znacilkah (t. j., ali je znacšilka pomembna za koncept, ki se ga ucšimo, angl. feature queries) dojemajo kot najbolj inteligentne, medtem ko je na splošno ljudem najlazje odgovarjati na poizvedbe o oznakah razredov (t. j., kateremu razredu pripada posamezen neoznaceni ucni primer, angl. label queries). Poizvedbe o oznakah razredov so tudi tip poizvedb, ki jih uporabljamo v našem clanku, po drugi strani pa [1] ne vsebuje izrecne obravnave vzajemnosti, t. j. uciteljevega vpliva na izbiro ucencevih vprašanj. Ena glavnih predpostavk v našem clanku, predpostavka o šumnih cloveških uciteljih, je bila v [8] naslovljena kot eden izmed izzivov pri prakticšni uporabi aktivnega ucenja. Problem je bil nadalje proucen v [2], kjer avtorji obravnavajo obnašanje cloveških strokovnjakov pri dogodkih v realnem svetu. Avtorji v svoji študiji predpostavljajo, da naj bi tedaj, ko je strokovnjak zelo preprican o oznacevanih ucnih primerih, tudi verjetnost pravilnosti teh oznak bila visoka. Predstavljena je analiza o tem, v katerih primerih in kako cloveški strokovnjaki posredujejo nepravilne odgovore. Na podlagi rezultatov analize je predlagana nova metoda za iskanje ravnovesja med izbiro primerov, ki so zelo informativni (vendar pa bo strokovnjak nekatere izmed njih verjetno napacno oznacšil), in primerov z visoko verjetnostjo dodelitve pravilne oznake (ki pa imajo majhno informativno vrednost). To iskanje ravnovesja, ceprav naslovljeno z drugega zornega kota, predstavlja tudi osnovno idejo našega clanka. Omenjeni problem je poznan tudi pod imenom kompromis med raziskovanjem in uporabo (angl. exploration/exploitation dilemma) in je nadalje obravnavan v [6]. Obicajno pri ucenju umetnih inteligentnih sistemov sodelujejo ucitelji, ki se na tematiko ucenja spoznajo. Recemo lahko, da je ucitelj v tem primeru strokovnjak za dano tematiko. Predlagano vzajemno aktivno ucenje naj bi bilo pri ucenju s strokovnjaki uspešnejše od osnovnega aktivnega ucenja. Prednosti vzajemnega aktivnega ucenja pa naj bi se v še večji meri kot pri strokovnjakih, ki (bolj ali manj dobro) razumejo ucenceva vprašanja in (praviloma) sorazmerno suvereno (pravilno, natancšno) odgovarjajo na vprašanja, pokazale pri učiteljih - nestrokovnjakih. Enega izmed scenarijev, kjer robota poučujejo nestrokovnjaki, proučujejo avtorji v [7]. Obravnavani so štirje različni tipi dodatne informacije o robotovem stanju, ki naj bi bila v pomoč učitelju - nestrokovnjaku. Velika razlika v primerjavi z našim pristopom pa je v tem, da mi predpostavljamo, da ima učitelj dejavno vlogo pri sporočanju, katere informačije so zanj osebno bolj razumljive (učeneč se tako lahko prilagodi znanju posameznega učitelja). 3 Vzajemno aktivno ucenje Vodilo pri razvoju predlaganega pristopa so ugotovljene pomanjkljivosti osnovnega aktivnega učenja. V razdelku 3.1 primerjamo lastnosti osnovnega aktivnega učenja in vzajemnega aktivnega učenja s stališča splošne mo-tivačije, želja človeškega učitelja in nalog umetnega inteligentnega učenča. V 3.2 nato orišemo predlagani pristop k vključevanju "vzajemnosti" v aktivno učenje. Postavljene hipoteze so navedene v razdelku 3.3. 3.1 Osnovno in vzajemno aktivno ucenje 1) Aktivno učenje (AU): a) splošna motivačija: Prenos znanja z učitelja na učenča s pomočjo najmanjšega mogočega sštevila učšnih primerov. b) človeški učitelj: "Učeneč, prosim, uči se kar se da hitro, moj čas in napor sta dragočena." č) umetni inteligentni učšeneč: "Učšitelj, prosim, podaj mi primere, ki mi bodo omogočšili, da se čim hitreje naučim." 2) Vzajemno aktivno učenje (VAU): a) splošna motivačija: Kot v AU + s čim manj učiteljevega umskega napora. b) človeški učitelj: Kot v AU + "Učeneč, prosim, zastavljaj vprašanja, ki so čim manj ne-prijetna/tezavna (da bom tako lahko na vsako vprašanje odgovoril čim bolj zanesljivo in čim hitreje)." č) umetni inteligentni učeneč: Kot v AU. 3.2 Upoštevanje učiteljevega odziva V tem delu smo učiteljev odziv upoštevali na naslednji načšin. Namesto enega samega učšeneč v vsaki posamezni interakčiji z učiteljem le-temu v označevanje ponudi mnozšičo neoznačšenih učšnih primerov. Učšeneč vedno ponudi mnozičo primerov, ki so zanj posamično čim bolj koristni. To mnozšičo učšeneč sestavi tako, da očeni informativnost vseh razpolozšljivih primerov in izbere tiste z najvišjo vrednostjo informativnosti. Učitelj nato izmed ponujenih izbere in označši tisti primer, ki je zanj najbolj razumljiv. Ta (sedaj ze označeni) primer se zatem uporabi za učenje v dani interakčiji. Pri sami implementačiji smo uporabili usmerjeno vzorčenje negotovosti (angl. direčted unčertainty sampling), ki temelji na izračunu aposteriorne verjetnosti preko vseh mogočših razredov. To vzorčšenje je izvedeno v metodi tipa Monte Carlo, ki je bila opisana v [4]. Z vzorčšenjem prostora značšilk se ustvarjajo učšni primeri, ki so nato ponujeni učitelju v označevanje. Pročes ustvarjanja učšnih primerov je popolnoma introspektiven (učšeneč torej analizira svoje modele in se ne skličuje na učšne primere iz realnega sveta). Večš informačij o introspekčiji lahko prav tako najdete v [4]. 3.3 Naše hipoteze Ker pri vzajemnem aktivnem učenju učeneč v vsaki interakčiji učitelju ponudi le primere, ki so zanj pri-blizšno enako koristni, v splosšnem ne bi smela obstajati nevarnost, da bi predlagana metoda imela kakrsšenkoli negativen vpliv na končšno stopnjo uspesšnosti (merjeno npr. v obliki klasifikačijske točnosti). Naše hipoteze so tako naslednje: 1) Stopnja uspesšnosti naj bi se povečšala, in sičer zato, ker so učni primeri, ki so učitelju predstavljeni, le-temu verjetno bolj razumljivi. Učšitelj jih torej lahko označi z večjo zanesljivostjo. 2) Skupni čas učenja naj bi se skrajšal, saj naj bi za učitelja označevanje posameznih učnih primerov, ki jih le-ta bolje razume (je z njimi bolj seznanjen ali pa so bolj nedvoumni), bilo časovno manj zahtevno. Ali se čas učenja tudi dejansko skrajša pa naj bi bilo odvisno od domene, natančšneje, kako pomembno je za čšlovesškega označševalča v dani domeni, da se izogne morebitnim napačšnim klasifikačijam. Predpostavljamo, da naj bi se s povečevanjem pomembnosti čas učenja skrajševal v primerjavi s časom učenja pri osnovnem aktivnem učenju. 3) Umska obremenitev človeškega učitelja naj bi se zmanjsšala, in sičer zaradi bolj razumljivih učšnih primerov. 4 Eksperimentalno vrednotenje V razdelku 4.1 najprej opišemo preizkusno domeno, predstavimo primerjane načine učenja ter navedemo in opišemo mnoziče učnih primerov, ki so jih učitelji označevali. V razdelku 4.2 sledi časovni potek poizkusa. Prikazan je uporabnisški vmesnik, predstavljena pa so tudi navodila, ki so jih pred začšetkom poizkusa dobili učitelji. Mere, ki smo jih uporabili za subjektivno in objektivno vrednotenje rezultatov, so podane v razdelku 4.3, rezultati poizkusa pa so na voljo v razdelku 4.4. 4.1 Zasnova poizkusa Hipoteze so bile preizkušene na problemu razpoznavanja barvnih vzorčev, pridobljenih iz prostora HSL. Prostor HSL je pri tem trirazsezni prostor, kjer značilke H (barvni odtenek, angl. hue), S (nasičenost, angl. saturation) in L (svetlost, angl. lightness) predstavljajo po eno izmed razsezšnosti. Naloga je bila dodeliti predstavljenim vzorčem oznako ene izmed naslednjih osmih barv (razredov): rdeče, rumene, modre, oranžne, zelene, rožnate, črne in bele. Ta domena ima naslednji dve lastnosti, zaradi katerih ustreza našemu namenu: • Pojmovanje barv je ze po naravi, vsaj do neke mere, subjektivno. Strogo določene meje med različnimi barvami ne obstajajo. • Oznake nekaterih tipičnih barv manjkajo (npr. rjave, vijoličaste in sive). Učitelji se morajo odločšiti, katera od oznak, ki so na voljo, najbolje opisuje dani barvni vzoreč, lahko pa tudi izberejo moznost "Nobena od razpolozljivih". Pri vrednotenju smo uporabili štiri načine učenja, med njimi dva pomozna (naključni in večnaključni). 1) vzajemni - Vzajemno aktivno učenje. Pri vsaki interakčiji je več barvnih vzorčev pridobljenih s postopkom, ki je opisan v razdelku 3.2. Ti barvni vzorči so nato ponujeni v označevanje. 2) osnovni - Osnovno aktivno učenje. Pri vsaki interakčiji je pridobljen samo en barvni vzoreč (s pomočjo enakega postopka kot pri vzajemnem načšinu). Ta barvni vzoreč je nato ponujen v označševanje. 3) naključni - Naključno učenje. Pri vsaki interakčiji je barvni vzoreč ustvarjen naključno. Ta barvni vzoreč je nato ponujen v označevanje. 4) večnaključni - Večnaključno učenje. Pri vsaki interakčiji je več barvnih vzorčev ustvarjenih naključno. Vsi ti barvni vzorči so nato ponujeni v označševanje. Pri poizkusu je sodelovalo osem učiteljev, pet jih je pripadalo starostni skupini 20-30 let, preostali trije pa starostni skupini 30-40 let. Tri osebe so bile zenskega spola, pet moškega. Vsak izmed učiteljev je skupaj dodelil oznake razredov 840 barvnim vzorčem, ki so pripadali naslednjim mnozičam: • začetna učna mnoziča (L1) z 80 barvnimi vzorči (uravnotezšena porazdelitev po razredih s po 10 barvnimi vzorči na razred), • interaktivne učne mnoziče (L2) s po 50 barvnimi vzorči za vsako izmed 3 ponovitev pri vsakem izmed 4 načinov učenja, skupaj torej s 3 x 4 x 50 barvnimi vzorči (v splošnem neuravnotezena porazdelitev po razredih), • in preizkusna mnoziča (T) s 160 barvnimi vzorči (uravnotezšena porazdelitev po razredih s po 20 barvnimi vzorči na razred). Za zanesljivejšo primerjavo rezultatov so bili barvni vzorči začetne učne mnoziče in preizkusne mnoziče za vse učitelje enaki. Vsi učitelji so torej prejeli enake barvne vzorče, oznake razredov pa je tem barvnim vzorčem individualno priredil vsak učitelj posebej. Po drugi strani pa je bila izdelana unikatna interaktivna učna mnoziča za vsako kombinačijo (učitelj, ponovitev, način učenja). Skupno število takšnih interaktivnih učnih mnozič je torej 8 x 3 x 4 = 96. 4.2 Izvedba poizkusa Poizkus je bil izveden na zgoraj opisanem interaktivnem učnem sistemu, ki je tekel na osebnem računalniku. Kot temeljni učni algoritem smo uporabili odKDE [3]. Učni sistem je omogočal interaktivno komunikačijo in človeški učitelji so odgovarjali na vprašanja, ki jih je sistem zastavljal. Učiteljem so bila podana naslednja navodila: • Načina naključni in osnovni (tip A): Barvnemu vzorču dodelite oznako ene izmed 8 razpolozšljivih barv. Ce se ne morete odločiti za nobeno od teh barv, izberite moznost "Nobena od teh". • Načina večnaključni in vzajemni (tip B): Izberite enega izmed 15 ponujenih vzorčev, za katerega se lahko odločite, katere barve je. Izbranemu barvnemu vzorču dodelite oznako ene izmed 8 razpolozljivih barv. Ce ne morete nobene izmed oznak dodeliti nobenemu izmed 15 vzorčev, izberite mozšnost "Nobena od teh". Poizkusite naučšiti sistem razlikovati med končepti vseh 8 barv (torej, če je mogoče, tezite k izbiri vzorčev različnih barv). What color is the rectangle beneath? Slika 2: Uporabniški vmesnik pri tipu A Najprej je vsak učitelj označil 240 barvnih vzorčev; 80 jih je bilo namenjenih začetni učni mnoziči (L 1), 160 pa uporabljenih za preizkusno mnozičo (T). Nato se je vsak učšitelj soočšil z vsakim od sštirih načšinov učenja (predstavljenih v razdelku 4.1) v treh zaporednih ponovitvah. Načini učenja določajo, kako je (so) v vsaki interakčiji ustvarjen (-i) vektor (-ji) značilk, ki je (so) nato učšitelju prikazan (-i) v obliki barvnega (-ih) vzorča (-ev). Učitelj je torej označil 12 unikatnih interaktivnih učnih mnozič, kjer je vsaka mnoziča ustrezala enemu izmed 12 parov (ponovitev, način učenja). Učitelji niso bili seznanjeni z nikakršnimi dodatnimi informačijami o predpostavljeni kakovosti uporabljenih načinov učenja. Nazadnje je vsak učšitelj odgovoril na sštiri vprasšanja o svoji interakčiji s sistemom. Uporabniški vmesnik, ki je bil učiteljem na voljo pri načšinih tipa A oz. B, je prikazan na slikah 2 in 3. 4.3 Objektivne in subjektivne mere vrednotenja Objektivno izmerjeni količšini pri eksperimentalnem vrednotenju (pri stalnem številu učnih primerov - barvnih vzorčev) sta bili čas učenja in uspešnost učenja. Select one of the rectangles and answer what color it is. labeled remaining Slika 3: Uporabniški vmesnik pri tipu B Cas učenja se je meril od trenutka, ko je bilo učitelju zastavljeno prvo vprašanje, do trenutka, ko je učenec prejel zadnji odgovor. Stopnja uspešnosti pa je bila ugotovljena z izračunom klasifikacijske točnosti. Subjektivno vrednotenje umske obremenitve človeških učiteljev je bilo izvedeno na podlagi naslednjega vprašalnika, ki so ga učitelji dobili, ko je bil učni pročes končan. V osnovi ste se srečali z dvema tipoma načinov za označevanje barvnih vzorcev: • tip A: brez možnosti izbire (vedno na voljo le en vzorec), • tip B: z moččnostjo izbire (vedno na voljo 15 vzorcev). Prosimo, odgovorite z A ali B na naslednja štiri vprašanja. Svoje odločitve na kratko ob-razlozčite. 1) Kateri od obeh tipov vam je omogočil hitejsče odlocčanje o tem, katere barve je (izbrani) vzorec? Zakaj? 2) Pri katerem izmed obeh tipov je bilo po vašem mnenju ucenje uspešnejče? Zakaj? 3) Kateri izmed obeh tipov se vam je zdel umsko manj zahteven? Zakaj? 4) Pri katerem izmed obeh tipov ste ste počutili (bolj) negotovo? Zakaj? 4.4 Rezultati in razprava Na sliki 4 vidimo krivulje srednje klasifikačijske točšnosti, ki so bile izračšunane iz posameznih rezultatov vseh 8 učiteljev in vseh 3 ponovitev, ki jih je opravil vsak izmed učiteljev. Najprej lahko opazimo, da je bil pročes interaktivnega učenja v vseh primerih uspešen. Klasifi-kačijska točnost narašča s številom učnih primerov; ta rast je najbolj izrazita na začetku učnega pročesa, ko se sistem uči novih končeptov, vendar v glavnem ostaja pozitivna tudi v kasnejših obdobjih učenja, ko se naučeni modeli izpopolnjujejo na osnovi novih učnih primerov. V prvih fazah učnega pročesa osnovno aktivno učenje ni najbolj uspesšno, ker se modeli, na podlagi katerih učeneč izbira učne primere, šele gradijo. Ko pa so modeli dovolj zanesljivi, se pročes učenja zelo pospeši, tako daje ta način po pričakovanjih boljši kot naključni način, pri katerem se učni primeri izbirajo naključno. Zaradi vlozenega človeškega napora je tudi vecnakljucni način boljši od naključnega; v tem primeru namreč učenje z izbiranjem med ponujenimi naključno izbranimi vzorči vsaj deloma usmerja učitelj. Za najboljšega med vsemi pa se je izkazal vzajemni aktivni način. Ta način na konču učenja doseze največjo klasifikačijsko točnost, poleg tega pa tudi med samim učenjem visoko klasifikačijsko točnost doseze prej kot drug načini učenja. Ti rezultati torej potrjujejo nasšo prvo hipotezo, ki je predvidevala, da se bo zaradi večje razumljivosti učnih primerov klasifikačijska točnost povečala. Število učnih primerov Slika 4: Srednja klasifikačijska točnost Tabela 1 prikazuje srednji čas označevanja enega barvnega vzorča, povprečen preko vseh učiteljev in vseh ponovitev. Opazimo lahko, da je v nasprotju z našo drugo hipotezo srednji kosmati čas označevanja posameznega barvnega vzorča za priblizno 42 % višji pri vzajemnem (4.4 s) kot pri osnovnem (3.1 s) aktivnem načinu. Kosmati čas pri osnovnem načinu sestoji iz časa odločanja o oznaki in časa klika. Po drugi strani pa pri vzajemnem načinu kosmati čas vključuje čas odločanja o izbiri barvnega vzorča, čas klika, čas odločanja o oznaki in še čas drugega klika. Verjamemo pa, da bi v domenah, kjer so poslediče dodelitve napačne oznake učnemu primeru lahko resne, npr. v varnostno-občutjivih in me-dičinskih aplikačijah, kosmati čas praviloma moral biti večji pri osnovnem kot pri vzajemnem načinu. Po našem mnenju bi se tezavnost označevanja tipičnega aktivno pridobljenega primera odrazila v času, ki bi presegal vsoto časa odločanja o izbiri primera in časa drugega klika. Kakorkoli ze, na osnovi rezultatov poizkusa, druge hipoteze, ki je predvidevala skrajšanje skupnega časa učenja, ne moremo potrditi. Po drugi strani se je treba zavedati, da ima povečanje klasifikacijske točnosti za posledico skrajšanje časa učenja, ki je potreben za dosego neke določene klasifikacijske točnosti. Na primer, za dosego 92-odstotne klasifikacijske točnosti mora učitelj označiti 119 barvnih vzorcev v osnovnem načinu aktivnega učenja in le 97 barvnih vzorcev v vzajemni različici aktivnega učenja. Tabela 1: Srednji čas označevanja enega barvnega vzorca naključni več-naključni osnovni vzajemni 3.2 s 4.7 s 3.1 s 4.4 s Rezultati subjektivnega vrednotenja so predstavljeni v tabeli 2. Opazimo lahko, daje velika večina učiteljev pri vprašanjih 1, 2 in 4 bolj naklonjena tipu B. Tip B ima pred tipom A prednost tudi pri vprašanju 3, se pa pri tem vprašanju mnenja učiteljev najbolj razlikujejo: medtem ko se pri tipu A ni bilo treba odločati o tem, kateri barvni vzorec izbrati za označevanje, pa je bilo pri tipu B preprostejše samo označevanje izbranega barvnega vzorca. Iz rezultatov torej lahko sklepamo, da se je umska obremenitev človeškega učitelja pri vzajemnem aktivnem učenju zmanjšala, kar potrjuje našo tretjo hipotezo. Tabela 2: Subjektivno vrednotenje vprašanje odgovor odgovor drugo A B 1 0 6 2 2 1 5 2 3 3 4 1 4 7 1 0 5 Sklep V tem članku smo predlagali nov koncept za izboljšanje uspešnosti in učinkovitosti aktivnega učenja, ki smo ga poimenovali vzajemno aktivno ucenje. Glavna lastnost predlaganega pristopa je, da pri izbiri učšnih primerov v procesu aktivnega učenja sodelujeta tako učenec kot učitelj. Pri tej izbiri se tako poleg ocenjevanja infor-mativnosti primerov omogoči tudi upoštevanje njihove razumljivosti. Predstavili smo lastnosti predlaganega pristopa in tudi njegove pričakovane prednosti. Empirično vrednotenje pristopa na primeru učenja koncepta barv je potrdilo dve nasši hipotezi. Ker je osnovna ideja vzajemnega aktivnega učenja neodvisna od domene, je predlagani pristop primeren tudi za uporabo na drugih področjih. Pri bodočem delu bomo tako med drugim raziskali obnasšanje in uspesšnost vzajemnega aktivnega učenja na drugih domenah (npr. na problemu razpoznavanja ročno pisanih števk). Vzajemno aktivno učenje se priblizuje predpostavkam realnega sveta in naj bi pomagalo zmanjšati količino časa in napora, ki ga mora učitelj vloziti v proces učenja umetnega inteligentnega sistema. Pri praktičšni uporabi takšnih sistemov bi bila predlagana izboljšava zelo dobrodošla. Zavoljo hitrejšega in človeku bolj prijaznega učenja lahko torej pričakujemo, da bodo tovrstni pristopi igrali pomembno vlogo pri načrtovanju interaktivnih sočialnih aplikačij. Zahvala Zahvaljujemo se vsem, ki so v vlogi učitelja sodelovali pri preizkušanju predlagane vzajemne metode in tako omogočili njeno objektivno in subjektivno vrednotenje. Literatura [1] M. Cakmak and A. L. Thomaz. Designing robot learners that ask good questions. In Proceedings of the 7th ACM/IEEE International conference on human-robot interaction(HRI), pages 17-24, 2012. [2] J. Du and C. X. Ling. Ačtive learning with human-like noisy oračle. In Proceedings of the 10th IEEE International conference on data mining (ICDM), pages 797-802, 2010. [3] M. Kristan and A. Leonardis. Online disčriminative kernel density estimator with Gaussian kernels. IEEE Transactions on Systems, Man, and Cybernetics Part B: Cybernetics, In press (2013). [4] M. Majnik, M. Kristan, and D. Skočaj. Knowledge gap detečtion for interačtive learning of čategoričal knowledge. In Proceedings of the 18th Computer Vision Winter Workshop, pages 94-101, 2013. [5] Fredrik Olsson. A literature survey of ačtive mačhine learning in the čontext of natural language pročessing. Tečhničal report SICS T2009:06, Swedish Institute of Computer Sčienče, 2009. [6] T. Osugi, D. Kun, and S. Sčott. Balančing exploration and exploitation: A new algorithm for ačtive mačhine learning. In Proceedings of the 5th IEEE International conference on data mining (ICDM), pages 330-337, 2005. [7] S. Rosenthal, M. Veloso, and A. K. Dey. Ačquiring aččurate human responses to robots' questions. International journal of social robotics, 4(2):117-129, 2012. [8] Burr Settles. Ačtive learning literature survey. Tečhničal report 1648, University of Wisčonsin-Madison, 2010. [9] D. Skočaj, M. Majnik, M. Kristan, and A. Leonardis. Comparing different learning approačhes in čategoričal knowledge ačquisition. In Proceedings of the 17th Computer Vision Winter Workshop, pages 65-72, 2012. [10] Adriana Tapus, Maja J. Matarič, and Brian Sčassellati. The grand čhallenges in sočially assistive robotičs. IEEE Robotics and Automation Magazine, 14(1):35-42, 2007. Matjaž Majnik je diplomiral leta 2011 na Fakulteti za računalništvo in informatiko (FRI) Univerze v Ljubljani, izobrazevanje pa tam nadaljuje tudi v okviru doktorskega študija. Na FRI se je konec leta 2011 zaposlil kot raziskovaleč in asistent, njegovi raziskovalni interesi pa so aktivno strojno učenje ter interaktivni prenos znanja s človeka na umetne inteligentne sisteme. Danijel Skočaj je docent na Fakulteti za računalništvo in informatiko Univerze v Ljubljani, kjer je vodja Laboratorija za umetne vizualne spoznavne sisteme. Njegova raziskovalna dejavnost zajema področšja umetnih spoznavnih sistemov in inteligentne robotike, račšunalnisškega in umetnega spoznavnega vida ter interaktivnega socialnega in strojnega učšenja.