Elektrotehniški vestnik 79(1-2): 1-6, 2012 Existing separate English edition Robustno razpoznavanje 3D slik obrazov Janez KriZaj, Vitomir Štruc, Simon Dobrišek Univerza v Ljubljani, Fakulteta za elektrotehniko, Tržaška 25, 1000 Ljubljana, Slovenija E-pošta: janez.krizaj@fe.uni-lj.si Povzetek. Pri razpoznavanju obrazov v nekontroliranem okolju se srečujemo s spremembami pozicije obrazov, jakosti in smeri osvetlitve, izrazov na obrazu in raznimi prekrivanji obraznega področja. Te spremembe so prisotne pri številnih praktičnih sistemih za razpoznavanje obrazov. Uporaba 3D senzorjev pri zajemu slik je enen od načinov povečanja robustnosti na spremembe osvetlitve in orientacije obrazov. V članku so predstavljeni sistemi za razpoznavanje 3D slik obrazov. Opisana sta zgradba in delovanje teh sistemov. Predstavljeni so primeri izvedb ter poudarjene njihove prednosti in slabosti glede robustnosti na variačije pri zajemu slik. Predstavljeni so tudi prvi rezultati poskusov z lastnim sistemom za razpoznavanje 3D slik obrazov, ki ga razvijamo v nasšem laboratoriju. Ključne besede: biometrični sistemi, razpoznavanje obrazov, 3D slike, značilke Robust 3D face recognition Face recognition in uncontrolled environments is hindered by variations in illumination, pose, expression and occlusions of faces. Many practical face-recognition systems are affected by these variations. One way to increase the robustness to illumination and pose variations is to use 3D facial images. In this paper 3D face-recognition systems are presented. Their structure and operation are described. The robustness of such systems to variations in uncontrolled environments is emphasized. We present some preliminary results of a system developed in our laboratory. 1 UVOD Sistemi za biometricno razpoznavanje oseb temeljijo na ugotavljanju istovetnosti oseb na podlagi njihovih fizioloških ali vedenjskih lastnosti, kot so prstni odtisi, obrazi, govor, vzorci šarenic, nacin hoje itd. Področje uporabe takih sistemov zajema razlicne vrste nadzora, sodno medicino, preverjanje pristnosti pri denarnih transakcijah, kontrola dostopa (pri prehajanju meja, dostopu do informacij osebne narave) in drugo. Med vsemi biometricnimi sistemi so sistemi za razpoznavanje slik obrazov med najbolj priljubljenimi, predvsem zaradi njihove nevsiljive narave, saj poteka zajem podatkov na daljavo tudi brez vednosti obravnavane osebe. Posebno pozornost se tovrstnim biometricnim sistemom namenja pri razvoju t. i. pametnih nadzornih tehnologij ali, predvsem pri razvoju portalov za samodejni nadzor mejnih prehodov [1]. Čeprav ljudje razpoznavamo obraze brez posebnega truda, je samodejno razpoznavanje obrazov z racunalnikom precejšnja tezava in izziv. To še posebej velja, ce zelimo, da je razpoznavanje neodvisno od Prejet 12. januar, 2012 Odobren 2. februar, 2012 številnih spremenljivih dejavnikov, ki so lahko prisotni pri zajemu slik v nenadzorovanem okolju. Glavni dejavniki, ki vplivajo na zanesljivost razpoznavanja so spremembe orientačije in osvetlitve obraza, spremenljivo merilo (oddaljenost obrazov od kamere), spremembe izraza, razna prekrivanja obraznega predela (šal, brada, očala), časovni zamik (vidni znaki staranja na obrazu), kozmetičšni popravki ter podobni pojavi pri zajemu slik. Prisotnost teh dejavnikov na slikah obrazov lahko prečej poslabša zanesljivost razpoznavanja. Za izboljšanje robustnosti in zanesljivosti razpoznavanja pri teh sistemih je bilo uporabljenih več načinov zajema podatkov, kot so video, infra rdeče slike, večkratni zaporedni posnetki iz različšnih kotov in 3D slike obrazov. Prednosti uporabe 3D slik pri razpoznavanju obrazov so predvsem v neodvisnosti 3D podatkov na svetlobne pogoje, kot tudi mozšnost rotačije obrazov v normalno lego [2]. Se vedno pa na zanesljivost večine sistemov za razpoznavanje 3D slik obrazov vplivajo izrazne spremembe, prekrivanje obraznega predela in časovni zamik. V članku sta najprej predstavljena osnovna zgradba in delovanje sistemov za razpoznavanje 3D slik obrazov. Nato so predstavljeni primeri uveljavljenih postopkov, ki jih srečujemo pri izvedbi teh sistemov; od zajema 3D slik obrazov, postopkov določšanja obraznih značšilk do postopkov računanja podobnosti in odločanja. Predstavljeni so tudi prvi rezultati sistema za razpoznavanje 3D slik obrazov, ki ga razvijamo v nasšem laboratoriju. 2 Zgradba sistemov za RAZPOZNAVANJE 3D SLIK OBRAZOV Tipičšni sistem za razpoznavanje 3D slik obrazov je zgrajen iz naslednjih enot (slika 1): enota za zajem in predobdelavo podatkov, enota za določšitev obraznih značilk, enota za izračun podobnosti in odločanje. V nadaljevanju so podrobneje predstavljene posamezne enote in primeri različnih metod razpoznavanja. 3D slika zajem in predobdelava podatkov normalizirana 3D slika . določanje obraznih značilk vektor značilk izračun podobnosti in razvrščanje ID osebe obrazne značilke uporabnikov Slika 1: Bločna zgradba sistemov za razpoznavanje 3D slik obrazov 3 Zajem in predobdelava 3D slik Predstavitev obrazov v 3D tehniki naj bi imela več predpostavljenih prednosti v primerjavi z 2D slikami obrazov, kot je neodvisnost na spremenljive svetlobne pogoje in tudi robustnost na rotacijo obrazne površine, kar pa v realnosti ne drži popolnoma [3]. Poravnanje 3D slike obraza znotraj referenčnega okvira je lahko računsko zelo zahtevno in obstoječe metode niso vedno konvergentne. Prav tako dejstvo, da je zajem 3D podatkov neodvisen od sprememb osvetlitve, ne drži vedno -močni viri svetlobe in površine, ki odbijajo svetlobo, lahko precej vplivajo na zajem senzorja. Neobdelane 3D slike zato običajno vsebujejo neko mero šuma, ki se odraža v koničastih izboklinah (deli z veliko odbojnostjo - mastna koža) ali luknjah (manjkajoči podatki, kjer senzor ni bil sposoben pridobiti podatkov zaradi premajhne odbojnosti površine - predvsem predel obrvi, lasje, brada, oči) na zajeti sliki. Primeri naštetih popačenj «o o tehnika, ki deluje po principu strukturirane svetlobe. Ta tehnika uporablja kamero in oddajnik strukturirane svetlobe. Oddajnik projicira svetlobne vzorce natančno določene oblike (običajno IR-svetloba ali laserske črte) na obravnavan predmet, kamera pa sprejema svetlobne vzorce s površine predmeta. Iz sprememb v obliki med oddanimi in sprejetimi vzorci se rekonstruira 3D oblika predmeta. Po tem principu deluje tudi večje število komercialno dostopnih senzorskih sistemov, ki zagotavljajo precejšnjo globinsko ločljivost pri zajemu 3D slik: Konica Minolta Range5 / Vivid9i / Vivid910 (primeri slik zajetih z Minolta Vivid910 so na Sliki 2), Cyberware PX, 3DFaceCam, Face-SCAN, FastSCAN, IVP Ranger M50. Pred kratkim so prišle na trg tudi nizkocenovne alternative za zajem 3D slik obrazov, kot sta senzorja Microsoft Kinect in Asus Xtion PRO. Čeprav se pri teh senzorjih srečujemo s številnimi omejitvami, kot sta majhna globinska ločljivost in globinska ostrina, je možno z ustrezno obdelavo pridobiti zadovoljiv 3D model obraza. Primer je metoda v [4], kjer z iterativnim prilagajanjem povprečnega modela obraza 3D sliki obraza pridobljeni s senzorjem Kinect (slika 3a) pridobijo rekonstruiran model 3D obraza (slika 3b). (a) (b) (c) Slika 2: Primeri slik z napakami: (a) odsotnost nosu zaradi prevelike bližine obraza senzorju, (b) šum v okolici oči. (c) popačenje zaradi premika obraza med zajemom slike 3.1 Senzorji za zajem 3 D slik Glede na način delovanja lahko 3D senzorje razdelimo na pasivne in aktivne, pri čemer so za zajem 3D slik obrazov primernejši aktivni senzorji. Pri pasivnih senzorjih je 3D slika obraza rekonstruirana posredno iz več 2D slik ali videa. Aktivni senzorji za zajem 3D podatkov skenirane površine uporabljajo laserski žarek ali svetlobne vzorce. Med aktivnimi 3D senzorji, ki se uporabljajo za zajem slik obrazov, je najbolj razšiijena (a) (b) Slika 3: 3D slika obraza, zajeta s senzorjem Kinect: (a) neobdelana slika, (b) prilagojen povprečni model obraza 3.2 Predobdelava 3D podatkov S sistemi za zajem 3D slik pridobimo množico 3D točk površine slikanega objekta s podatkom o x, y in .i komponenti vsake točke. 3D podatke največkrat predstavimo v obliki točkovnega oblaka (slika 4a) ali globinske slike (slika 4b). Točkovni oblak je množica izmerjenih 3D točk i.r. y. z) površine danega objekta. S preslikavo 3D podatkov na pravokotno mrežo v i.r. y) ravnini dobimo globinsko sliko, ki jo lahko obravnavamo kot 2D sliko, kjer je svetlost posamezne točke na sliki sorazmerna globinski komponenti pripadajoče točke (koordinata s). Naslednji korak sta običajno zaznavanje in lokaliza-cija obraznega predela na zajeti 3D sliki. Z izrazom zaznavanje označujemo postopek, s katerim določimo prisotnost in število obrazov na sliki. Ob predpostavki, da je na sliki le en obraz, pa lokalizacija pomeni natančnejšo določitev lokacije in velikosti obraznega predela, lahko pa tudi orientacije obraza. Večina metod za lokalizacijo obrazov na 3D slikah temelji na analizi lokalne ukrivljenosti obrazne površine [5-7]. S tem dobimo množico potencialnih tock za lokacije karakterističnih delov obraza, kot so lokacija nosu, oči in ust, prek katerih se lahko dolocijo natancna lokacija, velikost in orientacija obraznega predela. Na podlagi teh podatkov se lahko obrazni predel loci od preostalega dela slike ter ustrezno skalira in rotira (slika 5b). Ker neobdelane slike vecinoma vsebujejo precej suma, je pred postopki dolocanja obraznih znacilk dobro izvesti se filtriranje slik. V ta namen se vecinoma uporabljajo nizkoprepustni filtri, ki izlocijo visokofrekvencni sum, manjkajoci predeli pa se zapolnijo z interpolacijo vrednosti sosednjih točk obrazne površine [5, 8]. i (a) (b) Slika 5: Predobdelava 3D slik: (a) neobdelana slika, (b) izrezan in filtriran obrazni predel 4 Določanje obraznih znacilk Izvedeni lokalizaciji in normalizaciji slik obrazov sledi postopek za dolocanje znacilk. Namen dolocanja znacilk je, da iz slik pridobimo bolj strnjene podatke, ki so koristni za razlikovanje med obrazi razlicsnih oseb in stabilni v smislu fotometricsnih in geometricsnih variacij pri zajemu slik. Iz slike obraznega predela pridobimo enega ali vec vektorjev znacilk, na podlagi katerih lahko potem sklepamo o identiteti osebe na sliki. Obstojece postopke dolocanja obraznih znacilk lahko glede na to, kako obravnavajo obrazni predel, razvrstimo v spodaj opisane skupine. 4.1 Postopki dolocanja globalnih znacilk Skupna lastnost postopkov te vrste je, da se vektor znacsilk (lahko tudi vecs) dolocsi iz celotnega obraznega predela (slika 6a). Vecina postopkov dolocanja globalnih znacsilk iz 3D slik je izpeljanih iz postopkov, prvotno razvitih za uporabo na 2D slikah, pri cemer so namesto 2D sivinskih slik uporabljene globinske slike. Najbolj znan in splossno razssirjen globalni postopek je analiza glavnih komponent (angl. principal component analysis, PCA), ki je bil sprva uporabljen za izločanje znacilk iz 2D slik, pozneje pa tudi iz globinskih slik [9]. Na globinskih slikah so bili izvedeni tudi drugi priljubljeni globalni postopki, kot je analiza linearne diskriminante (angl. linear discriminant analysis, LDA) [10], analiza neodvisnih komponent (angl. independent component analysis, ICA) [11]. Dobre lastnosti uporabe globalnih znacilk so: moznost precejšnjega zmanjšanja razseznosti podatkov; ohrani se informacija o prostorski relaciji med posameznimi deli obraza (pri lokalnih znacilkah to ne velja zmeraj). Poglavitna pomanjkljivost postopkov dolocanja globalnih znacilk pa je, da vecina teh postopkov zahteva natancno lokalizacijo in normalizacijo orientacije, osvetlitve in velikosti obrazov na slikah. Spremembe teh dejavnikov lahko vplivajo na globalne obrazne znacilke, kar lahko vodi do napak pri razpoznavanju. Pri postopkih, ki temeljijo na globalnih znacilkah, sta lokalizacija in normalizacija pogosto izvedeni z rocno dolocitvijo ka-rakteristicnih tock na obrazu. Za samodejno dolocanje teh tock se vecinoma uporablja iterativni algoritem iskanja najblizje tocke [12] (angl. iterative closest point, ICP), ki pa je racšunsko zelo potraten in ne konvergira vedno h globalnemu ekstremu. Poleg tega so postopki, ki temeljijo na globalnih znacilkah, vecinoma dokaj obcutljivi na izrazne spremembe in na razlicne vrste prekrivanja obraznega predela. 4.2 Postopki dolocanja lokalnih znacilk S postopki dolocanja lokalnih obraznih znacilk pridobimo mnozico vektorjev lokalnih znacilk, kjer posamezen vektor povzema lastnosti dolocšenega dela obraza. V zacetni fazi raziskav je bila pri razpoznavanju obrazov, zaradi kompaktnejše predstavitve, ki jo obicajno pridobimo z globalnimi znacšilkami, uporaba globalnih znacšilk bolj razsširjena kot uporaba lokalnih. Pri razvoju razpoznavalnih sistemov, ki bi bili bolj robustni na spremenljivo osvetlitev, orientacijo, izraze in merilo obrazov, pa so lokalne znacilke pritegnile vecjo pozornost raziskovalcev, saj se z lokalno analizo obraznega predela laze merimo z omenjenimi variacijami. Dolocšanje lokalnih znacšilk lahko razdelimo na dva dela. V prvem se detektirajo tocke zanimanja na obrazni površini, v katerih se nato v drugem delu izračunajo vektorji lokalnih značilk. Za detekcijo točk zanimanja obstaja več postopkov. Točke zanimanja so lahko določene kot mesta ekstre-mov v prostoru velikosti (angl. sčale-spače), s čimer zagotovimo neodvisnost značšilk na merilo obrazov na sliki. Tako poteka detekčija točk zanimanja pri postopku SIFT (angl. sčale-invariant feature transform) [13, 14] in SURF (angl. speeded up robust features) [15]. Točke zanimanja lahko določimo še: na podlagi analize lokalne ukrivljenosti globinskih slik [16]; s poravnavo 3D slik obrazov z modelom obraza, na katerem so lokačije točk znane a priori [17]; s postopki, kjer se značilke določajo v vozliščih grafov, kot je metoda prileganja elastičšnih grafov (angl. elastič bunčh graph matčhing, EBGM) [18]. Točke zanimanja pa lahko določimo tudi kot vozlišča na pravokotni mrezi, ki prekriva obrazni predel [8, 19, 20]. Ta postopek je ekvivalenten določanju lokalnih značšilk na bločšni osnovi, kjer se značšilke določšijo s pomočšjo drsečšega okna, ki ga s konstantnim korakom pomikamo po obrazni povrsšini, običšajno od leve proti desni in od zgoraj navzdol. Po izvedenem koraku detekčije točk po enem izmed zgoraj opisanih načšinov sledi določšitev vektorjev lokalnih značilk v teh točkah. Starejši postopki lokalne značšilke večšinoma določšijo iz geometrijskih relačij med točkami zanimanja (lokačija točk, razdalje in koti med točškami, razmerja razdalj, geodezičšne razdalje). Za opis oblikovanosti obrazne povrsšine v okoliči detektiranih točk zanimanja se pri novejših postopkih uporabljajo: deskriptorji diferenčialne geometrije (povprečna ukrivljenost, Gaussova ukrivljenost, indeks oblike) [8, 21], točkovne oznake (angl. point signatures) [22], koefičienti Gaborjevih filtrov na globinskih slikah [18], koefičienti diskretne kosinune transformačije (DCT) [19, 20], histogrami smeri gradientov v okoliči točšk zanimanja [13]. Uporaba lokalnih značšilk ima v primerjavi z globalnimi značšilkami večš prednosti. Zaradi narave postopkov, ki temeljijo na lokalnih značšilkah, ima nenatančšna loka-lizačija obraznega predela manjši vpliv na zanesljivost razpoznavanja, saj pri postopkih te vrste neodvisnost značšilk na spremembe osvetlitve, orientačije, velikosti in prekrivanja obraznega predela laze zagotoviti. Nekateri postopki, ki temeljijo na lokalnih značilkah, zato ne zahtevajo normalizačije obrazov na omenjene spremembe. Prav tako so ti postopki na splošno manj občutljivi na spremembe v izrazih. 4.3 Hibridni postopki izpeljave značilk Pri teh postopkih se obrazne značilke določijo na podlagi kombinačije postopkov iz zgornjih dveh skupin. Podatki iz obeh pristopov so lahko zdruzeni na ravni značšilk [23], rezultatov prileganja [24] ali pa na odločitveni ravni [25]. 5 IZRAČUN PODOBNOSTI IN ODLOČANJE Žadnji korak samodejnega razpoznavanja 3D slik obrazov je izračun podobnosti (oz. različnosti) med znacilkami testirane osebe in značilkami oseb, shranjenimi v podatkovni bazi sistema. Odločitev, ki sledi, je odvisna od tega, za kakšen namen se sistem za razpoznavanje uporablja. Glede na namen uporabe ločimo sisteme, ki opravljajo funkčijo verifikačije (potrjevanja istovetnosti) oseb, in sisteme, ki opravljajo funkčijo identifikačije (ugotavljanja istovetnosti) oseb. Pri veri-fikačiji ugotavljamo, ali je podobnost med značilkami testirane osebe in značilkami oseb, shranjenimi v bazi sistema, manjša ali večja od določenega praga ter glede na to potrdimo ali ne potrdimo identitete osebe (oz. razvrstimo osebo v mnozičo klientov ali pa v mnozičo vsiljivčev). Pri identifikačiji pa iščemo najmanjšo razdaljo med značilkami testirane osebe in značilkami oseb v bazi, izhod iz sistema pa je iskana identiteta osebe ali pa odgovor, da oseba ne ustreza nobenemu modelu iz baze sistema. Med postopki za razvrščanje v literaturi največkrat zasledimo postopek najblizšjega soseda (angl. nearest neighbor method, 1-NN) [5, 9-11]. Pri globalnih postopkih, kjer je posamezna slika predstavljena z enim vektorjem značilk, se primerjava med dvema slikama pri postopku 1-NN izvede tako, da se na podlagi neke mere podobnosti primerjata pripadajoča vektorja značilk med sabo. Pri lokalnih postopkih pa je potreben nekoliko drugačen pristop, saj je pri lokalnih postopkih posamezna slika opisana z mnozičo vektorjev lokalnih značilk, katerih število se od slike do slike praviloma razlikuje. Prav tako pri primerjavi lokalnih značilk dveh slik na splošno ni znano, katere značilke pripadajo istemu obraznemu predelu. Žaradi zgornjih razlogov se za računanje podobnosti med obrazi, predstavljenimi z lokalnimi značšilkami, pogosto prej poisščše poenoten zapis obraza, npr. s parametri modela Gaussovih mesšanič (angl. Gaussian mixture model, GMM) [26] ali s parametri prikritega Markovovega modela (angl. hidden Markov model, HMM) [19, 20]. S tako predstavljenimi obrazi lahko za merjenje podobnosti med njimi uporabimo različne metode, kot so kriterij razmerja verjetij (angl. likelihood ratio) [20, 26], metoda podpornih vektorjev (angl. support večtor mačhine, SVM) [27, 28]. Lahko pa izvedemo tudi direktno primerjavo dveh slik, opisanih z lokalnimi značilkami, tako da primerjamo vsak vektor lokalnih značilk ene slike z vsakim vektorjem lokalnih značilk druge slike. Mera podobnosti med dvema slikama obrazov v tem primeru temelji na normiranem številu ujemajočih vektorjev lokalnih značilk ali pa na normirani vsoti razdalj med ujemajočimi vektorji značšilk. 6 Izvedba primera sistema in poskusi Izvedli smo sistem za verifikacijo oseb, predstavljenih z globinskimi slikami, ki temelji na uporabi lokalnih značilk in modelov GMM (slika 7). Sistem je priljubljen postopek, ki ga razmeroma pogosto zasledimo v literaturi, uporablja pa se tako pri razpoznavanju 2D slik kot tudi 3D slik obrazov. Sistem bo izhodišče za nadaljnje raziskave, v okviru katerih bomo skušali utemeljiti uporabo lokalnih značilk pri robustnem razpoznavanju 3D slik obrazov. Rezultate verifikacije smo primerjali s postopkom določanja globalnih značilk, ki temelji na metodi PCA. Testna slika Učne slike Slika 7: Bločna zgradba izvedenega sistema V koraku predobdelave smo uporabili nizkoprepustni filter, s katerim smo odstranili visokofrekvenčni šum, manjkajoče podatke pa smo nadomestili z interpolacijo podatkov v sosednjih točkah. Izvedena je bila le groba samodejna lokalizacija obraznega predela, ki temelji na iskanju lokacij konice nosu in obeh očes z analizo ukrivljenosti površine [16]. Izrezane slike obrazov smo skalirali na standardno velikost s konstantno razdaljo med lokacijama oči. Vektorje lokalnih značilk smo določili na bločni osnovi, kjer smo v vsakem bloku izračunali 2D DCT koeficiente in kot značilke vzeli prvih 10 koeficientov, ki pripadajo nizkim frekvencam. Porazdelitev tako pridobljenih vektorjev značilk vsakega obraza smo opisali z modelom GMM. Model GMM, sestavljen iz K Gaussovih komponent, določajo naslednji parametri: uteži {7rfc}f=1, povprečni vektorji {^k}u=i in kovariančne matrike j£/, j ,. Za izračun teh parametrov smo uporabili iterativni postopek maksimizacije upanja (angl. expectation maximization, EM) [29]. Zaradi majhnega števila vektorjev značilk na posamezno osebo smo najprej izračunali parametre splošnega modela obraza (angl. universal background model, UBM) - to je GMM naučen na vseh slikah obrazov iz učne množice sistema. GMM posamezne osebe pa smo izpeljali iz modela UBM s pomočjo maksimizacije vrha posteriorne porazdelitve (angl. maximum a posteriori, MAP) [30], pri čemer smo prilagodili le povprečne vrednosti modelov. Sistemi za verifikacijo, ki temeljijo na modelih GMM, običajno uporabljajo test razmerja verjetij v fazi razvrščanja, v našem primeru pa smo namesto razmeija verjetij uporabili metodo podpornih vektorjev (angl. support vector machine, SVM). Za uporabo SVM kot odločitvenega kriterija je treba poiskati poenoten zapis slik obrazov. V ta namen smo razvrstili vektorje povprečnih vrednosti posameznega modela obraza drugega vrh drugega v stolpec in pridobili za vsak obraz en sam vektor, za katerega se je v literaturi uveljavilo ime supervektor. V fazi predstavitve določene osebe SVM določi ločilno mejo med supervektorji te osebe in supervektorji, ki pripadajo učnim slikam iz baze sistema. V fazi testiranja pa se oseba sprejme ali zavrne na podlagi lege supervektorja glede na ločilno mejo. Poskuse smo izvedli na uveljavljeni zbirki 3D slik FRGC (angl. face recognition grand challenge) [9]. Na sliki 8 so prikazani dobljeni rezultati verifikacije v obliki krivulje ROC (angl. receiver operating characteristic), ki podaja delež sprejetih klientov (angl. true acceptance rate) v odvisnosti od deleža sprejetih vsiljivcev (angl. false acceptance rate). ROC o o OC. o i o o o 10 10 ' 10 ' FAR 10 10" Slika 8: Krivulja ROC obravnavanega sistema v primerjavi s postopkom PCA Obravnavani sistem se je pričakovano obnesel precej bolje kot postopek PCA. To izhaja predvsem iz dejstva, da modeli GMM obravnavajo vektorje lokalnih značilk. S tem je dosežena večja robustnost na nenatančno loka-lizacijo obrazov, izrazne spremembe in prekrivanja. Ti faktoiji pa so prisotni pri večini slik iz zbirke FRGC, ki smo jo uporabili v poskusu. 7 Sklep V članku so predstavljeni sistemi za razpoznavanje 3D slik obrazov. Opisan je celoten postopek razpoznavanja, od zajetja slike do odločitve o identiteti osebe na sliki. Izpostavljeno je delovanje takih sistemov v nenadzorovanem okolju, kjer na zanesljivost razpoznavanja vplivajo različni spremenljivi dejavniki, ki so prisotni pri zajemu slik. Na splošno se postopki razpoznavanja, ki temeljijo na lokalnih značilkah, izkažejo za bolj robustne na te dejavnike, kar potrjujejo tudi rezultati naših poskusov, ki so omenjeni v članku. Zahvala Raziskovalno delo, ki je pripeljalo do predstavljenih rezultatov, je bilo delno financirano iz strani 7. Okvirnega -GMM/UBM --PCA programa EU (FP7-SEC-2010-1) v okviru sporazuma o dodelitvi sredstev st. 261727 in bilateralnega projekta z naslovom Hitro in zanesljivo razpoznavanje 3D obrazov (BI-BG/11-12-007). Literatura [1] C. Busch in A. Nouak, "3d face recognition for unattended border control." v Security and Management'08, 2008, str. 350-356. [2] G. Medioni in R. Waupotitsch, "Face modeling and recognition in 3-d," v Proceedings of the IEEE International Workshop on Analysis and Modeling of Faces and Gestures, ser. AMFG '03, 2003, str. 232-240. [3] S. Huq, B. Abidi, S. G. Kong in M. Abidi, "A survey on 3d modeling of human faces for face recognition," v 3D Imaging for Safety and Security, ser. Computational Imaging and Vision, 2007, vol. 35, str. 25-67. [4] M. Zollhofer et al., "Automatic reconstruction of personalized avatars from 3d face scans," Computer Animation and Virtual Worlds (Proceedings of CASA 2011), vol. 22, str. 195-202, 2011. [5] A. Mian, M. Bennamoun in R. Owens, "Face recognition using 2d and 3d multimodal local features," ISVC '06, vol. 860, str. 860-870, 2006. [6] A. Colombo, C. Cusano in R. Schettini, "3d face detection using curvature analysis," Pattern Recogn., vol. 39, str. 444-455, 2006. [7] S. Mehryar, K. Martin, K. Plataniotis in S. Stergiopo-ulos, "Automatic landmark detection for 3d face image processing," v CEC '10, 2010, str. 1-7. [8] T. Inan in U. Halici, "3-d face recognition with local shape descriptors," Information Forensics and Security, IEEE Transactions on, vol. 7, st. 2, str. 577-587, 2012. [9] P. J. Phillips et al., "Overview of the face recognition grand challenge," v CVPR '05, 2005, str. 947-954. [10] T. Heseltine, N. Pears in J. Austin, "Three-dimensional face recognition: A fishersurface approach," v Image Analysis and Recognition, ser. LNCS, 2004, vol. 3212, str. 684-691. [11] C. Hesher, A. Srivastava in G. Erlebacher, "A novel technique for face recognition using range imaging," v Proc. Seventh Int Signal Processing and Its Applications Symp, vol. 2, 2003, str. 201-204. [12] B. Amor, M. Ardabilian in L. Chen, "New experiments on icp-based 3d face recognition and authentication," v Pattern Recognition, 2006. ICPR 2006. 18th International Conference on, vol. 3, 2006, str. 1195-1199. [13] T. R. Lo in J. P. Siebert, "Local feature extraction and matching on range images: 2.5d sift," Comput. Vis. Image Underst., vol. 113, str. 1235-1250, 2009. [14] C. Maes et al., "Feature detection on 3d face surfaces for pose normalisation and recognition," v BTAS '10, 2010, str. 1-6. [15] H. Bay, A. Ess, T. Tuytelaars in L. Van Gool, "Surf: Speeded up robust features," v Computer Vision and Image Understanding (CVIU), 2008, str. 346-359. [16] P. Szeptycki, M. Ardabilian in L. Chen, "A coarse-to-fine curvature analysis-based rotation invariant 3d face landmarking," v BTAS '09, 2009, str. 32-37. [17] M. O. Irfanoglu, B. Gokberk in L. Akarun, "3d shape-based face recognition using automatically registered facial surfaces," v ICPR'04, 2004, str. 183-186. [18] M. Husken, M. Brauckmann, S. Gehlen in C. Von der Malsburg, "Strategies and benefits of fusion of 2d and 3d face recognition," v CVPR'05, 2005, str. 174-182. [19] F. Cardinaux, C. Sanderson in S. Bengio, "User authen- tication via adapted statistical models of face images," Signal Processing, IEEE Transactions on, vol. 54, str. 361-373, 2006. [20] C. McCool, J. Sanchez-Riera in S. Marcel, "Feature distribution modelling techniques for 3d face verification," Pattern Recogn. Lett., vol. 31, str. 1324-1330, 2010. [21] N. AlyUz, B. Gokberk in L. Akarun, "Regional registration and curvature descriptors for expression resistant 3d face recognition," v Signal Processing and Communications Applications Conference, 2009. SIU 2009. IEEE 17th, 2009, str. 544-547. [22] Y. Wang, C. S. Chua in Y. K. Ho, "Facial feature detection and face recognition from 2d and 3d images," Pattern Recognition Letters, vol. 23, st. 10, str. 11911202, 2002. [23] F. Al-Osaimi, M. Bennamoun in A. Mian, "Integration of local and global geometrical cues for 3d face recognition," Pattern Recognition, vol. 41, st. 3, str. 1030-1040, 2008. [24] J.-P. Vandeborre, V. Couillet in M. Daoudi, "A practical approach for 3d model indexing by combining local and global invariants," v 3D Data Processing Visualization and Transmission. Proceedings, 2002, str. 644-647. [25] B. Gokberk, A. Salah in L. Akarun, "Rank-based decision fusion for 3d shape-based face recognition," v Audio- and Video-Based Biometric Person Authentication, ser. LNCS, 2005, vol. 3546, str. 1019-1028. [26] C. McCool, V. Chandran, S. Sridharan in C. Fookes, "3d face verification using a free-parts approach," Pattern Recogn. Lett., vol. 29, st. 9, str. 1190-1196, 2008. [27] H. Bredin, N. Dehak in G. Chollet, "Gmm-based svm for face recognition," v ICPR '06, vol. 3, 2006, str. 1111 -1114. [28] A. Moreno, A. Sanchez, J. Velez in J. Diaz, "Face recognition using 3d local geometrical features: Pca vs. svm," v ISPA '05, 2005, str. 185-190. [29] T. Moon, "The expectation-maximization algorithm," Signal Processing Magazine, IEEE, vol. 13, str. 47-60, 1996. [30] D. A. Reynolds, T. F. Quatieri in R. B. Dunn, "Speaker verification using adapted gaussian mixture models," v Digital Signal Processing, 2000, str. 19-41. Janez Križaj je leta 2008 diplomiral na Fakulteti za elektrotehniko v Ljubljani. Trenutno je doktorski student in mladi raziskovalec v Laboratoriju za umetno zaznavanje, kibernetiko in sisteme na Fakulteti za elektrotehniko v Ljubljani. Raziskovalno je dejaven na podrocsjih razpoznavanja vzorcev, razpoznavanja obrazov, statisticsnega modeliranja in strojnega ucenja. Vitomir Struc je diplomiral leta 2005 na Fakulteti za elektrotehniko Univerze v Ljubljani. Na isti fakulteti je leta 2010 tudi doktoriral in leto pozneje za svoje doktorsko delo prejel Vodovnikovo nagrado. Po doktoratu se je zaposlil v podjetju Alpineon razvoj in raziskave, d.o.o., kjer je delal kot razvijalec programske opreme. Trenutno je zaposlen na podoktorskem projektu na Fakulteti za elektrotehniko v Ljubljani. Raziskovalno se ukvarja z razpoznavanjem vzorcev, obdelavo signalov in biometricsnimi sistemi. Simon Dobrišek je leta 1990 diplomiral na Fakulteti za elektrotehniko v Ljubljani. Leta 1994 je na isti fakulteti magistriral in leta 2001 se doktoriral na področju tehnologij govorjenega jezika. Od leta 1990 je zaposlen na Fakulteti za elektrotehniko v Ljubljani, kjer je trenutno docent na delovnem mestu asistenta. Raziskovalno deluje na področju razpoznavanja vzorcev in inteligentnih sistemov. Posebno pozornost namenja samodejnemu razpoznavanju govora in biometričnim nadzornim sistemom. Je avtor ali soavtor več kot 100 znanstvenih prispevkov na omenjenih področjih.