NEVRONSKI SISTEM ZA AVTOMATSKO ODSTRANJEVANJE OZADJA PRI AUGERJEVIH SPEKTRIH Igor Belic, Besnik Poniku, Monika Jenko ZNANSTVENI ČLANEK Inštitut za kovinske materiale in tehnologije, Lepi pot 11, 1000 Ljubljana POVZETEK Spektralno ozadje in šum sta neločljiva sestavna dela Augerjevih spektrov, ki zaradi svoje spremenljivosti onemogočata avtomatsko analizo in obdelavo spektrov. Ključni element zanesljive avtomatske analize spektrov je odstranjevanje spektralnega ozadja in šuma. To je postopek, ki mora pri svojem delovanju ohraniti večino informacij spektra, pri tem pa ne sme popačiti in spremeniti vsebine spektra, biti mora predmet temeljite študije, saj je izhodišče nadaljnje analize spektrov. Tudi samo spektralno ozadje vsebuje nekatere pomembne informacije o preiskovanem materialu, zato ga ne smemo preprosto zavreči, moramo ga shraniti za kasnejšo uporabo. Pri odstranjevanju ozadja Augerjevih spektrov smo uporabili nevronske sisteme. Z njimi smo aproksimirali ozadje spektrov. Pri tem nikoli natančno ne vemo, kje je meja med spektri in dejanskim ozadjem. Nevronske sisteme smo uporabili zato, ker za gradnjo modela ozadja ne potrebujejo drugega kot nekaj točk spektra, skozi katere želimo potegniti nelinearno funkcijo. Nevronski sistemi za svoje delovanje ne potrebujejo nobene dodatne informacije v smislu formalnih matematičnih zapisov povezav med glavnimi elementi modeliranega sistema. so tako imenovani brezmodelni aproksimatorji. Nevronske sisteme smo uporabili za določitev splošne oblike spektralnega ozadja. Ugotovili smo, da Augerjev spekter sestavljajo trije deli, in sicer sam spekter, spektralno ozadje ter spektralni vrhovi. Ključne besede: Augerjeva spektroskopija, AES, nevronski sistemi, modeliranje Neural network for AES spectra peak base background removal ABSTRACT Spectral background and noise are two inevitable constituent elements of Auger (AES) spectra. They make the AES spectra automatic analysis next to impossible. In order to provide the techniques that have the capability of extracting the information on the probed material from the AES spectra, the process of background and noise removal must first be addressed. Furthermore, the AES spectra background also contains the information on composition of the sample observed, so the processing must retain the shape of the background separate from the spectra itself for further investigation. In our work neural networks were used for the data modelling or background shape approximation. Neural networks are modelless approximators, meaning they are capable of accomplishing the approximation tasks regardless of any prior knowledge on the nature of the modelled system. Neural networks were used for the determination of AES spectra general shape. According to the analysis three distinctive parts of the spectra background were proposed. One of them is the so called peak base. The use of the neural network for the peak base background subtraction is described in detail. Keywords: AES spectra, neural networks, modelling, background subtraction, spectra analysis 1 UVOD V uporabi je kar nekaj metod za obdelavo AES-spektrov za določanje sestave površine. Najbolj pre- prosta je metoda, ko izmerimo velikost vrha v AES-spektru, tj. ploščina pod vrhom v spektru N(E) ali razlika med točkama maksimuma in minimuma v AES-spektru dN(E)/dE. Poleg te preproste metode obstajajo zahtevnejše metode, kot npr. metode faktorske analize (FA) ter metoda linearnega razstavljanja spektrov po merilu najmanjše razlike kvadratov (angl. linear least square - LLS). S temi metodami poskušamo razstaviti izmerjene spektre Augerjevih elektronov iz neznanih vzorcev na spektre iz referenčnih vzorcev čistih elementov ali iz referenčnih vzorcev znanih spojin in tako ugotoviti sestavo površine in tudi vrsto kemičnih spojin na površini. Pri vseh omenjenih metodah je velika težava spektralno ozadje in šum, ki je v vsakem spektru, vpliva pa direktno na kvaliteto analize. V prispevku se ukvarjamo s postopki za zanesljivo in razumno natančno avtomatsko analizo Augerjevih spektrov [1-7]. Uvodoma je treba poudariti, da ne iščemo fizikalnih utemeljitev procesov nastanka Augerjevega spektra, naš namen je poiskati ustrezne postopke in transformacije podatkov za odstranjevanje spektralnega ozadja [8] ter šuma [9], oba sta neločljiva dela vsakega spektra. Izhajamo iz predpostavke, da je šum in deloma tudi spektralno ozadje pojav, ki popači idealni spekter, ne ukvarjamo se z vprašanjem, kako je šum nastal, in želimo na podoben način, kot je v navadi na drugih področjih (akustika, obdelava električnih signalov itd.), oba vpliva zmanjšati na čim nižjo mogočo raven. Stremimo k idealiziranemu cilju, in sicer najti postopke, namenjene odstranjevanju ozadja in šuma, pri tem pa ne želimo posegati v informacije, vsebovane v merjenih spektrih. Dobro se zavedamo, da vsaka transformacija nujno poseže v integriteto podatkov in vnaša napake v analizo spektra. Iščemo torej postopke, ki bodo imeli čim manjši vpliv na informacije, zapisane v spektrih. Že v začetku naletimo na problem, ker imamo na razpolago celo vrsto izmerjenih Augerjevih spektrov, za nobenega od njih pa ne vemo njihove natančne sestave, torej kakšna sta dejansko ozadje in šum. Uporaba postopkov za njuno odstranjevanje napravi neznano in tudi neocenljivo napako. Zato smo se odločili izbrati pot, kjer smo najprej naredili simulator Augerjevih spektrov, z željo, da bi bil simulator sposoben generirati čim bolj verodostojne spektre. Tovrsten način ima dve zelo pomembni prednosti: prva je ta, da pri simuliranih spektrih natančno vemo, kako je spekter sestavljen, in zato lahko tudi natančno ocenimo vpliv posameznih transformacijskih metod, drugi pa je ta, da imamo tako na razpolago skoraj neomejeno zalogo različnih spektrov. Testiranje postopkov zato dobi tudi statistično veljavno oceno. Pri snovanju generatorja virtualnih Augerjevih spektrov smo naredili naslednje korake: - določitev osnovnih oblikovnih elementov spektra; - analiza posameznih elementov; - oblikovanje ustreznega zapis za vsak element spektra posebej; - gradnja generatorja; - ocena rezultatov. 2 OZADJE AUGERJEVIH SPEKTROV Eden od elementov Augerjevih spektrov, ki zaradi svoje naključnosti onemogočajo zanesljivo avtomatsko analizo, je spektralno ozadje [8]. Cilj je poiskati postopke za odstranjevanje spektralnega ozadja, in sicer takšne, ki bodo čim manj popačili originalen spekter. Vpliv vseh pomožnih orodij za filtriranje na sam spekter mora biti minimalen. Slika 1: Zgledi razli~nih Augerjevih spektrov ponazarjajo izrazito oblikovno variabilnost spektrov Prvi pogoj za kakršno koli izvajanje odstranjevanja spektralnega ozadja je temeljito poznanje oblike posameznih elementov, ki skupaj sestavljajo Augerjev spekter. Tu ne gre za fizikalne lastnosti, ampak najprej za oblikovne značilnosti. Pripravili smo programsko orodje za hiter vizualni pregled velikega števila posnetih spektrov. Ker gre za programsko okolje, v katerem želimo kasneje preizkusiti vrsto orodij, smo se odločili za uporabo okolja VBA (Visual basic for applications), delujočega v okviru MS Excel. Izbrano okolje ponuja vrsto prednosti, med katerimi je prav enostavna vizualizacija podatkov med najpomembnejšimi. Na sliki 1 je prikazan primer nekaj Auger-jevih spektrov. zavedati se moramo, da je oblika spektralnega ozadja zelo spremenljiva, fizikalno ozadje nastanka ozadja niti ni popolnoma poznano. 3 NEVRONSKI SISTEM ZA DOLOČANJE OBLIKE SPEKTRALNEGA OZADJA Za določanje oblike spektralnega ozadja smo uporabili nevronske sisteme. Ti izvajajo aproksimacije funkcij brez poznanja zapisa povezav med spremenljivkami in parametri sistema. zato so t. i. brezmodelni aproksimatorji [10, 11]. Pri klasičnih aproksimacijskih shemah je medsebojno poznanje povezav (lastnosti) sistema nujno. V nadaljevanju aproksimacijska shema prilagaja parametre matematičnih zapisov modela, in sicer tako, da zadosti vnaprej predpisanim optimi-zacijskim merilom. Zgled takšnega aproksimacijskega sistema so regresijski modeli, kjer iščemo najboljše prilagajanje znane funkcije merjenim podatkom. Za aproksimacijo - model spektralnega ozadja smo uporabili navadno shemo nevronskega sistema ter učenje s povratnim razširjanjem napak [10, 11]. Najpomembnejša lastnost nevronskih sistemov je njihova sposobnost, da zgradijo vhodno-izhodno povezavo samo na osnovi predstavljenih podatkov. o modeliranem sistemu skoraj ne potrebujemo nobenih drugih informacij. Grajenje modela na osnovi predstavljenih podatkov pomeni, da so vsebovane tudi povezave med podatki, če je le podatkov dovolj glede na dimenzionalnost in kompleksnost sistema. Pri našem delu smo uporabili programsko orodje Neuralyst (Cheshire ltd.), ki je dodatek k Excelu in VBA. 3.1 Splošna arhitektura nevronskega sistema osnovni gradnik nevronskega sistema je nevronska celica (slika 2) [10, 11]. Vsako nevronsko celico sestavlja vrsta vhodov (sinapse), ki signal pripeljejo do sumatorja. Vhodne vrednosti se pomnožijo s pripadajočomo utežmi w (sinaptične uteži) in se v sumatorju seštejejo z drugimi vhodnimi vrednostmi. Slika 2: Shematski prikaz umetne nevronske celice Proces učenja spreminja vrednosti uteži, s tem pa spreminja vplivnost posameznega vhoda na skupno vsoto. Včasih imajo nevronske celice še en vhod, ki mu rečemo podlaga (bias). Vrednost signala na tem vhodu je vedno 1, med procesom učenja pa se spreminja vrednost uteži. Vrednost, ki se formira po suma-torju pomeni vhodno vrednost aktivacijske funkcije nevronske celice. Aktivacijska funkcija ustvari izhodno vrednost nevronske celice. Večinoma je aktivacijska funkcija sigmoidalnega tipa, nekateri nevronski sistemi pa uporabljajo tudi drugačne vrste nelinearnosti. Posamične nevronske celice so združene v nevronskem sistemu, ki ima vedno vsaj dve plasti, in sicer vhodno in izhodno plast [10, 11]. Omenjeni plasti sta namenjeni komunikaciji sistema z okolico, zato ju navadno imenujemo vhodna in izhodna plast (slika 3). Med obema plastema ima nevronski sistem lahko več nivojev skritih plasti. Poimenovanje »skrito« se nanaša na zunanjost nevronskega sistema - skrite plasti z zunanjostjo sistema nimajo direktnih povezav. Vloga skritih plasti je ključna za adaptivno kreiranje nelinearne preslikave vhoda na izhod nevronskega Slika 3: Splošna konfiguracija nevronskega sistema. Na shemi ni označenih uteži posameznih vhodov celic, prav tako so izpuščene aktivacijske funkcije. sistema ter s tem na delovanje celotnega nevronskega sistema. 3.2 Proces učenja Proces, pri katerem se postopno spreminjajo lastnosti nevronskega sistema, imenujemo učenje. Pri nadzorovanem učenju so sistemu drug za drugim predstavljene vhodne vrednosti ter njim pripadajoče izhodne vrednosti, za katere želimo, da jih sistem reproducira. Celotna množica vhodno-izhodnih parov, ki jih nevronskemu sistemu predstavimo v procesu učenja, se imenuje učna množica. Izmerjene vrednosti sistema se druga za drugim predstavijo nevronskemu sistemu. V vsaki na vhod nevronskega sistema predstavljeni točki nevronski sistem generira izhodno vrednost sistema. Izhodne vrednosti nevronskega sistema se razlikujejo od predstavljenih ciljnih vrednosti - sistem naredi napako. Napaka nevronskega sistema se določi za vsako točko učne množice posebej. Sistem učenja nato oceni, koliko k napaki prispevajo posamične celice, posamične povezovalne uteži in jih spremeni tako, da poskuša zmanjšati zaznano napako. V angleški literaturi postopku zmanjševanja vpliva posamičnih sestavnih elementov nevronskega sistema rečejo »error backpropagation« ali povratno razširjanje napak. Algoritem učenja spremeni povezovalne uteži w (slika 2), in sicer tako, da se zmanjšuje napaka, ki jo naredi sistem. V postopku učenja je vsak element učne množice (pari vhod - izhod) predstavljen sistemu. Vrstni red predstavljanja točk učne množice ni pomemben. Predstavitev celotne učne množice nevronskemu sistemu se imenuje epoha. za to, da bi postopek učenja spremenil uteži nevronskega sistema do take mere, da je napaka sprejemljivo majhna, navadno potrebujemo veliko število epoh - tipično od 10 000 do nekaj milijonov. Eden od možnih pogojev, ki morajo biti izpolnjeni zato, da se postopek učenja preneha, je velikost napake, ki jo pri predstavitvi učne množice naredi nevronski sistem. Pri uporabi nevronskega sistema, ki ga opisuje ta članek, smo uporabili nevronski sistem s štirimi plastmi. V prvi plasti je en nevron, v dveh skritih plasteh je v vsaki po 10 nevronov, v izhodni plasti pa je tudi en nevron. Rezultati, ki smo jih dobili pri odstranjevanju ozadja Augerjevih spektrov, so spodbudni. Prva naloga je bila določitev kolikor mogoče splošne oblike ozadja Augerjevih spektrov. Pri tem smo vse digitalizirane vrednosti izmerjenega spektra uporabili kot učno množico nevronskega sistema. Ta v procesu učenja poskuša ponoviti vse predstavljene točke spektra, in sicer tako natančno, kot smo predpisali za Slika 4: Oblike aproksimiranih ozadij Augerjevih spektrov (63 izmerjenih in normaliziranih spektrov) pogoj ustavitve učenja. Ker smo nevronskemu sistemu predstavili vse točke spektra, ne moremo pričakovati, da bo spekter dobro predstavljen, še več, sistemu dovolimo dovolj veliko napako (tipično 10-20 %), rezultat pa je neke vrste posplošena oblika spektra, dejansko nevronski model v večjem deležu predstavi le posplošeno spektralno ozadje. Sistem deluje kot nizkopasovno sito. Na sliki 4 so Augerjevi spektri, pri katerih smo z nevronskim sistemom naredili model ozadja. Na enak način smo modelirali ozadje pri 63 izmerjenih Augerjevih spektrih. Ker se Augerjevi spektri po absolutnih vrednostih zelo razlikujejo in ker nas v prvi vrsti zanima le oblika ozadja, smo vse spektre pred modeliranjem ozadja normalizirali. Na sliki 4 so predstavljeni rezultati modeliranja ozadja za vseh 63 izmerjenih spektrov. Glede na sliko 4 lahko sklenemo: 1. oblika ozadja AES-spektrov je zelo spremenljiva; 2. kljub temu lahko zaznamo nekaj jasno ločenih oblikovnih delov spektra; 3. splošno lahko AEs-spekter razdelimo na tri dele, in sicer na: - nizkoenergijski del - to je del spektra, kjer se izmerjeno ozadje s povečevanjem energije hitro spušča; - srednjeenergijski del - na tem delu se ozadje najprej nekoliko vzpne in nato zopet pade; - visokoenergijski del - na tem delu se spektralno ozadje s povečevanjem energije monotono povečuje. 4 SPEKTRI ČISTIH ELEMENTOV ce želimo narediti generator, ki bo ustvarjal virtualne Augerjeve spektre, moramo pripraviti podat- kovno bazo spektrov, ki pripadajo čistim elementom. Uporabili smo spektre za aluminij, ogljik, kobalt, železo, zlato, nikelj, kisik, silicij, srebro, titan in vanadij. V splošnem smo pri generatorju virtualnih spektrov predpostavili, da velja pravilo linearne super-pozicije, ki jo opisuje enačba (1): 5 = f (a,s,) + PB + N (1) V enačbi (1) pomeni S izmerjeni Augerjev spekter, f(...) je nelinearna povezava, ki povezuje spektre posameznih spektrov čistih elementov v skupen spekter, ai je količina i-tega sestavnega elementa v opazovanem materialu, s je spekter i-tega čistega elementa, PB je osnovno spektralno ozadje, N pa je šum, primešan Augerjevemu spektru. Zavedamo se, daje funkcijaf(...) samo v grobem približku lahko vzeta kot linearna, vendar tudi linearna povezava med spektri čistih elementov zadošča namenom, za katere je generator virtualnih Augerjevih spektrov narejen. V primeru predpostavke linearnosti enačba (1) preide v obliko enačbe (2): M S = £ (a,s,) + Pb + n (2) i=1 Tu je M število vseh sestavnih elementov zajetih v podatkovni bazi. Preden lahko ustvarimo podatkovno bazo osnovnih spektrov, je bilo treba pripraviti analizo sestavnih delov spektrov čistih elementov. S slike 5 je razvidno, da vsak Augerjev spekter oblikovno sestavljajo trije ločeni elementi, in sicer: 1. osnovno spektralno ozadje; 2. baza spektralnih vrhov; 3. spektralni vrhovi. Ločevanje posameznih delov Augerjevega spektra zahteva nekaj korakov, in sicer: Slika 5: Trije sestavni elementi Augerjevega spektra nosti baze spektralnih vrhov za področje med P1 in P2. 5. Ko je oblika baze spektralnih vrhov znana, jo odštejemo od originalnega spektra. Tako ostanejo v spektru le še spektralni vrhovi. Opisan proces je bil ponovljen na vseh uporabljenih spektrih čistih elementov. Tako smo ustvarili podatkovno bazo spektrov čistih elementov, ki ločeno za vsak element vsebuje spektralne vrhove ter baze spektralnih vrhov. vsi spektri so shranjeni v normalizirani obliki, relativno razmerje med spektralnimi vrhovi in bazo spektralnih vrhov ostane ohranjeno. 3. Določiti je treba dve točki P1 in P2 (slika 5). Lastnost izbranih točk je, da pripadajo vsem trem elementom spektra hkrati. Premica skozi točki P1 in P2 pomeni prvi približek osnovnega spektralnega ozadja. Zavedamo se, da krivulja primarnega spektralnega ozadja ni nikjer linearna, pa vendar zadošča našemu namenu uporabe. Na delu spektra med P1 in P2 poiščemo nekaj točk, ki pripadajo bazi spektralnih vrhov. Iz praktičnih razlogov naj bo število izbranih točk do 10. oblika baze spektralnih vrhov je aproksimirana s štirinivojskim nevronskim sistemom (konfiguracija 1-4-8-1). Aproksimirana krivulja je shranjena v tabeli, ki vsebuje pare kinetične energije in vred- 5 ODSTRANJEVANJE BAZE SPEKTRALNIH VRHOV PRI AUGERJEVIH SPEKTRIH ČISTIH ELEMENTOV Posebej zanimiv sestavni del Augerjevega spektra je baza spektralnih vrhov. Pri vseh obravnavanih spektrih čistih elementov smo zaznali vse tri sestavne elemente. Raziskovalno delo ima cilj najti algoritme, ki bodo omogočili avtomatsko analizo Augerjevih spektrov. Pri tem smo izhajali iz predpostavke, da sta dva pomembna dela spektra tista, ki dejansko onemogočata avtomatsko analizo. Informacija o opazovanem materialu pa se izraža ne samo v spektralnih vrhovih, njihovi obliki in poziciji, pač pa tudi v bazi spektralnih vrhov. s tem ko smo Augerjeve spektre razdelili na tri ločene dele, smo dobili Slika 6: Izločena baza spektralnih vrhov za nekaj Augerjevih spektrov čistih elementov možnost, da prvič ločeno opazujemo in analiziramo vsak del spektra posebej. Oblika baze spektralnih vrhov je pri vseh opazovanih elementih presenetljivo podobna (slika 6). 6 SKLEP Zastavili smo si cilj pripraviti testno okolje, namenjeno analizi in primerjavi različnih tehnik in algoritmov za analizo Augerjevih spektrov. Pri Augerjevih spektrih in njihovi avtomatski analizi se srečamo s problemom spektralnega ozadja in šuma. Variabilnost obeh praktično onemogoča avtomatsko analizo. Predvidevamo, da prav zato do danes ne poznamo uporabnih orodij za avtomatsko analizo spektrov. Spektralno ozadje in šum lahko odstranimo s številnimi orodji, ki so bila razvita za druge namene. Ta orodja se ne ukvarjajo s fizikalnimi ozadji, ki so privedla do nastanka ozadja in šuma, njihova naloga je, da te moteče elemente odstranijo, in sicer ne glede na njihov nastanek. Gre za pogosto zelo zahtevne nu-merične operacije. Augerjev spekter je v digitalizirani obliki namreč samo množica števil. Zelo kratko smo predstavili korake, ki smo jih naredili v smeri avtomatske analize spektrov (več o tem v [12]). Pri dveh procesih, in sicer pri določanju osnovnih sestavnih elementov Augerjevih spektrov ter pri aproksimaciji oblike baze spektralnih vrhov, smo uporabili nevronske sisteme. Pomembna izkušnja, ki smo jo pri delu pridobili, je, da se informacije o sestavi analiziranih materialov izraža tudi v delu spektralnega ozadja. Baza spektralnih vrhov je eden takšnih elementov, saj vsebuje informacijo o globlje ležeči sestavi analiziranega materiala. Zlahka bi ta del spektra brez upoštevanja enostavno odstranili. 7 LITERATURA [1] C. J. Powella, A. Jablonski, W. S. M. Werner, W. Smekal, Appl. Surf. Sci., 239 (2005) 470-480 [2] C. R. Brundle, C. A. Evans, Jr., S. Wilson, Encyclopedia of Materials Characterization, Manning Publications & Reed Publishing, 1992 [3] J. T. Grant, D. Briggs, Surface Analysis by Auger and X-ray Photoelectron Spectroscopy, IM Publications, Chichester, 2003 [4] M. Thompson, M. D. Baker, A. Christie, J. F. Tyson, Auger Electron Spectroscopy, John Wiley & Sons, Chichester, 1985 [5] V. Mazet, C. Carteret, D. Brie, J. Idier, B. Humbert, Chemometr. Intell. Lab., 76 (2005) 2, 121-133 [6] J. A. Venebles, Introduction to Surface and Thin Film Processes, Cambridge University Press, 2000 [7] J. T. Grant, Appl. Surf. Sci., 13 (1982), 35-62 [8] J. T. Grant, J. Vac. Sci. Technol. A, 2 (1984) 2, 1135-1140 [9] M. F. Koenig, J. T. Grant, Surf. Interface Anal., 7 (1985) 5, 217 [10] R. M Golden, Mathematical Methods for Neural Network Analysis, MIT Press, 1996 [11] I. Belič, Vacuum, 80 (2006), 1107-1122 [12] P. Besnik, I. Belič, M. Jenko, The Auger spectra recognition and modelling, Lambert Academic Publishing, Saarbrucken, 2011