Nov način razpoznavanja masnih spektrov New Approach to Mass Spectra Recognition Belič 1.1 VŠNZ, Ljubljana L. Gyergyek, FER, Ljubljana Masna spektroskopija je le ena mnogih analitskih metod, kjer se veliko dela vlaga v avtomatsko razpoznavanje signalov. Razvito je bilo veliko število numeričnih algoritmov za razpoznavanje spektrov, pri čemer je njihova uporabnost precej različna. Zelo veliko algoritmov odpove, kadar je osnovnemu signalu iz masnega spektrometra primešan šum. Prispevek opisuje uporabo na novo razvitega nevronskega sistema za razpoznavanje masnih spektrov. Rezultati delovanja so primerjani z nekaterimi klasičnimi metodami razpoznavanja. Nevronski sistem je predstavljen v obliki filtra in v obliki sistema za kvalitativno analizo signala. Predstavljeni nevronski sistem je možno uporabiti splošno tudi za druga področja spektrometri je. Ključne besede: masna spektrometrija, nevronski sistemi, razpoznavanje spektrov, simulacija spektrov The mass spectra detection and automatic recognition is one of many analitical methods widely used. Several algorithms i/vere developed for automatic spectra recognition that are more or less effective and accurate. The use of algorithms is often limited by the noise superimposed to the original signal. The paper describes the use of specially designed neural netvvorks for mass spectra recognition. The results of our vvork are compared vvith data obtained by procedural Singular Value Decomposition methods. Neural netvvorks are introduced and tested as the signal filtering tool as vvell as the mass spectra qualitative analysis system. The described system can be used generally and not only for the mass spectra recognition. Key vvords: mass spectrometry, neural netvvorks, spectra recognition, spectra simulation 1. Uvod Avtomatsko razpoznavanje komponent masnega spektra je zahteven postopek. Pri klasičnih postopkovnih metodah razpoznavanja predstavlja osnovni problem šum, ki popači izhodni signal masnega spektrometra in povzroči, da so rezultati analize neuporabni. Namen dela je poiskati principe, kako iz originalnega signala izločiti šum in omogočiti kolikor mogoče natančno analizo. V delu4 sje zelo natančno opisan postopek razpoznavanja in detek-cije komponent masnega spektra v kvalitativni in kvantitativni obliki. Prav tako so nakazane težave, ki pri tem nastopajo. Pri signalih, kjer lahko prisotnost molilnih šumov omejimo na zanemarljivo vrednost, lahko z veliko natančnostjo izvedemo razpoznavanje spektrov po klasičnih postopkih (Singular Value Decomposition)4. Zelo pomembno je poznavanje narave motilnih šumov, ki nastopajo pri masni spektroskopiji. Prva vrsta so šumi elektromagnetnega izvora, ki so v vakuumskih sistemih, v katere je masni spekter vključen, zelo pogosti. Obstaja cela vrsta elektronskih filtrov, ki zmanjšajo velikost omenjenih šumov na naj- mag. Igor BELIČ VŠNZ Komikov a S. 61 (XX) Ljubljana manjšo možno mero. Za postopek razpoznavanja komponent masnih spektrov lahko tovrstne šume zanemarimo. Druga vrsta motilnih signalov pa so spektri, ki jih sistem pri razpoznavanju ne upošteva. Algoritmi za razpoznavanje komponent masnega spektra razpoznavajo le tiste komponente atmosfere, ki so vnaprej pričakovani. Če se pojavi snov. ki ni bila vključena v osnovni nabor, se razpoznavanje poruši. Obstaja več načinov, kako se izogniti omenjenemu problemu. Najlaže je povečati število komponent. ki se v sistemu lahko pojavijo. Tak način zahteva veliko zmogljivost računalnika, ki izvaja razpoznavanje. Razen tega tudi nikoli nismo povsem sigurni, da se vendarle v sistemu ne bi pojavila snov. ki je ni v osnovnem naboru. Alternativa je filtriranje vhodnega signala s filtrom, ki omogoča odstranjevanje motilnih komponent. V našem primeru je nevronski sistem uporabljen v vlogi filtra za odstranjevanje motilnih vplivov. Nevronski sistem izvaja kvalitativno analizo vhodnega signala. 2. Uporabljen nevronski sistem Za izvajanje kvalitativne analize masnega spektra je bil uporabljen večnivojski nevronski sistem brez povratnih povezav. Slika 1 prikazuje en nivo nevronskega sistema. Nevronski sistem deluje kot posebna izpeljanka asociativnega pomnilnika1ki smo ga poimenovali pomnilnik z vektorskim intervalnim naslavljanjem (pomnilnik bo v drugih prispevkih podrobno opisan). Naloga pomnilnika z vektorskim intervalnim naslavljanjem je izvajanje preslikave vhodnega prostora v izhodni pojmovni prostor. Pojmovni prostor vsebuje množico pojmov, kot npr. 11,0. N, itd. Ob nekem poljubnem vhodnem signalu, se v pojmovnem prostoru izberejo tisti pojmi, ki ustrezajo posameznim komponentam atmosfere v vakuumski komori. Proces učenja je postopek1'21, ki zgradi ustrezno funkcijo preslikave med vhodnim in pojmovnim prostorom. V našem primeru je bil uporabljen nadzorovani postopek učenja. Slika 1: En nivo uporabljenega nevronskega sistema Figure 1: One level of the used neural network system 3. Uporaba nevronskega sistema za detekcijo komponent masnih spektrov Sestavni elementi atmosfere v vakuumskem sistemu imajo poznane oblike spektrov. Označimo spekter i tega plina z X,. X, je n dimenzionalen vektor. Količina posameznega plina je v spektru izražena z multiplikacijsko konstanto, s katero se spekter plina pomnoži. V nekem časovnem trenutku je v vakuumskem sistemu atmosfera sestavljena iz vsote spektrov plinov. Enačba sestave masnega spektra je: n s=S kixi+ N (1 > ;=t kjer so: S : spekter atmosfere v vakuumskem sistemu n : število plinov, ki sestavljajo atmosfero k,: količina i - tega plina v atmosferi X,: spekter i - tega plina N: naključni šum. ki je dodan spektru Več je o problemu masne spektroskopije napisano v literaturi2. 4. Testiranje nevronskega sistema Testno nevronsko plast sestavljajo naslednji elementi: • Štirje nivoji nevronov s po 50 nevronov v nivoju. • Nevroni z 51 vhodi in sigmoidalno aktivacijsko funkcijo2, ki omejuje izhodne vrednosti celic v intervalu (-1. 1). • Naključni generator povezovalnih uteži med nevroni. Vrednost naključnega izbora uteži je omejena med vrednosti -0.8 in 0.8. Prvi test ugotavlja sposobnost nevronske plasti, da pravilno razporedi naučene spektre. Spektri so bili sistemu prikazani v relativni obliki. Delovanje sistema je bilo preizkušeno s sledenjem naslednjih korakov: • naključni izbor uteži; • učenje sistema; • preverjanje odziva plasti. Test zajema 100 ponovitev omenjenih korakov. V tabeli 1 so zbrani rezultati testov. Tabela prikazuje odstotke pravilnih razvrstitev vzorcev. V prvem stolpcu so zbrane vrednosti pri naslavljanu intervalnega pomnilnika z eno celico, v drugem pa z dvema. Tabela I: Rezultat testa razpoznavanja komponent masnega spektra. Masni spektri so bili sistemu predstavljeni v normirani obliki Table 1: Results of the mass spectra recognition process. Mass spectra were introduced to the system in normalized form pravilnost pravilnost razvrstitve v % razvrstitve v % nlini piiiii naslavljanje: naslavljanje: 1 celica 2 celici h: 100 100 He 99 100 ch4 97 100 nh, 100 100 H,O 100 100 Ne 99 100 C,H, 100 100 c;h4 98 100 100 100 co 100 100 c,h, 100 100 no 96 100 c,h6 100 100 c,hk 100 100 CO, 100 100 ch4o 100 100 0, 97 100 h,s 100 100 a 96 100 n.o 100 100 ch4o 99 100 C;h,0 98 100 no, 100 100 CH?0, 100 100 C4H,o 100 100 c3h6o 99 100 C,HC„ 100 100 Ocena rezultatov testa Ker je bila plast nevronov naučena razpoznavati točno določene vzorce, ki so obenem tudi vsi možni vzorci, ki jih sistem lahko v svojem delovanju dobi na vhodu, so intervali oz. razredi zelo ozko definirani. Napake, ki se pri razvrstitvi pojavijo v primeru naslavljanja intervalnega pomnilnika z eno celico so posledica naključne nelinearnosti preslikave, ki jo naredi nevronski sistem. Na pojav napake vpliva tudi širina izbranega intervala okoli vzorcev. Tabela 2: Rezultat testa razpoznavanja komponent masnega spektra. Masni spektri so bili sistemu predstavljeni v nenormirani obliki Table 2: Results ofthe mass spectra recognition process. Mass spectra vvere introduced to the system in unnormalized form pravilnost pravilnost pravilnost plini razvrstitve v % razvrstitve v % razvrstitve v % naslavljanje: naslavljanje: naslavljanje 1 celica 2 celici 3 celice H, 62 94 100 He 64 88 100 chj 66 84 100 nh, 64 92 100 hio 60 96 99 Ne 68 97 100 C,H, 63 100 100 C;H4 100 82 100 N, 94 97 100 co 85 99 100 c,h„ 70 84 100 no 69 90 100 c,h„ 90 100 100 c3h, 95 100 100 co, 78 94 100 ch4o 69 87 99 02 67 93 100 H,S 92 100 100 a 65 84 97 n,0 84 99 100 c,h4o 87 95 100 c,h,o 83 93 100 no, 65 92 100 ch,0, 77 90 100 cJhio 93 93 100 CTLO 71 100 98 c,hc„ 65 99 100 Ocena rezultatov testa Tudi v tem primeru se je sistem zelo dobro naučil razvrščanja vzorcev. Širina najmanjšega intervala okoli točke posameznega vzorca vpliva na število intervalov, kijih sistem ustvari v procesu učenja. V prisotnosti šuma, ki ga primešamo osnovnim spektrom se rezultat učenja precej poslabša. Zelo pomembna je naslednja praktična izkušnja. Če želimo, da bo sistem uspešno izvajal razpoznavanje signalov v prisotnosti dodanega šuma, mora tudi učenje potekati v prisotnosti šuma. Prisotnost šuma v procesu učenja sistema razširi intervale naslavlanja v posamezne razrede. Učenje sistema ob prisotnosti naključnega šuma lahko postane dolgotrajen postopek, nikakor pa postopek ni zapleten. Na rezultat učenja razvrščanja močno vpliva omejitev področja iz katerega naključni generator izbira vrednosti. Če so izbrane uteži prevelike, potem je prevajalna funkcija sistema v posameznih področjih zelo strma, na drugih pa se vrednost nahaja v nasičenju. Rezultat je stapljanje razredov (prekrivanje), ki onemogoči učenje. V drugem testu je bila plast nevronov enaka kot v prvem, le cilj je bil zastavljen nekoliko zahtevneje. Nevronski sistem seje učil razvrščati vhodne spektralne signale, pomnožene s poljubnimi konstantami (konstante A, v enačbi (1)). Vhodni vzorci so bili zato pripravljeni v absolutni in ne več v relativni obliki. Učenje se je pričelo z malimi vrednostmi konstante k,. Tabela 2 prikazuje, kako seje sistem naučil razvrščanja v stotih primerih naključno izbranih uteži in pri različnem številu uporabljenih celic za intervalno naslavljanje. 5. Sklep Razpoznavanje komponent, ki sestavljajo masni spekter je bilo narejeno s simulacijo masnega spektrometra in do sedaj v delo nismo vključili dejanske naprave. Zato je vrednost rezultatov manjša. Nevronski sistem, ki izvaja kvantitativno analizo masnega spektra je uporabljen kot filter za izločanje motilnih signalov. Filtriranju signala sledi kvalitativna analiza, izvedena s klasičnimi postopkovnimi metodami. Literatura 1 T. Kohonen, Self Organisation and Associative Memory, Berlin, Springer Verlag, 1985 G. Matsumoto. Neurocomputing - Neurones as Microcomputers, Future Generations Computer Systems, Elsevier Sci.Publ., 4, 1988. 39-51 B. Kosko. Neural Netvvorks and Fuzzy Systems, Englevvood Cliffs, Prentice Hali International Inc., 1992 4 I. Belič, Avtomatsko razpoznavanje komponent masnega spektra. Univerza v Ljubljani. FER, 1985 M. J. Drinkvvine, D. Lichtman, Partial pressure analyzers and analysis, American Vacuum Society Monograph Series, 1980