GEOLOGIJA 41, 435-475 (1998), Ljubljana 1999 _,__________......____ Klasifikacija satelitskih posnetkov z metodami umetne inteligence Satellite image classification with artificial intelligence methods Janez Hafner Geološki zavod Slovenije, Dimičeva 14, SI-1000 Ljubljana, Slovenija, Email:janez.hafner@geo-zs.si Ključne besede: digitalna obdelava podob, daljinsko zaznavanje, statistika, kla- sifikacija, umetna inteligenca, umetne nevronske mreže Key words: image processing, remote sensing, statistics, classification, artificial intelligence, artificial neural networks Povzetek Namen tega članka je predstaviti osnove obdelave satelitskih posnetkov, še zlasti njihove klasifikacije. V zvezi s tem je bila izvedena litološka klasifikacija širšega območja Kopra in Kozine. Standardne klasifikacijske metode, ki temeljijo na stati- stičnih načelih, se mnogokrat izkažejo za prešibke. Zato se strokovnjaki, ki se ukvarjajo z obdelavo digitalnih podob, trudijo osvojiti nove metode, ki bi jih pripe- ljale do uporabnejših rezultatov. Na tem mestu je potrebno poudariti, da metode opisane v tem članku niso uporabne le za interpretacijo satelitskih posnetkov am- pak se lahko uporabljajo tudi nad katerikoli drugimi prostorskimi podatki (geofizi- kalnimi, geokemičnimi ...). Ena od vej, ki na nov način poiskuša reševati klasifika- cijsko vprašanje so tudi umetne nevronske mreže (UNN). V članku je predstavljena tehnika strojnega učenja, ki kombinira nenadzorovano (ang. Self Organisig Maps - SOM) in nadzorovano učenje (ang. backpropagation - BPG). Primerjava s standar- dnim pristopom je pokazala, da uporaba umetnih nevronskih mrež mnogokrat boljše rešuje klasifikacijske probleme. Izkazalo se je, da je končna natančnost odvi- sna predvsem od števila razredov in njihove linearne ločljivosti. Z uporabo umetnih nevronskih mrež se odpirajo nove interpretativne možnosti. V učni proces lahko do- datno uvedemo X in Y koordinati, kar pri standardnih metodah zaradi njihovih omejenih sposobnostih pri razdelivi multivariatnega prostora vhodnih podatkov ni smiselno. Abstract The scope of this article is to acquaint Slovene geologic public with rudiments of image processing of satellite data and especially with classification issue. These me- thods are not useful only with remotely sensed data hut can be also used with any other kind of spatial data (geophysical, geochemical Ö). Standard classification me- thods based on statistical principles do not always give satisfactory results. There- fore a variety of new approaches are being tested in order to achieve better accu- racy. One of the most promising fields is artificial intelligence where artificial neu- ral networks (ANN) have proven to be useful. In this article two methods have been 436_Janez Hafner Uvod Članek obravnava interpretacijo podatkov pridobljenih z metodami daljinskega zaznavanja (ang. remote sensing), njihovo uporabo v geologiji in perspektive, ki se odpirajo na tem področju. Poseben poudarek je dan naprednim klasifikacijskim me- todam večspektralnih satelitskih posnetkov. Uporaba satelitskih posnetkov se je zlasti razmahnila po letu 1972 z lansiranjem satelita Landsat, ki je začel zbirati velike količine komercialnih satelitskih posnet- kov. Za vsak košček zemlje velikosti 57 x 79 metrov je satelit vsakih 18 dni izmeril elektromagnetno sevanje v štirih različnih pasovih valovne dolžine. Sledila je cela vr- sta satelitov, ki so sistematično zbirali podatke o zemeljskem površju. Količine po- datkov pridobljene na ta način so tako velike, da jih ni mogoče obdelati drugače kot z uporabo računalniških metod. Trdimo lahko, da je pojav satelitskih posnetkov po- vzročil hiter razvoj tehnik računalniške obdelave podob (ang. image processing). V zadnjih nekaj letih razvoj na tem področju poteka v smeri iskanja novih metod, ki naj bi v bodočnosti nadomestile v tem trenutku standardni pristop z uporabo statističnih klasifikatorjev. Kot uporabne so se pokazale metode umetne inteligence, še zlasti uporaba umetnih nevronskih mrež in mehke logike. V nadaljevanju je izvedena klasi- fikacija satelitskega posnetka širšega območja Kopra in Kozine s standardnimi kla- sterskimi metodami in z uporabo posebne nevronske mreže - Samo Organizirajoče Matrike (SOM) ter njeno nadgradnjo z uporabo gradientnih algoritmov - FMC (Fea- ture Map Classifier). Digitalna obdelava podob Digitalna obdelava satelitskih posnetkov se šteje za enega najpomembnejših delov obdelave podob (ang. image processing). Te metode so zadosti univerzalne, da lahko z računanikom obdelamo praktično katerokoli podobo - od fotografij, posnetih iz zra- ka do geofizikalnih podatkov (K v a m m e et al., 1997). Digitalno podobo si matema- tično lahko predstavljamo kot funkcijo /(x, y). To pomeni, da je barva (ali osvetlitev) rasterske celice funkcija njenega položaja (x, y). V nadaljevanju so vse podobe obra- vanavane v sivih odtenkih - barvne slike so namreč le združba treh osnovnih barv (rdeča, zelena, modra) in jih zato lahko obdelujemo enako kot sivinske. Digitalna po- doba je rezultat vzorčenja in kvantiziranja nekega objekta ali njegove podobe. V po- stopku kvantiziranja vsaki točki rastra dodelimo določeno število, ki kot sivi odtenek predstavlja osvetlitev te točke. V večini primerov je opisu namenjen en podatkovni bajt, kar pomeni, da v tem primeru dobimo na voljo 256 različnih vrednosti osvetli- tve. V primeru Landsat-5 (TM skener) posnetka, to pomeni, da je vsaka celica veliko- sti 30 krat 30 metrov predstavljena z nizom sedmih sivih vrednosti od O do 255. Te- matski kartograf (TM - Thematic Mapper) je predelan multispektralni skener druge tested, unsupervised learning with Self Organising Maps and supervised learning with backpropagation network. In comparison with standard approach better re- suits were gained especially in more complicated cases where classes are not line- arly separable. One of the advantages of ANN is that X and Y coordinates can be incorporated in learning process. In this way much better accuracy is achieved. This kind of model has ability to favour certain classes according to spatial position of ; J input data, but has disadvantage of not being the general model. It is strictly apli- cable only to examined area. Kvalifikacija satelitskih posnetkov_437 Osnove klasifikacije V osnovi ločimo dva tipa klasificiranja: nadzorovani in nenadzorovani. Pri nadzo- rovanem načinu v klasifikacijski način vstopa poleg vhodnih podatkov tudi pravilna razvrstitev v razrede medtem, ko pri nenadzorovanem načinu algoritem samostojno sklepa na podobnost med vhodnimi podatki. Za boljše razumevanje procesa razvrščanja opazovanj v prostoru si oglejmo proces klasifikacije iz nekoliko drugačnega zornega kota (B r a t k o et al, 1998). Vzemimo, da se nek pojav v prostoru U obnaša po zakonitosti C. Zakonitost C predstavlja torej podmnožico v prostoru U C: Cc U. Naš cilj je izdelati hipotezo C, ki za vse objekte (opazovanja) X iz prostora U pra- vilno ugotovi ali so ali niso del podmnožice, ki jo definira C. Pri tem je napaka hipo- teze enaka (C-C) u (C-C), delež pravilno klasificiranih objektov pa je enak I U-(C-C')-(C'-Cl I lui Hipotezo C lahko izrazimo na vrsto različnih načinov. Tako je na primer v eksper- tnih sistemih hipoteza C predstavljena v obliki .^pravil: If spremenljivka 1 ' Nevron kot preklopni element ;i> ;:: Analogijo biološkemu nevronu v teoriji umetnih nevronskih mrež predstavlja ume- tna nevronska celica (v nadaljevanju nevron), ki je osnovni gradnik zveznih modelov. Delovanje nevrona (glej sliko 10) poteka tako, da vsak nevron glede na prispele im- pulze izračuna svojo izhodno vrednost - aktivacijo in jo posreduje naslednjem nevro- nu. Praviloma vsi nevroni uporabljajo enake algoritme za računanje svoje aktivacije. Vstopni podatki so aktivacije spodaj ležečih nevronov in njihove uteži, kjer oznaka w,j predstavlja utež od nevrona u, proti nevronu Uj. V i-tem nevronu se aktivacija w, izračuna na naslednji način (Gallant, 1993): 1. Nevron najprej izračuna obteženo vsoto aktivacij iz direktno povezanih spodaj ležečih nevronov: 2. V naslednjem koraku s pomočjo preklopne funkcije izračuna aktivacijo u,=f(SJ SI. 10. Umetni nevron - preklopna celica (Gallant, 1993) Kvalifikacija satelitskih posnetkov 457 V nadaljevanju sta na kratko opisana dva modela nevronskih mrež, ki skupno tvo- rita FMC (ang. Feature Map Classifier) mrežo: BPG in SOM. ' BPG (ang. BackPropagation) - BPG nevronska mreža je verjetno v tem trenutku najbolj razširjena, najlažje ra- zumljiva in najbolj pogosto uporabljena nevronska mreža za reševanju klasifikacij- skih problemov. Bistvo BPG mreže je njena večnivojska struktura in sistem učenja, razvit ter izpopolnjen v sedemdesetih in osemdesetih letih (Werbos, 1976, Mc Clelland inRumelhart, 1986 ter Parker, 1985). Nevroni so organizirani v večih nivojih (glej sliko 11), tako da signal potuje od spodnjega nivoja proti zgornje- mu. Prvi nivo imenujemo tudi vhodni nivo. Vanj vstopajo vhodni podatki. V primeru klasifikacije satelitskega posnetka ga sestavlja 7 nevronov (za 7 spektralnih kanalov). Klasifikacija poteka na nmaslednji način. Signal se iz vhodnega nivoja preko ob- teženih povezav med nevroni prenese na višje ležeče skrite nivoje vse dokler ne do- seže zadnjega izhodnega nivoja, ki predstavlja ciljne klasifikacijske razrede. Vsak od nevronov v tem razredu predstavlja po en razred. Ko signal doseže izhodni nivo, se v njem izračunajo obtežene vsote. Nevron z največjo obteženo vsoto je proglašen za zmagovalca, kar pomeni, da se vhodnim podatkom pripiše razred, ki ga ta nevron predstavlja. SI. 11. Večnivojska nevronska mreža 458 Janez Hafner BPG mreža je svoje ime dobila po nadzorovanem načinu učenja, ki poteka v dveh korakih. V prvem koraku signal potuje preko celotne mreže do izhodnega nivoja. V izhodnem nivoju se dobljeni rezultat primerja z že prej znanim pravilnim rezultatom. Na ta način se izračuna napaka mreže. V drugem koraku napaka potuje navzdol po mreži, od izhodnega proti vhodnemu nivoju. Za vsako povezavo (utež) med nevroni se najprej izračuna njen prispevek k napaki ter nato utež premakne v smeri zmanjšanja skupna napake. Proces učenja je iterativen in poteka dokler se napaka ne ustali ñ se z nadaljnim učenjem ne zmanjšuje več. Matematično ozadje je dokaj zapleteno in presega okvire tega članka. Zato svetu- jem bralcu, ki ga področje bolj zanima, da si ogleda strokovno literaturo (Gallant, 1993). SOM - Samo Organizirajoče Matrike n V prejšnjem poglavju je opisana tipična metoda za nadzorovanega učenja, ki zah- teva, da v procesu učenja mreži skupaj z vhodnimi podatki predstavimo tudi pravilne rezultate. Poleg takih metod so se zelo uveljavili tudi postopki nenadzorovanega učenja, ki med seboj združujejo podatke glede na njihovo podobnost. Izjemno zani- mivo področje samoorganiziranja pri nevronskih mrežah je prvi načel Kohonen (K o h o n e n , 1984), ki ni le razvil ustrezne teorije ampak jo je tudi na široko uvelja- vil in vpeljal v reševanje praktičnih problemov. Kadarkoli upravljamo z večdimenzionalnimi podatki, se vedno zastavlja vprašanje njihove najboljše predstavitve. S teorijo SOM (ang. Self Organising Maps) je Koho- nen razvil učinkovit sistem predstavitve podatkov v dvodimenzionalnem (lahko tudi več-dimenzionalnem) prostoru. SOM mreža je sestavljena le iz dveh nevronskih nivo- jev, vhodnega in Kohonenovega (izhodnega) nivoja, kjer nevroni Kohonenovega nivo- ja tvorijo dvodimenzionalno matriko (glej sliko 12). Na ta način lahko vsakemu nev- Sl. 12. Struktura SOM (Gallant, 1993) Kvalifikacija satelitskih posnetkov__ 459 Prednosti in slabosti umetnih nevronskih mrež Delo z umetnimi nevronskimi mrežami lahko pod pogojem, da nam je dostopna ustrezna programska oprema, izpade dokaj enostavno - podatki se vstavijo v mrežo, požene se učni proces in počaka na rezultat. Vendar pa v praksi resničnost izgleda povsem drugače. Kdor želi dobiti dobre rezultate, to je rezultate, ki so boljši ali vsaj enaki od tistih pridobljenih s standardnimi statističnimi metodami, mora k delu pri- stopiti na resen način. Umetne nevronske mreže, tako kot vsaka druga znanstvena metoda, lahko dajo dobre rezultate, kakšni pa ti bodo je odvisno predvsem od izbora metode ter od načina uporabe. Danes v svetu obstaja široka paleta različnih nevron- skih mrež - razvoj se odvija s tako naglico, da se vsako leto pojavi nekaj novih mode- lov. Vsak od njih vsebuje svoje posebne značilnosti, ki ga razlikujejo od ostalih. Izbor metode je odvisen predvsem od vrste problema ter od strukture vhodnih podatkov. Vsaka metoda nadalje predstavlja nepregledno množico različnih variant. Z izborom števila nevronskih nivojev, povezav med njimi, števila nevronov v posameznih nivo- jih, pragovnih funkcij, učilnih algoritmov, Ö, doseže število možnih kombinacij ne- sluteno razsežnost. Trenutno še ni razvite metodologije za pravilno določitev prej omenjenih parametrov. Uporabnik je zato prepuščen samemu sebi, da z uporabo in- tuicije in s čim večjim številom poiskusnih mrež najde optimalno rešitev. Vendar pa se tudi v primeru, da je izbrana metoda optimalna in je mreža pravilno zgrajena lah- ko zgodi, da bo končni rezultat slabši od naših pričakovanj. Predvsem v primerih, ko rešujemo linearne oziroma skoraj linearne pojave, se izkaže, da se z uporabo umetnih nevronskih mrež v najboljšem primeru lahko le približamo statističnim rešitvam. Za- radi vsega prej naštetega je za uporabnika zelo pomembmno, da se zaveda tako pre- dnosti, kot tudi slabosti umetnih nevronskih mrež. ronu Kohonenovega nivoja določimo njegove sosede. V fazi učenja se uteži med obe- ma nivojema samo organizirajo tako, da podobni vhodni podatki aktivirajo bližnje ležeče izhodne nevrone. S tem je doseženo, da razdalja med nevroni predstavlja mero za podobnost. Zgled za tako strukturo najdemo v možganih sesalcev, kjer dražljaji bližnjih točk na telesu sprožajo tudi bližnje nevronske celice v možganih. Moč SOM je v sposobnosti hitrega organiziranja velikega števila podatkov v n-di- menzionalno matriko. To je v bistvu nelinearna projekcija verjetnostne gostotne funkcije visoko-dimenzijskih podatkov v dvo ali več dimenzionalni prostor (K o h o - n e n et al., 1995). Na ta način lahko učinkovito preučujemo strukturo vhodnih po- datkov in ugotavljamo relacije med njimi. Če primerjamo to metodo s klasičnimi sta- tističnimi clustreskimi metodami, je njena glavna prednost v nelinearnosti projekcije. V procesu samoorganiziranja je včasih zaželjeno, da vhodne vektorje povežemo z že znanimi končnimi rezultati (klasifikacija) podobno kot to dela BPG mreža. V ta- kem primeru se SOM razširi z dodatnim izhodnim nivojem. Uteži med Kohonenovim nivojem in izhodnim nivojem nato določimo z BPG pravilom. Na ta način dobimo FMC (Feature Map Classifier) nevronsko mrežo. 460 /i Janez Hafner Prednosti Umetne nevronske mreže odlikujejo predvsem naslednje lastnosti: i • Sposobne so se učiti iz podatkov. Tudi v primerih, ko nam ni dostopno znanje o za- konitostih, ki vplivajo na nek pojav, lahko z uporabo nevronskih mrež uspešno mo- deliramo njegovo delovanje. • Rešitve pridobljene na tak način so nelinearne. • Vsebujejo prirojeno sosobnost posploševanja. • Odlično rešuje težave, ki pri statističnih metodah lahko nastanejo zaradi medse- bojne odvisnosti vhodnih spremenljivk. • Zaradi velike sposobnosti posploševanja zelo dobro rešujejo težave, ki nastanejo zaradi šuma v vhodnih podatkih. • Tudi v primerih, ko v mrežo vstopajo le delni vhodni podatki, torej ko del podat- kov manjka, so nevronske mreže zaradi razpršenega zapisa znanja v utežeh sposo- bne izdelati relativno dobre rešitve. To pomeni, da so sposobne sklepati, kakšen naj bi bil manjkajoči del podatkov. • Ko je mreža enkrat naučena, lahko z njo zelo hitro obdelujemo podatke. Slabosti Ob vsestranski uporabnosti se je potrebno zavedati tudi slabih strani nevronskih mrež. Mnoge od njih so bile omenjene že v prejšnjih poglavjih, kljub temu pa je dobro če si jih na tem mestu še enkrat ogledamo v združeni obliki. Z vsakodnevnim razvo- jem sicer prihajajo nove in nove rešitve, vendar so uporabniki trenutno še vedno soočeni z naslednjimi slabostmi: • Za uspešno učenje potrebujemo veliko število kvalitetnih vhodnih podatkov. V pri- meru, da podatki niso kvalitetni, je taka tudi rešitev (ang. garbage in - garbage out). • Iskanje optimalne nevronske mreže ter njeno učenje je lahko zelo dolgotrajen pro- ces. • Razen ART druge nevronske mreže ne rešujejo problema hkratnega pomnenja no- vih in ohranjanja starih vzorcev. Zato je zelo pomembno, da so vhodni podatki pravilno strukturirani - v primeru klasifikacijskih nevronskih mrež morajo biti v vhodnih podatkih vsi razredi enako zastopani. • Pri gradientnih učilnih algoritmih se pojavlja problem lokalnih minimumov. • Rešitve, ki jih pridobimo, so ponavadi nejasne. V večini primerov je nemogoče ugotoviti kakšne so zakonitosti, ki privedejo sistem do pravilnega delovanja. V li- teraturi pogosto nevronske mreže primerjajo s črno skrinjico - na eni strani podat- ki vstopajo, na drugi izstopajo, kakšni so notranji mehanizmi pa ostaja očem skri- to. Iz tega sledi, da moramo biti zelo previdni pri izboru metode s katero želimo in- terpretirati podatke. Vnaprej moramo določiti namen našega dela. Če želimo le po- staviti nek model, ki bo pravilno deloval in nas mehanizmi ne zanimajo, so nev- ronske mreže vsekakor priporočljive. Nasprotno pa v primeru, ko želimo analizira- ti postopke in dognati zakonitosti, nevronske mreže le redkokdaj pridejo v poštev. • Težave zaradi »pretreniranosti«. Cilj procesa učenja je doseči čim boljše prilagaja- nje učnim podatkom. S spreminjanjem uteži v mreži skušamo delovanje modela privesti do čim manjše napake. Seveda pa je glavni cilj izdelati model, ki ne bo de- loval le na učnih podatkih ampak se bo enako dobro obnesel tudi na katerikoli Kvalifikacija satelitskih posnetkov 461 drugih podatkih. Zato je potrebno v postopku učenja neprenehoma izvajati tudi postopke testiranja. V ta namen je potrebno uporabiti testne podatke, ki niso ena- ki učnim. Preučevanje napake (glej sliko 13) kaže na to, da se ta za učne in testne podatke ne zmanjšuje enako hitro. V neki točki pa se napaka na testnih podatkih začne povečevati kljub temu, da se nad učnimi podatki še naprej zmanjšuje. V tej prevojni točki je dosežen trenutek, ko rečemo, da je od tu naprej mreža »pretreni- rana«. Predolg proces učenja vodi v efekt slabega posploševanja. Z drugimi bese- dami lahko rečemo, da je mreža izgubila sposobnost posploševanja, pričel pa se je proces memoriranja učnih podatkov. S tem se v utežeh v bistvu zapisuje vsak učni podatek posebej, hkrati s tem pa se izgublja sposobnost uspešne obdelave doslej še neznanih podatkov. Učenje je potrebno v prevojni točki prekiniti. Načeloma bi na- pako nad učnimi podatki lahko poljubno zmanjšali z povečevanjem števila nevro- nov, vendar pa bi hkrati s tem izgubili sposobnost posploševanja. SI. 13. Napaka na učnih in testnih podatkih ni enaka Klasifikacija satelitskega posnetka z uporabo FMC V nadaljevanju sledi prikaz klasifikacije z FMC (ang. Feature Map Classifier). To je metoda, ki kombinira nenadzorovano učenje SOM in nadzorovano učenje po meto- di BPG. Uporabljena mreža je bila sestavljena iz: • vhodnega nivoja nevronov, ki vsebuje sedem vhodnih nevronov od katerih vsak predstavlja po en kanal Landsat TM posnetka. • SOM nivo oziroma Kohonenov nivo sestavlja matriko 20 * 20 nevronov, kar pome- ni, da je sestavljen iz 400 nevronov. • Izhodni nivo nevronov je bil odvisno od primera (števila razredov) sestavljen iz 16, 9 in 5 izhodnih nevronov od katerih vsak predstavlja po en razred. Učenje je potekalo v dveh korakih. V prvem je bil izveden nenadzorovani del učenja, v katerem so se določile uteži med vhodnim in Kohonenovim nivojem. S tem se je izvedla samo-organizacija matrike. To pomeni, da bližnji nevroni zmagujejo 462_Janez Hafner Rezultati dobljeni z uporabo FMC so zanimivi iz dveh zornih kotov. Po eni strani si lahko ogledamo natančnost klasifikacije, po drugi strani pa so še zlasti zanimivi re- zultati nenadzorovane faze učenja - samoorganizacije nevronov v Kohonenovem ni- voju. Ti predstavljajo dvodomenzionalno karto (v tem primeru razsežnosti 20*20), kjer je vsakemu nevronu predpisana pripadnost v določeni razred. Na ta način za vsak razred dobimo SOM karto, kjer s temnejšo barvo označimo nevrone, ki bolj po- gosto zmagujejo (imajo višjo vsoto vseh prispevkov iz vhodnega nivoja) in obratno s svetlejšo barvo označimo nevrone, ki ne izkazujejo pripadnosti k razredu. Pri lito- loški klasifikaciji v 16 razredov dobimo 16 SOM kart - za vsak razred po eno, kjer lahko glede na podobnost pojavljanja preučujemo podobnost oziroma razliko med ra- zredi. Take karte so zlasti uporabne pri umetno postavljenih kategorizacijah (npr razdelitev terena glede na stabilnost), kjer je na ta način možno odpraviti slabosti v klasifikaciji, oziroma na novo postaviti razrede, ki so med seboj bolje ločljivi. V pri- meru litološke klasifikacije temu ni tako, saj so razredi že vnaprej trdno določeni gle- (vsota vseh prispevkov iz vhodnega nivoja je najvišja) kadar so si vhodni podatki po- dobni. V drugi fazi učenja uteži Kohonenovega nivoja mirujejo, nadzorovano učenje pa po BPG metodi poteka med Kohonenovim in izhodnim nivojem. Za učenje in testi- ranje sta bili izdelani dve datoteki s po 4000 vhodnih in izhodnih podatkov v vsaki. Učenje je potekalo tako, da je v vsakem iteracijskem koraku v učni proces vstopilo 200 naključno izbranih vektorjev (vhodnih podatkov) in njim pripadajočih razredov. Na tej osnovi je bila izračunana napaka, utežni vektorji pa so se za majhen delež pre- maknili v smeri največjega zmanjšanja napake. Za uspešno organiziranje SOM nivoja je bilo potrebnih 80000 iteracij, učenje izhodnega nivoja pa je v odvisnosti od števila izhodnih razredov nihalo od 250000 za 16 razredov do 150000 za 5 razredov. Pri večjem številu iteracijskih korakov so se že pokazali prvi znaki »pretreniranosti«. Klasifikacija -16 razredov Začetna klasifikacija je bila izvršena nad vsemi 16 izhodiščnimi razredi: 1. Q melišča in pobočni grušč 2. Q aluvij 3. Q morski sedimenti 4. 'E., fhš 5. lapor „, v: 6. Pc, E alveolinski in numulitni apnenec 7. Рсг miliolidni apnenec 8.2PC1 kozinski skladi 9. K,Pc apnenec z giropleurami 10. črni ploščasti apnenec ; 11. K| rudistni apnenec 12. К^/ apnenci z radioliti 13. KI apnenec 14. KY rudistni apnenec z vložki dolomita 15. Ki 2 dolomit, breča in apnenec 16. Ki 2 pretežno dolomit Kvalifikacija satelitskih posnetkov____463 de na geološko podlago (karto). Iz slike 14 je razvidno, da so zares dobro diferenciirani le morski sedimenti, lapor in Ki 2 dolomit, breča in apnenec, medtem ko ostali razredi pokrivajo podoben prostor oziroma niso lahko ločljivi med sabo. Kljub vsemu se da ugotoviti, da nadaljnje združevanje razredov lahko poteka po enakem postopku kot pri delu s standardnimi metodami: • R6, R7,R8,R9,RllinR13 • R5inR12 • R2 in R4 464 Janez Hafner SI. 14. SOM karte za 16 razredov Kvalifikacija satelitskih posnetkov 465 Nekoliko vprašljivo je le združevanje razredov R5 in R12, saj bi razred R12 veliko lažje uvrstili v razred, ki združuje razrede R6, R7, R8, R9, Ril in R13. Zaradi primer- ljivosti s standardnimi metodami je bilo v nadaljevanju izvedeno prvotno zastavljeno združevanje razredov. Po zaključku nenadzorovane faze učenja, torej ko je SOM nivo že naučen in so uteži do vhodnega nivoja določene, je bila izvedena še nadzorovana faza učenja po metodi BPG. Za uspešno izvedeno učenje je bilo potrebnih še 250.000 učnih iteracij. Na ta način je bil izdelan FMC klasifikator za 16 razredov V nadaljevanju je bila nad satelitskim posnetkom obravnavanega področja z uporabo FMC klasifikator j a izde- lana klasifikacija. Rezultati so podani v tabelah 10 in 11 in na sliki 15. Tabela 10. Pravilnost klasifikacije z FMC metodo za 16 razredov 466 Janez Hafner SI. 15. Rezultat FMC klasifikacije za 16 razredov (zgoraj) in enaka klasifikacija z uporabo X in Y koordinat (spodaj) Kvalifikacija satelitskih posnetkov 467 Tabela 11. Klasifikacijska tabela za FMC klasifikacijo v 16 razredov Klasifikacija - 9 razredov Klasifikacija za 9 razredov je zaradi lažje primerljivosti z statističnimi metodami potekala nad istimi devetimi razredi kot v poglavju o klasifikaciji s standardnimi metodami. Ciljni razredi so torej: 1. Q melišča in pobočni grušč 2. Q aluvij + -'E^ fliš 3. Q morski sedimenti 4. ^-E., lapor + K;'apnenec z radioliti 5. Pc,E alveolinski in numulitni apnenec + Pc¿ miliolidni apnenec + ¿Pc^ kozinski skladi + K, P C apnenec z giropleurami + K¡ rudistni apnenec + K¡ apnenec 6. KI črni ploščasti apnenci 7. K;'^ rudistni apnenec z vložki dolomita 8. K, 2 dolomit, breča in apnenec 9. Ki 2 pretežno dolomit FMC klasifikacija za 9 razredov je potekala na enak način kot pri razvrščanju v 16 razredov, le da je izhodni nevronski nivo vseboval le 9 nevronov. Rezultati so podani v tabelah 12 in 13 ter na sliki 16. 468 Janez Hafner Tabela 12. Natančnost za FMC klasifikacijo z 9 razredi Tabela 13. Klasifikacijska matrika za FMC z 9 razredi Kvalifikacija satelitskih posnetkov 469 SI. 16. Rezultat FMC klasifikacije za 9 razredov (zg.) in enaka klasifikacija z uporabo X in Y _ koordinat (sp.) 470 Janez Hafner Klasifikacija - 5 razredov V zadnjem primeru klasifikacije z FMC je v proces učenja vstopilo pet razre- 1. Q melišča in pobočni grušč + Q aluvij + fliš 2. Q morski sedimenti 3. '^Eglapor + Kl'' apnenec z radioliti + Pc,E alveolinski in numulitni apnenec + РСз miliolidni apnenec + ¿Pc^ kozinski skladi + K,Pc apnenec z giropleurami + K2 ru- distni apnenec + KI apnenec + K¡ črni ploščasti apnenec + K/ rudistni apnenec z vložki dolomita 4. K, 2 dolomit, breča in apnenec < 5. Ki.2 pretežno dolomit dov:FMC klasifikacija za 9 razredov je potekala na enak način kot pri razvrščanju v 9 in 16 razredov, le da je izhodni nevronski nivo vseboval le 5 nevronov. Rezultati so podani v tabelah 14 in 15 ter na sliki 17. Tabela 14. Natančnost za FMC klasifikacijo s 5 razredi Tabela 15. Klasifikacijska tabela za FMC klasifikacijo s 5 razredi Kvalifikacija satelitskih posnetkov 471 81.Д7. Rezultat FMC klasifikacije za 9 razredov (zg.) in enaka klasifikacija z uporabo X in Y koordinat (sp.) 472 Janez Hafner Analiza uspešnosti klasifikacijskih metod Namen zgoraj opisanih del je bil ugotoviti uporabnost dveh različnih klasifikacij- skih metod, standardne statistične metode z uporabo kriterija največje podobnosti in samoorganizirajočih matrik z nadgradnjo v FMC. Primerjava obeh metod je podana v tabeli 16. Tabela 16. Primerjava klasifikacijskih metod :• Iz dobljenih rezultatov lahko ugotovimo, da klasifikacija z umetnimi nevronskimi mrežami - v tem primeru z metodo FMC ni vedno boljša od standardnih metod. V pri- meru klasifikacije 16 razredov se metoda po kriteriju največje podobnosti izkaže za slabšo v vseh kriterijih, razlika je že manjša v primeru klasifikacije v 9 razredov, medtem ko se v primeru klasifikacije v 5 razredov standardni pristop izkaže za boljšega v vseh kriterijih razen v povprečni natančnosti postopka. Natančnost obeh metod se z zmanjševanjem števila razredov približuje, pri majhnem številu razredov pa se standardni pristop izkaže za boljšega od FMC. To je posledica naslednjih dej- stev: • Večje število razredov zahteva močnejše razmejitvene sposobnosti multivariatnega prostora. To je ena od poglavitnih prednosti nevronskih mrež zato se te praviloma bolje izkažejo v primeru večih razredov. • Standardne metode delujejo na statističnih načelih. To pomeni, da morajo biti vhodni podatki normalno porazdeljeni, prav tako pa mora biti porazdelitev nor- malna znotraj posameznih razredov. Z združevanjem razredov v splošnem pridobi- vamo na normalnosti, zato se klasifikacijske sposobnosti statističnih metod z manjšim številom razredov izboljšujejo. • Združevanje med seboj podobnih si razredov - to je razredov, ki se med seboj pre- krivajo/prepletajo prispeva k njihovi večji homogenosti in lažji ločljivosti od dru- gih razredov. Moč umetnih nevronskih mrež je med drugim tudi v boljšem omeje- vanju multivariatnega prostora zato homogenizacija razredov v manjši meri pripe- va k boljši natančnosti kot je to primer pri standardnih metodah. Kvalifikacija satelitskih posnetkov 473 V nadaljevanju je potrebno opozoriti še na en način klasifikacij satelitskih posnet- kov, ki v primeru statističnih metod ni smiselen. Če k vhodnim podatkom dodamo X in Y koordinati (7 TM kanalov + X + Y) se klasifikacijske sposobnosti nevronskih mrež izredno povečajo (glej tabelo 17 in slike 15, 16 in 17). V model smo s tem vpelja- li še prostorsko lego točk. Tako naučen model glede na geografsko lego vhodnih po- datkov že vnaprej določenim razredom predpisuje večjo verjetnost pojavljanja. Pri tem se je potrebno zavedati naslednjih omejitev: • Učni podatki, ki vstopajo v model v učni fazi morajo biti enakomerno porazdeljeni po prostoru. • Tako izdelan model je uporaben samo na tem področju. To ne more biti univerzalni klasifikator ampak je strogo vezan na specifični primer. Pri ugotavljanju litoloških mej se uporabnost tovrstnih klasifikatorjev izkaže zlasti pri prehodu iz manjših v večja merila. Tabela 17. Natančnost FMC klasifikacij z upoštevano prostorsko lego Zaključek Obdelava digitalnih podob, v našem primeru satelitskih posnetkov, v slovenskem prostoru še ni doživela uveljavitve ampak predstavlja le eno od metod, ki bi lahko v prihodnosti dala pozitivne rezultate. Zaradi poraščenosti slovenskega ozemlja je geo- loška interpretacija satelitskih posnetkov močno otežena, vendar pa v svetu v nasle- dnjih nekaj letih na tem področju napovedujejo pravo revolucijo. Že letos bo lansiran prvi komercialni satelit z monokromatsko ločljivostjo Im in pankromatsko 4m. Hkrati s tem se pričakuje prehod na hiperspektralne posnetke (skenerji z 200 in več kanali) in večjo radiometrično ločljivostjo. Vse večja komercializacija in ostri konku- renčni boj že sedaj znižuje cenovna razmerja, tako da lahko v kratkem pričakujemo, da bodo posnetki dostopni za razmeroma nizko ceno. Če k temu dodamo še razvoj no- vih interpretativnih metod, lahko zelo kmalu pričakujemo uporabne rezultate tudi za taka ozemlja kot je slovensko. Odpirajo se številne možnosti: • Pomoč pri določanju skritih litoloških mej, zlasti pri prehodu iz manjših v večja merila. 474_Janez Hafner Literatura B r a t k o. L, D ž e r o s k i. S., K o m p a r e, B., W a 11 e y, W.J. 1998: Analysis of Environ- mental Data with Machine Learning Methods, US, Ljubljana. B u s e r, S., 1965: Osnovna geološka karta SFRJ Gorica 100.000 (Geological map of SFRJ Gorica 1:100.000). - Zvezni geološki zavod, Beograd. B u s e r. S., 1964: Tolmač lista Gorica. Osnovna geološka karta SFRJ 1:100.000 (Explanatory text for sheet Gorica. Geological map of SFRJ 1:100.000). - Zvezni geološki zavod, 50 p., Beo- grad. G a 11 a n t. S., 1993: Nural Network Learning, The MIT Press, London Gonzales, R.C. & Woods, R.E. 1993: Digital image processing. - Addison - Weslwy Pu- blishing Company, 716 p., Detroit. Gupta, R.P 1991: Remote sensing geology. - Springer-Verlag, 356 p., Berlin. H e b b, D.O. 1949: The Organization of Behavior, Wiley, New York. K o h o n e n, T, 1984: Self-Organization and Associative Memory, Springer-Verlag, Berlin. K o h o n e n, T, H y n n I n e n, J., K a n g a s, J., L a a k s o n e n, J., 1995: SOM PAK The Self-Organizing Map Program Package, Helsinki University of Technology, Laboratory of Com- puter and Information Science, Helsinki. • Pomoč terenskim geologom pri določanju obhodnih poti. • Izdelava bolj natančnih tematskih kart (prehod v večje merilo) s korelacijo temat- skih kart manjših meril in satelitskih posnetkov (npr geokemične karte). • Metode uporabljene pri digitalni obdelavi podob niso uporabne le za interpretacijo daljinsko pridobljenih podatkov ampak lahko na ta način obdelamo vse vrste pro- storskih podatkov (geofizikalni, geokemični...). • II V članku je predstavljena uporaba samo-organizirajočih matrik ter njihova razširitev v FMC (ang. Feature Map Classifier) z dodajanjem BPG (ang. backpropa- gation) nevronskih nivojev. V primeru več razredov se je ta metoda pokazala za boljšo od standardnega pristopa, ob zmanjševanju števila razredov pa se je zmanjševala tu- di razlika med obema metodama. Statistične metode odlikujeta preglednost odločitvenega mehanizma in hitrost izračuna, njihova slabost pa je domneva normal- ne porazdelite podatkov. V primeru, ko temu ni tako ali v primerih, ko je en razred zastopan na večih mestih spektralnega prostora statistične metode odpovejo. V nas- protju s tem umetne nevronske mreže niso odvisne od normalnosti porazdelitve in so mnogo bolje sposobne razmejiti spektralni prostor Velike razmejitvene sposobnosti umetnih nevronskih mrež bi v klasifikacijski mo- del načeloma lahko dovoljevale vpeljavo zemljepisnih koordinat. Kljub boljši na- tančnosti je potrebno pri interpretaciji uporabiti veliko mero previdnosti. Uporaba zemljepisnih koordinat zahteva, da so učni podatki razporejeni enakomerno preko celotnega ozemlja, po drugi strani pa umetne nevronske mreže zahtevajo, da je vsak razred zastopan s podobnim številom primerov. Uspešnost metode je odvisna od us- pešnosti v iskanju srednje poti med obema zahtevama. Postavlja se vprašanje ali upo- raba zemljepisnih koordinat res prinaša željeni napredek. Če je za uspešen rezultat potrebna enakomerna zastopanost učnih podatkov preko celotnega ozemlja, to pome- ni, da moramo ozemlje že vnaprej dobro poznati. V takih primerih je vprašljiva smi- selnost raziskav. Pravzaprav vidim možnosti le pri prehodu iz manjših v večja merila, kjer lahko karte manjših meril služijo kot učni podatek za natančnejšo določitev mej med razredi. Ob tem bi bilo potrebno zmanjšati vpliv zemljepisnih koordinat kar bi bilo možno z njihovim »mehčanjem« ñ predelavo v mehko obliko, kot jo pozna mehka logika (ang. fuzzy logic). Kvalifikacija satelitskih posnetkov_475 Kostwinde r, H. 1995: Introduction to image enhancement. - International Institute for Aerospace Survez and Earth Sciences, 4/1 - 4/13, Enschede. L i 11 e s a n d, T.M. & K i e f e r, R.W. 1994: Remote sensing and image interpretation. - John Wiley & Sons, 750 p., New York. L i p p m a n, R.P., 1987: An Introduction to Computing with Neural Nets, IEEE ASSP Maga- zine, vol. 4. M c C 1 e 1 1 a n d, J., R u m e 1 h a r t, D:, 1986: Parallel Distributed Processing, MIT Press, Cambridge, MA. Parker, D.B., 1985: Learning Logic, Technical Report TR-47, Centre for Computational Research in Economics and Management Science, MIT, Cambridge, MA. P 1 e n i Č a r, M., P o 1 Š a k. A., Š i k i d, D. 1965: Osnovna geološka karta SFRJ Trst 100.000 (Geological map of SFRJ Trieste 1:100.000). - Zvezni geološki zavod, Beograd. P 1 e n i č a r, M., P o 1 š a k. A., Š i k i Ć, D. 1965: Tolmač Usta Trst. Osnovna geološka karta SFRJ 1:100.000 (Explanatory text for sheet Trieste. Geological map of SFRJ 1:100.000).- Zvezni geološki zavod, 68 p., Beograd. Reeves, R.G. 1968: Introduction to electromagnetic remote sensing with emphasis on ap- plications to geology and hydrology- Am. Geol. Inst., Washington. S a b i n s, F.F. JR. 1987: Remote sensing principles and interpretation, 2nd ed.- Freeman and Company, New York, 449 p., New York. Swain, PH. and Davis, S.M.(eds.) 1978. Remote Sensing: The Quantitative Approach, McGraw-Hill, Inc., New York, 396 p. V i c k e r s, R.S. & L y o n, R.J.P. 1967: linfraredsensing from spacecraft ñ a geological inter- pretation. - Proc. Thermophysics Spec. Conf., Am. Inst. Aeronautics Astronautics, 67-284, Wa- shington. Werbos, P., 1974: Beyond Regression: New Tools for Prediction and Analysis in the Beha- vioral Sciences, PhD thesis, Harvard, Cambridge, MA. W i d r o w, B., H o f f, M.E., 1960: Adaptive Switching Circuits, Institute of Radio Engineers, Western Electronic Show and Convention, Convention Record, part 4 Zavod Republike Slovenije za statistiko 1993: Georeferencirani mozaik Slovenije izdelan iz podatkov satelita Landsat - TM (Georeferenced mosaic of Slovenia produ- ced from LANDSAT-TM data). - 314,4 MB, Ljubljana.