VPLIV STISKANJA )PEG2000 Z IZGUBAMI NA KLASIFIKACIJO POSNETKOV WORLDVIEW-2 EFFECTS OF LOSSY )PEG2000 COMPRESSION METHOD ON WORLDVIEW-2 IMAGE CLASSIFICATION Aleš Marsetič, Žiga Kokalj, Krištof Oštir UDK: 528.7/.8(078.7) IZVLEČEK Stiskanje z izgubami se vse pogosteje uporablja v daljinskem zaznavanju, čeprav njegov vpliv na rezultate obdelav posnetkov še ni v celoti raziskan. V članku so predstavljeni učinki stiskanja JPEG2000 z izgubami na klasifikacijo posnetkov zelo visoke ločljivosti WorldView-2. Za klasifikacijo stisnjenih posnetkov smo prvič uporabili objektni metodi k-najbližji sosed (k-nearest neighbor) in metodo podpornih vektorjev (support vector machine), ki smo ju tudi primerjali. Rezultati razkrivajo vpliv stiskanja na same posnetke, segmentacijo in končno klasifikacijo. Študija dokazuje, da v splošnem stiskanje z izgubo ne vpliva negativno na klasifikacijo posnetkov, še več, v nekaterih primerih ima klasifikacija stisnjenih posnetkov boljše rezultate kot klasifikacija izvirnih posnetkov. Natančnost klasifikacij z metodo podpornih vektorjev kaže na možnost stiskanja podob do razmerja 30 : 1 brez izgube natančnosti klasifikacije. Najboljši rezultat z metodo k-najbližji sosed smo pridobili z najvišjim kompresijskim razmerjem (100 : 1). V raziskavi smo ugotovili, da metoda podpornih vektorjev daje boljše rezultate klasifikacije kot metoda k-najbližji sosed ter se priporoča tudi za nadaljnje raziskave. Poleg metode klasifikacije ima pri natančnosti rezultatov pomembno vlogo tudi segmentacija posnetkov. Klasifikacija prispevka po COBISS-u: 1.01 ABSTRACT Lossy compression is becoming increasingly used in remote sensing, although its effect on the processing results has yet not been fully investigated. This paper presents the effects of JPEG2000 lossy compression on the classification of very high-resolution WorldView-2 imagery. For the first time, the k-nearest neighbor and support vector machine methods of the object based classification were used. The results explore the impact of compression on the images, segmentation and resulting classification. The study proves that in general lossy compression does not adversely affect the classification of images; moreover, in some cases classification of compressed images yields better results than classification of the original image. Classification accuracy of the support vector machine method indicates that compression ratios of up to 30:1 can be used without any loss of classification accuracy. The best result of the k-nearest neighbor method was obtained with the highest compression ratio (100:1). The support vector machine is recommended for further research. In addition to the classification method, image segmentation also plays an important role in the accuracy of the results. KLJUČNE BESEDE slikovno stiskanje z izgubami, objektna, klasifikacija, JPEG2000, WorldView-2, metoda, podpornih vektorjev, k-najbližji sosed KEY WORDS image lossy compression, object classification, JPEG2000, WorldView-2, support vector machine, k-nearest neighbour vo is 1 UVOD Podatki daljinskega zaznavanja so uporabni na številnih področjih opazovanja okolja in njegovega upravljanja, njihova pomembnost tudi strmo narašča. Nepogrešljivi so na primer pri kartiranju pokrovnosti tal, spremljanju naravnih nesreč, modeliranju podnebja ter upravljanju kmetijskih zemljišč in gozdov (Zabala in Pons, 2011). Navedene aplikacije potrebujejo za doseganje rezultatov, ki vsebujejo veliko detajlnih informacij, podobe z visoko prostorsko, spektralno in časovno ločljivostjo. S pojavom novejših satelitov, kakršen je na primer WorldView-2, so tovrstne podobe že komercialno dostopne. Shranjevanje, upravljanje in obdelava velike količine podatkov, tako zaradi njihove velike prostorske ločljivosti kot zaradi številnosti in večspektralnosti pri nižjeločljivih podobah, so težko obvladljivi, zato je nujna uporaba učinkovite tehnike stiskanja podatkov. Stisnjeni posnetki se uporabljajo tudi pri spletnih servisih oziroma geoportalih, ki ponujajo ogled visokoločljivih posnetkov za območja celotnih držav ali celo vsega sveta. Običajno temeljijo na standardih OGC (Open Geospatial Consortium) v obliki servisov WMS (Web Map Service) in WCS (Web Coverage Service). Predhodno stiskanje (kompresija) posnetkov je v tem primeru stalna praksa, saj gre za hitro dostavo posnetkov velikih območij do številnih uporabnikov. Ker sama kakovost zapisa pri tem običajno ni kritična, sta WMS in WCS glavna vira posnetkov, ki so stisnjeni z izgubami. Shranjevanje in prenašanje velike količine posnetih podob je velika težava tudi pri majhnih satelitih za daljinsko zaznavanje. Ti imajo na krovu le manjše pomnilniške enote in imajo tudi omejene možnosti prenosa podatkov do zemeljskih postaj, tako glede časa, ki je na voljo, kot glede zmogljivosti anten. Stiskanje podatkov z izgubami, opravljeno takoj po snemanju, lahko te težave omili ali celo odpravi in tako pripomore k razširitvi tovrstnih tehnologij. iS Čeprav so tehnike stiskanja podatkov zelo razširjene, na področju daljinskega zaznavanja stiskanje 53 z izgubami še ni povsem sprejeto. Strokovnjaki se ga izogibajo, saj naj bi negativno vplivalo na kakovost rezultatov obdelav, kakršna je na primer klasifikacija (Garcia-Vilchez et al., 2011). Tudi zaradi tega je bilo v preteklih letih malo raziskav vpliva stiskanja z izgubami na klasifikacijo ^^ posnetkov. Obstoječe študije praviloma obravnavajo učinke stiskanja na pikselsko klasifikacijo, rezultati pa negativnega vpliva na kakovost ne izražajo vedno. V naslednjem odstavku so navedene ugotovitve nekaterih raziskav. ^^ Kiema (2000) je pri klasifikaciji urbanih območij ugotovil, da se lahko pri valjčnem stiskanju [i^ (angl. wavelet compression) ter kombinaciji letalskih posnetkov in lidarskih podatkov uporablja kompresijsko razmerje do 20 : 1, in sicer brez poslabšanja rezultatov klasifikacije. Lam et al. sš [š^ (2000) so z JPEG-stiskanjem večspektralnih posnetkov SPOT do kompresijskega razmerja 20 : 1 ^ dosegli klasifikacijo, ki je bila le nekaj odstotkov slabša od klasifikacije izvornega posnetka. Liang et al. (2008) so preizkusili učinke nadzorovane klasifikacije na letalskih posnetkih, ki so bili predhodno stiskani s tehnikama JPEG2000 in SPIHT (angl. set partitioning in hierarchical i| trees). Rezultati so bili zadovoljivi do kompresijskega razmerja 10 : 1, pri čemer so z načinom Ü JPEG2000 dosegli boljše rezultate. Stiskanje je zelo pomembno pri hiperspektralnih posnetkih, kjer je količina podatkov izjemno velika. Garcia-Vilchez et al. (2011) so preizkusili pikselsko klasifikacijo na posnetkih AVIRIS, ki so jih predhodno stiskali z različnimi tehnikami. Dobre rezultate klasifikacije so dobili tudi z visokimi kompresijskimi razmerji. Do podobnih ugotovitev so prišli Mercier et al. (1999) z uporabo vektorske kvantizacije (angl. vector quantization). V tem primeru so dosegli dobro kakovost klasifikacije tudi z uporabo podob, stisnjenih s kompresijskim razmerjem 70 : 1. Na drugi strani Goodenough et al. (2004) ne priporočajo stiskanja satelitskih hiperspektralnih podatkov (Hyperion, AVIRIS) pri določanju gozdnih površin. Zabala in Pons (2011) sta raziskovala vpliv stiskanja posnetkov Landsat TM in ETM+ s tehnikama JPEG in JPEG2000 na natančnost klasifikacije. Pokazala sta, da je lahko kompresijsko razmerje v homogenih območjih tudi 20 : 1, medtem ko je na fragmentiranih območjih lahko le 5 : 1. Zanimivo je, da so bili boljši rezultati doseženi s klasifikacijo stisnjenih posnetkov kot s klasifikacijo izvornih posnetkov. Razlog sta pripisala učinku glajenja podob in odstranitvi izoliranih pikslov z napakami, ki nastanejo kot posledica stiskanja. V članku bomo ocenili vpliv stiskanja z izgubami na klasifikacijo visokoločljivih posnetkov WorldView-2. Na podlagi rezultatov klasifikacije bodo podane ugotovitve o možnostih in uporabnosti močno stisnjenih podatkov. Da bi zagotovili reprezentativne rezultate, je bila na stisnjenih podatkih uporabljena objektna klasifikacija, kar do sedaj še ni bilo raziskano. Uporabljen je bil standard JPEG2000, ki omogoča stiskanje z izgubami in je zaradi kakovostnega načina stiskanja vse pogosteje uporabljen na podatkih daljinskega zaznavanja. JPEG2000 ima tudi možnost stiskanja brez izgub, ki pa je v študiji nismo upoštevali, saj niti približno ne doseže tako visokega razmerja stiskanja kot stiskanje z izgubami. 2 TEHNIKA STISKANJA JPEG2000 Metode stiskanja podob lahko razdelimo v dve veliki skupini. V prvi so metode stiskanja brez izgub, ki ob zgoščevanju podatkov odpravljajo le nepotrebna ponavljanja in ne izgubljajo informacij, v drugi pa so metode stiskanja z izgubami, ki odstranijo manj pomembne informacije. S tehnikami stiskanja podatkov brez izgub je v najboljšem primeru mogoče doseči kompresijsko e! razmerje 3 : 1 (Serra-Sagristain Auli-Llinas, 2008), zato se pri potrebah po večjem razmerju uporabljajo tehnike stiskanja z izgubami (Garcia-Vilchez et al., 2011). Med najbolj primerne tehnike stiskanja z izgubami sodi kodirni sistem ter standard stiskanja slikovnih in video podatkov JPEG2000, ki je bil potrjen leta 2000. Temelji na valjčni pretvorbi in tehnologiji podkanalov. Njegov glavni del je sprejet kot mednarodni standard (ISO/IEC 15444-1, 2004) in v kakovosti stiskanja nadgrajuje predhodni standard JPEG. Podatkovni i?! zapis je prilagodljiv in ga je mogoče nazivati na različnih ravneh, kar pomeni, da ga je mogoče siJ dekodirati na različne načine. Z različno razvrstitvijo kode v zapisu lahko programi dosežejo znatno hitrejše delovanje, vendar zapis potrebuje kompleksne in računsko zahtevne kodeke. V primerjavi s standardom JPEG, JPEG2000 izdela kolobarjaste artefakte, ki se odražajo v obliki zameglitev in kolobarjev ob robovih na sliki, medtem ko JPEG izdela kolobarjaste in kockaste jji ^^ artefakte (Taubman in Marcellin, 2002). Za uporabo v daljinskem zaznavanju je zlasti primeren, ker: ;o ^ N H ^r^ K prostorske informacije lahko prikličemo naključno (dostopamo do posameznih delov podobe), "jg zato ni potrebe po njihovem deljenju (razkosanju); | t^? - v procesu stiskanja razčleni sliko v predstavitve večjih ločljivosti, ki jih lahko uporabimo kot piramidne sloje, kar je zelo pogosto pri delu s podobami; - opredelimo lahko območja zanimanja, ki so stisnjena in posredovana z višjo kakovostjo kot preostali del podobe, in - obrezovanje podob je brez izgube kakovosti (napake se ne kopičijo). 3 TESTNI PODATKI Podjetje DigitalGlobe je z izstrelitvijo satelita WorldView-2 odprlo novo poglavje v opazovanju Zemlje iz vesolja. WorldView-2 je prvi komercialni visokoločljivi satelit z več kot štirimi »standardnimi« večspektralnimi kanali. Trem kanalom v vidni svetlobi in enem v bližnji infrardeči so bili dodani še štirje: drugi kanal v bližnji infrardeči svetlobi, kanal na robu med rdečo in bližnjo infrardečo, rumeni kanal in kanal z valovno dolžino svetlobe, nekoliko krajšo od modre (tako imenovani obalni kanal). Večspektralni kanali zajemajo podatke s prostorsko ločljivostjo 1,84 metra, pankromatski pa s 0,46 metra, v pasu, širokem 16,4 kilometra. Zaradi ameriških zakonskih omejitev so uporabnikom posredovani podatki prevzorčeni na 2 oziroma 0,5 metra. Njihova radiometrična ločljivost je 11 bitov. Satelit leti 770 kilometrov visoko, izstrelili so ga oktobra 2009. Gre za relativno velik satelit, saj je visok 4,3 metra, širok 2,5 metra brez sončnih panelov in 7,1 metra z njimi, tehta pa 2800 kilogramov. Pri nagibu za 45 ° lahko isto območje posname skoraj vsak dan, pri nagibu 20 ° pa vsake štiri dni. V tej študiji sta uporabljena večspektralni in pankromatski posnetek, ki ju je satelit WorldView-2 zajel prvega avgusta leta 2010. Zajemata območje zahodne Ljubljane z okolico v velikosti 17 x 16 kilometrov. K posnetkoma so bili priloženi metapodatki z informacijami o tirnici in snemalnem sistemu satelita ter koeficienti RPC (angl. rational polynomial coefficients) za lažjo rektifikacijo. Posnetka sta bila predobdelana do ravni 1B oziroma Basic, kar pomeni, da sta vsebovala le osnovne radiometrične popravke in popravke senzorja. Posnetka nista bila umeščena v koordinatni sistem. Zaradi geometrije gledanja snemalnega sistema in premikanja platforme je bila tudi velikost pikslov po posnetku različna. Pred stiskanjem in klasifikacijo je bilo treba posnetke ustrezno pripraviti. Pankromatske in večspektralne posnetke smo najprej ortorektificirali z uporabo koeficientov RPC. Pankromatsko in večspektralno podobo smo nato združili z metodo Gram-Schmidt. To metodo izostritve večspektralnih posnetkov s prostorskimi informacijami pankromatskega kanala (angl. pansharpening) sta zasnovala Laben in Brower (2000), patentiral pa jo je Eastman Kodak. Temelji na zamenjavi komponent in deluje v dveh operativnih načinih, odvisno od tega, kako je definirana nizkoločljiva različica pankromatske podobe v transformaciji. V prvem načinu je opredeljena kot povprečje pikslov večspektralnih kanalov, v drugem pa z nizkoprepustnim filtriranjem in ^ razkosanjem pankromatske podobe. Največja razlika pri rezultatu je opazna v vidnem spektru. ^^ Pri prvem načinu dobimo rezultat s polno prostorsko ločljivostjo pankromatskega kanala, vendar 5! se zaradi pogoste razlike v radiometričnih lastnostih večspektralnih in pankromatskega kanala lo lahko pojavijo barvna popačenja. Rezultat pri drugem načinu je brez barvnih popačenj, vendar ü je manj izostren (Aiazzi et al., 2006). Ker so bile pri nadaljnjem delu bolj pomembne spektralne lastnosti, smo uporabili drugi način. ^ P? Pri ostritvi smo uporabili izrez celotne podobe v velikosti 1448 x 968 pikslov, saj je to zadoščalo za izvedbo raziskave. Manjša podoba omogoča hitrejšo obdelavo in hkrati ni bila prevelika za izdelavo ročno klasificirane kontrolne karte, ki je bila uporabljena za preverjanje natančnosti samodejne objektne klasifikacije. Testno območje obsega del Ljubljanskega barja ter vključuje obdelana in pozidana zemljišča ter gozd (slika 1). Slika 1: Testno območje posnetka WorldView-2 4 METODE DELA Raziskavo vpliva stiskanja z izgubami na klasifikacijo smo opravili v več korakih. Najprej smo podobo z osmimi kanali stisnili s tehniko JPEG2000 z različnimi kompresijskimi razmerji. Sledila sta razširjanje in nato klasifikacija, saj programska oprema, ki smo jo uporabili za objektno klasifikacijo (ENVI Zoom z modulom Feature Extraction (ITT Visual Information Solutions, 2008)), ne deluje na stisnjenih podobah. 4.1 Stiskanje in razširjanje podob Zaradi velikega števila kanalov in možnosti nadzora stiskanja je slednje potekalo v programu ERDAS Imagine. Program omogoča izbiro kompresijskega razmerja (KR), ki je bilo izbrano za mero manjšanja količine podatkov. KR se računa kot razmerje med velikostjo izvorne datoteke in velikostjo stisnjene datoteke. Na primer pri KR 2 : 1 ima stisnjena datoteka polovico velikosti izvorne datoteke. Dejansko razmerje v praksi vedno nekoliko odstopa (tudi nekaj odstotkov) od teoretične vrednosti. vo iš V raziskavi smo preizkusili vpliv različnih KR na klasifikacijo, zato je bila podoba stisnjena s šestimi različnimi razmerji (2 : 1, 5 : 1, 15 : 1, 30 : 1, 50 : 1 in 100 : 1). Pri manjših KR so vizualne razlike glede na izvorno podobo majhne, večja razmerja pa podobo kar precej popačijo. Primerjava med izvorno in stisnjeno podobo je prikazana na sliki 2. Slika 2: Izsek izvorne (levo) in stisnjene podobe s kompresijskim razmerjem 100: 1 (desno). Razlika je najbolj opazna na homogenih površinah, kot so travniki, kjer so v celoti izgubljene podrobnosti. sš iT o 4.2 Klasifikacija Klasifikacija podob je eden najpomembnejših izdelkov daljinskega zaznavanja ter pomemben dejavnik pri razvoju in napredku senzorjev za zajem slikovnih informacij o površju. Z vidika obravnave območij klasifikacijo delimo na pikselsko in segmentno oziroma objektno usmerjeno. Z napredkom v ločljivosti senzorjev so postale velikosti piksla občutno manjše od povprečne velikosti preučevanih objektov. Klasifikacijske tehnike, ki temeljijo na analizi spektralnih lastnosti posameznih pikslov, so zato postale nezadostne in razvit je bil nov pristop, ki temelji na analizi okolice ter združuje postopka segmentacije in razvrščanja - objektno usmerjena klasifikacija. Segmentacija podob zniža raven detajlov, zmanjša kompleksnost podob in naredi njihovo vsebino bolj razumljivo. Izdela regije oziroma segmente, ki jim lahko pripišemo številne lastnosti, poleg spektralnih še teksturne in prostorske (na primer velikost, oblika, sosedstvo), ter jih v drugem koraku analiziramo in razvrstimo v razrede - spremenimo v geografske objekte (Lang, 2008). V predhodnih raziskavah učinkov stiskanja podob na kakovost klasifikacije je bila večinoma uporabljena pikselska klasifikacija, ki ima daljšo zgodovino od objektne. V zadnjih letih se je zaradi uvedbe visokoločljivih posnetkov trend uporabe prevesil na stran slednje, ki na teh posnetkih dosega boljše rezultate (Blaschke, 2010). Zato smo objektno usmerjeno klasifikacijo izbrali tudi pri delu s posnetki WorldView-2. Po opravljeni segmentaciji podobe je bila izvedena klasifikacija na podlagi predhodno izračunanih prostorskih, spektralnih in teksturnih atributov vseh osmih kanalov. Pred samodejno klasifikacijo so bili določeni informacijski razredi. Glede na vizualno razpoznavnost in za lažje preverjanje rezultatov je bilo izbranih pet razredov: - gozd (združuje gozdne površine, združbe dreves in večja posamezna drevesa); - zgradbe (večinoma stanovanjske hiše in sorodni objekti); - zelene površine (njive z zelenimi pridelki, travniki in pašniki); - gola prst (kmetijska zemljišča brez pridelkov) in - ceste (ceste ter druge betonske in asfaltirane površine). Postopek smo nadaljevali z nadzorovano klasifikacijo z uporabo učnih vzorcev. V tem primeru operater izbere nekaj segmentov oziroma učnih vzorcev, za katere je prepričan, da spadajo v posamezen informacijski razred. V našem primeru so bili vzorci določeni na podlagi letalskih ortofoto in WorldView-2 posnetkov. S samodejno, objektno usmerjeno nadzorovano klasifikacijo smo nato segmente razvrstili v razrede z dvema različnima algoritmoma: k-najbližji sosed (angl. k-nearest neighbor, kNN) in metodo podpornih vektorjev (angl. support vector machine, SVM). Metoda razvrščanja k-najbližji sosed je ena najbolj osnovnih in najpreprostejših klasifikacijskih metod. Leta 1951 sta jo razvila Fix in Hodges (1989). Pri razvrščanju upošteva evklidsko razdaljo med učnimi vzorci in podatki v n-razsežnem prostoru, kjer je n število lastnosti (atributov) vektorskega objekta (prostorskih, spektralnih in teksturnih). Metoda je bolj robustna od razvrščanja z običajnim algoritmom najbližjega soseda, saj za pripis pripadnosti določenega objekta upošteva k najbližjih razdalj. Je manj občutljiva za razpršenost podatkov in šum ter običajno z njo dobimo kakovostnejše rezultate. Metode podpornih vektorjev predstavljajo specifičen razred algoritmov, ki ga označuje uporaba iskalnih oken, odsotnost lokalnih minimumov, redkost rešitev ter nadzor nad rezultatom z možnostjo uravnavanja meja ali drugih neodvisnih množin, na primer števila podpornih vektorjev. Iznašli so jih Boser s sodelavci (1992). Metode SVM so sorodne nevronskim mrežam. Podatke razvrščajo z izgradnjo n-razsežne ploskve, ki optimalno loči podatke v dva razreda. Uporabljajo iskalno okno in so kot klasifikator alternativna učna metoda za polinomske in radialne funkcije ter večslojne perceptrone. Uteži za mrežo so utemeljene z razrešitvijo kvadratnega programskega problema z linearnimi omejitvami. V iskalnem oknu lahko uporabimo številne računske operacije - tudi neskončno mnogo, čeprav že majhen nabor deluje dobro v različnih aplikacijah. Po končani klasifikaciji je na podobah ostalo še nekaj šuma v obliki majhnih izoliranih segmentov z dvomljivo natančnostjo klasifikacije ter nazobčanih območij nehomogene oblike. Večina tovrstnih segmentov je bila preklasificirana z večinskim filtriranjem (angl. majority analysis), ki vsakemu pikslu določi razred glede na večinski razred v njegovi bližini (ITT Visual Information Solutions, 2008). Po filtriranju je bila klasifikacija zaključena. Njeni rezultati so prikazani na sliki 3. iS K ;o ^ N Slika 3: Rezultat klasifikacije izseka izvorne podobe z metodo podpornih vektorjev 4.3 Preverjanje natančnosti rezultatov -äS- o Klasifikacije so bile ovrednotene z matriko napak (angl. confusion matrix), ki je eden najpogosteje uporabljenih prikazov natančnosti klasifikacije. Z matriko se ugotavlja odnos med referenčnimi podatki in rezultati klasifikacije. Matrika je kvadratna, število stolpcev in vrstic pa ustreza številu razredov, za katere se ugotavlja natančnost klasifikacije. Stolpci v matriki so referenčni, vrstice pa klasificirani podatki. Vrednosti v diagonalnih poljih podajajo število pravilno klasificiranih pikslov, števila v ostalih poljih pa so napake (Janža, 2005). V našem primeru so bili referenčni podatki izdelani ročno z vizualno interpretacijo posnetka WorldView-2. Tako smo se izognili napakam zaradi neažurnih podatkov, ki bi nastali na primer z interpretacijo ortofoto posnetkov, ki so bili posneti štiri leta pred obravnavanim posnetkom. Kljub temu tudi referenčna podoba ni bila popolna, saj se brez terenskega preverjanja težko določi vse vrste objektov, posebno v pozidanih območjih. 5 REZULTATI Z analizo matrike napak smo določali učinke uporabljenih kompresijskih razmerij na natančnost klasifikacije. Poleg vpliva stiskanja na natančnost same klasifikacije smo preučili njegov vpliv na geometrijo segmentov. Zanimale so nas tudi razlike med samimi podobami po stiskanju. 5.1 Stisnjene podobe Izsek izvorne podobe je bil velikosti 23 MB, kar je omogočalo hitro stiskanje in analizo podob. Podrobna analiza stisnjenih podob je dober kazalec sprememb, ki se zgodijo v podobi po stiskanju. Graf 1 prikazuje odstotek vseh nespremenjenih pikslov (piksli, katerih digitalna vrednost se pri stiskanju ne spremeni) po posameznih stiskanjih za vse kanale. Razviden je hiter padec nespremenjenih vrednosti, ki seže pod 10 % že pri razmerju 15 : 1. Za najmanjše uporabljeno razmerje jih je le približno 31 %. Graf 1: Odstotek nespremenjenih pikslov za posamezna stiskanja Dodatno smo preverili tudi rang sprememb za vse podobe in največja odstopanja. Povprečna razlika digitalnih vrednosti narašča skoraj linearno in doseže vrednost 12 pri največjem razmerju stiskanja. Položaj je podoben tudi pri največji razliki z največjo vrednostjo pri 198 (graf 2). Pri interpretaciji moramo upoštevati, da je spektralna ločljivost podob 11-bitna, torej lahko vsak piksel zavzame 2048 digitalnih vrednosti. vo is Ü CS 40 50 60 70 Kompresijsko razmerje Graf 2: Povprečna in največja razlika digitalnih vrednosti (DV) za posamezna stiskanja Pri vizualni analizi podob je lepo vidno slabšanje kakovosti z večanjem kompresijskega razmerja. Opazna sta tudi glajenje robov objektov in zmanjšanje teksture, kar je dobro vidno na travnikih in njivah s posevki (slika 2). 5.2 Segmentacija SS iT Ii i( Graf 3: Število segmentov za posamezna stiskanja Segmentacija je prvi korak objektno usmerjene klasifikacije, kjer na podlagi značilnosti in podobnosti pikslov z njihovim združevanjem dobimo objekte, ki nato vstopijo v proces klasifikacije. Ta korak je nadvse pomemben in močno vpliva na končni rezultat. Učinke stiskanja na geometrijo segmentov smo preverili vizualno, kvantitativno pa smo preverili število dobljenih segmentov (graf 3). Čeprav bi zaradi učinka glajenja z naraščajočim razmerjem pričakovali manjšanje števila segmentov, je rezultat obraten. Po vizualnem pregledu se je izkazalo, da so za povečanje števila segmentov krivi predvsem gozd in skupine dreves, kjer je nastalo več manjših segmentov. Pri visokih razmerjih stiskanja je opazno manjše število izoliranih segmentov in večje število združenih, ki dejansko tvorijo celoten objekt (npr. celotna streha, večji odsek ceste). Pri primerjavi je opaziti tudi večje spremembe mej segmentov. Spremembe se večajo z naraščajočim razmerjem stiskanja (slika 4). Slika 4: Sprememba oblik in števila segmentov na primeru zelenih površin, ki so na zgornjem srednjem delu uporabljenega izseka. Vidno je naraščanje števila segmentov od originalne podobe (levo zgoraj) do podobe, stiskane v razmerju 15: 1 (desno zgoraj), in podobe v razmerju 30: 1 (levo spodaj). Generalizacija segmentov je najbolje vidna na podobi s kompresijskim razmerjem 100: 1 (desno spodaj). 5.3 Skupna natančnost klasifikacije in koeficient Kappa Preglednica 1 prikazuje skupno natančnost klasifikacije z metodo k-najbližji sosed in metodo podpornih vektorjev izvorne in stisnjenih podob. Z metodo kNN smo dobili približno 4 % slabše rezultate klasifikacije kot pri metodi SVM. Rezultati metode kNN so presenetljivi, saj je bila najboljša natančnost klasifikacije dobljena z najvišjim kompresijskim razmerjem. Skupna natančnost je bila boljša kot pri izvorni podobi tudi pri stiskanju z razmerjem 2 : 1. Najslabše rezultate smo dobili pri stiskanjih z razmerji 5 : 1 in 15 : 1, nekoliko boljše pri ostalih. vo is Ü CS o Pri metodi SVM smo dobili bolj pričakovane rezultate. V tem primeru so sicer najboljši rezultati pri stiskanju 2 : 1, vendar tudi klasifikaciji s stiskanji 15 : 1 in 30 : 1 ponujata boljšo rešitev od izvorne podobe. V tem primeru lahko sklepamo, da predhodno stiskanje podob do razmerja 30 : 1 izboljša klasifikacijo, čeprav tudi višja razmerja stiskanja dajo podobne rezultate (graf 4). Skupna natančnost (%) in razlika (%) kNN razlika kNN SVM razlika SVM Izvorna podoba 83,69 / 87,57 / KR 2:1 83,77 0,08 87,69 0,12 KR 5:1 82,34 - 1,35 87,49 - 0,08 KR 15:1 82,70 - 0,99 87,64 0,07 KR 30:1 83,43 - 0,26 87,65 0,08 KR 50:1 83,38 - 0,31 87,50 - 0,07 KR 100:1 84,89 1,20 87,22 - 0,35 Preglednica 1: Natančnost klasifikacije z metodo k-najbližji sosed (kNN) in metodo podpornih vektorjev (SVM) izvorne in stisnjenih podob. Vrednosti v 3. in 5. stolpcu predstavljajo razlike v natančnosti klasifikacije glede na natančnost klasifikacije izvorne podobe. Graf 4: Skupna natančnost klasifikacije z metodo k-najbližji sosed in metodo podpornih vektorjev za posamezna stiskanja. Drugo merilo za izračun ocene natančnosti klasifikacije je koeficient Kappa. Uveden je bil zato, ker se tudi s povsem naključno klasifikacijo doseže določena stopnja natančnosti v klasifikacijski matriki napak. S koeficientom Kappa se meri razlika med preučevano in naključno klasifikacijo. Definiran je v razponu med 0 in 1, kjer vrednost 0 pomeni, da z uporabljeno klasifikacijo niso bili doseženi boljši rezultati, kot bi bili z naključno. Nasprotno pa vrednost 1 pomeni, da je uporabljena klasifikacija brez napake. Vrednost 0,5 pomeni, da je uporabljena klasifikacija za 50 % boljša od naključne (Janža, 2005). Koeficient Kappa in razlika kNN razlika kNN SVM razlika SVM Izvorna podoba 0,7021 / 0,7640 / KR 2:1 0,7007 - 0,0014 0,7658 0,0018 KR 5:1 0,6782 - 0,0239 0,7627 - 0,0013 KR 15:1 0,6845 - 0,0176 0,7654 0,0014 KR 30:1 0,6966 - 0,0055 0,7654 0,0014 KR 50:1 0,6946 - 0,0075 0,7623 - 0,0017 KR 100:1 0,7134 0,0113 0,7508 - 0,0132 Preglednica 2: Koeficient Kappa za klasifikacijo izvorne in stisnjenih podob z metodo k-najbližji sosed (kNN) in metodo podpornih vektorjev (SVM). Vrednosti v 3. in 5. stolpcu predstavljajo razlike koeficienta Kappa glede na koeficient Kappa izvorne podobe. V preglednici 2 so prikazani koeficienti Kappa za vse podobe. Rezultati so zelo podobni kot pri skupni natančnosti, razlike so le pri metodi SVM, saj je tu največji koeficient (najboljša klasifikacija) pri stiskanju z razmerjem 2 : 1. Tudi koeficient Kappa potrjuje boljše rezultate metode SVM. Nekatera sklepanja o kakovosti klasifikacije ponuja tudi vizualni pregled klasificiranih podob. Rezultati klasifikacij izvorne in stisnjenih podob se ne razlikujejo veliko, opazne razlike so največkrat odvisne od načina segmentacije oziroma oblike segmentov. Pri tem ne smemo spregledati vpliva referenčne klasifikacije, s katero se računa matrika napak. Ta je namreč zelo odvisna od operaterja in v nekaterih primerih manj natančna kot pri samodejni klasifikaciji. 6 SKLEP V članku je bil prvič obravnavan vpliv stiskanja z izgubami na objektno klasifikacijo visokoločljivih podob satelita WorldView-2. Rezultati dokazujejo, da stiskanje z izgubami na klasifikacijo podob ne vpliva vedno negativno, saj je klasifikacija stisnjenih podob v nekaterih primerih celo bolj natančna od klasifikacije izvorne podobe. Pri klasifikaciji z metodo podpornih vektorjev (SVM) dobimo boljše rezultate kot z metodo k-najbližji sosed (kNN). Poleg tega so bili rezultati klasifikacij metode SVM bližje pričakovanim in izražajo možnost stiskanja podob do razmerja 30 : 1 brez znatne izgube natančnosti klasifikacije. Čeprav so bili pri metodi kNN najboljši rezultati pridobljeni z najvišjim kompresijskim razmerjem, bi bilo treba izsledke dodatno preveriti v prihodnjih raziskavah. Najvišjega uporabnega kompresijskega razmerja ni mogoče natančno določiti, saj je natančnost klasifikacije odvisna od številnih dejavnikov (npr. metode klasifikacije, parametrov segmentacije). vo is V obravnavanem primeru so rezultati klasifikacije z metodo kNN presenetljivi in dopuščajo možnost uporabe zelo visokih stiskanj. Zaradi enostavnosti delovanja metode bo treba rezultate potrditi še na drugih primerih. V prihodnjih raziskavah bo treba posvetiti več pozornosti sami segmentaciji, ki je ključnega pomena pri uspešnosti klasifikacije. Poleg klasifikacije bo nujno natančno preučiti tudi učinke stiskanja na druge samodejne procese, kot sta, na primer, prepoznavanje karakterističnih točk in odkrivanje prostorskih vzorcev. ZAHVALA Članek je rezultat študije v okviru Centra odličnosti vesolje, znanost in tehnologije Vesolje-SI, ki ga delno financirajo Evropska unija, Evropski sklad za regionalni razvoj in Republika Slovenija - Ministrstvo za visoko šolstvo, znanost in tehnologijo. Literatura in viri: Aiazzi, B., Baronti, S., Selva, M., Alparone, L. (2006). Enhanced Gram-Schmidt Spectral Sharpening Based on Multivariate Regression of MS and Pan Data. Denver, ZDA, Proceedings of IGARSS2006, 3789-3792. Blaschke, T. (2010). Object based image analysis for remote sensing. ISPRS Journal of Photogrammetry and Remote Sensing, 65(1), 2-16. Boser, B. E., Guyon, I. M., Vapnik, V. N. (1992). A training algorithm for optimal margin classifiers. V D. Haussler (ur.), 5th Annual ACM Workshop on COLT. Pittsburgh, ZDA: ACM Press, 144-152. Fix, E., Hodges, J. L. (1989). Discriminatory Analysis. Nonparametric Discrimination: Consistency Properties. International Statistical Review/ Revue Internationale de Statistique, 57(3), 238-247. Garcia-Vilchez, F., Muiioz-Mari, J., Zortea, M., Blanes, I., Gonzalez-Ruiz, V, Camps-Valls, G., Plaza, A., Serra-Sagristä, J. (2011). On the Impact of Lossy Compression on Hyperspectral Image Classification and Unmixing. IEEE Geoscience and Remote Sensing Letters, 8(2), 253-257. Goodenough, D. G., Dyk, A., Han, T., Jazayeri, A., Li, J. (2004). Impacts of Lossy Compression on Hyperspectral ^^ Products for Forestry. Anchorage, Proceedings of IGARSS 2004, 465-468. ITT Visual Information Solutions (2008). ENVI User's guide. Boulder: ITT VIS. ššs Janža, M. (2005). Določitev rabe tal s klasifikacijo satelitske podobe za namene hidrološkega modeliranja, na območju ^^ zaledja, izvira. Rižane. Geologija, 48(1), 153-159. Kiema,J.B.K.(2000).Effect ofwavelet compression on the automatic classification ofurban environments using high t:} resolution multispectral imagery and laser scanning data. Amsterdam, International Archives of Photogrammetry and - 15 Remote Sensing, 33 (Part B3), 488-495. 5! Laben, A., Brower, B. V. (2000). Process for enhancing the spatial resolution of multispectral imagery using pan-sharpening. U.S. Patent 6011875. Lam,K.W.,Lau,W.,Li,Z. (2000).The effects on image classification using image compression technique.Amsterdam, International Archives of Photogrammetry and Remote Sensing, 33 (Part B7), 744-751. Lang, S. (2008). Object-based image analysis for remote sensing applications: modeling reality - dealing with SS ijS complexity. V Thomas Blaschke, Stefan Lang, in G. J. Hay (ur), Object-Based Image Analysis, Lecture Notes in Geoinformation and Cartography. Berlin Heidelberg: Springer-Verlag, 3-27. Liang, Z., Tang, X., Zhang, G., Wu, X. (2008). Effects of JPEG2000 and SPIHT compression on image classification. Peking, The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, 37 (Part B7), 541-544. Mercier, G., Mouchot, M.-C., Cazuguel, G. (1999). Joint classification and compression of hyperspectral images. O jS Hamburg, Proceedings of IGARSS 1999,28(4), 2035-2037. Serra-Sagrist^, J., Auh'-Llin^s, F. (2008). Remote Sensing Data Compression. VM. Graina in R. J. Duro (ur.), Computational Intelligence for Remote Sensing. Berlin, Nemčija: Springer-Verlag, 27-61. Standard ISO/IEC 15444-1 (2004). Taubman, D. S., Marcellin, M. W. (2002). IPEG2000: Image compression fundamentals, standards and practice. Boston, ZDA: Kluwer academic publishers. Zabala, A., Pons, X. (2011). Effects of lossy compression on remote sensing image classification of forest areas. International Journal of Applied Earth Observation and Geoinformation, 13(1), 43-51. Prispelo v objavo: 31. januar 2012 Sprejeto: 8. junij 2012 Aleš Marsetič, univ. dipl. inž. geod. CO Vesolje-SI, Aškerčeva cesta 12, SI-1000 Ljubljana ZRC SAZU - Inštitut za antropološke in prostorske študije, Novi trg 2, SI-1000 Ljubljana E-pošta: ales.marsetic@zrc-sazu.si dr Žiga Kokalj, univ. dipl. geog. CO Vesolje-SI, Aškerčeva cesta 12, SI-1000 Ljubljana ZRC SAZU - Inštitut za antropološke in prostorske študije, Novi trg 2, SI-1000 Ljubljana E-pošta: ziga.kokalj@zrc-sazu.si dr. Krištof Oštir, univ. dipl. fizik CO Vesolje-SI, Aškerčeva cesta 12, SI-1000 Ljubljana ZRC SAZU - Inštitut za antropološke in prostorske študije, Novi trg 2, SI-1000 Ljubljana E-pošta: kristof@zrc-sazu.si vo is Ü CS