ERK'2021, Portorož, 87-90 87 Simulator rasti vegetacije, temelječ na podatkih LiDAR Simon Kolmanič, Štefan Kohek, Matej Brumen, Danijel Žlaus, Tamara Golob, David Jesenko, Domen Mongus Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko, Koroška cesta 46, 2000 Maribor E-pošta: simon.kolmanic@um.si Vegetation Growth Simulator Based on LiDAR Data Abstract. Forest growth simulation is a well-covered area in the literature which is still developing due to new challenges such a climate changes, forest management planning, and similar [1,2]. First models, describing the forest growth are almost 50 years old [6] and were based entirely on the traditional human observations methods. These simulators give accurate predictions but require a lot of input data in return, which are hard to obtain for larger areas. The automated decision making support systems for managing vegetation on larger areas, however, relay mostly on airborne light detection and ranging (LiDAR) data [9,11]. Although these systems would highly benefit from the ability to predict vegetation growth, there is a lack of simulators that can serve that purpose. In this paper, therefore, a new simulation tool that fuses LiDAR data generated canopy height (CHM) and digital terrain models (DTM) with environmental data (e.g. temperature, precipitation, insolation, pH) in order to support large-scale simulations need for vegetation management. 1 Uvod Napovedovanje rasti dreves je dobro raziskano področje, kjer so prvi modeli stari skoraj 50 let [6]. Ti modeli so v celoti temeljili na človeškem opazovanju in so dajali zadovoljive rezultate, so pa zato potrebovali kup vhodnih podatkov, ki jih je bilo težko pridobiti za večja področja. Nasledniki teh model so v sistemih za upravljanje z gozdovi v uporabi še danes. Čeprav zaradi klimatskih sprememb in izzivov za gospodarjenje z gozdovi nastajajo novi modeli [1,2], ti še vedno niso najbolj primerni za uporabo v avtomatiziranih sistemih za upravljanje z vegetacijo na večjih področjih. Sodobni sistemi namreč v večini temeljijo na podatkih LiDAR, pridobljenih z zračnim snemanjem [9,11]. Ti podatki so primerni za opis velikih površin [7] in služijo za izdelavo višinskih modelov krošenj [4] (angl. Canopy Height Model - CHM). Primer takega modela višine vidimo na sliki 1, kjer je bila za izdelavo modela CHM uporabljena preizkušena metoda [5]. Sistemi za upravljanje z vegetacijo bi bili bolj učinkoviti, v kolikor bi imeli možnost napovedovanja rasti vegetacije. V članku tako predstavljamo simulator, temelječ na podatkih LiDAR, ki ga lahko uporabimo v ta namen. Za napovedovanje rasti dreves smo uporabili linearno regresijo, za širjenje krošenj pa morfološko širjenje. Za večjo natančnost napovedi, smo vegetacijo razdelili v regije z istimi parametri rasti, ki smo jih pridobili iz javno dostopnih slojev Agencije Republike Slovenije za okolje. Slika 1: a) Zračni posnetek LiDAR testnega področja, b) Višinski model krošenj visoke vegetacije na trasi. Segmentacijo smo tvorili glede na več različnih parametrov, pri čemer se je izkazalo, da smo najboljši rezultat dobili, ko smo regije, podobno kot v [6] tvorili glede na povprečno količino padavin, povprečno letno temperaturo, pH, talno število in orientacijo terena. 2 Zasnova simulatorja Simulatorji rasti dreves so v gozdarstvu pogosti, toda večina le-teh ni primernih za uporabo v sistemih za upravljanje z vegetacijo, saj potrebujejo množico specifičnih podatkov tako o samih rastiščih kot sestoju vegetacije, ki jih za poljubna območja ni mogoče zagotoviti. To bi bilo namreč povezano z velikimi stroški, pa tudi časovno bi bilo to težko izvedljivo. Da se temu izognemo, smo za osnovo vzeli delo [10], kjer so avtorji pokazali, da lahko prihodnjo višino dreves uspešno napovemo s pomočjo linearne regresije in zračnih podatkov LiDAR. Metodo je bilo potrebno nekoliko prilagoditi, saj za vegetacijo ni pomemben zgolj prirast v višino, ampak tudi to, za koliko bo krošnja posegla v 88 samo traso, kar pomeni, da smo morali uvesti še faktor širjenja krošnje. Opisan postopek lahko vidimo na sliki 2. Vhod v simulator tako predstavljata posnetka LiDAR danega območja, narejena v časih T 0 in T 1. Iz teh podatkov tvorimo modela krošenj CHM (T 0 ) in CHM (T 1 ) . Kot izhod simulacije dobimo model višin krošenj v času T 2, ki ga določa enačba: CHM (T 2 ) = CHM (T 0 ) +HI, (1) pri čemer vrednost HI določa enačba: 𝐻𝐼 = 𝛽 0 + 𝛽 1 CHM (T 0 ) . (2) kjer sta 𝛽 0 in 𝛽 1 koeficienta linearne regresije, ki ju določimo iz modelov krošenj CHM (T 0 ) in CHM (T 1 ) . Poleg koeficientov 𝛽 0 in 𝛽 1 iz razlike med vhodnima modeloma krošenj določimo še parameter D, ki predstavlja širjenje krošnje. Simulacija je implementirana v programskem jeziku R [3], širjenje krošenj pa je izvedeno z morfološkim širjenjem, kjer parameter D predstavlja velikost morfološkega strukturnega elementa. Slika 2: Delovanje simulatorja rasti vegetacije, temelječega na podatkih LiDAR. Pri razvoju moramo upoštevati, da je zaradi velikosti terena struktura vegetacije toliko različna, da enolični koeficienti 𝛽 0, 𝛽 1 in D niso zadostni za natančno simulacijo rasti. Zaradi tega je bilo teren potrebno razdeliti tako, da zajamemo področja z isto strukturo vegetacije. V ta namen smo regije oblikovali glede na potrebe rastlin po temperaturi, vlagi, kislosti, dušiku in osvetlitvi [6]. Teren, ki ga predstavljata CHM (T 0 ) in CHM (T 1 ) tako razpade na več regij, združenih v množicah {𝑟 0 (𝑇 0 ) , 𝑟 1 (𝑇 0 ) , … , 𝑟 𝑛 (𝑇 0 ) } in {𝑟 0 (𝑇 1 ) , 𝑟 1 (𝑇 1 ) , … , 𝑟 𝑛 (𝑇 1 ) }. Za vsak par regij 𝑟 𝑖 (𝑇 0 ) in 𝑟 𝑖 (𝑇 1 ) določimo parametre modela (𝛽 0 𝑖 , 𝛽 1 𝑖 , 𝐷 𝑖 ), s pomočjo katerih nato napovedujemo rast vegetacije posamezne regije oziroma množice regij {𝑟 0 (𝑇 2 ) , 𝑟 1 (𝑇 2 ) , … , 𝑟 𝑛 (𝑇 2 ) }. Z zlitjem teh regij pa tvorimo končni CHM (T 2 ) . Natančnost simulacije lahko dodatno izboljšamo s primerjavo napovedi z modelom CHM realnega stanja v času T 2. Razliko med napovedjo in realnim stanjem lahko nato uporabimo za uglasitev parametrov napovednega modela. 3 Segmentacija Za potrebe segmentacije smo uporabili sloje povprečne temperature zraka, povprečne letne višine korigiranih padavin za obdobje 1971-2000, povprečnega trajanja sončnega obsevanja – poletje za enako obdobje ter pedološko karto Slovenije. Le ta vsebuje podatke o kislosti tal in talnem številu. Slednje je ekvivalent vsebnosti dušika v tleh. S presekom geoobjekta želenega območja z zgoraj omenjenimi sloji, dobimo množico mnogokotnikov s pridruženimi parametri, ki jih lahko vidimo na desni strani na sliki 3. Slika 3: Presek geoobjekta trase s sloji za opis klimatskih značilnosti in pedološke karte Slovenije. Poleg naštetih slojev, ki so javno dostopni, pa smo dodatno zgenerirali še sloj, ki nam opisuje orientacijo terena, saj so razredi sončnega obsevanja pregrobi, da bi lahko zaznali prisojne in osojne lege, ki so pomembne pri napovedi intenzivnosti rasti. Tudi sloj orientacije terena uporabimo za izračun preseka z geoobjektom trase, kar dodatno bistveno poveča količino nastalih mnogokotnikov. Z razpadom dobljenega območja na množico mnogokotnikov, lahko začnemo tvoriti posamezne regije tako, da grupiramo med seboj mnogokotnike z enakimi lastnostmi. Čeprav je za to uporabnih več kot 30 parametrov, smo se, kot že omenjeno, omejili na tiste, ki so blizu Ellenbergovim ekološkim koeficientom. Za 89 segmentacijo smo tako izbrali temperaturo (Tm), sončno obsevanje (So), orientacijo terena (Or), padavine (Pv), kislost tal (pH) in talno število (TSS). Poleg tega, da smo želeli ovrednotiti vpliv posameznega parametra na natančnost napovedi, smo izvedli segmentacijo tudi s kombinacijo posameznih parametrov in sicer smo uporabili dve kombinaciji parametrov. Prva kombinacija je višina padavin, temperatura, sončno obsevanje in orientacija terena (Pv/Tm/So/Or), medtem ko je druga kombinacija višina padavin, temperatura, kislost tal, talno število in orientacija terena (Pv/Tm/pH/TSS/Or). Segmentacijo smo izvajali nad testnim območjem, ki pokriva 272 ha. Glede na izbrani parameter, je trasa razpadla na različno število regij, prikazanih v tabeli 1. Tabela 1. Vpliv izbranega parametra na število regij Izbrani parameter Število regij Padavine (Pv) 2 Kislost tal (pH) 6 Talno število (TSS) 10 Orientacija terena (Or) 5 Kombinacija 1 (Pv/Tm/So/Or) 30 Kombinacija 2 (Pv/Tm/pH/TSS/Or) 78 Vsaka od tako ustvarjenih regij predstavlja samostojen geoobjekt. Za potrebe simulacije je tako potrebno ustrezno razrezati še CHM (T 0 ) in CHM (T 1 ) . Na sliki 4 lahko vidimo razrez gornjega dela testnega območja iz leta 2014, oziroma ustreznega modela CHM le-te, glede na parameter pH. Slika 4: Razpad CHM površine testnega območja iz leta 2014 glede na parameter kislosti tal (pH). Vsaka regija v obliki modela CHM je shranjena kot raster v formatu TIFF z ločljivostjo pol metra. 4 Rezultati Simulator smo testirali na testnem območju na Primorskem, slika 5. Pri testiranju smo uporabljali dva posnetka LiDAR prej omenjenega območja, prvi je bil iz leta 2014 in je javno dostopen preko Agencije Republike Slovenije za okolje, drugi pa je iz leta 2017 in je v lasti družbe ELES. Povprečna resolucija prvega je bila 9 točk/m 2 , drugega pa 100 točk/m 2 . Med obema snemanjema so bili opravljeni tudi določeni poseki na terenu, zato je bilo potrebno le-te upoštevati pri iskanju parametrov napovednega modela. Za izdelavo modelov CHM in segmentacijo smo uporabljali lastno orodje GeMMa Fusion Suite, prav tako smo v tem orodju iz CHM (2014) odstranili vso vegetacijo, ki je bila posekana med letoma 2014 in 2017. Simulacija je potekala v okolju RStudio [3], rezultati pa so bili vizualizirani ponovno znotraj orodja GeMMa Fusion Suite. Zaradi lažje primerjave rezultatov napovedi ob različnih segmentacijah, smo CHM (2017) uporabljali tako za učno kot testno množico, saj se je sicer različna velikost regij odražala v rezultatih, čemur smo se želeli izogniti. Slika 5: Primerjava vegetacije v letih a) 2014 in 2017, b) 2014 in 2021. Pri primerjavi smo se omejili zgolj na visoko vegetacijo, to je vegetacija, višja od petih metrov. V kolikor primerjamo rezultat simulacije z izhodiščnim modelom CHM, lahko vidimo, da se je področje, ki ga pokriva vegetacija nekoliko razširilo, povečala pa se je tudi višina vegetacije. Na sliki 5a lahko neposredno primerjamo model CHM (2017) , ustvarjen s simulacijo z modelom CHM (2014) , tako da CHM (2017) prekrijemo s CHM (2014) . Razlika je še bolj očitna na sliki 5b, kjer primerjamo CHM (2014) in CHM (2021) . Več o natančnosti simulacije nam pove merjenje napake napovedi s pomočjo uveljavljenih metrik RMSE (angl. Root Mean Square Error) in MAE (angl. Mean Absolute 90 Error). Iz slike 6 lahko vidimo, da se napaka RMSE za celotno traso giblje med 1,613 in 1,530 m, medtem ko se napaka MAE giblje med 1,299 in 1,143 m. Glede na to, da imamo v tem primeru opravka z visoko vegetacijo, so napovedi še vedno uporabne, saj se napaka MAE v najboljšem primeru giblje v okviru enega metra. Slika 6: Gibanje napake napovedi rasti, v odvisnosti od segmentacije. Iz slike 6 lahko razberemo, da najboljše rezultate daje tista segmentacija, ki je najbliže Ellenbergovim ekološkim koeficientom. To lahko pojasnimo z dejstvom, da rastišča z enakimi pogoji za rast zasedajo podobne rastlinske združbe, ki jih zato lažje opišemo z enakimi parametri napovednega modela, tudi če samih rastlinskih združb ne poznamo. 5 Zaključek Glavna prednost predstavljenega simulatorja, je ta, da potrebuje neprimerno manj vhodnih podatkov, kot običajni simulatorji rasti. Iz podatkov LiDAR lahko namreč razločimo posamezna drevesa, določimo njihovo višino in obliko krošnje [8], nič pa ne moremo povedati o njihovi starosti, kar je zelo pomemben podatek, prav tako ne vemo skoraj nič o vrsti, ki ji drevo pripada. Dodatno težavo predstavljajo različne resolucije oblakov točk, ki jih imamo na razpolago. Le-te predstavljajo dodaten vir napak, ki jih ni mogoče v celoti odpraviti. Lahko pa napake v napovedovanju omilimo s smiselno segmentacijo, ki nam združuje rastline z enakimi potrebami po rastiščih. Segmentacija lahko pomaga tudi v primeru nepopolnih podatkov o za nas zanimivih območjih, ko lahko za napovedovanje rasti uporabimo parametre napovednega modela sorodnih regij, kar ugodno vpliva na stroške delovanja sistema za upravljanje z vegetacijo. Naše prihodnje delo bo namenjeno razvoju sistema za adaptivno segmentacijo, ki se bo avtomatizirano prilagajal napaki v napovedi in jo s tem posledično zmanjševal. Literatura [1] Felipe Bravo, Marek Fabrika, Christian Ammer, Susana Barreiro, Kamil Bielak, Lluis Coll, Teresa Fonseca, Ahto Kangur, Magnus Löf, Katarina Merganičová, and others. 2019. Modelling approaches for mixed forests dynamics prognosis. Research gaps and opportunities. Forest Systems 28, 1 (2019), eR002. [2] Michael J Case, Brittany G Johnson, Kristina J Bartowitz, and Tara W Hudiburg. 2021. Forests of the future: Climate change impacts and implications for carbon storage in the Pacific Northwest, USA. Forest Ecology and Management 482, (2021), 118886. [3] Nicholas J Horton and Ken Kleinman. 2015. Using R and RStudio for data management, statistical analysis, and graphics. CRC Press. [4] Denis Horvat, Borut Žalik, and Domen Mongus. 2016. Context-dependent detection of non-linearly distributed points for vegetation classification in airborne LiDAR. ISPRS Journal of Photogrammetry and Remote Sensing 116, (2016), 1–14. [5] Anahita Khosravipour, Andrew K Skidmore, Martin Isenburg, Tiejun Wang, and Yousif A Hussin. 2014. Generating pit-free canopy height models from airborne lidar. Photogrammetric Engineering & Remote Sensing 80, 9 (2014), 863–872. [6] Simon Kolmanič, Nikola Guid, and Jurij Diaci. 2014. ForestMAS–A single tree based secondary succession model employing Ellenberg indicator values. Ecological Modelling 279, (2014), 100–113. [7] Domen Mongus, Niko Lukač, and Borut Žalik. 2014. Ground and building extraction from LiDAR data based on differential morphological profiles and locally fitted surfaces. ISPRS Journal of Photogrammetry and Remote Sensing 93, (2014), 145–156. [8] Domen Mongus and Borut Žalik. 2015. An efficient approach to 3D single tree-crown delineation in LiDAR data. ISPRS Journal of Photogrammetry and Remote Sensing 108, (2015), 219–233. [9] Ana Novo, Noelia Fariñas-Álvarez, Joaquin Martínez-Sánchez, Higinio González-Jorge, and Henrique Lorenzo. 2020. Automatic processing of aerial LiDAR data to detect vegetation continuity in the surroundings of roads. Remote Sensing 12, 10 (2020), 1677. [10] Cheng Wang and Nancy F Glenn. 2008. A linear regression method for tree canopy height estimation using airborne lidar data. Canadian Journal of Remote Sensing 34, sup2 (2008), S217–S227. [11] DW Wanik, JR Parent, EN Anagnostou, and BM Hartman. 2017. Using vegetation management and LiDAR-derived tree height data to improve outage predictions for electric utilities. Electric Power Systems Research 146, (2017), 236–245.