Zbornik gozdarstva in lesarstva, 40, 1992, s. 3-14 Prispelo/Received: novembra/November 1992 GDK 181.1: 182.5 Math.Subj.Class. (1991) 15A52, 62H20, 92B15 EVKLIDSKO PRIMERJANJE SESTOJEV PO RASTLINSKIH VRSTAH Anton CEDILNIK*, Dušan ROBIČ** Izvleček V članku je opisana metoda primerjanja sestojev glede na pojavnost rastlinskih vrst. V nasprotju z metodami, ki so ali so bile že v uporabi, je naše primerjanje čisto evklidsko: sestoji so enakovredni vektorji v mnogorazsežnem evklidskem prostoru (bazne smeri so rastline) in primerjave med njimi se izražajo z njihovimi skalarnimi produkti. Glede na rastlinske vrste in njihove medsebojne odvisnosti imamo sestoje za slučajne vzorce, kar nam omogoči dobiti cenilke za kote med baznimi smermi in s tem tudi za skalarne produkte. Ključne besede: ordinacijska metoda, primerjanje sestojev, evklidska metrika EUCLIDEAN COMPARISON OF STANDS ACCORDING TO PLANT SPECIES Anton CEDILNIK"', Dušan ROBIČ** Abstract In the article we describe a method of comparison of stands according to the appearance of plants. Contrary to methods which are or have been already in use, our comparison is purely euclidean: the stands are vectors in a multidimensional space (base lines are the plants) and the comparisons among them are expressed by their scalar products. We consider the stands in regard to plant species and their interrelations as random samples which enables us to get an estimate for the angles between the base lines and so also for necessary scalar products. Key words: ordination method, comparison of stands, euclidean distance. • dr.docent A. C., Gozdarski oddelek Biotehniške fakultete, Ljubljana, Večna pot 83, SLO •• mag. D. R., višji predavatelj, Gozdarski oddelek Biotehniške fakultete, Ljubljana, Večna pot 83, SLO 4 Zbornik gozdarstva in Jesarstva, 40 1 lNOD Naloga, ki jo bomo reševali, je povsem kJasična. Primerjamo popise danih rastlinskih združb (sestojev, fitocenoz, habitatov) Fi, ... , Fn glede na to, ali in kako se v njih pojavljajo rastlinske vrste Ri, ... , Rm (m, n z 2; zaželeno je, da sta čim večja). Pojavnost rastline R; v sestoju Fi naj podaja število aii. Ta števila so načeloma lahko poljubna realna števila, edina omejitev je, da so lestvice njihovih vrednosti za vse rastline progresivne in vsaj približno linearne. Zaželeno je še, da je število vrednosti v vsaki lestvici čim večje, da je torej čim bolj podrobno opisano, kako ustrezna rastlina nastopa v opazovanem sestoju. Treba pa je posebej poudariti, da smejo biti lestvice za različne rastlinske vrste, podvrste in celo istovrstne rastline v različnih slojih različne! Dana je torej vhodna tabela 1 kot edini podatek za primerjanje sestojev. Sestoji so vektorji ali pa točke ( odvisno od interpretacije) v m-razsežnem vektorskem Tabela l. Sestoji F1 Fz ... Fn Vrste Rz all a12 ... a1n Rz azl azz ... a2n ... Rm am1 am2 ... amn prostoru. Definiramo lahko, da je razdalja med dvema vektorjema kot med njima, razda]ja med dvema točkama pa običajna razdalja, ki je enaka velikosti razlike ustreznih vektorjev. Vsaka od teh dveh metrik bo imela svojo interpretacijo. Za izračun obeh pa potrebujemo skalarne produkte med sestoji. Ti skalarni produkti so preprosta reč, če je baza že ortogonalna, kar bi pomenilo, da so rastline med seboj neodvisne. Seveda pa to v splošnem ni res in je treba vzajemno odvisnost rastlin še oceniti. Ocenjevanje odvisnosti med rastlinami je glavni del vsebine te razprave. Doslej je bilo evk1idsko ocenjevanje različnosti fitocenoz sicer že standardni del kvantitativne ekologije (PIELOU 1977). Tudi koti med mnogodimenzionalnimi vektorji - fitocenozami so v nekem smislu že bili uporabljeni za kJasificiranje fitocenoz (ORLOCI (cit. PIELOU 1977) imenuje tetive lokov, ki pripadajo tem kotom, standardizirane razdalje). V glavnem pa so avtorji predpostavili, da rastlinske vrste tvorijo ortonormiran koordinatni sistem. Ortogonalnost so upravičevali s tem, da se negativne in pozitivne korelacije med rastlinami - pri velikem številu upoštevanih rastlinskih vrst in velikem številu sestojev - bolj ali manj anihilirajo; normiranost pa je bila utemeljena s skrbno izbiro lestvic količin rastlin ali pa (pri O za odsotnost in 1 za prisotnost rastlinske vrste v sestoju) s tem, da lestvic sploh ni. 5 Cedilnik A., Robič D.: Evklidsko primerJanJe Neortogonalni razdalji sta uporabljala GENGERELLI in MAHALANOBIS. Gengerelli je uporabil le korelacije, zaradi česar je lahko za primerjave uporabljal le podobne rastline. Mahalanobis je (pravilneje) uporabil kovariančno matriko, ni pa zmanjšal vpliva nediagonalnih elementov, kar povzroči čudne rezultate, če je primerjanih sestojev malo. Vrstice v tabeli 1 bomo imeli za slučajne vzorce pojavnosti rastlinskih vrst, korelacije med vrsticami pa uporabili za ocenjevanje kotov med koordinatnimi smermi. Mimogrede bomo podatke še standardizirali, da bodo lestvice pojavnosti rastlin res tako poljubne, kot smo napisali v začetku uvoda. 2 PRIPRAVA PODATKOV Že od vsega začetka se moramo sprijazniti z dejstvom, da so primerjave fitocenoz nujno relativne. Povejmo to s primerom: če se F3, .. ,, Fn zelo razlikujejo med seboj in tudi od F1 in F2, bomo ugotovili veliko podobnost med njima; če pa so si F3, ... , Fn zelo podobni, nam bo račun pokazal veliko razliko med F 1 in F2• Zato bomo že na začetku podatke v tabeli 1 nekoliko popravili. Tiste količine, ki so skupne vsem sestojem, bomo odvrgli kot nebistvene za naše primerjave, upoštevali pa bomo zato le tiste, ki vsaj pri kakšnem sestoju kažejo na različnost. Prvi popravek: vse lestvice količin rastlin bomo premaknili tako, da se bodo začele z O. (1) Z; .- min {a;i, ao, .... ain} (i = 1, ... , m); (2) bik := a;k • z; (i = 1, ... , m; k = 1, ... , n). Na tem mestu bomo za poznejšo rabo izračunali neko novo ko1ičino: (3) (i = 1, ... , m). Drngi popravek: če se neka rastlina v vseh sestojih enako pojavlja, jo izločimo kot nepomembno za primerjave: e; = O • R; izločimo. Pri tem se v splošnem m zmanjša. Brez nevarnosti za nesporazum bomo novo število rastlinskih vrst spet označili z m. Tudi ta m mora imeti 2 za absolutno spodnjo mejo: m ~ 2. 6 Zbornik gozdarstva in lesarstva, 40 Pripravimo si še eno serijo novih količin: n (4) V;i: = L blkbik ne1ei = v11 k=I (i,j = 1, ... , m). Tretji popravek pa bo drugačne vrste. Lestvica vrednosti za določeno rastlino je prirejena naravi te rastline. Zato je treba vse lestvice nekako standardizirati. Prvi popravek je že bil ukrep v tej smeri. Ponazorimo problem z naslednjim primerom. Pri vseh rastlinah naj števila alk pomenijo števila osebkov v opazovanem sestoju. Potem bodo očitno zeli imele neprimerno pomembnejšo vlogo v primerjavah kot drevesa, kar pa zagotovo ni smiselno. Zato se bomo nekaj pozneje vrnili k tej standardizaciji. Bistveni privzetek v tem sestavku je, da predstavljajo sestoji slučajne vzorce. za rastline ter njihove medsebojne relacije in interakcije. Vrstica b11, bn, ... , b;n je po tem privzetku slučajni vzorec za pojavnost rastlinske vrste R;; s tem postane R; slučajna spremenljivka. Povprečno količino določene vrste da cenilka za povprečno vrednost: (5) R; = e1 (i 1, ... , m). Variabilnost rastlinske vrste podaja cenilka za standardni odklon: (6) 1 n L (bik R;)2 n - 1 k=l v;;/(n - 1) =: s; (i = 1, ... , m). Standardni odklon je nekako naravna enota slučajne spremenljivke in to bomo izkoristili za prej omenjeni tretji popravek: (7) c"' = b"' / s; (i = 1, ... , m; j = 1, ... , n). 3 SKALARNI PRODUKTI SESTOJEV Izračunajmo najprej glavne statistike slučajne spremenljivke R;, podane s števili Cik. (8) R; = e;f s1 , (9) s(RJ = 1. (i = 1, ... , m). Cenilka za kovarianco dveh rastlin je (10) K(R;, R1 ) = n ~ 1 't,_1 (clk - R;)(c11;: - R1 ) = &, ~ '\Jvuvff (i, j = · 1, ... , m). Zaradi (9) pa je to tudi cenilka za korelacijski koeficient dveh rastlinskih vrst. 7 Cedilnik A, Robič D.: Evklidsko primerjanje če imamo rastlinske vrste za smeri v mnogodimenzionalnem evklidskem prostoru, so K(R;,Ri) ocene za kosinuse kotov med temi smermi. Ocene za kote so tedaj: (11) 1//ii = arccos( K ( R;, Ri)) (i, j = 1, ... , m). Rj Slika 1. Preverimo, če so te ocene dobre. Resda je O s lf/;i s n. Treba pa je še pogledati, če velja sferno trikotniško pravilo (slika 1): \:/;. i. k E { 1, ... , m}: 1//ik s f//;j + f//w vij, za določena i in j, je skalarni produkt vektorjev [bik - e;] 1 xn in [bik - eiLn· Od tod sledi nenegativnost Gramove determinante: Vu vii Vik vii vii vik ;:=:: O. vki vki vkk Z nekaj preračunavanja to zapišemo takole: Obe strani te ocene delimo z v 11 .jviivkk in upoštevamo (10): Iz (11) potem sledi: cos( l/ljk) ;:=:: cos( 1//;)cos( lf/;k) - sin( !//;)sin( lf/;k) = cos( lf/;i + lf/;k)- Kosinus je padajoča funkcija na intervalu [O,n], zato: l/ljkSlf/;j+lf/;k• Naslednja stopnja v abstrakciji problema je v tem, da identificiramo rastlinsko vrsto R; s sestojem, v katerem nastopa samo ta rastlina in sicer v količini, ki je 8 Zbornik gozdarstva in lesarstva, 40 v standardni enoti ravno 1. Sestoji Fk so potem linearne kombinacije vektorjev Ri: m (12) F1c L Cv,R, l=I (k = 1, ... , n). Ker poznamo kote med rastlinskimi vrstami, lahko ocenimo njihove skalarne produkte: (13) (R;,Ri) = IIR,11·1lR1 ll·cos(Vtii) = K(Ri,Ri) (i, j = 1, ... , m). Od tod pa že dobimo skalarne produkte sestojev: / m m ) m m bikbjlvij (14) (F1c,F,) = \t1cikR;,~c11Ri (n l)t1~ VuV» (k, l = 1, ... , n), pri čemer smo upoštevali enačbe (4), (7), (10) in (13). Zdi pa se nam potrebno uvesti še dodaten korekcijski faktor (poleg faktorja (n - 1)/n, ki je v izračunu nepristranske cenilke za standardni odklon tudi neke vrste korekcijski faktor). Menimo namreč, da je izračunana korelacija med rastlinami (absolutno) prevelika in da so rastlinske vrste v resnici med seboj bolj neodvisne. Zato bomo v1i za i :t= j nadomestili z svii, kjer je e E [0,1]. Kakšen e izberemo, je odvisno od števila sestojev n; z manjšanjem števila sestojev se mora zmanjšati tudi e. Predlagamo naslednjo korekcijo: (15) e (n 2)2 n(n - 1)' Njena utemeljitev je v računski preprostosti in v tem, da metoda s tem korekcijskim faktorjem dobro funkcionira. Če torej definiramo (16) P11 P11 = ( n - 1) / V11 (n 2)2vii =---~ nv11v11 (i, j = 1, ... , m), so skalarni produkti m m (i = j), (i * j), (17) {Fk, F,) = L L bikbj,Pij = {F,' Fk) i=l J=I (k, l = 1, ... , n) Definirajmo naslednje matrike: B:= [bikt,n;P:= [PiiLxm;Go: [(F1c,F,}L • . [gk/Ln• Potem je: (18) 9 Cedilnik A., Robič D.: Evklidsko primerjanje Skalarni produkti sestojev so ključni za računanje njihovih medsebojnih razdalj. To nam da možnost, da ugotovimo relativno pomembnost rastlinskih vrst ali skupin vrst. Recimo, da sta r in A dve podmnožici rast1inskih vrst, katerih značilnost (signifikantnost) bi radi primerjali. Naj bo Gr matrika skalarnih produktov po izločitvi rastlin r in analogno G !J.• Sklepamo, da je vrsta ali skupina vrst tem pomembnejša, čim večjo spremembo doživi matrika G0 potem, ko to vrsto ali skupino vrst izločimo iz računa. Torej: r je pomembnejša od A, če je IIGo - Gr II ~ !!Go GA jj. Zato je smiselno definirati: signifikanca neke podmnožice rastlinskih vrst A je kvocient (19) sgnf(A): Sicer je še vprasanJe, kakšno normo izberemo. Iz računskih razlogov pa je najbolje, če se odločimo za evklidsko normo: 4 PRIMERJAVE Naredili bomo dve primerjavi, kot ju kaže slika 2. Slika 2. (A) Prvi tip razdalje podaja kot Fk ima v glavnem veliko osebkov katere koli vrste takrat, ko jih ima veliko tudi F1; rkl ;::; O <=> Fk ima veliko določenega rastlinja navadno takrat, ko ga ima F1 malo; rld ,:; -1 <=> Fk je porasel z rastlinskimi vrstami, ki se izključujejo z vrstami iz F,. 10 Zbornik gozdarstva in lesarstva, 40 (Seveda imata izraza "veliko" in "malo" relativen pomen glede na povprečno poraščenost fitocenoz Fi, ... , F11 z dotično rastlinsko vrsto). Zato smemo koeficientu rkl reči vrstna podobnost, kotu uVp ' v11 : vij J·: 1· + 11----------r~~;--, aik: aik ( i = 1, ... , m - 1; j=i+l, ... ,m) (k l, ... n) (i=l, ... ,ni) m m gkl:= LLaikajlvif; glk:= gkl (k= l, ... ,n;l = k, ... ,n) i=l j=l (f}kk : O(k=l, ... ,n) 7 SKLEP r: = gkkgll; 13 Cedilnik A., Robič D.: Evklidsko primerjanje ... ČE y = O POTEM 'Pkz:= l; ČE r * O POTEM 'Pkz: = ¼ arccos(g"if,Jy); narediti dejansko ordinacijo sestojev. Metod je veliko in nobenega vzroka ni za domnevo, da ne bi bile vsaj nekatere uporabne na naših rezultatih. 8 SUMMARY If we consider stands as vectors in a multidimensional Euclidean space, wbere plant species are tbe base vectors, the distance between two stands is calculated from the scalar products of stands. The essence of our method is that we calculate these scalar products considering estimates of angles between base elements; the estimates are the covariances of pairs of plant species, regarding the stands as random samples for tbe quantities of those species. We take the covariances into account in accordance with the number of stands. From the scalar products we derive two types of distances: usual Euclidean metric as the total distance, and the angle between two stands as the variety distance. This angle is calculated from its cosine which is got in the usual way. At the end we set the algorithm of the method described. 9 REFERENCE ORLOCI, L. (1966): Geometric models in ecology: I. The theory and application of some ordination methods. J. Ecol., Vol. 54, No. 1, 193-215. ORLOCI, L. (1975): Multivariate Analysis in Vegetation Research. Junk, The Hague. PIELOU, E.C. (1977): Mathematical Ecology. John Wiley & Sons, Toronto.