      P 48 (2020/2021) 3 9 Regresijska premica P L̌ Denimo, da imamo v pravokotnem koordinat- nem sistemu na ravnini tri točke, T1px1, y1q, T2px2, y2q, T3px3, y3q, ki sicer ne ležijo na isti pre- mici. Ampak v mislih si vseeno lahko narišemo premico, od katere bodo vse le malo oddaljene. Ilu- stracijo imamo na sliki 1. SLIKA 1. Tri točke, ki ne ležijo na isti premici. Denimo, da so te tri točke rezultati treh meritev para količin px,yq in vemo, da je zveza med količi- nama teoretično linearna v obliki y “ f pxq “ px`q. Tu sta p in q neznana in ju moramo še določiti. Za- radi slučajnih napak pri meritvah prihaja zmeraj do rahlih odstopanj od pravih vrednosti in zato točke niso kolinearne. Kako bi kar najbolje izkoristili rezultate vseh treh meritev in določili premico, ki se »najbolje« prilega vsem trem meritvam? Radi bi, da premica kar naj- bolje podaja rezultate meritev, se pravi, da je f pxiq kolikor je mogoče blizu yi za i “ 1,2,3. Odstopanja, to so vrednosti |f pxiq ´yi|, naj bi bila kolikor je mo- goče majhna. Na sliki 2 smo narisali premico, ki se na oko kar dobro prilega danim podatkom. Dolžine debelo narisanih navpičnih rdečih daljic so veliko- sti odstopanj meritvenih vrednosti od ustreznih vre- dnosti na premici. Nekatera odstopanja so navzgor, druga navzdol. Nekako moramo minimizirati ta od- stopanja v celoti. Obstajajo močni razlogi (ki jih pa tu ne moremo razlagati), da uporabimo metodo naj- manjših kvadratov. To pomeni, da skušamo mini- mizirati vsoto kvadratov odstopanj, torej vsoto kva- dratov dolžin rdečih daljic na sliki 2. SLIKA 2. Rdeče so narisana odstopanja.       P 48 (2020/2021) 310 Števili p in q moramo torej izbrati tako, da bo vsota W “ py1´f px1qq 2`py2´f px2qq 2`py3´f px3qq 2 (1) minimalna. Premico, ki zadošča tem pogojem, ime- nujemo regresijska premica. To lahko posplošimo. Če imamo točke T1px1, y1q, T2px2, y2q, . . . , Tnpxn, ynq, je regresijska premica y “ f pxq “ px ` q tista, za katero je vsota W “ py1 ´ f px1qq 2 ` py2 ´ f px2qq 2 ` . . . ` pyn ´ f pxnqq 2 (2) najmanjša. V programu Geogebra je regresijska premica ime- novana trendna črta. Napišemo seznam točk in ukaz Trendna črta nam nariše regresijsko premico in da njeno enačbo. Uporabimo lahko tudi program za preglednice Excel. Grafična računala znajo potegniti tako premico. Z vektorji bomo izpeljali enačbo regresijske pre- mice v primeru treh točk. V ta namen se bomo pre- selili v trirazsežni prostor. Če vas zanima le rezultat, lahko nadaljujete pri enačbah (3) in (4). Število W v enačbi (1) je kvadrat razdalje med znano točko Y py1, y2, y3q s krajevnim vektorjem á́y “ py1, y2, y3q in neznano točko Zpf px1q, f px2q, f px3qq s krajevnim vektorjem á́ z “ pf px1q, f px2q, f px3qq. Ta W mora biti minima- len. Zato mora biti razdalja med Y in Z minimalna! Vektor á́z lahko zapišemo, kot lahko takoj preve- rite, zaradi f pxiq “ pxi ` q (za i=1,2,3) takole: á́ z “ ppx1, x2, x3q ` qp1,1,1q. Označimo px1, x2, x3q “ á́ x , p1,1,1q “ á́c . Torej je á́ z “ p á́x ` q á́c . Tako točka Z leži na ravnini, napeti na znana vek- torja á́x in á́c . Z drugimi besedami, točka Z leži na ravnini Σ skozi izhodišče ter točki Xpx1, x2, x3q in Cp1,1,1q. Iščemo torej točko Z na ravnini Σ, ki je najmanj oddaljena od točke Y . To je točki Y naj- bližja točka na ravnini Σ. Geometrija nam pove, da je iskana točka Z pravokotna projekcija točke Y na ravnino Σ. Vektor á́ YZ “ á́z ´ á́y “ p á́x `q á́c ´ á́y je torej pra- vokoten na vektorja á́x in á́c , ki razpenjata ravnino Σ. Tako je skalarni produkt pp á́x `q á́c ´ á́y q¨ á́x “ p á́x ¨ á́x `q á́c ¨ á́x ´ á́y ¨ á́x “ 0. Še pp á́x `q á́c ´ á́y q¨ á́c “ p á́x ¨ á́c `q á́c ¨ á́c ´ á́y ¨ á́c “ 0. Dobili smo sistem dveh linearnih enačb za p in q: p á́ x ¨ á́x ` q á́c ¨ á́x “ á́y ¨ á́x p á́ x ¨ á́c ` q á́c ¨ á́c “ á́y ¨ á́c ... Izračunamo skalarne produkte v zadnjih dveh enač- bah: á́ y ¨ á́x “ y1x1 `y2x2 `y3x3, á́ x ¨ á́x “ x1 2 ` x2 2 ` x2 2, á́ y ¨ á́c “ py1, y2, y3q.p1,1,1q “ y1 `y2 `y3, á́ x ¨ á́c “ x1 ` x2 ` x3, á́ c ¨ á́c “ 3. Sistem enačb za p in q lahko tako prepišemo v enačbi ppx1 2 ` x2 2 ` x3 2q ` qpx1 ` x2 ` x3q “ y1x1 ` y2x2 ` y3x3 (3) ppx1 ` x2 ` x3q ` 3q “ y1 `y2 `y3. (4) Primer Vzemimo točke (1,4), (3,3), (5,0) v ravnini. Tako je x1 “ 1, y1 “ 4 itd. Če te podatke vstavimo v (3) in (4), dobimo 35p ` 9q “ 13, 9p ` 3q “ 7.       P 48 (2020/2021) 3 11 Pomnožimo drugo enačbo z ´3 in prištejmo prvi, pa dobimo 8p “ ´8 in tako je p “ ´1. Izračunamo še q “ 163 . Premica, ki se najbolje prilega danim trem točkam, ima torej enačbo y “ ´x ` 163 . Narisana je na sliki 3. SLIKA 3. Regresijska premica Brez težav boste verjeli, da formuli (3) in (4) lahko posplošimo na primer n točk in dobimo za parame- tra p in q regresijske premice enačbi: ppx1 2 ` x2 2 ` . . .` xn 2q ` qpx1 ` x2 ` . . .` xnq “ y1x1 `y2x2 ` . . .`ynxn, ppx1 ` x2 ` . . .` xnq `nq “ y1 `y2 ` . . .`yn. Na koncu povejmo še nekaj o zgodovini metode naj- manjših kvadratov. Izvira iz potreb astronomov in geodetov po povečanju natančnosti z večkratnimi meritvami. Dubrovčan Rudjer Bošković je leta 1757 predlagal kriterij za najboljšo aproksimacijo, ki bi na sliki 2 pomenil najti premico, pri kateri je naj- večje odstopanje najmanjše, se pravi, največja med rdečimi daljicami naj bo kolikor je mogoče kratka. Slavni francoski matematik Pierre Simon Laplace (1754–1827) je avtor izredno vplivne monografije (v petih knjigah) o nebesni mehaniki Traité de méca- nique céleste. Laplace je predlagal minimiziranje vso- te dolžin rdečih daljic na sliki 2. Francoz Adrien-Marie Legendre je leta 1805 prvi jasno predstavil metodo najmanjših kvadratov. Nare- dil je tudi primerjavo z Laplaceovo metodo pri raču- nanju oblike Zemlje. Uporabil je kar Laplaceove po- datke. Astronomi in geodeti so hitro razumeli prednosti nove metode. Matematik Carl Friedrich Gauss (1777–1855), ki je kasneje dobil naziv knez matematikov, je že leta 1801 uporabil metodo najmanjših kvadratov pri do- ločitvi orbite pritlikavega planeta Cerere. To je odkril italijanski astronom Giuseppe Piazzi. V dobrem me- secu je opravil 24 opazovanj. Potem je zbolel, med njegovo boleznijo pa je Cerera izginila v siju Sonca. Podatke je Piazzi kasneje poslal trem drugim astro- nomom. Ko naj bi bilo opazovanje spet mogoče, pla- neta niso več mogli najti. Štiriindvajsetletni Gauss je izdelal novo metodo za približno določevanje orbit in po intenzivnem računanju s Piazzijevemi podatki eno leto po odkritju sporočil, kje naj iščejo Cerero (Ceres). Dejansko so jo našli pol stopinje od predvi- denega mesta. Takratni astronomi si verjetno niti v sanjah niso mogli predstavljati, da bo dobri dve stoletji kasneje (leta 2015) Cerero obiskala in jo od blizu proučila vesoljska sonda Dawn. Vsi prej omenjeni so bili del znanstvene skupnosti, ki je postavila temelje, da je bilo to sploh mogoče. Gaussova trditev, da je metodo najmanjših kvadra- tov razvil že leta 1795 (a tega ni objavil), je vodila v spor z Legendrom. Kasneje pa je Gauss veliko upo- rabnost metode utemeljil z verjetnostnim računom in to tudi objavil. ˆ ˆ ˆ Križne vsote R  ̌            8 5 7 8 2 6 11 11 3 1 7 15 8 1 7 11 3 8 ˆ ˆ ˆ