0049360 1*9 3 fco > UNIVERZA V LJUBLJANI Fakulteta za elektrotehniko 1001 Ljubljana, p. p. 2999 Tržaška 25 Tel.: 01 476 84 11 01 426 46 20 Fax: 01426 46 30 Št: M-901/2002 Datum: 27. 2. 2002 David G E R B E C, univ. dipl. inž. el. LJUBLJANA Fakulteta za elektrotehniko Univerze v Ljubljani izdaja naslednjo magistrsko nalogo Naslov naloge: NADOMESTNI OBREMENITVENI DIAGRAMI Tematika naloge: Na trgu z električno energijo prihaja do odstopanja odjema glede na sklenjene pogodbe. Če prekomerno odstopanje večjega števila odjemalcev povzroči sistemsko odstopanje preko ±5%, mora sistemski operater za to odstopanje kupiti električno energijo na trgu in stroške zaračunati povzročiteljem. Odjemalci, ki nimajo sprotnih meritev velikosti odjema, potrebujejo nadomestne obremenitvene diagrame, ki služijo za obračun odstopanja. Zaradi velike množice odjemalcev je potrebno zmanjšati število nadomestnih obremenitvenih diagramov na sprejemljivo število. Najdite metode za združevanje podobnih obremenitvenih diagramov, ki bodo služili za oblikovanje nadomestnih obremenitvenih diagramov. UNIVERZA V LJUBLJANI FAKULTETA ZA ELEKTROTEHNIKO NADOMESTNI OBREMENITVENI DIAGRAMI MAGISTRSKO DELO David Gerbec Mentor: prof. dr. Ferdinand Gubma LJUBLJANA, MAREC 2003 nr\o^ 99 G J) ^-g^GO 13.1». 02> Zahvala Zahvaljujem se mentorju prof. dr. Ferdinandu Gubini za strokovno pomoč in mentorstvo na podiplomskem študiju. Za mnenja, nasvete, pomoč in prijetno vzdušje se zahvaljujem sodelavcem v Laboratoriju za elektroenergetske sisteme in Laboratoriju za elektroenergetske strategije. Hvala Samotu, Davidu, Gregorju, Tadeji, Andreju, Milošu, Ivanu, Dejanu, Andreju. Zahvaljujem se tudi svojim staršem in vsem najbližjim, ki so me vedno spodbujali in podpirali na moji študijski poti. Črpal sem njihovo energijo. To želim vrniti s spoštovanjem in vdanostjo. V času študija me je financiralo Ministrstvo za šolstvo in šport v okviru programa mladih raziskovalcev. Kazalo Kazalo.............................................................................................................................................III Uporabljene kratice in simboli.........................................................................................................IV Povzetek...........................................................................................................................................1 Abstract.............................................................................................................................................2 1. Uvod........................................................................................................................................3 2. Obremenitveni diagrami...........................................................................................................6 2.1. Pregled problematike določanja obremenitvenih diagramov............................................6 3. Določanje nadomestnih obremenitvenih diagramov..................................................................8 3.1. Priprava podatkov za nadaljnjo obdelavo........................................................................9 3.1.1. Valčki............................................................................................................10 3.1.1.1 Valčna multiresolucijska analiza...............................................................11 3.1.1.2 Odstranjevanje šuma (Glajenje)................................................................13 3.1.2. Normiranje.....................................................................................................16 3.2. Razpoznavanje vzorcev................................................................................................18 3.2.1. Fuzzy C-means rojenje (FCM)........................................................................18 3.2.1.1 Noise Clustering (NC) algoritem...............................................................21 3.2.1.2 Mere veljavnosti rojenja...........................................................................23 3.2.2. Hierarhične metode........................................................................................26 3.2.2.1 Mere podobnosti.......................................................................................26 3.2.3. Nevronska omrežja.........................................................................................29 3.2.3.1 Samo-organizirajoča omrežja (SOM)........................................................30 3.2.3.2 Verjetnostna Nevronska Omrežja (VNO)..................................................33 3.3. Dodelitev NOD-ov posameznim UO-jem......................................................................34 4. Rezultati................................................................................................................................37 4.1. Rezultati rojenja OD-jev s FCM algoritmom.................................................................38 4.2. Rezultati rojenja s hierarhično metodo in SOM-om.......................................................40 4.3. Primerjava metod rojenja..............................................................................................42 4.4. Rezultati določitve in dodelitev NOD-ov posameznim UO-jem.....................................43 5. Sklep.....................................................................................................................................46 6. Literatura...............................................................................................................................47 7. Priloge...................................................................................................................................49 III Uporabljene kratice in simboli KRATICE EES elektroenergetski sistem RTP razdelilna transformatorska postaja RCV republiški center vodenja UO upravičen odjemalec SO sistemski operater UDO upravljavec distribucijskega omrežja NOD nadomestni obremenitveni diagram FCM fuzzy c-means algoritem SOM samo-organizirajoca omrežja VNO verjetnostno nevronsko omrežja sym8 Simlet valček reda 8 NC noise clustering NO nevronska omrežja SKD standardni klasifikat dejavnosti SIMBOLI Xk M>(0 m g(o Ca,b» Cjk a b z 1 j, k,nN, M cdj,k caj,k h(n) g(n) J h*(n) gf(n) e, P(cd, pj) obremenitveni diagram ali vzorec minimalna moč maksimalna moč valčne funkcije poljubna časovna funkcija ali vrsta koeficienti valčne transformacije faktor skaliranja faktor premika množica celih števil množica realnih števil poljubna cela števila valčni koeficienti detajlov valčni koeficienti aproksimacije koeficienti visokofrekvenčnega filtra za dekompozicijo koeficienti nizkofrekvenčnega filtra za dekompozicijo resolucija ali skala razcepa koeficienti visokofrekvenčnega filtra za rekonstrukcijo koeficienti nizkofrekvenčnega filtra za rekonstrukcijo normalno porazdeljena napaka pragovna funkcija IV Pi vrednost praga Oj ocena standardnega odklona H normirana vrednost OD-ja H dejanska vrednost OD-ja Pb povprečna mesečno porabo K faktor, za katerega vrednost zmanjšamo konico 0 parametra, ki določa velikost spremembe porabe X množica OD-jev ali vzorcev B množica prototipov P. posamezen prototip U pripadnostna matrika Ui,k pripadnost C število prototipov, skupin ali rojev J(B,U,X) kriterijska funkcija FCM algoritma P,) norma (razdalja) med vzorcem xk in prototipom pi m faktor mehčanja 5 razdalja prototipa posebnežev do vseh vzorcev fi in f2 kritefijski funkciji ali meri rojenja Dy razdalja med prototipoma S, množica vzorcev v roju d(xk, xi) razdalja med vzorcema ali OD-jema D(Ci5 q) razdalja med rojema r korelacijski koeficient, ki meri distorzijo I koeficient neskladnosti rojenja R radij Wj utežni vector <*y razdalja vzbujenega nevrona do vhodnega vzorca Oi.(d) okolica nevrona ,dw(/) sprememba vrednosti uteži i-tega nevrona a(/) mera učenja g(A,R) aktivacijski factor b sprožilni prag al vektor, ki predstavlja radial basis nevron ^VT energija v visoki tarifi ^NT energija v nizki tarifi A konična moč V Povzetek Z odpiranjem trgov električne energije v Evropi je bil prvi korak v večini držav usmerjen k oblikovanju pravil za delovanje trga na debelo, ker so nastopali predvsem veliki odjemalci in distribucijska podjetja. Vendar je zaradi postopnega zmanjševanjem meje, ko upravičeni odjemalci lahko svobodno izbirajo dobavitelja električne energije, potrebno oblikovati pravila, ki omogočajo udeležbo na trgu tudi malim odjemalcem, ki so praviloma brez ustrezne merilne opreme. Za te odjemalce je potrebno izdelati nadomestne obremenitvene diagrame, ki se uporabljajo za obračun odstopanj med napovedano in dejansko porabo. V nalogi smo predlagali postopek izdelave nadomestnih obremenitvenih diagramov in njihove dodelitve posameznim upravičenim odjemalcem, ki temelji na metodah razpoznavanja vzorcev. Razdelili smo ga na naslednje korake: pridobitev meritev, priprava meritev za nadaljnjo obdelavo, razvrščanje obremenitvenih diagramov v posamezne skupine in dodelitev nadomestnih obremenitvenih diagramov posameznim upravičenim odjemalcem. Meritve smo pridobili od slovenskih distribucijskih podjetij. Vpliv naključnih vklopov in izklopov električnih naprav smo izločili z glajenjem obremenitvenih diagramov. Za to nalogo smo uporabili valčno multiresolucijsko analizo ter mehko pragovno funkcijo. Z normiranjem smo odpravili vpliv različnih velikostnih razredov obremenitvenih diagramov na razvrščanje. Za razvrščanje smo preizkusili tri metode, izmed katerih smo izbrali FCM algoritem kot najprimernejšo metodo. Nadomestne obremenitvene diagrame smo dodelili posameznim upravičenim odjemalcem glede na njihovo registrirano dejavnost z uporabo verjetnostnih nevronskih omrežij. Postopek izdelave nadomestnih obremenitvenih diagramov smo preizkusili na 288 meritvah delovne moči upravičenih odjemalcev za mesec marec 2002. Ključne besede: trg z električno energijo, distribucija električne energije, nadomestni obremenitveni diagrami, valčna analiza, razpoznavanje vzorcev, mehka logika, nevronska omrežja 1 Abstract With the opening of the electric power market in Europe, the first step has been focused to the development of the rules for the wholesale energy market. On this market, only large power consumers and distribution Utilities could participate. With gradual decreasing of the threshold when eligible consumer may freely choose their power suppliers it is necessary to establish effective rules vvhich allows smaller consumers to participate at the povver market. These small consumers generally are not equipped with the appropriate mattering equipment, which allovvs them to keep track of their povver consumption. For those consumers, it is necessary to develop typical load profiles, vvhich are used for settlement of the deviations betvveen contracted and actual consumption. The thesis proposes a method for typical load profile determination and allocation to the eligible consumers. The method is based on pattern recognition methods and can be divided into the follovving steps: acquisition of the measurements, preprocessing of the measurements, clustering of load profiles into coherent groups and determination and allocation of the typical load profiles to the eligible consumers. The measurements vvere acquired from the Slovenian distribution companies with no analysis of, vvhich eligible consumers' load profiles should be measured. The influence of sudden shifts of the electric appliances on the shape of the load profiles vvas eliminated through averaging of vvorking day load profiles and de-noising. For that purpose, the vvavelet multi-resolution analysis together vvith soft threshold function vvas used. Before the clustering process, aH load profiles vvere normalized by the peak povver of each profile to remove the effect that load profiles can be measured on different scales. For the clustering purpose, three methods vvere tested, among vvhich the Fuzzy c-means algorithm vvas chosen as the most appropriate. Typical load profiles vvere allocated to the eligible consumers according to their economic activities. For that purpose, the probability neural netvvorks vvere used. The method vvas tested on 288 load profiles. The results show that the proposed method gives good results. Key words: povver market, povver distribution, load profiling, vvavelet analvsis, pattern recognition, fuzzy logic, neural netvvork 2 1. Uvod Svet brez električne energije je težko predstavljiv, čeprav jo ljudje v razvitem svetu izkoriščamo šele zadnjih sto let. V relativno kratkem času se je njena uporaba razširila na vsa področja človekovega življenja. Hitra rast porabe je zahtevala hiter razvoj elektroenergetskega sistema (EES-a). Zaradi njegove obsežnosti sta načrtovanje in izgradnja v preteklosti potekala celovito pod regulativo posameznih držav. V zadnjem času pa so vertikalno integriram EES-i po svetu podvrženi velikim strukturnim spremembam. Te spremembe so po naravi različne, vendar je njihov glavni ali značilni trend v smeri večje tekmovalnosti in odprtosti. Rezultat tega je trgovanje z električno energijo kot dobrino, ter oblikovanje ustreznih trgov, ki omogočajo in spodbujajo trgovanje. Tako so v nekaterih državah spremembe posledica želje, da se posamezne vlade rešijo finančnih obveznosti za izgradnjo novih proizvodnih virov. Drugje so glavna vodila prestrukturiranja energetskega sektorja priložnosti, ki jih prinaša tekmovalnost na odprtem trgu. V večini primerov pa je vodilo omogočiti posameznemu odjemalcu, da svobodno izbira dobavitelja na osnovi cene električne energije ter storitev, ki jih ponuja. Razlogov za spremembe je več, vendar so v večini primerov politično vodene [1J, [2]. Te organizacijske spremembe podjetjem na področju elektroenergetike prinašajo nove priložnosti ter izzive. Zaželen in vzpodbujen je razvoj novih bolj uporabnih orodij, potrebnih podjetjem za doseganje želenih ciljev. Z odpiranjem trgov električne energije v Evropi je bil prvi korak v večini držav usmerjen k oblikovanju pravil za delovanje trga na debelo. Na tem trgu imajo možnost sodelovati predvsem proizvajalci kot ponudniki električne energije na eni strani, ter veliki odjemalci in dobavitelji končnim odjemalcem na drugi. Za velike odjemalce je določitev količine porabljene energije v izbranem časovnem intervalu enoumna, saj so opremljeni z ustrezno merilno opremo. Podobno velja za posamezne dobavitelje, saj ti dobavitelji uporabljajo obstoječe meritve v posameznih razdelilnih transformatorskih postajah (RTP-jih). S postopnim zmanjševanjem meje, ko odjemalci lahko svobodno izbirajo svojega dobavitelja, pa je določitev porabe nekoliko težja. Omenjeni problem je enostavno rešljiv z inštalacijo ustreznih merilnih naprav pri vseh odjemalcih, ki pa je ekonomično nesmotrna1. Zato je pri trgovanju na drobno še kako pomembno določiti praktično, vendar ekonomično metodo določanja porabe posameznih odjemalcev. Alternativa vgraditvi merilnih naprav je določitev porabe na podlagi obremenitvenih diagramov. Na ta način omogočimo manjšim odjemalcem prosto izbiro dobavitelja in s tem dostop do odprtega trga z električno energijo. Omenjena metoda je relativno enostavna ter pregledna. Posamezen odjemalec ima še vedno možnost, da se sam odloči, ali bo investiral v merilno opremo ali ne. Okvirna analiza upravičenosti investicije odjemalca v merilno opremo podaja referenca [3]. Odvisna je predvsem od porabljene električne energije ter 1 Stroški vgradnje ustreznega, trenutno najpogosteje uporabljenega, števca v Sloveniji znašajo približno 210.000 tolarjev. 3 dodeljenega obremenitvenega diagrama. V Evropskih državah se v splošnem uporabljata dva različna modela obremenitvenih diagramov [4]. Tako imenovani območni model ter kategorijski model. Za območni model je značilno, da imajo vsi odjemalci brez ustreznih meritev znotraj določenega geografskega območja enak obremenitveni diagram. Pri uporabi kategorijskega modela pa je potrebno določiti obremenitvene diagrame, ki predstavljajo homogene skupine odjemalcev. Področje trga z električno energijo v Sloveniji ureja energetski zakon [2] ter ustrezne uredbe in pravilniki. Z njim se na področju elektroenergetike uvajajo novi subjekti. Na novo se definirajo dejavnosti, ki jih ti opravljajo ali so zanje odgovorni. Eden izmed dokumentov, ki omogočajo delovanje trga z električno energijo, je tudi pravilnik o načinu obračunavanja odstopanj oddaje ali odjema električne energije od voznih redov [5]. Z njim je določen analitični postopek ugotavljanja dejanskih voznih redov posameznih bilančnih skupin. Pri tem postopku imajo vsi obremenitveni diagrami posameznih odjemalcev ali skupine odjemalcev brez ustrezne merilne opreme znotraj določenega območja enako obliko. Gre za obliko tako imenovane preostale krivulje. Omenjeni način določitve voznih redov je primerljiv z območnim modelom, katerega uporabljajo na Norveškem in Švedskem. Določitev dejanskih voznih redov potrebujemo za obračun odstopanj od napovedanih voznih redov. V obdobju monopola se distribucijska podjetja in posamezni odjemalci v Sloveniji z voznimi redi niso veliko ukvarjali. Za napoved celotne porabe so skrbeli dispečerji v republiškem centru vodenja (RCV). Z uvedbo trga pa mora vsak dobavitelj ali upravičen odjemalec (UO) porabo ali vozni red napovedovati sam. Podatke o voznih redih morajo sporočiti organizatorju trga. Sistemski operater (SO), ki je prevzel določene funkcije RCV-ja, je odgovoren za upravljanje prenosnega sistema. Na časovni osi lahko njegove pristojnosti razdelimo na izravnavo proizvodnje in porabe ter dodeljevanje dostopa do omrežja. Maksimalni časovni interval izravnavanja proizvodnje in porabe obsega čas od zaključka trgovanja na borzi pa do konca intervala, za katerega je trgovanje potekalo. Tako znaša maksimalni časovni interval 36 ur, če imamo dnevni trg. Odstopanja, ki so posledica razlike med napovedanim ter dejanskim odjemom bilančne skupine, SO zaračuna odgovornim nosilcem bilančnih skupin [5]. Dejanske vozne rede posameznih bilančnih skupin določi Upravljavec distribucijskega omrežja (UDO) v skladu s pravilnikom. Pomanjkljivost uporabljenega modela je, da predpostavi enako obliko obremenitvenega diagrama vseh odjemalcev brez ustrezne merilne opreme, kar pa dejansko ne drži. Omenjeno slabost odpravlja model, ki uporablja nadomestne obremenitvene diagrame (NOD). Predstavljena problematika nakazuje, da je za uporabo kategorijskaga modela določanja dejanskih voznih redov potrebno predhodno določiti NOD-e. Namen magistrske naloge je raziskati možne načine ali metode za določitev NOD-ov, pregledati njihove prednosti in pomanjkljivosti, izbrati najprimernejšo metodo ter predlagati enostaven ter enoumen postopek, kako dobljene NOD-e pripisati posameznemu UO-ju. Referenca [7] podaja obseg nalog, ki jih je potrebno izvesti za določitev NOD-ov. Poudariti moramo, da je tematika naloge posvečena predvsem problematiki oblikovanja NOD-ov na podlagi 4 meritev, ki smo jih pridobili od Slovenskih distribucijskih podjetij. Podjetja so po lastni presoji odločala, katerim UO-jem bodo merila porabo. Izločili smo meritve tistih UO-jev, katerih maksimalna izmerjena delovna moč je presegala 300 kW. Za ta korak smo se odločili zaradi določil v [6], ki pravijo, da morajo imeti vsi odjemalci, po prehodnem obdobju, nad 100 kW priključne moči ustrezno merilno opremo. Prehodno obdobje traja za odjemalce nad 250 kW od 31. 12. 2005 ter za odjemalce nad 100 kW do 31. 12. 2008. Struktura magistrskega dela je naslednja: Predstavitev obremenitvenih diagramov, njihovo možno uporabo ter pregled dosedanjega dela na tem področju podaja poglavje 2. Poglavje 3 opisuje potek določitve NOD-ov, predstavi uporabljene metode razvrščanja, predlaga najprimernejšo metodo ter podaja enostaven ter enoumen postopek, kako dobljene NOD-e pripisati posameznemu UO-ju. Sledijo rezultati v poglavju 4 in sklep v poglavju 5 ter reference v poglavju 6. 5 2. Obremenitveni diagrami Obremenitveni diagrami (OD) predstavljajo časovni potek obremenitve posameznega odjemalca, skupine odjemalcev ali celotnega EES-a znotraj izbranega časovnega obdobja - enega dneva. Njegova oblika je v veliki meri odvisna od tipa dneva v tednu in meseca v letu ter od dejavnosti posameznega odjemalca. Tip dejavnosti posameznega odjemalca je tudi povezan z napravami, ki jih UO-ji uporabljajo ter njihovo dinamiko obratovanja. Zato je oblika OD-ja povezana s številom istočasno merjenih naprav. Poleg omenjanih dejavnikov pa na obliko OD-ja vplivajo tudi drugi zunanji dejavniki, kakor je na primer temperatura, vendar se z njimi v nalogi posebej ne bomo ukvarjali. Posamezen OD sestavljajo meritve moči kot povprečne vrednosti energije v posameznih časovnih intervalih, izmed katerih se najpogosteje uporabljajo 15, 30 ali 60 minutni intervali. V slovenskem EES-u je za distribucijska podjetja predpisan 15 minutni časovni interval merjenja porabe. Tako OD xk sestavlja 96 četrt-urnih vrednosti: %=(>«]. J = l,-..,96. (2.1) Način odjema električne energije odjemalcev različnih dejavnosti je lahko podoben, zato njihove OD-je lahko združimo tako, da so predstavljeni samo z enim nadomestnim obremenitvenim diagramom (NOD-om). NOD predstavlja povprečno vrednost vseh OD-jev v izbrani skupini odjemalcev. Uvodoma predstavljena uporaba NOD-ov je le ena izmed mnogih uporab in izvira iz potrebe po obračunu odstopanj dejanske porabe od napovedane. Poleg omenjene uporabe pa so se NOD-i uporabljali že pred deregulacijo kot pomoč pri načrtovanju EES-a, določanju ustrezne tarifne politike [8], določanju življenske dobe transformatorjev v distribucijskem omrežju [9] in pri vodenju porabe. V nadaljevanju bomo na kratko podali pregled problematike modeliranja obremenitve, kamor lahko uvrščamo tudi določanje nadomestnih obremenitvenih diagramov. 2.1. Pregled problematike določanja obremenitvenih diagramov Problematiko oblikovanja in določanja OD-jev posameznih skupin odjemalcev lahko v grobem razdelimo na dva načina. Prvi način [9] predstavlja modeliranja porabe odjemalcev gospodinjskega tipa z uporabo verjetnostnih funkcij, ki podajajo povezavo med porabo in tipičnimi psihološkimi faktorji obnašanja gospodinjstev, kakor so: prisotnost članov družine v stanovanju, uporaba gospodinjskih naprav ipd. Omenjeni način določanja OD-jev zahteva poglobljeno analizo obnašanja odjemalcev in analizo uporabe električnih naprav, zato bi jo zelo težko posplošili na ostale tipe odjemalcev kakor so industrijski odjemalci. Drugi način določanja OD-jev in njihovih karakteristik temelji na merjenju porabe posameznih odjemalcev [8], [ll]-[22]. Predstavljeno literaturo lahko razdelimo v dva sklopa. Prvi obravnava določanje OD-jev v primerih, ko imamo vnaprej znane skupine odjemalcev. Tako so avtorji 6 [14] razdelili odjemalce na gospodinjstva, komercialo in industrijo. Znotraj posameznih razredov pa še glede na moč posameznih odjemalcev. Podoben primer razdelitve odjemalcev zasledimo v [8], [11]-[13], kjer avtorji vse odjemalce, ne samo tiste priključene na nizko napetost [14],[15], razdelijo v devet skupin, in sicer od gospodinjskega odjema z enofaznim priključkom pa do velikih industrijskih odjemalcev, priključenih na visoko napetost. Poleg tega literatura [11]-[13] podaja nazoren prikaz izbire števila merjenih odjemalcev v posamezni skupini. Podobno tematiko zasledimo v [16], kjer avtorji predstavijo možno strategijo, kako razdeliti merilne garniture za merjenje obremenitve med posamezne skupine odjemalcev. V [17] najdemo opis določanja OD-jev, kakor jih uporabljajo v Veliki Britaniji, kjer uporabljajo osem NOD-ov za odjemalce pod 100 kW moči. Drugi sklop literature [18]-[22] obravnava določanje obremenitvenih diagramov s pomočjo razvrščanja - uporabe metod in tehnik razpoznavanja vzorcev. Literatura [18] obravnava razvrščanje OD-jev z uporabo določenih indeksov, izračunanih iz izmerjenega OD-ja. Uporabljeni indeksi predstavljajo razmerja med minimalno Pa^ in maksimalno PmSK močjo, povprečno in maksimalno močjo, razmerje med povprečno močjo v času večje porabe med 6. in 23. uro ter povprečno močjo v času nižje porabe med 23. in 6. uro. Preostali sklop literature opisuje razvrščanje dejanskih OD-jev z metodami razpoznavanja vzorcev: hierarhično metodo, ki temelji na prestavljanju OD-jev iz ene skupine v drugo, v odvisnost od razdalje med OD-ji podaja [19]. V literaturi [20], [21] najdemo primerjavo hierarhičnih metod in samo-organizirajočih omrežij za razvrščanje OD-jev. Literatura [22], [23] podaja prvi poizkus oblikovanja NOD-ov v Sloveniji. Avtorji so za razvrščanje OD-jev uporabili hierarhično metodo, katero bomo preizkusili tudi v naši nalogi. Pregleda problematike določanja OD-jev na podlagi meritev porabe posameznih odjemalcev lahko sklenemo z naslednjima ugotovitvama: • Prvi način temelji na znanih skupinah odjemalcev ter večletnih meritvah odjema, npr. avtorji v [13] poročajo o štiriletnem obdobju merjenja in analiziranja porabe. Poleg tega pa večina avtorjev ne podaja kriterijev, kako so posamezne skupine določili. • Drugi način obravnava določanje OD-jev z uporabo metod razpoznavanja vzorcev. V večini primerov avtorji poročajo o preizkusu uporabljenih metod in oblikovanju diagramov, nikjer pa ne podajo postopka, kako OD-je dodeliti posameznim skupinam odjemalcev ter katerim odjemalcem je potrebno meriti porabo. Omenjena naloga pa je ena izmed pomembnejših pri izbiri načina izdelave NOD-ov. V nalogi smo poizkušali poiskati kompromis med obema načinoma določanja NOD-ov, kar bomo podrobneje predstavili v naslednjem poglavju. V tem poglavju smo z "določanjem obremenitvenih diagramov" venomer imeli v mislih določanje nadomestnih obremenitvenih diagramov, NOD-ov. Omenjeno formulacijo smo povzeli iz literature, kje avtorji uporabljajo naslednje izraze za NOD-e: obremenitvene krivulje (load curves) ali obremenitveni profili (load profiles). V nadaljevanju bomo izmerjeno porabo posameznih odjemalcev predstavljali z izrazom obremenitveni diagram. 7 3. Določanje nadomestnih obremenitvenih diagramov V prejšnjem poglavju smo v pregledu literature spoznali dva različna postopka določanja NOD-ov. Prvi temelji na večletnih raziskavah obremenitev posameznih skupin odjemalcev. Na ta način so raziskovalci določili število skupin ter karakteristike odjemalcev, ki sestavljajo omenjene skupine. Drugi postopek pa temelji na razvrščanju izmerjenih OD-jev posameznih odjemalcev. V tem primeru je potrebno določiti način, s katerim bomo NOD-e dodelili posameznim skupinam UO-jev. V nalogi smo uporabili drugi postopek določanja ali oblikovanja NOD-ov, katerega korake predstavljamo v nadaljevanju. Postopek oblikovanja ter določitve NOD-ov posameznim upravičenim odjemalcem prikazuje slika 1. Razdelimo ga lahko na štiri večje korake: • pridobitev meritev od upravljavcev distribucijskih sistemov, • priprava meritev, • razvrščanje obremenitvenih diagramov, • določitev in dodelitev posameznih NOD-ov posameznim UO-jem na podlagi njihovega tipa dejavnosti. Meritve 1 Priprava podatkov za nadaljnjo obdelavo glajenje • normiranje Razvrščanje OD-jev v posamezne skupine I Tip dejavnosti posameznega odjemalca Določitev in dodelitev NOD-ov posameznim upravičenim odjemalcem Slika 1: Postopek oblikovanja in določanja NOD-ov posameznim upravičenim odjemalcem. Meritve porabe posameznih UO-jev za vsak 15 minutni interval vzorčenja smo dobili od distribucijskih podjetij. Vpliva na to, katere odjemalce naj distribucijska podjetja opremijo z ustreznimi merilnimi garniturami, nismo imeli. Priprava meritev, drugi korak v postopku določanja NOD-ov, sestavljajo naslednji podkoraki: • V tem koraku razdelimo OD-je glede na tip dneva ter jih zgladimo - izločimo šum iz meritev. V ta name smo uporabili valčno analizo. • Normiranje. 8 Podrobnejši opis izvedenih nalog v drugem koraku podajamo v poglavju 3.1 Priprava podatkov za nadaljnjo obdelavo. Razvrščanje OD-jev v posamezne NOD-e je ena izmed ključnih nalog postopka oblikovanja NOD-ov. V ta namen smo uporabili tehnike razpoznavanja vzorcev. V nalogo bomo razvrščanje OD-jev imenovali rojenje (clustering). Terminologijo smo povzeli po literaturi [30]. Zaradi zahtevnosti rojenja je za doseganje "optimalnih" rezultatov razvrščanja potrebno preizkusiti več metod. V nalogi smo preizkusili naslednje metode nenadziranega rojenja: • Rojenje s pomočjo mehke logike, Fuzzy C-means (FCM) algoritem. • Hierarhične metode, rojenje z izračunom Evklidske razdalje med posameznim OD-ji, vzorci, ter povprečne razdalje med roji. • Nevronska omrežja, samo-organizirajoča omrežja (SOM). Tehnikam razpoznavanja vzorcev smo posvetili največ pozornosti in jih podrobneje opisujemo v poglavju 3.2 Razpoznavanje vzorcev. V njem so predstavljene posamezne metode rojenja ter način določanja števila rojev. V našem primeru posamezni roji določajo NOD-e. Zadnji, četrti korak postopka je dodelitev NOD-ov posameznim skupinam UO-jev. Za dodelitev NOD-ov odjemalcem smo uporabili tip dejavnosti posameznega UO-ja. Podrobnejši opis dodeljevanja NOD-ov podajamo v poglavju 3.3 Dodelitev NOD-ov posameznim UO-jem. Pri tem smo uporabili metodo nadziranega razpoznavanja vzorcev, in sicer verjetnostna nevronska omrežja (VNO), katera smo podrobneje opisali v poglavju o razpoznavanju vzorcev. Do sedaj smo zelo na kratko opredelili posamezne korake pri določanju nadomestnih obremenitvenih diagramov. V nadaljevanju sledijo podrobnejši opisi posameznik korakov ter opis uporabljenih metod v posameznih korakih. 3.1. Priprava podatkov za nadaljnjo obdelavo Ustrezna priprava meritev je pogoj za njihovo uspešno razvrščanje. V tem koraku postopka oblikovanja NOD-ov je treba pridobljene meritve organizirati na način, da predhodno izločimo največ dejavnikov, ki vplivajo na obliko OD-jev ter s tem na njihovo nadaljnjo razvrstitev. S tem namenom smo OD-je razdelili glede na tip dneva, delavnik od ponedeljka do petka, sobota in nedelja ter glede na sezono ali mesec v letu. Vpliv na porabo imajo tudi posebni dnevi, kot so prazniki, vendar se z njimi v nalogi ne bomo ukvarjali. Poleg tipa dneva in sezone pa na natančnejšo obliko izmerjene obremenitve v veliki meri vplivajo tudi naslednji faktorji [24]: • Število električnih naprav, katere posamezni UO-ji v določenem trenutku uporabljajo. • Način merjenja in čas vzorčenja. Drugi faktor je za distribucijska podjetja določen in nanj na moremo vplivati, prav tako ne moremo vplivati na število naprav, ki jih UO-ji uporabljajo. Lahko pa poizkusimo njihov vpliv izločiti tako, da za delavnik posameznega UO-ja določimo povprečje več delavnikov. V nalogi predstavlja 9 delavnik povprečje štirih sredinih delavnikov v mesecu. Za sredo smo se odločili zaradi tega, ker je najbolj tipičen delovni dan. Poleg povprečenja pa nekateri OD-ji še vedno vsebujejo veliko mero šuma, ki ga je potrebno odstraniti ter s tem zgladiti OD. V ta namen smo uporabili valčno multiresolucijsko analizo, ki je del teorije valčkov. Primer zglajenega ter nezglajenega OD-ja prikazuje slika 2. 40 35 30 25 15 10 5 0 0 6 12 18 24 tih Slika 2: Primer zglajenega in nezglajenega OD-ja. 3.1.1. Valčki Valčki so funkcije \\i(t\ ki jih lahko uporabimo kot osnovne gradnike, s katerimi opišemo in analiziramo druge funkcije, podobno kot uporabimo sinuse in kosinuse pri Fourierovi analizi. Da lahko tovrstne funkcije imenujemo valčki, morajo zadostovati naslednjim pogojem: • Morajo biti oscilatorne narave. • Imeti morajo efektivno omejene amplitude, ki hitro padajo proti nič. • Imeti morajo povprečno vrednost nič. • Biti morajo dobro časovno ter frekvenčno lokalizirani. Omenjene lastnosti omogočajo dobro določanje frekvenc, ki so se v časovni vrsti pojavile le v nekem obdobju. V nalogi bomo za časovno vrsto privzeli OD-je, ter jih za potrebe predstavitve valčne analize označevali kot časovno vrsto ali funkcijo f(t). Poljubno funkcijo f(/) lahko zapišemo kot linearno kombinacijo izpeljanih valčkov f(t) = Za,b Ca,b m V(*-byaX a> b e Z, kjer so c^b koeficinti valčne transformacije. Nove oblike valčkov dobimo s pomočjo skaliranja in premikov osnovnega valčka. Skaliranje pomeni, da je osnovni valček ali raztegnjen ali stisnjen, medtem ko translacija pomeni premikanje osnovnega valčka v nekem časovnem območju. Pri tem se energija novih valčkov ohranja. Osnovni valček družine Simlet reda 4 prikazuje slika 3. 10 Slika 3: Osnovni valček družine Simlet reda 4 i}/(/). Določitev novih oblik valčkov iz osnovnega valčka podaja naslednja enačba: f r-b (3.1) kjer parameter a - predstavlja faktor skaliranja, b - faktor, s katerim se pomikamo po časovni osi t. Valčno transformacijo pa podaja naslednja enačba: 'a.b i1«")' (3.2) Transformacijo dosežemo s skaliranjem in časovnim premikom po časovni osi osnovnega valčka ter izračunom podobnosti med signalom in valčkom na ustrezni skali in časovni osi. V praksi imamo dve obliki transformacije, in sicer zvezno in diskretno transformacijo. Razlikujeta se glede na zalogo vrednosti parametrov a in b. Zaloga vrednosti parametrov zvezne transformacije je: a g M+ - {0}, b g K. Z zveznim premikanjem in skaliranjem osnovnega valčka pridobimo veliko redundantne informacije, zato se velikokrat uporablja diskretna valčna transformacija, kjer zaloga vrednosti parametrov temelji na potencah števila dva: a = 2J, b = k-2J, j, k g Z. Takšne vrednosti imenujemo diadične vrednosti. V nalogi smo uporabljali diskretno valčno transformacijo. 3.1.1.1 Valčna multiresolucijska analiza Valčna multiresolucijska analiza je orodje, ki omogoča analizo poljubnih signalov na različnih časovnih skalah ter pri različnih frekvencah. Njegova osnovna ideja je, da lahko signal razcepimo na mehko komponento, tj. približek signala in na detajlno komponento signala. Približek signala predstavljajo nizkofrekvenčne komponente signala na večjih skalah, medtem ko predstavljajo detajli komponente signala na nižjih skalah pri višjih frekvencah. Multiresolucijska analiza je izvedena s konvolucijo časovno diskretnega signala f(n), n g Z, ali časovne vrste z ustreznim filtrom. Rezultat so valčni koeficienti, ki predstavljajo detajle cdp in aproksimacijo cajk- Signal f(n), v našem primeru je to OD, na prvem nivoju razdelimo na koeficiente cdjjk s konvolucijo z visokofrekvenčnim filtrom, ki ga opisujejo njegovi koeficienti h(n) ter na koeficiente cajk s konvolucijo z nizkofrekvenčnim filtrom g(n). Proces razcepa signala lahko nadaljujemo do želene resolucije J tako, da v vsakem nadaljnjem koraku izvedemo enak proces, in 11 sicer z razdelitvijo aproksimacije. Simbolični, rekurzivni potek razcepa imenujemo valčno dekompozicijsko drevo in ga za razcep na dveh skalah prikazuje slika 4. Takoj za filtriranjem sledi diadično zmanjševanje resolucije za faktor 2. f(n) h(n) "O g(n) €) h(n) h 9 cai* I * g(n) J *\ <£> -> ca2,k -► CČ2X ■+. cdu- Slika 4: Valčno dekompozicijsko drevo za razčlenitev na dveh skalah. Podobno, kot razcep signala na posamezne detajle in na aproksimacijo, si lahko predstavljamo sintezo posameznih prispevkov v izvorni signal v nasprotni smeri, kakor ga prikazuje zgornja slika. Pri tem namesto visoko in nizko frekvenčnih filtrov za dekompozicijo uporabljamo visoko h'(n) in nizko frekvenčne g'(n) filtre za rekonstrukcijo. Primer razčlenitve vhodnega signala, obremenitvenega diagrama, Simlet valčki osmega reda (sym8) prikazuje slika 5. Red valčka določa število filtrskih koeficientov. Razčlenitev je narejena na dveh skalah 2j, j =1,2. b) a) T??r????f?TT O ca^ ??9??Q?9??? O c "O -5 I ' 5 O Ca2,k Ol «" Pl , P m L 25 30 O CV 9°9| I VoHK i^i^po^, i^' Ksu^i' ■ %■> ^6 i i 10 15 20 25 30 35 40 45 50 št. koeficientov K¥^VAl\l^j[^^A/4' hf^f^ I I___ det^l d, 12 Slika 5: Razčlenitev vhodnega signala s Simlet valčki osmega reda: a) valčni koeficienti aproksimacije ca2,k in dveh detajlov cd2>k in cdt k, b) prispevek valčnih koeficientov na vsakem nivoju k vhodnemu signalu. Iz slike 5a se vidi, da se število valčnih koeficientov pri prehodu iz nižje na višjo skalo močno zmanjša. Teoretično se bi moralo število koeficientov zmanjšati za polovico, vendar je zaradi procesa filtriranja, ki poteka s konvolucijo signala in filtra, signal nekoliko "zamazan" zaradi dodajanja dodatnih vzorcev v signal [25]. Zaradi tega imamo nekoliko večje število koeficientov. Poleg tega se 12 tudi vidi, da so valčni koeficienti detajlov cdjk na posamezni skali veliki le tam, kjer imamo velike spremembe v originalnem signalu. Tako so pomembne informacije o signalu zbrane v majhnem številu koeficientov z veliko absolutno vrednostjo. Poleg tega se z večanjem skale njihova velikost povečuje. Slika 5b prikazuje prispevke koeficientov na posameznih skalah k vhodnemu signalu. Vidimo, da s koeficienti aproksimacije opišemo vhodni signal grobo, z manjšo ločljivostjo, s koeficienti detajlov pa večje in manjše podrobnosti pri različnih ločljivostih. Vsota prispevkov valčnih koeficientov k vhodnemu signalu nam da vrednosti vhodnega signala, kar je v skladu s tem, kar smo zapisali v uvodnem delu poglavja, da lahko poljuben signal ali funkcijo f(/) zapišemo kot vsoto prispevkov valčnih koeficientov na posameznih skalah. Povedano se vidi tudi iz enačbe (3.3), ki podaja inverzno diskretno valčno transformacijo. f(')=2>*VW(') (3-3) j,keZ kjer so Cjk valčni koeficienti. Obstaja neposredna povezava med obliko valčka in uporabo posameznega nizkofrekvenčnega in visokofrekvenčnega filtra. Izbrani valčki določajo filtre, ki jih uporabimo za multiresolucijsko analizo ter obratno, izbrani filtri določajo valček. 3.1. L 2 Odstranjevanje šuma (Glajenje) Vzemimo, da imamo časovno vrsto, ki je vzorčena v časovnih korakih t\ = k + iAt, i = 0,..., N-1 in jo zapišemo z naslednjo enačbo: Xi=f(0 + e,, i = 0,...,N-l, (3.4) kjer je f(/) ustrezna gladka neznana funkcija, ei pa so naključne normalno porazdeljene napake s povprečjem nič in varianco a2. Poiskati želimo takšno funkcijo g(t), pri kateri je povprečna kvadratna napaka -iS('(0-«h))' <3-5) ™ i=0 minimalna, ter vsaj toliko gladka kot funkcija f(/). Razčlenitev časovne vrste, OD-ja, na posamezne koeficiente valčne transformacije in njihove prispevke k časovni vrsti, katere prikazuje slika 5, podajajo aproksiamcijo ter posamezne detajle. Vidimo, da so nekateri detajli zelo majhni, kar ustreza tudi majhnim absolutnim vrednostim valčnih koeficientov. V takšnem primeru lahko koeficiente odstranimo ter s tem ne spremenimo močno obliko časovne vrste ali signala. Za uspešno glajenje časovne vrste je tako potrebno najti primeren način, kako omejiti koeficiente detajlov cdjj. Potek glajenja OD-jev s pomočjo valčne multiresolucijske analize lahko razdelimo v tri korake: • Po rekurzivni shemi za razcep časovne vrste izračunamo valčne koficiente. 13 • Koeficiente detajlov cdj;k na vseh skalah 2J popravimo s pragovno funkcijo P(cd, pj), kjer je pj ustrezen prag. • Po rekurzvivni shemi za sestavljenje izračunamo zglajeno časovno vrsto. Primer mehke pragovne funkcije, katero smo uporabljali v naši nalogi in je implementirana v Matlabovi knjižnici o valčkih ter opisana v [25], podaja enačba: P(cd,Pj) = cd+pJ? cd<-Pj 0, |cd|Pj (3.6) ter jo prikazuje slika 6. P(cd,pi) k k Pj ------------------_••-' ^ A& Pi cd // -P« Slika 6: Mehka pragovna funkcija P(cd, pj). Z mehko pragovno funkcijo vse koeficiente manjše od praga pj postavimo na nič ter upoštevamo, da so koeficienti zunaj praga tudi zašumljeni, zato jih premaknemo proti nič. Za uspešno glajenje je ključnega pomena določitev ustreznega praga pj, ki ga lahko določimo z naslednjo enačbo: Pj=ovV2"lnNJ (3-7) kjer je Nj število koeficientov na j-ti skali, Oj pa ocena standardnega odklona katerega izračunana s pomočjo mediane absolutnih odstopanj (MAD) vrednosti valčnih koeficientov ter količnika 0.6745. Oj = MAD (cd)/0.6745 . Verjetnost, daje zglajena funkcija g(t) vsaj tako gladka kakor funkcija f(t), je za predstavljeno izbiro pragovne funkcije ter vrednosti pragov zelo velika. Predstavitev glajenja z valčno multiresolucijsko analizo smo povzeli po literaturi [25],[26]. Poleg izbire pragovne funkcije ter velikosti praga je pri glajenju z valčki potrebno določiti tudi družino valčka, red valčka ter število skal, na katerih bomo gladili. Primerjali smo glajenje z valčki Simlet in Coifletovimi valčki. Spreminjali smo red valčka od dva do pet pri Coifletovih valčkih in od dva do osem pri Simlet valčkih ter skalo razcepa j = 1,...,11. Odvisnost srednje kvadratične napake, med zglajenim OD-jem in dejanskim OD-jem, ki ga prikazuje slika 2, od reda valčka ter skale razčlenitve prikazuje slika 7. Omenjeni diagram smo izbrali zato, ker vsebuje relativno veliko šuma. Iz slike 7 se vidi, da obe družini valčkov podajata primerljive rezultate. Za predstavljen primer glajenja 14 red valčka ne vpliva poglavitno na velikost napake pri valčkih iz Coifietove družine, medtem ko je omenjena odvisnost pri Simlet valčkih večja. Na napako pa močno vpliva velikost skale razčlenitve j, vendar pa se pri določeni velikost skale napaka ustali. Pri valčku družine Simlet reda osem (sym8) vidimo najmanjšo napako za vse skale razčlenitve. Coif let valčki Simlet valčki red valčka skala razčlenitve red valčka skala razčlenitve Slika 7: Potek povprečne kvadratične napake v odvisnosti od reda valčka ter skale razcepa za družini valčkov Simlet in Coiflet. Iz primerjav napak smo se odločili za glajenje z valčki družine Simlet reda osem. Skalo razcepa pa smo določili s primerjavo rezultatov glajenja na različnih skalah j = 2, 3, 4 in 6. Primerjavo glajenj prikazuje slika 8. 40 a) 1 1 1 35 30 1 \ 25 ;f^Nfefe3 \f ^>KH 20 a15 ./~Jb\ 10 k&ž$3šši3$/ 5 ------ skala; = 2 . skala; =3 0 skala; = 4 — skala; = 6 - -5 r — dejanski OD - 12 f/h 24 Slika 8: Primerjava glajenja na skalah j = 2, 3, 4 in 6 za valček db3: a) celoten OD, b) del OD-ja med 6. in 12. uro. Iz slike 8 se vidi, da so rezultati glajenja z razčlenitvijo na različnih skalah j na določenih odsekih primerljivi, medtem ko se na nekaterih odsekih, na primer med osmo in deveto uro, opazijo določena večja odstopanja. Zaradi omenjenih odstopanj smo izbrali skalo razcepa OD-ja j = 4, ki podaja dobre rezultate glajenja in jo bomo zato uporabljali v naši nalogi. Pri izbiri skale razcepa je treba poiskati kompromis med stopnjo zglajenosti OD-ja ter izgubo informacije o OD-ju. 15 3.1.2. Normiranje Ker se lahko konična poraba posameznih UO-jev razlikuje za več velikostnih razredov, je treba OD-je normirati. Normiranje je treba izvesti zato, ker metode, ki smo jih uporabljali pri rojenju (poglavje 3.2), temeljijo na razdalji ali distanci med posameznima OD-jema. Pri normiranju je potrebno paziti, da ostanejo medsebojna razmerja posameznih vrednosti OD-ja po normiranju nespremenjena. Dve obliki normiranja, ki zadostujeta zgornjemu pogoju, podajata enačbi (3.8) in (3.9). zi3 = ij maxx , i = l,...,96, (3.8) kjer je: zy - normirana vrednost OD-ja, Xy - dejanska vrednost OD-ja, Xj - OD j-tega odjemalca. V tem primeru so vse vrednosti meritve Xy deljene z njihovo maksimalno vrednostjo - konično močjo. Literatura [10] pa uporablja normiranje, ki ga podaja naslednja enačba: PB=± f M(Q^^mCSeČnaenergiJa(kWh) B 24 J w 24-30 (3.9) kjer PB predstavlja povprečno mesečno porabo posameznega odjemalca. Z normiranjem po enačbi (3.8) transformiramo vse meritve na interval [0,1], medtem ko normiranje po enačbi (3.9) ne daje enotnega intervala za vse meritve. Zaradi tega smo v nalogi uporabili normiranje po enačbi (3.8). Uporaba izbranega načina normiranja zahteva dodatno previdnost, saj v določenih primerih maksimalna vrednost OD-ja lahko podaja zavajajoče rezultate. Enega izmed takšnih primerov prikazuje slika 9. Na sliki vidimo primer OD-ja, ko je poraba relativno konstantna preko celotnega dneva z izjemo enega 15 minutnega intervala, ko nastopi konica. 70 60 50 5 40 Se 30 20 10 0 CK^jM ^7^ % L: ------ OD glajenOD 12 tih 24 Slika 9: Primer zavajajočih rezultatov pri uporabi konične moči kot faktorja normiranja. Iz slike se vidi, da glajenje ne odpravi ali zmanjša vrednost konice. Če predstavljeni OD normiramo z uporabo enačbe (3.8), naredimo napako, ki vpliva na rojenje, OD ni razvrščen v skupino, 16 ki predstavljajo odjemalce s pasovnim odjemom električne energije. Zaradi tega je treba omenjeno konico pred postopkom glajenja zmanjšati. Podobne konice, kot je na sliki 9, lahko nastopijo na različnih delih OD-ja, ne samo kot konična obremenitev, zato smo jih pred postopkom glajenja zmanjšali z uporabo enačbe: Xij — Xi-1 j "*" K " Xi-1 j Xi,j (3.10) kjer je: k- faktor, za katerega vrednost zmanjšamo konico. Enačba (3.10) podaja, za koliko smo vrednost konice zmanjšali. Predhodno pa je potrebno določiti, katere vrednosti OD-ja predstavljajo konico. V nalogi smo "proglasili" za konice vse i-te, i e %, vrednosti j-tega OD-ja xy, kjer je sprememba porabe pred in po nastopu konice večja od parametra o, kar zapišemo z enačbo: ieŠ I x.j xi-ij maxX; >o j Xi+lj Xij maxxj i = l,...,96, (3.11) <-o kjer % predstavlja množico vseh i-jev, kjer nastopajo konice. Parametra o = 0.1 in k = 1/3 smo določilo kot najprimernejša z vizualnim pregledom rezultatov odstranjevanja konic. Primerjavo rezultatov normiranja s predhodnim odstranjevanjem konic in brez njihove odstranitve za OD na sliki 9 prikazuje slika 10. Iz slike se vidi, da zmanjšanje konice pripomore k izboljšanju normiranja. zmanjšanje konice 6 12 18 brez zmanjšanja konice 24 Slika 10: Primerjava normiranih OD-jev pri zmanjšanju konice ter brez zmanjšanja. V nadaljevanju si bomo podrobneje pogledali metode, namenjene razpoznavanju vzorcev, katere smo uporabljali v nalogi, saj si posamezen OD Xj lahko predstavljamo kot vzorec, opisan s 96 parametri, vrednostmi. 17 3.2. Razpoznavanje vzorcev Razpoznavanje vzorcev je področje, ki opisuje kako "stroji" opazujejo okolico, se učijo razlikovati želene vzorce od ozadja, jih medsebojno grupirati ter podajati jasne in razumne odločitve o njihovih kategorijah in lastnostih. Avtomatsko razpoznavanje, opis, klasifikacija in grupiranje vzorcev ima velik pomen pri različnih disciplinah, kot so: medicina, biologija, psihologija, računalniški vid, umetna inteligenca. Vendar, kaj sploh je vzorec? Vzorec lahko definirano kot nasprotje kaosa, je celota, ki jo je možno poimenovati. Tako je vzorec lahko prstni odtis ali obremenitveni diagram. Če imamo podano množico vzorcev, katerih lastnosti niso podane vnaprej, se njihovo razpoznavanje ali razvrščanje izvede s pomočjo ene izmed naslednjih tehnik: • nadzirajoče razvrščanje, • nenadzirajoče razvrščanje. Pri nadziraj očem razvrščanju se vhodni vzorec spozna kot pripadnik v naprej določenega razreda, ki ga je določi načrtovalec. Načrtovalec pozna obliko ali lastnosti vzorca, ki ga išče v vhodni množici. V drugem primeru nenadzirajočege razvrščanja, pa se vzorec dodeli vnaprej neznanemu razredu na podlagi podobnosti med vzorci. Načrtovalec išče možne podobne oblike vzorcev v vhodni množici. Pri tem načrtovalec pozna najmanj informacij o izbrani množici vzorcev, kar ima za posledico, da je razvrščanje težje. Načrtovalec mora biti sposoben naučiti se posameznih lastnosti iz vhodne množice vzorcev. Nenadzirajoče razvrščanje je najzahtevnejša oblika razvrščanja, saj načrtovalec orodja za razvrščanje ne pozna lastnosti vzorcev ter končnega števila podobnih skupin, v katere mora podano množico vzorcev razvrstiti. V to kategorijo spadajo metode rojenja (cluster analvsis), ki ga lahko nadalje delimo na hierarhične, nehierarhične, geometrijske ter ostale. V nalogi se bom omejil na obravnavo in uporabo metod iz prvih dveh skupin. Njihova bistvena medsebojna razlika je, da je treba pri nehierarhičnih metodah vnaprej podati končno število podobnih skupin. Glavni cilj metod rojenja je, da imajo vzorci znotraj določenega roja podobne karakteristike, medtem ko se vzorci, ki pripadajo različnim skupinam, očitno razlikujejo med seboj. Zaradi zahtevnosti rojenja je za doseganje "optimalnih" rezultatov razvrščanja treba preizkusiti več metod. Metode, primerne za reševanje problema rojenja OD-jev, ki smo jih preizkusili, temeljijo na mehki logiki, statistiki in nevronskem omrežju. Njihove predstavitve podajam v nadaljevanju. 3.2.1. Fuzzy C-means rojenje (FCM) Metodo je predlagal Bazdek [27] in temelji na teoriji mehke logike, kjer stopnjo pripadnosti vzorca določenemu roju podaja pripadnost. Fuzzy C-means (FCM) algoritem je en izmed najpogosteje uporabljenih algoritmov, temelječih na teoriji mehkih množic in je osnovan na prototipih. Prototip je vzorec, ki predstavlja celotno populacijo vzorcev v posamezni skupini ali roju. Algoritem definiramo na naslednji način. 18 Predpostavimo, da imamo množico N vzorcev X = {Xk | = 1,...,N}, kjer posamezen vzorec xk = [xk,i, xk2,..., xk;M] podaja M parametrov. Vzemimo, da B = [pi, p2,..., Pc] predstavlja C prototipov (1 < C < N), vsak opisuje posamezno skupino ali roj. Vsak Pi sestavlja M parametrov. V nalogi bomo z pi označevali prototipe in roje. Algoritem predpostavlja, da je število podobnih skupin znano. Stopnjo pripadnosti vzorca xk v roju P; označimo z wj,k. Definiramo lahko pripadnostno matriko U = [uj,k] dimenzij N x C, ki mora zadostovati naslednjima pogojema: N uiJc e [0,1] za vsaki, 0<]£uik m-l C I H f*2(*a^ d2(*k.Pj) Optimizacija poteka iterativno, zato je treba v vsaki iteraciji posodobiti vrednosti prototipov, ki jih podaja naslednja enačba: N 2Xrxk IX, k=l V splošnem lahko zapišemo FCM algoritem v štirih korakih na naslednji način: 19 1) Določi število rojev C ter faktor mehčanja m. 2) Inicializiraj pripadnostno matriko U. PONAVLJAJ 3) Posodobi parametre prototipov, enačba (3.17),. 4) Posodobi vrednosti pripadnostne matrike U, enačba (3.16). DOKLER rojenje ni stabilno (A < e) Pogoj za prekinitev (stabilna razvrstitev) iterativne optimizacije je, ko je spremenljivka A manjša od poljubno majhnega števila 8. Spremenljivko A lahko definiramo kot razliko vrednosti kriterijske funkcije J(B,U,X) v dveh sosednjih iteracijah ali pa kot normo razlike pripadnostnih matrik U v dveh sosednjih iteracijah (3.18). V nalogi smo uporabili prvi pogoj za prekinitev optimizacije. A = JJ(U,B,X)-JJ.1(U,B,X),ali (3.18) FCM algoritem uporablja faktor mehčanja m, katerega vrednost je poljubno pozitivno število večje od ena. Natančna vloga ali pomen faktorja mehčanja ni znan. Prav tako ni znano, kako izbrati njegovo optimalno vrednost. V nalogi smo s preizkušanjem različnih vrednosti izbrali faktor mehčanja m =1.2. Rezultat mehkega rojenja so prototipi B, ki predstavljajo določeno populacijo vzorcev v izbrani skupini, ter pripadnostna matrika U. Pripadnost vzorca uj,k, lahko zajema vrednosti med nič in ena, enačba (3.12), zato omenjeni algoritem ne podaja jasne (crisp) ločitve, kateri skupini ali roju pripada določen vzorec. Omenjeno dejstvo lahko razumemo kot pomanjkljivost, če potrebujemo jasno razločitev pripadnosti (nič - ne pripada, ena - pripada). V nasprotnem primeru pa se pokaže, da ima mehko rojenje prednost pred trdim (hard) rojenjem, saj lahko povezujemo koncept pripadnosti pri teoriji mehke logike s konceptom utežnostnih funkcij pri statistiki. S pomočjo tega dejstvo si lahko razlagamo trditve strokovnjakov, ki zagovarjajo teorijo mehke logike, češ, da je "mehek" način tolerantnejši do šuma in posebnežev (outliers) kakor trdi (hard). Posebneži so vzorci, ki se močno razlikujejo od ostalih vzorcev v vhodni množici X. Zaradi tega bi bilo razumno, da imajo majhno pripadnost v vsakem izmed rojev C, vendar nam pogoj (3.13) ne dovoljuje, da bi imele vse pripadnosti vrednosti manjše od l/C. Posebnež xk ima pogosto vsa razmerja d(xk,Pj)/d(xk,pj) enaka približno ena, kar ima za posledico, da so vrednosti pripadnosti blizu razmerja l/C. Za izračun vrednost centrov FCM algoritem uporablja vrednosti pripadnosti, enačba (3.17), kar lahko vodi do tega, da je položaj prototipa še vedno premaknjen iz njegove 20 dejanske lege. Če je posebnež močno oddaljen od centra roja, je položaj prototipa lahko močno premaknjen. Problematiko posebnežev označuje občutljivost algoritma na šum (noise sensitivitv). Zato so bili razviti algoritmi, ki v določeni meri rešujejo omenjeno problematiko. Glavno vodilo oblikovanja algoritmov je: • Posebneži naj bi imeli majhno vrednost pripadnosti v vseh rojih C. • Prototipi, generirani z algoritmom na podlagi podatkov, ki vsebujejo posebneže, naj se ne bi dosti razlikovali od prototipov, generiranih na podlagi podatkov brez posebnežev. Možen način reševanja omenjene naloge je, da se posebneže najprej izloči iz vhodnih podatkov ter šele potem izvede rojenje, vendar je takšna procedura v veliko primerih praktično nemogoča ali pa zelo zahtevna. Zaradi tega je Dave [28], predlagal nov algoritem, ki ga je poimenoval "Noise Clustering", NC. 3.2.1.1 Noise Clustering (NC) algoritem Noise Clustering (NC) algoritem lahko formuliramo na podoben način kot FCM algoritem. Razlikuje se v tem, da algoritem predvidi dodaten roj imenovan "šumni" roj, ki vsebuje posebneže ter ga predstavlja prototip s konstantno razdaljo 6 do vseh podatkov. Pripadnost u*;k vzorca Xk v "šumnem" roju podaja enačba (3.19) c i=i Z upoštevanjem zgornjega pogoja imamo sproščeno omejitev pripadnosti za vse dobre roje na: 2>.kS-d2K.ft)+I82(l-i>u I • i=lk=l k=l V M Z odvajanjem kriterijske funkcije (3.21) na parameter u^ dobimo pogoj (3.22), s pomočjo katerega posodobimo vrednosti pripadnosti u^ v vsaki iteraciji optimizacije. Pogoj za posodobitev prototipov je enak kakor pri FCM algoritmu, enačba (3.17). Pri tem moram poudariti, da omenjena pogoja veljata samo za primer Evklidove razdalje med vzorci, enačba (3.15). 1 —p (3.22) m-l C I d2(it,Mr+ (d2fr.Pi) ^2M), v ° ; 21 Drugi člen v imenovalcu (3.22) postane zelo velik za posebneže, kar ima za posledico majhno vrednost pripadnosti v "dobrih" rojih. Prednosti NC algoritma so v tem, da je robustnejši od FCM algoritma in enostavnejši za uporabo, vendar moramo podati primerno vrednost parametra 8, ki jo pa ni vedno enostavno določiti. Določimo jo lahko na podlagi statističnih parametrov podatkov kot razdaljo med vzorci, ki odražajo njihovo strukturo. Na tej podlagi lahko 5 izračunamo kot poenostavljeno statistično povprečje [28]: 82=?i Zl^fc) N-C (3.23) kjer je X poljuben faktor v večini primeru enak ena. Parameter 8, ki predstavlja razdaljo do roja posebnežev, lahko izračunamo v vsaki iteraciji optimizacije. Do sedaj predstavljene lastnosti algoritmov bomo na kratko ilustrirali na preprostem primeru. Predpostavimo, da imamo na voljo dva jasno izražena roja, ki vsebujeta vsak po devet vzorcev, ter dva dodatna vzorca, ki predstavljata posebneža, slika 11(A). Vse vzorce predstavljata dvema parametra M = 2, v x-y ravnini. Podatke predstavlja slika 11(A), razvrstili pa smo jih s FCM, NC algoritmom ter na način, da vsi vzorci v celoti pripadajo enemu izmed rojev - "trda" razvrstitev. Algoritem, ki omogoča zadnjo razvrstitev, je lahko postopek k-tih povprečij (k-means algorithm). Od FCM algoritma se razlikuje v tem, da lahko pripadnost zavzema le vrednosti ena (pripada) ali nič (ne pripada), ter da je vrednost parametra m = 1. V nalogi omenjeni algoritem ne bom posebej obravnaval in smo ga samo navedeli kot eno izmed možnosti rojenja vzorcev. Zaradi preprostosti ilustrativnega primera lahko "trdo" razvrstitev dosežemo tako, da posebneža pripadata k prvemu roju. Rezultate rojenja v dva roja, C = 2, predstavljajo jih posamezni prototipi, prikazuje slika 11(B). Omenjena slika prikazuje tudi vrednosti pripadnosti posebnežev v obeh rojih v primeru rojenja s FCM algoritmom. 5 4 5 4 3.5 >, 3 (D f 2.5 5 2 1.5 1 0.5 0 1 ooo ooo ooo (A) O roji O roj 2 • posebneža ooo ooo ooo 1.5 2.5 3.5 4.5 razdalja x 5 4.5 4 3.5 3 2.5 2 1.5 1 0.5 0 Pripadnost posebnežev (0.512 0.488) (0.516 0.484) (B) 1.5 2.5 roj 1 C) roj 2 posebneža X FCM algoritem X "trda" razvrstitev ♦ NC algoritem 3 x-os 3.5 4.5 Slika 11: Dva roja in dva posebneža: (A) podatki, (B) rezultati rojenja s FCM, NC algoritmom ter tako imenovana "trda" razvrstitev. 22 Iz slike 11(B) se vidi, da je pripadnost posebnežev pri razvrstitvi s FCM algoritmom v obeh rojih podobna, ter zavzema vrednosti blizu 0.5. Rezultat potrjuje predpostavko, da zavzemajo vrednosti pripadnosti posebnežev v dobrih rojih približno v razmerju l/C. Relativno velika pripadnost posebnežev v obeh rojih povzroči, da sta prototipa delno premaknjena iz dejanskega položaja, vendar pa ne toliko kot prototip, ki predstavlja prvi roj pri "trdi" razvrstitvi. Najboljše rezultate podaja NC algoritem. Prototipi podajajo zelo natančno lokacijo centrov rojev, kar se iz slike 11(B) zelo lepo vidi. Poleg posebnežev pa je dodaten problem, ki ga je treba rešiti pri rojenju, namreč določitev ustreznega števila rojev ter odvisnost rezultatov rojenja od izbire začetnih prototipov. Oba omenjena problema, kakor tudi problem posebnežev, sta povezana s pojmom robustnosti. Navkljub nekaterim predlogom pa je splošno rešitev problema robustnosti pri neznanem številu rojev iluzorno pričakovati, saj ima vsaka metoda svoje prednosti ter pomanjkljivosti [29]. Ne glede na zgornjo trditev [29] predlaga algoritem, ki obravnava koncept robustnosti mehkega rojenja. Temelji na tem, da je potrebno za dosego robustne rešitve rojenja izvesti ustrezno število ponovitev rojenja pri različnem številu rojev C ter uvedbo mere veljavnosti (validitv measure) rojenja. Mero veljavnosti v splošnem podaja kriterijska funkcija f(C,X), katere vrednost je odvisna od števila rojev C ter vzorcev X. Optimalno je tisto rojenje, katerega rezultat je najmanjša ali največja vrednost mere veljavnosti (odvisno od izbrane mere). 3.2. L 2 Mere veljavnosti rojenja Določitev ali izbira ustrezne kriterijske funkcije literatura obsežno obravnava. Nekatere metode merijo stopnjo "mehkosti" v posameznemu roju ter predpostavijo, da je najboljša tista delitev, pri kateri je stopnja "mehkosti" najmanjša. Omenjena predpostavka je tudi v skladu z idejo mehkega razvrščanja, saj imajo OD z "najtršo" pripadnostjo najmanjšo negotovost povezano z njihovo klasifikacijo. Iz tega sledi, da je cilj uporabe mer veljavnosti najti razdelitev, ki minimizira razdelitveno negotovost. V uvodu poglavja 3.2 smo podali trditev, da je zaradi zahtevnosti rojenja potrebno za doseganje "optimalnih" rezultatov, razvrščanje preizkusiti z več metodami ter primerjati rezultate. Zaradi tega smo izbrali takšno mero veljavnosti rojenja, ki ne temelji na "mehkih" pripadnostih z namenom, da jih lahko uporabim tudi pri ostalih metodah rojenja. V nalogi smo preizkusili dve kriterijski funkciji, ki smo ju označili z fi in f*2, za mere veljavnosti rojenja. Literatura [30] podaja kot mero za določitev ustreznega števila rojev naslednjo kriterijsko funkcijo: f,(C,X) = i£fl*-flkfl\ (3.24) i=l seSi kjer je Si množica vseh vzorcev razporejenih v i-ti roj. 23 Če število rojev narašča, kriterijska funkcija monotono pada zato, ker se vsota kvadratov odstopanja zmanjša vsakokrat, ko število rojev povečamo tako, da en vzorec uvrstimo v nov roj. Če N vzorcev roji v C strnjenih, dobro razpoznavnih rojih, lahko pričakujemo, da bo vrednost kriterijska funkcije (3.24) hitro padala do naravnega števila rojev C (funkcija doseže koleno), pozneje pa veliko počasneje vse do vrednosti nič pri C = N. Optimalno število rojev določimo, ko kriterijska funkcija doseže koleno. Določitev, kdaj je funkcija dosegla koleno, je v določenih primerih subjektivna, saj koleno ni jasno izraženo, zato smo za primerjavo uporabili dodatno kriterijsko funkcijo, ki sta jo predlagala Davies in Bouldin [31]. Kriterijsko funkcijo kot povprečno podobnost rojev določa enačba: f2(C,X) = if max|^P-L C = 2,3,...,N-1, (3.25) C ,=i i=i,...c ul j i*j *■ J kjer je: o, = i v 2 ( x j, ^ 5-Zk-p. V^l v=l l = i,j (3.26) standardni odklon vzorcev v i-tem in j-tem roju, Djj razdalja med prototipoma rojev Pj in pj, Si predstavlja množico vseh vzorcev v posameznem roju. Število rojev C, pri katerem doseže kriterijska funkcija (3.25) najmanjšo vrednost (globalni minimum), imamo za naravno število rojev v dani množici vzorcev. Zgoraj predstavljeni kriterijski funkciji kot meri veljavnosti rojenja zahtevata, da imamo "trdo" pripadnost (ena - pripada ali nič - ne pripada) vzorcev v posameznem roju. FCM algoritem podaja "mehko" pripadnost roju, zato rezultatov ne moremo direktno uporabiti. Pred uporabo mer veljavnosti je potrebno določiti "trdo1' pripadnost. V nalogi smo jo določili glede na pripadnosti vzorca v določenem roju. Vzorec xk pripada roju Pj, če ima največjo pripadnost u^j v množici vzorcev Sj, ki sestavlja roj Pj: xk e0j | maxuki eSj. (3.28) FCM algoritem z upoštevanjem mer veljavnosti rojev smo testirali na podatkih predstavljenih na sliki 11(A). Potek kriterijskih funkcij fj in i-i v odvisnosti od števila rojev prikazuje slika 12. 24 i— f1 I I 1 L 16 14 \ M-*- 1? \ u o 10 ■ \ a T) P 8 \ > \ 6 \ 4 \ 2 \__ ---- 1 0.6 število rojev/C število rojev/C Slika 12: Potek kriterijskih funkcij fi in f2. Iz slike se vidi, da funkciji podajata različno število optimalnih rojev saj, funkcija fi doseže koleno pri treh rojih, funkcija f*2 pa minimalno vrednost pri razvrstitvi vzorcev v štiri roje. Lego prototipov za oba optimalna primera (kriterij fi, kriterij f2) prikazuje slika 13. kriterij f. •*-X O roj 1 O roj2 . posebneža X FCM algoritem _ * OKO OUO OQO OKO OUO kriterij f2 4.5 4 X roj 1 O roj2 posebneža X FCM algoritem . 3.5 3 2.5 2 1.5 1 0.5 X ono oxo ouo ----------1-------------1-------------1-------------1-------------1-------------1-------------1------------- OOO 0X0 ooo 3 os-x Slika 13: Lega prototipov za oba optimalna primera. Iz slike 13 se vidi, da rojenje z uporabo mere veljavnosti rojenja dodeli posebnežema ločena roja, oba prototipa pa ležita v centru rojev. Na njuno lego posebneža ne vplivata. Primerjava rezultatov rojenja z uporabo dveh različno definiranih mer veljavnosti rojenja kaže, da kriterij f2 določi vsakemu od posebnežev en roj, medtem ko kriterij fi posebneža združi v en sam roj. Ob predstavitvi podatkov, slika 11 (A), smo poudarili, da imamo preprost primer, kjer je v naprej podano število rojev. Z rojenjem vzorcev v dva roja smo pokazali, da NC algoritem podaja najboljše rezultate lege prototipov, saj nanj posebneži ne vplivajo, slika 11(B). Zaradi vpliva inicializacije začetnih prototipov in, v splošnem, neznanega števila rojev na robustnost rojenja smo uporabili mero veljavnosti rojenja. Rezultati ponovnega rojenja prikazujejo, da je rojenje optimalno, če dodelimo posebnežema dodaten roj. Rezultat povečanja števila rojev je natančnejša lega prototipov. 25 Analiza vrednosti pripadnosti Ujk pokaže, da so vse vrednosti praktično enake ena. Zato v tem primeru ne naredimo velike napake, ko določimo "trdo" pripadnost posameznega vzorca izbranemu roju, ki je potrebna za izračun mere veljavnosti rojenja. Rojenje vzorcev v optimalno število rojev podaja relativno jasno pripadnost vzorcev posameznim rojem ter v veliki meri odpravlja probleme s posebneži. Zaradi tega uporaba NC algoritma ni potrebna. Poleg tega NC algoritem ne odpravlja problema naravnega ali optimalnega števila rojev. Zgornje ugotovitve veljajo za predstavljen primer, vendar jih ne moremo v celoti posplošiti, saj je rojenje zelo specifična naloga, odvisna od konkretnih vzorcev, ki jih je potrebno rojiti. Ne glede na to, da ugotovitev ne moremo posplošiti, FCM algoritem z uporabljeno mero veljavnosti podaja dobre rezultate, kar bomo videli tudi v poglavju 4. 3.2.2. Hierarhične metode Rojenja s hierarhični metodami definiramo podobno kot rojenje z mehkimi množicami, kjer predpostavimo, da imamo množico N vzorcev X = {xk | = 1,...,N}, kjer posamezen vzorec xk = [xk>i, Xk,2v, xKm] podaja M parametrov. Razlika med metodama je, da pri hierarhičnih metodah ni potrebno vnaprej podati števila rojev C. Bistveno hierarhičnih postopkov rojenja je opis množice vzorcev X z zaporedjem N rojev, ki začne z N roji, v vsakem roju je natanko en vzorec, in se konča z enim rojem. Stopnje podobnosti med roji v zaporedju rojenj ponazorimo z N nivojskimi drevesi, ki jih imenujemo dendrogrami [30]. 3.2.2.1 Mere podobnosti Pri rojenju je veliko možnosti, kako meriti podobnost med vzorci. Pokazalo se je, da se v večini primerov uporablja kot mera podobnosti razdaljo med vzorci [33]. Razdaljo d(xk, xi) med M-dimenzionalnima vzorcema xk in X] najpogosteje merimo z eno izmed oblik razdalje Minkovskega, ki jo v osnovni obliki podaja naslednja enačba: i d(ik,*i)= ZKi-xu ' (3-29) Vi=i J kjer je n g (0,oo) poljuben parameter. Posebni primeri razdalje Minkovskega so: Manhattan ali "City block" (n = 1), Evklidska (n = 2) in Cebiševa (n -¥ oo). Poleg omenjenih izpeljank pa se lahko uporabljata tudi razdalja "Canberra" ali koeficient Czekanovvskega. V splošnem lahko uporabljamo vse razdalje, ki zadostujejo naslednjim pogojem [33]: 26 d (xk, x,) = d (x,, xk) simetričnost d (x,, x,) > 0, če je x. * x, nenegativnost V ' (3.30) d (xk, x,) = 0, če je xk = x, razločljivost d(xk, x,) < d (xk, xz) + d (xz, x,) trikotniška neenakost Najpogosteje uporabljena razdalja med vzorci, ki smo jo uporabljal tudi v nalogi, je Evklidska in jo uporabljajo tudi druge metode: FCM algoritem ali nevronska omrežja. Omenjeno razdaljo podaja enačba (3.15), lahko pa jo zapišemo tudi v naslednji obliki: d(xk,x1) = ||xk,x1| = >/(xk-x1)T-(xk-x1). (3.31) Na podlagi izračunanih razdalj med vzorci lahko določimo roje z grupiranjem vzorcev v odvisnosti od podobnosti. Zaradi ogromno različnih kombinacij združevanja vzorcev so se oblikovali postopki rojenja, ki temeljijo na zaporedju. Prvi člen zaporedja, ki je najnižji v hierarhiji rojenja, predstavlja delitev vzorcev X v C = N rojev. V vsakem roju je natanko en vzorec. Zadnji člen zaporedja predstavlja en sam roj in je najvišji v hierarhiji. V vsakem nivoju rojenja združimo dva najbolj podobna roja v en sam večji roj. Oba pa se na višjih nivojih rojenja ne razdružita več. Po združitvi dveh rojev Q in C, v nov roj Cy je treba izračunati razdalje novega roja do ostalih rojev Ck. Različni postopki rojenja se razlikujejo med seboj v načinu izračuna razdalj D(Cij, Ck) med roji, vendar vsi temeljijo na naslednjem algoritmu, ki ima za predpogoj, da se izračuna razdalja med vzorci d(xk, X|) [30], [33]: 1) vsaka enota je svoj roj; C, = {xi}, i=l,...,N PONAVLJAJ 2) določi najbližja roja Q in Q na podlagi min(D(Ci, Cj)) in ju združi v nov roj Cij, 3) določi razdaljo med novim rojem Qj in preostalimi roji Ck(3.32); DOKLER ne ostane ena sama skupina. Običajne razdalje med roji so: minimalna razdalja, maksimalna razdalja, povprečna razdalja, Wardova razdalja [30], [33]. V diplomski nalogi [21] je avtor pokazal, da je za razvrščanje OD najprimernejša povprečna razdalja med roji, ki jo podaja enačba: S Id(«..ik) D(CM,Ct )= '-} k" -------, (3.32) (n,+nj)-nk 27 kjer je (ni + nj) število vzorcev v združenem roju Cy, nk število vzorcev v roju Ck, d(xi? xk) razdalja med i-tim vzorcem združenega roja ter k-tim vzorcem v roju Ck. Slika 14 prikazuje enostaven primer izračuna povprečne razdalje med dvema rojema. \ 2 W^=^ZC~~ ^^^-^ 1 ^~^* / T^//^ /~> \ _ dl3 + dl4 + dl5 + d23 + d24 + Č25 ,,s——-—.—~-~____^^^ / U{Ls\,{s2) —----------------------2---------------------- c. ^Jy Slika 14: Izračun povprečne razdalje med rojema. Pri izračunu Evklidijanove razdalje med vzorci (3.31) ter povprečne razdalje med roji (3.32) je vrednost korelacijskega koeficienta r [34], ki meri distorzijo rojenja ter podaja, kako dobro vzorci ustrezajo posameznemu roju, največja. Omenjeni koeficient je merilo primernejše razdalje med roji je za rojenje. Zalogo vrednosti ima na intervalu [0, 1], večja vrednost koeficienta r pomeni večjo podobnost med vzorci v podobnih rojih. Podaja ga enačba: I((d8-dy)(D,-D8)) I(d,-d;)2I(D,-^)3 r(dlitD,,) = —-----------------------------. (3-33) v2 « V w t* *W % cm" ■g 1.5 po 1 i h lk jk ) % v 1 ¥ ^ v 0.5 d t - položaj(l.i) Slika 16: Pravokotna in heksagonalna oblika SOM-a omrežja z 16 nevroni. Načrtovanje in uporabo SOM omrežij lahko razdelimo na dva načina: prvi določa, da je število nevronov v omrežju enako številu rojev. Na primer, omrežje velikosti 2x2 ima štiri nevrone zato določa štiri roje. Pri drugem načinu pa izberemo število nevronov, ki je večje od števila rojev. V tem primeru je potrebna dodatna analiza rezultatov SOM omrežja, da določimo ustrezno število rojev. SOM omrežja imajo dva nivoja, vhodnega ter Kohonenovega. Vhodni nivo je v celoti povezan z dvodimenzionalnim Kohonenovim nivojem. Strukturo SOM-a z zmagovalnim nevronom in njegovo okolico z radijem R = 1 prikazuje slika 17. 30 Zmagovalni nevron Sosednji nevroni /-<----Kohonenov nivo -~~/ / v v\—rxi \//i/j / // /7~ XW-^W Vhodni nivo Slika 17: Struktura SOM-a z zmagovalnim nevronom in okolico z radijem R = 1. Med procesom učenja vhodni vzorci prehajajo v omrežje preko procesnih elementov, nevronov, v vhodnem nivoju. Množica N vzorcev X = {Xk | = 1,...,N}, kjer ima posamezen vzorec Xk = [xk,i, Xk,2,.--, Xk,M] M parametrov, se primerja z nevroni v dvodimenzionalnem Kohonenovem nivoju. Vsakemu nevronu je pridružen utežni vektor W; = [wy, Wi>2,—> wj,m] prav tako reda M, kjer je Wjj vrednost uteži nevrona i v povezavi z j-tim parametrom vhodnega vzorca. Z učenjem nevroni posodabljajo vrednost uteži glede na topološke odnose med vhodnimi vzorci. Nevron z minimalno razdaljo (3.35) do vhodnega vzorca, t.j. zmagovalni ali vzbujeni nevron i , prilagodi utež tako, da je bližje vhodnemu vzorcu. dw. =m.in{||xt-wi||} (3.35) Poleg spremembe uteži zmagovalnega ali vzbujenega nevrona algoritem prilagodi vrednosti uteži tudi vsem nevronom v njegovi okolici Oj*(d). Nevron i se nahaja v okolici Oj*(d) vzbujenega nevrona i , če leži znotraj radija R: ieO,.(d) |dM. xk,M], K - število rojev ali razredov, v katere moramo razvrstiti vzorce (število nevronov v drugem nivoju). Vrednosti uteži Wi nevronov v prvem nivoju, matrika uteži IW reda CxM, predstavljajo prototipe rojev ali skupin B = [|3i, 02,—> Pc]. Imenujemo jih tudi učna množica. Vrednosti uteži nevronov v drugem nivoju, matrika uteži LW reda KxM, predstavljajo imena razredov, v katere moramo vhodne vzorce razvrstiti. Matrika LM zavzema vrednosti ena samo v vrsticah, povezanih z vhodnim razredom, druge ima vrednosti nič. Vektor b predstavlja sprožilni prag, ki določa občutljivost nevrona. vhod "radial basis" nivo tekmovalni nivo CxM IW 1-^-* d(Xk,wO Mxll---------------1 1-{V] Cxl ------/ Cxl M Cxl ai Cxl LW n2 Kxl KxM 32 Kxl "radial basis" aktivacijska funkcija Slika 18: Arhitektura PNN-ja. / C "compet" aktivacijska funkcija Razvrščanje vzorcev s pomočjo VNO omrežja razdelimo v dve fazi. V prvi fazi je treba za vsak vhodni vzorec xk izračunati razdaljo dk,i(xk, wj) do uteži Wi, i = 1,...,C. Uporabljena razdalja je Evklidska (3.15). Razdalje so pomnožene s sprožilnim pragom b in sicer: istoležni elementi vektorja razdalj s in sprožilnega praga b med seboj. Rezultat radial basis nevrona je vektor al, katerega i-ti element izračunamo z naslednjo enačbo: a\ =radbas(di(xk,w1)-bi), (3.40) kjer aktivacijsko funkcijo radbas podaja enačba (3.41), njen potek prikazuje slika 19. Kjer je nI parameter z zalogo vrednosti nI g (-oo, oo). radbas(nl) = e~nl2 (3.41) 33 0.0-------i------------i----> h 4)833 K).833 o radbas(n) Slika 19: Radial basis aktivacijska funkcija. Aktivacijska funkcija zavzema vrednosti med nič in ena. Tako se vhodni vzorec, ki je zelo podoben učnemu vzorcu, predstavi s številko blizu vrednosti ena v izhodnem vektorju al, kar izhaja iz oblike funkcije, slika 19. Če je vhodni vzorec podoben več učnim vzorcem, je predstavljen z več elementi vektorja al blizu ena. V drugi fazi najprej seštejmo elemente vektorja al glede na njihovo pripadnost posameznemu razredu K. Rezultat drugega nivoja je vrednost ena za tisti razred, ki mu vhodni vzorec pripada. Na takšen način omrežje razvrsti vhodne vzorce v tiste razrede, ki imajo največjo verjetnost, da jim vzorec pripada. Načrtovanje VNO-jev je relativno enostavno ter neodvisno od učenja, kot pri ostalih tipih NOjev. Njihove uteži predstavljajo prototipe vzorcev, na podlagi katerih razvrščamo ostale vzorce, zato ni potrebno prilagajati uteži in pragov. Uporabljamo jih lahko sproti in ko podamo učne vzorce, lahko omrežje začne razvrščati nove vzorce. Če imamo dovolj učnih vzorcev, VNO-ji konvergirajo k Bayes-ovi strategiji razvrščanja. Poleg tega ima veliko sposobnost posploševanja. Največjo pomanjkljivost VNO-jev je v tem, da zahtevajo en nevron za vsak učni vzorec in da so počasnejše kot ostali tipi NO-jev, saj zahtevajo veliko izračunov. Celotna predstavitev VNO-jev je povzeta po literaturi [36] in [37]. Verjetnostna nevronska omrežja smo predstavili v tem poglavju zato, ker predstavljajo enega izmed načinov razpoznavanja vzorcev, vendar ga za rojenje OD-jev nismo uporabili. Njihova koristnost se je pokazala pri dodeljevanju NOD-ov posameznim upravičenim odjemalcem, kar bomo podrobneje prikazali v naslednjem poglavju. 3.3. Dodelitev NOD-ov posameznim UO-jem V prejšnjih dveh poglavjih 3.1 in 3.2 smo podrobneje predstavili potek oblikovanja podobnih skupin ali rojev z uporabo valčne analize in metod nenadziranega rojenja. Sedaj je potrebno določiti NOD-e ter jih dodeliti posameznim UO-jem. Podatki o posameznem UO-ju, ki so na razpolago in se nanje lahko opremo pri dodeljevanju NOD-ov, so: • Registrirana dejavnost. • Mesečna energija v visoki tarifi Wyj ter nizki tarifi Wm. • Mesečna konična moč i\. 34 V nalogi smo uporabili registrirano dejavnost kot parameter na podlagi katerega smo določili, kateri NOD pripada posameznemu UO-ju. V ta namen smo najprej analizirali, katerim dejavnostim pripadajo UO-ji, od katerih smo pridobili meritve OD-jev. Dejavnosti odjemalcev določa v Standardni Klasifikat Dejavnosti (SKD), ki je usklajen z evropsko klasifikacijo ter zavzema 60 glavnih dejavnosti označenih od 1 do 99, vendar ne zavzema vseh vrednosti. Dejavnost posameznega UO-ja smo izbrali zaradi tega, ker je ta podatek znan in ga lahko enostavno pridobimo. Na ta način imamo jasen kriterij, kateri nadomestni obremenitveni diagram pripisati posameznemu UO-ju. Analizo UO-jev glede na njihovo glavno dejavnost podaja slika 20. Iz slike se vidi, da so najbolj zastopane dejavnosti 15, 51, 52 in 80. Relativno mnogo je dejavnosti, ki so zelo slabo zastopane z enim ali dvema UO-jema. Nekatere dejavnosti celo niso zastopane in so označene z rdečo barvo. .2. 15 o 10 3/5 i L_- B zastopani ■■ nezastopani i Lj iJ - 0 10 20 30 40 50 60 70 80 90 100 dejavnost Slika 20: Analiza UO-jev v odvisnosti od dejavnosti. Prvi korak, pri uporabi registrirane dejavnosti, je namenjen iskanju korelacije med obliko povprečnega OD-ja posamezne skupine ter registrirane dejavnostji odjemalcev, ki to skupino sestavljajo. Pri tem naj še enkrat poudarimo, da smo UO-je razvrščali, rojili, glede na podobnost diagramov. Za rojenje smo uporabili FCM algoritem ter določili "trdo" pripadnost OD-ja v posamezni skupini z enačbo (3.28). Rezultate iskanja korelacije med skupinami in tipom registrirane dejavnosti v grafični obliki prikazuje slika 21. V levem stolpcu vidimo posamezne skupine, označene z zaporedno črko od a do d, skupaj s OD-ji, ki jih sestavljajo ter povprečnim OD-jem, ki je označen z debelejšo črto. Na desni strani pa slika prikazuje število OD-jev, ki sestavljajo posamezno skupino v odvisnosti od dejavnosti UO-jev, katerim diagrami pripadajo. Slika prikazuje samo glavne dejavnosti iz SKD-ja. Iz slike vidimo slabo korelacijo med obliko povprečnega OD-ja ter registrirano dejavnostjo odjemalcev, saj podobne skupine določajo odjemalci istih dejavnosti. Tako lahko vidimo, da je dejavnost 52 zastopana v treh skupinah a), b) in c), medtem ko je dejavnost 15 zastopana v vseh štirih. Zaradi tega lahko nastopijo težave pri enoumnem dodeljevanju NOD-ov posameznim UO-jem. Podobne ugotovitve bi lahko podali tudi za nekatere druge dejavnosti. 35 50 dejavnost 100 100 100 100 Slika 21: Grafična primerjava korelacije med NOD-om in registrirano dejavnostjo. Predstavljena analiza kaže na dejstvo, da je korelacija med registrirano dejavnostjo posameznega UO-ja ter obliko njegovega OD-ja slaba. Omenjeno dejstvo so podali tudi avtorji v referenci [20]. Kljub slabi korekciji pa vseeno predlagamo uporabo registrirane dejavnosti za dodelitev NOD-a posameznemu odjemalcu, saj je ta podatek najenostavneje pridobiti. Nalogo smo rešili v dveh korakih. V prvem smo najprej iz meritev, ki smo jih imeli na razpolago, določili povprečne diagrame posameznih glavnih dejavnosti. Drugi korak pa predstavlja razvrstitev povprečnih diagramov glavnih dejavnosti v skupine, ki so rezultat rojenja podobnih diagramov. Tiste povprečne OD-je skupin, v katere razvrstimo povprečne diagrame glavnih dejavnosti, imenujemo Nadomestne Obremenitvene Diagrame (NOD-e). Razvrstitev smo izvedli z verjetnostnim nevronskim omrežjem, predstavljenim v poglavju 3.2.3.2, ki nam daje dobre rezultate. Do sedaj smo predstavili postopek oblikovanja NOD-ov ter njihovega dodeljevanja posameznim odjemalcem. V nadaljevanju bomo predstavili rezultate predstavljenega postopka. 36 4. Rezultati Za predstavitev rezultatov postopka oblikovanja NOD-ov ter njihovega dodeljevanja posameznim UO-jem smo uporabili podatke 288 izmerjenih OD-jev odjemalcev, ki smo jih pridobili od slovenskih distribucijskih podjetji. Kakor smo že v začetnem delu poglavja 3 povedali, posebnega vpliva na izbiro meritev nismo imeli. NOD-e smo določili v skladu s postopkom, predstavljenim na sliki 1 ter v celoti opisanem v predhodnem poglavju. Iz pridobljenih meritev OD-jev posameznih odjemalcev smo najprej določili povprečne OD-je za posamezni tip dneva v mesecu. V nalogi bomo prikazali rezultate analize povprečnih obremenitvenih diagramov za delavnik, sreda v mesecu marcu 2002. Naslednji korak je glajenje in normiranje. Rezultate glajenja, izločanja šuma, za štiri obremenitvene diagrame prikazuje slika 22. Posamezni diagrami so označeni s črkami od a do d. a) 200 .. i 150 - 100 - 50 n ------ merjen OD — glajen OD 12 f/h c) 18 24 ------ merjen OD ------ glajen OD ^\i 12 f/h 18 24 d) ------ merjen OD ------ glajen OD 12 f/h 18 24 Slika 22: Rezultati glajenja štirih OD-jev. Iz slike se vidi, da v poglavju 3.1.1 predstavljen algoritem zelo dobro gladi OD-je, če vsebujejo relativno dosti šuma, slika 22c. Če "merjen OD" ne vsebuje dosti šuma, pa je glajen OD skoraj popolnoma enak merjenemu OD-ju, slika 22d. V konkretnem primeru smo z "merjen OD" označili povprečno sredo v marcu. 37 4.1. Rezultati rojenja OD-jev s FCM algoritmom Rojenje glajenih in normiranih OD-jev smo najprej izvedli s FCM algoritmom iz poglavja 3.2.1. Pri tem smo uporabili mere veljavnosti rojenja za določitev števila rojev, t.j. skupin. Pri splošni predstavitvi metod razpoznavanja vzorcev, poglavje 3.2, smo z roji označevali vzorce, razvrščene v posamezno skupino. V našem konkretnem primeru pa roji predstavljajo skupino OD-jev, ki sestavljajo posamezno skupino. Zaradi vnaprej neznanega števila skupin smo njihovo število spreminjali od vrednosti dva do 30 pri različnih inicializacijah začetne pripadnostne matrike U. Število inicializacij je bilo 100. Za vsako inicializacijo pripadnostne matrike in vsako posamezno število skupin smo izračunali vrednosti kriterijskih funkcij fi (3.24) in f2 (3.25). Njuna poteka prikazuje slika 23. 11---------------1---------------1---------------1---------------1---------------1---------------1 o1------------Lj---------------'---------------'---------------'---------------'--------------- 0 5 10 15 20 25 30 0 4 5 10 15 20 25 30 število skupi n števi to skupi n Slika 23: Potek kriterijskih funkcij fj in f*2 v odvisnosti od števila skupin. Iz slike vidimo, da je potek vrednosti kriterijskih funkcij f\ in f2 v odvisnosti od števila skupin v katere rojimo OD-je za večino primerov različnih inicializacij pripadnostne matrike podoben. Relativno velika odstopanja imamo samo v enem izmed primeru pri uporabi kriterija fi. Kriterij f2 predlaga štiri optimalne skupine, kot minimalna vrednost. To je razmeroma malo, zato smo za določanje števila skupin izbrali prvi kriterij. Pri tem kriteriju koleno ni tako izrazito, kakor smo ga videli na sliki 12, zato smo v našem primeru izbrali 15 kot najprimernejše število skupin. Pri določenem številu skupin smo izbrali tisto inicializacijo pripadnostne matrike U, kjer je bila vrednost kriterijske funkcije f\ minimalna. V našem primeru je znašala 399.9. Rezultate rojenja glajenih in normiranih OD-jev s FCM algoritmom prikazuje slika 24. Na sliki vidimo 15 skupin, ki smo jih prikazali na posamezni manjši sličici, označeni z zaporedno črko od a do o. Ordinatne osi predstavljajo čas v urah, medtem ko abscisne osi predstavljajo moč P v p.u. Za vsako izmed dobljenih skupin smo izračunali povprečni diagram vseh OD-jev v skupin ter ga predstavili z debelejšo modro črto. Povprečni diagram vseh OD-jev v skupini bomo imenovali povprečen diagram (PD). 38 Iz slike se vidi, da so nekatere skupine zelo jasne ter dobro zastopane kot npr. skupina a, b, c, h, ali k, medtem ko so med njimi tudi skupine, ki so slabše zastopane z OD-ji, ki imajo zelo različne oblike. Takšni skupini sta npr. g in j. 6 12 18 24 0 6 12 18 24 0 6 12 18 24 1 i-------------- .i-........ i m----------1 1 6 12 18 24 0 6 12 18 24 0 6 12 18 24 1 i------------vu-^-k-m-^ raw<-----1 1 0 6 12 18 24 0 6 12 18 24 0 6 12 18 24 t/h Slika 24: Rezultati rojenja s FCM algoritmom. Za razločevanje posameznih skupin med seboj sta pomembna naslednja podatka: čas spremembe ali povečanja porabe ter velikost porabe. Vpliv omenjenih dveh podatkov zelo nazorno prikazuje slika 25, kjer vidimo primerjavo povprečnih diagramov d in e ter a in c. Prva dva diagrama, d in e, prikazujeta vpliv začetka večanja porabe ali obratovanja odjemalcev. Odjemalci skupine d začnejo obratovati približno ob šestih zjutraj in zaključijo delavnik ob 16 popoldan, medtem ko imajo odjemalci iz skupine e približno za eno uro zamaknjen delavnik. 39 0.9 ----- a -------- C ' 0.8 - 07 [ \ \ 0.6 ■ j \ \ * 0.5 0.4 / \ ^^ 0.3 / \ 0.2 0.1 - 12 1516 18 f/h 12 f/h 24 Slika 25: Primerjava med povprečnimi diagramoma skupin d in e ter a in c. Povprečna diagrama skupin a in c na zgornji sliki prikazujeta vpliv velikosti porabe. Vidimo, da odjemalci začnejo obratovati ob istem času, vendar imajo prvi nižjo nočno ali pasovno porabo. Število OD-jev v posamezni skupini podaja tabela 1. Iz tabele vidimo, da so nekatere skupine dobro zastopane, medtem ko skupine f, g, j in m sestavlja manj kot osem OD-jev. Skupine, ki so zastopane z več kot deset OD-ji, vsebujejo 263 OD-jev, kar predstavlja 91% vseh OD-jev Tabela 1: Število OD-jev v posamezni skupini. skupina število OD-jev I skupina število OD-jev | skupina število OD-jev a 29 f 5 k 36 b 17 g 8 1 26 c 36 h 28 m 6 d 18 18 n 28 e 14 j 6 0 13 4.2. Rezultati rojenja s hierarhično metodo in SOM-om V skladu z postopkom, ki smo ga predstavili v poglavju 3.2.2, je treba za razdelitev dendrograma združevanja, ki ga prikazuje slika 26, predhodno določiti ustrezno vrednost koeficienta neskladnosti I. Velikost koeficienta I določa končno število skupin, v katere OD-je razvrstimo. V nalogi smo koeficient izbrali tako, da je bila vrednost kriterija ali mere veljavnost rojenja (3.24) primerljiva z vrednostjo pri rojenju s FCM algoritmom. Znašala je 403.7. Na takšen način smo določili vrednost I = 2.55 iz cesarje sledilo, da smo OD-je razvrstili v 26 skupin. Rezultate razvrščanja smo označili na podoben način kakor v primeru rojenja s FCM algoritmom ter jih podali v prilogi 1, slika 29 in slika 30. Število OD-jev v posamezni skupini podaja tabela 2. Iz tabele vidimo, da samo deset skupin od 26 zastopa deset ali več OD-jev, ki vsebujejo 245 OD-jev, kar predstavlja 85% vseh obremenitvenih diagramov katere smo razvrščali. Poleg tega pa imamo celo sedem skupin, kjer je samo en obremenitveni diagram. 40 Zaključimo lahko, da hierarhična metoda "generira" skupine, ki predstavljajo "posebneže" ali šum v množici vhodnih vzorcev. OD-ji Slika 26: Dendrogram združevanja OD-jev Tabela 2: Število OD-jev v posamezni skupini pri razvrščanju s hierarhično metodo skupina število OD-jev skupina število OD-jev skupina število OD-jev skupina število OD-jev a 20 h 11 0 14 v 1 b 1 i P 1 w 2 C 36 j 2 q 2 X 1 d 7 k 10 r 20 y 7 e 39 1 59 s 3 z 7 f 10 m 4 t 1 g 26 - > u 2 1 Za rojenje s SOM-om smo izbrali heksagonalno strukturo nevronskega omrežja s številom nevronov, ki ustreza želenemu številu rojev ali skupin. V tem primeru predstavlja vsak nevron eno skupino. Zaradi primerjave rojenja z rojenjem s FCM algoritmom smo izbrali 15 nevronov, ki so bili razporejeni v dvodimenzionalno mrežo dimenzije 5x3. S preizkušanjem različnih vrednosti radija okolice R in števila iteracij smo izbrali R = 1.2 ter število iteracij učenja 2000. Z izbrano konfiguracijo nevronskega omrežja ter nastavljenimi parametri učenja smo omrežje najprej naučili, nato pa simulirali. Rezultat simulacije je vektor indeksov, ki predstavljajo skupino, v katero posamezen OD pripada. Rezultate rojenja s samo-organizirajočim omrežjem smo v grafični obliki prikazali v prilogi 2, slika 31. Vrednost kriterija fi (3.24) za dobljeno razvrstitev je znašala 468.5. Število OD-jev v posamezni skupini podaja tabela 3. 41 Tabela 3: Število OD-jev v posamezni skupini pri razvrščanju s samo-organizirajočim omrežjem. skupina število OD-jev skupina število OD-jev skupina število OD-jev a 30 f 13 k 22 b 16 g 12 1 24 C 26 h 8 m 33 d 12 i 26 n 17 e 20 j 11 0 18 Iz tabele vidimo, da samo ena skupina vsebuje manj kot deset OD-jev. Vendar so te skupine manj homogene, kar se tudi vidi iz rezultatov, glej sliko 31. Takšen zaključek lahko naredimo tudi na podlagi vrednosti kriterija (3.24), ki meri odstopanje posameznih OD-jev v skupinah od povprečnih OD-jev. 4.3. Primerjava metod rojenja Do sedaj smo predstavili rezultate razvrščanja z uporabo treh različnih metod rojenja. Primerjava kvadratnih odstopanj meritev (3.24) nakazuje, da je rojenje s SOM-om manj primerno kakor s FCM algoritmom, saj imamo v prvem primeru večja odstopanja. Poleg tega lahko pri rojenju s FCM algoritmom določimo ustrezen prag pripadnosti Ujj, na podlagi katerega lahko izločimo vse OD-je, ki imajo maksimalno pripadnost v določeni skupini ali roju manjšo od praga. Na ta način lahko dodatno izločimo posebneže. V nalogi posebnežev za uporabo praga pripadnosti nismo uporabljali. Direktna primerjava hierarhične metode z ostalima dvema na podlagi izračuna odstopanj ni primerna zato, ker smo vrednost koeficienta neskladnosti I določili pri pogoju, da so odstopanja primerljiva z odstopanji pri rojenju s FCM algoritmom. Če bi izbrali takšno vrednost koeficienta neskladnosti, da bi algoritem "generiral" 15 skupin, dobimo veliko večja odstopanja, in sicer 534.9. V nalogi smo za najprimernejšo metodo rojenja ali razvrščanja izbrali FCM algoritem. Rezultate tega algoritma smo uporabili za določitev NOD-ov ter njihovih dodelitev UO-jem. Grafično primerjavo nekaterih povprečnih diagramov, dobljenih z rojenjem s posamezno metodo prikazuje slika 27. Z modro barvo smo označili povprečne diagrame, dobljene s FCM algoritmom, z rdečo barvo diagrame, dobljene s hierarhično metodo ter s črno barvo diagrame, dobljene s SOM-om. Iz slike vidimo, da so nekateri diagrami, dobljeni z vsemi tremi metodami, praktično povsem enaki, npr. skupina 2, 4 in 5. Ostali so bolj ali manj primerljivi. Najmanj primerljivi so diagrami v skupini 1, medtem ko sta v skupini 5 dva diagrama dobljena s SOM-om, ki bi ju lahko združili v samo enega. Vidimo pa lahko tudi, da z uporabo SOM-a ne dobimo obremenitvenega diagrama za skupino 6. Za boljšo predstavitev tega, katere skupine iz slik 24, 29, 30 in 31 predstavljajo povprečni diagrami, prikazani na sliki 27, smo jih navedli po vrsti za skupine od 1 do 6; slika 24: a, c, e, h, 1 in n. slika 29 in slika 30: e, c, a, m, o in l.slika 31: d, 1, e, a, g, in y. 42 Slika 27: Grafična primerjava nekaterih rezultatov rojenja z različnimi metodami. 4.4. Rezultati določitve in dodelitev NOD-ov posameznim UO-jem Nadomestne obremenitvene diagrame smo določili ter jim pripisali tipe registriranih dejavnosti na način, kakor smo ga opisali v poglavju 3.3. Najprej smo naredili povprečne OD-je posameznih glavnih dejavnosti ter jih nato razvrstili z uporabo verjetnostnih nevronskih omrežji v skupine, ki smo jih določili s FCM algoritmom. Končne rezultate razvrščanja je osem NOD-ov, ki jih prikazuje slika 28. Na sliki so NOD-i poimenovani z zaporednimi številkami od ena do osem ter prikazani s poudarjeno črto. Ostali diagrami predstavljajo povprečne obremenitvene diagrame posameznih registriranih dejavnosti. Tabela 4 podaja, katere dejavnosti zastopa posamezen NOD. Tabela 4: Zastopane registrirane dejavnosti UO-jev v posameznem NOD-u. r Registrirane dejavnosti NODl 19, 20, 27, 29, 36, 80 NOD 2 18,24,28,30,45,70 NOD 3 34,71 NOD 4 10, 13,40,41,72,90 NOD 5 17,22 NOD 6 1,51,52,63,65,92 NOD 7 15, 25, 31, 33, 50, 55, 60, 73, 74, 75, 85, 93 NOD 8 2, 32, 64, 99 43 NOD1 NOD2 tih Slika 28: Končni NOD-i Primerjava NOD-ov, ki jih prikazuje zgornja slika, ter povprečnih OD-jev posameznih podobnih skupin, ki jih prikazuje slika 24 kaže, da sedem podobnih skupin nismo predlagali za NOD-e. Razlog je v tem, da so nekatere skupine zelo netipične ter zastopane z manj OD-ji, kakor npr. skupine f, g, j in m. Opozoriti pa moramo na skupini b in e, ki sta bolje zastopani. Povprečen OD skupine e je oblikovno zelo podoben povprečnemu OD-ju skupine d, le da je časovno premaknjen zato bi ju načeloma lahko združili. Njuno podrobnejšo primerjavo prikazuje slika 25. Skupino b, ki je zelo homogena in dobro zastopana, ne moremo zelo enostavno združiti s katero od ostalih skupi. Ta pomanjkljivost, da dveh dobro zastopanih skupin ne proglasimo za NOD-a, je posledica izbire števila podobnih skupin. Odpravimo jo lahko z zmanjšanjem začetnega števila želenih skupin, vendar bomo tem primeru dobili manj homogene skupine z večjimi odstopanji posameznih OD-jev znotraj skupine. KOMENTAR: Rezultati prikazujejo uspešno uporabo predlagane metode oblikovanja in dodelitve NOD-ov posameznim upravičenim odjemalcem. V nalogi smo predstavili samo rezultate oblikovanja NOD-ov 44 za delavnik. Dobljeni NOD-i so rezultat razvrščanja dejanskih obremenitvenih diagramov, zato z gotovostjo lahko trdimo, da so njihove oblike verodostojne in pravilne. Manj smo lahko prepričani o verodostojnosti povprečnih diagramov posameznih dejavnosti. Do tega sklepa nas vodi dejstvo, da so dejavnosti v veliki meri slabo zastopane. Da bi bili rezultati boljši in splošnejši je treba, pridobiti dodatne meritve, ponoviti predlagani postopek ter izdelati NOD-e še za ostale tipične dneve. 45 5. Sklep V nalogi smo obdelovali vprašanje določanja nadomestnih obremenitvenih diagramov, kjer ločimo dva načina, ki temeljita na meritvah obremenitve posameznih odjemalcev. V prvem načinu NOD-e določimo z večletnim merjenjem porabe ter z analizo meritev, na podlagi katere določimo tipične skupine odjemalcev. Drugi način temelji na razvrščanju dejanskih OD-jev z metodami razpoznavanja vzorcev, vendar v tem primeru avtorji ne poročajo o tem, kako dobljene NOD-e dodeliti posameznim odjemalcem. V nalogi smo predstavili postopek določanja NOD-ov za upravičene odjemalce, ki temelji na metodah razpoznavanja vzorcev in smo ga razdelili v štiri korake: • pridobitev meritev, • priprava meritev za nadaljnjo obdelavo z glajenjem in normiranjem, • razvrščanje OD-jev v posamezne skupine, • dodelitev NOD-ov posameznim tipom odjemalcev. Meritve smo pridobili od slovenskih distribucijskih podjetji, vendar vpliva in posebne analize tega, katerim odjemalcem naj podjetja merijo porabo, nismo imeli. Za glajenje OD-jev smo uporabili valčno multiresolucijsko analizo, ki omogoča učinkovito izločanja šuma iz OD-jev. Posamezne OD-je smo normirali (delili) z njihovo maksimalno vrednostjo. Izmed mnogih metod rojenja smo preizkusili FCM algoritem, hierarhične metode in samo-organizirajoča nevronska omrežja. Primerjava rezultatov rojenja z uporabo različnih algoritmov je pokazala, da smo dobili primerljive rezultate rojenja. Za najprimernejše smo izbrali rojenje z uporabo mehke logike - FCM algoritem. Z uporab verjetnostnih nevronskih omrežji smo NOD-e dodelili posameznim skupinam upravičenih odjemalcev. Pri tem smo kot glavni parameter za določanje skupin uporabili registrirano dejavnost posameznih upravičenih odjemalcev. Predstavljeni postopek smo preizkusili na 288 izmerjenih OD-jih upravičenih odjemalcev, ki smo jih razvrstili v 15 skupin. Nekatere izmed dobljenih skupin so združevale netipične OD-je, posebneže, zato jih ne moremo predstaviti kot NOD-e. V nalogi smo predstavili rezultate razvrščanja povprečnih delavnikov (sreda) meseca marca 2002. Enak postopek bi lahko ponovili za druge značilne dneve v tednu. Rezultati prikazujejo primernost uporabljenega postopka za določanje NOD-ov. Predstavljeni postopek omogoča relativno učinkovito oblikovanje in dodelitev NOD-ov posameznim upravičenim odjemalcem. Zavedati pa se moramo, da rezultati predstavljeni v nalogi, podajajo "optimalno" rešitev oblikovanja NOD-ov za podatke, ki smo jih uporabili. Da bi rezultate lahko posplošili, pa menimo, daje potrebno pridobiti več meritev ter rezultate preveriti v "realnosti". 46 6. Literatura [I] EU, European Union Concil Directive 96/92/EC, 1996 http://europa.eu.int/eur-lex/en/Iif/reg/en_register_1230.html [2] Energetski zakon (EZ), Klasifikacijska številka: 320-01/98-0007/0001, Objava v Ur. listu 79/99, 30/9/99 (stran 12378) [3] Gorazd Ažman: "Ekonomski vidiki sistemov merjenja porabe električne energije v dereguliranih EES", diplomsko delo, Univerza v Ljubljani, Fakulteta za elektrotehniko, Ljubljana, 2001. [4] "Metering, Load Profiles and Settlement in Deregulated Markets", Svstem Tariff Issues Working Group, EURELECTRIC, ref: 2000-220-0004, ' March 2000, http ://public. eurelectric. org/C ontent/Default. asp [5] "Pravilnik o načinu obračunavanja odstopanj oddaje ali odjema električne energije od voznih redov", Uradni list Republike Slovenije, št. 83/27.9.2002/st. 9171-9177. [6] "Uredba o splošnih pogojih za dobavo in odjem električne energije", Uradni list 117/2 [7] F. Gubina, D. Gerbec, S. Gašperič, Krmiljenje napetostnega nivoja v distribucijskih omrežjih -Obremenitveni diagrami odjemalcev, Fakulteta za elektrotehniko v Ljubljani, maj 2001. [8] C. S. Chen, J. C. Hwang, and C. W. Huang, "Application of Load Survev Svstems to Proper Tariff Design," IEEE Transactions on Power Systems, vol. 4, pp. 1746-1751, Nov. 1997. [9] J.A. Jardin, H.P. Schmidt, CM.V. Tahan, C.C.B. de Oliveira, S.U. Ahn, "Distribution Transformer Loss of Life Evaluation: A Novel Approach Based on Daily Load Profiles", IEEE Transactions on Power Delivery, vol. 15, No. 1, pp.361-366, Januar 2000. [10] A. Capasso, W. Grattier, R. Lamedica, A. Prudenzi, 1994, "A Bottom-Up Approach to Residential Load Modeling", IEEE Transactions on Power Systems, vol. 9, No. 2, pp. 957-964, May 1994. [II] C S. Chen, J. C. Hwang, Y. M. Tzeng, C. W. Huang, M. Y. Cho, 1996, "Determination of Load Survev Svstem at Taipower" IEEE Trans. Power Deliverj, vol. 11, No. 3, p.p. 1430-1436, July 1996. [12] C. S. Chen, M.S. Kang, J. C Hwang, and C. W. Huang, "Svnthesis of power system load profiles by class load study", Electrical Power and Energy Systems, vol. 22, p.p. 325-330, 2000. [13] C. S. Chen, M.S. Kang, J. C. Hwang, and C. W. Huang, "Implementation of the Load Survey System in Taipovver", IEEE Transmission and Distribution Conference, IEEE. vol. 1, 1999, pp.300-4 vol.l. Piscataway, NJ, USA. [14] J.A. Jardin, S.U. Ahn, CM.V. Tahan, F.M. Figueiredo, "Daily Load Profiles for Residential, Commercial and Industrial Low Voltage Consumers", IEEE Transactions on Power Delivery, vol. 15, No. 1, pp. 375-380, Januar 2000. [15] J.A. Jardin, CM.V. Tahan, M.R. Gouvea, S.U. Ahn, F.M. Figueiredo, "Residential and Commercial Daily Load Curve Representetion by Statistical Function for Engineering Purposes", CIRED, International Confer. And Exhibition on Electricity Distribution, Brussels, Belgium, 1995. [16] E. Bompard, E. Carpaneto, G. Chicco, R. Napoli, F. Piglione, P. Postolache, M. Scutariu, "Stratified Sampling of the Electricity Customers for Setting up a Load Profile Surey", Proceedings ofRIMAPS Conference, Madeira, Portugal, 2000. [17] S. V. Allera, A. G. Horsburgh, "Load Profiling for Energy Trading and Settlements in the UK Electricity Markets", Proceedings DistribuTECH, 1998, http://www.electricity. org.uk/services/lrg/dadsm2a2.html. 47 [18] M. Scutariu, C. Toader, P. Postolache, "Investigations On Daily Load Curve Characteristion", Proceedings o/RIMAPS Conference, Porto, Portugal, 2001. [19] G. Chicco, R. Napoli, P. Postolache, M. Scutariu, C. Toader, "Electric Energy Consumer Caracterisation for Developing Dedicated Market Strategies", in Proceedings of IEEE Porto Power Tech Conference, 2001. [20] G. Chicco, R. Napoli, F. Piglione, P. Postolache, M. Scutariu, C. Toader, "Options to Classify Electricity Customers", Proceedings ofMedpower Conference, Athens, 2002 [21] G. Chicco, R. Napoli, F. Piglione, P. Postolache, M. Scutariu, C. Toader, "A Review of Concepts and Techniques for Emergent Consumer Categorisation", Technology Evolution and Future European Electricity Markets, September 2002, London, UK, http://www.telmark.org/ [22] Ivan Šmon, "Oblikovanje nadomestnih obremenitvenih diagramov", diplomsko delo, Fakulteta za elektrotehniko, 2001. [23] D. Gerbec, S. Gašperič, L Šmon, F. Gubina, "Hierarchic clustering methods for consumers load profile determination" Proceedings of 2nd Balkan Power Conference, pp. 9-14, Belgrade, Yugoslavia, June, 2002. [24] H.L. Willis, T.D. Vismor, R.W. Powell, "Some Aspects of Sampling Load Curve Data on Distribution Svstems" IEEE Transactions on Power Systems, Vol. PAS-104, No. 11, November 1985. [25] M. Misiti, Y. Misiti, G. Oppenheim, J.-M. Poggi, "Wavelet Toolbox for Use With Matlab", User's Guide, Version 2, Mathworks, 2002. [26] U. Lotrič, Uporaba valčne analize in nevronskih mrež pri napovedovanju časovnih vrst, doktorska disertacija, Fakulteta za elektrotehniko v Ljubljani, april 2000. [27] J. C. Bezdek, "Pattern Recognition With Fuzzy Objective Function Algorithms", New York Plenum, New York, 1981. [28] R. N. Dave, "Characterization and detection of noise in clustering", Pattern Recognition Letters, vol 12, pp. 657-664, November 1991. [29] R. N. Dave, R. Krishnapuram, "Robust Clustering Methods: A Unified View", IEEE Transactions ofFuzzySystems, vol 5, No 2, pp. 270-293, May 1997. [30] Nikola Pavešič, "Razpoznavanje vzorcev", ZAFER, Ljubljana 1992. [31] D. L. Davies, D. W. Bouldin, "A Cluster Separation Measure", IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. PAMI-1, No. 2, April 1979. [32] A. K. Jain, P. W. Duin, J. Mao, "Statistical Pattern Recognition: A Review", IEEE Transactions on Pattern Analysis and Machine Intelligence, vol 2, No. 1, January 2000. [33] R. A. Johnson, D. W. Wicheren, "Applied Multivariate Statistical Analysis", Fifth Edition, Practice Hali, New Jersey, 2002. [34] Statistics Toolbox for Use with Matlab, User's Guide Version 4, July 2002. [35] M. Y. Kiang, " Extending the Kohonen self-organizing map networks for clustering analysis", Computational Statistics & Data Analysis, 38, pp. 161-180, 2001. [36] H. Demuth, M. Beale, "Neural Network Toolbox for Use with MATLAB", Users Guide, vesion 4, MathWorks, 2002. [37] C. H. Chen, "Fuzzy Logic and Neural Networks Handbook", IEEE Press, McGraw-Hill Companies, pp. 3.1-3.13, 1996. 48 7. Priloge PRILOGA 1: Rezultati rojenja s hierarhično metodo. PRILOGA 2: rezultati rojenja s SOM-om 49 Rezultati rojenja s hierarhično metodo 0.5 0 0 6 12 18 24 0 6 12 18 24 0 6 12 18 24 1 ,-----------m~m.-----■-----------■-----------1 1 i---------- m—m , i------■-----------1 1 0 6 12 18 24 0.5 0 6 12 18 24 0 6 12 18 24 0 6 12 18 24 0 6 12 18 24 0.5 0 6 12 18 24 0 6 12 18 24 0 6 12 18 24 o mt Njm i/ ]vQsjM m ji] v^F % ?^V**C^ tih Slika 29: Rezultati rojenja s hierarhično metodo (prvi del). 50 0.5 0 6 12 18 24 0.5 0 "iMk i v \y v U ■ i i / /J J"' ^L . \^2 ■-' r\ •^—Jj 0 6 12 18 24 0 6 12 18 24 0 1 l-----------■-----------■-----------^^ vi 1 0 6 12 18 24 O 6 12 18 24 t/h Slika 30: Rezultati rojenja s hierarhično metodo (drugi del). 12 18 24 51 Rezultati rojenja s SOM-om 0 6 12 18 24 0 6 12 18 24 0 6 12 18 24 0.5 ■ 0.5 21»^ ii e fw1 Mm /'Ji '^mK * \j\\ C =2^ J \>1 IsR*! 0.5 BfggM ' A, f flf J 1 VI »31 1 2S3 2>\ O 6 12 18 24 O 6 12 18 24 0 6 12 18 24 0.5 J/j nt vtvcCVv\ f i /k/Jl^ -—X ^f^Scp^ ~^JjTii H \ f A A* c ^££ O 6 12 18 24 O 6 12 18 24 O 6 12 18 24 0 6 12 18 24 t/h Slika 31: Rezultati rojenja s SOM-om. 52 Izjava Podpisani David Gerbec izjavljam, da sem magistrsko delo izdelal samostojno pod vodstvom mentorja prof. dr. Ferdinanda Gubine. Pomoč drugih sodelavcev sem v celoti navedel v zahvali. JkW David Gerbec