ELEKTROTEHNI ˇ SKI VESTNIK 78(3): 142–146, 2011 EXISTING SEPARATE ENGLISH EDITION Zaznavanje napak in spremljanje ˇ ciˇ sˇ cenja odpadnih voda na podlagi mehkega modela Dejan Dovˇ zan 1 , Vito Logar 2 , Nadja Hvala 3 , Igor ˇ Skrjanc 4 1;2;4 Faculty of Electrical Engineering, Trˇ zaˇ ska 25, 1000 Ljubljana 3 Inˇ stitut Joˇ zef ˇ Stefan, Jamova cesta 39, 1000 Ljubljana E-poˇ sta: 1 dejan.dovzan@fe.uni-lj.si Povzetek. V ˇ clanku je predstavljen sistem za spremljanje in zaznavanje napak na procesu ˇ cistilne naprave. Zaradi nelinearnosti procesa smo kot osnovo za sistem spremljanja uporabili mehki model, s katerim lahko zelo dobro aproksimiramo nelinearnosti procesa in se s tem izognemo nepotrebnim laˇ znim alarmom. Model je dobljen s pomoˇ cjo Gustafson-Kesselovega algoritma za rojenje. Odziv mehkega modela v normalnem obratovanju je primerjan s trenutnim dogajanjem v procesu. Na podlagi odstopanja odzivov lahko zaznamo napako. Proces v naˇ sem primeru simuliramo. Simulirane pa so tudi napake na senzorjih. Merjeni signali so: vhodna koncentracija amonijaka in koncentracija kisika v prvem aerobnem tanku ter temperatura, koncentracija kisika in amonijaka v drugem tanku. Prikazani so rezultati spremljanja procesa in odkrivanja napak na podlagi mehkega modela. Kljuˇ cne besede: mehko rojenje, graditev mehkega modela, ˇ ciˇ sˇ cenje odpadnih voda, spremljanje procesa, zaznavanje napak Monitoring and sensor fault detection in a waste-water treatment process based on a fuzzy model In this paper, monitoring and sensor fault detection in a waste- water treatment process are discussed. Monitoring is based on the Takagi-Sugeno fuzzy model of a plant process obtained by using Gustafson-Kessel fuzzy clustering algorithm.The paper also explains the principle of the Takagi-Sugeno fuzzy model. The main idea is to cope with the non-linearity of a monitored process. The output of the fuzzy-model in normal operation regime is compared with the current behavior. If the fault- detection index exceeds a certain predefined value (the fault- tolerant index), an alarm is triggered. The data treated in this paper are obtained with a simulation model of a waste- water treatment plant and by simulating sensor faults. The signals to be measured in the process monitoring are the following: influent ammonia concentration, dissolved-oxygen concentration in the first aerobic reactor tank, temperature, dissolved-oxygen concentration and ammonia concentration in the second aerobic reactor. 1 UVOD Spremljanje procesov skupaj z zaznavanjem napak in diagnozo je v zadnjem ˇ casu postalo eno popularnejˇ sih podroˇ cij procesne avtomatike. Za spremljanje procesa in odkrivanje napak se pogosto uporabljajo tehnike na podlagi modela procesa, ekspertni sistemi in sistemi za razpoznavanje vzorcev [1], [2]. Hitri senzorji in oprema za zajem podatkov nam omogoˇ cajo zajem ve- like koliˇ cine podatkov, ki nam kaˇ zejo, kaj se dogaja s procesom. Za obdelavo in analizo zajetih podatkov je bilo razvitih veliko statistiˇ cnih metod [3], [4]. S pomoˇ cjo Prejet 22. junij, 2011 Odobren 25. julij, 2011 meritev lahko ves ˇ cas spremljamo procese in zaznavamo napake ter temu primerno proˇ zimo alarme. V naˇ sem primeru obravnavamo zaznavanje napake na senzorju simuliranega procesa ˇ ciˇ sˇ cenja odpadne vode [5], [6], [7]. Ti procesi so zaradi dnevnih, meseˇ cnih in sezonskih vpli- vov izpostavljeni nenehnemu spreminjanju dinamike. Nanje vplivjo sprememba temperature, koliˇ cina padavin in razliˇ cne obremenitve naprave. Teoretiˇ cno modeliranje je pri ˇ ciˇ sˇ cenju odpadnih voda zelo zapleten postopek, katerega rezultati so dvomljivi. Zato se za spremljanje takih procesov uporabljajo statistiˇ cne metode, ki teme- ljijo na rudarjenju s podatki. ˇ Ciˇ sˇ cenje odpadnih voda je zelo nelinearen proces, zato je treba njegovo nelinearnost upoˇ stevati v modelu. Za predprocesiranje podatkov smo v naˇ sem primeru uporabili algoritem za mehko rojenje podatkov. S tem smo se izognili napaˇ cnim alarmom, ki lahko nastanejo zaradi nelinearnosti procesa (ˇ ce bi uporabili linearni model za zaznavanje), saj z mehkim modelom lahko poljubno natanˇ cno aproksimiramo neli- nearnosti. 1.1 Mehki model z Gustafson-Kesselsovim rojenjem V tem poglavju bomo opisali algoritme in metode, ki so bile uporabljene za analizo podatkov. Razloˇ zen bo Gustafson-Kesselov algoritem rojenja in izpeljan ter identificiran Takagi-Sugeno mehki model procesa ˇ ciˇ sˇ cenja odpadnih voda. 1.1.1 Gustafson-Kesselov algoritem mehkega rojenja: Gustafson-Kesselov algoritem rojenja nam omogoˇ ca, da definiramo roje razliˇ cnih oblik, kar nam pri takih procesih, kot je obravnavani, pride prav. ZAZNA V ANJE NAPAK IN SPREMLJANJE ˇ CI ˇ S ˇ CENJA ODPADNIH VODA NA PODLAGI MEHKEGA MODELA 143 Matrika vhodnih podatkov je podana kot X2R n p : (1) Vektor vhodnih podatkov v trenutku k je definiran kot x k = [x k1 ;:::;x kp ]; x k 2R p : (2) Nabor n meritev oznaˇ cimo kot X =fx k jk = 1; 2;:::;ng (3) in je predstavljen kot matrika n p: X = 2 6 6 6 4 x 11 x 12 ::: x 1p x 21 x 22 ::: x 2p . . . . . . . . . . . . x n1 x n2 ::: x np 3 7 7 7 5 : (4) Cilj rojenja je razdeliti nabor podatkov X v c pod- mnoˇ zic, ki jih imenujemo roji. Mehko razdeljen nabor podatkov X je skupek mehkih podmnoˇ zic (rojev)fA i j 1 i cg. Roji so definirani s pripadnostnimi funkci- jami, ki so implicitno vsebovane v pripadnostni matriki U = [ ik ]2 R c n . i-ta vrsta matrike U vsebuje vre- dnosti pripadnostne funkcije i-tega roja A i iz mnoˇ zice podatkov X. Matrika U izpolnjuje naslednje pogoje: pripadnostne stopnje so realna ˇ stevila iz intervala od niˇ c do ena ( ik 2 [0; 1]; 1 i c; 1 k n;), pripadnost vzorca x k k uniji rojev je ena ( P c i=1 ik = 1; 1 k n;), noben roj ni prazen oziroma ne vsebuje vseh podatkov (0< P n k=1 ik 0 ( v naˇ sem primeru end = 0:001). Inicializiramo matriko pripadnosti: U2M (nakljuˇ cno) in epoh r = 0. Zanka r =r + 1 izraˇ cun centrov rojev: v (r) i = P n k=1 (r) ik m x k P n k=1 (r) ik m ; 1 i c: (8) izraˇ cun kovarianˇ cne matrike in matrike A i : C i = P n k=1 m ik (x k v i ) (x k v i ) T P n k=1 m ik ; (9) A i = ( i det (C i )) 1=p C 1 i ; 1 i c (10) izraˇ cun razdalje vzorcev do centrov rojev d 2 ik = x k v (r) i T A i x k v (r) i ; 1 i c; 1 k n (11) osveˇ zitev matrike pripadnosti: ˇ ce jed ik > 0; (r) ik = 1 P c j=1 d ik d jk 2 m 1 (12) dokler nijjU (r) U (r 1) jj< end 1.1.3 Mehki model Takagi-Sugeno : Mehki TS- modeli aproksimirajo nelinearen sistem z interpolacijo lokalnih linearnih modelov. Vsak lokalni linearni model prispeva svoj deleˇ z k izhodu globalnega modela. ˇ Ce imamo nabor vhodnih vektorjev X = [x 1 ;x 2 ;:::;x n ] T (13) in nabor pripadajoˇ cih izhodov Y = [y 1 ;y 2 ;:::;y n ] T ; (14) 144 DOV ˇ ZAN, LOGAR, HV ALA, ˇ SKRJANC potem je mehki model podan v obliki pravil R i : R i : ˇ ce jex k izA i potem ^ y k = i (x k ); i = 1;:::;c (15) Vektor x k je vektor vhodnih podatkov, ^ y k je izhod lokalnega linearnega modela v trenutku k. Vektor x k pripada mehkim mnoˇ zicam (A 1 ;:::;A c ) z doloˇ ceno pripadnostjo Ai (x k ) oziroma ik : R! [0; 1]. Funk- cije i ( ) so lahko poljubne zvezne funkcije, ˇ ceprav so najveˇ ckrat uporabljene linearne afine funkcije. Izhod globalnega modela izraˇ cunamo po enaˇ cbi: ^ y k = P c i=1 ik i (x k ) P c i=1 ik : (16) En. (16) poenostavimo tako, da definiramo funkcijo: i (x k ) = ik P c i=1 ik ; i = 1;:::;c (17) Funkcija i (x k ) nam podaja normirano pripadnost vzorca k posameznemu roju. S tem nam pove tudi, kakˇ sna je veljavnost pravila. Vsota funkcije po rojih je ena ( P c i=1 i (x k ) = 1) ne glede na x k , ˇ ce je imenovalec i (x k ) razliˇ cen od niˇ c. To pa je lahko zagotoviti s pravilno definicijo pripadnostnih funkcij nad roji. Z zdruˇ zitvijo enaˇ cb (16) in (17) pridemo do slednje poenostavljene enaˇ cbe za izhod globalnega modela: ^ y k = c X i=1 i (x k ) i (x k ); k = 1;:::;n (18) Izhod lokalnega modela je obiˇ cajno definiran kot line- arna kombinacija elementov podatkovnega vektorja: i (x k ) =x k i ; i = 1;:::;c; T i = i1 ;:::; i(p+q) : (19) Vektor zmehˇ canih vhodov v trenutku k zapiˇ semo kot: k = [ 1 (x k )x k ;:::; c (x k )x k ]; k = 1;:::;n; (20) matriko zmehˇ canih podatkov pa kot: T = T 1 ; T 2 ;:::; T n : (21) ˇ Ce zapiˇ semo matriko koeficientov celotnega nabora pra- vil kot T = T 1 ;:::; T c ; (22) potem lahko izhod globalnega modela (En. (18)) zapiˇ semo v matriˇ cni obliki: ^ y k = k : (23) Relacija izhoda modela in vhodnih podatkov za celoten nabor zapiˇ semo kot: ^ Y = ; (24) kjer je ^ Y vektor izhodov modela ^ y k (k = 1;:::;n) ^ Y = [^ y 1 ; ^ y 2 ;:::; ^ y n ] T : (25) Mehki model, podan z enaˇ cbo En. (23), imenujemo afini model Takagi-Sugeno. S tem modelom lahko s poljubno natanˇ cnostjo aproksimiramo poljubno funkcijo [8], [9], [10]. Sploˇ snost modela lahko dokaˇ zemo s Stone- Weierstrassovim teoremom [11]. Ta pravi, da lahko vsako zvezno funkcijo aproksimiramo z razˇ siritvijo osnovnih mehkih funkcij [12]. 1.1.4 Ocena parametrov mehkega modela: Za oceno parametrov mehkega modela bo uporabljena metoda naj- manjˇ sih kvadratov. Meritve zadoˇ sˇ cajo nelinearni enaˇ cbi sistema: y i =g(x i ); i = 1;:::;n (26) Po Stone-Weierstrassevm teoremu obstaja za realno zve- zno funkcijog, definirano nad naboromU c R p , mehki sistem f tako, da je max xi2X jf(x i ) g(x i )j<; 8i; (27) kjer je> 0 poljubno majhna konstanta. Pri aproksima- ciji zveznih funkcij z mehkimi funkcijami iz razredaF p , ki so definirane z En. (23), je treba opozoriti, da manjˇ se vrednosti poveˇ cajo ˇ stevilo rojev c, da bi zadovoljili En. (27). Pri aproksimaciji funkcije z mehkim modelom je napaka med meritvami in vrednostmi izhoda mehkega modela definirana kot: e i =y i f(x i ) =y i ^ y i ; i = 1;:::;n; (28) kjer y i pomeni merjene izhode sistema, ^ y k pa izhode mehkega modela v trenutkuk. Parametre mehke funkcije ( ) dobimo z minimizacijo vsote kvadratov napak: E = n X i=1 e 2 i = = (Y ^ Y ) T (Y ^ Y ) == (Y ) T (Y ) : (29) Parameter dobimo kot parcialni odvod @E @ = 0: = T 1 T Y: 2 BIOLO ˇ SKA ˇ CISTILNA NAPRAVA ZA ˇ CI ˇ S ˇ CENJE ODPADNIH VODA Procesi ˇ ciˇ sˇ cenja odpadnih voda so veliki nelinearni sistemi, ki so izpostavljeni velikim motnjam predvsem v toku in obremenitvi. Hkrati pa se spreminja tudi sestava odpadne vode, ki pride v ˇ cistilno napravo. Za nepristran- sko primerjavo razliˇ cnih sistemov oziroma strategij vo- denja in sistemov spremljanja je bil razvit enoten simu- lacijski model. Sestoji iz petih zaporedno vezanih reak- torjev, ki se nato iztekajo v desetplastni sekundarni tank, kjer se tvorijo usedline. Model procesa, pripadajoˇ ce enaˇ cbe in podroben opis najdemo na spletni stranihttp : ==www:ensic:inpl nancy:fr=COSTWWTP=. V naˇ sem primeru smo spremljali del sistema, kjer je odpa- dana voda ˇ ciˇ sˇ cena (tanki). Shema procesa je prikazana na sliki 1. ZAZNA V ANJE NAPAK IN SPREMLJANJE ˇ CI ˇ S ˇ CENJA ODPADNIH VODA NA PODLAGI MEHKEGA MODELA 145 ANOXICTANKS AERATIONTANKS Q in Q air Q w Q out tanki Slika 1: Shema simuliranega procesa. Za izraˇ cun mehkega modela obravnavanega dela pro- cesa smo uporabili naslednje spremenljivke: koncentra- cija amonijaka v vhodnem toku v proces Q in , ki je oznaˇ cena kotC NH4Nin , koncentracija stopljenega kisika v prvem tanku C 1 O2 , koncentracija stopljenega kisika v drugem tankuC 2 O2 in koncentracija amonijaka v drugem tanku C NH4Nout . Mehki model je bil zgrajen tako, da aproksimira odvisost koncentracije amonijaka v drugem tanku od preostalih merjenih spremenljivk: C NH4Nout (k) =G C NH4Nin (k);C 1 O2 (k);C 2 O2 (k) ; (30) kjer G oznaˇ cuje nelinearno povezavo med merje- nimi spremenljivkami. Prvih 15000 vzorcev (s ˇ casom vzorˇ cenja T s = 120s) je bilo uporabljenih za gra- dnjo (identifikacijo) mehkega modela Takagi-Sugeno. Ob 17000. vzorcu zaˇ cne poˇ casi naraˇ sˇ cati napaka na senzorju, ki je odpravljena ob 18000. vzorcu. Senzor za merjenje koncentracije amonijaka v drugem tanku C NH4Nout se je torej pokvaril. K nominalnemu signalu senzorja smo dodali eksponentni signal za simulacijo napake. Celoten set meritev je prikazan na sliki 2. 0 0.5 1 1.5 2 2.5 3 x 10 4 0 50 100 Sample C NH4N in 0 0.5 1 1.5 2 2.5 3 x 10 4 0 5 10 Sample C 1 O 2 0 0.5 1 1.5 2 2.5 3 x 10 4 0 5 10 Sample C 2 O 2 0 0.5 1 1.5 2 2.5 3 x 10 4 0 5 10 Sample C NH4N out Slika 2: Celoten nabor meritev. Koncentracija amonijaka v pritoku v sistemCNH4N in , koncentracija kisika v prvem tanku C 1 O 2 ter koncentracija kisika C 2 O 2 in amonijaka CNH4N out v drugem tanku. Mehki model smo zgradili na prvih 15000 vzorcih. Izhod mehkega modela ^ C NH4Nout in izhod procesa C NH4Nout sta prikazana na sliki 3. Indeks za detekcijo 0 5000 10000 15000 0 1 2 3 4 5 6 7 8 9 10 Sample C (-), C (--) NH4Nout NH4Nout Slika 3: Verifikacija mehkega modela, kjer je ^ CNH4N out izhod modela, CNH4N out pa izhod procesa. napake je definiran kot: f = C NH4Nout ^ C NH4Nout ^ C NH4Nout ! 2 : (31) Ko indeks detekcije preseˇ ze indeks tolerance napake, se sproˇ zi alarm. Indeks tolerance je defeniran kot najveˇ cji indeks napake, pomnoˇ zen s konstanto: f tol = maxf. Najveˇ cji indeks napake smo zaznali pri uˇ cenju modela na podatkih, kjer ni bilo simulirane napake. V naˇ sem primeru smo pomnoˇ zili maksimalno vrednost indeksa napake s konstanto = 1; 5. To pomeni, da smo za toleranˇ cni indeks dobili vrednost f tol = 0; 15. Slika 4 prikazuje toleranˇ cni indeks, indeks detekcije napake in signal za alarm. Napako, ki nastane pri vzorcu 17000, je predlagani sistem za spremljanje procesa detektiral pri 17556. vzorcu. Detekcija napake je zakasnjena, kar je pri napakah, ki naraˇ sˇ cajo poˇ casi obiˇ cajno. 0 0.5 1 1.5 2 2.5 3 x 10 4 0 0.2 0.4 0.6 0.8 1 Sample f, f tol 0 0.5 1 1.5 2 2.5 3 x 10 4 0 0.5 1 1.5 2 Sample fault (--), fault detected (-) Slika 4: Indeks detekcije napake, toleranˇ cni indeksf tol dejan- ska in detektirana napaka. 146 DOV ˇ ZAN, LOGAR, HV ALA, ˇ SKRJANC 3 SKLEP V ˇ clanku smo obravnavali detekcijo napake na sen- zorju in spremljanje ˇ ciˇ sˇ cenja odpadnih voda. Sistem za detekcijo je bil realiziran z mehkim modelom Takagi- Sugeno. Model smo identificirali s pomoˇ cjo Gustafson- Kesslovega algorita rojenja, parametri pa so bili dobljeni s pomoˇ cjo najmanjˇ sih kvadratov. Razvit sistem je bil te- stiran na modelu procesa, kjer je bila simulirana napaka na enem od senzorjev. Za gradnjo mehkega modela smo uporabili naslednje meritve: vhodno koncentracijo amo- nijaka in koncentracijo kisika v prvem tanku ter tempe- raturo, koncentracijo kisika in koncentracijo amonijaka v drugem. Zaradi narave napake, simulirane na senzorju koncentracije amonijaka na drugem tanku, je bila le-ta detektirana brez laˇ znih alarmov in z majhno zakasni- tvijo. Glede na to, da je dinamika sistema izpostavljena spreminjanju zaradi razliˇ cnih obremenitev, padavin itd., bomo poskuˇ sali sistem za detekcijo napake implemen- tirati z rekruzivno mehko identifikacijo, ki bo sposobna prilagajati dinamiko sistema tem spremambam, hkrati pa bo sistem sposoben detektirati tudi napake. LITERATURA [1] Chen, J., Liao, C. M., “Dynamic process fault monitoring based on neural network and PCA”. Jour. of Process Control, vol. 12, pp. 277–289, 2002. [2] Klanˇ car, G., D. Juriˇ cic, R. Karba., “Robust fault detection based on compensation of the modelling error”. International journal of Systems Science, vol. 33, no. 2, pp. 97–105, 2002. [3] Johnson, R. A., Wichern, D. W., Applied Multivariate Statistical Analysis, Prentice-Hall, New Jersey, 1992. [4] Daszykowski, M., Walczak, B., Massart, D. L., “Projection me- thods in chemistry”. Chemometrics and Intelligent Laboratory Systems, vol. 65, pp. 97–112, 2003. [5] Vreˇ cko, D., Hvala, N., Kocijan, J., Zec, M. “System analysis for optimal control of a wastewater treatment benchmark”. Water sci. technol., vol. 43, pp. 199–206, 2001. [6] Vreˇ cko, D., Hvala, N., Kocijan, J., “Wastewater treatment bench- mark : What can be achieved with simple control?”. Water sci. technol., vol. 45, pp. 127–134, 2002. [7] Hvala, N., Vreˇ cko, D., Burica, O., Straˇ zar, M., Levstek, M., “Si- mulation study supporting wastewater treatment plant upgrading”. Water sci. technol., vol. 46, pp. 325–332, 2002. [8] Kosko, B., “Fuzzy Systems as Universal Approximators”, IEEE Transactions on Computers, vol. 43, no. 11, pp. 1329–1333, 1994. [9] Ying, H. GC., “Necessary conditions for some typical fuzzy systems as universal approximators”, Automatica, vol. 33, pp. 1333–1338, 1997. [10] Wang, L.-X., Mendel, J. M., “Fuzzy basis functions, univer- sal approximation, and orthogonal least-squares learning”, IEEE Trans. Neural Networks, vol. 3, no. 5, pp. 807–814, 1992. [11] Goldberg, R. R., Methods of Real Analysis, John Wiley and Sons, 1976. [12] Lin, C-H., “Siso nonlinear system identification using a fuzzy- neural hybrid system”, Int. Jour. of Neural Systems, vol. 8, no. 3, pp. 325–337, 1997. Dejan Dovˇ zan je diplomiral leta 2008 na Fakulteti za elektrotehniko. Trenutno je zaposlen kot mladi raziskovalec v laboratoriju Laboratorij za modeliranje simulacijo in vodenje na Fakulteti za elektrotehniko. Njegovo raziskovalno podroˇ cje obsega adaptivno mehko vodenje, pre- diktivno vodenje, mehke modele, detekcijo napak s pomoˇ cjo mehkih modelov in rekurzivno mehko identifikacijo. Vito Logar je diplomiral leta 2004 in doktoriral leta 2009 na Fakulteti za elektrotehniko v Ljubljani. Podroˇ cje njegovega raziskovanja zajema napredno analizo EKG signalov in modeliranje industrijskih procesov. Trenutno dela na procesu elektriˇ cne obloˇ cne peˇ ci in optimizaciji stroˇ skov njenega delovanja. Nadja Hvala je diplomirala leta 1985, magistrirala leta 1988 in doktorirala leta 1992, vse na Fakulteti za elektrotehniko Univerze v Ljubljani. Kot znanstvena sodelavka je zaposlena na Institutu Joˇ zef Stefan v Ljubljani. Ukvarja se z modeliranjem, simulacijo, optimiza- cijo in naˇ crtovanjem vodenja kemijskih in biokemijskih procesov. Igor ˇ Skrjanc je diplomiral leta 1988, magistriral leta 1991 in dok- toriral leta 1996 na Fakulteti za elektrotehnik v Ljubljani. Njegovo raziskovalno podroˇ cje obsega adaptivne, mehke in mehke adaptivne re- gulacijske sisteme. Leta 2007 je prejel V odovnikovo nagrado, leta 2008 Zoisovo nagrado Republike Slovenije za doseˇ zke na raziskovalnem podroˇ cju pametnega vodenja. Za obdobje med 2009 in 2011 je prejel Humboldtovo ˇ stipendijo za izkuˇ sene raziskovalce za raziskovalno delo na Univerzi v Siegenu.