Nevronske mreže vs. regresijski modeli - napovedovanje povpraševanja na treh vrstah dobrin Anton Zidar1, Roberto Biloslavo2 1Bo bovo 3.a, 3240 Šmarj e pri Jelšah, Slove nij a, info.amc @siol.net 2Univerza na Primorskem, Fakulteta za management, Cankarjeva 5, 6000 Koper, Sloveni- a, roberto.biloslavo@guest.arnes.si Nevronske mreže so relativno mlado razvijajoče področje, ki se kažejo kot zmogljivo orodje za reševanje raznovrstnih prob -lemov iz različnih področij. Zato so tudi zanimive za reševanje problemov na področju managementa. Ta raziskava odgovarja na primeru treh dobrin na vprašanje: Ali se (usmerjena) nevronska mreža kaže kot boljša metoda za napovedovanje (prodaje prehrambenih dobrin) kot tradicionalna regresijska metoda? Ob ome- itvah vzorčenja so rezultati pokazali, da je regresijska metoda začela konkurirati nevronski metodi, ko je regresijski model dosegel visoko po- asnjeno varianco. Pri niž- i po- asnjeni varianci je bila nevronska mreža bistveno boljša. To ugotovitev so dodatno podkrepili rezultati ocenjevalnih metod in tudi ugo -tovitve nekaterih sorodnih raziskav. Ključne besede: nevronske mreže, regresijski modeli, napovedovanje prodaje 1 Uvod Nevronske mreže so relativno mlado razvijajoče področje, uporabiti jih je možno za reševanje raznovrstnih problemov iz različnih področij. Sofisticiranost nevronskih mrež je v tem, da posnemajo princip delovanja bioloških možganov. Na začetku jih je potrebno primerno naučiti, nato jih je možno uporabljati kot orodje za reševanje takšne vrste problemov kot so bile poprej naučene. Zato so tudi zanimive za reševanje raznovrstnih poslovnih problemov. V poslovnem okolju se tržniki, managerji in ekonomisti pogosto srečujejo s problematiko napovedovanja prihodnjih pojavov. Ti pojavi so lahko dinamični, ki se pojavljajo v odvisnosti od časa, ali statični, ki se pojavljajo kot vzrok in posledica. Za napovedovanje pojavov so se razvile razne metode, ki imajo določene prednosti in slabosti. To pomeni, da lahko z različnimi metodami oblikujemo razne napovedovalne modele, ki zasledujejo enake cilje in se modelirajo na enakih podatkih. Vendar je potrebno razumeti, da so takšni načini napovedovanja le ocene. Med napovedanim in doseženim običajno prihaja do razlik ali odmikov (deviacij, diferenc). Ti odmiki so lahko relativno majhni ali veliki, to pa nam pove, koliko so metode oziroma napovedovalni modeli kakovostni pri napovedovanju. Vendar je ta kakovost napovedovanja tudi odvisna od kvalitete opredeljenih pojasnjevalnih dejavnikov (števila neodvisnih spremenljivk) in kvalitete podatkov. Ob tem pa je tudi pomembna pojasnjevalna moč metode, ki pojasni delova- nje modela, in možnosti optimizacije pri modeliranju modela. Zato je pomembno, katera metoda se bo izbrala za modeliranje napovedovalnega modela, ki bo nato kot orodje v pomoč na primer tržnikom, managerjem in ekonomistom. Glede na to, da so nevronske mreže novejše orodje, smo se odločili, da te preverimo oziroma jih primerjamo s tradicionalno regresijsko metodo v kontekstu kakovosti napovedovanja povpraševanja na trgu prehrambenih dobrin. Raziskavo smo izvedli na realnih podatkih treh dobrin in preučili kakšne so prednosti in slabosti uporabe nevronskih mrež. Za regresij-sko metodo kot primerjalno metodo smo se odločili, ker je ta v družboslovju razširjena in primerna za pojasnjevanje social-no-ekonomskih pojavov (Košmelj, 2005). Z vidika vertikalne delitve dela v gospodarstvu predstavlja trgovina na drobno (kjer je bila izvedena pričujoča raziskava) pomemben člen, saj je na eni strani neposredno vpeta na (končni) potrošniški trg in na drugi strani med proi-zvajalce-predelovalce-pridelovalce (prehrambenih) dobrin. Kar pomeni, da trgovina s svojim napovedovanjem povpraševanja vpliva na lastno in ravno tako na uspešnost v celotni oskrbovalni verigi. Ob tem pa se lahko pojavijo razni odkloni med ponudbo in povpraševanjem. Vse to kaže, da so potrebe po kakovostnih (novih) metodah za napovedovanje še kako dobrodošle ali potrebne. Iz tega razloga smo oblikovali naslednje raziskovalno vprašanje: Ali se (usmerjena) nevronska mreža (perceptron) kaže kot boljša metoda za napovedovanje kot regresijska metoda v smislu kakovosti napovedano-doseženo? V ta namen smo še oblikovali dve hipotezi, ki ju ponazarja obrazec (1). ^o ■ ^regresija nevronska mreža H ■ F >F 1 ' regresija nevronska mreža (1) Prva hipoteza (Hq), t. i. ničelna hipoteza, predpostavlja, da ima napovedovalni model, ki temelji na regresijskem modelu, v povprečju (E) manjšo ali enako napako kot napovedovalni model, ki temelji na nevronski mreži. Druga hipoteza (Hj) predpostavlja, da ima napovedovalni model, ki temelji na regresijskem modelu, v povprečju (E ) večjo napako kot napovedovalni model, ki temelji na nevronski mreži. V nadaljevanju bomo najprej predstavili predpostavke in omejitve raziskave, potek raziskave, metode dela, kakšna je bistvena razlika med nevronskim in regresijskim modeliranjem modelov. Nato bomo predstavili vzorčenje in vzorce ter ugotovitve analiziranja podatkov (vzorcev) oziroma kateri dejavniki so pomembni za modeliranje modelov. Temu sledi predstavitev nevronskega in regresijskega modeliranja ter kateri modeli so se izkazali kot najbolj primerni za testiranje in evalvacijo. Za tem še predstavimo rezultate testiranja in evalvacije na izbranih modelih, predstavimo razpravni del ter v zaključnem delu predstavimo sklepne ugotovitve raziskave. 2 Predpostavke in omejitve raziskave V raziskavi smo se omejili na napovedovanje količinske prodaje, torej ne na vrednost prodaje (prihodek). Omejili smo se na dve metodi napovedovanja, to je z usmerjeno nevronsko mrežo (perceptron) in regresijsko metodo, vendar z večjim poudarkom na nevronski mreži kot novejši metodi. Ob tem tudi posebej ne izpostavljamo področja predvidevanje in napovedovanje. V raziskavi se ne ukvarjamo z matematično argumentacijo, zakaj je katera metoda boljša. Odločili smo se, da bomo nevronsko mrežo preveriti le na realnih podatkih oziroma na dobrinah, ki se prodajajo končnim potrošnikom (široka potrošnja). Ker so to podatki, ki jih (iz poslovnih razlogov) trgovska podjetja varujejo, torej so težje dostopni, smo lahko pridobili le tri primere dobrin iz njihove podatkovne baze. Iz slednjega razloga je kredibilnost raziskave z vidika posploševanja omejena, saj smo preverjanje nevronske mreže v primerjavi z regresijskim modelom opravili na treh primerih dobrin, kar je premajhen vzorec za posploševanje. Da bi lahko kredibilno odgovorili na takšne vrste vprašanj je potrebno razpolagati z večjim številom raziskav oziroma z večjim vzorcem. Zato smo interpretacijsko moč v tej raziskavi izboljšali s povzemanjem ugotovitev iz sorodnih raziskav. Za pregled raziskav na tem področju smo za vir uporabili razne baze podatkov, ki so na razpolago v spletnem omrežju. Zanimali so nas članki, ki opisujejo uporabo nevronskih mrež za napovedovanje na področju managementa, trženja oziroma marketinga in ekonomije. Prispevek te raziskave je predvsem v tem , da nakazuje na uporabnost nevronske mreže v trženju oziroma napovedovanju prodaje in tako prispeva svoj delež na področju raziskovanja nevronskih mrež kot takih. 3 Potek raziskave Potek raziskave smo razdelili na sedem faz, kot to ponazarja slika 1, kjer smo glede na namen raziskave oblikovali in dosegli naslednje cilje. Prvič, v okviru vzorčenja smo izbrali tri primere dobrin iz različnih panog za preverjanje napovedovanja prodaje z nevronsko mrežo in regresijsko metodo ter na tej osnovi opredelili dejavnike, ki vplivajo na prodajo izbranih dobrin. Drugič, za vsako posamezno dobrino smo izdelali nevronski in regresijski model za napovedovanje prodaje ter jih nato testirali in evalvirali z vidika kakovosti napovedovanja. Tretjič, pridobljene rezultate modeliranih napovedovalnih modelov smo primerjali in na teh temeljih podali sklepne ugotovitve raziskave. 4 Metode dela Za doseganje prvega cilja, kjer je bilo potrebno opraviti vzorčenje ter podatke obdelati in pripraviti, smo za vir podatkov izbrali trgovsko podjetje (t. i. sekundarni vir podatkov), saj takšna podjetja običajno razpolagajo z velikim številom raznovrstnih dobrin iz različnih panog. Pri tem smo uporabili metodo razvrščanja dobrin po vrednosti in količini prodaje kot medsebojni produkt (količina krat vrednost), kjer smo izbrali tri dobrine, ki so bile razvrščene najvišje po vrednosti produkta in iz različnih panog. Za vsako posamezno izbrano dobrino smo opredelili dva vzorca podatkov. Prvi vzorec smo namenili za modeliranje in drugi vzorec za testiranje in evalvacijo kakovosti napovedovanja prodaje. Pri tem se je vzorec za modeli- Slika 1: Potek raziskave ranje opredelil kot zgodovinsko starejši od vzorca za testiranje in evalvacijo. Na ta način smo dosegli, da se je testiranje napovedovalnih modelov postavilo v časovno dimenzijo, kot da bi jih resnično uporabljali v praksi za napovedovanje prodaje v podjetju, kar daje dodaten pomen tej raziskavi. Časovna dimenzija vzorca za modeliranje napovedovalnih modelov je obsegala dve leti in ravno tako za testiranje in evalvacijo kakovosti napovedovalnih modelov. Dejavnike, ki vplivajo na prodajo izbranih dobrin, smo ugotavljali z metodami statističnega analiziranja. Pridobljene podatke smo obdelali in pripravili ter analizirali s programskim orodjem Excel in SPSS. Za doseganje drugega cilja, to je modeliranje napovedovalnih modelov, smo uporabili metodo usmerjene nevronske mreže (perceptron), kjer smo uporabili metodo prečnega vrednotenja za optimizacijo in algoritem vzvratnega razširjanja napake (angl. backpropagation) ter metodo skaliranja vhodnih podatkov. Pri tem smo uporabili programsko opremo MATLAB. Na drugi strani pa smo uporabili metodo multiva-riantne regresijske analize v okviru programske opreme SPSS. Za evalvacijo kakovosti napovedovanja smo uporabili naslednje metode: srednja absolutna odstotna napaka (MAPE), srednja absolutna napaka (MAD), srednja kvadratna napaka (MSE), srednja odstotna napaka (MPE), korelacijski koeficient (r) v smislu doseženo-napovedano ter delež storjenih napak na dejanski obseg. Za ugotavljanje, katera metoda se kaže kot boljša pri napovedovanju, smo uporabili opredeljeni hipotezi, kateri smo preverili na empiričnih podatkih z metodo statističnega sklepanja pri 5-odstotni stopnji tveganja (a=0,05) s pomočjo programskega paketa SPSS. 5 Nevronske mreže in regresijski modeli Glede na to, da smo v tej raziskavi uporabili (zvezno) usmerjeno (večplastno) nevronsko mrežo, ki jo je možno uporabiti tudi za napovedovanje (aproksimiranje raznih funkcij), je potrebno nadaljnje besedilo razumeti predvsem v tem kontekstu. Na tem mestu bi še izpostavili, da smo regresijsko metodo na kratko opisali v smislu bistvenih prednosti in slabosti, saj je literature na to tematiko relativno veliko. Avtorji, kot na primer Jesenko (2007), Ljubič (2008), Košmelj, (2005), Arte- njak (2003), regresijsko metodo podrobno opišejo, predstavijo poleg ostalih metod. Nevronske mreže (angl. neural network) so grajene iz gradnikov, ki se imenujejo (umetni) nevroni in so podobno grajeni kot biološki nevroni (slika 3). Osnovni elementi biološkega nevrona (celica) so telo celice, dendriti in akson. Na koncu aksona so sinapse, ki se povezujejo z drugimi nevroni preko dendritov. Dendriti imajo vlogo, da sprejemajo od drugih nevronov preko sinaps vhodne signale, ki jih pošiljajo v jedro nevrona. Če je vsota teh signalov dovolj velika, bo nevron generiral impulz, ki se bo prenašal preko aksona, sinaps in dendritov do drugih nevronov. Če vsota signalov ni dovolj velika je nevron v mirovanju, torej ne generira impulza oziroma celica se ne »vžge« in po aksonu se ne prenaša impulz (Guid et al., 2007; Potočnik, 2007). Opisan proces je analogen procesu umetnega nevrona, ki je opredeljen z matematičnim modelom. Nevroni v nevronski mreži so lahko med seboj povezani na različne načine, kar se opredeljuje s topologijo (arhitekturo) mreže. Vendar so ti v usmerjeni nevronski mreži povezani tako, da so izhodi nevronov iz prve plasti povezani na vhode nevronov v drugi plasti in tako naprej, kot to ponazarja slika 4, kjer so usmerjene nevronske mreže predstavljene kot eno-, dvo-, tro-plastne oziroma večplastne mreže (nevroni so ponazorjeni s črnimi krogi, plasti pa z vertikalnimi razvrstitvami nevronov). Ob tem je potrebno razumeti, da ni nujno, da so vsi izhodi nevronov povezani v naslednjo plast z vsemi vhodi nevronov (SAS, MatLab). Nevronske mreže imajo lastnost, da so se sposobne učiti oziroma se naučiti vhodne podatke povezovati z izhodnimi podatki. Učijo se na osnovi učnih primerov, ki jih imenujemo učni vzorci. Učni vzorci so pari vhodnih in izhodnih vzorcev. Naučeno znanje nevronska mreža shranjuje v povezavah (sinapsah), kar tudi imenujemo kot uteži med nevroni. V procesu učenja se te uteži v celotni nevronski mreži spreminjajo na takšen način in s takšno težnjo, da bi se doseglo optimalno stanje uteži v celotni nevronski mreži. Nevronska mreža je v takšnem stanju sposobna oziroma ima primerno znanje za posploševanje (t. i. generalizacija), kar pomeni, da je sposobna povezati neznani vhodni vzorec s pravilnim ali želenim izhodnim vzorcem. To pa ima tudi aplikativno vrednost. Slabost nevronske mreže se kaže predvsem v tem, da nima pojasnjevalne moči, ker deluje kot črna škatla (angl. black box) v katero pošljemo podatke in na izhodu dobimo biološki nevron Slika 2: Zgradba biološkega nevrona in umetnega nevrona umetni nevron enoplastna dvo/večplastna tro/večplastna Slika 3: Ponazoritev arhitekture/topologije primerov usmerjene nevronske mreže neke rezultate, kot to ponazarja slika 5. Leva stran slike ponazarja delovanje »black box« tehnike, kjer v t. i. črno škatlo pošljemo preko določenega števila vhodnih spremenljivk podatke in na drugi strani iz nje dobimo preko izhodnih spremenljivk neke rezultate. Desna stran slike pa ponazarja skrito topologijo (arhitekturo) kot primer usmerjene nevronske mreže z definicijskim nizom (8-4-3). Slika oziroma definicijski niz ponazarja usmerjeno nevronsko mrežo z osmimi vhodi (kot neodvisne spremenljivke X1, X2 ... X8), štirimi nevroni v prvi plasti in tremi nevroni v izhodni plasti oziroma s tremi izhodi (kot odvisne spremenljivke Y1, Y2, Y3) Slika 5 tudi ponazarja dva načina delovanja nevronske mreže. Prvi način je učni - v tem načinu nevronsko mrežo učimo tako (modeliramo nevronski model), da ji na vhodu predstavljamo podatke in hkrati na izhodu pravilne (ali želene) rezultate in s pomočjo izbrane učne metode na ta način prilagajamo uteži v notranjosti mreže preko iteracij oziroma epoh učenja. Drugi način je delovni (uporabniški), ko nevronsko mrežo uporabljamo - torej vanjo pošljemo določene vhodne podatke in nevronska mreža na osnovi predhodno pridobljenega znanja na izhodu predstavi nek rezultat. To pomeni, da so rezultati nevronske mreže tudi odvisni od kvalitete učnih vzorcev in kvalitete učenja, kar je analogno človekovemu učenju. Kot naslednja slabost nevronske mreže je ta, da ni pravil, ki bi omogočala nastavitev parametrov za optimalno modeliranje nevronskega modela (učenje), ampak smo pri tem bolj prepuščeni lastni iznajdljivosti in izkušnjam. Zaradi tega se lahko zgodi, da ne dosežemo globalnega minimuma oziroma ne dosežemo vsaj primerno bližino, kar pomeni nekakovostno ali nepredvidljivo delovanje nevronskega modela. Zahteva se tudi določen čas, če se modelirajo bolj kompleksni nevronski modeli zaradi dolgotrajnega procesa učenja, vendar to ne velja pri uporabi nevronskega modela-orodja. Priporočljiva oziroma potrebna je predobdelava podatkov (skaliranje), ker nevronska mreža deluje na intervalu [0, 1] ali [-1, 1], kar je odvisno od izbranih prenosnih funkcij. Prednost nevronske mreže se odraža predvsem v tem, da je sposobna reševati probleme, ko ne poznamo ali nimamo vseh pojasnjevalnih dejavnikov - takšne vrste problemov je na področju družboslovja (managementa, ekonomije, trženja^) veliko. So »robustne« oziroma odporne na napake (šume) v podatkih ali na pomanjkljive podatke, saj znajo kljub temu na izhodu pravilno napovedovati, v kolikor je mreža pravilno optimizirana oziroma naučena. Regresijska metoda je namenjena za modeliranje modelov s katerimi je možno pojasnjevati pojave, ki so lahko dinamični v odvisnosti od časa ali statični kot vzrok in posledica. Prednost regresijske metode je v tem, da je postopek za modeliranje modelov standardiziran, izračunati je možno optimalni model z metodo najmanjših kvadratov, kakovosti parametrov modela je možno oceniti s statističnimi metodami, raziskovalcu omogoča rezultate modela (enostavno) pojasniti črna škatla - »black box« Slika 4: Ponazoritev nevronske mreže kot »black box« tehnike ponazoritev notranjega mehanizma Tabela 1: Podatki o vzorčenju oz. vzorci za modeliranje in testiranje Vzorec za modeliranje Vzorec za testiranje Izbrana dobrina (2001-2002) (2003-2004) Dobrina pivo n=730 n=719 Dobrina mleko n=728 n=716 Dobrina kruh n=730 n=731 Opomba: simbol n pomeni število zapisov v datoteki oz. statističnih enot v vzorcu. (pojasnjevalna moč). Slabost metode pa je predvsem v tem, da je neuporabna, če nima na razpolago dovolj kakovostnih pojasnjevalnih dejavnikov (Košmelj, 2005). Na osnovi proučevane literature o nevronskih mrežah lahko zaključimo, da je bistvena razlika med modeliranjem z nevronsko in regresijsko metodo predvsem naslednja. Nevronski modeli se oblikujejo po principu učenja z učnimi primeri iz učne množice, regresijski modeli pa po principu vzorčne statistične množice z enkratnim dokončnim izračunom. Kar pomeni, da se pri nevronskem napovedovalnem modelu v procesu modeliranja z iteracijami in s preračunavanjem išče optimalni model. Pri regresijskem napovedovalnem modelu pa se v procesu modeliranja izračuna optimalni model z metodo najmanjših kvadratov. 6 Vzorčenje Vzorčenje treh dobrin smo izvedli na podatkovni bazi, ki vsebuje vse transakcije glede prodaje dobrin končnim odjemalcem (široka potrošnja) na geografskem območju Celja za obdobje 2001-2002. Na osnovi opredeljene metode smo izbrali tri dobrine iz različnih panog. Te so pivo, mleko in kruh. Za vsako posamezno dobrino smo pripravili dve vrsti vzorcev (tabela 1). Prvi vzorec smo namenili za modeliranje napovedovalnih modelov, ki obsega obdobje prodaje 2001-2002. Drugi vzorec pa smo namenili za testiranje in evalvacijo napovedovalnih modelov, ki obsega obdobje prodaje 2003-2004. Glede na značilnost dobrine pivo, da je to pijača, ki se je običajno v poletnih mesecih proda več oziroma ob določenih vremenskih razmerah več ali manj, smo še dodali podatke o vremenu, kot verjetni vplivni dejavnik v modelu. Za vir podatkov o vremenu smo uporabili Meteorološke letopise za obdobje 2001-2004, ki jih izdaja Ministrstvo za okolje in prostor oziroma Agencija RS za okolje. 7 Analiza podatkov oz. opredelitev dejavnikov in nastavkov za modeliranje V okviru deskriptivne analize smo za vsako posamezno dobrino opravili analizo podatkov na vzorcu za modeliranje 2001-2002 na enoten način za vse tri dobrine. Najprej smo opravili analizo dinamike prodaje (povpraševanja) na osnovi grafikonov (stolpčni, linijski, razsevni). Temu je sledila analiza frekvenčne porazdelitve dnevnih prodaj s histogramom, analiza nekaterih statističnih parametrov, analize razvrščanja enot v skupine in korelacijska analiza. Ugotovili smo, da imajo izbrane tri dobrine nekatere skupne dejavnike, ki bi naj vplivali na obseg povpraševanja (tabela 3), kot so: dan v tednu, prazniki v letu, letni čas (kvar-tal, mesec), višina cena in drugi nepoznani dejavniki. Na obseg povpraševanja po dobrini pivo bi še naj dodatno vplivali štirje tedni v letu (18., 26., 44. in 50.), dva dneva v mesecu (1. in Tabela 2: Opredeljeni dejavniki za vse tri dobrine (pivo, mleko, kruh) Vplivni dejavniki pivo Dobrina mleko kruh 1. dan v tednu (pon., tor. ... ned.) x x x 2. praznik v letu x x x 3. letni čas (kvartal oz. mesec v letu) x x x 4. višina cene x x x 5. temperatura zraka x 6. dva dneva v mesecu (1. in 15.) oz. izplačilo pokojnine, plače x 7. pet dni v mesecu (1., 9., 15., 26. in zadnji v mesecu) »plus-minus« x 8. štirje tedni v letu (18., 26., 44. in 50.) x 9. štirje tedni v letu (26., 37., 44. in 52.) x 10. štirje tedni v letu (6., 18., 44. in 52.) x 11. drugi nepoznani dejavniki x x x 15.) in temperatura zraka. Na obseg povpraševanja po dobrini mleko bi še naj dodatno vplivali štirje tedni v letu (26., 37., 44. in 52.) in pet dni v mesecu (1., 9., 15., 26. in zadnji v mesecu) s kakšnim dnevom zamika v plus ali minus. Na obseg povpraševanja po dobrini kruh pa bi še naj dodatno vplivali štirje tedni v letu (6., 18., 44. in 52.). Pri vseh treh dobrinah je tudi prisoten padajoč trend. Ker vplivni dejavniki kažejo odvisnost prodaje od časovne dimenzije, smo v ta namen opredelili koncepte v smislu pojasnjevanja gibanja tedenskih period, sezonskih vplivov ali letnih period in nekaterih posameznih dni v letu. Iz tega razloga smo dimenzije vzorcev umetno razširili tako, da smo upoštevali tri načine pojasnjevanja. Prvi način je binaren, drugi polinomski in tretji hibriden - slednji je kombinacija binarnega in poli-nomskega načina. Na osnovi opredeljenih dejavnikov in konceptov smo za vsako posamezno dobrino izpeljali tri variacije nastavkov napovedovalnih modelov in jih poimenovali na naslednji način. Napovedovalni model za dobrino pivo smo poimenovali kot »Model P«, za dobrino mleko kot »Model M« in za dobrino kruh kot »Model K«, kjer smo na koncu naziva še dodali številko variacije modela. Opredeljeni nastavki napovedovalnih modelov so naslednji: ■ Model P1, M1 in K1 (prvi nastavek modela) ima značilnost, da pojasnjuje sezonskost in tedenske periode z binarnimi spremenljivkami. ■ Model P2, M2 in K2 (drugi nastavek modela) ima značilnost, da pojasnjuje sezonskost in tedenske periode s poli-nomskimi spremenljivkami. ■ Model P3, M3 in K3 (tretji nastavek modela) ima značilnost, da pojasnjuje sezonskost in tedenske periode na hibriden način, to je z binarnimi in polinomskimi spremenljivkami. 8 Modeliranje napovedovalnih modelov V procesu modeliranja smo najprej opredelili načelo modeliranja, da regresija narekuje izbor nastavka modela za modeliranje z nevronsko mrežo. To pomeni, da smo najprej z regre-sijsko analizo opredelili najboljši regresijski napovedovalnim model in na tej osnovi privzeli nastavek napovedovalnega modela za modeliranje z nevronsko mrežo (iz razloga, ker smo v hipotezi predpostavljali, da je v osnovi regresijska metoda boljša ali vsaj enaka, torej to kar zna regresijska metoda najbolje »narediti«, naj nevronska mreža »dokaže«, da je pri tem boljša). 8.1 Modeliranje z regresijo Na osnovi opredeljenih nastavkov in spremenljivk za dobrino pivo, mleko in kruh smo s pomočjo programskega paketa SpSs opravili regresijsko modeliranje napovedovalnih modelov za vse tri dobrine. Pri modeliranju se je uporabil splošni multivariantni regresijski zapis modela, ki ga ponazarja obrazec (2), kateri je osnova za modeliranje za vse tri dobrine oziroma ocenjeni multivariantni regresijski model kot ga ponazarja obrazec (3). r, =« +ßi +ß 2 X2,, +... +ß kXk t + e t (2) (3) V procesu modeliranja napovedovalnih modelov smo za vsako posamezno dobrino uporabili pripadajoči vzorec za modeliranje 2001-2002 in na teh vzorcih za vsako dobrino modelirali po šest regresijskih modelov (skupaj 18 regresij-skih modelov). Med izdelanimi modeli za vsako posamezno dobrini ni bilo bistvenih odstopanj oziroma so ta bila relativno majhna. Kar pomeni, da so vsi trije načini (binaren, polinomski, hibridni) primerni za pojasnjevanje sezonskosti in tedenske periode. Kljub temu se je pri vseh treh dobrinah izkazalo, da je bolj primeren koncept, ki temelji na binarnem pojasnjevanju sezonskosti in tedenske periode. Regresijske modele smo operacionalizirani na ravni F-statistike in t-statistike pri 5-odstotni stopnji tveganja (a=0,05). Za dobrino pivo se je na prvo mesto uvrstil Model P1 glede na pojasnjeno varianco ali t. i. determinacijski koeficient (R2). Model P1 na osnovi vzorca podatkov pojasni 74-odstot-kov variance (R2=0,739) oziroma model pojasni 74-odstotkov prodaje dobrine pivo (tabela 5). Razlika glede na pojasnjeno varianco v odstotnih točkah med prvim in zadnjim modelom je 1,1 odstotne točke. količina = + Q,943*količinaTrend365 - 9,246*marec + 16,6Q8*junij + 8,627*november + 14,252*december + 8,622*petek + 38,936*sobota + 87,668* nedelja + 1Q4,387*praznik - Q,3Q9*cena + 1,7Q7*temperatura + 9,842* prejemek (4) Ocenjeno regresijsko funkcijo, ki jo ponazarja obrazec (4), sestavlja dvanajst dejavnikov (neodvisne spremenljivke). Ti so povprečna količina dnevne prodaje za preteklih 365 dni (količinaTrend365); ali je dnevna prodaja v mesecu marec, Tabela 3: Rezultati modeliranja z regresijsko metodo Naziv modela r2 F Sig. Model P1 (pivo) 0,739 173,162 0,000 Model M1 (mleko) 0,516 44,117 0,000 Model K1 (kruh) 0,901 602,212 0,000 junij, november, december; ali je dnevna prodaje na dan petek, sobota, nedelja; ali je dnevna prodaja na dan praznik; cena dobrine; dnevna temperatura zraka in ali je na dan dnevne prodaje izplačilo pokojnin oziroma plač (prejemek). Za dobrino mleko se je na prvo mesto uvrstil Model M1 glede na pojasnjeno varianco (tabela 5). Modela M1 na osnovi vzorca podatkov pojasni 52-odstotkov variance (^^=0,516) oziroma model pojasni 52-odstotkov prodaje dobrine mleko. Glede na pojasnjeno varianco je razlika med prvim in zadnjim modelom za 1,6 odstotne točke. Kot je razvidno je model po kakovosti slab in ni primeren za uporabo. Kljub temu da smo poskušali identificirati dodatne dejavnike, nam teh ni uspelo odkriti. Vendar glede na namen te raziskave je to ravno pravi izziv za nevronsko mrežo, da se lahko »dokaže«, da je ta boljša, ko na vhodu nima dovolj pojasnjevalnih dejavnikov, torej bo prisoten šum. količina = + 211,121 - 4,493*količinaTrend365 + 5,203*januar + 4,698*februar + 3,988*marec + 3,184*april + 3,807*avgust + 5,445*september + 8,334*teden26 + 18,164*teden37 + 8,434*teden41 + 7,720*teden44 - 2,351*sreda + 6,330*sobota + 22,104*nedelja + 24,837*praznik + 4,847*dan9 + 4,307*dan16 - 0,604*cena (5) Ocenjeno regresijsko funkcijo ponazarja obrazec (5) z osemnajstimi dejavniki. Ti so povprečna količina dnevne prodaje za preteklih 365 dni (količinaTrend365); ali je dnevna prodaja v mesecu januar, februar, marec, april, avgust, september; ali je dnevna prodaja v 26., 37., 41., 44. tednu (teden26, teden37, teden41, teden44); ali je dnevna prodaje na dan sreda, sobota, nedelja; ali je dnevna prodaja na dan praznik; ali je dnevna prodaja na 9., 16. v mesecu (dan9, dan16) in cena dobrine. Za dobrino kruh se je na prvo mesto uvrstil Model K1 glede na pojasnjeno varianco (tabela 5). Modela K1 na osnovi vzorca podatkov pojasni 90-odstotkov variance (^2=0,901) oziroma model pojasni 90-odstotkov prodaje dobrine kruh. Med modelom na prvem in zadnjem mestu glede na pojasnjeno varianco je razlike le za 0,7 odstotne točke. Za model lahko trdimo, da ima visoko pojasnjevalno moč in da je kakovosten. količina = + 24,583 + 0,965*količinaTrend365 + 5,331*maj + 4,953*junij - 46,323*ponedeljek - 46,307*torek - 47,066*sreda - 47,367*četrtek - 46,489*petek - 28,555*sobota + 39,257*nedelja + 117,095*praznik (6) Ocenjeno regresijsko funkcijo, ki jo ponazarja obrazec (6), sestavlja enajst dejavnikov. Ti so povprečna količina dnevne prodaje za preteklih 365 dni (količinaTrend365); ali je dnevna prodaja v mesecu maju, juniju; ali je dnevna prodaje na dan ponedeljek, torek, sreda, četrtek, petek, sobota, nedelja in ali je dnevna prodaja na dan praznik. 8.2 Modeliranje z nevronsko mrežo Na osnovi izbranih modelov v okviru modeliranja z regresij-sko analizo smo za modeliranje z nevronsko mrežo privzeli naslednje nastavke modelov. Za dobrino pivo se je privzel nastavek Model P1, za dobrino mleko Model M1 in za dobrino kruh Model K1. Vsi izbrani modeli temeljijo na binarnem pojasnjevanju sezonskosti in tedenske periode. Na tem mestu je potrebno izpostaviti, da med regresijskim in nevronskim modelom prihaja do razlik med številom vhodnih spremenljivk, saj so se modeli v procesu regresijskega modeliranja operacionalizirali in se je na ta način zmanjšalo število neodvisnih spremenljivk v modelu. Za nevronske modele pa smo uporabili prvotno oblikovane nastavke (osnovno izhodišče). Za vse nevronske modele smo uporabili sigmoidne prenosne funkcije (oz. logistične funkcije, kot tip sigmoidne funkcije) razen na izhodu, kjer smo uporabili linearno prenosno funkcijo, saj ta omogoča neposredno napovedovanje količinske prodaje za dobrino. Začetne vrednosti uteži (sinapse) v nevronski mreži smo določali naključno. Glede na uporabljeno metodo (prečno vrednotenje) za optimiziranje nevronskega napovedovalnega modela smo oblikovati tri podvzorce (učni, validacijski in testni). Za validacijski vzorec smo naključno izbrali 130 (datumskih) enot iz vzorca za modeliranje (2001-2002), kar predstavlja 17,8-odstotka celotnega vzorca za modeliranje. Za testni vzorec smo naključno izbrali 70 enot iz vzorca za modeliranje, vendar pod pogoje, da se je predhodno zmanjšal za validacijski podvzorec, kar predstavlja 9,6-odstotka celotnega vzorca za modeliranje. Razliko (ostanek) smo namenili za podvzorec za učenje v obsegu 530 enot, kar predstavlja 72,6-odstotka celotnega vzorca za modeliranje. Opredeljeni način smo uporabili za vse tri dobrine. Vhodne podatke v nevronsko mrežo smo skalirali na interval [0,1] za vsako posamezno dobrino z enačbo (7), vendar smo pri tem korigirali maksimalne in minimalne vrednosti za 20-odstotkov oziroma vrednosti smiselno prilagodili. Razlog za korekcijo je v nepoznani prihodnji dinamiki nekaterih spremenljivk, kot je gibanje razpona trenda količinske prodaje za preteklih 365 dni, cene in temperature. skaliranoj JC ^JC _ dejansko,! min v —Y max -^min (7) Pri modeliranju smo uporabili naslednje načelo za vse tri dobrine. Glede na uporabo dvoplastne usmerjene nevronske mreže in enega izhodnega nevrona smo število nevronov v prvi plasti postopoma povečevali od enega nevrona naprej do 2, 3, 4, 5, 10, 24, 50, 100 in do 300 nevronov. Pri modeliranju smo začetne uteži večkrat spremenili in ravno tako smo spreminjali parameter hitrosti učenja iz razloga, da bi dosegli najbolj primerno točko blizu globalnega minimuma oziroma da ne bi obtičali v kakšnem lokalnem minimumu ali kotanji. Za vsako posamezno dobrino smo izdelali po deset nevronskih napovedovalnih modelov (skupaj 30 nevronskih modelov) in na tej osnovi izbrali najbolj primerne (tabela 6) glede na dosežen najnižji MSE. Za dobrino pivo smo izbrali model, ki ga sestavlja 24 vhodnih spremenljivk, štirje nevroni v prvi plasti in eden Tabela 4: Parametri in rezultati modeliranja z nevronsko mrežo Nastavitveni parametri za modeliranje Rezultati modeliranja Topologija Ciljna Max. Št. Skal- nevronske Št. Hitrost napaka št. Vali- izvr. Naziv modela iranje mreže epoh učenja MSE napak dacija Test epoh MSE r Model P1 (dobrina pivo) da 24-4-1 20000 0,001 0 5 da da 2917 486,581 0,87894 Model M1 (dobrina mleko) da 28-3-1 20000 0,001 0 5 da da 13298 87,1336 0,75311 Model K1 (dobrina kruh) da 21-5-1 20000 0,001 0 5 da da 5505 125,004 0,95016 nevron na izhodu. Model je dosegel najnižji MSE, ki je 486,581, in najboljši korelacijski koeficient (r), ki je 0,87594) med dejanskim in napovedanim. Za dobrino mleko smo izbrali model, ki ga sestavlja 28 vhodnih spremenljivk, trije nevrone v prvi plasti in eden nevron na izhodu. Model je dosegel najnižji MSE, ki je 87,1336, in najboljši korelacijski koeficient, ki je 0,75311. Za dobrino kruh smo izbrali model, ki ga sestavlja 21 vhodnih spremenljivk, pet nevronov v prvi plasti in eden nevron na izhodu. Model je dosegel najnižji MSE, ki je 125,004, čeprav korelacijski koeficient, ki je 0,95016, ni bil med najboljšimi, vendar je ta razlika relativno majhna. 9 Rezultati testiranja in evalvacije Testiranje izbranih napovedovalnih modelov smo opravili na vzorcih za testiranje, ki obsegajo podatke za obdobje 2003-2004. Izbrane napovedovalne modele (tako nevronski kot regresijski) smo testirali in evalvirali za celotno obdobje 2003-2004 in za vsako posamezno leto. Vzorce za testiranje smo dopolnili in pripravili v skladu z izbranimi in opredeljenimi strukturami vhodnih podatkov v regresijske in nevronske napovedovalne modele. Skratka umetno smo dodali nekatere potrebne spremenljivke za pojasnjevanje sezonskosti, tedenske periode, nekaterih tednov v letu in dni v mesecu ter praznikov v letu. Za evalvacijo modelov smo uporabili opredeljene metode, kot smo jih na začetku navedli. 9.1 Statistično preverjanje hipotez Glede na opredeljeni hipotezi smo povprečne napake (E) za regresijske oziroma nevronske modele izračunali po enačbi (8), kjer pomeni simbol d dejansko ali dosežena količino prodane dobrine, simbol y pa napovedano količino prodane dobrine z modelom, simbol t časovno enoto napovedi (sta- tistično enoto vzorca) in simbol n časovno obdobje (celotna velikost vzorca). 1 ^ m -Vbeg.,) oz. -J» (8) Preverjanje hipotez smo opravili tako, da smo storjene napake po regresijskem in nevronskem modelu med seboj odšteli (po pravilu regresijske napake minus nevronske napake), kar pomeni naslednje (tabela 8): ■ če je razlika nič, imata modela v povprečju enako napako, zato se ničelna hipoteza ne more zavrniti, ■ če je razlika negativna, ima v povprečju nevronski model večjo napako kot regresijski model, zato se ničelna hipoteza ne more zavrniti, ■ če je razlika pozitivna, ima v povprečju nevronski model manjšo napako kot regresijski model, zato se ničelna hipoteza zavrne in sprejme alternativna hipoteza. S pomočjo programskega orodja SPSS smo opravili t. i. preizkus dvojic (angl. Paired samples T test) in dobili naslednje rezultate. Za dobrino pivo (Model P1) je povprečna dnevna napaka po regresijskem modelu 20 kosov piva in po nevronskem modelu 7 kosov piva. Preizkus dvojic je pokazal pozitivno razliko, ki se nahaja na pozitivnem intervalu med 12 in 14 kosov piva, povprečna razlika je 13 kosov piva. Na podlagi vzorčnih podatkov se zavrne ničelna hipoteza pri zanemarljivi stopnji tveganja (t=20,950; Sig.=0,000) in sprejme sklep, da je povprečna napaka regresijskega napovedovalnega modela večja od povprečne napake nevronskega modela. Za dobrino mleko (Model M1) je povprečna dnevna napaka po regresijskem modelu -26 kosov mleka in po nevronskem modelu -4 kose mleka. Preizkus dvojic je pokazal negativno razliko, ki se nahaja na negativnem intervalu med -23 in -21 Tabela 5 Pravila glede sklepa o hipotezah Razlika napake Sklep o hipotezi Ereg =0 ničelna hipoteza (H0) se ne zavrne EREG <0 ničelna hipoteza (H0) se ne zavrne ^REG -E« >0 ničelna hipoteza (H0) se zavrne in se sprejme alternativna hipoteza (H1) Tabela 6: Rezultati za sklep o uporabi nevronske metode za dobrino pivo (Model P1) Obdobje 2003-2004 (n=731) Obdobje 2003 (n=365) Obdobje 2004 (n=366) Regre- Sklep o Regre- Sklep o Regre- Sklep o Ocenjevalni sijski Nevron. nevron. sijski Nevron. nevron. sijski Nevron. nevron. parametri model model modelu model model modelu model model modelu MAD 26 18 boljši 24 18 boljši 27 18 boljši MSE 997 692 boljši 959 726 boljši 1035 659 boljši MAPE 49% 36% boljši 44% 34% boljši 55% 38% boljši MPE 40% -9% boljši 31% -8% boljši 49% -9% boljši r 0,8211 0,8032 slabši 0,8054 0,8077 boljši 0,8447 0,7992 slabši Napaka-delež 33% 11% boljši 26% 9% boljši 40% 13% boljši kosov mleka, povprečna razlika je -22 kosov mleka. Na podlagi vzorčnih podatkov se zavrne ničelna hipoteza pri zanemarljivi stopnji tveganja (t=-49,288; Sig.=0,000) in sprejme sklep, da je povprečna napaka regresijskega napovedovalnega modela večja od povprečne napake nevronskega modela. Za dobrino kruh (Model K1) je povprečna dnevna napaka po regresijskem modelu -2 kosa kruha in po nevronskem modelu -6 kosov kruha. Preizkus dvojic je pokazal pozitivno razliko, ki se nahaja na pozitivnem intervalu med 4 in 5 kosov kruha, povprečna razlika je 5 kosov kruha. Na podlagi vzorčnih podatkov se ne zavrne ničelna hipoteza, saj bi bilo tveganje preveliko (t=12,637; Sig.=0,000). Sprejme se sklep, da je povprečna napaka regresijskega napovedovalnega modela manjša od povprečne napake nevronskega modela. Rezultati ocenjevalnih metod Za dobrino pivo (Model P1) smo z ocenjevalnimi metodami ugotovili (tabela 10), da je nevronski model dosegel slabšo oceno le v primeru korelacijskega koeficienta za obdobje 2003-2004 z relativno majhno razliko in za obdobje 2004. Po vseh ostalih ocenjevalnih metodah je nevronski model dosegel boljše ocene, predvsem za obdobje 2003. Načeloma sta oba modela dosegla slabše ocene za obdobje 2004 v primerjavi z obdobjem 2003. Za dobrino mleko smo ugotovili (tabela 12), da je nevronski model za vsako opredeljeno obdobje (2003-2004, 2003 in 2004) dosegel po vseh ocenjevalnih metodah boljše ocene. Oba modela sta v obdobju 2003 načeloma dosegla boljše ocene glede na obdobje 2004. Za dobrino kruh smo ugotovili (tabela 14), da je nevronski model za obdobje 2003-2004 dosegel slabši oceni z vidika MPE in deleža storjenih napak, enako velja tudi za obdobje 2003. Za obdobje 2004 je nevronski model dosegel slabše ocene z vidika MAPE, MPE in deleža strojenih napak. Oba modela sta za obdobje 2003 načeloma dosegla boljše ocene glede na obdobje 2004. 10 Razprava V tem delu bomo izpostavili predvsem naslednje vidike: 1. kakovost napovedovanja z vidika premajhnega števila pojasnjevalnih dejavnikov oziroma problem identificiranja kakovostnih pojasnjevalnih dejavnikov za modeliranje modelov (konvergenca oz. divergenca metod), 2. pojasnjevalna moč, 3. možnost optimizacije modela v procesu modeliranja in 4. kdaj je smiselno uporabiti nevronsko mrežo oziroma regresijo. 10.1 Kakovost napovedovanja in konvergenca oz. divergenca med metodama Z vidika kakovosti napovedovanja smo ugotovili, da se je nevronska mreža v primeru nizke pojasnjene variance z regresijskim modelom (Model M1, R2=0,516) izkazala kot bistveno boljša (tabela 16 in slika 7). Regresijski model se je izkazal kot (»konkurenčen«) boljši od nevronskega mode- Tabela 7: Rezultati za sklep o uporabi nevronske metode za dobrino mleko (Model M1) Obdobje 2003-2004 (n=731) Obdobje 2003 (n=365) Obdobje 2004 (n=366) Regre- Sklep o Regre- Sklep o Regre- Sklep o Ocenjevalni sijski Nevron. nevron. sijski Nevron. nevron. sijski Nevron. nevron. parametri model model modelu model model modelu model model modelu MAD 26 7 boljši 14 7 boljši 38 7 boljši MSE 914 79 boljši 290 78 boljši 1537 81 boljši MAPE 412% 94% boljši 132% 51% boljši 690% 136% boljši MPE -411% -82% boljši -130% -35% boljši -690% -129% boljši r 0,2671 0,6471 boljši 0,5667 0,6565 boljši 0,6086 0,6280 boljši Napaka-delež -200% -29% boljši -88% -15% boljši -362% -50% boljši Tabela 8: Rezultati za sklep o uporabi nevronske metode za dobrino kruh (Model K1) Obdobje 2003-2004 (n=731) Obdobje 2003 (n=365) Obdobje 2004 (n=366) Regre- Sklep o Regre- Sklep o Regre- Sklep o Ocenjevalni sijski Nevron. nevron. sijski Nevron. nevron. sijski Nevron. nevron. parametri model model modelu model model modelu model model modelu MAD 11 9 boljši 10 8 boljši 11 10 boljši MSE 393 235 boljši 314 209 boljši 472 262 boljši MAPE 22% 21% boljši 19% 15% boljši 24% 28% slabši MPE 4% -16% slabši 3% -7% slabši 5% -24% slabši r 0,9035 0,9138 boljši 0,9146 0,9245 boljši 0,8978 0,9105 boljši Napaka-delež -4% -14% slabši -3% -9% slabši -5% -21% slabši la šele v primeru, ko je dosegel visoko pojasnjeno varianco (Model K1, R2=0,901). Ta ugotovitev kaže na »brezpogojno« uporabo nevronske metode, dokler regresijski determinacijski koeficient (R2) ne doseže določne vrednosti (kritična točka), kar z drugimi besedami pomeni, da bi šele od te vrednosti naprej nevronske mreže dobile »konkurenco« glede kakovosti napovedovanja. Linijski grafikon (slika 7) to ugotovitev zelo nazorno ponazarja. Vendar se takšne trditve ne da posploševati na osnovi treh primerov dobrin, kar kaže na potrebo po dodatnih raziskavah, s katerimi bi se ugotovilo, ali se nevronska mreža pri napovedovanju praviloma vedno kaže kot boljša, če je pojasnjena varianca z regresijskim modelom nizka in če, kje je ta meja determinacijskega koeficienta. V tej raziskavi se kaže, da se vrednost determinacijskega koeficienta (kritična točka) nahaja nekje na intervalu med 0,80 in 0,90. Na osnovi podatkov smo še izračunali razlike napak v odstotnih točkah (tabela 16) in rezultate predstavili z linijskim grafikonom (slika 9). Linijski grafikon ponazarja potek konvergence oziroma divergence med nevronskim in regresijskim modelom (metodama) glede na R2. Na grafu je tudi aproksimirana polinomska funkcija druge stopnje (kvadratna funkcija), ki jo ponazarja enačba (9) z determinacijskim koeficientom ena (R2=1). Izračun je pokazala, da se kritična točka nahaja okoli 81-odstotkov pojasnjene variance z regresijskim modelom. y =12,224x' - 22,023x +9,8191 (9) Kaže se, da bi to lahko bila konvergenčna krivulja med nevronskim in regresijskim modelom, čeprav je za takšno trditev premalo argumentiranih dokazov, zato to izpostavljamo kot izziv (smer) za nadaljnje raziskovanje. Z vidika kakovosti napovedovanja še gre na tem mestu izpostaviti razlog za statistično značilno slabšo oceno nevronskega modela za dobrino kruh, katerega je domnevno možno iskati med regresijsko in nevronsko metodo za izračun optimalnega napovedovalnega modela. Regresijski optimalni napovedovalni model, kot smo že povedali, se izračuna enkratno in dokončno z metodo najmanjših kvadratov, kar pomeni najnižji možni minimum napake. Ob predpostavki, da imajo vse neodvisne spremenljivke visoko pojasnjevalno moč za odvisno spremenljivko, kot je to v primeru dobrine kruh, je pričakovati z enkratnim dokončnim izračunom majhne razlike (napake) med dejanskim in napovedanim. Nevronski optimalni napovedovalni model se ne izračuna dokončno in enkratno, ampak se izračunava z iteracijami in s postopnim pomikanjem (parameter: hitrost učenja) proti globalnemu minimumu napake (MSE), kar lahko pomeni, da nevronski model ni dosegel (vsaj primerne bližine) globalnega minimuma. Na osnovi predhodnih ugotovitev je razvidno, da se je nevronska mreža v pogojih, ko je imela na vhodu nepopolne informacije oziroma premalo pojasnjevalnih dejavnikov (dobrina mleko), kljub temu izkazala pri napovedovanju kot bistveno boljša od regresijskega modela. Ta ugotovitev o nepopolnosti vhodnih podatkov v nevronsko mrežo in o pravilnih napovedih na izhodu nevronske mreže je tudi skladna s teorijo o nevronskih mrežah, da so odporne na napake (šume) in tudi na okvare v sinaptičnih utežeh (Guid et al., 2007). Z vidika kakovosti napovedovanja in ugotovitev te raziskave je tudi možno sklepati o primernosti ali meji časovnega obdobja napovedovanja, ki se kaže kot enoletno časovno obdobje (2003), kar tudi pomeni, da bi bilo potrebno napovedovalne modele za vsako leto ponovno modelirati za naslednje leto. Ta ugotovitev je tudi skladna s teoretičnimi priporočili glede napovedovanja, da kakovost napovedovanja pada s Tabela 9: Kakovost (napake) napovedovalnih modelov in R2 za obdobje 2QQ3-2QQ4 Napovedovalni model R2 Regresija (delež napake) Nevronska mreža (delež napake) Razlika v odstotnih točkah Model M1 (dobrina mleko) 0,516 200% 29% 171 Model P1 (dobrina pivo) 0,739 33% 11% 22 Model K1 (dobrina kruh) 0,901 4% 14% -10 5nn% -I- -^regi-esija 2uu% -»-nevronska mreža 175% mleko 150% 125% >~ 100% 75% 50% 25% 0,3 0,4 0,5 0,6 Pojasnjena varianca z regresijo - R ^ Slika 5: Primerjava R2 in napak (kakovosti) regresijskega in nevronskega modela Vir: tabela 9. ■♦—Razlika v odstotnih točkah --Poly. (Razlika v odstotnih točkah) 140% 0,3 0,4 0,5 0,6 0,7 Pojasnjena varianca z regresijo - R ^ Slika 6: Krivulja konvergence med nevronskim in regresijskim modelom Vir: tabela 9. povečevanjem časovnega obdobja v prihodnost in obratno (Artenjak, 2003). Ugotavljamo, da je nevronska mreža bolj kakovostna pri napovedovanju kot regresijska metoda, ko ni na razpolago dovolj kakovostnih pojasnjevalnih dejavnikov oziroma vhodnih podatkov v napovedovalni model in da je ob tem bolj primerno izbrati enoletno obdobje napovedovanja. 10.2 Pojasnjevalna moč Z vidika primerjave pojasnjevalne moči med nevronsko in regresijsko metodo obstaja bistvena razlika. Nevronska meto- da ne razpolaga s kakršnokoli pojasnjevalno močjo (Guid et al., 2007), ker se obnaša kot »black box«, kot smo že povedali, kar se smatra kot velika slabost. Predvsem iz razloga, če se v procesu modeliranja ni izoblikoval optimalni model, kar pomeni, da se lahko model zelo nepredvidljivo obnaša in je zato praktično neuporaben. Regresijski model ima jasno in enostavno pojasnjevalno moč, saj lahko iz vsakega posameznega dejavnika v modelu (neodvisne spremenljivke) pojasnimo vpliv (v tem primeru) na napoved (odvisna spremenljivka), kot je to razvidno iz obrazcev (4), (5) in (6). Tega pa ni možno storiti z vidika nevronskega napovedovalnega modela. 10.3 Optimizacija modela Regresijska metoda razpolaga s standardiziranim postopkom za ocenjevanje regresijskega modela v procesu modeliranja s statističnimi metodami. Na ta način dobimo informacije, katere dejavnike v modelu je potrebno odstraniti, da bi model bil optimalen ali kaj je potrebno v modelu izboljšati (Jesenko, 2007). Nevronska mreža ne razpolaga s podobnim postopkom oziroma ga ni, zato smo prepuščeni lastni intuiciji, izkušnjam (problem subjektivnosti). Za optimizacijo modelov sicer obstaja t. i. gradientna metoda, ki se uporablja v procesu učenja (modeliranje), ki pa zahteva »ročne« nastavitve parametrov za oblikovanje optimalnega modela, vendar to nam ne daje informacij, kaj je potrebno v modelu izboljšati. Predvsem pa gre za problem pravilne nastavitve parametra hitrosti učenja, ki je povezan z gradientno metodo glede doseganja (vsaj primerne bližine) globalnega minimuma. V raziskavi smo na to težavo naleteli, ko smo izvajali razne variacije učenja. Zgodilo se je, da smo obtičali v lokalnem minimumu (kotanji) in bili relativno zelo oddaljeni od globalnega minimuma. Zato ocenjujemo, da je to velika slabost nevronske mreže z vidika optimizacije v procesu modeliranja nevronskega modela. 10.4 Kdaj katero metodo uporabiti Dilema kot je, kdaj katero metodo uporabiti (nevronsko ali regresijsko), kaj narediti v primeru, ko se oba modela izkaže-ta kot enakovredna glede kakovosti rezultatov, v ta namen je predvsem smiselno izpostaviti in upoštevati naslednje: ■ pojasnjevalna moč nevronske in regresijske metode, ker nevronska mreža kot metoda nima pojasnjevalne moči (Guid et al., 2007), kar pa regresijska metoda ima (Koš-melj, 2005), ■ kakovost rezultatov nevronske in regresijske metode, ker je nevronska mreža manj občutljive na napake (Guid et al., 2007), kar pa običajno ne velja za regresijski model. Na osnovi teh opredelitev in v povezavi s stopnjo pomena za določen problem, se je možno odločati, katero metodo bi bilo bolj primerno izbrati. Če se potrebuje samo kakovost rezultatov, potem se lahko izbere nevronska metoda. Če se potrebuje pojasnjevalna moč, potem nevronske metode že v osnovi ni možno izbrati, zato se izbere regresijska metoda. Če se potrebuje kakovost rezultatov in pojasnjevalna moč, ravno tako ni možno izbrati nevronske metode. Če sta nevronski in regresijski model enakovredna glede kakovosti rezultatov, potem se lahko upošteva pomembnost glede na odpornost na napake (šum) in pojasnjevalno moč. 10.5 Sorodne raziskave Z vidika primerjave s sorodnimi raziskavami nismo uspeli najti vsebinsko enake raziskave, kjer bi se primerjali nevronska in multivarianta linearna regresijska metoda v smislu napovedovanja prehrambenih dobrin. Obstajajo pa raziskave v smislu napovedovanja in podobno z nevronsko mrežo kot na primer napovedovanje porabe električne energije, časovnih vrst ipd. Iz tega razloga ni možno opraviti neposredne primerjave z drugimi raziskavami, ampak le ugotovitve in jih na splošni ravni primerjati. Do sorodnih ugotovitev so prišli med drugim tudi Hill et al. (1996), Hansen in Nelson (2003), Klemenc (2005), Šmigic (2006), Chakraborty et al. (1992), Andresia de Oliveira et al. (2000), Panda et al. (2007), Weatherford et al. (2003), Zou et al. (2007), Zhang (2003), West et al. (1997), Darbellay in Slama (2000), Law (2000). Te podobne ugotovitve avtorjev dodatno podkrepijo ugotovitve naše raziskave, da so nevronske mreže boljše z vidika kakovosti napovedovanja. 10.6 Zakaj se nevronske mreže kažejo kot boljše pri napovedovanju V okviru te raziskave ugotavljamo, da so nevronske mreže boljše in bolj kakovostne pri napovedovanju kot regresijska metoda. Ob tem se zastavlja vprašanje, zakaj se nevronske mreže kažejo kot boljše pri napovedovanju? Tega seveda ni možno enostavno pojasniti, saj bi bilo za to potrebno opraviti poglobljeno matematično razpravo, kar pa bi presegalo okvir tako zasnovane raziskave in na katero smo se tudi omejili. Vendar pa je kljub temu možno obrazložiti bistvene razlike na splošni ravni kot sledi. Nevronski in regresijski napovedovalni modeli v tej raziskavi se med seboj zelo razlikujejo v samih strukturah in v načinu gradnje teh struktur (modeliranje modelov). Torej fokus je, kakšna je končna nevronska in regresijska struktura modela ali strukturna gostota modela. Če primerjamo enačbe, ki gradijo te modele, se lahko opazi, da ima regresijska enačba bistveno manj členov kot nevronska enačba. Pri tem je možno regresijske koeficiente pogojno enačiti s sinaptičnimi utežmi. Torej je možno sklepati, da je znanje v regresijskem modelu zapisano v regresijskih koeficientih, tako kot je pri nevronski mreži zapisano v sinaptičnih utežeh. To pomeni, da regresijski model glede na svojo strukturo vsebuje bistveno manj »porazdeljenega znanja« za napovedovanje ali »sinaptičnih uteži« kot pa nevronska mreža. Za regresijske modele je značilno, če dodajamo dodatne člene (dejavnike) v model, da tudi dosegamo večjo pojasnjeno varianco. Vendar običajno pri tem težimo k operacionalizaciji regresijskega modela, da s tem tudi dobimo enostavno pojasnjevalno moč. Tega pa običajno pri nevronski metodi ne počnemo na tako očiten način ali se celo ne zavedamo, kolikšne količine členov ustvarjamo (v enačbi) pri opredeljevanju arhitekture nevronske mreže oziroma nevronskega modela. Iz tega vidika celo ni presenetljivo, da se nevronske mreže kažejo kot boljše pri napovedovanju od regresije. Ravno tako je lahko ob tem bolj razumljivo, zakaj so nevronske mreže odporne na napake ali na nepopolne vhodne podatke in kljub temu »znajo« na izhodu napovedati pravilne rezultate. Skratka bistvene razlika je v gostoti strukture med regresijskim in nevronskim napovedovalnim modelom. 11 Sklep Na osnovi teoretičnega proučevanja smo že ugotovili, kakšne so prednosti in slabosti nevronskih mrež, nekatere smo spoz- nali tudi v tej raziskavi, zato jih lahko samo dodatno potrdimo in te so predvsem naslednje. Prednost nevronskih mreže se kaže v tem, da imajo lastnost delovanja v slabših pogoji, ko ni na razpolago dovolj (identificiranih) kakovostnih pojasnjevalnih dejavnikov (primer dobrine mleko) in da so odporne na napake v podatkih, torej so »robustne«. Slabosti nevronske mreže pa se kaže v tem, da nimajo pojasnjevalne moči, ker delujejo kot črne škatle (t. i. »black box« tehnika), kamor se pošljejo podatki in na izhodu dobijo neki rezultati, ki se jih ne da pojasniti. Ni pravil, ki bi omogočala nastavitev parametrov za optimalno modeliranje nevronskega modela, ampak smo pri tem bolj prepuščeni lastni iznajdljivosti in izkušnjam (problem subjektivnosti). Zaradi tega se lahko zgodi, da se v procesu modeliranja ne doseže (vsaj bližine) globalnega minimuma, kar pomeni nekakovostno ali nepredvidljivo delovanje nevronskega modela. Torej, na osnovi te raziskave smo ugotovili, da se je nevronska mreža kot metoda za napovedovanje količinske prodaje v dveh primerih (pivo, mleko) statistično značilno pokazala kot boljša in v enem primeru kot slabša glede na regresijsko metodo. Nevronska mreža se je izkazala kot slabša pri napovedovanju količinske prodaje za dobrino kruh. Vendar sta oba modela dosegla visoke ocene ocenjevalnih metod in relativno nizko statistično značilno razliko, saj oba modela z napovedovanjem konvergirata proti dejanski prodaji, zato so tudi razlike napak za oba napovedovalna modela manjše. Z vidika ocenjevalnih metod (MAD, MSE, MAPE, MPE, korelacijski koeficient, napaka-delež) smo ugotovili, da je nevronska mreža kot metoda za napovedovanje količinske prodaje dosegla očitno več boljših ocen kot regresijska metoda in še predvsem, če predpostavljamo enoletno obdobje napovedovanja. Ob upoštevanju vseh predhodno navedenih omejitev raziskave lahko s sprejemljivo mero gotovosti zaključimo, da se (usmerjena) nevronska mreža kaže kot boljša metoda za napovedovanje kot regresijska metoda v smislu kakovosti napovedano - doseženo (z vidika tržnega povpraševanja), kar pa hkrati tudi pomeni pogoj, če lahko zanemarimo pojasnjevalno moč, torej da pri napovedovanju ne potrebujemo pojasnjevalne moči. Pri tem je potrebno ponovno poudariti, da se ta zaključek nanaša na to raziskavo in sorodne raziskave (Hill et al., 1996; Hansen in Nelson, 2003; Klemenc, 2005; Šmigic, 2006; Chakraborty et al., 1992; Andresia de Oliveira et al., 2000; Panda et al., 2007; Weatherford et al., 2003; Zou et al., 2007; Zhang, 2003; West et al., 1997; Darbellay in Slama, 2000; Law, 2000). Z vidika napovedovanja tržnega povpraševanja, načrtovanja poslovanja podjetja na izbranih treh primerih dobrin bi izbira nevronske metode v povprečju povzročila manjše odmike med načrtovanim (cilj) in doseženim (rezultat) kot regresij-ska metoda, kar posledično tudi pomeni, da bi bili načrtovani celostni predračuni bližje dejanskemu poslovanju, kar bi se tudi odražalo v večji kakovosti po raznih ekonomskih kategorijah, kot so zaloge, obveznosti, denarna sredstva ipd., ki so v bilanci stanja, poslovnega izida in finančnega izida. Vendar pri tem ne bi imeli možnosti pojasnjevanja. Skratka tržnik, ekonomist in manager se lahko glede smiselnosti uporabe nevronske mreže odloča na osnovi pomembnosti: pojasnjevalne moči in kakovosti napovedovanja, ki se tudi navezuje na možnosti kakovostnega identificiranja pojasnjevalnih dejavnikov. 12 Literatura Andresia de Oliveira, K., Vannucci, Ä. & Cesar da Silva, E. (2000). Using artificial neural networks to forecast chaotic time series, Physica A: Statistical Mechanics and its Applications, 284, (1-4): 393-404. Artenjak, J. (2003). Poslovna statistika. Maribor: Ekonomsko-po-slovna fakulteta. Chakraborty, K., Mehrotra, K., Mohan, C. K. & Ranka, S. (1992). Forecasting the behavior of multivariate time series using neural networks, Neural Networks, 5 (6): 961-970. Darbellay, G. A. & Slama, M. (2000). Forecasting the short-term demand for electricity: Do neural networks stand a better chance?, International Journal of Forecasting, 16, (1): 71-83. Guid, N. & Strnad, D. (2007). Umetna inteligenca. Maribor: Fakulteta za elektrotehniko, računalništvo in informatiko. Hansen, J. V. & Nelson, R. D. (2003). Forecasting and recombining time-series components by using neural networks, Journal of the Operational Research Society, 54 (3): 307-317. Hill, T., O'Connor, M. & Remus, W. (1996). Neural Network Models for Time Series Forecasts, Management Science, 42 (7): 1082-1092. Jesenko, J. (2007). Multivariatne statistične metode. Kranj: Moderna organizacija. Klemenc, J. (2005). Uporaba metod rudarjenja podatkov za analizo nepremičninskih transakcij v Republiki Sloveniji in izgradnjo modela za tržno vrednotenje nepremičnin. Magistrsko delo, Ekonomska fakulteta v Ljubljani. Košmelj, B. (2005). Analiza odvisnosti za vzorčne podatke. Ljubljana: Ekonomska fakulteta. Law, R. (2000). Back-propagation learning in improving the accuracy of neural network-based tourism demand forecasting, Tourism Management, 21 (4): 331-340. Ljubič, T. 2008. Predvidevanje in napovedovanje v oskrbovalni verigi. Kranj: Moderna organizacija. MatLab, Neural Network Toolbox™ 6 User's Guide, dosegljivo na: http ://www. mathworks.com/ access/helpdesk/help/ pdf_doc/ nnet/ nnet.pdf (10.2.2009). Panda, C., & Narasimhan, V. (2007). Forecasting exchange rate better with artificial neural network, Journal of Policy Modeling, 29, (2): 227-236. Potočnik, B. (2007). Osnove razpoznavanja vzorcev z nevronskimi mrežami. Maribor: Fakulteta za elektrotehniko, računalništvo in informatiko. Russell, S. J. & Norvig, P. (1995). Artificial intelligence: A modern approach. New Jersey: Prentice Hall. SAS, Neural Networks and Statistical Models, dosegljivo na: http:// sasenterpriseminer.com/documents/Neural%20Networks%20 and%20Statistical%20Models.pdf. Šmigic, D. (2006). Uporaba strojnega učenja pri analizi vrednostnih papirjev. Magistrsko delo, Ekonomska fakulteta v Ljubljani. Weatherford, L. R., Gentry, T. W. & Wilamowski, B. (2003). Neural network forecasting for airlines: A comparative analysis, Jour nal of Revenue & Pricing Management 1: 319-331. West, P. M., Brockett, P. L. & Golden, L. L. (1997). A Comparative Analysis of Neural Networks and Statistical Methods for Predicting Consumer Choice, Marketing Science, 16 (4): 370-391. Zhang, G. P. (2003). Time series forecasting using a hybrid ARIMA and neural network model, Neurocomputing, 50: 159-175. Zidar, A. (2009). Nevronske mreže kot modeli za napovedovanje pro -daje prehrambenih dobrin, magistrsko delo v pripravi, Univerza na Primorskem, Fakulteta za management Koper. Zou, H. F., Xia, G. P., Yang, F. T. & Wang, H. Y. (2007). An investigation and comparison of artificial neural network and time series models for Chinese food grain price forecasting, Neurocompu-ting, 70, (16-18): 2913-2923. Anton Zidar je ma nager, podj et nik, usta novitelj več podj etij, v okviru katerih je vodil oziroma implementiral več lastnih podjetniških idej, je tudi član Združenja nadzornikov Slove -nije. Izkušnje ima s področja managementa in upravljanja podjetij, podjetništva, marketinga, informacijskih tehnologij, organizacije poslovnih procesov ter trgovine in logistike. Je avtor številne (računalniške) aplikativne programske opreme, ravno tako je vodil številne projekte s področja infor- macijskih tehnologij ter pri tem tudi svetoval poslovodstvom podjetij. Zadnji dve leti pa se posveča raziskovanju nevronskih mrež z vidika aplikacije v managementu kot metode, orodja za reševanje raznovrstnih poslovnih problemov in za ocenjevanje podjetniških priložnosti. Nevronske mreže so bile tudi osrednja tematika njegovega magistrskega dela na Fakulteti za management Koper, Univerza na Primorskem Roberto Biloslavo je prorektor za študijske zadeve Uni -verze na Primorskem in izredni profesor za področje managementa na UP, Fakulteta za management Koper. Njegovo raziskovalno delo je usmerjeno v področje managementa, strateškega managementa, managementa znanja in druž -bene odgovornosti gospodarskih družb. Izsledke svojih razi -skav je objavil v številnih domačih in tujih strokovnih revijah ter monografijah.