letnik 17, št. 1-2/06 Drucker, P. F. (1998). The Coming of the New Organization, Harvard Business Review on Knowledge Management, Harvard Business School Press, USA. Egbu, C.O. (2002). Information Technologies for Knowledge Management: Their Usage and Effectiveness, Electronic Journal of Information Technology in Construction. Egbu, C. O., & BOTTERILL, K. (2002). Information Technologies for Knowledge Management: Their Usage and Effectiveness, Electronic Journal of Information Technology in Construction. Garvin, D. A. (1998). Building a Learning Organization, Harvad Business Review on Knowledge Management, Harvard Business School Press, USA. Kleiner, A., & ROTH, G. (1998). How to Make Experience Your Company's Best Teacher, Harvard Business Review on Knowledge Management, Harvard Business School Press, USA. Koivu, T. J. (2002). Future of Product Modeling and Knowledge Sharing in the FM/AEC Industry, Electronic Journal of Information Technology in Construction. Koenders, E. A. B., at al (2004). The (Re) Use of Knowledge for Academics and Buil- ding Industry, Delft University of Technology, Delft, The Netherlands. Leonard, D., & STRAUS, S. (1998). Putting Your Company's Whole Brain to Work, Harvard Business Review on Knowledge Management, Harvard Business School Press, USA. Lima, C., et al (2005). Ontology-Based Optimization of in e-Construction, Electronic Journal of Information Technology in Construction. Lima, C., et al (2003). The BCXML: Supporting Ecommerce and Knowledge Management in the construction industry, Electronic Journal of Information Technology in Construction. Nonaka, I. ( (1998). The Knowledge-Creating Company, Harvard Business Review on Knowledge Management, Harvard Business School Press, USA. Quinn, J. B., at al (1998). Managing Professional Intellect: Making the Most of the Best, Harvard Business Review on Knowledge Management, Harvard Business School Press, USA. Pakanen, J. E., at al (2001). A web-based Information System for Diagnosing, Servicing and Operating Heating Systems, Electronic Journal of Information Technology in Construction. Slak, M. (2002). Ko bi le vedeli, kaj vemo, Sistem, Infomediji, d. o. o., Slovenija. Stojanovic, N., HANDSCHUH, S. (2002). A Framework for Knowledge Management on the Semantic Web, University of Karlsruhe, Karlsruhe, Germany. Staab, S., et al (2001). Knowledge Processes and Ontologies, IEEE Intelligent Systems 16(1), January/February 2001, Special Issue on Knowledge Management. Wilson, T. D. (2002). The Nonsense of 'Knowledge Management', Information Research, 8(1), paper no. 144 (http://InformationR.net/ir/8-1/ paper144.html). Zack, M. H. (1999). Managing Codified Knowledge, Sloan Management Review, 40(4) (web.cba.neu.edu/~mzack/articles/ kmarch/kmarch.htm). Povezave na spletu Microsoft SharePoint [http://www.microsoft.com/ windowsserver2003/technologies/ sharepoint/default.mspx], [http://www.microsoft.com/resources/ documentation/wss/2/all/adminguide/ en-us/stsa02.mspx]. Urbanistični inštitut Slovenije [www.uirs.si]. Boštjan KERBLER - Kefo Modeli diskretne izbire V ~lanku je sistemati~no predstavljena posebna oblika regresijskih metod - modelov diskretne izbire -, imenovanih tudi verjetnostni modeli. Poleg njihovega pomena so opisane {e metodolo{ke zna~ilnosti pri njihovi izvedbi, natan~neje pa so predstavljeni modeli binarne izbire in tisti z omejeno odvisno spremenljivko, logisti~ni model ter modela probit in tobit kot izhodi{~ni metodolo{ki pristopi k izvedbi modelov. The paper systematically describes special regression methods - discrete choice models -known as probability models. The meaning of models and their methodological characteristics are described, as well as different types of models, especially binary-choice models and censored regression models. We considered three most commonly used approaches to estimating such models - logit, probit and tobit model. Logistični model Modeli diskretne izbire Modeli binarne izbire Modeli z omejeno odvisno spremenljivko Model probit Regresijska analiza Statistične metode Model tobit Binary-choice models Censored regression models Discrete choice models Logit model Probit model Regression analysis Statistical methods Tobit model 1. Poimenovanja in pomen modelov diskretne izbire Za modele diskretne izbire (angl. discrete choice models) avtorji upo- rabljajo različna poimenovanja. Izraz povzemamo po Greenu (2003), ki jih imenuje tudi modeli kvalitativnega odziva (angl. qualitative response (QR) models), Pindyck in Rubinfeld (1991) pa jih imenujeta modeli kvalitativne izbire (angl. qualitative choice models). Madda-la (1999) uporablja termin diskretni regresijski modeli (angl. discrete regression models), Liao (1994) pa govori o verjetnostnih modelih (angl. probability models). Modeli diskretne izbire sodijo med regresijske letnik 17, št. 1-2/06 modele - Fox (1997) jih uvršča med posplošene linearne (regresijske) modele (angl. generalized linear (regression) models - GLM), Wooldridge (2002) pa med nelinearne regresijske modele (angl. nonlinear regression models). Podobno kot pri klasičnih linearnih regresijskih modelih analiziramo tudi pri modelih diskretne izbire kavzalne zveze med pojasnjeno, odvisno spremenljivko (F) in eno ali več pojasnjevalnimi, neodvisnimi spremenljivkami ... Glavni pomen modelov diskretne izbire je, da v nasprotju s klasičnimi linearnimi regresijskimi modeli omogočajo vpogled v kavzalne zveze, če ne poznamo zveznih, kvantitativnih vrednosti odvisne spremenljivke, temveč ločimo le končno število izidov, ki zavzemajo diskretne, kvalitativne vrednosti 0uvan-čič, 2002, povzeto po Maddala, 1999, Wooldridge, 2002). Takšno odvisno spremenljivko imenujemo omejena odvisna spremenljivka (angl. limited dependent variable), uporaba konvencionalnih regresijskih metod pa v takih primerih ni ustrezna (Greene, 2003). Ker je po Foxu (1997) za regresijske modele značilno, da lahko na podlagi sprejetega modela in ocen njegovih parametrov iz vrednosti pojasnjevalnih spremenljivk napovemo vrednost odvisne spremenljivke, omogočajo modeli diskretne izbire - kot verjetnostni modeli - napovedovanje verjetnosti odziva oziroma izbire {zn^. forecasting response/choice probability) (Liao, 1994, Wooldridge, 2002). Prob (dogodek j se zgodi) = = Prob (F = j) = /"[relevantne posledice, parametri] Pri tem pomeni Prob (F = j) verjetnost, da se dogodek j zgodi, dogodek (angl. event) pa posameznikovo izbiro med alternativami -izidi, ki jih zavzema odvisna spremenljivka F. Opis modelov diskretne izbire je tako prvič objavljen v slovenščini.^1 2. Metodološke značilnosti pri izvedbi modelov diskretne izbire Glavne metodološke značilnosti modelov diskretne izbire so: Osnovna oblika zapisa modelov diskretne izbire temelji na regresijskem modelu, ki ga z enačbo zapišemo kot Y, = ßX, + s, Pri tem je Yj vektor vrednosti odvisne spremenljivke, matrika vrednosti pojasnjevalnih spremenljivk, ß vektor koeficientov, ki jih ocenjujemo, E j pa vektor slučajnih napak (ostankov) oziroma vplivov (Koš-melj, 2001). Ocenjevanje postavljenega modela oziroma njegovih parametrov temelji na metodi največjega verjetja (angl. maximum likelihood method). Za preizkušanje hipotez in ugotavljanje statistične značilnosti postavljenega modela uporabljamo test z razmerjem verjetij (angl. likelihood ratio test). Skladnost postavljenega modela izražamo z različnimi oblikami de-terminacijskega koeficienta psevdo-R2 pseudo-R2), npr z in- deksom razmerja verjetij (angl. likelihood ratio index), različnimi oblikami informacijskih kriterijev (angl. information criteria) in deležem pravilno napovedanih odzivov - cenitev R2 (angl. count R2). Postavljeni model interpretiramo s cenilkami mejnih učinkov (angl. estimates of marginal effects) pojasnjevalnih spremenljivk. 3. Vrste modelov diskretne izbire Modele diskretne izbire razvrščajo avtorji, kot npr Greene (2003), Pindyck in Rubinfeld (1991), Maddala (1999), Fox (1997), Liao (1994) Wooldridge (2002), glede na lastnosti odvisne spremenljivke Y^. Čeprav se razvrstitve v podrobnostih med seboj razlikujejo, je njihova skupna značilnost ta, da so modeli diskretne izbire v osnovi razdeljeni glede na število izidov oziroma diskretnih vrednosti, ki jih zavzema odvisna spremenljivka: Modeli diskretne izbire, pri katerih zavzema odvisna spremenljivka dva izida - modeli binarne izbire (angl. binary-choice/response models, dichotomous choice models, itd.): Y, = 0, 1 Pri tem Y^ = 1 pomeni, da se dogodek zgodi, Y^ = O pa, da se dogodek ne zgodi. Spremenljivko, ki je prirejena vsaki vrednosti nominalne spremenljivke in dobi vrednost 1, če ima enota izbrano vrednost nominalne spremenljivke, ter vrednost O, če enota nima izbrane vrednosti nominalne spremenljivke, imenujemo slamnata (umetna) spremenljivka (angl. dummy variable) (Košmelj in dragi, 2001). Izhodiščna metodološka pristopa pri izvedbi modelov binarne izbire sta logistični model, imenovan tudi logistična regresija (angl. logit model/logistic regression), in model probit, imenovan tudi model nor-mit im^.probit/normit model). Pri obeh metodoloških pristopih običajno ocenjujemo vpliv ene pojasnjevalne spremenljivke ali več na eno odvisno spremenljivko z dvema izidoma. Po Greenu (2003) lahko pri modelu probit opazujemo tudi vpliv ene pojasnjevalne spremenljivke ali več na več kot eno odvisno spremenljivko, ki zavzema dva izida. Kadar imamo dve odvisni spremenljivki, govorimo o bivariatnem modelu probit (angl. bivariateprobit model), kadar so v analizo vključeni več kot dve odvisni spremenljivki, pa o multivariatnem modelu probit (angl. multivariate probit model). Modeli diskretne izbire, pri katerih zavzema odvisna spremenljivka več kot dva izida - modeli multiple izbire (angl. multiple-choice/response models, polytomous (polycho-tomous) choice models, itd.): Y = 0, 1, 2, 3, ...j letnik 17, št. 1-2/06 Pri tem so izidi lahko razvrščeni na urejenostni merski lestvici (angl. ordered outcomes) ali pa niso rangirani (angl. unordered outcomes). Tako kot pri modelih binarne izbire sta tudi pri izvedbi modelov multiple izbire izhodiščna metodološka pristopa logistični model in model probitci, ki sta izpeljana v več različicah. Najpogosteje sta v rabi multinomski logistični model (angl. multinomial logit model - MNL) in multinomski model probit (angl. multinomial probit model - hìNP). Nekateri avtorji, kot npr Gujarati (1995) in Pindyck, Rubinfeld (1991), uvrščajo med modele diskretne izbire tudi tiste, pri katerih ima odvisna spremenljivka omejene (angl. censored)'[^ vrednosti: Modeli diskretne izbire, pri katerih zavzema odvisna spremenljivka eno diskretno vrednost in eno ali več zveznih vrednosti - po Gujara-tiju (1995) modeli z omejeno odvisno spremenljivko (angl. censored regression models/limited dependent variable models) : Y = 0 Yi = a + ßXi + s;, ce je desna stran enačbe (DSE) > O Pri tem je Yj- = O diskretna vrednost, DSE pa zavzema zvezne vrednosti. Metodološki pristop pri izvedbi modelov diskretne izbire te vrste je model tobit (angl. tobit model). 3.1 Modeli binarne izbire Regresijska oblika zapisa modelov binarne izbire je a + ßX, + e, Pri tem predpostavljamo, da je pričakovana vrednost slučajne napake ii(£^)enaka O, saj s tem dosežemo, da so cenilke nepristranske (Gujarati, 1995). Skupna značilnost modelov je, da zavzema odvisna spremenljivka Yj le dve vrednosti (O in 1), zato zapišemo po Pindvcku in Rubinfeldu (1991) verjetnostno porazdelitev kot P,= Prob (Y = 1) in 1 - p.= Prob (Yi = 0) Pri tem je verjetnost P^ - verjetnost, da se bo dogodek pri danih Xj- zgodil - enaka razmerju med številom za dogodek Yj = 1 ugodnih možnosti in številom vseh možnosti, ob pogoju, da imajo vse možnosti enako priložnosti za nastop (Košmelj in dragi, 2001). Verjetnost zavzema vrednosti na intervalu med O in 1 (Pindyck, Rubinfeld, 1991). Ker zavzame le dve vrednosti, interpretiramo po Gujaratiju (1995) pri modelih binarne izbire verjetnost Pj tudi kot pogojno pričakovano vrednost odvisne spremenljivke Yj E(Y) = 1(Pi) + 0(1 - Pi) = P; Pri logističnem modelu in modelu probit binarne izbire je po Gujaratiju (1995) odnos med verjetnostjo Pj in pojasnjevalnimi spremenljivkami Xj- nelinearen. Porazdelitvena funkcija ima obliko črke S in je po Foxu (1997) asimptota - vrednostma O in 1 se približuje v neskončnost (njen razpon je med -00 in +00). Pri obeh metodoloških pristopih je funkcija porazdeljena kumulativno (angl. cumulative distribution function - CDFOTìxomA.P). Nagib je največji pri P^ = 0,5, ko = 0. To pomeni, da imajo spremembe vrednosti pojasnjevalnih spremenljivki^- največji vpliv na verjetnost izbire v razpolovišču porazdelitve, zaradi majhne nagnjenost porazde-litvene krivulje na njenih koncih pa so spremembe v verjetnosti majhne, tudi če so spremembe v vrednostih pojasnjevalnih spremenljivki^- velike (Pindyck, Rubinfeld, 1991)-Kumulativna porazdelitvena funkcija P se pri obeh izhodiščnih metodoloških pristopih izvedbe modelov binarne izbire - logističnem in modelu probit - razlikuje v tem, da prvi predpostavlja logistično,drugi pa normalno kumulativno porazdelitev. Logistično kumulativno verjetnostno porazdelitveno funkcijo zapišemo kot P, = F(a + ßX) = F(Z) = 1 1 + + ßXi) = HZ) Pri tem je A dogovorjeni simbol za logistično porazdelitev (Greene, 2003), Z j je po Pindycku in Rubinfeldu (1991) teoretični zvezni indeks (angl. theoretical continuous index = a + ßX^), kumulativna porazdelitvena funkcija zveznega indeksa, e pa osnova za naravni logaritem - matematična konstanta, ki znaša približno 2,718 oziroma po Foxu (1997) eksponenta negativne vrednosti zveznega indeksa i-^Z^). Normalno standardizirano kumulativno verjetnostno porazdelitveno funkcijo zapišemo kot Pi= F^x+ ßX) = F(Z) = Zi
0 ' V 0 cejer* 5 0 Ker so podatki omejeni, je pri modelu tobit porazdelitvena funkcija mešanica med diskretno in zvezno porazdelitvijo (Greene, 2003), vendar temelji po Bierensu (2004) in Oladeleju (2005) na normalni kumulativni porazdelitveni funkciji, ki jo ob predpostavki, da se dogodek zgodi (Yj > 0), zapišemo kot F(Zi)= SZ
O, izračunamo to po formuli E(Y) = (ßXi) F(Zi) + a f(Zi) Pri tem je fiZj) funkcija verjetnostne gostote za normalno porazdeli- letnik 17, št. 1-2/06 tev (Pindyck in Rubinfeld, 1991, Bierens, 2004, Oladele, 2005). Ker je pri modelu tobit porazdelitev delno diskretna in delno zvezna, zapišemo po Greenu (2003) logaritemsko funkcijo verjetja za model tobit v oblik enačbe kot InL=Q - --[log ( 2jt) + In d2 + Y,>0 2 + Qln[1 - cI)(Z,)] Pri tem predpostavljamo, da je konstanta a = 1, slučajna napaka je normalno porazdeljena, opazovana odvisna spremenljivka Yj pa je omejena z vrednostjo 0. Greene (2003) povzema po McDo-naldu in Mofittu (1980) razčlembo enačbe na dva dela Pri tem je enačba razdeljena na dva dela, in sicer prvi del pripada opazovanim enotam, ki nimajo omejitev oziroma zavzemajo odvisne spremenljivke zvezne vrednosti (1^- > 0), drugi del pa opazovanim enotam, katerih odvisne spremenljivke so omejene (1^- > 0). Zaradi omejitve odvisne spremenljivke ocenjujemo model tobit, kljub podobnostim s konvencional-nimi regresijskim modeli, po metodi največjega verjetja, pred tem pa po Greenu (2003) in Bierensu (2004) logaritemsko funkcijo verjetja poenostavimo s t. i. Olsnovo reparametrizacijo, po kateri sta v = in 6 = tako da je 'a a ' InL=E - --[In (2tt) - I nO2 + Y>o + (OY- X^)2] + Q In[1 - (X, y)] Y=o Pri modelu tobit izračunamo deter-minacijski koeficient i?^ enako kot pri konvencionalnih regresijskih modelih, in sicer po enačbi Q2 R2= 1- -^ '_ = E(Y - _)2 Pri tem pomeni F povprečje vrednosti odvisnih spremenljivk V nasprotju s konvencionalnimi re-gresijskimi modeli je pri modelu tobit izračun mejnih učinkov po enačbi SEjY-) _ -iwx--^ omejen, saj je Y* latentna spremenljivka. Greene (2003) zato predlaga, da moramo namesto Y* upoštevati opazovano odvisno spremenljivko + E(Y„ Y,> 0) aProb(Y-> 0) dX, Pri tem ima sprememba pojasnjevalne spremenljivke dvojni pomen: v pozitivnem delu porazdelitve vpliva na pogojno povprečno vrednost latentne spremenljivke Y* in na verjetnost, da bo v tem delu porazdelitve tudi opazovana enota. 4. Sklep + X- O Čeprav članek temelji na pregledu strokovne literature s področja statistike in ekonometrije, ima za slovensko znanost velik pomen, saj zelo sistematično in podrobno opiše metode diskretne izbire, kar v slovenskem jeziku doslej še ni bilo narejeno. To je vzrok, da smo številne izraze zapisali tudi v izvirnem (angleškem) jeziku. Modeli diskretne izbire so kot statistično metodo pri nas redko uporabljali tudi v empiričnih raziskavah, najpogosteje sna področju ekonomije in medicine. V doktorski disertaciji smo prvi v Sloveniji uporabili modele na področju socialne geografije in z njimi ugotavljali povezanost med socialnogeografsko strukturo na slovenskih hribovskih kmetijah in nasledstvom na njih. V članku predstavljena teoretična metodološka podlaga je pripomogla k ustrezni uporabi modelov in uspešni izvedbi raziskave. Boštjan Kerbler - Kefo, univ. dipl. geogr., Urbanistični in{titut RS, Ljubljana E-po{ta: kefo@uirs.si Pojasnilo I1! Podrobnejši opis metod in njihovo aplikacijo lahko najdete v avtorjevi doktor- ski disertaciji. Opombe 121 Čeprav je v Sloveniji raba izraza probit model že ustaljena, v skladu s pravili Slovenskega pravopisa (2001) določilo probit zapisujemo v vlogi desnega prilastka. Pravilen zapis se torej glasi model probit. Enako velja tudi za izraz model tobit. 131 Juvančič (2002) izraz »censored« prevaja kot okrnjen, čeprav je angleški prevod izraza okrnjen »truncated«. Viri in literatura Anderson, S., Newell, R. (2003) Simplifield marginal effects in discret choice models. Dostopno na: http://www.rff.org/ Documents/ RFF-DP-03-38.pdf (7. 6. 2006). Bierens, H. J. (2004) The tobit model. Dostopno na: http://econ.la.psu.edu^hbierens/ EasyRegTours/TOBIT_Tourfiles/TOBIT.PDF (20. 6. 2006). Cornelissen, T. (2005) Standard errors of marginal effects in the heteroskedastic probit model. Dostopno na: http:// www.wiwi.uni-hannover.de/ Forschung/ Diskussionspapiere/dp-320.pdf (8. 6. 2006). Fox, J. (1997) Applied regression analysis, liner models, and related methods. Thousand Oaks, Sage Publicatons, London, New Delhi. Greene, W. H. (2003) Econometric analysis. Prentice Hall: Pearson Education International, Upper Saddle River (New Jersey). Gujarati, D. N. (1995) Basic econometrics. McGraw-Hill Inc., New York. Juvančič, L. (2002) Model odločanja o zaposlovanju na kmečkih gospodarstvih v Sloveniji. Biotehniška fakulteta, Oddelek za zootehniko, Ljubljana. Košmelj, B., Arh, F., Doberšek Urbanc, A., Ferligoj, A., Omladič, M. (2001) Statistični terminološki slovar. Statistično društvo Slovenije, Statistični urad Republike Slovenije, Ljubljana. Košmelj, K. (2001) Osnove logistične regresije (1. del). Zbornik Biotehniške fakultete Univerze v Ljubljani - Kmetijstvo, št. 2/2001, str. 22^238. Liao, T. F. (1994) Interpreting probability models: logit, probit, and other generalized linear models. Thousand Oaks, Sage Pub-licatons, London, New Delhi. Maddala, G. S. (1999) Limited-dependet and qualitative variables in econometrics. Cambridge University Press, Cambridge, New York, Melbourne. Oladele, O. I. (2005) A tobit analysis of propensity to discontinue adoption of agricultural technology among farmers in Southwestern Nigeria. Journal of Central European agriculture, št. 3/2005, str. 24^254. Pindyck, R. S., Rubinfeld, D. L. (1991) Econometric models and econometric forecasts. McGraw-Hill Inc., New York. Vir 1. http://en.wikipedia.org/wiki/ Tobit_model (20. 6. 2006). Wooldbridge, J. M. (2002) Econometric analysis of cross section and panel data. The MIT Press, Cambridge, London. +