i i “Kuzman” — 2021/8/24 — 14:00 — page 60 — #1 i i i i i i ZANIMIVOSTI Nesebičnost kot socialni optimum Pisalo se je leto 2001, ko je na platna kinematografov prǐsel Čudoviti um z Russlom Crowom v glavni vlogi. Film, ki naj bi na avtobiografski način predstavil življenje Johna Forbesa Nasha in ki je kot bodočega študenta matematike pritegnil tudi mene. Spomnim se, da sem prav z veseljem sedel v kino in z dvignjeno obrvjo kritiziral olepšano zgodbo njegovega življenja ter nezadovoljno vzdihoval ob filmskih trivilizacijah matematičnih vsebin. Vseeno pa moram priznati, da sem skozi ta videoizdelek sploh prvič slǐsal za najbolj znan raziskovalni dosežek omenjenega nobelovca. Gre seveda za t. i. Nashevo ravnovesje, o katerem rad – čeprav nisem specialist za področje teorije iger – spregovorim še danes, predvsem kadar me medse povabi kakšna manj matematična sredina. Z vsebino tega sestavka to svoje, prek Hollywooda pridobljeno znanje, v uporabo predajam tudi vam. Vsak film ima točko preloma. Trenutek, v katerem iz uvoda preidemo v zaplet. V filmu Čudoviti um je to prizor, v katerem protagonist s prijatelji vstopi v bar. Tam zagledajo skupino deklet, v kateri je – ne zamerite stereo- tipizaciji, vendarle gre za film – blondinka izrazito bolj privlačna od drugih. In medtem ko se vsi drugi prerekajo, kdo in kako jo bo osvojil, naš junak ugotovi, da je za skupno dobro bolǰsa drugačna strategija. In sicer taka, v kateri nihče ne pristopi k blondinki, temveč se vsi osredotočijo na srca njenih spremljevalk. Tako si namreč ne bodo v napoto, uspeha pa bo deležen več kot eden. Kakorkoli, čeravno je ta primer hollywoodsko netočen (izkazalo se bo, da sploh ne gre za Nashevo ravnovesje), ga vseeno vzemimo kot popotnico za to, kar želimo povedati – da stremenje vsakega posameznika k individualnemu uspehu ne vodi nujno v družbeni optimum1. Kaj je Nashevo ravnovesje? Če želimo uvesti pojem Nashevega ravnovesja, moramo najprej povedati, kaj je to strateška igra. Gre za igro, v kateri igralci sočasno izberejo eno iz- med ponujenih alternativ brez vedenja o tem, kaj bodo izbrali drugi igralci, 1Tovrstno načelo je v svojem delu An Inquiry into the Nature and Causes of the Wealth of Nations zagovarjal Adam Smith, škotski filozof, ki je deloval v 18. stoletju in se v mnogih virih omenja kot oče sodobne ekonomije. 60 Obzornik mat. fiz. 68 (2021) 2 i i “Kuzman” — 2021/8/24 — 14:00 — page 61 — #2 i i i i i i Nesebičnost kot socialni optimum njihov končni izplen pa je nato odvisen od izbire vseh. Lep primer zanjo je otroška igra kamen-̌skarje-papir, v kateri igralca hkrati pokažeta vsak svojo figuro, zmagovalca pa nato določijo vnaprej znana pravila: škarje pre- režejo papir, papir ovije kamen oz. kamen potolče škarje (v primeru iste figure imamo remi). Poteza igralcev je torej natanko taka, kot je značilno za strateške igre – hkratna in brez predhodnega dogovarjanja, končni izid pa naposled določita obe figuri. Ker igro igrata le dva igralca, jo lahko pred- stavimo s prvo izmed spodnjih tabel. V njej smo zmagi pripisali vrednost +1, porazu vrednost −1, remi pa smo ovrednotili s parom ničel. Nadalje smo z drugo tabelo ilustrirali eno izmed najbolj znanih strateških iger – dilemo dveh zapornikov. Gre za igro, v kateri policisti osebi, ki sta osumljeni zločina, zaradi pomanjkanja dokazov zaslǐsujejo ločeno in upajo, da bo vsaj ena od njiju priznala svoje dejanje. Pri tem veljajo naslednja pravila: če se obe osebi odločita molčati, ju čaka enoletna zaporna kazen; če bo zločin priznala le ena oseba, se bo s tem izognila zaporu, a bo sostorilca obsodila na štiriletno kazen; če zločin priznata obe osebi, bosta v ječi pristali za tri leta (dolžino zaporne kazni smo označili z negativnim predznakom). Zadnja tabela prikazuje igro, ki jo v literaturi najdemo pod imenom Bach ali Stravinsky. Ljubitelja klasične glasbe imata možnost skupaj oditi na enega od dveh koncertov. Na enem bodo igrali Bachova dela, ki so Obzornik mat. fiz. 68 (2021) 2 61 i i “Kuzman” — 2021/8/24 — 14:00 — page 62 — #3 i i i i i i Zanimivosti bližje prvemu, na drugem pa dela Stravinskyja, ki so bolj všeč drugemu. Ti stanji v tabeli zaradi njunih preferenc ovrednotimo s paroma (2, 1) oz. (1, 2). Opciji, v katerih gre vsak od njiju na koncert sam, pa zaradi ogrozitve njunega prijateljstva ovrednotimo z (0, 0). Sedaj vpeljimo osrednji pojem tega članka. Nashevo ravnovesje je stanje strateške igre, v katerem nihče od igralcev ne bi želel zamenjati svoje izbire, čeprav bi bil vnaprej seznanjen z alternativami, ki jih bodo izbrali drugi. Recimo, v primeru dileme dveh zapornikov je to stanje, v katerem oba osumljenca zločin priznata. Res, ob zavedanju, da se je njegov pajdaš zlomil pod pritiskom, se nikomur od njiju ne splača molčati, saj bi s tem dolžino svoje kazni podalǰsal za eno leto. Nasprotno, nobeno od preostalih treh stanj igre ni ravnovesno. Če bi se namreč eden od njiju lahko z gotovostjo zanesel na molk pajdaša, bi se mu zločin splačalo priznati, saj bi se tako izognil kazni. Če pa bi eden od njiju zločin priznal, drugi pa ne, pa bi v primeru, da bi imel to možnost, svojo odločitev želel spremeniti slednji. Omeniti je treba, da Nashevo ravnovesje ne obstaja vedno in da ni nujno enolično. Na primer, v igri Bach ali Stravinsky sta ravnovesna oba para (2, 1) in (1, 2), pri igri škarje-kamen-papir pa Nashevega ravnovesja ni (v primeru poraza ali remija bo igralec želel svojo odločitev spremeniti). Ka- korkoli, kar analizo tega pojava napravi zares zanimivo, so t. i. epistemski pogoji, pri katerih je ravnovesje tudi končni izid igre: Če ima igra eno samo Nashevo ravnovesje in jo igrajo igralci, katerih racionalnost je skupno zna- nje, bo končni izid igre enak temu ravnovesju2. V tem primeru gre torej za stanje, ki je na neki način predvidljivo in nam omogoča – kot bomo vi- deli v nadaljevanju – interpretacijo nekaterih zanimivih družbenih pojavov. Preden pa se lotimo teh, obrazložimo, kaj pomenijo ključne predpostavke v zgornji trditvi. Za igralca pravimo, da je racionalen, če pozna in razume pravila igre ter pri danih potezah nasprotnikov izbere potezo, ki mu prinaša najbolj ugoden izid. Če nadalje predpostavimo tudi, da se vsak igralec zaveda racionalnosti svojih nasprotnikov in dejstva, da to velja za vse izmed njih, pravimo, da je racionalnost igralcev skupno znanje (angl. common knowledge). V teh okolǐsčinah je enolično Nashevo ravnovesje edino stabilno stanje, v katerem nihče od igralcev nima motivacije za spremembo svoje izbire, in je posledično 2R. Aumann in A. Brandenburger, Epistemic Conditions for Nash equilibrium, Eco- nometrica, 63 (1995), 1161–1180. 62 Obzornik mat. fiz. 68 (2021) 2 i i “Kuzman” — 2021/8/24 — 14:00 — page 63 — #4 i i i i i i Nesebičnost kot socialni optimum tudi končni izid igre. Ker pa v praksi tovrstne racionalnosti igralcev ne gre pričakovati »na mah«, si bomo v naših modelih dovolili nekaj več poljudnega jezika in to stanje interpretirali kot pričakovano limitno vrednost, ki naj bi se ji igralci približali z večkratnim igranjem igre oz. z »nabiranjem izkušenj«. Tako bomo večkrat – z večjo gotovostjo, kot bi smeli – napovedali, kaj naj bi se zgodilo »po nekem času« oz. natančneje, ko bo racionalnost igralcev postala pričakovana in vsem znana informacija3. V luči zapisanega se sedaj še za hip vrnimo k dilemi dveh zapornikov. Ob predpostavki, da to ni prvo ločeno zaslǐsanje obeh prestopnikov, lahko torej za najverjetneǰsega izmed štirih izidov štejemo simultano priznanje zločina, kar tudi razloži, zakaj je ta metoda pogosto uporabljena v praksi. Kakorkoli, kar pa temu popularnemu primeru strateške igre daje še dodaten pomen, pa je dejstvo, da tak izid za zločinca, niti na individualni niti na kolektivni ravni, ni optimalen. Res, v primeru simultanega molka bi bila tako njuna skupna kot individualna kazen nižja. In prav tovrstnim primerom se želimo posvetiti v nadaljevanju – strateškim igram, v katerih enolično Nashevo ravnovesje obstaja, a ni enako socialnemu optimumu. Pica Deluxe ali Klasika? Družba kolegov ob petkih igra košarko, po rekreaciji pa si v bližnji restav- raciji privošči pice. Na meniju imajo dve pici – tradicionalno Klasiko za 5 evrov in še posebej slastno pico Deluxe za 10 evrov. Kot stalna družba so dogovorjeni, da vsak od njih izbere poljubno pico, končni račun pa vseeno poravnajo v enakovrednih zneskih. A takemu dogovoru navkljub se čez čas izkaže, da jim kot posameznikom ni povsem vseeno, kolikšen zapitek plačajo. Natančneje, količino svojega zadovoljstva začnejo meriti z razliko med ceno naročene pice in zneskom, ki so ga zanjo plačali. Na primer, če je igralec pojedel pico Deluxe in zanjo plačal 8 evrov, je stopnja njegovega zadovoljstva enaka vrednosti +2, če pa je za isti znesek pojedel Klasiko, jo vrednoti z −3. Kaj je Nashevo ravnovesje te igre oz. kaj lahko pričakujemo, da se bo zgodilo po večjem številu rekreacij? Igra ima eno samo ravnovesje, saj je količina ugodja igralca, ki je naročil Klasiko, vedno nepozitivna – manǰsa od nič, če je vsaj eden izmed njegovih 3Za bolj poglobljeno razlago na temo racionalnosti in eksperimentalnega pristopa k raz- iskovanju Nashevega ravnovesja bralcem priporočam drugo poglavje knjige J. M. Osborne, An introduction to Game Theory, Oxford University press. Obzornik mat. fiz. 68 (2021) 2 63 i i “Kuzman” — 2021/8/24 — 14:00 — page 64 — #5 i i i i i i Zanimivosti kolegov naročil pico Deluxe, in enaka nič, če so vsi naročili Klasiko. Podobno velja, da je količina ugodja pri osebi, ki je naročila pico Deluxe, vedno ne- negativna. Zatorej bo vsak igralec, ki ni naročil pice Delux, to odločitev v nekem trenutku želel spremeniti. S tem bo količino svojega ugodja pove- čal do strogo pozitivne vrednosti, če bo vsaj eden od njegovih prijateljev vztrajal pri Klasiki, oz. do ničelne vrednosti, če bodo naposled vsi naročili pico Deluxe. Po številnih rekreacijah gre torej pričakovati, da bodo vsi iz- brali dražjo pico, saj bodo le tako dobili »največ« za svoj denar. Narava njihovega dogovora v kombinaciji z rahlo zavistnim razmǐsljanjem jih torej spodbudi k večji porabi denarja. Le kaj bi naročili, če bi zapitek plačala klubska blagajna? Sodeč po mojih izkušnjah vsak dve pici Deluxe . . . Zakaj so vse lekarne v centru mesta? Na 100 m dolgi plaži sladoled prodajata dva ponudnika. Oba imata enak premičen zabojnik in identično ponudbo, zato se dogovorita, da bosta stala vsak na svoji strani plaže, za 25 m odmaknjena od sredǐsčne točke. Tako imajo namreč, ob enakomerni zasedenosti plaže, vsi obiskovalci v povprečju najkraǰso pot do sladoleda, vsak od njiju pa zasluži – ob predpostavki, da gre kupec k tistemu, ki je bližje – polovico možnega dobička (prva slika). Nato pa se nekega dne zgodi preobrat. In sicer, prvi prodajalec svoj vo- ziček zapelje za 5 m bližje sredini (druga slika), saj razmǐslja takole: »S tem bom ohranil vse svoje stranke, svojemu konkurentu pa bom odškrnil tudi 2,5 m njegovega teritorija, saj bodo obiskovalci, ki so za manj kot to razda- ljo oddaljeni od sredine plaže, sedaj raje prǐsli k meni.« In res, v naslednjih dneh se razmerje zasluženega denarja obrne njemu v korist. Ker je zaradi 64 Obzornik mat. fiz. 68 (2021) 2 i i “Kuzman” — 2021/8/24 — 14:00 — page 65 — #6 i i i i i i Nesebičnost kot socialni optimum tega nezadovoljen drugi prodajalec, se za premik odloči tudi on, pri čemer pa je še bolj podjeten kot prvi. Svoj voziček zapelje kar na drugo stran plaže in se postavi 10 m stran od sredǐsčne točke. Tako s svojo ponudbo sladoledov pokrije kar 65 % plaže (tretja slika). Seveda tudi ta premik ne ostane neopažen in tovrstno menjavanje lokacije postane njuna dnevna pra- ksa. Vse dokler ne pristaneta v ravnovesnem stanju. In kdaj je to? Ko oba stojita na sredini plaže! Tam je namreč njun zaslužek znova enak (ob predpostavki, da je verjetnost, da gre kupec k enemu ali drugemu, zaradi enake ponudbe identična). Kaj pa obiskovalci plaže? Nad novo lokacijo so nezadovoljni predvsem tisti na levem in desnem robu plaže, saj morajo sedaj do sladoleda pešačiti dlje . . . Edino Nashevo ravnovesje tega primera je stanje, v katerem se oba pro- dajalca nahajata na sredini plaže. Res, če bi se eden od prodajalcev odločil premakniti s tega mesta, bi s tem svoj dobiček kvečjemu zmanǰsal, saj bi svojemu konkurentu prepustil celotno polovico plaže ter še delež kupcev, ki ustreza polovici razdalje med njima. Opisan primer pojasni fenomen, zakaj se pogosto vse prodajalne specifičnega tipa (na primer lekarne ali resta- vracije s hitro prehrano) nahajajo v mestnih sredǐsčih, čeprav bi si njihovi kupci želeli večjo razpršenost. Kakorkoli, za izziva željne bralce dodajmo še dodatno nalogo. Kaj se zgodi, če na plažo umestimo tri ali štiri prodajalce? Izkaže se, da Nashevo ravnovesje obstaja le v drugem primeru. Poskusite to dokazati in poiskati ravnovesje za primer štirih prodajalcev! Prometni paradoks Vsako jutro se štiristo zaposlenih pelje v službo iz kraja A v kraj D. Pri tem imajo na voljo dve poti – skozi kraj B in skozi kraj C. Cesti, ki vodita od kraja A do kraja C ter od kraja B do kraja D, sta mestni vpadnici, zato je čas, ki ga voznik potrebuje za vožnjo po njih, stalen, 5 minut. Preostali dve cesti sta običajni regionalki, čas potovanja pa je odvisen od števila avtomobilov na njih. Natančneje, voznik v povprečju porabi 1 minuto na 100 avtomobilov, ki se to jutro peljejo po dotični cesti. Kaj je Nashevo ravnovesje te igre oz. pri kateri razporeditvi avtomobilov se posamezniku ne splača izbrati druge poti? Odgovor je preprost – ravnovesno je vsako stanje, pri katerem se po vsaki od dveh možnih poti pelje polovica avtomobilov. Res, če bi se ob tej razporeditvi eden izmed voznikov odločil zamenjati pot, bi s tem svoj čas Obzornik mat. fiz. 68 (2021) 2 65 i i “Kuzman” — 2021/8/24 — 14:00 — page 66 — #7 i i i i i i Zanimivosti potovanja le podalǰsal, saj bi se s tem povečalo število vozil na odseku med krajema A in B oz. med krajema C in D. Na drugi strani je treba opozoriti, da nobeno od preostalih stanj ni optimalno, saj bo vsak voznik, ki se nahaja na poti z več kot 200 vozili, želel svojo izbiro zamenjati. Imamo torej več ravnovesij, ki pa so ekvivalentna do razporeditve avtomobilov natančno. Zato bomo malce prezrli, da predpostavke Nashevega izreka niso izpolnjene, in dejali, da se neenoličnosti ravnovesja navkljub promet čez čas stabilizira in da se na vsaki od dveh tras zjutraj nahaja istih 200 voznikov. Ker pa želijo v mestni občini izbolǰsati cestni pretok, obstoječi mreži dodajo povezavo med krajema B in C. Le-ta je tako zelo učinkovita, da lahko zanjo predpostavimo, da je čas potovanja po njej enak kar nič minut! In kako to vpliva na obstoj ravnovesja? Tudi tokrat je odgovor preprost. V nobenem primeru se vozniku ne splača izbrati ceste med krajema A in C oz. med krajema B in D, saj bo za pot po njih porabil vsaj minuto več, kot če v kombinaciji z regionalkama uporabi novo cesto med krajema B in C. Zatorej gre pričakovati, da bodo vsi vozniki izbrali novo traso. In kje se skriva paradoks? Če so pred tem vozniki za pot v službo porabili sedem minut, jih sedaj potrebujejo osem! Ekonomija skupnih dobrin Štirje prijatelji se dogovorijo za skupno investicijo. Vsak izmed njih je po- zvan, naj vloži poljuben znesek med nič in sto evri, banka pa bo nato njihov skupni znesek podvojila, ter jim denar razdelila v enakih deležih. Kaj je Nashevo ravnovesje te igre? Za ilustracijo si oglejmo konkreten primer. Denimo, da so trije od njih vložili po 50 evrov, eden pa le 30 evrov. Po podvojitvi vložka banka med njih torej razdeli 360 evrov, vsakemu po 90 66 Obzornik mat. fiz. 68 (2021) 2 i i “Kuzman” — 2021/8/24 — 14:00 — page 67 — #8 i i i i i i Nesebičnost kot socialni optimum evrov. Vendar pa njihov dobiček pri tem ni enak! Medtem ko bodo tisti, ki so vložili več denarja, zaslužili po 40 evrov, bo njihov prijatelj kljub najniž- jemu vložku zaslužil kar 60 evrov. Posledično lahko sklepamo, da bo vsak izmed njih ob naslednji investiciji pod temi pogoji vložil manǰsi znesek. Na- tančneje, edino Nashevo ravnovesje bo doseženo takrat, ko nihče od njih ne bo vložil niti evra. Res, postavimo se v vlogo enega od igralcev. Vsak evro, ki ga bo vložil v investicijo, je v resnici odveč, saj se kljub podvojitvi razdeli na štiri dele, kar pomeni, da zanj ne predstavlja dobička, ampak strošek v vǐsini pol evra. Edini pravi dobiček mu torej prinašajo le evri, ki jih vložijo drugi. A če tudi prijatelji razmǐsljajo tako kot on, denarja ne vloži nihče. Družbeni pojav, ki ga modelira ta igra, se v mnogih virih pojavi pod imenom ekonomija skupnih dobrin. Nakazuje pa na to, da smo ljudje zelo zadržani, ko je treba sredstva vložiti v dobrine, ki se na koncu povrnejo v enakovrednem deležu. Lep primer za to so politike držav pri vlaganju sredstev v preprečevanje podnebnih sprememb. Vsi se zavedamo, da bi bilo to nujno potrebno, a si obenem obetamo, da bodo konkretne korake na tej poti napravili drugi. A bodimo malce optimistični in nakažimo, da je premik v tej smeri možen. Na primer, osnovni igri dodajmo pravilo, da morajo osebe z najnižjim vložkom plačati kazen v vǐsini 50 evrov. Premislite lahko, da ob takem pogoju ničelni vložek vseh vpletenih ni več ravnovesen. Russla naj zamenja George Potrdili smo, da je za dosego socialnega optimuma včasih potrebna nesebič- nost. Ostane nam torej le še obravnava hollywoodske netočnosti iz uvoda. Sedaj, ko razumemo pojem Nashevega ravnovesja, hitro ugotovimo, da po- teza, ki jo je v baru predlagal naš glavni junak, ni ravnovesna. Če namreč prijatelji pristopijo k spremljevalkam in ne k blondinki, bo vsak od njih po tihem razmǐsljal, da bi v odsotnosti konkurence lahko osvojil tudi najlepše dekle. Vseeno pa, bolj za šalo kot za res, povejmo, da lahko to neskladje popravi drug glavni igralec. Res, če to postane George Clooney, ki očara vsako dekle in vedno premaga vse konkurente, nekonsistentnost izgine. Te- daj bo namreč ravnovesno stanje, v katerem George pristopil k blondinki, vsi drugi pa so zadovoljni z izbiro spremljevalke . . . 4 Uroš Kuzman 4Originalni vir te šale je plus.maths.org/content/if-we-all-go-blonde. Obzornik mat. fiz. 68 (2021) 2 67