Sildiarhiiv: mänguteooria

Relvajõudude tasakaal

Kaarel Tarand rääkis ühes arvamusartiklis Kanti igavese rahu ideaalist ja ütles, et ka kaitseotstarbelised relvajõud tuleks kaotada. Mänguteoreetiliselt vaadates pole relvajõudude kaotamine maailmast tasakaal – kui maailmas on alles kasvõi üks agressiivne riik või rühmitus, siis see vallutab maailma, kui teised kaitsejõududest loobuvad.

Evolutsiooniliselt on hea põhjus, miks inimesed on parasjagu sõjakad – liiga vähesõjakad muutusid vanasti orjadeks, mis ei soodustanud paljunemisedu. Liiga sõjakad aga hävitasid ennast liiga tihedate konfliktidega. Evolutsiooniline surve viis sellisele keskmisele isiksusele, kes nõrgematelt jõuga vara ära võtab, aga tugevamate eest jookseb (arg jõhkard).

Relvastumismängus puhastes strateegiates tasakaalu pole, sest kui kõik on enda kaitsmiseks piisavalt tugevad, pole kellelgi motivatsiooni ründevõimekust arendada, aga siis pole ka kellelgi motivatsiooni kaitsevõimesse investeerida. Kui kaitsesse ei investeerita, siis tekib motivatsioon ründeks, mis loob motivatsiooni kaitseks.

Tasakaal peab olema segastrateegiates, kus sõjaline võimekus on parasjagu nii suur, et naabrid on ükskõiksed ründamise ja mitteründamise vahel. Vahel ründavad, vahel mitte – rünnaku tõenäosus on parasjagu selline, et hoiab riigi ükskõiksena kaitsevõime suurendamise ja vähendamise vahel. Niipea kui riigi sõjaline võimekus langeb alla heidutavat piiri, naabrid ründavad kindlasti, mis tagab motivatsiooni piisavalt kaitsevõimesse investeerida. Teisest küljest, liiga palju sõjalisse võimsusesse panustada pole kuluefektiivne, sest tugevat nagunii ei rünnata.

Pimehindamine vs tausta arvestav hindamine

Taylor ja Yildirim (2011) uurivad, miks mõnes hindamisprotsessis ei anta hindajatele teavet kandidaadi omaduste ja tausta kohta (hindamine toimub hinnatava nime teadmata), aga mõnikord antakse. Taylori ja Yildirimi mudelis on kandidaadid eri võimekusega ja esitavad projekte, mille hulgast hindaja peab valima standardile vastavad. Hindaja saab ebatäpse signaali kandidaadi võimekuse ja tema projekti kvaliteedi kohta.

Kui enamik kandidaate on võimekad või signaal projekti kvaliteedi kohta on täpne, siis on parim variant pimehindamine. Vastupidisel juhul on kasulikum võtta kandidaadi tausta tema projekti hindamisel arvesse. Pimehindamine annab kandidaatidele parema motivatsiooni pingutamiseks, aga informeeritud hindamine hindajale täpsema projektivaliku.

Mudeli rakendamise näide kohtusüsteemis on, et tänavakuritegudes kasutatakse otsuse tegemisel ka kohtualuse isikuomadusi ja tausta, aga valgekraede kuritegudes (kelmus, kartell) otsustatakse ainult konkreetse teo põhjal. Esimesel juhul on põhiline õige otsuse tegemine, teisel juhul antud käitumise ärahoidmine.

Akadeemilises maailmas rakendatakse valmis artiklite retsenseerimisel tihti pimehindamist, tulevase uurimistöö plaanide hindamisel (näiteks grantide jagamisel) aga arvestatakse uurija kvalifikatsiooni ja eelnevat tööd. Selle põhjuseks on, et valmis töö põhjal on hinnang töö kvaliteedile üsna täpne, plaanitava töö korral mitte. Artiklite pimehindamisega püütakse anda motivatsiooni pingutamiseks, grantide informeeritud hindamisega soovitakse valida parimad projektid.

Sarnaselt mudeliga evolutsioonilisest kasulikkusfunktsiooni arengust, vähendavad nii liiga madal kui ka liiga kõrge standard motivatsiooni pingutada. Tolles mudelis kohandab evolutsioon kasulikkusfunktsiooni nii, et pingutamise ja mittepingutamise tulemuste vahe oleks võimalikult suur. Samamoodi on Taylori ja Yildirimi hindamismudelis hindamissüsteemi eesmärgiks võimalikult suure pingutuse motiveerimine, aga lisaks soovib hindaja ka parima lõpptulemuse valida.

Inimese tausta arvestamist on mainitud ka hulluindeksites. Üks soovitus hullude artiklite eristamiseks tavalistest artiklitest on võtta arvesse inimese tausta, näiteks haridust ja eelnevat tööd. Seega on tegu informeeritud hindamise, mitte pimehindamisega. Informeeritud hindamise põhjenduseks on täpsema teabe saamine praeguse projekti tõenäolise taseme kohta, et otsustada, kas seda on mõtet lugema hakata.

Piinamisest

Jeffrey Ely artiklis „Torture“ kirjeldatakse piinamist mänguteoreetilisest vaatepunktist. Sisuliselt on tegu motivatsiooni loomisega teabe avaldamiseks, kui pole teada, kellel on teavet ja kellel pole. Nimetagem teabe omajaid süüdi olijateks ja mitteomajaid süütuteks. Artikli kohaselt põhineb tulemuslik piinamine kahel aspektil: süütute piinamise jätkamisel ja süüdi olijate piinamise lõpetamisel.

On populatsioon inimesi, kellest osadel on infot, osadel mitte. Teavet sooviv organisatsioon võib sealt juhuslikult mõne valida ja teda piinama asuda. Kui tegu on süüdi olijaga, on tal valida, kas info avaldada või mitte. Süütu ei tea midagi, seega ei saa infot avaldada. Pärast piinamise alustamist on võimalikud kaks olukorda: piinatav avaldab infot või mitte. Selle põhjal peab teavet otsiv organisatsioon otsustama, kas piinamist jätkata (karistada) või see lõpetada.

On neli võimalust: 1) pärast info kättesaamist jätkata, pärast mitteavaldamist samuti jätkata, 2) jätkata, lõpetada, 3) lõpetada, jätkata, 4) lõpetada, lõpetada. Pole eriti mõistlik pärast teabe saamist piinata ja selle mittesaamisel lõpetada – siis ei räägi keegi midagi. Samuti kui pärast avaldamist ja mitteavaldamist on tulemus piinatava jaoks sama (mõlemal juhul lõpetatakse või mõlemal juhul jätkatakse), ei avalda keegi infot. Ainus võimalus motiveerida inimesi teavet avaldama on lõpetada piinamine pärast teabe saamist ja jätkata seda teabe mittesaamisel.

Sellisel juhul otsustavad süüdi olijad oma info avaldada ja pääsevad edasisest karistusest, süütuid aga piinatakse lõpuni, kuna neil pole midagi rääkida. Ehk tulemus on täpselt vastupidine ideaalsele õigussüsteemile, kus süüdi olijaid karistatakse ja süütuid mitte.

Ely ajaveebis Cheap Talk on mänguteoreetiliselt kirjeldatud paljusid elulisi küsimusi, päris huvitav lugeda.

Moe mänguteoreetiline modelleerimine

Mitu majandusartiklit on pakkunud erinevaid seletusi moevoolude kujunemisele. Moodi defineeritakse kui kasutuid, kuid kulukaid muudatusi riietuses, tarbimises või käitumises. Tihti korduvad need muutused tsükliliselt.

Moemäng, kus osa populatsioonist püüab sarnaneda nendega, keda nad kohtavad, teine osa rahvastikust aga erineda, on kirjeldatud  Matsuyama (1992) artiklis. Agendid kohtuvad mudelis juhuslikult valitud populatsiooni liikmetega. Kohtumisi on palju ja iga kohtumise järel otsustab agent oma käitumise järgmiseks kohtumiseks.

Koordinatsioonimäng sarnanejate või erinejate vahel on segamini kull-kiri mänguga sarnaneja ja erineja vahel. Täpsemalt kohandavad sarnanejad oma käitumist samaks enda kohatud inimeste käitumisega, erinejad aga erinevaks kohatud inimeste käitumisest. Kui kohtuvad kaks sarnanejat, on tegu koordinatsioonimänguga – mõlemad tahavad teha sama, mis teine, näiteks valida mõlemad sinise või mõlemad punase riietuse. Kui kohtuvad kaks erinejat, on samuti tegu koordinatsioonimänguga, sest mõlemad pooled soovivad sama lahendit – esimene peaks valima sinise ja teine punase, või vastupidi. Sarnaneja ja erineja kohtudes on mäng kull-kiri, kus üks pool tahab valida sama käitumise, mis teine, aga teine pool tahab valida esimesest erineva käitumise. Soovitud lahendid on täpselt vastupidised, ehk tegu on nullsumma mänguga.

Koordinatsioonimängus on kolm tasakaalu – mõlemad sarnanejad valivad punase, mõlemad valivad sinise või mõlemad juhuslikustavad punase ja sinise vahel. Sama kehtib erinejate puhul, ainult nemad tahavad valida (sinine, punane) või (punane, sinine) kombinatsiooni. Koordineeritud tasakaalud on evolutsiooniliselt stabiilsed, ehk kui alustatakse tasakaalust väljas, aga selle lähedal, siis liigub käitumine kohandumise tagajärjel tasakaalu. Segatasakaal on evolutsiooniliselt ebastabiilne, kuna kui üks pool valib rohkem punast, on ka teisel motivatsioon rohkem punast valida ja liigutakse ühe koordinatsioonitasakaalu suunas, mitte segatasakaalu poole tagasi.

Kull-kiri mängus on üks tasakaal, mis on segastrateegiates ehk mõlemad pooled juhuslikustavad oma käitumist. See on evolutsiooniliselt stabiilne.

Neid kahte mängu erinevates proportsioonides segades võib tulemuseks olla kas juhuslikustatud käitumine kogu populatsioonis, moetsüklid või sotsiaalne norm. Moetsüklite korral valivad kõik algul punase, siis üha rohkem sinist, siis jälle punast ja nii perioodilise kõikumisega lõpmatuseni. Sotsiaalse normi kujunedes valivad kõik sama käitumise, kas sinise või punase, olenevalt sellest, kumba algselt rohkem on (see võib olla juhuslik).

Rõivatootjate motiivi pidevalt uusi moode toota analüüsib Pesendorfer (1995).

Miks motiveerida teadlasi artikleid kirjutama

Akadeemilised artiklid võivad olla ühiskonnale kasulikud, kirjeldades uusi tehnoloogiaid või avastusi. Nad võivad olla teadlastele endile huvitavad kirjutada ja lugeda. Aga ka nende kahe põhjuse puudumisel võib kasulik olla motiveerida teadlasi artikleid kirjutama.

Kui teadusest mingit kasu pole, aga see on piisavalt keeruline, siis võimaldab teadustöö tase mõõta inimeste intelligentsust. Teaduse arendamisega saab tõestada enda töökust ja tarkust. Ehk tegu on Spence’i signaliseerimismudeliga. Bioloogiline analoog on paabulinnu sabasuled.

Kui teadlased on ühtlasi õppejõud, peab neid kuidagi motiveerima oma taset hoidma ja pideva enesetäiendamisega unustamist vältima. Võiks ju regulaarselt õppejõududele eksameid korraldada, aga see on igav, avatud pettusele (kuigi ka akadeemiliste artiklite puhul esineb plagiaadiprobleem), keegi peab eksamiülesandeid koostama ja eksameid kontrollima. Sundides teadlasi artikleid kirjutama, saab neid panna valdkonna keerulisi ülesandeid lahendama. Teadmiste pidev kasutamine hoiab neid vananemast ja olen ise leidnud, et ülesannete lahendamine on hea õppimismeetod, nii et teadustööga säilitatakse vaimset tippvormi.

Lihtsuse ja tõepära konverents

13.-15. novembril 2009 oli meil majandusteaduskonnas lihtsuse ja tõepära konverents (Workshop on simplicity and likelihood), organiseerijateks Itzhak Gilboa ja Larry Samuelson. Külalisi oli umbes kakskümmend.

Konverents oli huvitav segu ökonomeetria teooriast ja otsustusteooriast. Esinejate hulgas oli lisaks majandusteadlastele arvutiteadlasi, füüsikuid ja statistikuid. Teemad olid väga abstraktsed ja matemaatilised, seetõttu minu jaoks väga huvitavad. Reedel oli mul päev loengutega täidetud, nii et konverentsile jõudsin alles laupäeva hommikul.

Laupäeva esimene esineja oli Joe Halpern Cornellist. Ta rääkis põhjuslikkusest ja esitas selle matemaatilise kirjelduse, illustreerides seda näidetega filosoofiast ja õigusteadusest. Põhjuslikkus, süü ja vastutus on matemaatiliselt erinevad mõisted (vähemalt Halperni mudelis) ja üks kriteeriume põhjuste järjestamisel on, kui palju ebanormaalsemaks see maailma muudab. Halperni näited on järgnevad:

Billy ja Sue viskavad kividega pudelit. Mõlemad on täpse käega, aga Sue kivi jõuab esimesena kohale ja purustab pudeli. Billy kivi oleks selle ka purustanud, kui Sue oma selle terveks jätnud oleks. Nii et kui Sue poleks visanud, siis oleks pudel ikka purunenud. Kas võib öelda, et Sue kivivise on pudeli purunemise põhjus? (Jah)

Võrdluseks eelmisele näitele: kaks süütajat viskavad põleva tiku metsa. Ühe süütaja tulekahju suudavad päästjad kustutada, aga kui mets kahest otsast põleb, siis ei suuda. Nii et metsa mahapõlemiseks on vaja mõlema süütaja tikku. Kas võib öelda, et süütaja A on metsa mahapõlemise põhjustaja? (Ei) Kas abstraktne põhjuslikkuse struktuur selles ja eelmises näites on sama? (Ei) Kui metsa mahapõlemiseks piisab ainult ühe süütaja tikust ja mõlemad viskavad tiku, siis kas süütaja A on metsa mahapõlemise põhjustaja?

Billy haigestub mittesurmavasse haigusesse pühapäeval. Kui esmaspäeval tööl olev arst talle ravimit annab, on Billy teisipäeval terve. Kui esmaspäeva arst teda ei ravi, aga teisipäeva arst ravib, on Billy kolmapäeval terve. Üks ravimidoos ravib, aga kaks on surmav. Kas teisipäevase arsti mitteravimine on Billy kolmapäevase elusoleku põhjus? Aga esmaspäevase arsti mitteravimine?

Kas see, et ma sind ei tulista, on põhjus, miks sa elus oled?

Keskaegne kuningriik. Mõrtsukas plaanib kuningat mürgitada. Kuninga nõunik kahtlustab seda ja annab kuningale vastumürki. Mitmesugustel asjaoludel ei õnnestu mõrtsukal kuningale mürki anda. Kas vastumürgi andmine on kuninga elusolemise põhjus?

David Schmeidler rääkis aksiomaatilisest lähenemisest lihtsusele ja põhjuslikkusele. Sarnaselt paljude otsustusteooria artiklitega postuleeris Schmeidler aksioomid, mida reaalsuse kohta käivate mudelite paremusjärjestus peaks rahuldama ja tuletas neist selle järjestuse funktsionaalse kuju. Seda funktsiooni võib vaadelda ka kui mudeli valiku kriteeriumi.

David Wolpert NASAst rääkis oma tõestusest, et ka deterministlikus ja lõplikus universumis on Laplace’i hüpotees vale. Laplace väitis, et kui talle anda piisavalt infot praeguse kõigi osakeste asukoha ja liikumise kohta universumis, siis võib ta arvutada kogu universumi tuleviku ja mineviku. Meie reaalses universumis on Laplace’i hüpotees vale juba Heisenbergi määramatuse printsiibi kohaselt – pole võimalik samaaegselt ennustada osakese asukohta ja liikumist. Aga hüpoteetilises deterministlikus ja lõplikus universumis, nii nagu seda nähti Laplace’i ajal?

Wolpert alustas vaatluse ja ennustuse defineerimisega. Nende mõningaid ühiseid jooni koondava tegevuse nimetas ta järeldamiseks ja defineeris järeldusmasina – objekti, millele me võime esitada maailma kohta jah/ei küsimusi ja saada vastuseks ühe biti 0 või 1, vastavalt siis ei või jah. Järeldamine on nii vaatluse kui ennustuse jaoks tarvilik, aga mitte piisav. Wolperti põhiline teoreem oli, et iga sündmuse kohta eksisteerib järeldusmasin, mis suudab seda sündmust järeldada, aga iga järeldusmasina jaoks on olemas sündmus, mida see masin järeldada ei suuda.

Wolperti näited olid sarnase struktuuriga, mida matemaatikas nimetatakse Cantori diagonalisatsiooniargumendiks. Arvutiteaduses on sarnane olukord Turingi masina puhul – on olemas sündmus, et see masin peatub. Aga masin ei suuda vastata küsimusele, kas ta peatub.

Järeldusmasina puhul nimetagem V-ks nende maailma arenguteede hulka, kus masin homme vastab täna küsitud küsimusele jah. Homseks on need arenguteed natuke läbitud, nimetagem samade arenguteede hulka homme V’-ks. Masin ei suuda õigesti vastata küsimusele, kas me oleme homme väljaspool hulka V’. Kui masin ütleks jah, siis ta eksiks, sest kui ta ütleb jah, oleme me hulgas V’, aga küsimus oli, kas me oleme väljaspool seda hulka. Kui masin ütleks ei, siis ta eksiks, sest me oleme nüüd väljaspool hulka V’ ja küsimus oli, kas me oleme väljaspool seda hulka.

Kuna ükski järeldusmasin ei suuda kõigile maailma kohta käivatele küsimustele õigesti vastata, siis ei ole olemas masinat, mis suudaks ennustada kogu universumi tulevikku. Kaval inimene võib küsida, et kui iga sündmuse kohta on masin, mis suudab seda ennustada, siis kas me ei võiks võtta piisavalt palju erinevaid masinaid ja lasta igal neist ennustada jupikest universumit, saades kokku kogu tuleviku ennustuse. Veel kavalam vastaks sellele, et igasuguse masinate kogumi võime me ümber nimetada üheks masinaks, seega eelnev võimatusteoreem kehtib.

Pühapäeva esimese esineja Andrew Barroni teema oli informatsiooniteooria, lihtsus ja tõepära. Ta rääkis, et andmehulga keerukust võib vaadelda kui bittide arvu, mida selle üksüheseks edasiandmiseks vaja läheb. See on arvutiteaduses kaua teada olnud. Barroni uudne väide oli, et tõenäosust võib samuti vaadelda kui bittide arvu koodis ja kodeerimisviise kui tõenäosusjaotusi. Ta rakendas seda vaatepunkti masinõppimise näitele.

Masinõppimisel antakse arvutile kõigepealt mingi treeningandmehulk, mis on võetud mingist tõenäosusjaotusest. Selle põhjal peab masin ennustama andmeid mingist teisest tõenäosusjaotusest ehk üldistama oma varasemat teadmist. Inimestele on see tavaline tegevus, aga arvutite puhul on sellise üldistusvõime tekitamine keeruline.

Aris Spanos rääkis mudelite valikust andmete seletamiseks. Statistikud ja ökonomeetrikud kasutavad enamjaolt lähendamisteooriat ja püüavad leida mudelit, mis kõige paremini andmetele vastab. Spanose kohaselt on see vale lähenemine ja tal oli palju näiteid, kus sellega valesid tulemusi saadakse. Oluline pole Spanose sõnul mitte lähenduse täpsus ehk väike vahe mudeli ja andmete vahel, vaid selle vahe (mudeli jäägi, model residual) mittesüstemaatilisus. Näiteks n andmepunkti võime me lähendada (n-1) järku polünoomiga ja saada täpse vastavuse, aga see mudel on ennustuste või järelduste seisukohast väärtusetu.

Statistilisi mudelivalikukriteeriume rakendatakse eelnevalt valitud mudelite klassis. Kui see klass on aga valesti valitud, siis valikukriteeriumi rakendamine selle sees annab vale tulemuse. Iga mudeli puhul peaks kontrollima selle statistiliste eelduste täidetust ja kui need pole täidetud, siis valima mõne muu mudeli hoolimata sellest, kui lähedane antud mudel andmetele on.

Larry Samuelson rääkis inimeste lihtsuse-eelistustest. Näiteks rida 010101 jätkaks enamik inimesi paariga 01 ja rida 1,2,4,8 arvuga 16. Aga on palju teisi mudeleid, mis sobiksid nende ridade algusega ja annaksid järgnevaks tulemuseks hoopis midagi muud. Nii et miks siis on inimeste hulgas kujunenud selline komme või norm, et rida 010101 tuleks jätkata paariga 01?

Samuelsoni vastuseks oli lihtsus. Kuna konverentsi jooksul oli esitatud palju erinevaid lihtsuse ja keerukuse definitsioone, ei hoidnud ka Samuelson end tagasi ja kasutas enda oma. Tema põhiline tulemus oli lihtsuse-eelistuste matemaatilise vormi esitamine. Kõigepealt valib otsustaja erinevate andmeid kirjeldavate mudelite vahel nende tõepära järgi ja seejärel viiki jäänud parimate mudelite vahel nende lihtsuse järgi. Tuleb välja, et niimoodi objektiivsele valikule subjektiivsust lisades saadakse parem tulemus, kui ainult objektiivset tõepärakriteeriumi kasutades.

 

Kes valvab vahimehi – akadeemilise ebaaususe karistamisest

Paranduses oma kunagisele postitusele Hinnosaarte ajaveebis viitasin sellele, et akadeemilist pettust esineb igal pool. Kui hinded on olulised, siis on (üli)õpilastel alati motivatsioon spikerdada. Teatud määral saab mahakirjutamist vähendada, üritades jutlustada aususe voorusi, aga kui spikerdamise eest eriti ei karistata, siis on see kasulik ja seda väldivad vaid vähesed lollakalt ausad inimesed, nagu mina.

Majandusteaduslikust vaatepunktist on küsimus motivatsioonis. Avastatud spikerdamine on kahjulik, avastamata kasulik. Akadeemilise ebaaususega alustatakse, kui kasu kaalub üles kahju, ehk hinded sellega paranevad, aga karistus on piisavalt väike või vähetõenäoline. Õppurite ausana hoidmiseks tuleks neid eksamite ajal piisavalt hästi valvata ja kodutööde sarnasusi hästi tähele panna, aga siin tekib küsimus õppejõu motivatsioonist.

Kui akadeemilise pettuse avastamise korral peab tegelema paberimajandusega, kokku kutsuma komiteesid ja võtma vastu ebamugavaid otsuseid, samas kui mitteavastamise korral pingutama ei pea, siis võib õppejõud strateegiliselt otsustada väiksemate pettuste suhtes silma kinni pigistada. Karistamise ebamugavus võib kaaluda üles hea tunde õige asja tegemisest. Lisaks võib karistamine olla õppejõule psühholoogiliselt ebameeldiv. Kui organisatsioonis on juba kultuur, et vähemolulist spikerdamist ei karistata, siis muutub see igapäevaseks ja õppurid liiguvad edasi põhjalikuma plagiaadi poole.

Küsimus on kokku võetav lausega Quis custodiet ipsos custodes? Mänguteoorias võib korratavas mängus kõigile kasuliku tasakaalu hoidmiseks olla vajalik sellest kõrvalekaldujate (või lihtsalt sellise kahtluse alla sattujate) karistamine. Karistamine võib olla karistajatele kahjulik, mispuhul tekib neil soov karistust nõudvast strateegiast kõrvale kalduda. Tasakaalu hoidmiseks tuleb karistajaid mittekaristamise eest karistada, karistamisest kõrvale hoidjate mittekaristajaid karistada ja nii edasi kuni lõpmatuseni. Iga vahimehe puhul peab olema keegi, kes teda valvab.

Õppeasutustes tähendab see, et akadeemilise ebaaususe suhtes silma kinni pigistavat õppejõudu peaks tabama midagi ebameeldivat. Kui tema ülemus teda ei karista, peaks ülemus seeläbi kannatama ja nii edasi. Ei saa tekitada lõpmatut jada valvureid, aga saab moodustada neist ringi, kus igaüks valvab eelnevat ja on valvatud endale järgneva poolt. Ringiks võib piisata ainult kahest kategooriast inimestest.

Üks võimalik mehhanism on, et kui õppur tõestab, et ta antud õppejõu aines pettis, aga õppejõud seda ei avastanud või ignoreeris, siis antakse õppurile väike preemia, pettuse eest teda ei karistata, aga karistatakse õppejõudu. Kui õppejõud avastab pettuse, siis karistatakse õppurit, aga õppejõud saab väikese preemia, mis kompenseerib pettuse karistamiseks vajaliku bürokraatiaga tegelemise. Peab vaatama, et preemia poleks suurem, kui karistus pettuse eest, sest siis tekib valvuritel ja valvatavatel motivatsioon kokku leppida, et üks petab, teine avastab ja preemia jagatakse omavahel.

Sarnast mehhanismi saaks rakendada korruptsiooni puhul. Kui altkäemaksu andja tõestab, et teine pool seda võttis, siis andjat ei karistata ja ta saab selle, mida ta altkäemaksu eest saada tahtis. Karistatakse võtjat, kusjuures karistus peab olema suurem, kui altkäemaksu andja kasu, muidu tekib kokkuleppeoht. Kui altkäemaksu võtja tõestab, et teine andis, siis saab ta summa endale jätta, pluss väike preemia, ja andjat karistatakse sellest suuremas ulatuses.

Demokraatlikus riigis ei saa inimesi eriti rängalt karistada, nii et suuremahuliste korruptiivsete tehingute puhul ülaltoodud mehhanismi kasutada ei saa. Tehingu avalikustajale jäetav kasu on liiga suur, ta võib sellest osa karistatavale anda, talle karistuse kompenseerida ja ise täiesti seaduslikult saavutada selle, mida ta tehinguga saada tahtis. Miljarditehingute tasakaalustamiseks läheks vaja keskaegses stiilis karistusi, mida inimesed tänapäeval oma riiki ei soovi.

Toomas Hinnosaar mainis, et valvurite valvamise mudel on majandusteaduses juba tehtud, autor on Rahman ja avaldatud 2012 American Economic Reviews.

Domineeritud strateegia ellujäämisest evolutsioonis

Hofbauer ja Sandholm (2011) kirjeldavad hüpnoketta mängu, kus domineeritud strateegia evolutsioonis alles jääb. See tulemus on üllatav, kuna domineeritud strateegia pole parim vastus ühelegi teiste mängijate strateegiakombinatsioonile ja on vähemalt üks puhas strateegia, mis annaks mängijale igal juhul parema tulemuse.

Mängijad kohtuvad juhuslikult populatsioonist valitud vastastega, mängivad antud mängu ja saavad tulemuse teada. Siis on neil võimalus enne järgmist kohtumist juhuslike vastastega oma käitumist muuta. Võiks arvata, et kui mängijad oma käitumist kohandavad, siis pidevalt kohatud vastaste vastu parimat strateegiat valides jõuavad nad lõpuks Nashi tasakaalu, kus definitsiooni kohaselt domineeritud strateegiaid ei mängita.

Hüpnoketta mängus on ainult üks Nashi tasakaal, mis on segastrateegiates ja evolutsiooniliselt ebastabiilne. Käitumine selles mängus jõuab evolutsioonilise protsessi kaudu korduvasse tsüklisse, kus positiivse tõenäosusega valitakse domineeritud strateegiat.

Teine link samale artiklile.