Sildiarhiiv: otsustusteooria

Teoreem: diskrimineerimine on rumalus

Definitsioon: diskrimineerimine tähendab, et valitakse mitte kõigi kandidaatide seast, vaid mingist väiksemast alamhulgast.

Kommentaar: kandidaadid ja valik võivad olla erinevates kontekstides, näiteks tudengite vastuvõtt ülikooli, töökoha täitmine, Riigikogu valimised.

Definitsioon: rumalus tähendab, et mitte kõigi kandidaadihulkade ja kandidaadivõimekuste puhul ei valita (saadaoleva teabe põhjal) parimat kandidaati.

Kommentaar: jätan eetilised küsimused selles tekstis kõrvale ja vaatlen isekat otsustajat, kes soovib kandidaadi tööst suurimat kasu. Parim kandidaat on kõige töövõimekam. Töö tähendus sõltub kontekstist, samuti võimekus. Võimekus ei pruugi olla selgelt nähtav. Saadaoleva teabe põhjal võib kõik kandidaadid järjestada oodatava võimekuse järgi, kusjuures osad (või kõik) kandidaadid võivad olla võrdsed. Saadaoleva teabe põhjal parim on suurima oodatava võimekusega.

Teoreem: diskrimineerimine on rumalus.

Tõestus: Parim kandidaat kõigi hulgast võib kuuluda väiksemasse alamhulka A, millega piirdub diskrimineerija, või võib asuda selle kaashulgas. Kui parim ei kuulu A-sse, siis diskrimineerimise korral teda ei valita. Seega mitte kõigi kandidaadihulkade ja kandidaadivõimekuste puhul ei vali diskrimineerija parimat.

Väljapressija probleem

Väljapressimist võib modelleerida kahe osapoolega korratava mänguna. Igal perioodil nõuab väljapressija teatud rahasummat, ohver otsustab, kas maksta või mitte, ja siis väljapressija otsustab, kas viia ähvardus täide või mitte. Kui ähvarduse saab lõpetada, näiteks röövitud inimese omastele tagastada, siis on tegemist üheperioodilise vahetuskaubaga, kus jääb otsustada vaid hind.

Oletame, et ähvardus on selline, mida väljapressija usutavalt lõpetada ei saa, näiteks info avalikustamine. Alati on võimalik, et dokumentidest on koopiad tehtud, seega on ähvardus olemas igal tulevasel perioodil.

Väljapressija tahaks kätte saada võimalikult palju, ehk kogu ohvri varanduse. Kestva ähvarduse korral takistab teda see, et ta ei saa garanteerida, et ta järgmisel perioodil jälle raha ei nõua. Kui ohver on ratsionaalne, nõustub ta igal perioodil maksma ainult ähvarduse järgmisele perioodile edasilükkamise eest, mitte ähvarduse lõpetamise eest, kuna lõpetamist ei saa väljapressija usutavalt pakkuda. Lühikeste perioodide või kannatliku ohvri korral on tulu väljapressimisest igal perioodil väike. Lisaks saab ohvri vara lõpuks otsa ja ta peab jätma väljapressijale maksmata, nii et kunagi viiakse ähvardus ikka täide.

Mängud oma tulevase mina vastu

Majandusteaduses on juba üsna laialdane kirjandus kiusatuse ja enesekontrolli kohta. Üks võimalus seda modelleerida on mänguna lühiajalise ja pikaajalise mina vahel (Fudenberg ja Levine 2006). Lühiajaline mõtleb ainult tänasele päevale, pikaajaline tahab kasu kõigile tulevastele lühiajalistele minadele. Seega püüab pikaajaline mina kontrollida lühiajalist.

Näiteks hommikul poes mõtleb inimene, kas osta lisaks salatile maiustusi või mitte. Hommikune mina eelistaks kõige rohkem süüa õhtul salati ja ühe maiustuse, teisel kohal on salat üksi ja viimasel kohal kõik maiustused. Ta teab, et õhtul tekib tal kiusatus süüa kõik maiustused, ehk õhtune mina eelistab kõige rohkem kõiki maiustusi, teisel kohal on tal salat ja üks maiustus, ning viimasel kohal ainult salat. Teades, mida õhtune mina tegema hakkab, otsustab hommikune mina osta ainult salati, ehk valida enda seisukohast paremuselt teine ja õhtuse mina seisukohast halvim variant. Võttes õhtuselt minalt valikuvõimaluse, kontrollib hommikune mina tema käitumist.

Pikaajaline mina peab olema piisavalt ratsionaalne, et läbi mõelda lühiajaliste minade tulevased otsused ja neid enda otsustes arvestada. Kui pikaajaline mina usuks, et lühiajalistel on temaga samad eelistused, ei teeks ta enesekontrolliks midagi ja käitumine oleks ainult jada lühiajalise perspektiiviga otsuseid.

 

Lihtsuse ja tõepära konverents

13.-15. novembril 2009 oli meil majandusteaduskonnas lihtsuse ja tõepära konverents (Workshop on simplicity and likelihood), organiseerijateks Itzhak Gilboa ja Larry Samuelson. Külalisi oli umbes kakskümmend.

Konverents oli huvitav segu ökonomeetria teooriast ja otsustusteooriast. Esinejate hulgas oli lisaks majandusteadlastele arvutiteadlasi, füüsikuid ja statistikuid. Teemad olid väga abstraktsed ja matemaatilised, seetõttu minu jaoks väga huvitavad. Reedel oli mul päev loengutega täidetud, nii et konverentsile jõudsin alles laupäeva hommikul.

Laupäeva esimene esineja oli Joe Halpern Cornellist. Ta rääkis põhjuslikkusest ja esitas selle matemaatilise kirjelduse, illustreerides seda näidetega filosoofiast ja õigusteadusest. Põhjuslikkus, süü ja vastutus on matemaatiliselt erinevad mõisted (vähemalt Halperni mudelis) ja üks kriteeriume põhjuste järjestamisel on, kui palju ebanormaalsemaks see maailma muudab. Halperni näited on järgnevad:

Billy ja Sue viskavad kividega pudelit. Mõlemad on täpse käega, aga Sue kivi jõuab esimesena kohale ja purustab pudeli. Billy kivi oleks selle ka purustanud, kui Sue oma selle terveks jätnud oleks. Nii et kui Sue poleks visanud, siis oleks pudel ikka purunenud. Kas võib öelda, et Sue kivivise on pudeli purunemise põhjus? (Jah)

Võrdluseks eelmisele näitele: kaks süütajat viskavad põleva tiku metsa. Ühe süütaja tulekahju suudavad päästjad kustutada, aga kui mets kahest otsast põleb, siis ei suuda. Nii et metsa mahapõlemiseks on vaja mõlema süütaja tikku. Kas võib öelda, et süütaja A on metsa mahapõlemise põhjustaja? (Ei) Kas abstraktne põhjuslikkuse struktuur selles ja eelmises näites on sama? (Ei) Kui metsa mahapõlemiseks piisab ainult ühe süütaja tikust ja mõlemad viskavad tiku, siis kas süütaja A on metsa mahapõlemise põhjustaja?

Billy haigestub mittesurmavasse haigusesse pühapäeval. Kui esmaspäeval tööl olev arst talle ravimit annab, on Billy teisipäeval terve. Kui esmaspäeva arst teda ei ravi, aga teisipäeva arst ravib, on Billy kolmapäeval terve. Üks ravimidoos ravib, aga kaks on surmav. Kas teisipäevase arsti mitteravimine on Billy kolmapäevase elusoleku põhjus? Aga esmaspäevase arsti mitteravimine?

Kas see, et ma sind ei tulista, on põhjus, miks sa elus oled?

Keskaegne kuningriik. Mõrtsukas plaanib kuningat mürgitada. Kuninga nõunik kahtlustab seda ja annab kuningale vastumürki. Mitmesugustel asjaoludel ei õnnestu mõrtsukal kuningale mürki anda. Kas vastumürgi andmine on kuninga elusolemise põhjus?

David Schmeidler rääkis aksiomaatilisest lähenemisest lihtsusele ja põhjuslikkusele. Sarnaselt paljude otsustusteooria artiklitega postuleeris Schmeidler aksioomid, mida reaalsuse kohta käivate mudelite paremusjärjestus peaks rahuldama ja tuletas neist selle järjestuse funktsionaalse kuju. Seda funktsiooni võib vaadelda ka kui mudeli valiku kriteeriumi.

David Wolpert NASAst rääkis oma tõestusest, et ka deterministlikus ja lõplikus universumis on Laplace’i hüpotees vale. Laplace väitis, et kui talle anda piisavalt infot praeguse kõigi osakeste asukoha ja liikumise kohta universumis, siis võib ta arvutada kogu universumi tuleviku ja mineviku. Meie reaalses universumis on Laplace’i hüpotees vale juba Heisenbergi määramatuse printsiibi kohaselt – pole võimalik samaaegselt ennustada osakese asukohta ja liikumist. Aga hüpoteetilises deterministlikus ja lõplikus universumis, nii nagu seda nähti Laplace’i ajal?

Wolpert alustas vaatluse ja ennustuse defineerimisega. Nende mõningaid ühiseid jooni koondava tegevuse nimetas ta järeldamiseks ja defineeris järeldusmasina – objekti, millele me võime esitada maailma kohta jah/ei küsimusi ja saada vastuseks ühe biti 0 või 1, vastavalt siis ei või jah. Järeldamine on nii vaatluse kui ennustuse jaoks tarvilik, aga mitte piisav. Wolperti põhiline teoreem oli, et iga sündmuse kohta eksisteerib järeldusmasin, mis suudab seda sündmust järeldada, aga iga järeldusmasina jaoks on olemas sündmus, mida see masin järeldada ei suuda.

Wolperti näited olid sarnase struktuuriga, mida matemaatikas nimetatakse Cantori diagonalisatsiooniargumendiks. Arvutiteaduses on sarnane olukord Turingi masina puhul – on olemas sündmus, et see masin peatub. Aga masin ei suuda vastata küsimusele, kas ta peatub.

Järeldusmasina puhul nimetagem V-ks nende maailma arenguteede hulka, kus masin homme vastab täna küsitud küsimusele jah. Homseks on need arenguteed natuke läbitud, nimetagem samade arenguteede hulka homme V’-ks. Masin ei suuda õigesti vastata küsimusele, kas me oleme homme väljaspool hulka V’. Kui masin ütleks jah, siis ta eksiks, sest kui ta ütleb jah, oleme me hulgas V’, aga küsimus oli, kas me oleme väljaspool seda hulka. Kui masin ütleks ei, siis ta eksiks, sest me oleme nüüd väljaspool hulka V’ ja küsimus oli, kas me oleme väljaspool seda hulka.

Kuna ükski järeldusmasin ei suuda kõigile maailma kohta käivatele küsimustele õigesti vastata, siis ei ole olemas masinat, mis suudaks ennustada kogu universumi tulevikku. Kaval inimene võib küsida, et kui iga sündmuse kohta on masin, mis suudab seda ennustada, siis kas me ei võiks võtta piisavalt palju erinevaid masinaid ja lasta igal neist ennustada jupikest universumit, saades kokku kogu tuleviku ennustuse. Veel kavalam vastaks sellele, et igasuguse masinate kogumi võime me ümber nimetada üheks masinaks, seega eelnev võimatusteoreem kehtib.

Pühapäeva esimese esineja Andrew Barroni teema oli informatsiooniteooria, lihtsus ja tõepära. Ta rääkis, et andmehulga keerukust võib vaadelda kui bittide arvu, mida selle üksüheseks edasiandmiseks vaja läheb. See on arvutiteaduses kaua teada olnud. Barroni uudne väide oli, et tõenäosust võib samuti vaadelda kui bittide arvu koodis ja kodeerimisviise kui tõenäosusjaotusi. Ta rakendas seda vaatepunkti masinõppimise näitele.

Masinõppimisel antakse arvutile kõigepealt mingi treeningandmehulk, mis on võetud mingist tõenäosusjaotusest. Selle põhjal peab masin ennustama andmeid mingist teisest tõenäosusjaotusest ehk üldistama oma varasemat teadmist. Inimestele on see tavaline tegevus, aga arvutite puhul on sellise üldistusvõime tekitamine keeruline.

Aris Spanos rääkis mudelite valikust andmete seletamiseks. Statistikud ja ökonomeetrikud kasutavad enamjaolt lähendamisteooriat ja püüavad leida mudelit, mis kõige paremini andmetele vastab. Spanose kohaselt on see vale lähenemine ja tal oli palju näiteid, kus sellega valesid tulemusi saadakse. Oluline pole Spanose sõnul mitte lähenduse täpsus ehk väike vahe mudeli ja andmete vahel, vaid selle vahe (mudeli jäägi, model residual) mittesüstemaatilisus. Näiteks n andmepunkti võime me lähendada (n-1) järku polünoomiga ja saada täpse vastavuse, aga see mudel on ennustuste või järelduste seisukohast väärtusetu.

Statistilisi mudelivalikukriteeriume rakendatakse eelnevalt valitud mudelite klassis. Kui see klass on aga valesti valitud, siis valikukriteeriumi rakendamine selle sees annab vale tulemuse. Iga mudeli puhul peaks kontrollima selle statistiliste eelduste täidetust ja kui need pole täidetud, siis valima mõne muu mudeli hoolimata sellest, kui lähedane antud mudel andmetele on.

Larry Samuelson rääkis inimeste lihtsuse-eelistustest. Näiteks rida 010101 jätkaks enamik inimesi paariga 01 ja rida 1,2,4,8 arvuga 16. Aga on palju teisi mudeleid, mis sobiksid nende ridade algusega ja annaksid järgnevaks tulemuseks hoopis midagi muud. Nii et miks siis on inimeste hulgas kujunenud selline komme või norm, et rida 010101 tuleks jätkata paariga 01?

Samuelsoni vastuseks oli lihtsus. Kuna konverentsi jooksul oli esitatud palju erinevaid lihtsuse ja keerukuse definitsioone, ei hoidnud ka Samuelson end tagasi ja kasutas enda oma. Tema põhiline tulemus oli lihtsuse-eelistuste matemaatilise vormi esitamine. Kõigepealt valib otsustaja erinevate andmeid kirjeldavate mudelite vahel nende tõepära järgi ja seejärel viiki jäänud parimate mudelite vahel nende lihtsuse järgi. Tuleb välja, et niimoodi objektiivsele valikule subjektiivsust lisades saadakse parem tulemus, kui ainult objektiivset tõepärakriteeriumi kasutades.

 

Kuidas otsustada kuidas otsustada kuidas otsustada…

Üks majandusartikkel, mis on minu jaoks väga huvitav, aga täiesti kasutu, on Lipman 1991 How to decide how to decide how to… Modeling limited rationality. See tõestab lahenduse olemasolu järgneva otsustusprobleemi jaoks.

Olgu meil mingid alternatiivid, mille hulgast me tahame optimaalse valida. Selleks tuleb valida parim valikumeetod, aga meetodi valik on omakorda otsustusprobleem. Tuleks valida parim meetod meetodi valikuks, parim meetod meetodi valiku meetodi valikuks, meetodi valiku meetodi valiku meetodi valikuks jne. Tegemist on lõpmatu rekursiooniga.

Lipman 1991 tõestab, et lahendus sellele valikute jadale eksisteerib, aga alles pärast lõpmatust (induktsioon ordinaalarvudel, mitte naturaalarvudel). Nii et kui me läheme lõpmatusest edasi, siis jõuame kunagi lahendini. Tõestus pole konstruktiivne, näitab ainult lahendi olemasolu, nii et lahendusalgoritmi see ei anna. Seetõttu on artikkel üsna kasutu.

Ebakindluse liigid

Kirjutan natuke enda uurimistöö taustast. Püüan matemaatiliselt kirjeldada teadmatust, mis on üks ebakindluse liike. Majandusteadus on kaua uurinud riski, mis on kirjeldatav tõenäosusjaotusega üle teadaolevate tulemuste. See on kõige laiemalt tuntud ebakindluse liik.

Viimase veerandsajandi jooksul on majanduses riskile lisandunud ebamäärasus (ambiguity, tõlgitav ka mitmemõttelisusena), mille puhul on võimalikud tulemused teada, aga tõenäosused mitte. Selle asemel on teada tõenäosusjaotuste hulk või mingi tõenäosuse üldistus, näiteks mahtuvus (minu tõlge sõnast capacity, täpset matemaatikaterminit eesti keeles ei tea). Nii riski kui ebamäärasuse puhul teab otsustaja, et ta ei tea ja mida täpselt ta ei tea.

Loogikas hakati kaheksakümnendate lõpus ja majanduses üheksakümnendate lõpus uurima teadmatust (unawareness), mis on ebakindluse liik, mille puhul pole teada kõik võimalikud tulemused. Teadmatuse all kannatav otsustaja mudelis ei tea, et ta ei tea ja mida ta ei tea.

2009. aastal lisandus kolmele eelnimetatud ebakindluse liigile veel eneseteadlik teadmatus (self-aware unawareness), mille puhul otsustaja teab, et on olemas midagi, mida ta ei tea, aga ta ei tea täpselt, mis see on. Eneseteadlik teadmatus on tavalise teadmatuse ja ebamäärasuse vahepealne mõiste, kuna otsustaja teab, et ta ei tea, aga ei tea, mida ta ei tea.

Tavaline teadmatus on otsustaja enda vaatepunktist nagu teadmatuse puudumine – ta arvab, et teab kõiki tulemusi ja ainus ebakindlus tuleb riskist ja ebamäärasusest. Järelikult käitub ta, nagu tavaliselt sellise teadmise korral. Ainult modelleerija vaatepunktist on mudelis oleva agendi uskumused valed.

Eneseteadliku teadmatuse puhul muudab agent mudelis ilmselt oma käitumist, kuna tema vaatepunktist erineb olukord tavalisest riski ja ebamäärasusega otsustusprobleemist.