Sildiarhiiv: statistika

Teadus ei anna tõde, küll aga parima signaali selle kohta

Arvan, et eksisteerib tõde – kuidas universumis asjad tegelikult on – aga see eksistents on usuküsimus. Eeldame, et tõde on olemas. Gödeli võimatusteoreemi kohaselt pole kõik tõesed väited tõestatavad. Seega teadus ei saa tõestada kõiki tõeseid väiteid.

Vaatame siis ainult matemaatiliselt tõestatavaid väiteid, mis peavad olema tõesed, aga ei hõlma kõiki tõeseid väiteid. Inimkonna praegune teaduse tase on kaugel sellest, et jõuda kõigi tõestatavate väidete tõestamiseni. Lisaks on minevik näidanud, et teaduses tehakse aeg-ajalt vigu. Seetõttu on tõenäoline, et ka praeguses teaduses on vigu, ehk teadus on „tõestanud“ ka mõned väärad väited. Loodetavasti lükatakse need väärad tõestused tulevikus ümber.

Enamik teadustööd väiteid ei tõesta (matemaatilise loogika mõistes), vaid pakub statistilist hinnangut tulemuste õigsuse kohta. Teaduse areng tähendab veapiiride kitsenemist ja täpsemaid tõenäosushinnanguid suurema arvu väidete kohta. Kui teadus tulemust ei tõesta, vaid annab statistilise hinnangu, siis ei tea inimkond antud asjas tõde, vaid ainult tõenäosuslikku signaali tõe kohta.

Miks siis kasutada teadust? Sest see on parim tõe kohta saadaolev signaal, mis inimkonnal on. „Parim signaal“ on informatsiooniteoreetiline mõiste, mis tähendab, et kõik teised signaalid on antud signaali mürarikkamad variandid. Kui tahta teha otsust, mille tulemus sõltub sellest, milline on tegelik tõde, siis parima oodatava tulemuse saamiseks tuleks järgida parimat signaali. Mõni teine signaal võib mõnel juhul anda sama hea tulemuse kui parim signaal, aga ei saa kunagi anda paremat, sest teise signaali võime saada parimast signaalist osa teabe ära viskamisel.

Teadusvastaste üks tavalisi demagoogiavõtteid on: „Kas sa arvad, et teadus teab kõike? Aga miks siis teadus pikka aega uskus valeväidet X, mis nüüdseks on ümber lükatud?“ Neid hiljem ümber lükatud väiteid on palju, sest enamjaolt annab teadus vaid tõenäosusliku tulemuse ja tulemuste suure hulga tõttu on ka ümber lükatud tulemusi arvukalt. Üks võimalik vastus ülaltoodud demagoogiavõttele ongi, et teadus ei tea muidugi kõike, aga on statistiliselt parim signaal tõe kohta, mis meil on. Rumal oleks jätta kasutamata osa inimkonnal olemas olevast infost, otsustades mingi halvema signaali (usu, ideoloogia, naabri jutu, internetifoorumi postituste) põhjal. Agressiivsem ja demagoogilisem vastus oleks: „Aga kas sina arvad, et sinu usk/ideoloogia/kuulujutt teab kõike? Miks siis see allikas pikka aega uskus valeväidet Z, mis nüüdseks on ümber lükatud? Teadus esitab vähem valeväiteid ja lükkab need kiiremini ümber, kui sinu allikas. Aeg-ajalt võib teadus eksida ja sinu allikas sama asja kohta õiget infot anda, aga see on harv juhus, keskmiselt see nii ei ole.“ 

Bayesi reeglit võiks õpetada algkoolis

Veerpalu dopingujuhtum on järjekordne näide selle kohta, et inimesed ei mõista valepositiivseid ja valenegatiivseid tulemusi, ehk üldisemalt tinglikku tõenäosust. Ometi on tingliku tõenäosuse valdamine õige otsustamise juures üks olulisemaid tegureid. Näiteks Pratt ja kaasautorid (1964) tõestavad, et otsustamine, mis rahuldab väga nõrku eeldusi mõistlikkuse kohta stiilis „kui A on eelistatud B-le ja B C-le, siis A on eelistatud C-le“, peab järgima Bayesi reeglit.

Kuna Bayesi reegli intuitiivne seletus ei nõua mingit matemaatilist tausta ja reegel ise on nii laialt kasutatav ja oluline, võiks seda õpetada algkoolis või lausa lasteaias. Oot-oot, ütleb nüüd lugeja, Bayesi reegli jaoks on vaja korrutamist-jagamist, mis ometi on matemaatika ja võib ka mõnele täiskasvanule üle jõu käia. Sellest vastuväitest hiilisin ma eelnevalt aga kavalasti mööda, öeldes „intuitiivne seletus“, mitte lihtsalt reegel ise. Ka on osa matemaatikat lihtsam, kui esmapilgul paistab, näiteks on võimalik kuueaastasele lineaarvõrrandite lahendamist õpetada.

Bayesi reegli intuitiivne seletus võib sisaldada järgmisi osi. Joonistatakse ruut, jagatakse neljaks ruuduks ja seletatakse, et ülemises reas on õige vastus jah, alumises ei, vasakus tulbas on kellegi väidetav vastus jah, paremas ei. Nii et tuleb arvestada kõiki nelja varianti. Kui me nüüd teame, et keegi väidab kogu aeg jah, mida me saame tema jah-väitest tõe kohta järeldada? Mitte midagi. Samuti kellegi väitest, kes ütleb kogu aeg ei. Kui väide on kogu aeg õige, pole millegi üle arutleda, vastus on teada. Samuti kui väide on kogu aeg vale.

Kui on kaks inimest ja üks neist eksib tihedamini kui teine (näiteks teisel on kogu aeg õigus) ja nad väidavad vastupidiseid asju, kumba peaksime rohkem uskuma? Kui meil on teada neist kahest ainult ühe väide (jah), siis kumma inimese jah-väite puhul on meil rohkem usku, et tõde on „jah“?

Kui on kaks inimest, kes vahel räägivad tõtt, vahel valetavad sedamoodi, et esimene väidab „jah“ ka siis, kui vastus on ei, kuid mitte kunagi „ei“ kui vastus on jah ja teine väidab vahel „ei“ ka siis, kui vastus on jah, kuid mitte kunagi „jah“ kui vastus on ei, siis kumma inimese väite „jah“ peale peaksime rohkem uskuma, et tõde on „jah“? Järgmiseks võib võtta kaks inimest, kes võivad valetada mõlemas suunas, aga üks valetab rohkem jah-suunas, teine rohkem ei-suunas ja korrata küsimust.

Siis võib veel teha sissejuhatuse hulgateooriasse, joonistades lõikuvaid ringe ja rääkides noolemängust: kui teame, et nool langes esimesse ringi, kas me teame, et langes teise ringi? Kui teame, et langes esimesse ringi, kas teame, et ei langenud teise ringi? Kui kolm ringi lõikuvad ja kahe esimese ühisosa on ilmselgelt suurem kui teise ja kolmanda ning meile öeldakse, et nool langes teise ringi, siis kas peaksime rohkem uskuma, et langes esimesse või rohkem, et langes kolmandasse.

Ja lõpueksam on Monty Halli küsimus. Kes küsimust varem näinud pole ja esimese korraga õigesti vastab, saab kommi 🙂