Sildiarhiiv: teadus

Katsed endaga

Meditsiinis on katsetel endaga pikk ajalugu (http://en.wikipedia.org/wiki/Self-experimentation). Põhjuseks enamasti teiste katsejäneste puudumine või arvatavalt ohtlike katsete teiste peal tegemise ebaeetilisus.
Hoopis teine alus on tavalisel inimesel igapäevaelus enda peal katset teha – soov teada, kas mingi müüdav toode ka töötab nagu lubatud. Tihti pole toote omadusi põhjalikult uuritud, aga sel väidetakse igasuguseid kasulikke aspekte olevat. Isegi kui korralikud uuringud on näidanud toote efektiivsust keskmise inimese jaoks, võib isiklik kogemus erineda. Ostjat huvitab ju ikka, kas toode on kasulik temale, mitte keskmisele inimesele.
Olen katsetanud kätekreemi ja leidnud selle kahjuliku olevat. Taustaks: talvel kuiva õhuga kipub nahk mu sõrmenukkidel kuivusest lõhenema. Soovitati kätekreemi. Kohe pärast kreemitamist läks nahk muidugi niiskeks ja lõhed hakkasid paranema. Aga paari tunni pärast oli kreem sisse imbunud või ära auranud ja nahk jälle kuiv ja lõhenev. Uuesti kreemi, uuesti kuivaks… Paari nädala pärast tekkis kahtlus, kas kreem mitte pikas perspektiivis ei soodusta nahalõhesid. Teoreetiline mehhanism oleks, et nahk reageerib kestvale kuivusele viitajaga. Kui mitte kreemitada, siis niisutab end seestpoolt ja lõhede arv väheneb võrreldes kuiva aja algusega. Kui aga kreemitada, siis segab see kohanemist, seespoolne niisutamine ei tööta ja lõhesid tuleb juurde. Teisest küljest muidugi võib kreem aidata nagu lubatud. Vaja andmeid, et selgusele jõuda.
Valisin siis juhuslikult ühe käe kreemitamiseks ja teise jätsin kreemita. Paari nädala pärast oli ilma kreemita käel selgelt vähem lõhesid.  Jätsin siis kreemitamise edaspidi ära ja kannatasin kuiva aja alguses lõhed ära.
Olen katsetanud ka näonaha haiguse vastast ravimit, mis selgus aitavat, aga ainult natuke. Jällegi tekkis kahtlus ravimi efektiivsuse suhtes. Jätkasin selle kasutamist ühel näopoolel ja lõpetasin teisel. Nädala jagu polnud vahet näha. Pärastpoole tundus ravimiga näopool paari nädala jooksul õige pisut tervem. Kasutasin siis ravimit mõlemal pool edasi.
Korraliku katsega on mu enesekatsetustel muidugi suur erinevus. Puudub platseebokontroll ja eelnevalt paika pandud katseprotokoll, katsetaja teab, kumb kehapool saab katseainet ja kumb mitte. Aga mingi teabekild sellest katsest ikka tuleb.
Keda huvitab, võib enda peal võrrelda eri kosmeetikatooteid, näiteks aknevastaseid vahendeid, või kas üks raseerija töötab paremini kui teine. Ei saa muidugi kontrollida kogu keha hõlmavate seespidiste käsimüügiravimite toimet. Ma ei soovita haiguses resistentsust tekitavate ravimite osalist kasutamist.

Nahkkinnaste kasvatamine

Huvitav, kui kalliks läheks järgmine nahkkinnaste tootmise viis: teha käelabast plastik- või kipsmudel, katta kollageeniga, istutada sellele näiteks sea naharakke, kasvatada toitevedelikus paar nädalat kuni paar kuud, et mudelile nahk peale kasvaks. Siis võtta mudel vedelikust välja, parkida nahk ära ja võtta mudelilt maha. Või kõigepealt nülgida nahk mudelilt ja siis parkida. Tulemuseks oleks täpselt käele istuv nahkkinnas ühegi õmbluseta.

Tehnoloogia on olemas, sest biomeditsiinilise uurimistöö käigus on nahatükke kasvatatud, nagu ka veresooni ja põisi, ühesõnaga õhukesest membraanist koosnevaid lihtsa kujuga organeid. Ainuke probleem võib olla hind, sest toitevedelikus kasvatamine nõuab aega, kindlal temperatuuril hoidmist ja võibolla kalleid materjale.

Kuidas valida uurimisteemat

Teema peab olema piisavalt suurele hulgale inimestele huvitav, et selle valdkonna uurimistöö koguks piisavalt viiteid, et õigustada kulutatud aega. Töö ei tohiks olla liiga lihtne, muidu ei võeta seda tõsiselt. Töö ei tohiks olla liiga keeruline, muidu nõuab selle tegemine liiga palju aega ja pingutust. Töö ei tohi olla varem tehtud, vaja on originaalsust.

Keerulisuse, originaalsuse ja huvitavuse kriteeriumid muutuvad ajas. Huvitavuse kohta ei oska ma selget trendi välja tuua – kord on moes üks valdkond, kord teine. Keerulisuse ja originaalsuse mõõtmetes võib joonistada järgmise pildi, kus keerulisus on vertikaalteljel, originaalsus horisontaalteljel. Graafikul on üks enamvähem püstine ja kaks mittelõikuvat enamvähem horisontaalset joont. Püstisest joonest vasakul on juba tehtud uurimistöö, paremal veel tegemata. Alumisest horisontaaljoonest allpool on liiga lihtsad teemad, ülemisest horisontaaljoonest üleval liiga keerulised. Head uurimisteemad jäävad kahe horisontaaljoone vahele ja vertikaaljoonest paremale.

Ajas liigub vertikaaljoon paremale, sest teemad muutuvad pidevalt veel tegemata olekust tehtud olekusse. Mõlemad horisontaaljooned liiguvad ülespoole, sest uute meetodite leiutamisega muutuvad osad varem liiga keerulised teemad tehtavaks ja osad varem parajalt keerulised teemad triviaalseks ja ebahuvitavaks. Heade teemade hulk võib kokkuvõttes suureneda või väheneda, aga keskmine hea teema muutub keerulisemaks, kuna lihtsamad teemad kasutatakse suurema tõenäosusega ära.

Uued meetodid küll lihtsustavad uurimistööd, aga enne peab need järjest keerulisemad meetodid endale selgeks tegema, nii et küsimusele vastamise kogukeerukus suureneb. Sellest olen kirjutanud postituses Teaduse piirid kaugenevad.

Matemaatikute sisseränne ja konkurents USAs

Borjas ja Doran kirjutavad QJEs, kuidas Nõukogude Liidu lagunemise järgne matemaatikute sissevool USAsse mõjutas sealsete matemaatikute karjääri- ja avaldamisvõimalusi. Sissevoolu järgselt jäi rohkem matemaatika doktorikraadi saanuid töötuks ja lahkus teadusest, USA matemaatikud liikusid madalama tasemega ülikoolidesse ja avaldasid vähem artikleid.

Seda kõike on lihtne ennustada nõudluse ja pakkumise mudelist. Matemaatikute pakkumine suurenes, aga nõudlus jäi samaks, sest uusi töökohti ega ilmselt ka teadusajakirju ei loodud. Sama arv matemaatikuid täitis sama arvu kohti, aga need olid erinevad inimesed. Sisserännanud matemaatikud said töökohad ülikoolides, kust siis mõned seal varem olnud teadlased lahkusid nõrgematesse ülikoolidesse, kust omakorda osa varasemaid olijaid pidi lahkuma jne. Ülikoolide pingerea allotsa jõudes pidid sealt välja tõrjutud matemaatikud teadusest lahkuma.

Borjas ja Doran väidavad, et USA matemaatikute tootlikkus langes sisserände tagajärgel, aga sisserändajate teadustöö kompenseeris selle üsna täpselt. Kui autorid arvavad, et avaldatud teadusartiklite hulk (mis on neil tootlikkuse mõõduks) mõõdab teadlase absoluutset tootlikkust, siis teevad nad vea, jättes arvestamata samaks jäänud avaldamisvõimaluste arvu. Kui suurem arv teadlasi konkureerib sama arvu artiklikohtade pärast ajakirjades, siis loomulikult varasemate olijate artiklihulga langus võrdub uute tulijate artiklihulgaga. See ei tähenda kohalike teadlaste tootlikkuse langust, vaid keskmise artikli kvaliteedi tõusu. Fikseeritud artiklikohtade arvu korral mõõdab avaldatud artiklite hulk inimese suhtelist tootlikkust võrdluses teiste sama valdkonna teadlastega.

Kui ajakirjade toimetajad valivad neile saadetud artiklitest n parimat, siis sisse rännanud matemaatikud suudavad kohalike artikleid ajakirjadest välja tõrjuda ainult parema kvaliteedi abil. Kui uued tulijad avaldavad m artiklit, siis nende m artikli minimaalne kvaliteet on suurem või võrdne välja tõrjutud artiklitest parimaga. Kvaliteedi minimaalse tõusu suuruse saab leida, eeldades et immigrantide artiklid asendavad täpselt kohalike kõige viletsamad artiklid. Maksimaalse tõusu suurust lihtsalt avaldamisandmete põhjal leida ei saa, sest kui sisserändajate m artiklit on paremad kui kõik kohalike omad, siis võivad nad olla kuitahes palju paremad. Asendades m kohalike tippartiklit, sunnitakse asendatud artikleid asetuma m järgmisele kohale, m järgmist omakorda asendavad neist allpool olevaid jne. Ajakirjadest välja jäävad ikka kõige viletsamad, aga juurdetulijad võivad olla lõpmatult paremad kui algne hulk.

Muidugi pole ajakirjade toimetajad kõiketeadjad ega suuda alati valida parimaid artikleid, aga kui nad keskmiselt teevad õige otsuse (valivad parema artikli suurema tõenäosusega kui halvema), siis eelnev argument kehtib, ainult muutuste suurus väheneb (kvaliteet tõuseb vähem).

Tõestustest ja edusammudest matemaatikas

William Thurston (1994) on kirjutanud huvitava artikli teadustöö tegemisest matemaatikas. Üks tema meeldejääv mõte on, et matemaatiku ülesanne pole ainult suurimat võimalikku arvu teoreeme tõestada, vaid ka oma matemaatikavaldkonda populariseerida ja teistele selgitada.

Filosoofilisest vaatepunktist ei pea matemaatikas mitte ainult tõeseid tulemusi teadma, vaid ka nende tõestustest aru saama. Seetõttu on arvutipõhised tõestused vähem väärtuslikud, kui „käsitsi tehtud“. Thurstoni kohaselt peaks edendama inimkonna arusaamist matemaatikast, mille üks osa on uute tulemuste tõestamine, aga oluline on ka ideede selgitamine.

Isikliku kasu vaatepunktist tuleb osa uurimistöö meeldivusest teiste inimeste huvist teema vastu, nende heakskiidust tehtud tööle ja võimalusest ühist huvi pakkuval teemal arutleda. Seega peaks teadlane olema huvitatud oma valdkonna teistele selgitamisest ja teiste kaasatõmbamisest oma suuna uurimistöösse. Selle nimel on mõtet vähem uut teadustööd teha ja rohkem vana selgitada ja õpetada.

Ma ise lisaksin veel ühe iseka põhjuse, miks oma tööd teistele „müüma“ peaks – kui valdkonda lisandub teadlasi, siis tsiteeritakse varasemaid tulemusi rohkem. Need varasemad tulemused on pärit valdkonda varem sisenenud teadlastelt, kelle akadeemiline tuntus tõuseb, kui valdkond populaarsemaks muutub.

Üldisemalt on teaduse tegemise eesmärk, et ühiskond sellest mingit kasu saaks. Kasu saamiseks peavad inimesed teadust kuidagi kasutama ja kasutamiseks on vaja seda teatud määral mõista. Teaduse selgitamine teenib seega üldist eesmärki. Vahel rohkemgi, kui uue teaduse loomine.

Teoreetilise ja empiirilise teadustöö võrdlus

Tippülikoolide majandusteaduskondades tundub teoreetikute osakaal olevat oluliselt suurem kui järjestuses madalamatel kohtadel olevates teaduskondades. Üks võimalik seletus on, nõudlus teooria õpetamise järele on väike, seega teoreetikuid palkavad uurimisülikoolid, mitte õpetamisülikoolid, ning uurimisülikoolid on (teadustöö põhjal tehtavas) järjestuses kõrgemal.

Teine seletus on, et et originaalset teoreetilist teadustööd on raskem teha, sest see ei vanane nagu empiirika. Kui kunagi tõestati mingi teoreem või loodi mudel, pole seda mõtet uuesti teha. Sama empiirilist analüüsi saab aga rakendada erinevatele andmetele – võtta valim teisest piirkonnast, inimrühmast, ajaperioodist. Igal aastal korraldatakse uued küsitlused, igal kümnendil uus rahvaloendus, mis võimaldavad teha uue empiirilise teadustöö vanade meetoditega. Lisaks võib uue empiirilise meetodi leiutamisel kõik vanad analüüsid sellega üle käia.

Sama meetodi eri andmehulkadele rakendamise võimaluse tõttu on empiirilise töö tegemiseks vaja väiksema hulga eelneva teaduse tundmaõppimist. Selgeks peab saama meetodi, mis võib olla suhteliselt lihtne, nagu vähimruutude regressioon. Teoreetilise töö jaoks peab jõudma pidevalt kaugenevale teaduse piirile – peab tundma kõiki antud valdkonnas tehtud teoreetilisi töid, et olla kindel, et mõnes neist pole sama asja tehtud.

Empiirika puhul peab kontrollima, et sama andmehulka pole varem kasutatud. Kui andmehulk on uus, piisab viimase aasta-paari artiklite vaatamisest. Teoorias peab vaatama ka vanu artikleid, sest matemaatiline tulemus võib olla saadud kaua aega tagasi.

Selleks, et aru saada, kas mingi teoreetiline artikkel on antud mudelit varem uurinud, peab vaatama mudelit ennast artikli põhiosas, lühikokkuvõttest üldiselt ei piisa.

 

Teaduse piirid kaugenevad

Mida suuremaks paisub inimkonna teadmistekogum, seda raskem on saada teadlaseks. Selleks et teadust edasi arendada, tuleb kõigepealt jõuda selle praegusele piirile. Seega tuleb õppida ära siiani tehtu antud valdkonnas. Mida kaugemale teadus areneb, seda raskem ja aeganõudvam on varasemate teadmiste selgekssaamine.

Ühest küljest viib see õppeaja, eriti doktorantuuri pikenemiseni. Teisest küljest kitsama spetsialiseerumiseni – mida kitsam valdkond, seda vähem on materjali, mis teadmiste piirile jõudmiseks ära õppida tuleb. Õpitakse ju nii sügavuti kui laiuti, seega järeleandmine ühes mõõtmes võimaldab kiiremat edasiliikumist teises.

Tulemuse võib kokku võtta tsitaadiga „Eksperdid on inimesed, kes teavad üha rohkem ja rohkem üha vähemast ja vähemast, kuni piirväärtusena teavad nad kõike mitte millestki“. Üks mõõdetav märk kitsamast spetsialiseerumisest on teadusartiklite keskmise kaasautorite arvu suurenemine. Iga autor teeb artikli juures üha väiksema ja spetsialiseerituma osa.

Tasakaalustavad tegurid, mis aeglustavad õppeaja pikenemist ja erialade kitsenemist, on eluea pikenemine, inimeste kiirem õppimine ja parema tehnika kasutamine. Pikem eluiga võimaldab kauem õppida ja pärast piisavalt pikalt töötada. Tehnika poolelt aitavad eriti arvutid rutiinseid ülesandeid kiiremini ja lihtsamini täita, mis jätab rohkem aega sisulisele poolele. Kiirem õppimine tuleneb parematest õpetamismeetoditest ja teadmiste paremast süstematiseerimisest. Näiteks matemaatikas mõeldakse välja lühemaid ja lihtsamaid tõestusi teadaolevatele teoreemidele, mis kiirendab nende äraõppimist.

Pikas perspektiivis peab kusagil saabuma eluea, õppimiskiiruse ja tehnika kasutamise piir, kui teadmiste omandamine jääb oma praegusesse vormi. Tehnika kasutamist peab ju omakorda õppima, nii et lõpuks taandub küsimus elueale ja õppekiirusele. Kui eluea pikenemine ja õppimiskiiruse suurenemine pole lõputu, siis lõpeb kunagi teaduse areng.

Lahendus piiratud õppimiskiirusele oleks teadmiste otsene kandmine ajju, näiteks ühendades aju arvutiga (küborg), mis võimaldaks vajalikud teadmised alla laadida või ajuga ühendatavale arvutile sisse ehitada. Samuti kiirendaks see inimestevahelist suhtlust, mis praegu seisab piiratud rääkimis- ja kirjutamiskiiruse taga. Teadusartiklite kaasautorite arv võiks kiirema kommunikatsiooni korral samuti suureneda.

Samaaegsetest avastustest

Teaduses on korduvalt ette tulnud, et sama avastus tehakse umbes samal ajal kahe või rohkema teadlase poolt, kes üksteise tööst ei tea. See lükkab ümber teaduse arengu geeniuse teooria, mis väidab, et suurem osa teadlasi nokitseb niisama pisiküsimuste kallal, aga vahel sünnib geenius, kes teeb tõelise läbimurde. Ja siis nokitsetakse jälle edasi, kuni järgmise geeniuseni. Kui revolutsiooniliseks avastuseks on vaja midagi haruldast ja erilist, siis peaksid samaaegsed avastused olema üliharvad, sest need eeldavad kahe haruldase sündmuse koostoimumist.

Teine teaduse arengu seletus on hiiglaste õlgadel seismise teooria, mis ütleb, et kui teadus on teatud maani arenenud, siis järgmine samm on üsna läbipaistev ja lihtne. Seega kui mitu kompetentset inimest loevad sama teaduskirjandust, siis tekib tõenäoliselt enamikul neist sama idee, kuidas tulemusi edasi arendada. Ja nad teevad avastuse enamvähem samaaegselt.

Mul oli just 2011 sügisel juhust hiiglaste õlgadel seismise teooriale isiklikku kinnitust leida. Nimelt on minu universaalsete teadmatuse tüübiruumide artikliga väga sarnaseid artikleid samal kuul kirjutatud tervelt kaks – ühe autoriteks Pintér ja Udvar ning teisel Heifetz, Meier ja Schipper. Kokku niisiis kolm sõltumatut samaaegset avastust. Pole eriti tõenäoline, et kõigi autoriteks geeniused on (vähemalt ühe puhul on kindel, et pole).

Lihtsuse ja tõepära konverents

13.-15. novembril 2009 oli meil majandusteaduskonnas lihtsuse ja tõepära konverents (Workshop on simplicity and likelihood), organiseerijateks Itzhak Gilboa ja Larry Samuelson. Külalisi oli umbes kakskümmend.

Konverents oli huvitav segu ökonomeetria teooriast ja otsustusteooriast. Esinejate hulgas oli lisaks majandusteadlastele arvutiteadlasi, füüsikuid ja statistikuid. Teemad olid väga abstraktsed ja matemaatilised, seetõttu minu jaoks väga huvitavad. Reedel oli mul päev loengutega täidetud, nii et konverentsile jõudsin alles laupäeva hommikul.

Laupäeva esimene esineja oli Joe Halpern Cornellist. Ta rääkis põhjuslikkusest ja esitas selle matemaatilise kirjelduse, illustreerides seda näidetega filosoofiast ja õigusteadusest. Põhjuslikkus, süü ja vastutus on matemaatiliselt erinevad mõisted (vähemalt Halperni mudelis) ja üks kriteeriume põhjuste järjestamisel on, kui palju ebanormaalsemaks see maailma muudab. Halperni näited on järgnevad:

Billy ja Sue viskavad kividega pudelit. Mõlemad on täpse käega, aga Sue kivi jõuab esimesena kohale ja purustab pudeli. Billy kivi oleks selle ka purustanud, kui Sue oma selle terveks jätnud oleks. Nii et kui Sue poleks visanud, siis oleks pudel ikka purunenud. Kas võib öelda, et Sue kivivise on pudeli purunemise põhjus? (Jah)

Võrdluseks eelmisele näitele: kaks süütajat viskavad põleva tiku metsa. Ühe süütaja tulekahju suudavad päästjad kustutada, aga kui mets kahest otsast põleb, siis ei suuda. Nii et metsa mahapõlemiseks on vaja mõlema süütaja tikku. Kas võib öelda, et süütaja A on metsa mahapõlemise põhjustaja? (Ei) Kas abstraktne põhjuslikkuse struktuur selles ja eelmises näites on sama? (Ei) Kui metsa mahapõlemiseks piisab ainult ühe süütaja tikust ja mõlemad viskavad tiku, siis kas süütaja A on metsa mahapõlemise põhjustaja?

Billy haigestub mittesurmavasse haigusesse pühapäeval. Kui esmaspäeval tööl olev arst talle ravimit annab, on Billy teisipäeval terve. Kui esmaspäeva arst teda ei ravi, aga teisipäeva arst ravib, on Billy kolmapäeval terve. Üks ravimidoos ravib, aga kaks on surmav. Kas teisipäevase arsti mitteravimine on Billy kolmapäevase elusoleku põhjus? Aga esmaspäevase arsti mitteravimine?

Kas see, et ma sind ei tulista, on põhjus, miks sa elus oled?

Keskaegne kuningriik. Mõrtsukas plaanib kuningat mürgitada. Kuninga nõunik kahtlustab seda ja annab kuningale vastumürki. Mitmesugustel asjaoludel ei õnnestu mõrtsukal kuningale mürki anda. Kas vastumürgi andmine on kuninga elusolemise põhjus?

David Schmeidler rääkis aksiomaatilisest lähenemisest lihtsusele ja põhjuslikkusele. Sarnaselt paljude otsustusteooria artiklitega postuleeris Schmeidler aksioomid, mida reaalsuse kohta käivate mudelite paremusjärjestus peaks rahuldama ja tuletas neist selle järjestuse funktsionaalse kuju. Seda funktsiooni võib vaadelda ka kui mudeli valiku kriteeriumi.

David Wolpert NASAst rääkis oma tõestusest, et ka deterministlikus ja lõplikus universumis on Laplace’i hüpotees vale. Laplace väitis, et kui talle anda piisavalt infot praeguse kõigi osakeste asukoha ja liikumise kohta universumis, siis võib ta arvutada kogu universumi tuleviku ja mineviku. Meie reaalses universumis on Laplace’i hüpotees vale juba Heisenbergi määramatuse printsiibi kohaselt – pole võimalik samaaegselt ennustada osakese asukohta ja liikumist. Aga hüpoteetilises deterministlikus ja lõplikus universumis, nii nagu seda nähti Laplace’i ajal?

Wolpert alustas vaatluse ja ennustuse defineerimisega. Nende mõningaid ühiseid jooni koondava tegevuse nimetas ta järeldamiseks ja defineeris järeldusmasina – objekti, millele me võime esitada maailma kohta jah/ei küsimusi ja saada vastuseks ühe biti 0 või 1, vastavalt siis ei või jah. Järeldamine on nii vaatluse kui ennustuse jaoks tarvilik, aga mitte piisav. Wolperti põhiline teoreem oli, et iga sündmuse kohta eksisteerib järeldusmasin, mis suudab seda sündmust järeldada, aga iga järeldusmasina jaoks on olemas sündmus, mida see masin järeldada ei suuda.

Wolperti näited olid sarnase struktuuriga, mida matemaatikas nimetatakse Cantori diagonalisatsiooniargumendiks. Arvutiteaduses on sarnane olukord Turingi masina puhul – on olemas sündmus, et see masin peatub. Aga masin ei suuda vastata küsimusele, kas ta peatub.

Järeldusmasina puhul nimetagem V-ks nende maailma arenguteede hulka, kus masin homme vastab täna küsitud küsimusele jah. Homseks on need arenguteed natuke läbitud, nimetagem samade arenguteede hulka homme V’-ks. Masin ei suuda õigesti vastata küsimusele, kas me oleme homme väljaspool hulka V’. Kui masin ütleks jah, siis ta eksiks, sest kui ta ütleb jah, oleme me hulgas V’, aga küsimus oli, kas me oleme väljaspool seda hulka. Kui masin ütleks ei, siis ta eksiks, sest me oleme nüüd väljaspool hulka V’ ja küsimus oli, kas me oleme väljaspool seda hulka.

Kuna ükski järeldusmasin ei suuda kõigile maailma kohta käivatele küsimustele õigesti vastata, siis ei ole olemas masinat, mis suudaks ennustada kogu universumi tulevikku. Kaval inimene võib küsida, et kui iga sündmuse kohta on masin, mis suudab seda ennustada, siis kas me ei võiks võtta piisavalt palju erinevaid masinaid ja lasta igal neist ennustada jupikest universumit, saades kokku kogu tuleviku ennustuse. Veel kavalam vastaks sellele, et igasuguse masinate kogumi võime me ümber nimetada üheks masinaks, seega eelnev võimatusteoreem kehtib.

Pühapäeva esimese esineja Andrew Barroni teema oli informatsiooniteooria, lihtsus ja tõepära. Ta rääkis, et andmehulga keerukust võib vaadelda kui bittide arvu, mida selle üksüheseks edasiandmiseks vaja läheb. See on arvutiteaduses kaua teada olnud. Barroni uudne väide oli, et tõenäosust võib samuti vaadelda kui bittide arvu koodis ja kodeerimisviise kui tõenäosusjaotusi. Ta rakendas seda vaatepunkti masinõppimise näitele.

Masinõppimisel antakse arvutile kõigepealt mingi treeningandmehulk, mis on võetud mingist tõenäosusjaotusest. Selle põhjal peab masin ennustama andmeid mingist teisest tõenäosusjaotusest ehk üldistama oma varasemat teadmist. Inimestele on see tavaline tegevus, aga arvutite puhul on sellise üldistusvõime tekitamine keeruline.

Aris Spanos rääkis mudelite valikust andmete seletamiseks. Statistikud ja ökonomeetrikud kasutavad enamjaolt lähendamisteooriat ja püüavad leida mudelit, mis kõige paremini andmetele vastab. Spanose kohaselt on see vale lähenemine ja tal oli palju näiteid, kus sellega valesid tulemusi saadakse. Oluline pole Spanose sõnul mitte lähenduse täpsus ehk väike vahe mudeli ja andmete vahel, vaid selle vahe (mudeli jäägi, model residual) mittesüstemaatilisus. Näiteks n andmepunkti võime me lähendada (n-1) järku polünoomiga ja saada täpse vastavuse, aga see mudel on ennustuste või järelduste seisukohast väärtusetu.

Statistilisi mudelivalikukriteeriume rakendatakse eelnevalt valitud mudelite klassis. Kui see klass on aga valesti valitud, siis valikukriteeriumi rakendamine selle sees annab vale tulemuse. Iga mudeli puhul peaks kontrollima selle statistiliste eelduste täidetust ja kui need pole täidetud, siis valima mõne muu mudeli hoolimata sellest, kui lähedane antud mudel andmetele on.

Larry Samuelson rääkis inimeste lihtsuse-eelistustest. Näiteks rida 010101 jätkaks enamik inimesi paariga 01 ja rida 1,2,4,8 arvuga 16. Aga on palju teisi mudeleid, mis sobiksid nende ridade algusega ja annaksid järgnevaks tulemuseks hoopis midagi muud. Nii et miks siis on inimeste hulgas kujunenud selline komme või norm, et rida 010101 tuleks jätkata paariga 01?

Samuelsoni vastuseks oli lihtsus. Kuna konverentsi jooksul oli esitatud palju erinevaid lihtsuse ja keerukuse definitsioone, ei hoidnud ka Samuelson end tagasi ja kasutas enda oma. Tema põhiline tulemus oli lihtsuse-eelistuste matemaatilise vormi esitamine. Kõigepealt valib otsustaja erinevate andmeid kirjeldavate mudelite vahel nende tõepära järgi ja seejärel viiki jäänud parimate mudelite vahel nende lihtsuse järgi. Tuleb välja, et niimoodi objektiivsele valikule subjektiivsust lisades saadakse parem tulemus, kui ainult objektiivset tõepärakriteeriumi kasutades.

 

Hulluindeksid

Majandusteaduses seda nii tihti ette ei tule, aga matemaatikas ja füüsikas on tõsistele teadlastele märgatavaks probleemiks hullud, kes väidavad, et on lahendanud mõne kuulsa probleemi (P=NP näiteks), või leidnud uue füüsikateooria, mis ühendab kõik vastasmõjud universumis ja seletab osakeste massi. Internetis leidub sel teemal palju naljakaid kommentaare. On näiteks loodud hulluindeksid, mille järgi saab otsustada, kas matemaatika- või füüsikaartikkel on kirjutatud hullu poolt. Matemaatika üldised hulluindeksid on siin ja siin. Arvuteooria kohta on veel eraldi hulluindeks. Alternatiivteaduse kohta üldiselt käib see hulluindeks.

Naljakaid artikleid ei loo ainult hullud, mõnikord viskavad tõsised teadlased nalja ja kirjutavad pilaartikli, näiteks selle kohta, kas kas langevari aitab lennukist hüpates vigastusi vähendada. Võidakse ka tõsimeeli olla teadmatuses varasemast avastusest (samaaegsetest avastustest on mul üks teine postitus), aga kui avastus on väga oluline ja tuntud, on tulemus naljakas – näiteks taasavastas üks meditsiinidoktor Riemanni integraali.

Isiklik kokkupuude teadushuviliste hulludega oli mul, kui käisin 2008. aastal Torontos Royal Canadian Institute’i avalikul loengul Gröönimaa ümbruse hoovuste mõjust kliimale. Kliimamuutusega seotud loeng tõmbas ligi igasugu fanaatikuid. Küsimuste voorus olid suurem osa normaalsed, aga küsiti ka, millal kliimamuutus maailma hävitab ja kas on tõsi, et hiinlased korraldasid oma ilmamuutmismasinaga orkaan Katrina ja USA valitsus kavatseb oma ilmamuutmismasinaga neile Pekingi olümpiamängude ajal tagasi teha.

Loengut pidanud professor oli hästi ette valmistunud, vastas rahulikult ja küsijaid mitte ärritades, selgitas, miks mõni asi pole võimalik või tõenäoline, otseselt väidet eitamata. Küsimuste ajal saalis küll itsitati ja muiati, aga professor suutis näo sirge hoida ja küsimuse naermata ära kuulata.