Sildiarhiiv: teadus

Teoreetilise ja empiirilise teadustöö võrdlus

Tippülikoolide majandusteaduskondades tundub teoreetikute osakaal olevat oluliselt suurem kui järjestuses madalamatel kohtadel olevates teaduskondades. Üks võimalik seletus on, nõudlus teooria õpetamise järele on väike, seega teoreetikuid palkavad uurimisülikoolid, mitte õpetamisülikoolid, ning uurimisülikoolid on (teadustöö põhjal tehtavas) järjestuses kõrgemal.

Teine seletus on, et et originaalset teoreetilist teadustööd on raskem teha, sest see ei vanane nagu empiirika. Kui kunagi tõestati mingi teoreem või loodi mudel, pole seda mõtet uuesti teha. Sama empiirilist analüüsi saab aga rakendada erinevatele andmetele – võtta valim teisest piirkonnast, inimrühmast, ajaperioodist. Igal aastal korraldatakse uued küsitlused, igal kümnendil uus rahvaloendus, mis võimaldavad teha uue empiirilise teadustöö vanade meetoditega. Lisaks võib uue empiirilise meetodi leiutamisel kõik vanad analüüsid sellega üle käia.

Sama meetodi eri andmehulkadele rakendamise võimaluse tõttu on empiirilise töö tegemiseks vaja väiksema hulga eelneva teaduse tundmaõppimist. Selgeks peab saama meetodi, mis võib olla suhteliselt lihtne, nagu vähimruutude regressioon. Teoreetilise töö jaoks peab jõudma pidevalt kaugenevale teaduse piirile – peab tundma kõiki antud valdkonnas tehtud teoreetilisi töid, et olla kindel, et mõnes neist pole sama asja tehtud.

Empiirika puhul peab kontrollima, et sama andmehulka pole varem kasutatud. Kui andmehulk on uus, piisab viimase aasta-paari artiklite vaatamisest. Teoorias peab vaatama ka vanu artikleid, sest matemaatiline tulemus võib olla saadud kaua aega tagasi.

Selleks, et aru saada, kas mingi teoreetiline artikkel on antud mudelit varem uurinud, peab vaatama mudelit ennast artikli põhiosas, lühikokkuvõttest üldiselt ei piisa.

 

Teaduse piirid kaugenevad

Mida suuremaks paisub inimkonna teadmistekogum, seda raskem on saada teadlaseks. Selleks et teadust edasi arendada, tuleb kõigepealt jõuda selle praegusele piirile. Seega tuleb õppida ära siiani tehtu antud valdkonnas. Mida kaugemale teadus areneb, seda raskem ja aeganõudvam on varasemate teadmiste selgekssaamine.

Ühest küljest viib see õppeaja, eriti doktorantuuri pikenemiseni. Teisest küljest kitsama spetsialiseerumiseni – mida kitsam valdkond, seda vähem on materjali, mis teadmiste piirile jõudmiseks ära õppida tuleb. Õpitakse ju nii sügavuti kui laiuti, seega järeleandmine ühes mõõtmes võimaldab kiiremat edasiliikumist teises.

Tulemuse võib kokku võtta tsitaadiga „Eksperdid on inimesed, kes teavad üha rohkem ja rohkem üha vähemast ja vähemast, kuni piirväärtusena teavad nad kõike mitte millestki“. Üks mõõdetav märk kitsamast spetsialiseerumisest on teadusartiklite keskmise kaasautorite arvu suurenemine. Iga autor teeb artikli juures üha väiksema ja spetsialiseerituma osa.

Tasakaalustavad tegurid, mis aeglustavad õppeaja pikenemist ja erialade kitsenemist, on eluea pikenemine, inimeste kiirem õppimine ja parema tehnika kasutamine. Pikem eluiga võimaldab kauem õppida ja pärast piisavalt pikalt töötada. Tehnika poolelt aitavad eriti arvutid rutiinseid ülesandeid kiiremini ja lihtsamini täita, mis jätab rohkem aega sisulisele poolele. Kiirem õppimine tuleneb parematest õpetamismeetoditest ja teadmiste paremast süstematiseerimisest. Näiteks matemaatikas mõeldakse välja lühemaid ja lihtsamaid tõestusi teadaolevatele teoreemidele, mis kiirendab nende äraõppimist.

Pikas perspektiivis peab kusagil saabuma eluea, õppimiskiiruse ja tehnika kasutamise piir, kui teadmiste omandamine jääb oma praegusesse vormi. Tehnika kasutamist peab ju omakorda õppima, nii et lõpuks taandub küsimus elueale ja õppekiirusele. Kui eluea pikenemine ja õppimiskiiruse suurenemine pole lõputu, siis lõpeb kunagi teaduse areng.

Lahendus piiratud õppimiskiirusele oleks teadmiste otsene kandmine ajju, näiteks ühendades aju arvutiga (küborg), mis võimaldaks vajalikud teadmised alla laadida või ajuga ühendatavale arvutile sisse ehitada. Samuti kiirendaks see inimestevahelist suhtlust, mis praegu seisab piiratud rääkimis- ja kirjutamiskiiruse taga. Teadusartiklite kaasautorite arv võiks kiirema kommunikatsiooni korral samuti suureneda.

Samaaegsetest avastustest

Teaduses on korduvalt ette tulnud, et sama avastus tehakse umbes samal ajal kahe või rohkema teadlase poolt, kes üksteise tööst ei tea. See lükkab ümber teaduse arengu geeniuse teooria, mis väidab, et suurem osa teadlasi nokitseb niisama pisiküsimuste kallal, aga vahel sünnib geenius, kes teeb tõelise läbimurde. Ja siis nokitsetakse jälle edasi, kuni järgmise geeniuseni. Kui revolutsiooniliseks avastuseks on vaja midagi haruldast ja erilist, siis peaksid samaaegsed avastused olema üliharvad, sest need eeldavad kahe haruldase sündmuse koostoimumist.

Teine teaduse arengu seletus on hiiglaste õlgadel seismise teooria, mis ütleb, et kui teadus on teatud maani arenenud, siis järgmine samm on üsna läbipaistev ja lihtne. Seega kui mitu kompetentset inimest loevad sama teaduskirjandust, siis tekib tõenäoliselt enamikul neist sama idee, kuidas tulemusi edasi arendada. Ja nad teevad avastuse enamvähem samaaegselt.

Mul oli just 2011 sügisel juhust hiiglaste õlgadel seismise teooriale isiklikku kinnitust leida. Nimelt on minu universaalsete teadmatuse tüübiruumide artikliga väga sarnaseid artikleid samal kuul kirjutatud tervelt kaks – ühe autoriteks Pintér ja Udvar ning teisel Heifetz, Meier ja Schipper. Kokku niisiis kolm sõltumatut samaaegset avastust. Pole eriti tõenäoline, et kõigi autoriteks geeniused on (vähemalt ühe puhul on kindel, et pole).

Lihtsuse ja tõepära konverents

13.-15. novembril 2009 oli meil majandusteaduskonnas lihtsuse ja tõepära konverents (Workshop on simplicity and likelihood), organiseerijateks Itzhak Gilboa ja Larry Samuelson. Külalisi oli umbes kakskümmend.

Konverents oli huvitav segu ökonomeetria teooriast ja otsustusteooriast. Esinejate hulgas oli lisaks majandusteadlastele arvutiteadlasi, füüsikuid ja statistikuid. Teemad olid väga abstraktsed ja matemaatilised, seetõttu minu jaoks väga huvitavad. Reedel oli mul päev loengutega täidetud, nii et konverentsile jõudsin alles laupäeva hommikul.

Laupäeva esimene esineja oli Joe Halpern Cornellist. Ta rääkis põhjuslikkusest ja esitas selle matemaatilise kirjelduse, illustreerides seda näidetega filosoofiast ja õigusteadusest. Põhjuslikkus, süü ja vastutus on matemaatiliselt erinevad mõisted (vähemalt Halperni mudelis) ja üks kriteeriume põhjuste järjestamisel on, kui palju ebanormaalsemaks see maailma muudab. Halperni näited on järgnevad:

Billy ja Sue viskavad kividega pudelit. Mõlemad on täpse käega, aga Sue kivi jõuab esimesena kohale ja purustab pudeli. Billy kivi oleks selle ka purustanud, kui Sue oma selle terveks jätnud oleks. Nii et kui Sue poleks visanud, siis oleks pudel ikka purunenud. Kas võib öelda, et Sue kivivise on pudeli purunemise põhjus? (Jah)

Võrdluseks eelmisele näitele: kaks süütajat viskavad põleva tiku metsa. Ühe süütaja tulekahju suudavad päästjad kustutada, aga kui mets kahest otsast põleb, siis ei suuda. Nii et metsa mahapõlemiseks on vaja mõlema süütaja tikku. Kas võib öelda, et süütaja A on metsa mahapõlemise põhjustaja? (Ei) Kas abstraktne põhjuslikkuse struktuur selles ja eelmises näites on sama? (Ei) Kui metsa mahapõlemiseks piisab ainult ühe süütaja tikust ja mõlemad viskavad tiku, siis kas süütaja A on metsa mahapõlemise põhjustaja?

Billy haigestub mittesurmavasse haigusesse pühapäeval. Kui esmaspäeval tööl olev arst talle ravimit annab, on Billy teisipäeval terve. Kui esmaspäeva arst teda ei ravi, aga teisipäeva arst ravib, on Billy kolmapäeval terve. Üks ravimidoos ravib, aga kaks on surmav. Kas teisipäevase arsti mitteravimine on Billy kolmapäevase elusoleku põhjus? Aga esmaspäevase arsti mitteravimine?

Kas see, et ma sind ei tulista, on põhjus, miks sa elus oled?

Keskaegne kuningriik. Mõrtsukas plaanib kuningat mürgitada. Kuninga nõunik kahtlustab seda ja annab kuningale vastumürki. Mitmesugustel asjaoludel ei õnnestu mõrtsukal kuningale mürki anda. Kas vastumürgi andmine on kuninga elusolemise põhjus?

David Schmeidler rääkis aksiomaatilisest lähenemisest lihtsusele ja põhjuslikkusele. Sarnaselt paljude otsustusteooria artiklitega postuleeris Schmeidler aksioomid, mida reaalsuse kohta käivate mudelite paremusjärjestus peaks rahuldama ja tuletas neist selle järjestuse funktsionaalse kuju. Seda funktsiooni võib vaadelda ka kui mudeli valiku kriteeriumi.

David Wolpert NASAst rääkis oma tõestusest, et ka deterministlikus ja lõplikus universumis on Laplace’i hüpotees vale. Laplace väitis, et kui talle anda piisavalt infot praeguse kõigi osakeste asukoha ja liikumise kohta universumis, siis võib ta arvutada kogu universumi tuleviku ja mineviku. Meie reaalses universumis on Laplace’i hüpotees vale juba Heisenbergi määramatuse printsiibi kohaselt – pole võimalik samaaegselt ennustada osakese asukohta ja liikumist. Aga hüpoteetilises deterministlikus ja lõplikus universumis, nii nagu seda nähti Laplace’i ajal?

Wolpert alustas vaatluse ja ennustuse defineerimisega. Nende mõningaid ühiseid jooni koondava tegevuse nimetas ta järeldamiseks ja defineeris järeldusmasina – objekti, millele me võime esitada maailma kohta jah/ei küsimusi ja saada vastuseks ühe biti 0 või 1, vastavalt siis ei või jah. Järeldamine on nii vaatluse kui ennustuse jaoks tarvilik, aga mitte piisav. Wolperti põhiline teoreem oli, et iga sündmuse kohta eksisteerib järeldusmasin, mis suudab seda sündmust järeldada, aga iga järeldusmasina jaoks on olemas sündmus, mida see masin järeldada ei suuda.

Wolperti näited olid sarnase struktuuriga, mida matemaatikas nimetatakse Cantori diagonalisatsiooniargumendiks. Arvutiteaduses on sarnane olukord Turingi masina puhul – on olemas sündmus, et see masin peatub. Aga masin ei suuda vastata küsimusele, kas ta peatub.

Järeldusmasina puhul nimetagem V-ks nende maailma arenguteede hulka, kus masin homme vastab täna küsitud küsimusele jah. Homseks on need arenguteed natuke läbitud, nimetagem samade arenguteede hulka homme V’-ks. Masin ei suuda õigesti vastata küsimusele, kas me oleme homme väljaspool hulka V’. Kui masin ütleks jah, siis ta eksiks, sest kui ta ütleb jah, oleme me hulgas V’, aga küsimus oli, kas me oleme väljaspool seda hulka. Kui masin ütleks ei, siis ta eksiks, sest me oleme nüüd väljaspool hulka V’ ja küsimus oli, kas me oleme väljaspool seda hulka.

Kuna ükski järeldusmasin ei suuda kõigile maailma kohta käivatele küsimustele õigesti vastata, siis ei ole olemas masinat, mis suudaks ennustada kogu universumi tulevikku. Kaval inimene võib küsida, et kui iga sündmuse kohta on masin, mis suudab seda ennustada, siis kas me ei võiks võtta piisavalt palju erinevaid masinaid ja lasta igal neist ennustada jupikest universumit, saades kokku kogu tuleviku ennustuse. Veel kavalam vastaks sellele, et igasuguse masinate kogumi võime me ümber nimetada üheks masinaks, seega eelnev võimatusteoreem kehtib.

Pühapäeva esimese esineja Andrew Barroni teema oli informatsiooniteooria, lihtsus ja tõepära. Ta rääkis, et andmehulga keerukust võib vaadelda kui bittide arvu, mida selle üksüheseks edasiandmiseks vaja läheb. See on arvutiteaduses kaua teada olnud. Barroni uudne väide oli, et tõenäosust võib samuti vaadelda kui bittide arvu koodis ja kodeerimisviise kui tõenäosusjaotusi. Ta rakendas seda vaatepunkti masinõppimise näitele.

Masinõppimisel antakse arvutile kõigepealt mingi treeningandmehulk, mis on võetud mingist tõenäosusjaotusest. Selle põhjal peab masin ennustama andmeid mingist teisest tõenäosusjaotusest ehk üldistama oma varasemat teadmist. Inimestele on see tavaline tegevus, aga arvutite puhul on sellise üldistusvõime tekitamine keeruline.

Aris Spanos rääkis mudelite valikust andmete seletamiseks. Statistikud ja ökonomeetrikud kasutavad enamjaolt lähendamisteooriat ja püüavad leida mudelit, mis kõige paremini andmetele vastab. Spanose kohaselt on see vale lähenemine ja tal oli palju näiteid, kus sellega valesid tulemusi saadakse. Oluline pole Spanose sõnul mitte lähenduse täpsus ehk väike vahe mudeli ja andmete vahel, vaid selle vahe (mudeli jäägi, model residual) mittesüstemaatilisus. Näiteks n andmepunkti võime me lähendada (n-1) järku polünoomiga ja saada täpse vastavuse, aga see mudel on ennustuste või järelduste seisukohast väärtusetu.

Statistilisi mudelivalikukriteeriume rakendatakse eelnevalt valitud mudelite klassis. Kui see klass on aga valesti valitud, siis valikukriteeriumi rakendamine selle sees annab vale tulemuse. Iga mudeli puhul peaks kontrollima selle statistiliste eelduste täidetust ja kui need pole täidetud, siis valima mõne muu mudeli hoolimata sellest, kui lähedane antud mudel andmetele on.

Larry Samuelson rääkis inimeste lihtsuse-eelistustest. Näiteks rida 010101 jätkaks enamik inimesi paariga 01 ja rida 1,2,4,8 arvuga 16. Aga on palju teisi mudeleid, mis sobiksid nende ridade algusega ja annaksid järgnevaks tulemuseks hoopis midagi muud. Nii et miks siis on inimeste hulgas kujunenud selline komme või norm, et rida 010101 tuleks jätkata paariga 01?

Samuelsoni vastuseks oli lihtsus. Kuna konverentsi jooksul oli esitatud palju erinevaid lihtsuse ja keerukuse definitsioone, ei hoidnud ka Samuelson end tagasi ja kasutas enda oma. Tema põhiline tulemus oli lihtsuse-eelistuste matemaatilise vormi esitamine. Kõigepealt valib otsustaja erinevate andmeid kirjeldavate mudelite vahel nende tõepära järgi ja seejärel viiki jäänud parimate mudelite vahel nende lihtsuse järgi. Tuleb välja, et niimoodi objektiivsele valikule subjektiivsust lisades saadakse parem tulemus, kui ainult objektiivset tõepärakriteeriumi kasutades.

 

Hulluindeksid

Majandusteaduses seda nii tihti ette ei tule, aga matemaatikas ja füüsikas on tõsistele teadlastele märgatavaks probleemiks hullud, kes väidavad, et on lahendanud mõne kuulsa probleemi (P=NP näiteks), või leidnud uue füüsikateooria, mis ühendab kõik vastasmõjud universumis ja seletab osakeste massi. Internetis leidub sel teemal palju naljakaid kommentaare. On näiteks loodud hulluindeksid, mille järgi saab otsustada, kas matemaatika- või füüsikaartikkel on kirjutatud hullu poolt. Matemaatika üldised hulluindeksid on siin ja siin. Arvuteooria kohta on veel eraldi hulluindeks. Alternatiivteaduse kohta üldiselt käib see hulluindeks.

Naljakaid artikleid ei loo ainult hullud, mõnikord viskavad tõsised teadlased nalja ja kirjutavad pilaartikli, näiteks selle kohta, kas kas langevari aitab lennukist hüpates vigastusi vähendada. Võidakse ka tõsimeeli olla teadmatuses varasemast avastusest (samaaegsetest avastustest on mul üks teine postitus), aga kui avastus on väga oluline ja tuntud, on tulemus naljakas – näiteks taasavastas üks meditsiinidoktor Riemanni integraali.

Isiklik kokkupuude teadushuviliste hulludega oli mul, kui käisin 2008. aastal Torontos Royal Canadian Institute’i avalikul loengul Gröönimaa ümbruse hoovuste mõjust kliimale. Kliimamuutusega seotud loeng tõmbas ligi igasugu fanaatikuid. Küsimuste voorus olid suurem osa normaalsed, aga küsiti ka, millal kliimamuutus maailma hävitab ja kas on tõsi, et hiinlased korraldasid oma ilmamuutmismasinaga orkaan Katrina ja USA valitsus kavatseb oma ilmamuutmismasinaga neile Pekingi olümpiamängude ajal tagasi teha.

Loengut pidanud professor oli hästi ette valmistunud, vastas rahulikult ja küsijaid mitte ärritades, selgitas, miks mõni asi pole võimalik või tõenäoline, otseselt väidet eitamata. Küsimuste ajal saalis küll itsitati ja muiati, aga professor suutis näo sirge hoida ja küsimuse naermata ära kuulata.