Sildiarhiiv: ökonomeetria

Elatustaseme võrdlus ei võta arvesse kvaliteeti

Põhja-Euroopa tomatid on vesised, hapukad ja seest roosakashallid, aga Lõuna-Euroopa omad magusad maitseplahvatused, seest punased. Samuti Gruusias värskelt puu otsast võetud küpsed virsikud ja muud puuviljad on palju maitsvamad kui need, mis on toorelt ekspordiks korjatud ja merekonteineris järelküpseda lastud. Samanimeline restoranitoit Itaalias on palju parem kui Põhja-Ameerikas või Eestis. Erinevate riikide ostukorvi kalliduse arvutamisel loeb aga ainult toodete hind, mitte neist saadav heaolu, nii et elatustase annab heaolutasemest vildaka pildi.

Kui kvaliteet erineks ainult väikse osa ostude puhul (restoranitoit ja puuviljad on keskmise leibkonna kuludes pisike protsent), siis see heaolutaseme võrdlust eriti ei mõjutaks. Üks oluline kululiik, mille puhul kvaliteet riigiti märgatavalt erineb, on majutus. USAs on ka uute kallihinnaliste kortermajade põrandad lainelised, mida kõndides märkab, dušikabiinis jookseb vesi nurka, mitte keskele äravoolu, akna ümber on tuntava tuulega praod ja tänavamüra kostab selgesti. Vanadel ja eramajadel on samad murekohad. Tartus euroremonditud ühiselamus selliseid probleeme polnud, kuigi see oli odav majutus. USAs on ka tippülikoolide hoonetes prussakad ja närilised, Tartus minu teada mitte. Tänavatel on USAs tihti näha kahjuritõrjefirmade siltidega mikrobusse, järelikult selle teenuse nõudlust on. Austraalias on enamik maju soojustamata ka piirkondades, kus kolm kuud aastas on hommikul härmatis maas. Soojustuse puudumisel langes seal mu kütmata kontori temperatuur 12 kraadini ja korteris 10,5ni. Elatustaseme arvutus aga kvaliteediprobleeme ei kajasta, võtab arvesse vaid pinda ja hinda.

Avalike teenuste pakutavat väärtust on statistikas keeruline hinnata, nii et vahel peab piirduma nendele kulutatava rahaga, mis on sisend, mitte väljund. Avaliku ruumi kvaliteet kindlasti riigiti kõigub – tänavate puhtus ja siledus USAs ja Singapuris on nagu öö ja päev.

Kvaliteedierinevuste põhjustatud kallakut ei saa korrigeerida ka avaldatud eelistusi kasutades (Dowrick ja Quiggin 1994 https://www.jstor.org/stable/2117988: kui ühe riigi keskmine elanik saaks teise riigi keskmist ostukorvi endale lubada, aga teise elanik esimese ostukorvi mitte, siis on esimene riik rikkam ja selle elanikud paremas olukorras). Probleemiks on jällegi, et need avaldatud eelistused on ainult hinnapõhised, seega kvaliteeti ei arvesta.

Heaolu sõltub mitte ainult tarbimisest, vaid palju otsesemalt eelistustest. Keskmise elaniku kasulikkusfunktsioon võib riigiti erineda, igatahes stereotüübid sellele vihjavad. Hüpotees eelistuste varieeruvuse kohta on kontrollitav ja Dowrick ja Quiggin 1994 lükkavad selle ümber (erinevusi ei leia), aga nende test sõltub kvaliteedi samasusest riikide vahel. Test seisneb järgnevas ostukorvide võrdluses: kui mõlema riigi keskmine elanik saab endale lubada mõlema riigi keskmist tarbitavate toodete ja teenuste komplekti, aga valitud ostukorvid riigiti erinevad, siis järelikult eelistused kokku ei lange. Eeldus, et mõlema elanikud suudavad osta mõlemat komplekti, on oluline selleks, et sissetulek valikut ei piiraks. Selline rahaline piirang viiks erinevale tarbimisele ehk näilisele erinevusele eelistustes.

Kui mõndade toodete ja teenuste kvaliteet on parem ühes riigis, teistel teises, siis oleks loogiline, et inimesed valivad riigiti erinevad ostukorvid isegi täpselt sama sissetuleku ja eelistuste puhul. Üks võimalik põhjus, miks Dowrick ja Quiggin 1994 sellist erinevust ei leidnud, on et kvaliteetsemad tooted on kallimad ka riikide lõikes, misjuhul hinnapõhine elatustaseme võrdlus kajastab heaoluerinevusi hästi (sarnaseid eelistusi eeldades). Toidu puhul ei tundu, et hind kvaliteediühiku kohta riigiti sama on – näiteks troopilised puuviljad on troopikas nii odavamad kui ka värskemad kui nende eksporditurgudel.

Ostukorvierinevuste puudumise teine võimalik põhjus on, et riigis, kus antud toode hinna-kvaliteedi suhtelt halvem on, eelistavad inimesed seda toodet. Kui kasulikkusfunktsiooni erinevus tasakaalustab kvaliteedierinevuse, siis on tarbitav komplekt sama hindadeprofiiliga riikides sarnane. Esmapilgul tundub imelik, et parema tootega riigis huvitab see toode inimesi vähem ja täpselt kvaliteedierinevuse võrra. Seletus on harjumine antud toote keskmise kvaliteeditasemega oma elukohas: veini või juustu, mis eestlastele kõlbab, ei võtaks prantslased suu sissegi, samas head ja halba verivorsti või leiba pranslased eristada ei suudaks, aga eestlased valiksid peaaegu ühehäälselt hea.

Harjumust saab modelleerida näiteks nii, et inimese heaolu on kasvav funktsioon tarbitavatest kogustest ja suhtelistest kvaliteetidest (praegune kvaliteet miinus varem kogetud keskmine kvaliteet). Kui selline kasulikkusfunktsioon on inimestel sama, siis samade hindade korral tarbivad nad harjumuspärase kvaliteediga tooteid samas koguses. Varem kogetud kvaliteedid võivad inimeste vahel palju erineda, aga kui varasem kvaliteet võrdub praegusega, siis on ostukorv ühesuguse varandusliku ja hinnatasemega riikides sarnane. Harjumine võrdsustab heaolutaseme riikide vahel, neutraliseerides kvaliteedierinevused. Kui elatustasemega tahta mõõta heaolu, siis harjumise korral polegi tarbitav kvaliteet oluline, nii et selle eiramine elatustaseme võrdluses on õigustatud.

Odavamat toodet tarbitakse alguses rohkem, mis võib vähendada edasist heaolu sellest tootest, seega tarbimist. See tasakaalustab parema ja odavama kauba esialgset rohkem ostmist riikide võrdluses, muutes ostukorvid aja jooksul sarnasemaks. Taas muudab tasakaalustumine hinna- ja kvaliteedierinevused heaolu jaoks vähem oluliseks.

Teaduse headuse indeks võib vale mulje jätta

Eesti teadus 2019 arvamuslugude kogumikus näitavad Allik ja Lauk graafikut, mille kohaselt Eesti teaduse kvaliteet mõõdetuna viidete arvuga artikli kohta on viimase 20 aastaga eksponentsiaalselt kasvanud. Tore muidugi näha andmeid ja arvutusi, mis avaldatud arvamustele ka mingi aluse annavad, aga Alliku ja Laugu valitud suhtarv ei pruugi just kõige parem teaduse mõõt olla. Seda indeksit tõstab näiteks nõrgemate artiklite mitteavaldamine, isegi kui need artiklid tegelikult olulisel määral uut teadmist loovad (mis pole sugugi kindel – olen sellest kirjutanud https://sanderheinsalu.com/ajaveeb/?p=558). Näiteks kui suure teadusrahastuse korral avaldataks 2 artiklit, üks ühe ja teine kahe viitega, siis oleks viidete arv artikli kohta 1,5, aga kui väikese teadusrahastuse korral avaldataks ainult see kahe viitega artikkel, siis oleks suhtarv 2. Teaduse näiline tase võib niisiis tõusta rahastuse vähenemisega. Madalam finantseerimine paneb osad inimesed teadusest lahkuma, eeldatavasti pigem nõrgemad teadlased, kes kirjutaksid akadeemilisse maailma jäädes vähemviidatud artikleid. Samuti kui värsked doktorantuuri lõpetajad avaldavad madalamalt tsiteeritud töid kui kogenud professorid ja rahastuse alanemine vähendab noorteadlaste sissevoolu, siis suurendab see viidete arvu artikli kohta.

Teine mehhanism kuidas tõsta viidete arvu artikli kohta teaduse tegelikku taset parandamata on suunata avaldamine ümber valdkondadesse, kus keskmine viidete arv artikli kohta on suurem. Näiteks eksperimentaalfüüsikas kogub publikatsioon keskmiselt palju rohkem viiteid kui matemaatikas. Kui vähendada matemaatikute ja suurendada füüsikute arvu, aga jätta keskmise teadlase avaldatud artiklid ja saadud viited kummaski valdkonnas selle valdkonna keskmiseks, siis kogu Eesti teadlaskonna viidete arv artikli kohta tõuseb. Lihtne numbriline näide on, et riigis on 1 matemaatik ja 1 füüsik, kumbki avaldab 1 artikli aastas. Kõik matemaatikaartiklid saavad 4 viidet, aga füüsika omad 10, keskmine viidete arv artikli kohta niisiis 7. Kui asendada matemaatik teise füüsikuga, siis tõuseb viidete-artiklite suhtarv 10 peale. Seda võib saavutada teadusrahastuse matemaatikalt ära võtmise ja füüsikasse suunamisega.

Empiirilise artikli järeletegemine Eesti andmetel: raadio ja toetus valitsusele

Adena, Enikolopov, Petrova, Santarosa, Zhuravskaya (2015) uurivad, kuidas mõjutas raadio 1930ndatel toetust natsidele Saksamaal. Leitakse üsna suur efekt mõlemas suunas: kui raadio oli Weimari valitsuse käes ja natsivastane, langetas raadio kättesaadavus toetust natsidele, aga kui natsid said kontrolli raadio üle, siis raadiosignaali ulatus tõstis nende toetust (keskmiselt, aga mitte igal pool). Need on oodatavad mõjud, huvitav on nende täpne mõõtmine. Lisaks leiti, et piirkondades, kus inimesed keskmiselt ei olnud juudivastased, natside raadio hoopis langetas natside populaarsust (kõrge antisemitismiga piirkondades tõstis). Tõlgendus on, et kui inimesed ei nõustu edastatava sõnumiga, siis paneb propaganda nad edastajale vastanduma. Kui nõustuvad, siis propaganda tugevdab toetust.
Andmetest on selle artikli järeletegemiseks vaja raadiojaamade asukohti ja võimsusi aastate lõikes, et arvutada, kuhu signaal mingil ajaperioodil ulatus. Vaja ka raadiote levikut rahva hulgas, poliitiliste jõudude populaarsust ja teavet selle kohta, kes kontrollis raadiot. Eestis võib mõõta toetust vapsidele ja valitsusele erinevatel valimistel eri piirkondades sõltuvalt raadio kättesaadavusest. Raadioprogrammide sisu ja administratiivse kontrolliahela põhjal saab hinnata, mis erakondi raadio toetas. Raadio kättesaadavuse ja valimistulemuste põhjal saab hinnata, kas raadio toetus tõstis erakonna populaarsust.
Link artiklile: http://bfi.uchicago.edu/sites/default/files/research/Media_effects_12_May_2014%20with%20Tables.pdf
Sarnane artikkel (Yanagizawa-Drott 2014) uurib raadio toetust ja mõju Ruanda genotsiidile: http://www.hks.harvard.edu/fs/dyanagi/Research/RwandaDYD.pdf

Esimene samm teaduse tegemisel

Richard Feynmani kohaselt (http://neurotheory.columbia.edu/~ken/cargo_cult.html) on esimene samm teaduse tegemisel mitte petta ennast. Enesepettus tekib näiteks siis, kui uurija soovib saada mingit tulemust (uudset, hästimüüvat) ja tõlgendab andmeid sellele tulemusele soodsalt. Paneb rõhku kooskõlalistele andmetele ja ignoreerib vastuolulisi.
Enesepettuse vältimiseks tuleks katse plaan enne katset üles kirjutada (ja võibolla ka avalikku katsete andmebaasi lisada) ja siis seda plaani järgida. Plaan peaks kirjeldama katset nii, et teised suudaksid ainult plaani kasutades seda katset korrata. Lisaks peaks plaan paika panema tulemuste tõlgendamise juhise. Ehk milliste andmete korral lugeda üks vastus statistiliselt tõenäolisemaks, milliste korral teine. Muidu hakatakse pärast andmete kogumist katse kriteeriume muutma stiilis “see mõõtmistulemus on ebanormaalne, jätame selle andmetest välja”. Väljajättu esineb muidugi sagedamini eelarvamust kummutavate andmete puhul.
Kui seda teaduslikku meetodit rakendada inimeste hindamisel, siis läheb elu raskeks neil, kes pidevalt andeks paluvad ja siis uue sigaduse korraldavad. Andeksandjad mõtlevad ilmselt sagedasti: “Ega ta enam ei tee. Anname talle veel ühe võimaluse.” Kui viimane võimalus oleks tõepoolest üks ja ainus, poleks kahju kuigi suur, aga tegelikkuses kipub neid viimaseid võimalusi üksteisele järgnema päris palju. Selle vältimiseks võiks proovida kirja panna kõik hinnatava inimese olulised sigadused, neile järgnenud tagajärjed, vabandused ja andeksandmised. Mingil hetkel tuleb tahtmine anda mitte rohkem kui üks võimalus veel. Kui see siis kirja panna, on tulevikus raskem endale õigustada veel ühe lisavõimaluse andmist.

Matemaatikute sisseränne ja konkurents USAs

Borjas ja Doran kirjutavad QJEs, kuidas Nõukogude Liidu lagunemise järgne matemaatikute sissevool USAsse mõjutas sealsete matemaatikute karjääri- ja avaldamisvõimalusi. Sissevoolu järgselt jäi rohkem matemaatika doktorikraadi saanuid töötuks ja lahkus teadusest, USA matemaatikud liikusid madalama tasemega ülikoolidesse ja avaldasid vähem artikleid.

Seda kõike on lihtne ennustada nõudluse ja pakkumise mudelist. Matemaatikute pakkumine suurenes, aga nõudlus jäi samaks, sest uusi töökohti ega ilmselt ka teadusajakirju ei loodud. Sama arv matemaatikuid täitis sama arvu kohti, aga need olid erinevad inimesed. Sisserännanud matemaatikud said töökohad ülikoolides, kust siis mõned seal varem olnud teadlased lahkusid nõrgematesse ülikoolidesse, kust omakorda osa varasemaid olijaid pidi lahkuma jne. Ülikoolide pingerea allotsa jõudes pidid sealt välja tõrjutud matemaatikud teadusest lahkuma.

Borjas ja Doran väidavad, et USA matemaatikute tootlikkus langes sisserände tagajärgel, aga sisserändajate teadustöö kompenseeris selle üsna täpselt. Kui autorid arvavad, et avaldatud teadusartiklite hulk (mis on neil tootlikkuse mõõduks) mõõdab teadlase absoluutset tootlikkust, siis teevad nad vea, jättes arvestamata samaks jäänud avaldamisvõimaluste arvu. Kui suurem arv teadlasi konkureerib sama arvu artiklikohtade pärast ajakirjades, siis loomulikult varasemate olijate artiklihulga langus võrdub uute tulijate artiklihulgaga. See ei tähenda kohalike teadlaste tootlikkuse langust, vaid keskmise artikli kvaliteedi tõusu. Fikseeritud artiklikohtade arvu korral mõõdab avaldatud artiklite hulk inimese suhtelist tootlikkust võrdluses teiste sama valdkonna teadlastega.

Kui ajakirjade toimetajad valivad neile saadetud artiklitest n parimat, siis sisse rännanud matemaatikud suudavad kohalike artikleid ajakirjadest välja tõrjuda ainult parema kvaliteedi abil. Kui uued tulijad avaldavad m artiklit, siis nende m artikli minimaalne kvaliteet on suurem või võrdne välja tõrjutud artiklitest parimaga. Kvaliteedi minimaalse tõusu suuruse saab leida, eeldades et immigrantide artiklid asendavad täpselt kohalike kõige viletsamad artiklid. Maksimaalse tõusu suurust lihtsalt avaldamisandmete põhjal leida ei saa, sest kui sisserändajate m artiklit on paremad kui kõik kohalike omad, siis võivad nad olla kuitahes palju paremad. Asendades m kohalike tippartiklit, sunnitakse asendatud artikleid asetuma m järgmisele kohale, m järgmist omakorda asendavad neist allpool olevaid jne. Ajakirjadest välja jäävad ikka kõige viletsamad, aga juurdetulijad võivad olla lõpmatult paremad kui algne hulk.

Muidugi pole ajakirjade toimetajad kõiketeadjad ega suuda alati valida parimaid artikleid, aga kui nad keskmiselt teevad õige otsuse (valivad parema artikli suurema tõenäosusega kui halvema), siis eelnev argument kehtib, ainult muutuste suurus väheneb (kvaliteet tõuseb vähem).

Sisseastujate ennustamisest

Kuulsin täna lõunalauas, et sel aastal alustab matemaatikateaduskonnas null doktoranti. Eelmisel aastal oli alustajaid seitse ja minu esimesel aastal kolm. Varieeruvus on oluliselt suurem, kui majandusteaduskonnas, kus igal aastal alustab kakskümmend kuni kakskümmend kaks inimest. Ilmselt tuleneb see majanduse vastuvõtukomitee täpsematest ennustustest selle kohta, kui palju vastuvõetud inimestest valib Yale. Lisaks aitab kaasa suurte arvude seadus, mis silub varieeruvust. Majandusteaduskonnas võetakse igal aastal vastu umbes kuuskümmend inimest, kellest siis umbes nelikümmend lähevad muudesse ülikoolidesse.

Yale majandusteaduskonnas ennustatakse õppima asumist individuaalselt – iga inimese omaduse põhjal arvutatakse tõenäosus, et ta vastuvõtu korral õppima asub. Ma ei tea täpseid kriteeriume ega meetodeid, aga üheks ennustavaks teguriks on parematesse ülikoolidesse sissesaamine. Siinne majandusteaduskond on maailmas teises viisikus, ehk kusagil kuuenda ja kümnenda koha vahel. Inimesed, kes siia sisse saavad, saavad tihti sisse ka tippviisikusse ja lähevad siis tõenäoliselt sinna.

Ühe mu kursusekaaslase tüdruksõber õppis esimese doktorantuuriaasta Wisconsini Ülikoolis Madisonis ja tuli siis siia üle. Ta oli vastuvõtul ootenimekirjas esimene, ehk tema vastuvõtu tingimuseks oli, et keegi teine keeldub õppimaasumisest. Õppimaasumise tõenäosuseks ennustati tema puhul 100%. Samas inimeste puhul, kes on saanud sisse Harvardisse ja MITsse, on Yale’is õppimaasumise tõenäosus üsna madal.

Näiline enese ülehindamine

Käitumisökonoomikas on palju artikleid kus kirjeldakse teoreetiliselt või mõõdetakse empiiriliselt enda ülehindamist väga paljudes olukordades. Enda võimete suhtes ollakse liigoptimistlikud nii autot juhtides, aktsiaturul investeerides kui nuputamisülesandeid lahendades.

Majandusteaduse kõige mõjukamas ajakirjas Econometrica aastal 2011 ilmunud Benoit ja Dubra artikkel juhib tähelepanu olulisele puudujäägile peaaegu kõigis enese ülehindamist mõõtvates empiirilistes artiklites. Neis töödes on tähelepanuta jäetud, et inimesed võivad saada signaale enda võimekuse kohta ja kohandada oma hinnangut oma võimetele vastavalt signaalidele üles- või allapoole. Kui halbade võimete kohta saadakse haruldasi halbu signaale, siis sellise signaali mittesaamine on teatud määral tõend heade võimete kohta. Kuna halvad signaalid on haruldased, siis enamik inimesi neid ei saa ning kohandab oma arvamust oma võimetest ülespoole. Võttes elanikkonnast juhusliku valimi, on seal palju inimesi, kes hindavad ennast (statistiliselt põhjendatult, mitte ebaratsionaalsetel psühholoogilistel põhjustel) paremaks keskmisest, kuna nad pole saanud vastupidist signaali. Valimis on vähe neid, kes on halva signaali saanud ja hindavad end keskmisest halvemaks. Kokkuvõttes näib, nagu oleks valimis tegu ennast süstemaatiliselt üle hindavate inimestega, kuigi tegelikult on kõik ratsionaalsed.

Benoit ja Dubra ei tõesta enese ülehindamise esinemist või mitteesinemist. Nad vaid juhivad tähelepanu, et siiamaani on seda valesti mõõdetud.

Koolide ja õpetajate taseme mõõtmisvõimalus Eestis

Koole kiputakse Eestis järjestama riigieksamitulemuste alusel, või liigitama koolikatsete põhjal eliit- ja tavakoolideks. Mõlemad on vastuolulised teemad, aga taset ei mõõda hästi kumbki. Ma pole tuttav empiirilise tööga sel teemal, aga kahtlustan, et keegi pole korralikult mõõtnud koolide taset Eestis.

Kooli taset ei määra mitte alustajate või lõpetajate tulemused, vaid see, kui palju kool õpilasele juurde annab. Lõpetamistaseme ja alustamistaseme vahe on kõige lihtsam näitaja selles vaimus. Loomulikult on tegelik olukord keerulisem – kooli tase võib erineda klassiti (4. klassis õpetatakse halvemini, 5. klassis paremini), õpilaste lõikes (helgemaid päid õpetatakse halvemini, nõrgemaid aidatakse hästi järele), ainetes jne.

Kõige keerulisem on taset mõõta, kui esinevad vastasmõjud õpilaste ja kooli vahel (ühe kooli või õpetaja stiil sobib ühe inimesega, aga ei sobi teisega, teise kooli stiil jälle vastupidi) või võrgustiku mõjusid õpilaste hulgas (inimesed A ja B või B ja C samas klassis takistavad üksteisel õppimist, aga A ja C samas klassis aitavad üksteisel õppida). Võib ka olla, et ühes koolis A ja B aitavad üksteist, teises takistavad, olenevalt õpetamisstiilist. Või A aitab B-d, aga B takistab A-d.

Vaatan, et internetis on vabalt üleval Eesti olümpiaaditulemused eri ainete ja aastate kohta. Andmetes on õpilase nimi, kooli nimi, klass, aasta, vahel ka õpetaja nimi. Tulemused on vahel olümpiaadi eri osade kaupa. Tulemuste nimeline avalikustamine internetis võib olla vastuolus Eesti üsna range andmekaitseseadusega, aga empiiriliseks tööks on see hea.

Iga olümpiaadides rohkem kui ühel aastal mainitud õpilase puhul saab vaadata tema absoluut- ja suhtelist tulemust kõigil osalemiskordadel. Lahutades varasema aasta tulemuse hilisema omast võib näha, kui palju õpilane antud ajavahemikus arenes. Keskmistades üle iga kooli õpilaste saab mõõta, kui hästi üks kool võrreldes teisega olümpiaadidel osalejaid (paremaid õpilasi) õpetab. Kui on mainitud olümpiaadil osaleja õpetajat, saab samamoodi võrrelda õpetajaid. Tulemusi saab eristada ainete ja klasside kaupa.

Eelnev mõõdab kooli või õpetaja keskmist headust paremate õpilaste jaoks erinevates klassides ja ainetes, aga mitte kooli ja õpilase vastasmõjusid või õpilaste omavahelist mõju. Kui õpilased vahetavad koole ja osalevad olümpiaadil enne ja pärast, saab teatud määral ka neid mõjusid hinnata. Ilmselt pole koolivahetajaid piisavalt palju, et selle kohta mingit olulist tulemust saada.

Pikema ajaperioodi andmete saamiseks võib olümpiaadiandmetele lisada ülikoolide lõpetajate andmed (õppeaste, kui mitu aastat läks, cum laude või mitte), mis on samuti vabalt internetis. Kui ma Tartu Ülikooli bakalaureuseõppesse kandideerisin, olid ka vastuvõetute ja vist ka kõigi kandideerijate nimekirjad vabalt saadaval. Hetkel neid internetist ei leidnud, aga kui need on olemas, lisab see veel ühe andmepunkti ja võimaldab mõõta, kui hästi üks või teine kool õpilasi ülikooliks ette valmistab. Selleks tuleb vaadata, milline osa antud koolist ühte ülikooli läinud inimestest lõpetab nominaalajaga või saab cum laude. Saab ka mõõta, kui hästi olümpiaaditulemused ennustavad õppeedukust ülikoolis. See võimaldab otsustada, kas on põhjendatud olümpiaaditulemuse arvestamine vastuvõtul.

Ülikoole võiks sarnaselt võrrelda üliõpilaste teadustööde konkursside tulemuste alusel (samuti vabalt netis), aga probleemiks on väike andmehulk. Õppetoetuse saajate nimekiri näitab kahjuks ainult ülikoolisisest suhtelist järjestust, nii et ülikoolide vahelist võrdlust ei võimalda.

Keele keerukuse mõõtmisest

On loogiline, et mitte kõik keeled pole sama lihtsad õppida, aga vestlustest on meelde jäänud arvamuste paljusus keeruliste ja lihtsate keelte osas. Kuidas siis mõõta keele keerukust? Naiivne lähenemine oleks mõõta mitut keelt õppivate inimeste teatud tasemele jõudmise kiirust igas nende õpitavas keeles, kui keeli õpitakse sama intensiivsusega. Iga keele puhul peaks siis võtma keskmise seda õppivate inimeste taseme saavutamise kiiruse.

Tegelikult ei annaks selline mõõtmine kuigi täpset tulemust, sest teatud keelte koos õppimine võib mõlema tundmist kiirendada või aeglustada. Lisaks varasem keeleoskus mõjutab, millist keelt inimene kiiremini õpib – eestlasele on soome keelt õppida hulga lihtsam kui inglasele või hiinlasele. Varasema keeleoskuse mõju neutraliseerimiseks peaks vaatama inimesi, kes (veel) ühtki keelt ei oska, ehk mõõtma erinevate emakeeltega väikelastel teatud keeleoskuse taseme saavutamise vanust. See on pisut keerukam, kui täiskasvanute keeleoskuse taseme mõõtmine, sest väikelastele sobivat keeleeksamit välja mõelda on raskem.

Täiskasvanute keeleõppekiiruse mõõtmisel peaks arvesse võtma võimalikke vastasmõjusid keelte vahel, ehk leidma korraga nii keelte keerukuse kui vastasmõjude võrgustiku. Selge on, et varasem sarnasema keele oskus lihtsustab õppimist rohkem. Suurema arvu keelte oskus lihtsustab samuti uute keelte õppimist, aga siin peab arvestama ka inimese keelealaste võimetega – kes oskab paljusid keeli, sellele ilmselt meeldib keeli õppida ja tal on arvatavasti rohkem annet.

Lisaks sõltub teatud keele õppimise keerukus sellest, kuidas juba osatavad keeled õpitava suhtes paiknevad. Kui õpitakse keelt, mis on varem osatavate kombinatsioon, on see lihtsam, kui keel, mis on varem õpitutest samal kaugusel, aga pole nende segu. Näiteks inglise keeles on palju elemente nii saksa kui prantsuse keelest, mis peaks lihtsustama inglise keele õpet neile, kes saksa ja prantsuse keelt juba oskavad, võrreldes nendega, kes oskavad saksa ja hollandi keelt. Samuti peaks inglise keel lihtsam olema hollandi ja prantsuse kui saksa ja hollandi keele oskajatele. Inglise keel on lähedasem saksa ja prantsuse keele kombinatsioonile (paikneb nende kahe „vahel“) kui saksa ja hollandi keele kombinatsioonile (mis mõlemad erinevad inglise keelest „samas suunas“).

(Hollandi keele kaugus inglise keelest on vist umbes sama, mis prantsuse keelel. Kui mitte, tuleb eelnevat näidet muuta.)

Kas tagasi lükatud inimesed on hiljem edukamad: empiirilise töö idee

Wall Street Journal kirjutab mitmest kuulsast inimesest, kes ei saanud oma valitud ülikooli sisse ja kellele see oli motiveerivaks teguriks, et ennast tõestada. Näiteks Warren Buffett lükati Harvardi Ärikoolist tagasi. Tagasilükkamine pidavat tekitama mõtte, et „ma neile alles näitan“ ja suurema pingutuse edu nimel, mis omakorda teeb inimese edukamaks. Mulle tundub see väide kahtlane ja nii mõtlesin, kuidas seda empiiriliselt kontrollida.

Uurimisküsimus on, et kas muude muutujate samaks jäädes on oma kõige eelistatumast ülikoolist tagasi lükatud inimesed edukamad kui sinna sisse saanud.

Selle mõõtmiseks on vaja iga inimese kohta andmeid tema ülikoolide eelistusjärjestuse, kandideerimise, vastuvõtmise, õppimaasumise, lõpetamise ja edasise edu kohta. Agregeeritud andmed on keskmise nelja muutuja kohta olemas isegi Eesti Statistikaametil. Paljudelt ülikoolidelt saab viimase viie muutuja kohta agregeeritud andmeid. Lisaks on tehtud uuringuid selle kohta, kuidas inimesed ülikoolid eelistusjärjekorda seavad.

Erinevalt eelnevast kirjandusest on vaja mikroandmeid, mis seostavad ühe inimese tagasilükkamise ja tema edasise edu. Selleks on vaja vähemalt inimese eelistusi ülikoolide osas, vastuvõttu ja edasist edu. Valim peab olema piisavalt suur, et võrrelda muus osas sarnaseid inimesi, kes said või ei saanud teatud ülikooli sisse.