Sildiarhiiv: keel

Automaattõlge aitab väikestel keeltel püsida

Viimasel ajal on Eesti ajakirjanduses paljud kaevelnud eesti keele väidetava väljasuremise üle, vastustanud ingliskeelset õpet ülikoolides jne. Praeguse trendi jätkudes muutub eesti keel tõepoolest kiiresti inglise laensõnadest küllastunuks ja sureb paari sajandi perspektiivis välja. Oluline eeldus on siinjuures praeguse trendi jätkumine, mis on lähiaastatel küll peaaegu kindel, aga paari aastakümne perspektiivis vähetõenäoline. Paralleel on siin eesti rahva väljarändega, millest viimase kahekümne aasta jooksul ennustati rahvale kadu ja lauldi meedias nutulaulu. Viimasel paaril aastal on aga migratsioonitrend pöördunud: eestlasi on Eestisse liikunud rohkem kui Eestist välja. On ka muid näiteid trendide muutusest: Briti Impeerium ei vallutanud 19. sajandi lõpuks maailma, ega ka Saksa Riik 1941. aasta lõpuks Euraasiat, kuigi trendi põhjal seda ennustati.

Lihtsalt väita, et trend muutub, sest ajaloos on mõnikord nii juhtunud, on muidugi tühi jutt. Tõsiseltvõetavuseks peaksid olema teoreetilised või andmepõhised argumendid, miks trendi muutus tõenäoline on. Minu argument on tõlkeprogrammide jätkuv paranemine ja vabatahtliku inimtõlke levik. Palju tekste, näiteks vaba tarkvara juhendid ja Vikipeedia, on inimesed tasuta ära tõlkinud. Google Translate suudab Euroopa keelte vahel minu kogemuse järgi juba enamvähem arusaadavalt tõlkida. Mida rohkem on tasuta tõlget saadaval, seda väiksem on motivatsioon oma keele võõrkeelega asendamiseks (ja ka keeleõppeks üldiselt).

Kui kirjalik ja suuline suhtlus suudetakse nii kiirelt ja täpselt tõlkida, et inimene ei saa aru, kas räägib omakeelse või teisekeelsega, siis lähevad inimesed kergema vastupanu teed ja suhtlevad oma keeles. Siis lõpeb trend väikeste keelte väljasuremise suunas. Pigem tekib trend keelte lahknemiseks ja killustumiseks, sest iga inimene saab rääkida nii nagu talle mugavam on, tarvitsemata järgida ühtegi õigekirja. Arvuti selgitab nagunii ühe inimese mõtte teisele, nii et iga inimene saab probleemideta enda individuaalset keelt kasutada.

Sellise märkamatu tõlkeni on veel aega, sest praegune arvutipõhine automaattõlge on nähtavalt konarlik. Praegu tõlgivad arvutid sõnakaupa ja neil on raskusi konteksti arvesse võtmisega. Arvutusvõimsuse ja andmebaaside mahu kasvades saab tõlkida lausekaupa, siis juba lõigukaupa jne. Iga tekstiühiku puhul on kontekstil teatud mõju tähendusele, aga mida pikem ühik, seda väiksem. Tõlge muutub pikematel tekstilõikudel põhineva tõlkega järjest täpsemaks, kuigi täiuslikkus on siin maailmas muidugi saavutamatu. Samas pole täiuslikkust kasutatavuseks tarvis, piisab enam-vähem arusaadavusest.

Kui tahta eesti keelt praegusele või ajaloolisele lähedasel kujul säilitada, on parim meetod arendada automaatset tõlget ja õigekirjakontrolli. Paljudes avalikes tekstides olen näinud sagedasi kirjavigu ja viletsa otsetõlke konarusi, mis keele edasikandumise huvides parandada tuleks. Keelt aitab säilitada ka rahva seas populaarsete tekstide (arvutimängud, filmid, uudised) kvaliteetne ja kiire inimtõlkimine eesti keelde. Kui meelelahutus ja tarbetekstid on omakeelsed, siis suunab laiskus rahvast enda keelt kasutama. Inimtõlge on aga oma mahult liiga piiratud võrreldes maailmas toodetud tekstihulgaga, seetõttu pole inimtõlkest ka keele säilitamisel palju abi. Enda keele eeliskasutamise motivatsiooni loob mitte oma keeles kätte saadava teksti maht (mis on praegu suurem kui iial varem), vaid omakeelse teksti protsent kogu saadaolevast tekstist. See suhtarv on kaasajal väiksem kui kunagi enne, aga automaattõlke arenguga muutub suuremaks kui ajalooliselt ja läheneb lõpuks sajale protsendile.

Valitsus saaks aidata keelt säilitada tasuta tõlkeprogramme arendades ja levitades. Ei maksaks minna nii kaugele, et teha veebilehtede automaatne eesti keelde ümberpanek vaikimisi variandiks või lausa kohustuslikuks, sest sundus tekitab vastuseisu, ka oma keele kasutamisel. Praegu Google juba pakub varianti „tõlgi see leht”, mis on tore kui seda esimest korda näha. Kahjuks selle pakkumise eemaldamine veebilehe ülaservast on pisut keeruline, mis tekitab minus teatud trotsi, eriti kuna pakutav tõlge pole veel sama hea kasutatavusega kui ingliskeelne originaal. Keelte puhul, mida ma ei oska, on aga veebilehe tõlkimine Googlei poolt väga tervitatav.

Viisakusavalduste tõlkimisest sõnasõnalt

Mõne keele kõnelejaid peetakse viisakamaks kui teise, näiteks on tekkinud stereotüüp „prantslaslik viisakus”. Näilise viisakuse põhjuseks on tõenäoliselt see, et inimesed tõlgivad oma keele viisakuse teise keelde otse. Teises keeles vastavad otse tõlgitud sõnad aga kõrgemale viisakustasemele („kas te palun ulataksite” on kõrgem kui „palun ulatage”, mis on kõrgem kui „anna”). Teisest keelest esimesse otse tõlkides satutakse jällegi madalamale viisakustasemele. Nii tekib stereotüüp ebaviisakatest matsidest.
Ma ei usu, et ühe keele rääkijad on olemuselt viisakamad kui teise, sest inimesed on kõikjal maailmas üsna sarnased. Näiliselt viisakates keeltes tundub olevat umbes sama palju roppusi ja solvanguid kui teistes. Solvata saab ka väga viisakate sõnadega.
Ka muud kultuuriga seotud väljendid ajavad otse tõlkides segadusse või vähemalt minetavad tähendusvarjundi. „Meie igapäevast leiba” oleks aasia keeltes tähenduselt lähedasem fraasile „meie igapäevast riisi”. Ingliskeelne „bread” tuleks igapäevakasutuses eesti keelde tõlkida „sai”, sest olemuselt on inglise „bread” nisujahust päts. Aga metafooriliselt tuleks „bread” tõlkida „leib”, näiteks Piiblis.

Tänavanime valikust

Keeleseadus piirab tänavanimede valikut, aga nimesid on piisavalt, et tekiks valikuraskus. Lühem on lihtsam meeles pidada ja aadressile kirjutada, eriti kui internetis on aadressiväljal piiratud arv tähemärke. Nimi võiks olla Eestis ainulaadne, et ei tekiks segadust. Eriti samas linnas kaks sama nimega tänavat tekitab probleeme. Nimi peaks olema positiivse tähendusega, et elanikud seal elada tahaksid ega masendusse ei satuks – näiteks Surma tänav on halb mõte.
Kui kinnisvaraarendaja teeb uue rajooni ja otsib tänavatele nimesid, siis osad nimed teevad piirkonnale tasuta reklaami. Eesti keele rikkused võivad lausa Guinnessi rekorditeraamatusse minna: sõnad nagu õieaia (pikim täishäälikutest koosnev), jää-ääre, kuu-uurija. Huvitavad on ka õe, ao, au, oa, öö, eratare, aerurea, ajaja, elutule (viimased on eest ja tagant lugedes samad). Täishäälikuid reastavad suurel arvul sõnad “meieaegne, nõiaoa, neiuaia, peiuea, ööõie”. Lõbusad nimed on ka Kohvi tee ja Tee tee. Kui neil kohvik ja teepood avada, saab nimeks panna “Kohvi tee kohv ja tee” ja “Tee tee tee”.

Anonüümse kasutajanime valik

Kui tahta anonüümseks jääda, ei tohiks kasutajanimi ega salasõna (ega midagi muud sisestatut) sisaldada infot sinu tausta kohta. Ehk kasutajanimi ega salasõna ei tohiks olla eesti keeles, vaid peaks olema inglise või mõnes muus suures keeles. Need ei tohiks sisaldada kultuurilisi viiteid (kalevsson, forestbrother), vaid peaksid olema näiteks massilevikuga arvutimängudest või filmidest (raider, halfelven, di3hard).

Väga intelligentsetest kasutajanimedest (morslongavitabrevis, lenfercestlesautres) tuleks hoiduda, kui tahta haridustausta varjata.

Nime valik lapsele

„Ütle mulle üks ilus poisslapse nimi!“

Unikaalsus tundub nime puhul olevat hea omadus – inimest ei aeta dokumentides kellegagi segamini. Ei saa muidugi kindel olla, et tulevikus keegi oma lapsele täpselt sama nime ei pane, aga selle tõenäosust saab vähendada, valides haruldase eesnime. Kui perekonnanimi on unikaalne, siis ükskõik millise eesnime puhul on terve nimi ainus maailmas praegu ja tõenäoliselt lähemas tulevikus. Levinud perekonnanime puhul on unikaalse nime valik keeruline.

Nimi võiks olla lihtne kirja panna, välja öelda ja meelde jätta. Lihtsus on suures osas mõõdetav tähtede arvuga nimes. Poistel on lihtsaimad vist kolmetähelised nimed (Enn, Ain, Uku), järgmiseks neljatähelised (Tiit, Olev, Ahto, Ants) jne. Tüdrukutel on ka Ly, kuigi see on võõras, muidu kolmetähelised Ela, Tea, Eve, Anu, Lea. Lühikest nime pole ka vaja hüüdnime jaoks lühemaks lõigata.

Bürokraatlike probleemide vähendamiseks reisimisel peaks vältima riigispetsiifilisi tähti õ, ä, ö, ü. Igasugustesse andmebaasidesse sisestamisel on erisümbolid samuti probleemiks. Eesti nimedest tekitavad võõrkeeltes kindlasti probleeme Õie, Krõõt, Äili, Ülo, Väino, Pärt.

Nimi võiks väljaütlemisel ilusasti kõlada, eriti tüdrukutel. Kõla sõltub muidugi kõneleja keelest (Euridice eesti hääldus Euridiitse, inglise hääldus Juridiss), nii et peaks arvestama keelega, milles seda nime tõenäoliselt kõige sagedamini ütlema hakatakse. Minu jaoks kõlavad kõige ilusamini sõnad, milles on palju e, i ja l häälikuid (seetõttu pean ma eesti keelt väga ilusaks), nii et näiteks tüdrukunimede puhul eelistaksin ma Elet Anule, Ellenit Krõõdale.

Hea oleks, kui nimi ei tähendaks midagi halba, eriti mõnes suure kõnelejate arvuga keeles. Näiteks Reet pidavat hollandi keeles tagumikku tähendama. Seda võib olla raske vältida, kuna keeli on maailmas palju ja släng muutub pidevalt, nii et tulevikus võib iga nimi muutuda mõnes keeles roppuseks.

Nime ja mõne sellele lähedaste sõnade tähendus võiks olla midagi positiivset ja lapse sooga sobivat, et koolis mõnitatud saamine vähem tõenäoline oleks. Sellised nimed on näiteks tüdrukutel Õie, Lembi, Helle, Aasa, poistel Kalev, Mehka, Mehis, Karmo, Tarmo, Ott. Tähenduse poolest ei meeldi mulle naisenimedest Aita, Leili, mehenimedest Mats. Sooga sobivus sõltub keelest: Eli võib eesti keeles naisenimi olla, aga on juudi mehenimi.

Eesti ajakirjanduse naljakas kopeerimine

Eesti ajalehtede võrguversioonid tõlgivad tihti uudiseid ingliskeelsetest allikatest, nagu näha tekstide konarlikust ingliskeelelaadsest stiilist. Arusaadavalt pole Eesti meedial raha igale poole oma reportereid saata ja tuleb teiste riikide ajakirjandusega koostööd teha. Uudiste tõlkimine on vältimatu, kvaliteet on nagu ta on. Naljakas on aga Eestisse mittepuutuvate ja eestimaalastele ilmselt vähe huvi pakkuvate uudiste edastamine (võibolla pole ajalehetoimetuses keegi edastavate tekstide sisu uurinud). Sellesse kategooriasse kuuluvad näiteks USA ilmateated ja sisepoliitika. USA elanikule pakub ehk tormihoiatus USA idarannikul huvi, aga pole vist palju eestlasi, kes just sel päeval USAsse reisivad. Ja kui reisivad, siis ilmselt vaatavad enne sihtkohaspetsiifilistelt veebilehtedelt ilma ja muud olulist. Igal juhul ei vajata USA ilmateadet Eesti meedias. Teiste riikide sisepoliitika võib mõjutada nende välispoliitikat ja nii kaudselt Eestit, aga on olulisemaid ja otsesemaid mõjusid, mida kajastada. Eestile lähemate riikide sisepoliitikat ei tutvusta Eesti ajakirjandus üldse nii palju kui USA oma. Muidugi on USA suurem ja maailmas olulisem, aga mitte nii palju kui sellega seonduvate uudiste osakaalust arvata. USA uudiste suure hulga põhjuseks on nende lihtne kättesaadavus ja inglise-eesti tõlke odavus võrreldes teiste keeltega.

Keeleõppe intensiivsusest ja efektiivsusest

Huvitav on võrrelda nädalas keeleõppele kulutatavat aega koolis, Tartu Ülikoolis ja Yale’is. Koolis kulutati inglise keelele neli-viis akadeemilist tundi nädalas, vene ja prantsuse keelele kaks-kolm. Natuke kodutööd oli ka. Tartu Ülikoolis oli saksa keel kaks korda nädalas, vist poolteist tundi korraga, pluss veidi kodutööd otsa. Yale tavalised bakalaureusetudengite keeleõppekursused on viis korda nädalas, õppekava ütleb, et tudengitelt oodatakse kolm tundi kodutööde tegemist päevas. On veel intensiivsed keeleõppekursused, enamasti suvel, kus sama materjal läbitakse kaks korda lühema ajaga. Nendes on kolm tundi klassiõpet ja kuus kuni üheksa tundi kodutöid päevas.

Keeleõppe puhul on minu arvates intensiivsem õppimine efektiivsem. See on sarnasem keelekeskkonnas elamisele. Mitte ainult ei saa kiiremini keelt selgeks, vaid teatud tasemele jõudmiseks kulub vähem töötunde, kui keeletundide vahel pikemat vahet pidades. Unustamise mõju on väiksem, kui keelt kasutatakse iga päev.

Oleks hea, kui Eesti koolides õpetataks üht võõrkeelt korraga, ehk ühel aastal oleksid kõik keeleõppetunnid, mis praegu eri keeltele kulutatakse, sama keele õppimiseks. Siis minnakse üle teise keele õppimisele ja jällegi kulutatakse sellele kõik keeletunnid. Kokku kuluv aeg oleks iga keele puhul sama, lihtsalt kontsentreeritud lühemasse ajavahemikku.

Lisaks jäi minu kooli keeleõppe puhul puudu õpetajate keeleoskusest inglise keele puhul ja õpetamisoskusest prantsuse ja vene keele puhul. Osalt saaks heade õpetajate puudust leevendada, lastes keele- ja õpetamisoskusega inimestel täita ainult neid ülesandeid, milleks neid oskusi tõesti vaja on. Ülejäänud tööga saavad ka madalama kvalifikatsiooniga inimesed hakkama. Seda tööjaotust selgitan ühes teises postituses.

Keele üles märkimise kolmnurk

Kõnekeel on seos tähenduse ja heli vahel, kirjakeel seostab kõnekeele visuaalsete sümbolitega. See seos võib olla tähenduse ja sümboli vahel (hieroglüüfid, matemaatikasümbolid) või heli ja sümboli vahel (tähestikupõhised keeled, foneetilised sümbolid). Kolmikus tähendus-heli-sümbol on alati joon tähenduse ja heli vahel, teine joon võib olla kas tähenduse ja sümboli või heli ja sümboli vahel.

Kui keel kaldub kõrvale sellest reeglist, on teda raskem õppida. Näiteks inglise ja prantsuse keel ei kirjuta üles tähendust ega hääldust (sama tähte hääldatakse eri sõnades erinevalt: e inglise sõnades get, need, same). Kui nende keelte kirjaviis loodi, kirjutas see üles toonast hääldust, aga hääldus on ajas muutunud. Kuigi kirjakeel on samuti muutunud, pole see suutnud hääldusega sammu pidada. Seega peab meelde jätma palju erandeid kirjasõna hääldamisel või häälduse üles kirjutamisel.

Keele keerukuse mõõtmisest

On loogiline, et mitte kõik keeled pole sama lihtsad õppida, aga vestlustest on meelde jäänud arvamuste paljusus keeruliste ja lihtsate keelte osas. Kuidas siis mõõta keele keerukust? Naiivne lähenemine oleks mõõta mitut keelt õppivate inimeste teatud tasemele jõudmise kiirust igas nende õpitavas keeles, kui keeli õpitakse sama intensiivsusega. Iga keele puhul peaks siis võtma keskmise seda õppivate inimeste taseme saavutamise kiiruse.

Tegelikult ei annaks selline mõõtmine kuigi täpset tulemust, sest teatud keelte koos õppimine võib mõlema tundmist kiirendada või aeglustada. Lisaks varasem keeleoskus mõjutab, millist keelt inimene kiiremini õpib – eestlasele on soome keelt õppida hulga lihtsam kui inglasele või hiinlasele. Varasema keeleoskuse mõju neutraliseerimiseks peaks vaatama inimesi, kes (veel) ühtki keelt ei oska, ehk mõõtma erinevate emakeeltega väikelastel teatud keeleoskuse taseme saavutamise vanust. See on pisut keerukam, kui täiskasvanute keeleoskuse taseme mõõtmine, sest väikelastele sobivat keeleeksamit välja mõelda on raskem.

Täiskasvanute keeleõppekiiruse mõõtmisel peaks arvesse võtma võimalikke vastasmõjusid keelte vahel, ehk leidma korraga nii keelte keerukuse kui vastasmõjude võrgustiku. Selge on, et varasem sarnasema keele oskus lihtsustab õppimist rohkem. Suurema arvu keelte oskus lihtsustab samuti uute keelte õppimist, aga siin peab arvestama ka inimese keelealaste võimetega – kes oskab paljusid keeli, sellele ilmselt meeldib keeli õppida ja tal on arvatavasti rohkem annet.

Lisaks sõltub teatud keele õppimise keerukus sellest, kuidas juba osatavad keeled õpitava suhtes paiknevad. Kui õpitakse keelt, mis on varem osatavate kombinatsioon, on see lihtsam, kui keel, mis on varem õpitutest samal kaugusel, aga pole nende segu. Näiteks inglise keeles on palju elemente nii saksa kui prantsuse keelest, mis peaks lihtsustama inglise keele õpet neile, kes saksa ja prantsuse keelt juba oskavad, võrreldes nendega, kes oskavad saksa ja hollandi keelt. Samuti peaks inglise keel lihtsam olema hollandi ja prantsuse kui saksa ja hollandi keele oskajatele. Inglise keel on lähedasem saksa ja prantsuse keele kombinatsioonile (paikneb nende kahe „vahel“) kui saksa ja hollandi keele kombinatsioonile (mis mõlemad erinevad inglise keelest „samas suunas“).

(Hollandi keele kaugus inglise keelest on vist umbes sama, mis prantsuse keelel. Kui mitte, tuleb eelnevat näidet muuta.)

Hääldusest foneetilise kirjaga keeltes

Eesti keel emakeelena on kasulik vähemalt ühes aspektis – ma saan õigesti hääldada peaaegu kõigi inimeste nimesid, keda ma kohtan, sealhulgas nimesid tonaalsetes keeltes nagu mandarini ja kantoni. Sama hääldamisvõimekust olen täheldanud türklaste ja peaaegu sama soomlaste puhul, aga mitte ühegi teisel siin kohatud rahvusel. Erinevaid rahvusi olen kohanud palju, kuna Yale kogukond on üsna rahvusvaheline – kraadiõppes on välistudengeid 30% ja bakalaureuseõppes 9% (ülikooli enda statistika kohaselt). See on veidi petlik, sest kanadalased on kultuuriliselt USA inimestega väga sarnased, aga loetakse välismaalasteks, samas hiljuti USAsse immigreerunud ja üsna viletsa inglise keele oskusega inimesed kohalikeks.

Aga ainus seos, mida ma eesti ja türgi keele vahel näen, on (peaaegu) foneetiline kirjapilt – tähte hääldatakse samamoodi, olenemata selle asukohast sõnas. Inglise keeles hääldatakse tähte e sõnades get, need, same kolme erinevat moodi, aga lugedes neid sõnu eesti keele hääldusega, on igal pool häälik e. Foneetiline kirjapilt paistab lihtsustavat teiste keelte hääldamist, aga seal võib olla muid ja tähtsamaid tegureid. Ma pole keeleteadlane, ei oska öelda.

Igatahes ingliskeelsete inimeste nende jaoks võõraste nimede hääldus on üsna naljakas. Esimest korda, kui kuulsin prof. Juuso Välimäki nime ameeriklase suust, arvasin, et tegu on kellegi jaapanlase Yu-So Valimakiga. Minu perenime hääldavad kohalikud saksapäraselt Hainsalu, eesnime inglisepäraselt Sänder.