Arhiiv kuude lõikes: January 2019

Automaattõlge aitab väikestel keeltel püsida

Viimasel ajal on Eesti ajakirjanduses paljud kaevelnud eesti keele väidetava väljasuremise üle, vastustanud ingliskeelset õpet ülikoolides jne. Praeguse trendi jätkudes muutub eesti keel tõepoolest kiiresti inglise laensõnadest küllastunuks ja sureb paari sajandi perspektiivis välja. Oluline eeldus on siinjuures praeguse trendi jätkumine, mis on lähiaastatel küll peaaegu kindel, aga paari aastakümne perspektiivis vähetõenäoline. Paralleel on siin eesti rahva väljarändega, millest viimase kahekümne aasta jooksul ennustati rahvale kadu ja lauldi meedias nutulaulu. Viimasel paaril aastal on aga migratsioonitrend pöördunud: eestlasi on Eestisse liikunud rohkem kui Eestist välja. On ka muid näiteid trendide muutusest: Briti Impeerium ei vallutanud 19. sajandi lõpuks maailma, ega ka Saksa Riik 1941. aasta lõpuks Euraasiat, kuigi trendi põhjal seda ennustati.

Lihtsalt väita, et trend muutub, sest ajaloos on mõnikord nii juhtunud, on muidugi tühi jutt. Tõsiseltvõetavuseks peaksid olema teoreetilised või andmepõhised argumendid, miks trendi muutus tõenäoline on. Minu argument on tõlkeprogrammide jätkuv paranemine ja vabatahtliku inimtõlke levik. Palju tekste, näiteks vaba tarkvara juhendid ja Vikipeedia, on inimesed tasuta ära tõlkinud. Google Translate suudab Euroopa keelte vahel minu kogemuse järgi juba enamvähem arusaadavalt tõlkida. Mida rohkem on tasuta tõlget saadaval, seda väiksem on motivatsioon oma keele võõrkeelega asendamiseks (ja ka keeleõppeks üldiselt).

Kui kirjalik ja suuline suhtlus suudetakse nii kiirelt ja täpselt tõlkida, et inimene ei saa aru, kas räägib omakeelse või teisekeelsega, siis lähevad inimesed kergema vastupanu teed ja suhtlevad oma keeles. Siis lõpeb trend väikeste keelte väljasuremise suunas. Pigem tekib trend keelte lahknemiseks ja killustumiseks, sest iga inimene saab rääkida nii nagu talle mugavam on, tarvitsemata järgida ühtegi õigekirja. Arvuti selgitab nagunii ühe inimese mõtte teisele, nii et iga inimene saab probleemideta enda individuaalset keelt kasutada.

Sellise märkamatu tõlkeni on veel aega, sest praegune arvutipõhine automaattõlge on nähtavalt konarlik. Praegu tõlgivad arvutid sõnakaupa ja neil on raskusi konteksti arvesse võtmisega. Arvutusvõimsuse ja andmebaaside mahu kasvades saab tõlkida lausekaupa, siis juba lõigukaupa jne. Iga tekstiühiku puhul on kontekstil teatud mõju tähendusele, aga mida pikem ühik, seda väiksem. Tõlge muutub pikematel tekstilõikudel põhineva tõlkega järjest täpsemaks, kuigi täiuslikkus on siin maailmas muidugi saavutamatu. Samas pole täiuslikkust kasutatavuseks tarvis, piisab enam-vähem arusaadavusest.

Kui tahta eesti keelt praegusele või ajaloolisele lähedasel kujul säilitada, on parim meetod arendada automaatset tõlget ja õigekirjakontrolli. Paljudes avalikes tekstides olen näinud sagedasi kirjavigu ja viletsa otsetõlke konarusi, mis keele edasikandumise huvides parandada tuleks. Keelt aitab säilitada ka rahva seas populaarsete tekstide (arvutimängud, filmid, uudised) kvaliteetne ja kiire inimtõlkimine eesti keelde. Kui meelelahutus ja tarbetekstid on omakeelsed, siis suunab laiskus rahvast enda keelt kasutama. Inimtõlge on aga oma mahult liiga piiratud võrreldes maailmas toodetud tekstihulgaga, seetõttu pole inimtõlkest ka keele säilitamisel palju abi. Enda keele eeliskasutamise motivatsiooni loob mitte oma keeles kätte saadava teksti maht (mis on praegu suurem kui iial varem), vaid omakeelse teksti protsent kogu saadaolevast tekstist. See suhtarv on kaasajal väiksem kui kunagi enne, aga automaattõlke arenguga muutub suuremaks kui ajalooliselt ja läheneb lõpuks sajale protsendile.

Valitsus saaks aidata keelt säilitada tasuta tõlkeprogramme arendades ja levitades. Ei maksaks minna nii kaugele, et teha veebilehtede automaatne eesti keelde ümberpanek vaikimisi variandiks või lausa kohustuslikuks, sest sundus tekitab vastuseisu, ka oma keele kasutamisel. Praegu Google juba pakub varianti „tõlgi see leht”, mis on tore kui seda esimest korda näha. Kahjuks selle pakkumise eemaldamine veebilehe ülaservast on pisut keeruline, mis tekitab minus teatud trotsi, eriti kuna pakutav tõlge pole veel sama hea kasutatavusega kui ingliskeelne originaal. Keelte puhul, mida ma ei oska, on aga veebilehe tõlkimine Googlei poolt väga tervitatav.