Sildiarhiiv: keel

Subtiitrite abil lugemisoskuse parandamine

Eesti laste lugemisoskuse parandamiseks on lihtne viis: lisada eestikeelsetele telesaadetele eestikeelsed subtiitrid. Samakeelsete subtiitrite (same-language/within-language/intralingual/unilingual subtitles) mõju on pikalt uuritud, põhiliselt ingliskeelsete subtiitrite puhul Indias ja leitud positiivne olevat. Inglismaal on lausa mittetulundusühing, mis samakeelseid subtiitreid propageerib. Ka võõrkeeleoskus paraneb kui selles võõrkeeles filmid on omakeelsete subtiitritega, mitte peale loetud omakeelse kõnega.

Turundajad saavad subtiitreid ja kõnet korraga kasutades ka telereklaami mõjusamaks muuta, mis võib olla hea või halb, olenevalt vaatepunktist ja reklaami eesmärgist.

Eesti Rahvusringhääling peaks oma esimesest eesmärgist lähtuvalt kohe võimalikult paljudele telesaadetele eestikeelsed subtiitrid lisama, eriti just eestikeelsetele saadetele. Postimees, mille lipukiri on „Seisame eesti rahvuse, keele ja kultuuri säilimise eest läbi aegade” peaks sama tegema oma telekanali Kanal 2 saadetega.

Subtiitreid saab tänapäeval automaatselt arvutiga luua nagu Youtube ja USA telekanalid näitavad. Teatud kirjavead ikka tekivad, eriti pärisnimede ja võõrkeelsete sõnadega. Eesti keel on foneetilisem kui inglise, mis lihtsustab eestikeelset kõnetuvastust ja kõnest tekstiks tõlkimist. Inglise keeles on muidugi suuremad andmebaasid automaattõlke tehisintellekti treenimiseks ja suurem turg, mis motiveerib ettevõtteid tõlget arendama.

Subtiitrikirjutamise võib ka rahvale laiali jagada (crowdsourcing) – iga vabatahtlik trükib enda vaadatavale telesaatele subtiitrid. Töö dubleerimise vältimiseks peab telekanal subtiitritega saadete üle arvet pidama ja vabatahtlikud erinevate saadete kallale suunama. Piisab avalikust arvutustabelist, kus juba subtitreeritud saated kirjas ja vabatahtlikud saavad enda nime subtiitrit vajava saate kõrvale lisada. Lapsevanematel peaks olema kõige suurem motivatsioon subtiitreid luua, et enda ja teiste laste lugemisoskust arendada.

Teksti ja kõne automaatse teisendamise treeningandmed

Masinõppeks on vaja suurt andmehulka. Vähese kõnelejate arvuga keele puhul on kallis palgata inimesi arvutile tekste ette lugema, et arvuti õpiks teksti kõneks teisendama. Samuti on kallis kõne kirjapanijaid palgata, et arvuti õpiks kõnet tekstiks tõlkima. Peaks leidma juba nii kõnes kui kirjas olemas olevaid tekste, mida masinõppele sööta. Üks näide on raadiointervjuud, mis ka ajalehes avaldatakse (Kuku Raadio saade Restart Postimehe majanduslehekülgedel, Toomas Sildami intervjuud). Probleemiks on suulise intervjuu toimetamine enne kirjalikku avaldamist, mis tähendab, et kõne ja tekst ei ole üksüheses vastavuses. Natuke kasu sellest siiski arvutile on, sest osad laused korduvad kõnes ja kirjas. Kõnenäidiseid ilma kirjaliku vasteta saab audiovisuaalsest ajakirjandusest hulganisti, samuti kirjalikku teksti helilise vasteta trükiajakirjandusest.

Kui koolides on tehtud etteütlusi arvutisse trükituna ja nende suuline salvestis on ka saadaval, siis saab neid arvuti treenimiseks kasutada.

Näidendite ja filmide tekstid ja helisalvestised on samuti vastavuses kõne ja kiri. Samuti laulusõnad ja laulud, aga laulu hääldus ja rütm on tavakõnest erinev, nii et see ei pruugi arvutit aidata muus kui laulude tõlkimisel heli ja kirja vahel.

Audioraamatud, mille puhul ettelugemine vastab kirjapandule, on head pikad sama häälega loetud tekstid arvuti treenimiseks.

Maailma suuremate keelte edukamad masintõlkefirmad on ilmselt leidnud palju teisi treeningandmete hulki, mida oma programmide arendamiseks kasutada.

Domineeritud sõnad

Definitsioon: sõna domineerib oma sünonüümi (üldisemalt, sünonüümilähedast sõna) kui esimene sõna on lühem, täpsem, meeldivama kõla, otsesele tähendusele lähedasema tähendusvarjundiga (nt positiivse sõna puhul positiivsema varjundiga) ja parem ka kõigis muudes mõõtmetes, mille alusel sarnase tähendusega sõnu võrrelda.

Näide: sõnad emaema ja isaema domineerivad vanaema, sest on (1) lühemad, (2) täpsemad, sest eristavad emapoolset ja isapoolset vanaema ning viitavad sugulusele, mitte vanusele, (3) vähemalt minu jaoks parema kõlaga, sest e ja i häälikud meeldivad mulle rohkem kui a ning m ja n on samaväärsed, (4) positiivsema tähendusvarjundiga, sest vana on praeguses kultuuris pisut negatiivne omadus (innovatsioon on hea, vananemine nii inimeste kui asjade puhul halb).

Sarnaselt domineerivad isaisa ja emaisa vanaisa. Minia domineerib poja naist, aga sõtse ei domineeri minu jaoks isa õde, sest kõla on ebameeldivam (õ häälik, raskepärane konsonantide ühend, konsonantide suur osakaal tähtedest).

Dominantne sõna on selline, mis domineerib kõiki oma sünonüüme ja sünonüümilähedasi sõnu. Emaema, isaema jne on minu jaoks dominantsed. Memm on tähenduselt liiga kauge, et domineerimist võrrelda, muidu ei domineeriks memm emaema ega vastupidi, sest tähendusvarjund ja lühidus annavad eelise kord ühele, kord teisele.

Domineeritud sõna on selline, mida domineerib mingi sünonüümilähedane sõna. Inimesed kasutavad domineeritud sõnu, sest see on sotsiaalne norm ehk koordinatsioonimängu tasakaal (domineeritud sõna ei ole domineeritud strateegia). Kui enamik ühiskonda kasutab teatud sõna teatud tähenduses ja inimene soovib, et temast aru saadaks, siis peab ta seda sõna samas tähenduses kasutama. Domineeritud sõna kasutatakse, sest enamik seda kasutab. Kui suurem osa ühiskonnast vahetaks antud tähenduses kasutatavat väljendit, siis oleks pea kõigil motiiv selle muutusega kaasa minna (tasakaal vahetuks).

Automaattõlge aitab väikestel keeltel püsida

Viimasel ajal on Eesti ajakirjanduses paljud kaevelnud eesti keele väidetava väljasuremise üle, vastustanud ingliskeelset õpet ülikoolides jne. Praeguse trendi jätkudes muutub eesti keel tõepoolest kiiresti inglise laensõnadest küllastunuks ja sureb paari sajandi perspektiivis välja. Oluline eeldus on siinjuures praeguse trendi jätkumine, mis on lähiaastatel küll peaaegu kindel, aga paari aastakümne perspektiivis vähetõenäoline. Paralleel on siin eesti rahva väljarändega, millest viimase kahekümne aasta jooksul ennustati rahvale kadu ja lauldi meedias nutulaulu. Viimasel paaril aastal on aga migratsioonitrend pöördunud: eestlasi on Eestisse liikunud rohkem kui Eestist välja. On ka muid näiteid trendide muutusest: Briti Impeerium ei vallutanud 19. sajandi lõpuks maailma, ega ka Saksa Riik 1941. aasta lõpuks Euraasiat, kuigi trendi põhjal seda ennustati.

Lihtsalt väita, et trend muutub, sest ajaloos on mõnikord nii juhtunud, on muidugi tühi jutt. Tõsiseltvõetavuseks peaksid olema teoreetilised või andmepõhised argumendid, miks trendi muutus tõenäoline on. Minu argument on tõlkeprogrammide jätkuv paranemine ja vabatahtliku inimtõlke levik. Palju tekste, näiteks vaba tarkvara juhendid ja Vikipeedia, on inimesed tasuta ära tõlkinud. Google Translate suudab Euroopa keelte vahel minu kogemuse järgi juba enamvähem arusaadavalt tõlkida. Mida rohkem on tasuta tõlget saadaval, seda väiksem on motivatsioon oma keele võõrkeelega asendamiseks (ja ka keeleõppeks üldiselt).

Kui kirjalik ja suuline suhtlus suudetakse nii kiirelt ja täpselt tõlkida, et inimene ei saa aru, kas räägib omakeelse või teisekeelsega, siis lähevad inimesed kergema vastupanu teed ja suhtlevad oma keeles. Siis lõpeb trend väikeste keelte väljasuremise suunas. Pigem tekib trend keelte lahknemiseks ja killustumiseks, sest iga inimene saab rääkida nii nagu talle mugavam on, tarvitsemata järgida ühtegi õigekirja. Arvuti selgitab nagunii ühe inimese mõtte teisele, nii et iga inimene saab probleemideta enda individuaalset keelt kasutada.

Sellise märkamatu tõlkeni on veel aega, sest praegune arvutipõhine automaattõlge on nähtavalt konarlik. Praegu tõlgivad arvutid sõnakaupa ja neil on raskusi konteksti arvesse võtmisega. Arvutusvõimsuse ja andmebaaside mahu kasvades saab tõlkida lausekaupa, siis juba lõigukaupa jne. Iga tekstiühiku puhul on kontekstil teatud mõju tähendusele, aga mida pikem ühik, seda väiksem. Tõlge muutub pikematel tekstilõikudel põhineva tõlkega järjest täpsemaks, kuigi täiuslikkus on siin maailmas muidugi saavutamatu. Samas pole täiuslikkust kasutatavuseks tarvis, piisab enam-vähem arusaadavusest.

Kui tahta eesti keelt praegusele või ajaloolisele lähedasel kujul säilitada, on parim meetod arendada automaatset tõlget ja õigekirjakontrolli. Paljudes avalikes tekstides olen näinud sagedasi kirjavigu ja viletsa otsetõlke konarusi, mis keele edasikandumise huvides parandada tuleks. Keelt aitab säilitada ka rahva seas populaarsete tekstide (arvutimängud, filmid, uudised) kvaliteetne ja kiire inimtõlkimine eesti keelde. Kui meelelahutus ja tarbetekstid on omakeelsed, siis suunab laiskus rahvast enda keelt kasutama. Inimtõlge on aga oma mahult liiga piiratud võrreldes maailmas toodetud tekstihulgaga, seetõttu pole inimtõlkest ka keele säilitamisel palju abi. Enda keele eeliskasutamise motivatsiooni loob mitte oma keeles kätte saadava teksti maht (mis on praegu suurem kui iial varem), vaid omakeelse teksti protsent kogu saadaolevast tekstist. See suhtarv on kaasajal väiksem kui kunagi enne, aga automaattõlke arenguga muutub suuremaks kui ajalooliselt ja läheneb lõpuks sajale protsendile.

Valitsus saaks aidata keelt säilitada tasuta tõlkeprogramme arendades ja levitades. Ei maksaks minna nii kaugele, et teha veebilehtede automaatne eesti keelde ümberpanek vaikimisi variandiks või lausa kohustuslikuks, sest sundus tekitab vastuseisu, ka oma keele kasutamisel. Praegu Google juba pakub varianti „tõlgi see leht”, mis on tore kui seda esimest korda näha. Kahjuks selle pakkumise eemaldamine veebilehe ülaservast on pisut keeruline, mis tekitab minus teatud trotsi, eriti kuna pakutav tõlge pole veel sama hea kasutatavusega kui ingliskeelne originaal. Keelte puhul, mida ma ei oska, on aga veebilehe tõlkimine Googlei poolt väga tervitatav.

Viisakusavalduste tõlkimisest sõnasõnalt

Mõne keele kõnelejaid peetakse viisakamaks kui teise, näiteks on tekkinud stereotüüp „prantslaslik viisakus”. Näilise viisakuse põhjuseks on tõenäoliselt see, et inimesed tõlgivad oma keele viisakuse teise keelde otse. Teises keeles vastavad otse tõlgitud sõnad aga kõrgemale viisakustasemele („kas te palun ulataksite” on kõrgem kui „palun ulatage”, mis on kõrgem kui „anna”). Teisest keelest esimesse otse tõlkides satutakse jällegi madalamale viisakustasemele. Nii tekib stereotüüp ebaviisakatest matsidest.
Ma ei usu, et ühe keele rääkijad on olemuselt viisakamad kui teise, sest inimesed on kõikjal maailmas üsna sarnased. Näiliselt viisakates keeltes tundub olevat umbes sama palju roppusi ja solvanguid kui teistes. Solvata saab ka väga viisakate sõnadega.
Ka muud kultuuriga seotud väljendid ajavad otse tõlkides segadusse või vähemalt minetavad tähendusvarjundi. „Meie igapäevast leiba” oleks aasia keeltes tähenduselt lähedasem fraasile „meie igapäevast riisi”. Ingliskeelne „bread” tuleks igapäevakasutuses eesti keelde tõlkida „sai”, sest olemuselt on inglise „bread” nisujahust päts. Aga metafooriliselt tuleks „bread” tõlkida „leib”, näiteks Piiblis.

Tänavanime valikust

Keeleseadus piirab tänavanimede valikut, aga nimesid on piisavalt, et tekiks valikuraskus. Lühem on lihtsam meeles pidada ja aadressile kirjutada, eriti kui internetis on aadressiväljal piiratud arv tähemärke. Nimi võiks olla Eestis ainulaadne, et ei tekiks segadust. Eriti samas linnas kaks sama nimega tänavat tekitab probleeme. Nimi peaks olema positiivse tähendusega, et elanikud seal elada tahaksid ega masendusse ei satuks – näiteks Surma tänav on halb mõte.
Kui kinnisvaraarendaja teeb uue rajooni ja otsib tänavatele nimesid, siis osad nimed teevad piirkonnale tasuta reklaami. Eesti keele rikkused võivad lausa Guinnessi rekorditeraamatusse minna: sõnad nagu õieaia (pikim täishäälikutest koosnev), jää-ääre, kuu-uurija. Huvitavad on ka õe, ao, au, oa, öö, eratare, aerurea, ajaja, elutule (viimased on eest ja tagant lugedes samad). Täishäälikuid reastavad suurel arvul sõnad “meieaegne, nõiaoa, neiuaia, peiuea, ööõie”. Lõbusad nimed on ka Kohvi tee ja Tee tee. Kui neil kohvik ja teepood avada, saab nimeks panna “Kohvi tee kohv ja tee” ja “Tee tee tee”.

Anonüümse kasutajanime valik

Kui tahta anonüümseks jääda, ei tohiks kasutajanimi ega salasõna (ega midagi muud sisestatut) sisaldada infot sinu tausta kohta. Ehk kasutajanimi ega salasõna ei tohiks olla eesti keeles, vaid peaks olema inglise või mõnes muus suures keeles. Need ei tohiks sisaldada kultuurilisi viiteid (kalevsson, forestbrother), vaid peaksid olema näiteks massilevikuga arvutimängudest või filmidest (raider, halfelven, di3hard).

Väga intelligentsetest kasutajanimedest (morslongavitabrevis, lenfercestlesautres) tuleks hoiduda, kui tahta haridustausta varjata.

Nime valik lapsele

„Ütle mulle üks ilus poisslapse nimi!“

Unikaalsus tundub nime puhul olevat hea omadus – inimest ei aeta dokumentides kellegagi segamini. Ei saa muidugi kindel olla, et tulevikus keegi oma lapsele täpselt sama nime ei pane, aga selle tõenäosust saab vähendada, valides haruldase eesnime. Kui perekonnanimi on unikaalne, siis ükskõik millise eesnime puhul on terve nimi ainus maailmas praegu ja tõenäoliselt lähemas tulevikus. Levinud perekonnanime puhul on unikaalse nime valik keeruline.

Nimi võiks olla lihtne kirja panna, välja öelda ja meelde jätta. Lihtsus on suures osas mõõdetav tähtede arvuga nimes. Poistel on lihtsaimad vist kolmetähelised nimed (Enn, Ain, Uku), järgmiseks neljatähelised (Tiit, Olev, Ahto, Ants) jne. Tüdrukutel on ka Ly, kuigi see on võõras, muidu kolmetähelised Ela, Tea, Eve, Anu, Lea. Lühikest nime pole ka vaja hüüdnime jaoks lühemaks lõigata.

Bürokraatlike probleemide vähendamiseks reisimisel peaks vältima riigispetsiifilisi tähti õ, ä, ö, ü. Igasugustesse andmebaasidesse sisestamisel on erisümbolid samuti probleemiks. Eesti nimedest tekitavad võõrkeeltes kindlasti probleeme Õie, Krõõt, Äili, Ülo, Väino, Pärt.

Nimi võiks väljaütlemisel ilusasti kõlada, eriti tüdrukutel. Kõla sõltub muidugi kõneleja keelest (Euridice eesti hääldus Euridiitse, inglise hääldus Juridiss), nii et peaks arvestama keelega, milles seda nime tõenäoliselt kõige sagedamini ütlema hakatakse. Minu jaoks kõlavad kõige ilusamini sõnad, milles on palju e, i ja l häälikuid (seetõttu pean ma eesti keelt väga ilusaks), nii et näiteks tüdrukunimede puhul eelistaksin ma Elet Anule, Ellenit Krõõdale.

Hea oleks, kui nimi ei tähendaks midagi halba, eriti mõnes suure kõnelejate arvuga keeles. Näiteks Reet pidavat hollandi keeles tagumikku tähendama. Seda võib olla raske vältida, kuna keeli on maailmas palju ja släng muutub pidevalt, nii et tulevikus võib iga nimi muutuda mõnes keeles roppuseks.

Nime ja mõne sellele lähedaste sõnade tähendus võiks olla midagi positiivset ja lapse sooga sobivat, et koolis mõnitatud saamine vähem tõenäoline oleks. Sellised nimed on näiteks tüdrukutel Õie, Lembi, Helle, Aasa, poistel Kalev, Mehka, Mehis, Karmo, Tarmo, Ott. Tähenduse poolest ei meeldi mulle naisenimedest Aita, Leili, mehenimedest Mats. Sooga sobivus sõltub keelest: Eli võib eesti keeles naisenimi olla, aga on juudi mehenimi.

Eesti ajakirjanduse naljakas kopeerimine

Eesti ajalehtede võrguversioonid tõlgivad tihti uudiseid ingliskeelsetest allikatest, nagu näha tekstide konarlikust ingliskeelelaadsest stiilist. Arusaadavalt pole Eesti meedial raha igale poole oma reportereid saata ja tuleb teiste riikide ajakirjandusega koostööd teha. Uudiste tõlkimine on vältimatu, kvaliteet on nagu ta on. Naljakas on aga Eestisse mittepuutuvate ja eestimaalastele ilmselt vähe huvi pakkuvate uudiste edastamine (võibolla pole ajalehetoimetuses keegi edastavate tekstide sisu uurinud). Sellesse kategooriasse kuuluvad näiteks USA ilmateated ja sisepoliitika. USA elanikule pakub ehk tormihoiatus USA idarannikul huvi, aga pole vist palju eestlasi, kes just sel päeval USAsse reisivad. Ja kui reisivad, siis ilmselt vaatavad enne sihtkohaspetsiifilistelt veebilehtedelt ilma ja muud olulist. Igal juhul ei vajata USA ilmateadet Eesti meedias. Teiste riikide sisepoliitika võib mõjutada nende välispoliitikat ja nii kaudselt Eestit, aga on olulisemaid ja otsesemaid mõjusid, mida kajastada. Eestile lähemate riikide sisepoliitikat ei tutvusta Eesti ajakirjandus üldse nii palju kui USA oma. Muidugi on USA suurem ja maailmas olulisem, aga mitte nii palju kui sellega seonduvate uudiste osakaalust arvata. USA uudiste suure hulga põhjuseks on nende lihtne kättesaadavus ja inglise-eesti tõlke odavus võrreldes teiste keeltega.

Keeleõppe intensiivsusest ja efektiivsusest

Huvitav on võrrelda nädalas keeleõppele kulutatavat aega koolis, Tartu Ülikoolis ja Yale’is. Koolis kulutati inglise keelele neli-viis akadeemilist tundi nädalas, vene ja prantsuse keelele kaks-kolm. Natuke kodutööd oli ka. Tartu Ülikoolis oli saksa keel kaks korda nädalas, vist poolteist tundi korraga, pluss veidi kodutööd otsa. Yale tavalised bakalaureusetudengite keeleõppekursused on viis korda nädalas, õppekava ütleb, et tudengitelt oodatakse kolm tundi kodutööde tegemist päevas. On veel intensiivsed keeleõppekursused, enamasti suvel, kus sama materjal läbitakse kaks korda lühema ajaga. Nendes on kolm tundi klassiõpet ja kuus kuni üheksa tundi kodutöid päevas.

Keeleõppe puhul on minu arvates intensiivsem õppimine efektiivsem. See on sarnasem keelekeskkonnas elamisele. Mitte ainult ei saa kiiremini keelt selgeks, vaid teatud tasemele jõudmiseks kulub vähem töötunde, kui keeletundide vahel pikemat vahet pidades. Unustamise mõju on väiksem, kui keelt kasutatakse iga päev.

Oleks hea, kui Eesti koolides õpetataks üht võõrkeelt korraga, ehk ühel aastal oleksid kõik keeleõppetunnid, mis praegu eri keeltele kulutatakse, sama keele õppimiseks. Siis minnakse üle teise keele õppimisele ja jällegi kulutatakse sellele kõik keeletunnid. Kokku kuluv aeg oleks iga keele puhul sama, lihtsalt kontsentreeritud lühemasse ajavahemikku.

Lisaks jäi minu kooli keeleõppe puhul puudu õpetajate keeleoskusest inglise keele puhul ja õpetamisoskusest prantsuse ja vene keele puhul. Osalt saaks heade õpetajate puudust leevendada, lastes keele- ja õpetamisoskusega inimestel täita ainult neid ülesandeid, milleks neid oskusi tõesti vaja on. Ülejäänud tööga saavad ka madalama kvalifikatsiooniga inimesed hakkama. Seda tööjaotust selgitan ühes teises postituses.