Parasiitsõnade eemaldamine kõnetuvastustehnoloogiaga

Eesti raadiojaamadest on mulle ebameeldivalt kõrva jäänud diktorite parasiitsõnad (ää, ee, mm, nigu) ja vead teksti mahalugemisel. Ka ingliskeelsetes riikides olen kuulnud mõnda kõnepidajat, kellel rääkimisoskus vilets. Arvuti teksti kõneks muundamise programm (text to speech, TTS) loeks ette vigadeta ja ilmekamalt.

Parasiitsõnad saab kõnetuvastustehnoloogiaga eemaldada kui inimene ise ei viitsi ettelugemist või kõnepidamist harjutada. Tuleb suuline tekst arvutiga kirjalikuks muundada (speech to text), osa sõnu eemaldada, siis lasta arvutil saadud tekst taas kõneks muundada ja ette lugeda. Igasugust elektrooniliselt edastatud suulist teksti on tehnoloogiliselt võimalik niimoodi parandada kui salvestamise ja edastamise vaheline viitaeg on pikem kõige pikemast eemaldatavast parasiitsõnast. Enamasti saab isegi jätta mulje reaalajas edastamisest, sest paarisekundilist viitaega kuulajad tõenäoliselt tähele ei pane, eriti kui kõnekiirust reaalajas kohandada, et vaikusehetki täita.

Madalama tehnoloogiatasemega lahendus on keelekorrektor, kes salvestisest parasiitsõnad enne edastamist kustutab. Ka seda saab tänapäeval teha arvutis, kus korrektor kuulab reaalajas kõnet ja märgib parasiitsõna kuuldes viimase sekundi (või muu vahemiku vastavalt sõna kestusele) kustutamiseks. Abiks on heli visualiseerija, näiteks seismogrammi sarnane sakiline joon, mis aitab just kuuldud tekstis sõna piire märkida.

Ilmselt on arvuti abil kõne parandamine odavam kui korrektori palkamine. Kõige odavam on muidugi vilets tekst otse-eetrisse lasta nagu praegu – ju siis enamikku raadiokuulajaid parasiitsõnad piisavalt ei häiri, et jaama vahetada.

Leave a Reply

Your email address will not be published.

WordPress Anti Spam by WP-SpamShield