Masintõlge ja neurovõrgustikul põhinevad tõlkesüsteemid kui murrang tõlkimises

Masintõlge on pidevalt arenev valdkond, mida on viimastel aastatel aidanud oluliselt täiustada tehisaru (AI) ja süvaõppe (deep learning) kasutamine. Üks silmapaistvamaid edusamme on neurovõrgustikul põhinevad tõlkesüsteemid (NMT, Neural Machine Translation), mis on muutnud masintõlke täpsemaks ja loomulikumaks. Masinõppel põhinevad NMT süsteemid suudavad luua kvaliteetseid tõlkeid ka keerukates keeltes, näiteks hiina, araabia või ka erinevates murdekeeltes.

Masintõlke areng enne NMT-d

Masintõlke algusaegadel (1960ndatel) kasutasid süsteemid lihtsaid sõnaraamatupõhiseid meetodeid, mis suutsid sõnu ühest keelest teise tõlkida, kuid tulemused olid sageli ebatäpsed ning ei arvestanud konteksti ega kultuuriliste eripäradega. Järgmine oluline etapp oli statistiline masintõlge (SMT), milles hakati suure andmekogumi põhjal analüüsima sõnade statistilisi seoseid ja tõlkima neid tõenäosuse põhjal. SMT tegi küll suure edusammu, kuid probleemiks jäi sõnade järjekord ning kontekstiga arvestamine. Tulemused olid sageli keeleliselt korrektsed, kuid kõlasid masinlikult ning nõudsid pea alati professionaalset toimetamist.

Tehisnärvivõrkudel põhinevad tõlkesüsteemid: kuidas need töötavad?

Tehisnärvivõrkudel põhinevad tõlkesüsteemid on suur edasiminek võrreldes SMT-ga. NMT süsteemid pakuvad palju täpsemaid ja loomulikumaid tõlkeid. Nende aluseks on tehislikud närvivõrgud, mis imiteerivad inimese aju toimimist ja suudavad ära õppida keerukaid mustreid suurtes andmekogumites. Üks kõige märkimisväärsemaid arenguid on Transformeri mudel, mida Google tutvustas 2017. aastal oma teadusartiklis „Attention is All You Need“. See mudel kasutab nn tähelepanumehhanismi, mis võimaldab süsteemil keskenduda kõige olulisematele sõnadele lauses, vaadeldes lauset kui tervikut, mitte vaid eraldiseisvaid sõnu.

Transformeri mudeli abil saavad NMT süsteemid töödelda terveid lauseid, kus iga sõna tõlge sõltub teistest sõnadest ja kontekstist. See on oluline, kuna suur osa tekste ei ole lihtsalt kuiv info, vaid tegemist on keerukate lausete ja mõtetega, mille täpset tähendust saab määrata vaid konteksti kaudu.

NMT eelised ja probleemid

NMT-l on võrreldes eelnevate süsteemidega palju eeliseid. Esiteks pakuvad NMT mudelid täpsemaid ja loomulikumaid tõlkeid. Kuna need suudavad arvestada terve lause või koguni lõigu konteksti, suudavad nad tõlkida keerukamaid lausekonstruktsioone, mis olid SMT-le kippusid üle jõu käima. Teiseks: NMT süsteemid võivad kiiresti õppida suurtest andmekogumitest, seeläbi pidevalt täiustudes.

Kuid NMT-l on ka oma kitsaskohad. Süsteemid ei pruugi olla kõikides keeltes võrdselt täpsed. Tõlketekstid spetsiifilisemates keeltes, millel on eriti keerukad grammatikareeglid või sõnade järjekorrad, võivad jääda hägusaks või koguni vigaseks.

Tõlkija ja NMT

NMT on oluliselt muutnud tõlkijate tööd, pakkudes kiiret ja täpset esialgset tõlget, kuid siiski on inimtõlkija roll kahtlemata vajalik. Tõlkijad saavad nüüd keskenduda masintõlke tehtud vigade parandamisele ning tekstide kohandamisele, selle asemel et ise algusest lõpuni iga sõna tõlkida. Kuigi NMT muudab tööprotsessi kiiremaks, on tõlkijapoolne kontroll väga oluline, eriti kui tegu on tekstiga, kus eksimisruumi ei ole, näiteks lepingud, meditsiinialased teavikud jne. Samuti on tõlketöös oluline erialaspetsialistide roll, kuna masintõlge ei suuda veel iga valdkonna sõnavara perfektselt kasutada.

NMT tulevik ja areng

NMT arendamine ei lõpe niipea – pigem on tegemist alles pika teekonna algusega, mille eesmärgiks on veelgi täpsemate tõlgete võimekus. Üks tulevikusuund on multikeelsed mudelid, mis võimaldavad ühe süsteemi kaudu tõlkida mitut keelt, minimeerides ressursikulu ja lihtsustades tõlketööd.

Uued tehnoloogilised arengud sünnitavad ka uusi rakendusi, näiteks erinevaid keeleõppe rakendusi ja reaalajas tõlkimise võimalusi.

Kokkuvõte

Tehisnärvivõrgustikul põhinevad tõlkesüsteemid on toonud masintõlke valdkonda suure edasimineku, pakkudes täpsemaid, loogilisemaid ja loomulikumaid tõlkeid. Erinevalt eelmistest süsteemidest suudavad NMT mudelid arvestada keelte ning kultuuride iseärasustega, tagades kõrge kvaliteediga tõlked. Samas ei ole kindlasti tegu imemasinaga – hetkel nõuavad ka NMT-l põhinevad tõlked inimese pilku ja kätt.

AI tõlge