Masintõlge ja andmekaitse: mida ettevõtjad teada võiksid
Tehisintellekti abil tõlkimine on muutunud või peagi muutumas paljudele ettevõtetele igapäevaseks praktikaks. See on kiire, mugav ning enamasti ka piisavalt täpne, et lihtsamaid tavatekste tõlkida. Kuid sageli ei mõelda sellele, kuhu tõlgitav tekst tegelikult liigub ja mida sellega edasi tehakse. Tasuta masintõlge tundub süütu, kuid võib tekitada tõsiseid andmekaitseriske. Selle kirjutise eesmärk on selgitada, millist ohtu need tööriistad võivad endast kujutada ning kuidas ettevõtted saavad tegutseda targalt ja turvaliselt.
Kuidas tekib risk? Avalike masintõlkesüsteemide varjuküljed
Populaarsed tasuta masintõlke tööriistad nagu Google Translate või DeepL Free töötavad serverites, mis võivad asuda ükskõik millises riigis. See tähendab, et iga kord, kui ettevõte sisestab neisse oma teksti, saadetakse see info väljapoole ettevõtet ja sageli ka väljapoole Euroopat. Ettevõte ei kontrolli, kuhu teave jõuab, kui kaua seda seal hoitakse või kas seda kasutatakse mudelite arendamiseks
Paljud teenusepakkujad jätavad endale õiguse sisestatud tekst ajutiselt salvestada. See võib tunduda tühine, kuid kui tõlgitakse näiteks kirjavahetusi, klienditeavet või lepinguid, võib info sattuda valesse kohta. Kõik, mis sisaldab isikuandmeid või ärikriitilist infot, tuleks alati hoida avalikest masintõlkesüsteemidest eemal. Tundub küll väga mugavana lihtsalt kopeerida tekst brauserisse ja klikkida „tõlgi“, kuid selline kiirustamine võib hiljem tuua kaasa probleeme.
Mis täpsemalt on isikuandmed?
GDPRi (General Data Protection Rights ehk isikuandmete kaitse üldmäärus) järgi on isikuandmed palju laiem mõiste, kui inimesed tavaliselt arvavad – nimelt ei tähenda see sugugi ainult nime või isikukoodi. Isikuandmed võivad olla ka e-posti aadress, tellimuse number, tarneaadress, terviseandmed, tööülesannete kirjeldused või isegi mingid detailid, mille põhjal saab inimest kaudselt tuvastada. Näiteks võib mõne ettevõtte jaoks täiesti rutiinse projekti kirjeldus sisaldada infot, mis võimaldab tuvastada konkreetse töötaja või kliendi.
Ettevõtted tõlgivad tihti dokumente, mis näivad n-ö „puhtad“, kuid tegelikult sisaldavad peidetud isikuandmeid. Näiteks võib tabelis olla kasutaja identifitseerimisnumber, tegevuslogi või arve number. Kui selline info liigub avalikku masintõlkesse, on tegu juba andmete edastamisega kolmandale osapoolele. See nõuab tavaliselt kliendi nõusolekut ja selget põhjendust. Kui ettevõte pole kindel, kas tekst sisaldab isikuandmeid, on kindlam eeldada, et sisaldab, ning valida turvalisem tõlkemeetod.
Turvaline masintõlge: kuidas see töötab ja mille poolest see avalikest masintõlkesüsteemidest erineb?
Muidugi ei ole kogu masintõlge kui selline ohtlik. Just eelmainitud puhkudeks on loodud turvalised masintõlkesüsteemid, mis võimaldavad ettevõtetel tõlkida tundlikke dokumente ilma andmeid ohtu seadmata.
Erinevalt avalikest tööriistadest ei salvesta turvaline masintõlkeprogramm sisestatud teksti. See ei jaga andmeid teiste kasutajatega, ei kasuta neid programmi treenimiseks ja töötab krüpteeritud keskkonnas; sageli asubki selline süsteem ettevõtte enda serveris või eraldi privaatses pilves, kuhu võõrad silmad ligi ei pääse.
Tõlkebürood kasutavad selliseid lahendusi koos terminibaaside ja inimtoimetajatega. See tähendab, et tõlge on mitte ainult turvaline, vaid ka täpsem ja ühtlasem. Näiteks juriidiliste või meditsiiniliste dokumentide puhul on tavaks kasutada eraldi turvalist serverit, kuhu pääseb ainult valitud personal. Nii ei liigu tekstid kunagi nn avalikku internetti.
Ettevõte peaks tõlkepartnerilt alati küsima, kus nende serverid asuvad, kas nad salvestavad andmeid ja millised turvameetmed on kasutusel. Kui teenusepakkuja on professionaalne, on tal nendele küsimustele selged vastused.
Kokkuvõtteks
Masintõlge võib olla väga kasulik tööriist, mis säästab aega ja raha. Kuid andmekaitse eeskirju arvestamata võib see tekitada tõsiseid probleeme. Avalikud masintõlked sobivad lihtsate tekstide jaoks, kus täpsus ei olegi niivõrd oluline, kuid vähegi tundliku info puhul tuleks alati kasutada turvalisi lahendusi või professionaalset tõlkebürood, sest tark ja teadlik tõlkimine aitab vältida nii trahve kui ka mainekahju. Uus tehnoloogia töötab alati kõige paremini siis, kui seda kasutatakse vastutustundlikult ning antakse endale aru, mida selle kasutamine kaasa tuua võib.
