• Any questions?+421 911 307 600
Preklady Echo

Nástroje na automatický/strojový preklad

Nástroje na automatický/strojový preklad

V medzinárodnom kontexte je strojový/automatický preklad označovaný skratkou MT (angl. Machine Translation), príp. AT (angl. Automated Translation) či FAMT (Fully Automated Machine Translation). Strojový preklad2 znamená počítačom zrealizovaný automatický preklad textu z jedného prirodzeného jazyka (východiskového jazyka) do druhého (cieľového), bez zásahu človeka do procesu prekladu. Ak hovoríme o nástrojoch na strojový preklad, máme na mysli rôzne prekladače, ktoré plnia funkciu prekladateľa, teda akoby ho „nahradzovali, zastupovali“. V našom príspevku sa budeme venovať internetovým prekladačom, ktoré pracujú v režime on-line, kedy je možné vložiť slovo, ale aj siahodlhý text do internetového prekladača a ten za veľmi krátky čas ponúkne jeho preklad. Je nevyhnutné zdôrazniť, že počítačom ponúknutá verzia prekladu je iba pracovný preklad (tzv. podstročník), t. j. text, ktorý musí prekladateľ dôsledne skontrolovať, čiže dôraz sa kladie na jeho finálnu korektúru. Komplikácie s prekladom nastávajú hlavne pri polysémických výrazoch, homonymických jednotkách, reáliách, inotajoch, alúziách, ustálených slovných spojeniach, skratkách, slovách s preneseným významom, antroponymách, zaužívanej terminológie, tiež pri prevode typických gramatických kategórií, syntaktických konštrukcií atď., teda toho, čo je špecifické pre ten-ktorý prirodzený jazykový kód. Prekladač sa odporúča použiť pri preklade napríklad „bežných“ komunikačných fráz, „jednoduchších“ odborných textov. Výhodami prekladačov je ich rapidnosť, komfortnosť, siplicitnosť, dostupnosť. Aj napriek tomu, že v súčasnosti sú dosť sofistikované, ale žiaden z nich neponúka 100 %
kvalitu, t. zn., že v mnohých prípadoch nezodpovedá originál prekladu. Z toho vyplýva, že prekladačom ponúknutá verzia má „ďaleko od dokonalosti“ a jej podobu je potrebné zrevidovať. Chceli by sme upozorniť na to, že tieto elektronické nástroje majú výsostne asistenčný charakter. Je potrebné mať na vedomí, že by sa mali používať až vtedy, keď prekladateľ dosiahne určitý kompetenčný stupeň východiskového a cieľového jazyka. Ľahko by sa mohlo stať, že neskúsený prekladateľ im natoľko podľahne, že sa bude spoliehať viac na nich ako na seba a neodhalí posuny, ktoré nastali pri strojovom preklade. Nedostatky či nezrovnalosti pri prevode strojovým prekladačom môžeme ilustrovať na niekoľkých exemplifikáciách. Google prekladač pri preklade zo slovenčiny do ruštiny náhodne vybraných, ale často používaných slov, slovných spojení, skratiek urobil nasledujúce chyby: národnosť (správne – национальность, nesprávne – гражданство), splnomocňujem (správne – удостоверяю, nesprávne – разрешаю), maturitné vysvedčenie (správne – свидетельство об экзамене на аттестат зрелости, nesprávne – аттестат), študijný odbor (správne – специализация, nesprávne – область исследования), štúdium na filozofickej fakulte (správne – учеба на философском факультете, nesprávne – исследование на факультете искусств), akademický titul (správne – степень, nesprávne – ученое звание), pracovná zmluva (správne – трудовой договор, nesprávne – рабочее соглашение), Výpis z registra trestov (správne – Справка о судимости, nesprávne – Сведения о судимости), technický preukaz (správne – технический паспорт, nesprávne – техническая лиценция), IČO, Z. z. (správne – ИНО, Св. з.; uvedené skratky prekladač nepreložil). Týmito príkladmi sme chceli poukázať na to, aké zradné môže byť použitie strojového prekladača.

Medzi významné české prekladače radíme APAČ, Ruslan, Česílko. V súčasnosti sa populárnou stala paleta produktov českej spoločnosti Microton (Eurotran 2009, Wordmaster 2009 sú nástroje určené na preklad textových dokumentov na anglických, nemeckých webových stránkach do českého jazyka). K aktuálnym a často využívaným prekladačom patria PC Translator, Google Translate, SYSTRAN. V nasledujúcich riadkoch krátko predstavíme Google Translate, tiež SYSTRAN a zmienime sa aj o projekte EuroMatrix, ktorý je ešte v štádiu vývoja.

Google Translate (Google prekladač) je schopný prekladať z/do 58 jazykov (v štádiu testovania je ďalších 6 jazykových kódov). Je založený na princípe vkladania slov do prekladateľského systému a potom na báze rýchleho vyhľadávania identických, analogických slov, slovných spojení v paralelných textov na stránkach s obrovským množstvom dokumentov, ktoré už boli v minulosti niekým preložené a následnej analýze s vyhodnotením výskytu eventuálnych ekvivalentov systém vygeneruje preklad. V pracovnom prostredí Google prekladača je možné vidieť ako východiskový text, tak aj cieľový. Táto možnosť
zrkadlového obrazu prekladateľovi výrazne uľahčuje finálnu kontrolu (korektúru). Google prekladač je on-line, t. j. voľne dostupný internetovým užívateľom. Medzi pracovnými jazykmi je aj slovenčina.

Spoločnosť SYSTRAN vyvinula niekoľko prekladateľských softvérov – SYSTRAN 7 Premium Translator, SYSTRAN 7 Business Translator, SYSTRAN 7 Office Translator, SYSTRAN 7 Home Translator, ktoré podľa špecifikácie balíka toho-ktorého produktu môžu prekladať texty, e-maily, súbory v PDF formáte, prekladateľské pamäte, glosáre atď. On-line SYSTRAN prekladač, ktorý pracuje s 15 jazykovými kódmi je k dispozícii na http://www.systranet.com/translate/. Užívateľovi sú v pracovnom prostredí demonštrované dve okná, jedno pre východiskový text (označený ako Sourse), do ktorého sa vkladá originál
a druhé pre cieľový text (označený ako Targe), kde prekladač ponúka jeho preklad. Medzi pracovnými jazykmi slovenčina nie je.

Na margo problematiky strojových prekladačov je potrebné spomenúť, že v súčasnej dobe Európska únia financuje vývoj nového prekladateľského systému EuroMatrix. Na projekte nového prekladača participuje ako EÚ, tak aj univerzity (napr. UK v Prahe) a inštitúcie (napr. česká prekladateľská agentúra CEET). EuroMatrix bude k dispozícii nielen orgánom EÚ, ale aj širokej verejnosti (internetovým užívateľom) už onedlho. Jeho použitie má byť bezplatné. Jazyková kapacita prekladača – 23 úradných jazykov EÚ, čiže 529 rôznych jazykových mutácií. Na rozdiel napríklad od konkurenčného prekladateľského systému
Google bude EuroMatrix založený nielen na štatistickom modeli, lingvistickej analýze textov z jazykových korpusov, ale dôraz sa bude klásť aj na špecifiká toho-ktorého jazyka. Táto hybridnosť má garantovať čo najvyššiu kvalitu počítačom ponúknutej verzie prekladu.

zdroj: Jazyk a kultúra číslo 6/2011