4/21/2018 10:31:00 AM
翻譯自動化行業(yè)的現(xiàn)狀及以后發(fā)展趨勢
2017年12月13日,翻譯自動化用戶協(xié)會(Translation Automation User Society,簡稱TAUS)發(fā)布了一份題為《Nuncest Tempus:Redesign Your Translation Business,Now!》的最新翻譯行業(yè)報告,分析了大數(shù)據(jù)和全球化背景下,翻譯行業(yè)今后的發(fā)展趨勢和前景。該報告分為“找準(zhǔn)時機(jī)”、“翻譯行業(yè)六大驅(qū)動力”、“現(xiàn)代翻譯管道”和“翻譯行業(yè)掌門人經(jīng)驗”四個章節(jié)。樂文翻譯通讀報告后,為大家提煉出值得關(guān)注的翻譯行業(yè)的現(xiàn)狀和發(fā)展趨勢供大家參閱:
S-曲線
第一章中,報告提出了一個叫做S曲線的概念,指出一種科技的發(fā)展,都會經(jīng)歷公司內(nèi)部研發(fā),該公司內(nèi)部所有,再演變成一種服務(wù)和工具,最終集成到更新的技術(shù)平臺中的小功能的過程。
那么應(yīng)用到翻譯領(lǐng)域呢?
80年代,一些公司隨著自身的向外拓張,出現(xiàn)翻譯需求,在公司內(nèi)部成立翻譯部門;90年代翻譯行業(yè)出現(xiàn)外包服務(wù)商,承接翻譯服務(wù);2000年早期Trados,memoQ等的翻譯記憶庫工具誕生,幫助譯者提高翻譯質(zhì)量和效率;2000年后期垂直領(lǐng)域工具和統(tǒng)計機(jī)器翻譯(SMT)逐漸興起;現(xiàn)如今,神經(jīng)機(jī)器翻譯(NMT)的大火。很顯然,就我們經(jīng)常使用的谷歌、百度和有道翻譯等機(jī)器翻譯軟件來看,翻譯產(chǎn)業(yè)已經(jīng)到達(dá)了S曲線的頂峰。

翻譯行業(yè)已從勞動密集型轉(zhuǎn)向數(shù)據(jù)驅(qū)動型
以往的翻譯行業(yè)是勞動力驅(qū)動的行業(yè),以低報價獲得客戶訂單,翻譯質(zhì)量偏低。在大數(shù)據(jù)時代,一些高質(zhì)量的語言資產(chǎn)得以保留下來復(fù)用,并導(dǎo)入翻譯機(jī)器中進(jìn)行訓(xùn)練,出現(xiàn)了機(jī)器翻譯比人工翻譯質(zhì)量更好的例子。漸漸地,人們發(fā)現(xiàn)數(shù)據(jù)的重要性,在某些通用場景下,機(jī)器翻譯做的反而比人工翻譯好,并且成本更低,于是業(yè)內(nèi)開啟了一場爭奪數(shù)據(jù)的戰(zhàn)爭。誰能獲取優(yōu)質(zhì)的數(shù)據(jù)資源,就能提供更好的翻譯服務(wù)。
語音翻譯和語音控制
TAUS預(yù)測,2020年,全球半數(shù)的智能手機(jī)用戶都將使用語音科技。常常勾搭Siri的同學(xué)對此應(yīng)該不陌生。隨著語音技術(shù)正在飛速發(fā)展,語音識別、音頻轉(zhuǎn)文字等技術(shù)的出現(xiàn),大大方便了我們的生活,也拓寬了語音翻譯的使用場景。
現(xiàn)代翻譯管道
TAUS報告中提出了現(xiàn)代翻譯管道,Modern Translation Pipeline(MTP)的概念,是一種圍繞機(jī)器翻譯架構(gòu)起來的系統(tǒng),架構(gòu)如下:

(1)管道的三大特點(diǎn)
管道的運(yùn)行是由數(shù)據(jù)驅(qū)動;
具有自發(fā)性、自驅(qū)動力,自動化程度高;
對多數(shù)人來說翻譯是無形的一種服務(wù)。
(2)管道分層
管道分為兩層架構(gòu):
第一層是大公司或超強(qiáng)技術(shù)公司,他們負(fù)責(zé)研發(fā)和維護(hù)支持翻譯產(chǎn)業(yè)的技術(shù)架構(gòu),如谷歌研發(fā)出神經(jīng)翻譯網(wǎng)絡(luò);而第二層是其他技術(shù)公司,他們利用上一層的標(biāo)準(zhǔn)架構(gòu),開發(fā)專門的增值業(yè)務(wù),如開發(fā)接入神經(jīng)機(jī)器翻譯的接口。
(3)管道要素:
管道的架構(gòu)搭好后,里面的要素主要有四個:
量子跳盒子:代表最佳的翻譯技術(shù):機(jī)器翻譯(MT),翻譯記憶庫(TM),眾包和社區(qū)翻譯。
算法管理盒子:隨著機(jī)器學(xué)習(xí)的進(jìn)步,一些翻譯系統(tǒng)可以自動選擇譯者和審校,分析文本、質(zhì)量控制,實(shí)現(xiàn)一個系統(tǒng)就能達(dá)到一個翻譯公司的效果。
數(shù)據(jù)化盒子:
內(nèi)容數(shù)據(jù):指TM,原文、譯文等的語言數(shù)據(jù),是定制MT引擎的關(guān)鍵。
元數(shù)據(jù):指語言對、流程、產(chǎn)業(yè)和個人信息等元數(shù)據(jù),是訓(xùn)練機(jī)器學(xué)習(xí)和算法管理的關(guān)鍵。
儀表盤。所有盒子都在這一管道中后,需要一個儀表盤來追蹤數(shù)據(jù),從翻譯完之后的數(shù)據(jù)中獲取更多洞見。
今后翻譯行業(yè)的工作趨勢
工程師:幫助搭建管道。
數(shù)據(jù)分析師:分析儀表盤反映出的數(shù)據(jù),獲取更多洞見。
語言人士開始從譯者的角色,轉(zhuǎn)變?yōu)閺氖聦徯!?chuàng)譯和譯后編輯工作。