為什麼要用CAT輔助翻譯?為什麼要用翻譯管理系統?以memoQ為例

職業譯員玩轉翻譯技術 發佈 2022-12-09T17:18:49.007684+00:00

文章節選改編自大辭科技官網文章《為什麼要使用CAT進行翻譯?以memoQ為例-大辭科技》對於CAT的定義有很多,但是我個人偏向的是徐彬老師在2007年提出的,CAT工具有狹義和廣義之分:狹義的CAT工具專指為提高翻譯效率、優化翻譯流程而設計的專門計算機輔助翻譯軟體,如翻譯記憶軟體等;

文章節選改編自大辭科技官網文章《為什麼要使用CAT進行翻譯?以memoQ為例-大辭科技》

1. 為什麼要用計算機輔助翻譯工具(Computer Aided Translation,CAT工具)

1.1 計算機輔助翻譯工具(CAT tool)是什麼

對於CAT(英文名Computer-Assisted Translation Tool,縮寫CAT tool)的定義有很多,但是我個人偏向的是徐彬老師在2007年提出的,CAT工具有狹義和廣義之分

  • 狹義的CAT工具專指為提高翻譯效率、優化翻譯流程而設計的專門計算機輔助翻譯軟體,如翻譯記憶軟體等;
  • 廣義的CAT工具包括所有服務翻譯流程的軟硬體工具,如常用文字處理軟體、光學字符識別(OCR)軟體、電子詞典、電子百科全書、搜尋引擎及桌面搜索等。(徐彬,2007)

按照狹義CAT的概念,memoQ是一款CAT工具;它能夠使用翻譯記憶庫、術語庫以及特有的語料庫等功能幫助譯員減少重複翻譯、提高翻譯效率、減少翻譯錯誤

而按照廣義CAT的概念,其實word也可以是一款CAT工具。因為word本身就是一款計算機工具,也是服務翻譯流程的。再比如語音識別,也是廣義的CAT工具。

1.2 計算機輔助翻譯工具(CAT tool)興起的時代剛需

我們淺用兩組數據來說明全球化背景下,語言本地化服務需求的市場及規模

第一組:

  • 除受疫情影響的2020年全球語言服務產值略有下降之外,自2009到2019年全球語言服務產值持續增高,並在2021年經濟重啟的背景下,全球語言服務產值預測將達到516億美元。(來源:Common Sense Advisory,2021)


  • 而國內語言服務行業產值持續呈良好增長態勢,從2015年的282.2億元穩步上升到2021年的554.5億元,漲幅達50.9%。(來源:2022年中國翻譯及語言服務行業發展報告,2022)


綜合以上兩點,為什麼要使用CAT工具呢?

一言以蔽之,就是以當前全球語言服務規模,減少重複勞動、提高翻譯質量已經成為剛需

而一款好用的CAT工具正可以幫助企業和個人實現這些目標


大家試想一下,

  • 若按照傳統的翻譯,以上工作能否完成呢?
  • 如果可實現,需要多久呢?

按照當下的發展要求,傳統的翻譯工作「費時低效」,僅憑人力和簡單的組織是無法高效高質量完成翻譯工作的。

因此,一款能夠

  • 提高翻譯效率
  • 提高翻譯質量
  • 降低翻譯成本

的CAT軟體就成為了企業、語言服務公司和個人的剛需

根據2020年中國語言服務行業發展報告顯示,從語言服務需求方的角度來看,有92.9%的翻譯語言服務需求方受訪者認同翻譯技術的使用能夠提高翻譯質量,86.1%的需求方受訪者認同翻譯技術的使用能夠降低翻譯成本並提高效率。



咦,細心的寶寶們也會發現,這不就是我們項目管理的「鐵三角」嘛!沒錯!



1.3 「計算機輔助翻譯(CAT)」和「機器翻譯(MT)」的區別

經常有小夥伴問我,CAT=MT嗎?當然不是呀!

——其實通過英文也不難發現,CAT可不是MT,CAT=Computer-Assisted Translation=計算機輔助的人工翻譯,所以,CAT的主體是人,是人在做翻譯

而MT呢?如圖5所示,MT=Machine Translation=機器翻譯,計算機在做翻譯,是計算機把一種語言翻譯成另一種語言。所以,MT的主體是machine,是計算機


因而,倘若使用MT+CAT,也即「機器翻譯+人工編輯」的方式,就可以大大提高效率

根據2022年語言服務行業發展報告,91%的語言服務企業認為採用「機器翻譯+譯後編輯」模式提高了效率,其中有25%的受訪者認為「極大提高了效率」;有66%的受訪者認為「提高了一些效率」。



如果你看到這裡,你或許已經發現,CAT可以幫到你。

那麼,它具體是如何幫助你實現質量和效率的雙提高呢?

今天我以memoQ為例,簡單解釋一下這個問題

2. 以memoQ為例,了解CAT的基本技術

推薦你購買這本書:《計算機輔助翻譯概率》,是華樹老師編的,很詳細地跟大家講解了CAT的各個技術。

2.1 CAT如何幫助提高翻譯效率

在提高翻譯翻譯效率方面,CAT具有:

  • 2.1.1翻譯記憶技術;
  • 匹配率;
  • 語詞檢索(一致性檢索);
  • 解析器(簡化翻譯格式);
  • 語料對齊;
  • 預翻譯、X-翻譯等譯前處理操作;
  • 複製原文至譯文等快速編輯操作;

在這裡我挑幾個重點介紹

2.1.1 翻譯記憶技術

翻譯記憶的技術原理非常簡單:

用戶利用已有的原文和譯文,建立起一個或多個翻譯記憶庫(Translation Memory,TM),在翻譯過程中,系統將自動搜索翻譯記憶庫中相同或相似的翻譯資源(如句子、段落),給出參考譯文,使用戶避免無謂的重複勞動,只需專注於新內容的翻譯。

譯記憶技術是翻譯技術的核心,有助於保持翻譯的一致性,提高譯員的本地化效率,同時提高翻譯質量。


使用翻譯記憶有什麼好處?

  • 加快翻譯速度
    如圖8所示,TM根據翻譯過的句段為當前相同的譯文提供參考建議,以充分利用已有的語言資產。


  • 降低翻譯成本
    若源文檔中有許多重複性文檔,如:網站、遊戲、合同、產品手冊等,可以根據記憶庫計算重複率,要求供應商降低計費或者設置加權計費,如圖9所示。



  • 提高翻譯質量
    翻譯記憶庫也可以提高翻譯質量:通過存儲正確的表達和句子,防止出現譯文不一致的現象,尤其是在進行多人協作翻譯一篇文檔或一個項目時,非常有用,如圖10


2.1.2 語詞檢索

語詞檢索也叫相關搜索( Concordance )。

前面我們講了,翻譯的過程中你可以在記憶庫中看到之前翻譯過的參考譯文,但是前提是,必須達到一定的匹配率。

那,如果沒有達到該匹配率怎麼辦呢?如果匹配率太低,怎麼辦呢?比如,翻譯結果區呈現的記憶庫結果默認只會顯示60%以上匹配的內容,所以如果匹配率在60%以下,怎麼辦呢?

——這時,就要用到語詞檢索功能了:你可以在記憶庫中搜索某個特定的詞彙、詞組、短語及其所在的句段

比如下圖中,當前句段(第5句段)沒有任何記憶庫參考。


但是實際上,你曾經翻譯過類似的內容,所以如果你想在記憶庫中查一下,某個詞,比如①"this"在記憶庫中是如何翻譯的,就可以使用②"語詞檢索(Concordance)"功能,這樣你就可以知道:③"哦!原來之前是這樣翻譯的!"如圖17所示。


然後如果你需要,你就可以使用④"插入"按鈕,插入需要使用的譯文啦~

這樣是不是也可以加速你的翻譯呀,從此再也不用擔心找不到哪個詞啦!

2.1.3 解析器(簡化翻譯格式)

判斷一款CAT工具好還是不好,並不僅僅是靠記憶庫和術語庫,還有一個很重要的技術,就是解析器技術。也就是說:這個CAT能解析多少種文檔?解析到什麼程度?——這是經常被忽略的一點。

那,什麼是解析器?

不論你的原文是什麼,CAT工具都會用自己的解析器,將你各種各樣的原文格式,解析為XLIFF格式,從而直接處理.html、.xml、.rtf、.docx、.json、.srt等文件

所以,你會發現,如圖18所示,你的原文雖然是word文檔,但是導入到memoQ中,會自動幫你解析出原文,所以你看到的是左邊是原文,右邊是譯文。


你的原文雖然是xml文檔,但是memoQ依然幫你解析出需要翻譯的那部分,你仍然只需要看左邊解析器解析出來的原文,在右邊的譯文區翻譯即可,不需要考慮代碼和格式。


memoQ的強大在於,只要你的文檔是可編輯的,它都能幫你解析!

在memoQ中,不同文檔在導入時會使用不同的解析器,默認情況下,文檔在導入時會按照默認的後綴名的解析器進行解析,如.html用html過濾器。


而且,memoQ的更強大在於,你還可以針對文檔需求,自定義你的解析內容。

也就是說,你可以自定義:哪些要翻譯,哪些不翻譯

比如,如圖21所示,假設原文檔是excel表格,你可以自定義哪些工作表要導入,哪些文本框的內容要導入,甚至是否導入索引,是否導入注釋等等。

當然,不懂也沒關係,你只要知道:memoQ會將你的幾乎所有格式的原文都解析為適用於CAT工具的XLIFF格式


解析器的作用

相信經過上面的介紹你已經能夠看出來,擁有一個強大的解析器對於實際應用中翻譯的幫助是非常大的,因為它可以:

  • 保護源文檔格式,如:標題、標記、表格、文本等。
    ——這樣你在翻譯的過程中,只需要在翻譯編輯器區域編輯即可,不需要考慮到標題、標記、表格、文本等格式。


  • 保護原始碼,如:xml文檔、json文檔、html文檔等。
    ——這樣你仍然只需要在翻譯編輯器區域編輯即可,不需要考慮到原始碼,也不用編輯原始碼。

如果你正在選一款CAT,一定要考慮是否能解析你現有、及將來的源文檔!

2.2 CAT如何幫助提高翻譯質量

在提高翻譯翻譯質量方面,CAT具有:

  • 術語庫技術;
  • 質量保證(QA);
  • 實時預覽;
  • 格式與標籤處理等譯中的編輯操作;

我們依然來挑重點講~

2.2.1 術語庫技術

什麼是術語庫呢?

術語庫(term base,簡稱TB)指的是包含與特定主題相關的某個單詞或特定表達的資料庫。

——你可以把它理解為專業名詞、專業術語的庫

術語庫中的術語往往是雙語的,甚至是多語的。


那麼使用術語庫有什麼好處?

  • 保證術語一致
    如圖28所示,準確的術語庫能夠保持核心信息的一致性。如果企業/組織內有多人協作翻譯,或多項目協作,一致性是必不可少的!


  • 提高翻譯質量
    如圖29所示,通過管理術語和定義禁用術語,你可以確保:不需要的單詞或表達不會為翻譯人員所使用


  • 提高檢索效率
    如果你之前花大量時間查詢術語,那麼你只需要查一次!
    如果團隊中已經有一個人確認了術語,那麼其他人不需要重複查詢啦!是不是可以提高檢索效率呀~

當然,術語庫還有很多其他的細節,我以後會慢慢分享,今天你只需要知道:
術語庫是CAT的基本技術,幫助提高翻譯質量。就好!

2.2.2 實時預覽

實時預覽即所見即所得,指在翻譯的過程中實時預覽最終的譯文。


當然,memoQ不僅支持內部預覽,還支持外部預覽

  • 比如翻譯indesign等文檔時,需要預覽外部pdf文檔,就可以使用外置的pdf預覽工具。這裡放個memoQ介紹的相關連結,就不展開講啦~《所見即所得:memoQ獨立預覽》
  • 再比如,翻譯srt字幕文件時,需要預覽最終的視頻文件,就可以使用外置的視頻預覽工具

2.3 CAT如何幫助降低翻譯成本

CAT可以通過字數統計和加權字數統計,來降低翻譯成本

詳細的字數統計結果包括:

  • 多少重複的句段?
  • 多少已鎖定的句段?
  • 多少已預翻譯的句段?
  • 各個匹配區間之間分別有多少句段?

你譯前和譯後都可以進行字數統計~


這樣,加上加權統計的話,你就可以降低翻譯成本。

比如如果你設置好加權值,如圖36所示。(加權也就是打幾折嘛~)

你在統計時,就可以進行加權統計,直接計算出打折後的字數啦,就像圖37~!

勞動人民賺錢不易啊嗚~

3.總結

總結一下CAT的作用和基本技術:

提高翻譯翻譯效率方面,CAT具有:

  • 翻譯記憶技術,基本格式是TMX格式,實現重複的內容不做二次翻譯;
  • 匹配率,包括完全匹配、模糊匹配和上下文匹配;
  • 語詞檢索(一致性檢索),輕鬆查找記憶庫中某個詞;
  • 解析器,簡化翻譯格式,將所有源文檔解析為XLIFF格式;
  • 語料對齊,,復用已有語料。

提高翻譯翻譯質量方面,CAT具有:

  • 術語庫技術,基本格式是TBX格式,實現術語一致;
  • 質量保證(QA),檢查低級錯誤。
  • 實時預覽,實現所見即所得。

在降低翻譯成本方面,CAT可以進行:

  • 字數統計,得出詳細統計報告,讓錢花的值,賺的明確。
  • 加權字數統計,進行字數打折~

當然,以上都是基本技術。

如果大家想要詳細了解這些技術,可以點擊這篇文章閱讀歐~《為什麼要使用CAT進行翻譯?以memoQ為例》

關鍵字: