建立翻译语料库初探

CCJK 原创文章,转载请注明出处,并加注本文链接

有一定翻译经验的译者可能都遇到过这样的问题:某个单词和短语在特定的句子中有特殊的用法和含义,但又不知道准确的翻译,似曾相识。盖因以前遇到过这个词/短语的翻译,但又忘记了,无从想起。

英语单词虽说有数十万之从,但据笔者估计,作为一名翻译,经常用到的词汇,应该在 2000 个单词以下。而 CCJK Technologies 从事本地化翻译 10 余年,公司团队翻译过的句子词条,少说也有 1000 万条以上。大多数词语,可以说是翻来覆去,各种用法都曾见过。团队成员犹如铁打的营盘,流水的兵,一拨又一拨。如果我们将一些常用词的用法分门别类加以整理,形成语料库,则能缩短学习周期,遇到疑问时,也可以搜寻数据库,快速解决问题。

笔者从翻译的角度,就需要建立的语料库介绍如下:

一.简繁体词汇比较。比较简繁体两种语言,最大的不同就在词汇方面的差别。由于繁体比简体更加复杂,对于大陆译员来说,掌握了两种语言在词汇方面的差别,学习繁体就成功了一半。

因此,我们需要建立一个非常详实的简繁体词汇比较语料库。参考结构如下:

英文 简体中文 繁体(台湾) 繁体(香港)
Blog 博客 部落格 網誌
digital 数字 数码 數位 數碼
Hardware 硬件 硬體 硬件
Bush 布什 布殊

如果我们的团队成员在工作过程中认真总结,将用词不同(包括人名)之处收集起来,经过集体审订,然后加以汇总,天长日久,相信就可以形成一个非常强大的“简繁体词汇比较库”。

二.繁体表达。若只懂得两种语言在词汇上的差别,还算不上地道的繁体翻译。译员需要体会在表达上的细微差别。

比如:“click here” 繁体中一般不用“按一下這裡”,而更习惯用“按一下此處”。笔者可通过 Google 自行查证。

对某个单词,台湾人不喜欢翻译成一个字,如 page,不会翻译成页,而趋向于翻译成“頁面”。

台湾较重文采,不太喜欢用量词“个”(几年前一个台湾客户提及,有待考证)。

三.繁简易错字辨析。本来,无论是做繁体翻译还是简体翻译,是不允许出现错别字的。对于港台人士来说,深谙繁体后,学习简体不会存在很大的障碍。而对于大陆人士而言,由于存在一个简体字对应多个繁体字的情况,译员往往搞不清该用哪个繁体字。特别是对于初学者,经常在译文中留下大量繁体错别字、简体字。因此,有必要建立一個“繁简易错字辨析库”,收集经常出现的一些繁体错别字。

English 錯譯 正譯 註釋
Wednesday 周三 週三
Note 注解 註解
Repeat 重復 重複
About 關于 關於

四.精准表达。翻译工作中,我们常常会觉得一些句子处理不是很好,不像是本地人所讲的那样,即不地道,留有翻译的痕迹。从惯用词汇,短语,再到句型,可能都有这方面的现象。

例如,词汇:

This function only works in the Hands-Free Profile.

原译:此功能只可在免提下使用。

此功能只可在免提模式下使用。

Do you want to add the information anyway?

原译:您不管如何都要添加信息吗?

改译:您仍然要添加信息嗎?

短语:

Please turn off your phone when using medical equipment for private purposes if possible.

原译:如有可能,使用私人醫療裝置時,請關閉手機。

改译:使用私人醫療裝置時,請儘量關閉手機。

句式:

The product is designed to…

The ** function allows you to…

To exit without saving the copy, press ** button

Available

when ** is selected for ** (When Continuous is selected for the “Pet portrait scene mode)

Double click on the XX icon in the… to…

为了便于收集案例,特统称“精准表达”,避免分类过多、过细,导致冗长复杂,让各位译者无所适从。

特别注意:公司文风中整理了大量词汇、短语和句子的翻译技法,译员应定期阅读文风,了解相关词汇的常见表达。

五.易错字辨析。英文单词中有一些开近词,稍一不留神就会看走眼,导致很严重的错误。在翻译工作中,可留心把这类词摘录下来,整理成“易错字辨析库”,平时大家多多阅读,加深记忆,从而在遇到这类词时,形成条件反射,引起特别注意,避免翻错。

例:

英文 中文 英文 中文 英文 中文 英文 中文
statue 塑像 statute 法令 stature 身长 status 地位
Shanxi 山西/陕西
Export 出口 Import 进口

六.介词用法。英语中,用法最灵活的应属介词莫属。理解与表达是否到位,与介词的处理有很大的干系。因此,建议译者在平时用心查找和收集一些介词的用法,整理成文,便利以后的工作。

在将要建立的语料库中,拟专门开辟一个“介词用法库”,用于收集介词的用法。

七.词的特殊用法。有的英文单词,在不同行业,其中文翻译完全不同,如果机械套用常规用法,则是大错特错。因此建议设立一个“词的特殊用法”数据库,加强译者对一些特殊用词的认识,避免翻译错误。

如 Position,在金融外汇领域,很多情况下是指拥有或借用的资金数量,不为翻译为“位置”,而是“头寸”。以前银行里用于日常支付的“袁大头”,十个袁大头摞起来刚好是一寸,因此叫“头寸”。

八.不同体裁的文件翻译技巧。文件内容体裁不同,句式和体裁不尽相同,牵涉的知识面更广更深。这不是一个数据库就能囊括的,市场上有针对不同体裁的专门翻译论著,如法律翻译、科技翻译、金融翻译等等。翻译本身就是个“杂家”,需要掌握不同领域的翻译技法。在此提及,旨在提请读者在平时学习中,有针对性地了解和掌握不同体裁文件的翻译。

九.不同格式的文件翻译注意事项。同上述第八点,不同格式的文件的翻译有许多特殊的要求,不适宜以一个表格或数据库来总结,但可以建立专门的论文来总结在翻译上的不同之处。可在以后的博客中逐一加以总结、归类。