字幕翻译受Time Code 和视屏屏宽的限制,对每行字幕的字符有特定的要求, 所有源语言需进行拆分,逐句翻译,且每句的长度都有严格的字符限定。而翻译人员所拿到的翻译材料却多种多样,有word文档,PDF,TXT等其他格式,翻译内容的编排也有可能是以句子,段落或表格为单位,如何对这些繁杂的文字word文档中进行快速的拆分和编排,提高前期源语言的编排效率?以下将按不同类型进行讲解: 首先我们需要统一源语言的文件格式,所有文件将在word文档中进行编辑,下面介绍在word文档中原文将出现的类型: 1 段落型:

原稿以下图所示方式呈现:

拆分方法:

  1. 1. 自动换行:
    1. a. 在word中同时按Ctrl + H进行符号替换:在“查找内容”中输入“.”(即英文句号),在“替换为”中输入“ .^p ”.
    2. b. 对于文档中出现的“,替换为“,^p

如图所示:

句号替换后,段落已基本拆分为每行一句,请见效果图:

2 表格型:

a 表格型的文档左上角都会出现此标志:

点击此标志—–全选表格—–word工具栏中的“布局”选项—-“转换为文本”

通过以上步骤就讲表格顺利转换为了纯文本,如遇到部分表格未转换的情况,只需重复上述操作,直到所有表格都转换完毕。

b 转换为文本后,再重复“段落型”的步骤即可。

通过以上步骤就能很快地将段落“句子化”,长句“短句化”。当然这个方法不能100%的正确拆分文档,对待特殊句子还需翻译人员手动进行拆分。