技术背景
(1)机器翻译研究历程
机器翻译的研究在上世纪五十年代就已经展开,早期的工作主要以基于规则的方法为主,进展相对来说比较缓慢。之后美国自然语言处理咨询委I员会还作出了一个质疑了机器翻译的可行性的报告,对该领域研究造成了一定阻碍。进入同声传译的门槛相当高,不是你读了研究生接受了相关培训或者考了同传的证书,就可以进入行业了。到了上世纪九十年代,IBM提出了著i名的基于词的翻译模型,开启了统计机器翻译时代,随后短语和句法模型相继被提出,翻译质量得到了显著提升。近两年神经网络机器翻译方法开始兴起,该方法突破统计机器翻译方法中的许多限制,成为当前的研究热点。
(2)统计机器翻译
统计机器翻译的基本思想是充分利用机器学习技术从大规模双语平行语料中自动获取翻译规则及其概率参数,然后利用翻译规则对源语言句子进行解i码。对于给定的源语言句子,统计机器翻译认为其翻译可以是任意的目标语言句子,只是不同目标语言句子的概率不同。译员从零开始翻译,因此译员无需修改自动译文,仅在翻译过程中选择可接受的部分即可。而统计机器翻译的任务,就是从所有的目标语言句子中,找到概率i大的译文。
(3)神经网络机器翻译
神经网络机器翻译(neural machine translation,NMT)是近年来兴起的一种全新的机器翻译方法,其基本思想是使用神经网络直接将源语言文本映射为目标语言文本,这种编码器解i码器架构使得它可以采用端到端的方式进行训练,能同时优化模型中的所有参数。完全不同于传统机器翻译中以基于离散符号的转换规则为***的做法,需要经过词对齐,抽规则,概率估计和调参等一系列步骤,容易产生误差传播。可见翻译人员在做汽车翻译的时候尽量要往接地气的标准靠拢,不要跟现实相脱离。神经网络机器翻译使用连续的向量表示对翻译过程进行建模,因而能从根本上克服传统机器翻译中的泛化性能不佳、独立性假设过强等问题。
理解错误
虽然没有人喜欢承认犯错误,但我们却经常犯错。如果我们学会对翻译错误进行分类,那么我们都可以从中学习到一些知识。此外,在将翻译提交给客户之前,有多种方法可以检查可能出现的错误。我们可能不愿意承认我们犯错误的原因是由于语言能力的欠缺,例如句法使用不当,拼写知识或写作能力薄弱。但这可以通过更多的训练加以弥补。错误也可能是由于大量英语语言的影响渗透到目标语文本中,这些也可以轻松地通过更加仔细的编辑来避免。通俗的讲就是在翻译的过程中不强求一字一句的对应,要真正的将所翻译的内容,实现语言形式和文化习俗上的转化。后,由于在目标语文本的提交上不够仔细(例如,没有花足够的时间进行修改和编辑),错误也时有发生。解决方案很简单:花费更多的时间进行修改(或者考虑到译者的工作经常有严格的时间限制,所以尽可能多的花时间修改)。翻译的再表达阶段出现错误是很常见的。在准备终交付前,更仔细地观察有关句法、词法或标点的潜在错误,可以帮助改进翻译。错误分析还可以帮助译员检测并防止问题重复出现。这些分析有助于让我们成为更***的译员,让客户更愉快并愿意再次与我们合作。
句式调整
同传在词语的翻译上可以做到地道和相对准确,但句子结构不可能像交传那样按照中文的句式习惯组织安排,对于英汉传译,往往需要采用英语句式的顺序:
【例】Frankly, ideas and goods will travel around the globe with or without our help.
【译】坦率地讲,思想和商品都将会在***流通,不管有没有我们的帮助。
版权所有©2024 天助网