术语翻译方法
(1)基于双语括号句子的术语翻译挖掘方法
站在改善***终机器翻译译文质量的角度,我们认为术语翻译知识的质量优
先于规模。因此,我们将目光转向互联网上单语网页上大量存在的双语括号的句子。所谓双语括号句子需要同时满足下列三个条件:包含一个或多个括号;紧临括号的左边是一个术语;该术语的译文在括号内。双语括号句子包含丰富的术语翻译知识,如目标语言术语的上下文信息。相对于平行语料或可比语料而言,双语括号句子的限制更少,更新比较及时且相对更容易抽取术语翻译知识。因此我们认为双语括号句子是挖掘术语翻译知识的理想语料。如以下示例所示,挖掘术语翻译知识的主要任务是确定目标术语的左边界,因为右边界已经由括号给出,且源语言术语的边界是确定的。
各个进程有自己的内存空间、数据栈等,所以只能使用进程间通讯(interprocess communication,IPC),而不能直接共享信息。
该方法的输入为种子 URL 和种子术语词典,***终输出为带概率的术语翻译规则表,类似于统计翻译的短语翻译规则表。在工作流中,中间结果包括主题爬虫获取的Web网页和URL,双语括号句子过滤器筛选出的双语括号句子,术语左边界分类器的术语翻译候选列表,以及增量更新后的种子术语词典。
(2)融合双语术语识别的联合词对齐方法
词对齐是统计机器翻译的一项***任务,它从双语平行语料中发掘互为翻译的语言片断,是翻译知识的主要来源。在实践中,一部分词对齐错误就是术语产生的,***终的译文质量也会受到影响。如果能自动识别出平行句对中的术语对应关系,词对齐质量就能得到改善,进而有望改善术语和句子的翻译质量。
术语识别方面,基于规则的方法已基本退出历史舞台。基于统计方法的方法虽然不受领域限制,但是对于多词术语和低频术语的识别并不理想, 因而抽取的术语也存在较多噪声。所以,如果直接将术语识别结果作为词对齐的约束,术语识别错误就会传递给后续阶段,***终译文质量反而难以得到提升。因此,研究如何提高术语识别和词对齐性能,并提高***终的机器翻译译文质量是迫切需要解决的一个难题。
为了尽量降低训练流程中错误传递的影响以改进术语翻译知识抽取,我们提出了融合双语术语识别的联合词对齐方法。首先,为了降低对训练数据的依赖,该联合词对齐方法从单语术语识别弱分类器开始。该分类器由维基百科等自然标注数据训练得到的。其次,为了降低因术语识别和词对齐的错误传递带来的负i面影响,该方法利用双语术语和词对齐的相互约束,将单语术语识别、双语术语对齐和词对齐联合在一起执行,***后得到效果更好的双语术语识别和词对齐结果。
(3)融合术语识别边界信息的统计翻译术语解i码方法
人名、地名、机构名等命名实体有明显的边界特征,相对容易进行识别与对齐。一般而言,将命名实体直接翻译方法用于统计翻译解i码器就可以取得比较好的翻译效果。但是,用与翻译命名实体的方式“直接翻译” 术语并不能明显改善机器翻译自动译文的质量。***的原因就是目前的术语识别模型还不够好,识别准确率大幅弱于命名实体识别。另外,由于术语本身是与领域高度相关的,为目标领域训练***的术语识别分类器需要大量高质量且同领域的人工标注训练语料,这进一步加大了术语识别的难度。在这种情况下,如果直接将术语识别结果作为词对齐的约束,术语识别错误就会传递给后续阶段,***终译文质量反而难以得到提升。因此,研究如何提高术语识别和词对齐性能,并提高***终的机器翻译译文质量是迫切需要解决的一个难题。
为了尽量降低训练流程中错误传递的影响以改进术语翻译知识抽取,我们提出了融合双语术语识别的联合词对齐方法。首先,为了降低对训练数据的依赖,该联合词对齐方法从单语术语识别弱分类器开始。该分类器由维基百科等自然标注数据训练得到的。其次,为了降低因术语识别和词对齐的错误传递带来的负i面影响,该方法利用双语术语和词对齐的相互约束,将单语术语识别、双语术语对齐和词对齐联合在一起执行,***后得到效果更好的双语术语识别和词对齐结果。
玄奘提出 “求真、喻俗”
当许多国家还没有自己的文字的时候,我国的翻译事业就产生了。据有关史***载,秦朝的语言中已有了外来语,说明当时已有翻译活动了。但比较一致的看法,认为我国的翻译业始于东汉桓帝建和二年,即公元一四八年。东汉至北宋时期是以佛经翻译为主的时期,历时约一千四百年。后汉时安息国人安世高,将梵文《安般守意经》等九十五部佛经译成汉文。
从隋到唐,是我国翻译事业发达的一个阶段。隋代的释彦琮,梵文造诣深,并总结出一些翻译理论来指导实践。释彦琮以后,出现了一个翻译巨i星玄奘。玄奘于唐太宗贞观二年去印度求经,十七年后回国,带回佛经六百五十七部,译出七十五部一千三百三十五卷;并将老子著作的一部分译成梵文,成为***个把汉文著作向国外介绍的中国人。玄奘在翻译理论方面也有所贡献,他提出的“既须求真,又须喻俗”的翻译标准,今天仍有一定的指导意义。
北宋时的乾德开宝年间,宋太祖派人西去求经,印度也派名僧来传法。宋太宗还在开封的太平兴国寺内兴修了译经院,从事佛经翻译,但盛况已不如唐初的极盛时期,到南宋,则渐渐地走向衰落。
明朝至五四运动时期,我国翻译事业进入一个新的转折性阶段。翻译的内容主要是西欧各国的科学、哲学、文学等著作。徐光启和意大利人利玛窦合作,翻译了欧几里得的《几何原本》《测量法义》等,对我国自然科学的发展产生了促进作用。严复所译作品多系西方政治经济学说,如赫胥黎的《天演论》、亚当·斯密的《原富》、孟德斯鸠的《法意》、斯宾塞尔的《群学肄言》等。严氏选材严谨,态度认真,提出的翻译标准“信、达、雅”,对我国翻译事业作出了贡献。林琴南采取与他人合作的方式,译了一百六十多部文学作品,著i名的译作有《巴黎茶花女遗事》《黑奴吁天录》《迦因小传》等。
在跨文化翻译中,译者能否准确地认知、构建文化语境,通常取决于译者是否具备强烈的文化语境意识,取决于译者对不同的文化知识和行为习惯的认知,以及对情感、行为等方面的适应性。
习i***总i***在《“一带一路”国际合作高峰论坛圆桌峰会上的闭幕辞》中讲到:“民心相通应该成为‘一带一路’建设国际合作的重要组成部分。”民心相通离不开文化交流,文化的深入交流更是无法脱离语境而孤立开展。“文化就是交流,交流就是文化。”(爱德华·霍尔语)文化语境对语言的理解是***的,对翻译有着重要的影响。彼得·纽马克认为:“语境在所有翻译中都是***的因素,其重要性要大于任何法规、任何理论、任何基本词义。”要充分理解并准确翻译信号、代码和意义,就无法脱离文化语境。一旦脱离了文化语境,“文化上的细微差异可能就会影响人们理解和翻译文章的方式”。在跨文化翻译中,译者能否准确地认知、构建文化语境,通常取决于译者是否具备强烈的文化语境意识,取决于译者对不同的文化知识和行为习惯的认知,以及对情感、行为等方面的适应性。
版权所有©2024 天助网