机器翻译

2024-05-28

机器翻译(精选十篇)

机器翻译 篇1

关键词:机器翻译,谷歌翻译,译后编辑

一、机器翻译概述

机器翻译是指将翻译过程的部分或全部使用机器实现自动化(Austermühl, 2006)。一般认为机器翻译的思想起源于1949年写作的韦弗备忘录,而后机器翻译的发展经历了重大的起伏。时至今日,机器翻译的研究和产品如雨后春笋般不断涌现出来,机器翻译已然成为一个具有重大社会意义、政治意义、商业价值、科学价值和哲学意义的重要课题。

机器翻译系统可以依据不同的标准分为不同的种类。根据机器翻译系统的使用环境可以分为三类:低端机器翻译系统、用户定制的高端机器翻译系统和基于因特网的机器翻译系统。低端机器翻译系统的目标客户是个人,用户定制的高端机器翻译系统的目标客户是公司,基于因特网的机器翻译系统则是一种通过因特网使用的。根据机器翻译系统使用的技术可以分为下图所示的五类:基于规则的机器翻译系统、基于语料库的机器翻译系统、多引擎机器翻译系统、在线机器翻译系统和口语机器翻译系统(Feng, 2004)。

一般而言,由于自然语言中诸如歧义、复杂句法、成语和照应关系之类问题,机器翻译的输出结果并不能令用户满意。于是一些人认为机器翻译系统对于译员而言毫无用处。我认为这是一种误解。翻译的过程一般可以分为两个阶段:第一阶段是翻译出译稿,第二阶段是修改译稿以求译文可以达到要求。在多数情况下使用机器翻译的目的仅仅是将第一阶段自动化,即翻译出译稿。然后由译员修改译稿,最终产出达到要求的译文。由此可见,机器翻译在将文本翻译成译稿的过程中大有用处。

在使用机器翻译将文本翻译成译稿的过程中,我们还可以使用多种方法提高机器翻译输出结果的质量。提高机器翻译系统翻译质量的策略如下表所示(Austermühl, 2006)。

这些提高机器翻译质量的策略不是互相排斥的,而是可以同时使用。更新词典是指为机器翻译系统添加词条。译前编辑应用于翻译之前的文本。受控语言是指控制输入机器翻译系统的语言的复杂程度。交互模式是指翻译中机器翻译系统一边输出译稿,译员一边实时地做出修改。译后编辑应用于译后文本。上表所列的提高机器翻译质量的策略中使用最多的是译后编辑。

二、译例

现在中国广受用户欢迎的机器翻译系统有谷歌翻译、金山快译和Systran。在此我们将使用如下一段文字演示谷歌翻译工具的使用方法和使用译后编辑的策略修改谷歌翻译输出的译稿:

Ubuntu is a community developed operating system that is perfect for laptops, desktops and servers.Whether you use it at home, at school or at work Ubuntu contains all the applications you’ll ever need, from word processing and email applications, toweb server software and programming tools.

谷歌翻译非常容易使用。我们首先在浏览器中打开谷歌翻译的网址http://translate.google.com/,将上面的一段文字输入或复制粘贴到源语文本框中,调整翻译方向,即将英语设为源语,将汉语设为目的语,点击“翻译”按钮,谷歌翻译输出的译稿便出现了:

Ubuntu的是一个社会发展的作业系统是完美的笔记本电脑、台式电脑和服务器。您是否使用它在家里,在学校或工作Ubuntu的包含所有申请您最需要的,从文字处理和电子邮件应用程序,Web服务器软件和编程工具。

接下来我们可以开始通过比较源语文本和译稿编辑谷歌翻译的输出,这是使用译后编辑策略的译员需要做的工作中的主要部分。

第一句的翻译有两个主要的问题,即“community developed”和“perfect for”的翻译。此处谷歌翻译的翻译引擎将“community developed”翻译为“社会发展的”;正确的翻译应该是“(开源)社区开发的”。据此我们可以将第一句的前半部分编辑为“乌班图(Ubuntu)是社区开发的操作系统”。而后半句中的“perfect for”在此具体语境中的意义应该是“非常适合”,而不是“完美的”。据此我们可以将后半句编辑为“适合运行于笔记本、台式机和服务器”。

第二句的翻译也有两处主要的问题,即“whether”和“applications”的翻译。在此具体语境中“whether”的意思不是“是否”,而是“无论”;“applications”的意思不是“申请”,而是“应用程序”。因此我们可以将第二句的前半句编辑为“无论在家庭、学校还是工作环境使用,乌班图(Ubuntu)都提供了您所需的各种应用程序”。接着我们可以看到第二句的后半句并不需要大幅地修改,只需稍为润色,成为“从文字处理软件、电子邮件程序到服务器软件、编程工具”。

经过编辑的译文如下:

乌班图(Ubuntu)是开源社区开发的操作系统,适合运行于笔记本、台式机和服务器。无论在家庭、学校还是工作环境使用,乌班图(Ubuntu)都提供了您所需的各种应用程序,从文字处理软件、电子邮件程序到服务器软件、编程工具。

比较谷歌翻译的输出与修改后的译文,我们可以看到要想达到专业的翻译水准,机器翻译的输出可能需要较大幅度的修改。但是我们也应该看到机器翻译的长处是翻译某一特定领域的文本和翻译受控语言。

参考文献

[1]Austermühl, F.Electronic Tools for Translators.Beijing:Foreign Language Teaching and Research Press, 2006.

[2]Ubuntu.The Ubuntu Promise.Retrieved Aug.23, 2010, from http://www.ubuntu.com/

机器翻译 篇2

手-机:【131-1089-3071】

精诚翻译公司全网最低5元百字起(市场价格10元,比传统翻译机构低40%左右,互联网+时代,省去中间的环节,价格低于翻译行业任何家翻译机构,5年经验保证,首推先翻译后付费模式,无效免单,免费试译,免费修改,为很多的大型外企和国企翻译过许多专业文件!五周年庆,五折优惠中,可以通过以上方式咨询!

美国州名的来源或地名研究(Toponymy)属于历史语言学范畴。历史语言学家对地名的来源作了相当的研究。美国内务部曾汇集了一批能干的语言学家,成立了专门机构,其任务是对美国的地名来源进行研究,给以准确的解释。

在美国的地名中,一半以上始源于印第安语。其余的始源于欧洲,如纪念皇帝皇后,或某一特殊地区,还有是为纪念历史重要人物及记载历史活动的。

由于语言和文化是休戚相关的,人们通过研究地名的始源,可以了解关于这个国家的背景。历史活动,甚至价值观。

笔者从不同的资料汇集了美国洲名的来源,供学习研究英语、美国历史与文化的人们参考。

ALABAMA(阿拉巴马):来源于巧克陶印第安语,意思是 “thicket-clearers” 或者 “vegetation-gatherers”,“拓荒者”或者“打草人”。

AlASKA(阿拉斯加):来源于阿留申语,意思是“great land”或“that which the seas breaks against”,“伟大的土地”或“分割海的地方”。

ARIZONA(亚利桑那):来源于印第安语 “Arimnac”,意思是“hule spring”,“小泉水”。

ARKANSAS(阿肯色):来源于印第安语,意思是“a breeze near the ground”,“靠近地面的微风”。CALIFORNIA(加利福尼亚):来源于法语 “Califerne”,是一部11世纪法国史诗中所想象的地方。

COLORADO(科罗拉多):来源于西班牙语,意思是“ruddy”或“red”,“红色的”。

CONNETICUT(康涅狄格):来源于印第安语,意思是“beside the long tidal river”, “在长长的潮河旁”。

DELAWARE(德拉华):纪念托马斯·魏斯特爵士“Sir Thomas West, Lord De La Warr”,德拉华河和德拉华湾也以此命名。

FRORIDA(佛罗里达):来源于西班牙语,意思是“feast flowers(Easter)”,“花的节日”,即复活节。

GEORGIA(乔治亚):纪念英国的乔治二世皇帝。In honor of George II of England.HAWAII(夏威夷):来源不确定。这个群岛可能是以其发现者夏威夷·罗亚(Hawaii Loa)命名,也可能以传统的波利尼西亚人的家乡Hawaii or Hawaiki命名。

IDAHO(爱达荷):来源于印第安语,意思是:“gem of the mountains”, “山中的宝石”;另一种说法的意思是“Good morning”“早上好”。

ILLINOIS(伊利诺):来源于印第安语加上法语后缀,意思是“tribe of superior men”,“贵人的土地”。

INDIANA(印第安纳):来源于印第安语,意思是:“land of Indians”,“印第安人的土地”。

IOWA(依阿华):来源于印第安语,意思是“the beatiful land”,“这块美丽的地方”,另一种说法是“the sleepy ones”,“爱睡觉的人们”。KANSAS(堪萨斯):来源于苏族印第安语,意思是“people of the south wind”, “南风的人们”。

KENTUCKY(肯塔基):来源于易洛魁印第安语“Ken-tah-ten”,意思是“land of tomorrow”or“the dark or bolldy ground”,“希望的土地”,或“黑色的沃上”。

LOUISIANA(路易斯安那):纪念法国路易十四世皇帝,“In honor of Louis XIV fo France”.MAINE(缅因):纪念英国查理一世皇后海丽塔·玛丽亚,“Henrietta Maria, Queen fo Charles I of England”据说她拥有过法国的缅因省,“Theprovince of Mayne in France” MARYLAND(马里兰):纪念英国查理一世皇后海丽塔·玛丽“In honor of Henrietta Maria, Queen of Charles I of England”.MASSACHUSETTS(麻萨诸塞):来源于印第安语,意思是“great mountain place”,“伟大的山地”。

MICHIGAN(密执安):来源于印第安语,意思是“great lake”or“big water”,“大湖”。

MINNESOTA(明尼苏达):来源于达科他印第安语,意思是“sky-tinted water”,“天色的水域”。

OHIO(俄亥俄):来源于印第安语,意思是“great river”,“大河”。

MISSISSIPPI(密西西比):来源于印第安语,意思是“father of waters”,“水之父”。

MISSOURI(密苏里):来源于印第安语, 意思是“town of the Large canoes”,“大独木舟之乡”。MONTANA(蒙大拿):由J.M.阿西从拉丁词典中选的词,是拉丁化的西班牙语,意思不详。

NEBRASKA(内布拉斯加):来源于澳托印第安语,意思是“flat water”,“平川之水”。

NEVADA(内华达):来源于西班牙语,意思是“snow-capped”,“雪山”。

NEW HAMPSHIRE(新罕布什尔):来源于英国的罕布什尔郡,“Hampshire”。

NEW JERSEY(新泽西):来源于海峡的泽西岛,“the Channel Isle of Jersey”。

NEW MEXICO(新墨西哥):来源于墨西哥,“the country of Mexico”。

NEW YORK(纽约):纪念英国的约克公爵,“In honor of the English Duke of York”。

机器老公+机器老婆=机器婚姻? 篇3

小舟老师:

我和老公结婚2年了,我们自己经营了一个电脑公司。公司很小,却是老公一点一滴做起来的。公司刚起步的时候,为了节约成本,老公不舍得雇人,就想找个能干的媳妇,帮他一起打理公司。

婚后我发现,老公简直是个工作狂,他不仅自己“狂”,还要求我一起跟着他“狂”。我们的蜜月期是在他对我的培训中度过的,他天天不停地给我讲公司的业务和工作内容。我没做过生意,没经验,做起来相当吃力,常常犯错误。我很着急,老公更着急,因为工作的事情,他天天给我上课,我做不好,他就冲我发火。我越来越自卑,硬着头皮努力做,可依旧做不到他心里。

我们天天探讨工作,根本没有情感交流。老公的心思全在公司上,我们之间除了生意经营,没别的话题。

我们的关系越来越紧张,陷入了冷战。我不想要这种“机器婚姻”,当个“机器女人”,甚至想过不跟“机器老公”过了。我每天的生活就是早上按时去公司,晚上下班回家做饭。我感觉自己老了很多,整天跟客户打交道,有时为了一点利益,要斤斤计较,讨价还价,其实我内心特别不愿意为了蝇头小利跟客户讲来讲去,遇到这样的客户,我就放弃了。一到这时,老公就说我没用。

我想过自己出去工作,可一想到这个公司是我们家的支柱,如果我走了,没人帮老公,他更是忙不过来了。我该怎么办呢?

露露

专家点评(李小舟,国家注册二级心理咨询师):

露露,看了你的来信,第一感觉是想问你一个问题:你是找老公,还是找工作?也很想问你老公一个问题:你是找老婆,还是找员工?你们婚姻的主要问题是,角色混乱。生活和事业、家庭和工作、领导和老公、员工和妻子,统统一锅粥啦!

你的婚姻出现目前这种状况是必然的。因为你老公的婚姻观从结婚时就已经定了:他不想雇用别人,想找个能干的媳妇帮他一起打理公司。这种想法意味着,他想让老婆给他打工,不用发工资,用着还放心,因为是自家人,管自家的公司,谈自己的生意,既节约成本又安全。可是,这样操作,表面上看,非常划算,但问题却隐藏其后。

首先,妻子和员工的定义和属性是完全不同的。妻子是老公的老婆,家庭中的女主人,职责当然是以经营家庭为重,是注重情感,偏感性的角色,可以是相夫教子,也可以把家庭布置得温馨,给老公和孩子一个温暖的环境,给疲惫的心情充充电。而员工的职责是做好工作,是偏理性的,甚至是纲性的,如果做不好,不按公司规定,老板可以批评指正,也可以炒鱿鱼。如果把老婆当员工使用,那一定会出现错位和矛盾,也必然会损伤感情。

其次,家庭和事业是两个不同的环境。事业要讲原则讲规定讲理性的。而家不是讲理的地方,是要讲情讲感觉的。妻子是个女人,女人是需要男人体贴和疼爱的,如果没有丈夫的情感输入和喂养,女人很容易枯萎。一支枯萎的花,是没有力量和温度去照顾幼苗的,那么孩子在家里会因为没有爸爸妈妈的爱和感情滋养,也不能健康成长。

你们的痛苦和矛盾来自于错位和遗忘。错位是角色混乱,遗忘是你们以婚姻为桥梁,搭着“婚姻列车”,走发展“事业之路”。这也不是不可以,错误在于你们“过河拆桥”,走在事业的路上,把“婚姻”给忘了,不去关注它,不去滋养它。被你们利用的“婚姻”因为没有得到“爱的满足”自然要提抗议,出问题。

机器翻译研究述评 篇4

机器翻译是利用计算机把一种自然语言转换成另一种自然语言的过程。早在上世纪30年代初, 法国科学家CtB.Artsouni就提出了利用机器来进行语言翻译的想法。1946年电子计算机问世之后, 美国工程师W.Weaver在1949年发表了一份以《翻译》为题的备忘录, 正式提出了机器翻译这一设想[1]。1954年美国乔治敦大学在IBM公司的协同下, 进行了俄英机器翻译实验, 这是世界上第一次机器翻译试验。随后, 前苏联、英国、日本、中国等国, 也相继进行了机器翻译试验。

机器翻译发展至今, 已出现了多种基于不同原理的机器翻译系统。总体可以将机器翻译系统从方法上大致分为四类:基于规则的机器翻译、基于实例的机器翻译、基于统计的机器翻译和混合式机器翻译。不同的机器翻译系统各有所长。例如, 基于规则的机器翻译系统擅长于翻译符合规则的句子, 翻译的质量较高;基于统计的机器翻译系统具有通用性, 自动从语料库中学习语言知识。

2 机器翻译的研究成果

2.1 基于规则的机器翻译

基于规则的机器翻译方法是机器翻译领域最初提出的研究方法, 该方法认为翻译的过程是需要对源语言进行分析并对源语言意义进行表示、然后再生成等价的目标语言的过程, 该方法从70年代中期开始到80年代末在机器翻译界一直占有主导地位。

基于规则的机器翻译系统从体系结构上可以分为:直接翻译系统、转换翻译系统和基于中间语言的翻译系统。直接翻译系统是根据源语言与目标语言间的词汇单元的对应关系进行翻译, 因此这种系统带有针对性过强的弊病。转换翻译系统中, 源语言的分析独立于目标语言, 其分析一般只在句法平面上进行。转换时需要一部双语对应词典, 用目标语言单元替换源语言单元时考虑上下文。与直接翻译系统不同, 转换翻译系统的建造需要进行双语对比, 构造复杂的映射规则。基于中间语的翻译系统中源语言与目标语言不直接接触。把源语言的文本用人工设计的无歧义的中间语来表示, 再把中间语言所表达的意义用目标语言的词汇和句法结构表示出来。中间语言系统不需要转换规则, 因为中间语表达式对源语言和目标语言都是一样的。但中间语言的设计非常困难, 即使设计出来其管理也很困难[2]。

基于规则的机器翻译中的规则是语言学家编写的, 因此需要消耗大量的人力物力用于规则的开发, 研究周期长, 实验的代价比较大。虽然研究者们已经建立了含有成千上万个规则的规则库, 然而这种方法仍然具有局限性。在处理大规模真实语料的时候, 效果依然很不理想。

2.2 基于实例的机器翻译

基于实例的机器翻译的基本思想是日本著名翻译专家长尾真 (Makoto Nagao) [3]在1984年提出的。基于实例的机器翻译的基本原理是不通过深层的分析, 仅仅利用已有的经验知识, 通过类比进行翻译。随着语料库语言学的兴起, 越来越多的人对基于实例的机器翻译进行了研究[4,5]。句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容。针对句子的相似度, 田生伟等[6]对维吾尔语句子的相似度进行了研究, 并得出结论:采用词形特征的粗选算法、基于散列单词倒排索引能够有效提高算法的查找速度, 快速从语料库中筛选出候选句子集合;多策略精选算法中采用基于维吾尔语词频的单词区分度算法、连续单词序列抽取算法, 可以有效衡量两个维吾尔语句子的相似程度, 能够有效地从候选句子集合中找出与输入句子最相似的句子。

2.3 基于统计的机器翻译

基于统计的机器翻译方法是20世纪90年代兴起的一种方法, 也是当前机器翻译的主要方法。这种方法自动从语料库中学习语言知识, 再利用这些知识对语言进行翻译。它不需要人工编写规则并且对所有语言都适用, 但其翻译质量依赖于语料库的大小。目前可以将统计机器翻译模型分为基于词、短语和句法的三种模型。

2.3.1 基于词的机器翻译模型

词对齐是统计机器翻译中的重要技术之一。肖桐等[7]提出了一种重对齐方法, 这种方法在IBM models获得的正反双向词对齐的基础上, 确定出正反双向对齐不一致的部分。之后, 对双向词对齐不一致的部分进行重新对齐以得到更好的对称化的词对齐结果。实验结果表明, 相比在统计机器翻译中广泛使用的基于启发信息的词对齐对称化方法, 这种重对齐方法可以使统计机器翻译系统得到更高的翻译准确率。徐春[8]等通过对各种汉维翻译模型的研究发现, 在汉维翻译中, 词对齐问题, 主语、谓语中心词和时态的一致性问题是制约其翻译性能的主要因素。董兴华[9]等对汉维统计机器翻译中的形态学处理问题进行了研究, 研究结果表明:对汉语句法结构的调整及以词干、词缀等更小的词素形式参与训练可以有效提高翻译质量。

2.3.2 基于短语的机器翻译模型

基于词的翻译模型在实用中遭遇到了词对齐噪声的影响且没有考虑句子的结构及上下文信息, 在两种语言的语序相差比较大时翻译效果不好。为了解决上述问题, 基于短语的机器翻译模型被提出[10]。Och[11]提出将对齐短语泛化为基于词类的对齐模板, 并采用线性对数模型作为整体框架。

调序模型是统计机器翻译研究的一个重点。侯宏旭等[12]通过对汉蒙机器翻译中调序模型的研究, 为基于短语的汉蒙机器翻译提出了一种基于词语语序变化分布特点的调序模型, 该模型比较简单, 模型参数很少, 但效果好于传统的模型, 比较适合于汉语和蒙古语这类语序差别较大的语言之间的翻译, 更重要的是能够有效地提高汉蒙机器翻译的性能。为解决基于短语统计机器翻译存在的调序能力不足的问题, 一些研究者尝试利用句法分析器对基于短语统计机器翻译的输入汉语句子进行句法分析, 然后利用转换器进行调序操作, 并对部分类型短语进行预先翻译, 然后再利用基于短语统计机器翻译的解码器进行翻译。

如果基于短语的统计机器翻译模型不将非连续短语的情况考虑在内, 会造成翻译结果在目标语言中的意义变化或缺失。针对这一问题, 孙越恒等[13]以非连续介词短语为例, 提出了一种短语模板抽取算法。该算法采用基于规则的方法, 抽取出中文非连续介词短语模板, 借助双语对齐语料和介词方位词翻译表, 获得模板对应的英文翻译, 最终形成的双语模板被加入短语翻译表中, 使译文更加符合语法规范。为克服传统的短语抽取方法对词对齐信息的依赖性强, 抗噪声能力差这一缺陷, 梁华参[14]提出基于词汇相似度约束的短语抽取策略。王斯日古楞[15]等在对汉语和蒙古语中的量词翻译进行研究的基础上, 提出了使用量词表进行翻译, 总结出了一对一、多对一、一对零和一对多等汉语量词到蒙语量词翻译的对应关系, 给出了各种对应中的翻译方法。这种方法能有效解决翻译中出现的量词错误, 尤其是对临时量词和一对空的量词翻译非常有效。

基于短语的机器翻译中, 传统的估计方法只考虑了双语短语同时出现, 满足对齐一致性的情况, 而没有对其他情况进行统计, 因而短语翻译概率的估计不够准确。因此一些研究者修改了传统的短语概率计算公式, 在估计概率的过程中充分地考虑短语的各种出现情况, 提高了翻译效率。

2.3.3 基于句法的机器翻译模型

基于句法的统计机器翻译模型几乎与基于单词的统计翻译模型同一时间被提出, 但是, 在2000年之后, 基于句法的统计机器翻译研究才逐渐得到人们的关注和认可。

引入句法结构有助于解决基于短语的统计机器翻译本身存在一些固有缺陷, 如短语层次上的全局重排序, 短语非连续性和泛化能力等问题。并且, 有些基于句法的统计机器翻译系统在性能上已经明显超过了基于短语的系统, 如2005年NIST机器翻译评测中的Chiang的Hiero系统, 2006年NIST机器翻译评测中的ISI的系统和中科院计算所的系统。徐春[8]等在对各种汉维翻译模型的研究中发现, 汉语和维吾尔语的句法结构差异对翻译性能也存在着影响。王斯日古楞[16]在对汉蒙统计机器翻译的研究中发现, 对于语序差异较大的汉语和蒙古语, 基于蒙古语语序的汉语句子调序方法对于系统性能的提高相当有效。

2.4 混合式机器翻译模型

近几年来, 针对各种翻译模型存在的缺陷, 研究者开始转向混合式机器翻译。宿建军等[17]根据维吾尔语形态变化丰富的特殊性, 搭建了一个基于Factored的维汉机器翻译系统, 将Factored系统和基于层次短语的Joshua翻译系统以及Moses中基于句法的翻译模型进行系统融合, 构建了混淆网络, 提高了翻译效率。杨宪泽等[18]对混合方法的模块实现以及相关的算法进行了讨论, 之后又对这种混合算法进行了改进[19]。晋耀红等[20]针对专利文本中的复杂现象, 提出了一种基于混合策略的方法, 融合语义分析技术和基于规则的翻译系统, 提高了专利翻译的效果。

3 机器翻译研究展望

机器翻译还不成熟, 需要人与系统的配合。并且, 机器翻译还存在一些问题。一方面, 存在词法、结构及语义歧义, 相同的一句话, 由于断句方式不同, 可能存在不同的语义。另一方面, 有些新的词汇无法解释。

目前, 更多的人还是热衷于统计机器翻译, 尤其是基于短语的统计翻译。近几年来, 人们开始关注混合式机器翻译。由于基于词的机器翻译、基于短语的机器翻译和基于句法的机器翻译各自存在不同的缺陷, 将各种翻译模型融合在一起, 有望解决已有翻译系统存在的不足。因此, 混合式机器翻译将成为今后机器翻译的热点。

摘要:文章讨论了机器翻译研究的历程, 总结了机器翻译的研究成果, 将机器翻译分为了基于规则的机器翻译、基于实例的机器翻译、基于统计的机器翻译和混合式机器翻译四类。并根据这四个研究方向对机器翻译研究成果进行了述评。最后指出目前机器翻译研究存在的不足, 并预测混合式机器翻译将成为机器翻译研究的热点。

机器翻译 篇5

目前随着中国与世界交流的日益频繁,随着中国国际地位的提高,现在不管是哪里的国际会议,都离不开中文,都少不了翻译和同声传译,特别是同声传译在国内和国际的市场都是巨大的。但翻译、同声传译人才属于全球稀缺人才,也是最难培养的人才之一。

全球专业的同声传译人员总共也就2000多人,中国同声传译人才更是紧缺,据不完全统计,我国专业的同声传译人才30人左右,至于国际上流行的在经贸、科技、政法等各个领域学有所长的专业型同声传译人才仍是一片空白。据相关数据统计中国口译人才需求量为百万人,高端的口译人才缺口也为上千人。而且,同声传译人才的薪资也是不菲的。一般同声传译人员的工资多以小时来计算,每个译员每天的工作量不会超过8小时。它也有低档、中档、高档之分,与之对应的薪水可以划分为一天6000元、7000元、8000元不等。因此同声传译的市场前景越来越被看好了。

翻译专业的就业前景非常好

两种机器翻译的对比及测评 篇6

【关键词】机器翻译 被动语态 翻译对比

【中图分类号】G64【文献标识码】A 【文章编号】2095-3089(2016)10-0123-02

一、被动语态和机器翻译

在被动句或被动短语中,主语是动作的承受者而非执行者,且语句的重点是动作。被动语态在英语中使用率极高,英语被动语态有多种结构,最常见的结构为:主语+be动词+动词过去分词。然而,被动语态在中文里使用率并没有如此高,且其语法结构也和英语中的有所不同。

本文将使用谷歌翻译和商英翻译进行被动语态的英汉翻译对比。谷歌翻译是当今最流行的机器翻译软件之一。谷歌翻译属于统计机器翻译,它的运行包括了两种不同的、单独进行的过程——瞄准和解译,其翻译主要依靠分析大量人为翻译的文本。

商英翻译创建于1968年,是最老的机器翻译公司之一。其运行属于基于规则系统,主要基于不同的语法规则进行翻译。2006年,该公司开发了混合翻译引擎,将基于规则系统和统计机器翻译相结合,统计机器翻译的功能主要是后期编辑。

二、对比方法

为了更全面的说明机器翻译在翻译被动语态时出现的问题,笔者将测试内容分成四类,这四类包含了英语被动语态中的主要语法结构:

1.含有动作执行者的被动句(通常由介词“by”引导)

2.不含动作执行者的被动句

3.get+过去分词

4.非人称被动语态

根据以上四类被动句,笔者创建了本次对比的测试集,测试集中的部分被动句是笔者自己创作的,其余则是通过语法书或网上搜集的,每个种类分别含有三测试句。翻译结果分为三个层次——准确、可理解和错误。准确意味着翻译的意思和语法都正确;可理解意味着翻译的意思可接受,但可能存在一些语法问题或者表达方式不够地道;而错误则说明翻译的结果完全不能令人理解、语句完全不符合正确的语法构成。

测试集和翻译结果如下:

三、对比结果分析

由对比结果表可见,虽然谷歌翻译和商英翻译所输入的测试句是一样的,他们输出的翻译内容却有很大差异。第一组测试为1到3句,均为含有动作执行者的被动句。从结果中可看出,谷歌翻译无法识别1句的被动语态,其翻译为颠倒了动作执行者和承受者的中文主动语态,使得输出句毫无逻辑。根据Hearne and Way的理论可得出推论,谷歌翻译的程序中拥有所输入单词的正确翻译模型,但它无法正确地分析输入句的语法结构,也没有此类英文被动句足够的翻译模型。谷歌翻译识别出了2句和3句的被动语态并正确翻译了2句,但在翻译3句时,却没有译出“written”一词,导致最后的输出句子在意义和语法结构上都不完整。因此,谷歌翻译在第一组测试中1句和3句的评分档次为“错误”,2句的评分为“正确”。商英翻译在此组测试中的表现则明显略胜一筹。它用正确的语法转换了输入句中的被动语态、译出了准确的意思。商英翻译在本组测试中的精确度可能要归功于其大量的、正确的语法规则和其成熟的筛选技术。但是,在3句的翻译中还是出现了一个语法错误。在翻译副词“usually”(通常)时,它将副词的位置按照原句的英文习惯放在了动词“写”的前面,但中文里正确的表达方式应该放在介词“由”的前面。由此可见,商英翻译所运用的混合引擎中的统计机器翻译没有起到很好的后期编辑作用。商英翻译在1句和2句的测试中的评分为“准确”,3句的评分为“可理解”。

第二组为不含执行者的被动句,包括4、5、6三句,其测试结果与第一组相比大有不同。谷歌翻译在第二组测试中可识别出所有输入句的被动语态,并用正确的中文语法表达出准确的意思。 值得一提的是,它在翻译第二组句子时将原句的被动语态全部译为中文的主动语态,这是中文的惯用表达方式。谷歌翻译在第二组测试中的表现说明此类被动语态的语言模型已经比较成熟了,其评分均为“准确”。商英英语虽识别出的了本组的被动语态但将其翻译成了中文被动语态,而此类被动语态一般不会在中文里用被动句表达,不符合习惯用语。因此,商英英语在本组的得分均为“可理解”。

第三组的被动语态结构为“get+过去分词”,两个机器翻译在本组的表现都可圈可点。谷歌翻译识别出了7、8、9句中“get+过去分词”的被动语态形式并将其正确地翻译成中文主动语态,再一次证明了谷歌翻译对于此类被动语态语言模型的成熟,并说明其刷选最佳表达方式的能力。因此,谷歌翻译在第三组测试的评分均为“准确”。商英翻译在第三组的测试中虽然识别出了“get+过去分词”的被动语态并将其译成了中文主动语态,但是在最后输出语言时形成的却不是惯用的表达方式,比如7句和8句的翻译“谁是否受到了伤害”和“请赶紧并且换衣服”,虽然这两句在理解意思上没有问题,但却不是最准确和地道的表达方式,说明商英在后期的文字编辑上任然有所欠缺。所以,商英翻译在本组测试的得分均为“可理解”。

最后一组的测试句为非人称被动语态句,其语法结构是:it+is+过去分词+that…,在英文中运用较广泛。中文中虽没有相对应的语法结构,但也有意思相同的表达方式,比如“据说”、“据报道”等等。谷歌翻译成功识别出了10-12三个测试句的被动语态,并用“据推测”、“据认为”等进行了正确的翻译。所以,此组的评分均为“正确”。商英翻译在本组的表现则逊色不少,虽然它用“据说”正确翻译出了10句的被动语态,但把“男人”译成了“人”,把“长寿”译成了“长期活”,这两个词语的翻译都不准确;另外,它没有识别出11句的被动语态,而在12句的翻译中,将被动语态直接逐字的翻译成“被相信”放在句首,也是不符合中文语法规则的。由此可见, 商英翻译在本组测试时所使用的语言转换器和语法规则都是错误的,其在本组的评分都为“错误”。

四、结论

由测试结果可得出结论,谷歌翻译的结果好坏主要取决于其翻译模型是否成熟,对于含有动作执行者的被动句的翻译模型还不够成熟,但其他测试的被动句类型都可被识别并正确翻译成中文惯用表达方式;商英翻译的结果则取决于其语言规则是否完善、后期语言编辑是否正确,商英翻译针对第一组到第三组被动语态的语法规则都较充足,都可正确识别出,但其无法识别第四组“非人称被动语态”、语法规则不够完善。另外,商英翻译在四组测试中都出现了选词不当、排序错误和表达方式不够地道等后期编辑问题,说明其后期编辑水平还有待提高。

参考文献:

[1]Hearne, M. Way, A. (2011) ‘Statistical Machine Translation: A Guide for Linguists and Translators. Language and Linguistics Compass.

[2]Arnold, D.(2003) Why translation is difficult for computers. In Somers, H.(ed.).Computers and Translations : A translators guide. Amsterdam/ Philadelphia: John Benjamins Publishing.

机器翻译探讨与研究 篇7

机器翻译(MT)是计算机科学与人工智能领域中的一个重要方向,是利用计算机把一种自然语言转换成另一种自然语言的过程[1]。在机器翻译的研究过程中,不仅涉及到人类对语言认知方式的研究,还涉及到对计算机科学、数学、信息论、知识工程、语言学等多门学科进展的关注及其知识在机器翻译中的应用[2]。机器翻译的核心是语言分析技术,即一种将句子变换成由词语及其抽象形式构成的、并用某种数据结构表示成内部形式的技术。

1 机器翻译面临问题分析

1.1 MT的机械性

计算机系统是硬件子系统与软件子系统的组合体,其运行过程由预先设定好的程序指令来控制。在翻译的过程当中,计算机系统并没有像人类大脑那样灵活的思维能力,也不具备自主的判断和推理能力。翻译的方法是进行直接的词汇转换-语法转换-语义转换,最后得到目标语言的过程。而人工翻译的过程比较复杂,译者需根据自己的知识、文化、地理、历史、风俗习惯等进行词汇重组,同时又掺杂着对语句的雕琢修饰以及丰富感情色彩的渗透和作用。资料显示,机器翻译在一些简单的翻译任务中收到了一定的效果,比如网页浏览,而要达到任意文本的高质量全自动翻译,目前还很难实现。

1.2 复杂的自然语言

自然语言是人类特有的用于交流的方式和手段,是人类区别于其他动物的重要标志。世界上大部分民族都有其独特的民族语言,理解语言不仅依赖语言学方面的知识,还需要与话题相关的背景知识。必须对这两种知识进行较好的应用和组合,才能建立起高效、智能的自然语言理解程序。作为自然语言理解技术的重要应用,机器翻译旨在使用计算机自动将源语言表示的语句转变为目标语言表示的语句。

自然语言的形式与其意义之间通常呈现为一种多对多的对应关系。因而从计算机处理的角度看,就必须消除歧义,即将具有潜在歧义的自然语言通过输入计算机而转换成某种不具歧义的计算机内部表示形式。

歧义(Ambiguity),即同一语言形式可能具有不同的意义,这是自然语言中普遍存在的现象,也是自然语言与人工语言的主要区别之一[3]。歧义现象的广泛存在使得消除歧义就需要运用大量的知识和推理,这就给基于语言学的方法、基于知识的方法带来了巨大的困难,因而虽然几十年来,以这些方法为主流的自然语言处理研究在理论和方法方面取得了一定的成就,但在能处理大规模真实文本的自然语言处理系统的研制方面,成果却并不显著。因此,消除歧义业已成为机器翻译中需要重点解决的主要问题之一。

1.3 机器自身的局限性

为了完成一项任务,计算机必须受到指挥与控制。即使最复杂的计算机,都必须接受指令才能工作。计算机与人类不同的地方是,人们可能因灵感、直觉而自发地找到一个问题的答案,并不需要进行很多详细的计算过程,但是计算机却只能按照已输入的程序机械地运行。因此在机器翻译的过程中,就难免会出现漏译、错译或直译等情况,其翻译结果将完全反映不出自然语言的魅力所在。

2 机器翻译方法

自然语言的机器翻译一般以句子为基本的翻译单位,而句子又可分为句、短语和词三个层次。自然语言分析阶段一般包括分词法分析、句法分析、语义分析、语境分析、语用分析等几部分,其中以词法分析和句法分析为主。下面,首先阐释了目前现有的几种机器翻译方法,然后则重点分析基于实例的机器翻译。

2.1 基于分析和转换的机器翻译方法

基于分析和转换的机器翻译方法就是自动实现源语言到目标语言的转换,通过采取一系列的分析和转换的生成层次,使得一个源语言句子经过不同的中间表达形式,最终达到目标语言句子。其目的是最大限度地加深对源语言的理解,生成最为恰当的目标语言形式。这种方法比较全面地体现了语言学知识在机器翻译中的应用,是了解机器翻译实现过程的非常合适的模式。对于标准的机器翻译系统而言,句子和短语层次的结构转换是翻译转换部分的研究重点。这方面一般采用产生式的转换规则形式[4]:

S是SL(源语言)的某个待翻译单位(句子、短语等等),S1~Si是S中的下一级组成单位,对于S,如果满足条件,则TL(目标语言)中有T1~Tj译文构成了相应的等价物T。

这种方法有两个特点:一是面向源语言分析,因为源语言中的句子已经由句法、语义分析等阶段分析完毕,生成了关于源语言句子的某种中间表示,转换就以这种源语言的中间表示作为输入;二是直接转换,T1~Tj可以直接包括目标语言的词汇,也可以是对应于S1~Si的译文组块。

2.2 基于中间语言的翻译方法

基于中间语言的翻译方法是利用一种中间语言(interlingua)作为翻译中介的表示形式,整个翻译的过程分为“分析”和“生成”两个阶段。分析阶段的任务是把源语言转化为中间语言,然后在生成阶段再将中间语言转化为目标语言。分析过程只与源语言有关,与目标语言无关,而生成过程却与之相反,只与目标语言有关,而与源语言无关。这种方法的优点在于,进行多语种翻译时,只需要对每种语言各自开发一个分析模块和一个生成模块,而不需要在每两种语言之间都开发一个转换模块。

对于多语种的机器翻译来说,使用中间语言作为翻译的中介是可取的。在理想状态下,中间语言应该没有或极少有歧义,且结构严谨,词汇单义,便于计算机处理。

2.3 统计机器翻译方法

统计机器翻译也就是基于语料库的机器翻译方法,不需要人工撰写规则,而是从语料库中获取翻译知识。具体来说,就是将某个原始句子按词拆开,然后全部单词存储;翻译就是将词语取出,按概率统计的方法重组句子,组合后的句子就是统计方法的翻译结果。

统计机器翻译方法的翻译机制需要建立统计模型,把翻译理解为搜索问题,即从所有可能的译文中搜索、选择概率最大的翻译结果作为译文。该方法与基于实例的翻译方法的区别在于,基于实例的机器翻译中,语言知识表现为实例本身;而统计机器翻译中,翻译知识则表现为模型参数。

2.4 基于实例的机器翻译方法

在基于实例的机器翻译系统中,系统的主要知识源是双语对照的翻译实例库,每输入一个源语言句子时,系统把这个句子同实例库中的源语言句子逐字段进行比较,找出与输入句最为相似的句子,并模拟与这个句子相对应的译文,最后输出译文。

基于实例的机器翻译系统中,翻译知识以实例和义类词典的形式来表示,易于增加或删除,系统的维护简单易行。如果利用了较大规模的翻译实例库并进行精确的对比,还有可能产生高质量译文,而且避过了基于规则的传统机器翻译方法必须进行深层语言学分析的难点,在翻译策略上是具有相当吸引力的。这种机器翻译方法直接使用语料库对齐来作为知识表示形式,虽然知识库的扩充非常简单,但是因而造成系统需要的实用语料库的规模将会极大。

3 机器翻译实例分析

目前,许多翻译引擎所采用的翻译方式如图1所示。这种模型机制是将语言学专家已经制定的翻译规则和词典的译文输入、存储在翻译系统之后,按照系统预制的运转规则对原文进行相应处理,并输出翻译结果给用户。

目前比较流行的在线翻译系统有Google、有道、爱词霸等。下面通过几个例子来比较、分析Google在线翻译系统和有道在线翻译系统的异同和优劣。

例1:

原文:喜马拉雅山之所以被称为世界屋脊,是因为它的最高部分(主脊带)的平均海拔在6 000米以上,群峰争艳。地球上大部分7 000米以上的高峰都云集于此。

(1)Google译文:Himalayas is known as the roof ofthe world,because it is the highest part of the(main ridge of the band),the average elevation of 6,000 meters above the peaks of blooming.Most of the Earth to the peak 7,000 meters above the set here.

(2)有道译文:The Himalayas are called the roof ofthe world,because of its highest part(the Lord with an average elevation of the ridge)in the 6000 meters and above,the mountain peaks bloom.Most of the earth is7000 meters above the peak to set in the this.

分析:由以上两个系统的译文可以看出,对于一些专有名词,如“世界屋脊”,现有机器翻译系统都能进行很好的翻译,对于每一个句子也基本能够达到翻译的要求。但是从整体来看,句子缺乏必要的润色以及句与句之间的贯通,这种翻译方法产生的结果是直译,而非意译。

例2:

原文:语言学起来很费事。

(1)Google译文:Linguistics it is very cumbersome.

(2)有道译文:Linguistics up very trouble.

分析:原文的意思是“学习一种语言是很麻烦的一件事”,然而这两种系统都把“语言学”当作了一个整体来处理,这就导致两个系统的译文都是在说“语言学”怎么样,而不是“语言”怎么样,因而两种系统的译文都与原文的意思大相径庭。有道译文甚至单独将“起来”与前文割裂译为up,最终的译文无法理解。

例3:

原文:It was Edison who invented electric bulb.

(1)Google译文:这是爱迪生发明的电灯泡谁。

(2)有道译文:是爱迪生什么人发明了电灯泡。

分析:原文的意思是“爱迪生发明了电灯”,但是两种翻译系统都没有做到翻译正确,原因就在于这两种系统都不能正确理解who在本句中的作用,Google将其直译为“谁”,有道系统把who理解为“什么人”,导致译文语句不通顺。

例4:

原文:I wonder whether he is a Satan.

(1)Google译文:我不知道他是。

(2)有道译文:我想知道他是一个撒旦。

分析:正确的译文应该是“我不知道他是不是一个恶魔”。Satan是《圣经》中堕落的魔王。在这句话中,不能将其简单地翻译成名词,而是一个代称,代指所有的敌对者。机器翻译不能很好地结合词语的文化内涵,在翻译过程中遗失大量的文化信息,以至于进行了直译,显然不能达到语言所希望表达的真实效果。

4 MT问题与展望

由于自然语言的复杂性,语言之间存在着程度不同的歧义,使得机器翻译的译文很难取得满意的效果,现对机器翻译中出现的主要问题做如下小结:

(1)词语直译。多义性是中西方语言普遍存在的问题。不同的词语在不同的语境中会派生出多种引申义,从而导致了一词多义。机器不能理解具体的上下文语境,从而不能做到一词多译。

(2)结构分歧。短语也是构成句子的主要成分,短语中又包括着名词、介词等成分,不同的分解方法会得到不同的语义。由于机器无法更深入地对自然语言进行分析理解,因而造成翻译上的结构歧义,这种歧义也是普遍存在的问题。

(3)语句直译,缺乏逻辑。词语的异义和结构的歧义制约了句子质量的提高。

(4)机器难以把译文与人物的身份、习惯、个性及特定的环境、场合相结合,也很难具备将上下文联系起来进行理解和翻译的能力。

(5)机器翻译存在文化缺陷,如信仰、习俗等纯精神方面的内容,离开了相关文化,对应的词汇就失去了意义。

面对MT现存的一些问题,笔者拟从以下几个方面入手,浅谈MT在今后发展的任务:

(1)机器翻译是一门边缘学科,以语言学、数学和计算机为基础学科。其中的语言学又是人文科学与自然科学的桥梁,因此上,要注重研究语言的共同规律,汇集语言使用的知识,不能只注重计算机科学方面的研究,更要重视计算机科学与语言学的有机结合。

(2)强化词义分析,做好词义消歧。词义消歧属于自然语言理解的底层研究,在许多高层次的研究和应用上,词义消歧都是其重要步骤或关键环节。

(3)注重多种翻译方法的融合。如前所述,单一的基于分析和转换的机器翻译方法或者基于中间语言的翻译方法都很难得到高质量的译文。既然单一的方法无法实现,就可以采取多策略的翻译方法,即采取多种翻译方法的优势于一体来构建翻译系统,以期得到高质量的译文。

5 结束语

经过了几十年的发展,机器翻译取得了较大的进展,各种翻译系统也相继出现,很大程度上节约了人力和物力。但是由于自然语言的多样性和多变性,机器翻译仍然面临着很多难题,如:一词多义、结构分歧、知识获取问题以及语言的文化背景和社会背景等,完全意义上的高质量的全自动翻译还远远没有达到。所以在研究中,应该重新定位机器翻译的实现目标,不应该将其作为一门独立的系统,而是起着辅助人工翻译的作用,在某些领域寻求生机和进展。目前,人类对语言的认识是无尽的,对机器翻译的研究也是没有止境的,因而,机器翻译始终具有挑战性。现在完全有理由相信,机器翻译技术一定会越来越成熟,翻译质量也必定会越来越好。

参考文献

[1]邵艳秋.机器翻译相关术语简介[J].术语标准化与信息技术,2010(1):1-2.

[2]张政.机器翻译刍议[J].中国科技翻译,2004,17(1):1.

[3]张政.机器翻译难点所在[J].外语研究,2005(5):1-3.

机器翻译 篇8

20世纪以来, 我国的翻译研究进入了以结构主义思想为指导的阶段。这是将我们的关注点从主体移向客体的一个阶段。结构主义给人们带来分析的方法, 使人们通过对客体的分析, 认识其内部的层次与结构从而更好地把握认识的对象 (吕俊, 2004) 。

典型的机器翻译系统通常表现在两个方面:第一, 传统机器翻译将词作为基本翻译单位, 机器先将源语言句子分解成词, 再将词转换成目标语言的词, 然后根据目标语言语法结构特征将词连接起来;第二, 传统的机器翻译对语境没有给予充分的考虑 (何莲珍, 2007) 。基于以上问题Teubert提出了translation unit概念, 李文中把这一提法称为“翻译单位”。

2 翻译单位的概念

Teubert将翻译单位定义为“包含节点词和其搭配的清晰的表述”, 并认为翻译实践中译者群体构成了一个特殊的语用话语社团, 一切翻译活动和行为都在这一特定的话语内进行 (李文中, 2010) 。

翻译单位应是一个可以在平行语料库中对应的意义单位, 而翻译单位概念的确立也为翻译, 特别是术语翻译提供了依据。而在此基础上李文中进而提出了对应单位, 并认为对应单位是平行文本中意义对应完整, 并具有清晰边界的任何片段或序列 (李文中, 2010) 。

3 现代机器翻译

3.1. 概念及发展

机器翻译 (machine translation) 又称自动化翻译。其概念虽提出较早, 但在上世纪60年代由于美国科学院对机器翻译采取否定态度, 使机器翻译研究转入低潮。70年代初, 由于现实的需要及技术的进步, 又重新兴旺。

3.2. 机器翻译的局限性

由于迄今为止还没有一种可靠的消歧方法, 因而在传统理论指导下的机器翻译中就会出现种种翻译失误 (何莲珍, 2007) 。现以“塞翁失马, 焉知非福”为例, 以下是不同机器翻译的对应文本。

例1.Weng Cypriot missing horse, non-blessing in disguise. (google翻译)

例2.When the old man on the frontier lost his mare, who could have guessed it was a blessing in disguise? (译典通字典)

由以上译本我们可以看出这例句都基本上达到了真正的形式对等, 但翻译出来的意义则与原文出入较大, 且直译使译文丧失了原文的意义, 例如对“塞翁”一词的翻译在google上译为“Weng Cypriot”。Cypriot原为“塞浦路斯”之意, 所以该翻译非常不妥。且“塞翁失马, 焉知非福”是指一件事情具有两面性、有很深的哲理, 而以上翻译作品完全丧失了这句话的深层含义。

但我们也应看到以上这些译本的可取之处, 例如:在对a blessing in disguise的使用上基本表达出了原文的涵义;另外, 也有一些译本采用意义对应形式取得了较好的翻译效果, 例如:

On one hand, loss imply gain;on the other hand, gain imply loss.

Nothing so bad but might be a blessing

以上这些翻译有其优势, 同时也存在不足。但其结合了西方文化特征中原有的表达方式, 因而译文具有较强的可读性。例如, 在以上译文中对imply一词的使用上, 利用语料库对imply进行检索, 其周边多为具有积极色彩的词汇。因此, 在传统理论指导下, 有很多机器翻译译本采用了词与词的对等, 从而导致译文虽在形式上做到对等但在意义上大相径庭。

4“翻译对应单位”的运用

把对应单位概念引入机器翻译中可使译文达到更好的翻译效果。在平行语料库的翻译中所遵循的原则为取大原则, 在此原则的制约下双语语料库首先对比已有数据, 然后找出已存的对应单位, 例如:

打击非法投机活动Strike out at speculation

大碗茶stall tea

安家费settling in allowance (李文中, 2010)

如果仅将以上汉语进行简单意义上的词汇对等, 那么根本不可能翻译出原文所要表达的含义。

5 结语

对应单位的提出是对翻译单位和意义单位的进一步阐释。将对应单位引入平行语料库的建设及机器翻译中, 会对机器翻译起到独特的作用, 而利用网络和语料库技术, 也会使现代机器翻译的准确度有质的提高。

参考文献

[1]何莲珍.基于汉、英语平行语料库的翻译数据库设计[J].现代外语, 2007 (191) .

[2]李文中.平行语料库设计及对应单位识别[J].当代外语研究, 2010 (22) .

机器翻译 篇9

汉英两种语言属于印欧和汉藏两种不同语系, 两种语言的词类相同, 句子的基本成分也很相似, 但是这两种语言还是异多于同, 本文则选取其不同点进行分析, 探讨这种差异给人工翻译与机器翻译带来的影响。

语言是思维的符号, 而思维是无声的语言。“中西两种思维方式的不同决定了两种句子结构上的差异。英语中的语法规则系统反映了思维方式的差异。如英语的定冠词和不定冠词, 名词的单、复数, 动词的第三人称单数等特征导致了汉语在这方面的语法空缺。” ( 张道真, 2002: 108) 人工翻译需要处理好这些不同。然而在机器翻译普遍应用的现在, 其很难做到准确无误的翻译源语言, 尤其在思维转换方面。这很大一方面可以体现出英汉句子差异带来的影响。

二、汉英句子结构的差异分析应用到人工翻译与机器翻译

很多语言学家从翻译者的思维活动来描述翻译的过程, 其中比较有影响的是尤金奈达提出的一种模式, 即: 分析, 转换, 重建。这都是基于译者的思维活动、双语知识、翻译技巧等背景知识进行的活动。所以在对于机器来说, 人工翻译的可操作空间大。“与人工翻译不同, 机器没有思维、推理、判断能力, 缺乏人工译者最起码的综合知识和长期积淀下来的文化知识等, 无法对原文进全面了解, 只能是在限定的范围内进行一对一的选择。因此, 就不可避免地会出现荒唐可笑的译文” ( 张政, 2004: 23) 。

下面笔者将节选一些英汉的句子, 对其进行了百度翻译, 并将其与人工翻译的译本作对比。从汉英句子结构的几个方面进行分析。

( 一) 英汉的形合与意合

美国翻译理论家奈达在其《译意》一书中指出: “就汉语和英语而言, 也许在语言学上最重要的一个区别, 就是形合和意合的对比。”

在形合方面, 英语讲求句子的结构完整和逻辑的合理。连接词连接句子的从属关系, 也就是说英语句子的形态重于神态。而汉语则是相反, 汉语的句子结构和逻辑关系外在形式并不明显, 有些比较模糊, 追求的是意思上的贴合, 并不追求形式上的完整性。例:

1. When Miss Emily died, our whole town went to her funeral.

百度: 当艾米丽小姐去世, 全镇的人都去参加了她的葬礼。

人工: 艾米丽小姐去世了, 全镇的人都去送丧。

英语中的连接词很重要, 而在汉语中这其实都可以省略掉。这就需要在翻译的时候斟酌语句, 英译汉的时候有所保留与取舍的翻译这些形式上的连接词。而汉译英的时候, 为了保留源语言的意义完整, 应该适当增加连接词。这些都是机器翻译无法处理的。所以机器翻译出的文章还是不够准确。

2. 汉语重前饰, 英语重后饰

尽管英汉句子采用的主体结构是主谓宾形式, 但是再修饰语上差别很明显, 那就是汉语的修饰语无论有几个, 都放在了被修饰成分之前, 而英语的修饰语在被修饰成分的前后皆可。例:

( 1) Wild - open grassland, fenced and colorless, with the red rocks and sweet - smilling shrubs scattered about, it was typical of a hard - used land.

百度: 野开阔的草地, 围栏和无色, 用红色岩石和甜美可爱的灌木错落, 这是典型的难利用土地。

人工: 这是一篇开阔的草场, 到处有栅栏、篱笆, 除了遍布各处的红岩和发出芳香气息的灌木外, 色彩想的单调。这是典型的被过度利用的土地。

( 2) 她的名字经常随着自己无法理解的陌生祈祷和赞美冲口而出。百度: Her name is often as he could not understand the strange prayer and praise unthinkingly.

人工: Her name sprang to my lips at moments in strange prayers and praises which I myself did not understand.

不论在英译汉还是汉译英中, 修饰成分的处理影响句子的质量。机器翻译的时候没有注意到修饰成分应该如何处理, 导致翻译的句子过于欧化与僵硬。

三、结束语

以上举出的例子都是笔者在翻译实践过程中亲身体会, 仔细分析, 注意到英汉语言的差异造成的影响。对于目前的机器翻译, 无论是一些在线的百度或者谷歌翻译, 还是像雅信, 传神等推出的机辅翻译软件, 它们在根本上都无法用人类的思维触及两种语言上的差异。所以在这种情况下, 笔者在面对庞大翻译任务时, 三分可以靠机器, 七分靠人工修改, 以保证翻译质量。

综上所述, 为了达到翻译的目的, 使译入语读者能够接受翻译的译稿, 在使用机器翻译时也要考虑到英汉句子结构上的不同, 人工修改和润色时一定要注意差异较大的句子上。在机器翻译中还缺少欠缺这种智能分析能力。机器翻译与人工翻译各有优点, 它们之间能互相借鉴、取长补短。因此机器翻译必须与人工翻译相结合, 才能达到最佳的翻译效果。

参考文献

[1]戴炜栋.新编简明语言学教程[M].上海:上海外语教育出版社, 2010.

[2]李红菱, 王丽.英汉句子结构的差异对翻译的影响[J].辽宁工业大学学报, 2009 (6) :54-56.

[3]洪堡特.K.L.西方语言学名著选读[M].北京:中国人民大学出版社, 1988.

[4]张道真.张道真使用英语语法[M].北京:外语教学与研究出版社, 2002.

机器翻译 篇10

1 机器翻译的主要应用范围以及当前成功应用的两个领域

1.1 机器翻译广泛应用的四个方面

我们不妨以欧委会的机器翻译系统Systran为例, 看一下机器翻译的主要应用范围。欧委会 (European Committee) 设有目前世界上最大的专业翻译组织翻译服务部, 雇有1500名全职译员, 每年翻译的材料达一百万页 (Brace 2000:219) 。西方资深职业翻译家、欧委会翻译服务部负责人Emma Wagner (Chesterman和Wagner, 2002) 认为, 翻译服务部在以下四个方面广泛使用机器翻译:

1) 作为人工翻译的辅助工具。在欧委会, 有的译者, 特别是法西互译的译者, 喜欢将Systran翻译系统作为人工翻译的辅助工具。机器翻译输出的译文, 常常需要译者修改或进行“译后编辑”, 因为机器翻译实际上只是产出了一份“草稿”。据统计, 法西互译的50%使用Systran翻译。2) 作为获取大致信息的粗糙翻译。几乎所有的工作人员都可以使用Systran翻译来获取自己所需要的信息。在一份可行性报告里, 欧委会的一些行政人员说, “在处理一些紧急的文件时, 他们有时来不及把文件送到翻译人员哪儿去, 就自己使用Systran来摄取主要信息……” (Brace 2000:219) 。3) 作为撰写文件的辅助工具。欧委会有些部门的行政人员, 特别是那些以法语为主要工作语言的人员, 由于他们的英语能力比法语能力更强一些, 经常喜欢用英语起草内部会议记录, 然后用机器翻译将材料翻译成法语, 最后再进行润色修改。4) 将机器翻译作为进行快速译后编辑的底稿。为了折中翻译的速度与质量, 对那些送给客户的、由机器翻译生成的粗糙译文, 欧委会的译员会告诉客户, 如果翻译质量达不到客户的要求, 他们可以让自由译者对翻译产品进行译后编辑。

1.2 机器翻译成功应用的两个领域

机器翻译较为成功应用的两个领域:

1) 使用于特定的语篇。机器翻译较为成功的文本类型是那些有着可以预测的词语和句型结构的特定语篇 (restricted texts with predictable vocabulary and syntax) , 例如天气预报这样的文本类型。加拿大的METEO机翻系统在进行英法天气预报互译时就极为成功, 原因是天气预报这一特定语域使用的语言可以被精确地加以限定 (Chesterman和Wagner 2002:122) 。

2) 有控制的语言输入 (controlled-language input) 。美国的Caterpillar公司在将大量信息传达给美国本土之外的生产商和销售商时要求公司的技术人员进行有控制的写作 (controlled-authoring) , 即技术人员在撰写文件和材料时, 必须使用Caterpillar公司的专门英语 (Caterpillar Technical English) , 这种英语的词汇量大约在七万字左右, 语法也是限定了范围的可以接受的惯用语法 (Cronin 2003:114) 。

2 评判机器翻译的质量应注意的事项

在判断机器翻译的质量时, 应注意以下事项:

1) 评判者的母语应当是机器翻译的译入语。

“如果一个人假定机器翻译能够将一份材料成功地译入到他所不懂的一种语言中去, 那他就有可能冒着毁掉自己职业翻译声誉的风险” (Chesterman和Wagner 2002:117) 。下面这个翻译案例清楚地阐明了这一点。英国的一家公司Cheesecake World拟在网上推销本公司的产品。公司总裁Jef Johnson在网上看到Babelfish提供的网上免费翻译服务, 于是就点击了这项服务, 使公司所要宣传的烹饪食谱瞬间译成了五种语言:西班牙语、德语、法语、意大利语和葡萄牙语。糟糕的是, 机器翻译所译出的译文与原文的意思大相径庭。例如, 英语的广告词“Super easy to make!Low in fat, High in taste (制作简单!低脂肪, 高品味!) ”在德语中却被译成“Super easy things to form!Deep in fat, strong in taste! (形成简单!脂肪厚, 味道重!) ”。这份翻译的烹调说明连职业厨师都看不懂, 更不用说普通读者了 (Chesterman和Wagner 2002) 。

事实上, 机器翻译的译文是靠不住的。国外甚至有人这样挖苦地说:“MT, 不是machine translation的缩写, 而是mad translation (疯子的翻译) 的缩写”。因此, 译文还需要懂双语的译者来校对和审核。

2) 没有亲自使用机器翻译的人对机器翻译的质量没有评判权。

Wagner认为, 一个人必须真正使用过机器翻译, 才能够有权利来评价机器翻译的好与坏。也就是说, 机器翻译的质量如何, 人们必须以是否达到实际翻译的目的来衡量。

3) 如果使用机器翻译的人既懂译入语又懂译出语, 机器翻译肯定会对其有帮助。

机器翻译的质量难免参差不齐, 译者有时校改机器翻译所花费的时间几乎与重新翻译这份材料所需要的时间相当。这就解释了不少职业译者并不认为机器翻译是翻译工作中不可或缺的翻译工具的原因。但是, 对于既懂译入语又懂译出语的译者, 机器翻译是很好的帮手。

3 机器翻译存在的问题及原因

对于机器翻译能否代替人工翻译, 这可能是当前翻译界所关注的一个重要话题。虽然有不少机器翻译研发人员对此做出了乐观的预测, 但从翻译实践的角度来看, 这一预测还值得商榷。这里又以Systran为例来看一下机器翻译存在的问题。机翻系统Systran自1976年在欧委会使用以来, 到现在为止, 还只能在以下几种语言之间进行互译:

大量的翻译实践证明, 使用Systran的译者和那些只能靠人工翻译的译者所花费的翻译时间几乎一样。而且, 也没有任何材料可以证明Systran译出的译文又多又好。事实上, 目前欧委会并没有因为使用机器翻译而减少译员。相反, 随着翻译量的增大, 翻译部一直在增加译员, 因为机器翻译系统本身存在着不可克服的缺点。由于Systran系统是建立在分析原文和生成译文两个翻译步骤上, 缺少对信息的非语言意义进行抽象概括这一中间步骤, 因而只能对某两种特定语言之间的词语和句子进行转换。这样, Systran每增加一种译出语, 所花费的资金和时间就比增加一种译入语要多出好几倍。而且某两种语言对互译 (比如法西互译) 质量的提高并不意味着其他两种语言对互译 (比如法英互译) 质量的提高。

鉴于Systran本身发展潜能的缺陷, 欧委会七十年代末开始研发Eurotra, 试图在分析和综合两个步骤之间建立一个共同语作为机器系统生成多种译入语的基础, 然而到1992年该项目经过多次实验后宣告失败 (Commission 1994) 。由于Eurotra的失败以及Systran本身存在的缺陷, 欧委会现在已经停止对新的机器翻译系统的开发, 认为比较明智的做法是等待市场的开发 (Chesterman和Wagner 2002) 。

4 具有发展潜力的翻译辅助软件

虽然机器翻译的发展前景目前还难以下定论, 翻译辅助软件的使用却具有很大的发展潜力。下面扼要介绍一下翻译辅助软件的应用以及其优势和面临的挑战。

4.1 翻译记忆软件

翻译记忆 (translation memory, 缩写为TM) 是计算机辅助翻译 (computer-aided translation, 简称CAT) 技术之一, 是翻译辅助软件中应用得比较成功、比较广泛的一种软件。实际上它是一个数据库, 包含着双语文本片段, 原文本中的每一个句子都有相应的译文对应。当译者在翻译某一文本片段的时候, 翻译软件能够将该段落并排记下来, 或者弹出译者以前所翻译的相关内容。译者可以选择接受该译文, 也可以做一些修改, 修改后的新译文会自动存入记忆库, 供以后使用。译者可以轻而易举地从以前的翻译中得到近40%的已翻译的内容, 从而免去了译者大量重复性劳动 (O’Brien 1998:116-117) 。

在西方翻译界, 大多数翻译工作者似乎都同意这一点:翻译辅助软件比机器翻译更具有发展潜力。自八十年代末始, 欧委会的一些重要法律文件就开始储存在CELEX数据库里。尽管当时译员在搜索某一资料时程序烦琐, 但是搜索CELEX数据库比到期刊上去查找资料更为方便。现在, CELEX数据库的用户界面已经得到了极大改善, 人们在网址http://europa.eu int/celex上已可以查找到该数据库。另一个颇受欧委会译员欢迎的软件是双语电子档案 (electronic archive) 。

有的西方翻译工作者认为翻译记忆软件应用范围有限, 但不少译者对该软件仍有很高的评价。他们在翻译一些枯燥乏味的日常材料时, 通常选用翻译记忆软件而不是机器翻译来辅助他们的工作。

4.2 翻译辅助软件的优势及面临的挑战

翻译辅助软件在未来的岁月里将会触及到每个翻译工作者, 其中受益最大的有可能是那些在大翻译公司上班的译员, 或是受聘于大翻译公司的自由译员。翻译辅助软件的工作效率高, 而且翻译记忆互联网上的资源共享也使得翻译行业的规范和统一得到保障 (O’Brien 1998:122) 。翻译辅助软件在本地化过程中, 能够使得行业的客户、本地化公司和译员从中受益。具体体现在以下三个方面:

1) 降低客户成本。由于翻译辅助软件有10%乃至70%的翻译内容是重复性的, 故客户只需按正常市价支付新文本翻译的费用, 而对于译员通过校对或编译的译稿, 则按不同的费率进行支付【即对全部匹配 (perfect matches) 、模糊匹配 (fuzzy matches) 和没有匹配 (no matches) 分别以不同的费率支付】。翻译辅助软件使得客户的文本内容的一致性得到保证, 同时也大大缩短了上市时间。

2) 对本地化公司而言, 翻译辅助软件可以减少翻译的时间周期, 加快翻译速度, 使服务更到位, 更具竞争力。

3) 对于译员, 翻译辅助软件并不构成任何威胁, 相反, 它解放了译员更多的时间, 使他们有更多的时间从事更多的翻译活动。此外, 译员还可以通过翻译工作平台 (Translator's Workbench) 在局域网或互联网上与其他译员同时分享翻译记忆库, 真正达到资源共享 (O’Brien 1998:119-120) 。

尽管翻译辅助软件有诸多优势, 但也面临多方面的挑战。

1) 对客户的挑战。由于翻译辅助软件是一项新的技术, 客户在使用之前必须进行培训学习, 因此前期的投资是必须的。而且为了使投资有回报, 客户必须长期坚持使用翻译辅助软件;而且为了保证翻译辅助软件高效运行, 客户建立的源文件必须是高质量的软件。另外, 有些翻译辅助软件并不支持所有的文件格式, 客户不得不选用不同类型的翻译辅助软件。

2) 对本地化公司的挑战。为了给客户提供高效的服务, 本地化公司必须在时间和资金上大力投入, 对译员、工程师、项目经理等进行培训;同时必须随时对本系统软件进行改制、升级, 不断提高效率。而设备的配套、更新以及网络的稳定, 都需要投入巨额资金, 以确保服务质量, 确保回头客。

3) 对译员的挑战。由于软件功能各异, 各司其职, 译员必须经常进行培训学习, 熟练掌握多种软件工具。关于翻译辅助软件稳定性和可靠性的问题, 也需要通过译员对软件正确的使用和经常的改进才能得以很好的解决 (O'Brien 1998:120-122) 。

5 结论

无论我们是否喜欢使用机器翻译和翻译辅助软件, 技术的发展无疑使译者有更多的选择机会。利用机器翻译和翻译软件提供的便利, 充分发挥译者的创造性和主动性, 人机互补是目前最为理想的翻译工作方法。因为, 从最终意义上来说, 机器翻译及翻译辅助软件的开发是解放译者, 而不是使译者成为机器的奴隶。

参考文献

[1]Brace C.Language Automation at the European Commission, 219-24, in Sprung, R.C. (ed.) Translating into Success:Cutting-Edge Strategies for Going Multilingual in a Global Age[M].Amsterdam and Philadelphia:John Benjamins, 2000.

[2]Chesterman, Andrew, Wagner E.Can Theory Help Translators[M].Manchester:St.Jerome, 2002.

[3]Commission.Final evaluation of the results of EUROTRA:aspecific programme concerning the preparation of the devel-opment of an operational EUROTRA system for machine translation[M].Brussels:EC, ESBN9277805854, 1994.

[4]Cronin, Michael.Translation and Globalization[M]//London:Routledge, 2003.Halal et al.Emerging Technologies:What's A-head for2001-2030[M].The Futurist, 1997:6, 20-8, 3.

[5]Kenny, Dorothy.CAT tools in an academic environment:what are they good for?[M].Target, 1999, 11 (1) :65-82..

[6]Lehman-Wilzig, Sam.The Tower of Babel v.the Power of Bab-ble:Future Political, Economic and Cultural consequences of Synchronous[M].Automated Translation Systems (SATS) , New Media and Society, 2000:484.

[7]O'Brien, Sharon.CAT Tools in the Software Localization Indus-tries[C]//Bowker L, Cronin M, Kenny D, Pearson J.Unity in Di-versity?Current Trend in Translation Studies.Manchester:St Jerome Publishing, 1998:115-122.

上一篇:国家立法权研究下一篇:随机微分代数方程