双语心理词典

2024-06-06

双语心理词典(精选十篇)

双语心理词典 篇1

心理词典(mental lexicon),与普通的词典相对,是词汇在人大脑中所形成的一种永久表征。对心理词典的研究主要集中在研究词语是如何储存在记忆中并从记忆中提取出来的。同样,对双语心理词典的研究也主要集中在两种语言的词汇在大脑中的储存的方式即双语心理词典的表征问题。双语心理词典的表征可以分为双语的形式表征(语音表征和词形表征)和概念(语义)表征,其中概念(语义)表征更加复杂也更加受到学者的关注。故研究双语心理词典的表征问题不仅能在理论上对心理语言学和“内在”的语法范畴有所贡献,更能在实践上对二语词汇的学习有很大帮助。

二、双语心理词典语义表征

双语心理词典的研究从二十世纪中期至今一直备受关注,其表征模式成为很多学者关注的重点问题。就汉语和英语而言,由于两者在语音和词形的差异都有比较明显,学者们往往认为其形式表征是相互分离的。而其语义(概念)是独立表征还是同一表征,即双语者存在一个还是两个语义系统一直是学者探讨的问题。

关于双语心理词典的语义表征问题,国内外研究者提出了很多观点。如Weinreich(1953)首先提出双语词汇知识有3种组织结构:并列型、复合型和从属型。Potter et al(1984)的概念调节模式和词汇连接模式,De Groot(1992,1993)的分布式特征模式,Kroll和Stewart(1994)的修正阶级模型(RHM),Green(1998)的IC(inhibitory control)模式,董燕萍(1998)的共享分布式非对称模式等。研究者们做了很多实验并没有的出一个统一的结论,这其中有一个很主要的原因是研究者们选取的研究对象有很大不同,尤其是双语者对不同二语词汇的熟悉度。

Pavlenko(2009)的提出了MHM改进层级模式(Modified H i e r a r c h i c a l M o d e l)。他在分析讨论了R H M、D F M和SAM(Shared Asymmetrical Model)后保留了三种模式的优势并作出了改进。他提出了概念表征或许完全共有,或部分重合,或具有完全的语言特定性,这超越了以前学者大部分认为的概念储存具有统一性,其双语概念的非对等和部分对等也和分布式特征模式和共享非对称模式作出了区别。MHM最主要的是提出了区别性特征即将二语学习作为概念重组。MHM模式认为二语学习的主要目标就是概念重组和培养目标化的语言学范畴。这种学习被认为是一种渐进过程,发生在隐性记忆中。

陈士法(2011)在研究双语心理词典的数量和语义表征时表明双语心理词典语义表征是具有阶段性,且处于不断变化之中的。在这个新的表征模式中,“低熟练度单词的表征方式为一语词项连接模型、中熟练度单词的为一语语义中介模型、高熟练度单词的为二语语义直达模型。”所以一个二语词汇的习得要经过从不熟悉到低、中、高熟悉,这是一个连续的过程,故所以对于二语学习者来说,双语心理词典是一个由很多熟悉度不同的词汇组织起来的,而词的熟悉度是随着学习的过程不断变化的,这是一个与熟悉度有关的动态的过程。陈士法(2015)利用了EPR技术对中国英语学习者二语单词再认的精神机制进行了研究,发现其再认模式确实和熟悉度有很大关系。

三、对英语词汇教学的启示

通过对英汉心理词典语义表征的研究可以看出,单纯的将学习者从其英语的整体水平去划分层次的研究对于词汇的学习来说并不够完整。单词的提取和心理词典中单词的熟悉度有很大关系,所以教师在教学是要注重温故而知新,将学过的单词加以复习,将新旧单词之间建立联系,逐渐提高熟悉度。同时,要注意语义习得的策略组合应该随着学习的过程不断改变,不能随意根据学习者的喜好一成不变的学习英语单词,虽然现在的研究无法具体的确定表征模式中转换和过渡的具体情况,但总体来看习得策略的改变也有很大意义。最后,对双语心理词典语义的建立是一个循序渐进的过程,正如MHM中提到的,学习的主要目标是要进行隐性的概念重组,这中间的要用到很多的策略对二语单词的语义进行深加工,在二语特定范畴和一语二语共有范畴上做好区分,如可以通过查英英字典等了解单词的意思而不是简单的将英汉意思对应,也可以结合语境去理解单词的意思等。

总之,未来的研究应该把心理词汇看作是动态和连续的过程。随着心理学上的一些新技术在心理语言学方面的应用,心理词典的研究的连续的、动态的过程将更加清晰,这也有助于人们更好地认识双语心理词典并将其语义表征正确的运用到词汇教学中去,二语词汇的记忆和提取都有重要的参考意义。

摘要:随着国内外研究的持续深入,双语心理词典这个黑匣子的面纱正在逐步被揭开。虽然现在关于双语心理词典语义表征尚且没有形成一个完整且确定的理论,但可以肯定的是双语心理词典并不是一个静态的固定不变的内部系统,而是随着二语学习者对词汇的逐步熟悉而变化的。因此对于双语心理词典的研究必须从动态的观点去分析,才能将研究结果运用到英语词汇学习这个持续的过程中去。本文将通过对近几年双语词典的动态观的理论综述,探讨其在英语词汇教学中的作用,从而为词汇教学提供一些新思路。

关键词:双语心理词典,词汇教学,动态观

参考文献

[1]桂诗春.新编心理语言学[M].上海:上海外国语出版社,2000.

[2]陈士法.双语心理词典的语义表征研究[J].山东外语教学,1997(2).

双语心理词典 篇2

从双语词典的编纂原则看《新英汉词典》的修订

从双语词典的评价标准看,<新英汉词典>历时25年的.再版与修订过程体现了词典编篡原则,即双语词典编篡的科学性、信息性与实用性原则.

作 者:汤丹青 Tang Danqing  作者单位:集美大学外国语学院,福建厦门,361005 刊 名:福建商业高等专科学校学报 英文刊名:JOURNAL OF FUJIAN COMMERCIAL COLLEGE 年,卷(期): “”(3) 分类号:H315.9 关键词:《新英汉词典》   词典编篡原则   科学性   信息性   实用性  

双语心理词典 篇3

关于梅花词典

梅花双语词典是这样一款词典:绿色、简单、快速、极少占用资源。梅花双语词典可以随系统启动,平时只占用1MB左右的内存,却可以随时为你提供16万条英汉词汇翻译。

相对于具有超海量词库和强大功能的金山、巴比伦、灵格斯等著名词典软件,梅花双语词典功能很少。但并不是多数人都需要那么多功能,人们大多数时候也许只需要英汉单词对照就可以了。

软件的名字叫梅花,古人云“比花花解语,比玉玉生香”,古人常用“比花花解语”形容绝色美女,那么能解语的花想必也是绝色。相信国人都很喜欢梅花、桃花,所以软件作者给这款词典起名梅花词典,可见其对自己作品的自信。

小提示:

梅花双语词典的屏幕取词功能,只能对可以选中词的窗口进行取词,不能对普通对话框控件之类的窗口取词,但是大多数情况下已经足够了,不支持的情况自己手动输入词就可以了。

双语心理词典 篇4

关键词:双语词典,文化全球化,权力差异,文化身份

一、引言

词典不仅仅是语言学著作, 从广义上讲, 词典还是一种文化研究的产品, 词典忠实地储存与反映社会文化的方方面面。双语词典涉及两种语言, 也就涉及两种异质文化的碰撞和交流。从文化的角度而言, 双语词典具有重大的意义, 不仅承担着引进外语文化的任务 (目的语—源语内向型双语词典) , 同时还肩负着向外介绍本土文化的重任 (源语—目的语外向型双语词典) 。鉴于此, 本文试将双语词典纳入全球化语境下文化研究的视阈, 将视角投向双语词典文本以外, 追问特定的文化语境在词典文本里词目、例证以及译义方法的选择上所发生的制约作用, 以期发现双语词典文本中体现出的权力差异和文化歧视。

二、文化全球化与语文词典中的文化权力差异

作为当代学术话语之一, 全球化 (globalization) 是指“当代人类社会跨越国家和地区界限, 在全球范围内展现的全方位的沟通、联系、相互影响的客观历史进程”。全球化过程中世界的经济、市场、技术与通讯形式都越来越具有全球特征, 民族性和地方性在减少, 而这意味着异质文化和文明的差异将成为全球化进程中地区间冲突的主要方面。文化冲突必然涉及强势文化和弱势文化之间的权力差异。从当前的世界文化现状来看, 西方文化仍居于明显的强势和主导地位, 而东方则处于弱势地位。在东西方文化之间的跨文化交流中, 西方一直扮演着“输入”的角色, 对东方实行着文化殖民统治。

东西方这种不平等的文化权利差异或明或暗地体现在语言和文化产品中。曾泰元等列举了OED2中有关中国的书证, 真实地展现了西方视角之下的东方 (中国) 。例如,

中国佬…的确状如玩偶, 长着一张长长的黄脸。

这些例证反映了单语词典中的种族主义, 以及西方对中国为代表的东方的扭曲, 是一种不平等的文化权力关系。

三、文化平等对话的诉求与双语词典编纂

1. 文化平等对话的诉求

通过以上例证我们看到了西方视野下模式化的中国 (东方) 。东方被构造并被介绍到欧洲, 结果是东西方处以一种不对称的文化权力关系, 西方是中心, 东方则是边缘。可想而知, 这发出的一个信号是:强势的西方文化在对非强势的东方文化进行“脱色”处理并使其面临灭绝危险。因此, 在全球化背景下, 怎样保留民族文化的深度, 弘扬文化的民族独创风格, 便是一个严峻的问题。文化全球化的目标要求强调不同民族文化的独特价值, 促进民族文化走向世界, 解构当今西方某些发达国家的霸权主义者试图借“全球化”推行文化殖民主义的策略, 真正实现多元共存互补。换言之, 在文化全球化的背景下, 我们所寻求的是与西方对话, 而不是对抗, 是一种文化平等对话的诉求。

2. 双语词典与平等文化话语关系建构—以汉英词典编纂为例

双语词典编者要利用双语词典文本这一阵地, 构建自身的文化身份, 从而建构平等、互敬的母语—外语文化话语关系。对于母语—外语的外向型双语词典编者, 尤其如此。这是因为此种类型的双语词典很大一部分功能是服务非本族语学习者的语言学习需求, 向学习者展示源语语言文化, 故编者更应利用这一文本形式, 重塑民族形象, 强化自身的文化身份。为做到这一点, 编者可以采用一些策略, 以下本文试图以汉英词典编纂为例来说明。

(1) 词目、例证选取

赛义德提出东方殖民地人民对殖民者的反抗的途径之一就是要进行“文化反抗”, 消解西方话语霸权, 从西方手中夺回自己的话语权。可利用的手段包括重写宗主国经典、重新命名山水、拥有文化和自我再现的权力等等。东方只有重新塑造、再现自我, 才能获得自己的文化话语权, 进而东西方之间的权力张力才能逐渐趋于平衡。据此, 汉英词典编者可以在选择词目和例证时, 选择那些可以反映中国积极向上形象的词目、例证。例如, 经济方面可以收录“高速铁路” (high-speed railway, 中国的高铁建设取得了举世瞩目的成绩) 、“西部大开发” (Western Development) 等等;科技方面, 如“神舟飞船” (Shenzhou spaceship) ;社会生活方面, 如“菜篮子工程” (vegetable basket program, non-staple food project) 、“保障性住房” (indemnificatory housing) 、“春晚” (Spring Festival Gala) 等等。

汉英词典编者更要选择那些反映当今中国状况的正面、积极的例证了。《新时代汉英大词典》为了反映时代特点, 采用了一些新的例证, 如:

由对比可见, 《新时代汉英大词典》编纂者努力展示当前人们新的精神面貌以及这个社会多元的文化生活方面。在编纂理念上, 《新时代汉英大词典》摆脱了人们深层意识中的政治文化情结, 通过以客观的态度展示这个多元社会的多方面特点, 可以为新世纪的国内外读者提供全方位的、全新的文化信息。

(2) 翻译策略选取—文化局限词异化翻译策略

双语词典在一定程度上可以看做是源语和目的语共现的翻译文本, 编纂者要自觉抵制词典文本翻译中的翻译暴力, 自觉抵抗强势文化的主流语言文化价值观念, 彰显少数族话语所蕴含的价值差异。这在处理词典中的文化局限词时, 尤为如此。在翻译文化限定词时, 译者要尊重不同文化的个性和独特性, 应采用异化的翻译策略, 从而尽可能保留源语文本所含的异域文化信息和文化意象, 达到“文化传真”的目的;若使用归化策略, 则会抹杀源语文化的民族色彩, 使词典用户误以为源语文化与目的语文化具有相同的文化理念。

《新世纪汉英大词典》则对文化限定词采用了异化的策略, 彰显出了汉民族文化的个性。如:

《新世纪汉英大词典》编纂者所使用的音译、直译等异化翻译策略, 忠实地在译文中再现了源语文本信息内容, 让读者了解到富有异国情调的源语文化, 有利于英汉文化的交流。

四、结语

正如陈原先生所言, “一部大型汉英词典问世, 它的意义不止是多了一部比较可靠的互译工具书, 它还有更深的一层涵义:它意味着东西两种文化传统和东西思维方式在接触, 在对话。它将引导世界更好地了解中国, 也将引导中国更好地去了解世界”。双语词典的文化意义可见一斑。用文化全球化的视角关照双语词典的编纂, 就是要发现双语词典文本中隐藏的文化权力差异。但是, 文化全球化的终极目标不是以民族主义对抗西方霸权, 而是促成东方和西方二元对立的消解, 平等对话, 相互尊敬。从这个意义上讲, 双语词典编者就被赋予了重要的使命:要利用双语词典文本这一载体, 强化自身的文化身份, 最终促进两种文化之间的平等对话。

参考文献

[1]韩红.全球化语境下外语教学中的跨文化意识[J].外语学刊, 2002, (1) .

[2]爱德华赛义德 (Edward Said) .东方主义再思考[C].后殖民主义文化理论.北京:中国社会科学出版社, 1999:3-21.

[3]曾泰元, 赵连振.试论英语词典里的中国形象变迁—兼评《朗文当代英语词典》 (第5版) 》中国例证的选择[J].辞书研究, 2001, (3) .

[4]张柏然.文化全球化语境下的翻译理论研究[J].中国翻译, 2002, (1) .

[5]王家传.2001.赛义德后殖民主义理论对福柯和德里达理论的借鉴[J].厦门大学学报, 2002, (3) .

[6]惠宇.新世纪汉英大词典[M].北京:外语教学与研究出版社, 2004.

双语词典翻译中的语境研究 篇5

本文在语言翻译的宏观框架中,立足元词典学理论,探证了双语词典翻译承载的四个维度的语境:词典语篇语境、微观结构语境、狭义语境与泛文化语境.基于语境对于翻译的重要作用,这一界定具有双语词典翻译本体论意义上的价值,是确立方法论意义上的翻译原则或标准的`必要前提,同时也有利于构建客观、理性的双语词典翻译评论体系.

作 者:陈伟 蒋清凤 作者单位:陈伟(南京大学双语词典研究中心博士后流动站,江苏,210093)

蒋清凤(湖南衡阳师范学院外语系,衡阳,421008)

谈双语学习词典编纂的基本问题 篇6

众多学者指出,词汇为二语教学的基础、核心、主导因素。词汇研究既有理论的一面,也有应用的一面。但如何把这两方面结合起来转化成二语教学之所需,或者再进一步,如何把二语词汇研究转化成二语词典之所需,恐怕系统的、精细的、实证的研究仍不多见。这不能不说是提升二语教学质量的一个瓶颈。本人基于编纂《汉英学习词典》(北京大学出版社)的心得以及组织三次对外汉语学习词典学研讨会的体会,不揣浅陋,谈谈对外汉语学习词典编纂的几个基本问题。

1997年在德国举行了国际上首届学习词典学研讨会,会后出版名为《有完美的学习词典吗?》(The Perf ect Learners'Dictionary?)的论文集。这个带有问号的题名暗示着没有“完美的”,只有“较佳的”学习词典。论文集中有句话很值得我们思考:一切准备好了才开始编写词典。怎样才称得上“准备好”呢?本人有三点体会,即类型要科学定位,方法要有可操作性,设例要符合二语学习的规律。本文就集中谈这三个问题。

一、对词典类型学的思考

类型学是研究事物之间个性和共性的科学,其结论具有方法论上的约束性。词典类型学公认的参数一般为:为谁、服务于什么目的、普适(for general purpose)或专项(for special purpose)等。可是,这些貌似常识的参数往往被忽略。有的人一时浮躁,立组班子,分工撰写,完全无视类型学的要求,只能产生“豆腐渣”词典。其实,这些参数背后正蕴藏着教育语言学(educational linguistics)关于二语学习词典的基本理念和原则。简单说来有五项:

1.一语教学面向知识,二语教学面向交际。

2.交际的有效性,首先来自语感的获得。

3.语感的获得来自实词入句条件的再现(reproduction)。我们之所以强调对“实词”(即名、动、形、副)的句法描写,是因为这是构成整个汉语面貌的基础,也是一切语言研究的基础。当然,我们所指的实词为词汇系统中的核心词,即排除种种社会边缘词(如新词、外来词、方言词等)、社会陌生词(如行业词、科技词、网络词等)。

4.实词入句条件的再现给出的就是规则。由于二语教学面对的是有限空间,而在有限空间里给出规则是可行的。

5.由于在现实交际中,词汇的准确使用比语法的合法重要,也由于在二语学习者的语言偏误中,词汇上的错误比语法上的错误要多,实词入句的策略是必行的。引用英国哲学家Quine的一句话:“词典的工作是教人如何使用句子。”[1]这句话足以概括二语学习词典类型学意义上与一语词典的分界线。

另外,二语学习词典类型上分单语及双语学习词典。本文讨论的范围是二语双语学习词典,也就是对外汉语(汉英)学习词典。国内有不少文献极力推崇英语单语学习词典(MLD:monolingual learner's dictionary)对对外汉语学习词典的借鉴价值。本人素有保留,原因有三:

1.对学英语的中国人来说,MLD起点可以比较高。可是从学汉语的外国人的角度来说,词典的起点应该相当低。李萍提供了一组很能说明问题的数字。她说:“留学生的汉语水平普遍不高,58.8%的留学生处于初级水平,22.1%处于中级,只有 19.1%处于高级水平。”[2]借鉴起点高的词典形式来编写起点低的词典是不现实的。

2.MLD起点高,故明言为读、写、译服务,无视为说服务。在目前情况下,汉语国际推广需要的恰恰是“为说”的词典产品。从类型学的角度来说,我们必须严格区分表一所示甲、乙两类词典。

表一

类型上的确定有助于系列化的界定。基于《汉英学习词典》的实践,我们初步提出五个方面的核心数据,如表二所示。

表二

说明:

①“比喻义”包括涉及中国元素的文化义。

② “句法规则”指的是在词典示例中操控出现的句法规则。据国内(包括台湾地区)的多项统计,外国人学习汉语掌握220~270条句法规则即可在一般的范围内达到表达自如的程度而无须学习具有相当难度的特殊格式或句式。本文讨论的三个等级中预设的规则数量的依据就在此。另外,“句法规则”和“参数比例”都是指滚动累积的数据。

③“参数比例”指的是条目数(前项)与示例数(后项)的比例;一般来说,一个条目配备一至三个示例,即提供三个实词入句的真实语境。

④“设例长度”依据的是心理学的阅读眼动和短时记忆效度的试验数据。

⑤“配价对应”指的是示例译文中清晰地显示汉语词目在目标语中的对应值,详见下文。

系列化的结果形成了科学化的产品,也就是语言信息词典化的基础,即32000个示例分布于16000个词项,涵盖着250条句法规则。这就是他族学生学习汉语的终端背景。另外,传统的思维是,你学到哪一级,你就应该具备相应级别的知识和技能。这往往是一种经验的判断、笼统的描述,往往与交际上的现实要求脱节,没有任何实证的量化基础,而新型的学习词典恰恰旨在提供教学-测试的参照数据。问题是英语M LD完全忽略这样的数据。

对英语MLD有所保留的第三个原因涉及比较深的层面。国外已出现批评的声音。I.J.Kernerman指出MLD的三个弊端:一是核心信息盲目追求高端化,只盯着学用英语的精英分子,附加信息繁杂,实在不敢恭维;二是只搞单语,忽略双语;三是“唯语料库论”,从而脱离普通学习者真正的需要。[3]S.Tarp更直指MLD对高级学习者很好而对初、中级学习者却很不好。[4]这些都是很中肯的意见。我们必须清晰地把握对外汉语学习词典编纂的实际需要以作出合理的选择。

“对外汉语学习词典”中的“学习”,总括起来就是要尊重二语学习的规律,从学习者的学习条件出发,尽可能做到 Q-E-I。Q(Quick)速查,E(Easy)易懂,I(Immediate)即用。要做到Q-E-I,首先不是技术问题,而是如何处理好类型学上的各项原则的问题。

二、对语料库的思考

首先,语料库的构建需要注意三个方面。

就构建的原则而言,问题有二:一是构建单一基础语料库还是平行语料库?二是构建平行语料库还是专设语料库?平行语料库含媒体、文学、专业的异质语言材料,专设语料库含词典、语法书、教材的同质语言材料。二语学习词典需要的是专设语料库。这是因为媒体有着不稳定的时效性,文学有着修辞色彩或地域文化元素,专业有着非社会的陌生性。对学习词典编纂来说,凡此种种都可以视为负面因素。而词典、语法书、教材则是已经过专业人员筛选加工的、条理化的、待用值高的语言材料,这正是学习词典编纂所需要的。

就构建的规模而言,面向本体汉语的语料库可能是超大规模的,而面向对外汉语的语料库完全可能是小规模的。这样说是因应对外汉语两个显著的特点。其一,对外汉语属二语教学,具有预设性、简约性和对比性。其二,对外汉语属语言工业,需要实证的方法,句法优先的方法,相对穷尽地描写的方法。从词典、语法书、教材梳理出的语言信息一般足够建立种种应用的平台(如跟其他教学手段进行链接、整合)。

就构建的价值而言,平行语料库内含的乃是生语料,一般不能直接使用,转化成本较高。由词典、语法书、教材等材料构建而成的专设语料库内含的却是熟语料(半成品),兼具转化成本低、内容可塑性高(如易于修改、操控)的特点。

其次,需要指出的是,语料库仅仅是一种工具,它需要以下三方面的有机配合才具有有效性、可操作性、应用性。

1.语言学方法的支撑。学习词典学属应用语言学。在应用语言学的框架里,我们自始至终借鉴由配价语法(valency grammar)[5]直接衍生的法国“词汇-语法”(lexicon grammar)理论和英国“词汇-语法”(lexicogrammar)理论。前者植根于美国哈里斯的数理结构语法而后者植根于英国弗斯的伦敦学派。两者的特点如表三所示:

表三

可见这两个模式,不管是共同点还是不同点,对我们来说都很值得参考借鉴,关键在于如何为汉语所用。

2.语料的科学梳理。由于学习词典是预设的、有限的、可调控的切割空间,完全可以施以基于规则(rule-based)的方法。语料的技术处理有三个环节,缺一不可。

①形式化,即把语言串列简约成可观察的格式,以便梳理。

②代码化,即给种种形式化了的格式指派代码,以便识辨。

③体例化,即给种种代码化的语言事实在锁定的空间内合理排序,以便使用。

以“意料”为例(见《现代汉语词典》1618页,动事先对情况、结果等进行估计)。《现代汉语词典》的处理方式是:一,“意料”算一个单位;二,“意料”算一个词单位。我们的处理方式如表四所示(当中C为必要的附加成分,Ca为前附加而Cb为后附加;E表示可省略表示由于音序有别而需要参照):

表四

这就是说,“意料”可构成的意义单位或语块单位至少为五个。这样处理,貌似增加词典的篇幅,却如实地反映了词语的使用情况。当然,语块分列属基础研究,使用者需要根据具体的应用目标、具体的服务对象决定取舍。至此,读者可能会更准确地理解本文表二第三项的“参数比例”的前项,如初级的7000个条目,可能只代表2000~2500个词单位。这就是法国和英国“词汇-语法”语言信息词典化的第一项工作。[6][7]

3.专家团队的干预。专家团队的干预是内省法的体现。内省法是对语料库不可或缺的补充,因为任何规模的语料库都不可避免地碰到语料稀疏、语料不平衡等问题。专家团队的干预主要表现在下列五个方面:

①判句能力(是否合法)

②辨句能力(消除歧义)

③完句能力(使之合法)

④改句能力(使之合乎读者要求)

⑤拟句能力(重新拟造)

这是在语料库中提取语料时使其效果最大化的被动措施。在进入实际的编写程序时就需要主动监控示例的设计。一语词典认为示例只充当一个被动的角色,即印证词义,所以示例设计的随机性很大。而二语词典主要是通过示例来显示其学习功能,所以示例设计当中的随机性应当最小化。下面是检查双语学习词典示例设计是否得当的清单,如表五所示。在这个反复检查的过程中,某些语料“复活”过来的情况是不少见的。设例成功与否就要看我们在语料梳理上所下的功夫如何了。对于双语学习词典,尤其是对外汉语学习词典,这样的处理方式从整体上降低了设例的随机性,从而大大保证了设例的质量,提升了词典的适读性和市场价值。我们同意这样的观点:有了语料库,你可能成功;没有语料库,你肯定失败。现在我们可以再加上一句:有了语料库,但离开语料库的合理构建,离开服务于你所设定的目标的科学方法,离开梳理语料细腻成熟的技术,离开专家团体的积极干预,同样,你肯定失败。

三、关于意义单位(语块)的思考

大家知道,对外英语教学有着深厚的实证主义传统,所以当M.Lewis的《词汇法》(The Lexical Approach)于 1993年出版后,“词汇全方位”(lexical dimension)的策略很快成了学界的主流,其关键词正是“语块单位”(lexical chunk)。就本文讨论的范围来说,我们关心的是,“语块单位”如何作用于:(a)条目的统计;(b)设例的框架;(c)译文配价的对应(valency correspondances)[8]。a项我们已有所论述,不再重复。b项,“语块单位”的条目化(chunk-based lemmatization)是设例的起点(见表四),这不难理解。下面我们集中谈c项。

在正式开始之前,需要简单介绍一下我们对汉语“语块单位”的理解和分类。

1.我们对“语块单位”的理解。

“语块单位”是语言使用中形成的惯例化语言构块,有如下五个特点:

①按照已知的句法规则生成。

②属于线性语法。

③属于话语单位,即只能用于有限的语境中、具有功能价值、稳定的话语单位。这里面包含三层意思:(a)话语单位为常用单位,因为感觉比知识更重要;(b)话语单位为口语单位,因为一般说来,口语单位要比文本单位更准确;(c)话语单位为韵律单位,也就是句法单位。

④属于句法-语义单位(syntactico-semantic unit),有别于传统的形态-词汇单位(morphologico-lexical unit)。

⑤在双语对比的语境下,在目标语(target language)中体现为一个整存整取的语义实体(semantic block);“语块单位”具体由多少个词符组成或是否连续组成并无实质意义。西方文献指出,在语言实际使用中多词符单位(multi-item-unit)的出现频率高于单词符单位(one-item-unit)。虽然在汉语方面尚无公开发表的统计数据,但我们相信,汉语不会是例外。在我们的心理词汇里,“跟……争辩”比“争辩”、“向……自首”比“自首”、“给……做媒”比“做媒”的使用频率高,因为各前项都体现为语义实体而各后项仅仅是形态实体,“争辩”、“自首”、“做媒”在汉语里只是书写成双语素的单位而已。

2.我们对汉语“语块单位”的分类。

汉语“语块单位”可分三大类,即“词串”(syntactico-semantic string)、“语串”(constructional string)和“句串”(enunciative string)。“词串”分六次类,即体语(体词性成分:主语和宾语)、述语、定语、状语、补语和话题语。“语串”指句子(包括单句和复句)内部的非连续单位。“句串”分三类,即小句(口头习用句式)、准句(谚语)和类句(歇后语);“句串”的命名来自法国学派(A.Culioli:enonciation)。综合起来,“语块单位”共十一小类。这样处理的一个基本出发点,是把汉语传统词汇学所涉及的词汇性单位、熟语性单位、语汇性单位都归纳到一个可形式化因而应用价值较高的“语块”系统里来,如表六所示。至于c项的讨论,我们注意到译用词典对示例的译文只求句子层面上的达意,无其他考虑。学用词典的示例译文则不然,需要充分提供双语互通的“理解线索”(mutual intelligibility clue),“理解线索”包括配价单位的对应;句法单位的排列和语义单位的翻译。“配价”我们理解为词项的句法分布模式,那么“配价单位的对应”实际上就是指语块单位的对应。始发语(如汉语)和目标语(如英语)在翻译输出的具体形式上往往存在着一对多的情况。译用词典完全可以从中随机地挑选一种,但学用词典只能优选一种,即能一对一地向读者提供最佳的“理解线索”的那一种,如表七所示。

表六

表七

(续表)

表七显示了两个词动词(妥协和注意)和对应的五个语块动词的翻译输出。

本文开始提出了“准备好了没有”这一问题。就本文讨论的范围,我们说的“三分清”,就是指:一分清一语词典(本体词典)与二语词典(对外词典);二分清双语译用词典与双语学用词典;三分清自始至终你所要贯彻的方法论。就本人初步的经验而言,方法论必须考虑到:(1)国外读者学汉语的时间压力;(2)便于整体记忆和运用的、基于句法-语义单位的条目安排;(3)双语例证互译中配价线索的设置及对应。

附 注

[1]Quine W V O.Meaning.∥Quine W V O.(ed.)Pursuit of Truth(Revised Edition).Cambridge MA:Harvard U niversity Press,1992:37-59.

[2]李萍.留学生跨文化适应现状与管理对策研究.浙江社会科学,2009(5):114-118.

[3]Kernerman I J.What's So Good or Bad about Advanced EFL Dictionaries? ∥Gottlied H.(ed.)Dictionary Visions,Researchand Practice.Amsterdam:John Benjamins Publishing Company,2007:139-142.

附 注

[1][2][3]Samuel C.The Encyclopaedia Sinica.Shanghai:Kelly and Walsh,Limited,1917:301-302.

[4]Baller F W.An Analytical Chinese-English Dictionary.Shanghai:China Inland Mission and Presbyterian Mission Press,1900:iv.

[5]M athews R H.Mathews'Chinese-English Dictionary.Shanghai:China Inland Mission and Presbyterian Mission Press,1931:v.

[6]Couvreur F S.Dictionnaire Classique de la Langue Chinoise Suivant L'ordre Alphabétique de la Prononciation.Ho Kien Fou:Imprimerie DF La Mission Catholique,1911.

国内双语电子词典现状简论 篇7

计算机、网络与信息存储技术的飞速发展, 使得电子词典 (electronic dictionaries) 无论从内容、功能或是实用性都有了全面的进步。从电子词典的介质来看, 电子词典大概可分为下面三种类型:网络电子词典 (web-based e-dicts) , 个人电脑电子词典 (PC-based e-dicts) 或单机版电子词典和芯片电子词典 (chip-based e-dicts) 。网络电子词典是目前国际上发展最迅速的电子词典, 这得益于网络技术和存储技术进步以及网络资源的共享, 但在中国这才刚刚起步。个人电脑电子词典发展也是非常的快, 这与独立的开发商和各大出版社的努力是分不开的, 这类电子词典现在主要是以C D-ROM的形式出现在市场上的, 不少出版社在出版印刷版的词典时, 同时也出版了相应的CD-ROM版。芯片电子词典近年来在中国的发展是异常的迅猛, 主要体现在以文曲星、好易通、名人、步步高和诺亚舟等品牌的电子词典在市场上的激烈竞争上。本文拟就上述三类电子词典中的双语词典在国内的现状作一概述。

1. 国内双语电子词典的现状及其特点

1.1. 网络电子词典

我们利用目前网络上最流行的搜索引擎Go o g le, 在所有简体中文网站中以Online Dictionaries为主题词进行搜索, 共获得520个相关链接。从所列出的链接来看, 网络电子词典的种类是多样的。从语种来看:有单语的, 有双语的, 也有多语种的;从内容来看:有普通词典, 有百科词典, 也有专门词典。这里我们以《金山词霸 (在线) 》电子词典为主要例子来了解一下国内双语网络电子词典的特点。

从词汇量来看, 在《金山词霸 (在线) 》电子词典的首页上有这样的说明:英汉词汇516, 917条, 汉英词汇127, 933条, 汉汉词汇90, 121条。仅从词汇量上来说, 其英汉词词典应该算是一部大型辞书了;汉英词典和汉汉词典也算得上是案头词典了。《金山词霸 (在线) 》在英汉词典方面主要由其《简明英汉词典》、《现代英汉词典》和《英语相关词典 (同义词与反义词) 》组成, 汉英词典主要是《简明汉英词典》, 汉语单语词典主要由《高级汉语词典》、《国际标准汉字大字典》和《汉语相关词典》组成。

在查词方面, 普通用户查询时, 英汉词典只给出英文单词的相应中文解释, 而在注册为会员后则可以得到较为详细的解释。下面以单词book为例说明:在普通用户页面的输入栏输入单词book后, 页面上给出book的音标, 词性以及其对应的中文释义;而在注册后的专业版的输入栏中输入单词b o o k后, 页面上所给出的有关book的信息就丰富的多了, 不光有上述的音标、词性、释义, 更有例句、常用词组、习惯用语、同义词。无论是从学生学习的角度, 还是从普通的读者阅读的角度, 该电子词典所给出的义项应该说基本能够满足需要。会员 (注册用户) 还可以使用生词本、查词的历史、报告错误等功能。这里的错误报告功能从某种意义上说也是读者参与提高网络电子词典质量的一种手段。汉英和汉语的查词功能与英汉查词功能大体相仿, 这里就不再赘述。但有一点要说明的是, 即使是专业版的《金山词霸 (在线) 》没有提供其CD-ROM版的专业词库, 这一部分我们在下一小节要述及。

《金山词霸 (在线) 》没有提供发音功能, 但这是网络电子词典发展的一个趋势, 台湾英业达集团的《英语万用辞典》就提供了此功能。该电子词典还提供了《语法辞典》、《用法辞典》和《句型辞典》供查阅者参考。从语言学习的角度, 这三个辞典可以给学习者提供不小帮助。

有的网络电子词典让读者参与编写、提供新词汇, 比如说《太阳雨英汉汉英词典》。这一功能有利于及时收录新词语。还有的网络电子词典还提供诸如俚语、成语等方面词汇的查询, 但为数不多。另外有不少出版社将其出版的双语词典在发布其网站上, 供读者查阅和使用。

总的来说, 网络电子词典的可以说有以下特点:词汇量大, “与时俱进”, 读者可以参编, 不会增加读者的经济负担, 学科之间可以交叉合作, 专业面广。

1.2. 个人电脑电子词典

与网络电子词典相比较而言, 个人电脑电子词典无论在质量上, 内容上抑或在功能上都要好得多。仅以笔者手头的《金山词霸》 (2007版) 来看, 至少有以下几点是网络词典所不具备的:1) 丰富的专业词库;2) 屏幕取词功能;3) 不供依赖于网络;4) 即时发音功能。当然还有其他功能与特点, 不过这几点是主要的差异, 也是优势。这也可能是免费与非免费之间的区别吧。下面我们以《金山词霸》为例, 了解一下单机版的电子词典的主要特点。

内容丰富。内含全国名词委审定的49学科的专业名词辞书, 全本收录12本印刷版的双语词典, 72个专业词库和29种百科性的附录。这是目前单机版电子词典之最。

屏幕取词。使用屏幕取词功能时, 将鼠标移动到屏幕上任意位置的中文或英文单词或词组, 即可实现中英文互译。中英文单词的释义显示在屏幕上的浮动窗口中。在取词时可自动处理捕获英文单词的时态和词形变化, 并可根据显示内容自动调整窗口大小、文本行数等。浮动窗口中提供有快捷按钮, 分别由“查词典 (查看详细的解释、例句等) 、复制解释、网络搜索、朗读按钮、固定取词条”组成。

词典查询。对于要查询的单词提供丰富的相关信息:音标、词性、词形变化、释义、例句、词汇辨析、同义词、反义词。支持单词、短语的模糊查询, 即使用户的输入不够准确, 也能通过模糊的记忆查到单词, 当在词典中找不到输入词, 词霸会给出拼写建议。支持互联网搜索, 当某个词查不到时, 可以上网查询。查询时也可以点击相应的按钮来听所查询的单词或词组的发音。显示的汉字可以在简繁之间互换:可以用简体字显示, 也可用繁体字显示。

用户词典。在用户词典中, 可以添加原词库中没有收录的中英文单词;添加并保存用户词典后, 该词典将可以解释添加的词, 词意可以在屏幕取词的浮动窗口中显示出来。另外该电子词典还提供了生词本功能。这一功能可以使用户回过来复习所查阅过的生词, 有助于扩大词汇量。

朗读功能。《金山词霸 (2007) 》中提供了朗读功能, 共分为两种朗读, 一个是词霸界面内朗读, 一个是词霸界面外朗读。通过设定可以朗读整篇文章 (英文) , 当然由于是电子合成语音, 语调是不自然的。

同步发音。即当鼠标指向某一单词时, 浮动窗口给出释义, 同时由真人朗读这个单词, 这给英语学习者带来了极大的方便。

拷贝与打印。支持解释窗口的任意文本的拷贝, 支持打印, 只要用户按一下词霸界面中显示框上方的“打印”按钮, 就可以打印当前单词或词组及其所有解释等, 这一功能对于语言学习和语言教学能提供很大的帮助。

整本收录印刷版词典。该电子词典整本收录了多本印刷版的英汉、汉英词典, 保证了双语词典的语言质量。也正由于这一点, 对于单词的解释以及相关信息就比网络电子词典要丰富得多。

总之, 个人电脑电子词典的功能是非常丰富的, 个人电脑当中装有单机版的电子词典的比例相当高。这一类的电子词典也可以说是与时俱进的, 词典用户可以通过网络下载“补丁”来更新词库或增加新词汇。

1.3. 芯片电子词典

芯片电子词典应该说是目前在我国发展最快的一种词典类型。从语种来看, 目前以英汉与汉英词典为主。这一类词典从一开始在市场上出来就受到了欢迎, 原因很简单:词汇量大, 便于携带。前面我们提到文曲星、好易通、名人、步步高和诺亚舟等品牌的电子词典就属于这类电子词典。它们在外形上与笔记本电脑像似, 但体积要小得多, 重量轻, 确实要比纸质的双语词典便于携带。下面我们以《文曲星》 (CC-800) 为例了解一下这一类电子词典的特点。

英汉/汉英查词功能。这是这一类电子词典的主要功能, 查询的方式与上述两种电子词典没有多大差别。它也提供模糊查询功能, 回顾查询功能和生字字库等功能。这里的生字字库有点像《金山词霸》中的生词本, 是用来复习生词的。

词汇测试功能。使用这一功能时, 可以以分级词汇作为测试的对象, 也可以以生字字库中的生词作为测试对象。测试时可以选择由看中文释义来拼出英文单词, 或者由看英语单词说出中文释义。甚至可以利用记忆遗忘曲线来设定生词复习的方式和周期。这是心理学与电子词典结合的良好的例子。

网络升级功能。可以通过专门的软件与连线与电脑连接, 从网上下载专业词库或其他相关资料 (一般由生产厂商提供) 。这一功能的实现, 使芯片电子词典实用性有了很大的提高。

自建字库。有些芯片电子词典提供了这一功能, 这和上述两类词典中的用户参与编纂功能相似。但由于芯片电子词典的存储空间比较小和工作原理的不同, 这一功能实际上并不能真正发挥其效用。

整本收录印刷版词典。这是提高该类电子词典语言质量的一个有效途径, 比如诺亚舟电子词典就全本收录了《新英汉词典 (世纪版) 》。

其他功能。这一类电子词典还提供了名片、记事、计算、提醒、年历、百科小资料等功能, 但这与本文所讨论的内容无关, 这里就不详细介绍了。

综合来讲, 芯片电子词典的主要功能为查词功能。其功能与实用性也主要体现在这个方面。由于芯片电子词典是利用固化技术将预先编好的电子词典集成到一个芯片上, 因此它的更新成本要比上述两类电子词典高得多。从经济角度来说, 它是三类电子词典中最贵的, 但从便于使用的角度来说, 它是最便于携带和使用的, 单机版次之, 再次为网络电子词典。

2. 电子词典的优势

电子词典与纸质词典相比较, 其优点是不言而喻的。我们可以从下面这几个方面来看:

1) 词汇量。电子词典的词汇量, 就目前来说, 一般情况下都是比较大的, 比如一般的芯片电子词典的英语词汇量可达到20多万, 现代的信息存储技术也使这成为可能。同样的词汇量如果出现在纸质词典中, 则会大大的增加它的篇幅。

2) 修订。纸质词典修订周期长是闻名的。一个修订周期短则四五年, 长则十几年甚至几十年。而电子词典的修订周期相对而言就短得多, 个人电脑电子词典的修订周期一般为一年, 网络电子词典可以说随时在进行, 芯片电子词典的修订形式稍有不同, 由于使用了固化技术, 对已经集成的芯片本身是不能进行改动的, 但其新版本却可以不断地出来, 或者通过扩充功能升级, 一般周期也不会超过一年。

3) 综合性。电子词典易于实现综合性这一要求。比如《金山词霸》, 它收录了许多学科的专业词汇, 但只用一张C D-ROM就可以将所有的内容存储进去。网络电子词典更易于实现这一点, 相对于海量的存储介质, 要将这许多内容集中到一起是很方便的。芯片电子词典也是如此, 虽然内容在不断增加, 体积可以说是越来越小。对于纸质词典来说, 在这种情况下只能出多卷本的大部头或出专门用途的分卷词典了。

4) 易用性。在易用性方面, 电子词典无疑是优于纸质词典的, 尤其是单机版的电子词典, 其即点即译、即时发音、快速度的反应是纸质词典所无法比拟的。

5) 便于携带性。在这一点上, 芯片电子词典显示出其优越性。其他两种电子词典相对于纸质词典倒没有多少优越性可言。但随着计算机和互联网的普及, 它们的优势将日益显现, 例如, 网络电子词典是不需要携带的。

6) 人工智能。电子词典充分地利用了人工智能所提供的便利, 电子词典中是的模糊查询便是一例。这也使得电子词典与使用者之间有了互动的可能。纸质词典是无法做到这一点的。

7) 多媒体技术的应用。这是纸质词典所无法企及的一个方面。电子词典, 尤其是网络与单机版的电子词典, 可以用影音、动画、彩图等多媒体手段来形象直观地解释词汇。纸质词典至多只能使用彩色插图。

3. 电子双语词典的不足

电子词典的不足与其优点一样也是非常明显的, 概括起来有以下几个方面:

1) 网络与单机版电子词典的使用是以电脑与网络为前提的, 虽然电脑与网络在不断地普及, 但在中国其普及率相对来说是低的。有人说电子词典将很快代替纸质词典, 这在短时间内是不可能实现的, 在中国尤其如此。再说, 纸质词典也有其优势, 比如它不存在因停电或操作系统出问题而不能使用的问题。

2) 语言质量问题。这一点在网络与芯片电子词典中问题比较明显。由于一些网络词典允许读者的参与编纂, 其语言质量就不能得到保证。芯片电子词典和部分单机版电子词典由于片面地追求词汇量而简单地将几本词典组合到一起, 出现了语言上的不规范和不统一, 尤其表现在音标的标注上, 出现了英国音与美国音混杂的现象。程序中存在的问题也导致了不少实质性的错误。由于越来越多的单机版电子词典实际上就是印刷版的电子化, 语言质量问题在这一类电子词典中基本得到了解决。

3) 屏幕取词功能尚不完备。使用这项功能时, 一般只有释义, 但一般并不指明已捕获单词的使用场合或感情色彩, 也就是说没有诸如“美” (美语) 、“英” (英语) 、“俚” (俚语) 、“褒” (褒义词) 、“贬” (贬义词) 、“正式” (用在正式场合) 、“非正式” (用在非正式场合) (这些标注在芯片电子词典中大多是没有的) 等语用标注, 这是不方便读者正确使用的。另外, 屏幕取词功能对于图像中的文字是无能为力的。

4) 汉英词典的质量亟待提高。相对于英汉电子词典而言, 汉英电子词典的质量就明显逊色了。这不仅表现在英译的质量上, 更表现的所收录的汉语词汇上。比如:验货、诚信、质检人员等词汇就没有收录, 也就无从找到它们的英译了。

4. 结语

电子词典无疑有着很好的发展前景, 随着网络、计算机、信息存储技术的不断发展, 用互联网络把全世界的计算机基本联结起来也不是不可能的。网络词典将是最便于读者查考的辞书。因为:1) 它不必预先购备;2) 它提供的是最新的信息;3) 它可以和读者直接交流;4) 它的图文、声音都可以直接复制。就目前而言, 单机版与芯片电子词典在我国是主要的发展领域。单机版电子词典由于像《金山词霸》等电子词典的出现, 已经走上了比较合理的轨道, 实现了技术与专业的结合, 这无疑是有利于提高这一类电子词典的质量的。而芯片电子词典还有很长的一段路要走。虽然现在已经出现了将印刷版的词典全本收录的芯片电子词典, 但大多仍然是将几本词典进行简单地组合。如果这一问题得不到解决, 芯片电子词典的前景是令人担忧的。

参考文献

[1] http://www.iciba.net/

[2] http://www.englishfree.com.tw/gb/dictionary/

[3] http://sunrain.net/index_c.shtml

[4] http://www.hrexam.com/dictionary.htm

[5]金山词霸2003版.金山软件股份公司.1996-2002

[6]文曲星 (CC-800) .北京金远见电脑技术公司

[7]章宜华, 黄建华.电子词典的现状与发展趋势.辞书研究.1996年06期

语境理论观照下的双语词典释义 篇8

释义是词典的基本内容, 是词典编纂的核心部分, 同时也是词典研究的重要切入口。在总结前人研究成果的基础上, 本文立足于吴建平的语义类型五分说, 从语境理论的角度探讨双语词典的释义。我们认为, 双语词典的性质是两套语言符号系统的对应, 因此其释义必然受到语境的影响和制约。既然始终无法绕开语境这个棘手的问题, 我们就从系统功能语言学和关联理论的语境观入手, 探讨将语境理论融入双语词典释义。

二、双语词典释义研究综述

释义是决定词典质量至关重要的因素。正因为如此, 这个被人们实践并讨论大约已有25个世纪的话题历久弥新, 至今仍然受到哲学家、语言学家和词典学家的关注。以国内为例, 宋新妮和荣永昌就双语词典在释义中经常出现的问题, 提出了在释义中应当遵循的准则, 并结合实例说明在具体实践中的应用。段冬生和冯淑贤探讨过如何进行词典释义, 并罗列了如“语词对释式”、“定义式”、“描写和说明式”、“图表式”等各种各样的释义方式。黄芳分析了目前各大词典中一对多等值词释义方式存在的信息冗余、准确性不足、词类不一致等五个问题, 并提出了双语同义释义方式要解决存在问题需注意的原则和方法。

词典释义研究包括实践和理论两方面。在理论方面, 近年来国内也有不少学者进行了探索。如魏向清基于现代多元本质论和认知系统论对双语词典译义问题进行了创新性的思考。而王静和娄红立则通过探讨对等翻译理论、语义学理论及双语词典学核心问题对双语词典释义实践的影响, 来说明双语词典释义的文化心理认知, 以此提高双语词典的释义质量。诚如林玫所述, 双语词典的释义研究在国内外都已取得一定的成果。

三、语义类型五分说

国内外双语词典释义研究的一大成果就是人们越发意识到了双语词典的释义本质是给源语词目提供等值的目的语词汇, 即选用与词条相对应的目的语词汇解释其意义。然而, 仅仅意识到这个本质还不够, 因为双语词典的释义不是逐字逐句地翻译原语的释文, 也不同于一般的文学翻译, 而是一个找“对应词”的过程, 此外还要考虑不同语言及文化的差异, 所以寻找对应词的过程有时是异常困难的。正如宋新妮和荣永昌所指出的, 双语词典在释义时, 不仅要照顾源语的各种含义, 如内涵义、外延义、文化义、以及各种附加义, 而且还要顾及释义的概括性与区分性:既要使词目所代表的对象区分对立于其他词目所代表的对象, 又要明白无误地概括同类事物的特征。

为解决这个难题, 吴建平从符号学角度出发, 率先提出语义类型五分说, 认为双语词典的释义是通过为原语符号提供对应的译语符号进行的, 而要提供对应的译语符号就必须使之在概念义、附加义、语法义、文化义和搭配义方面与原语符号的信息相对应。

在语义类型五分说中, 概念义是语言符号意义的核心部分, 是以语言概念为基础的意义, 是一种经过高度抽象概括而具有共性的东西。附加义由感情色彩、修辞色彩和文体色彩构成:感情色彩指词汇单位的褒贬色彩, 修辞色彩指词汇单位的比喻、委婉、戏谑、讽刺等色彩, 文体色彩则指词汇单位的时间 (例如古词、旧词等) 、地域 (例如方言词等) 、使用层次 (例如口语词、俚语词、粗痞词等) 、专业 (例如数、理、化等学科和行业方面的术语专名等) 等方面的色彩。语法义指词性、词汇单位的形态变化、数的范畴、句法功能等。文化义指词汇单位所具有的物质文化和精神文化方面的含义。搭配义指的是词汇单位的横向组合关系。

四、语境理论

作为语言学概念的语境最早是由德国语言学家Wegener提出来的。Wegener告诉我们, 语言的意义是通过实际使用而产生的, 语言的意义也只有根据语境才能确定。然而, Wegener的语境思想在当时的语言学界并没有引起很大反响, 直到英籍波兰人类学家B.Malinowski分别于1923年和1935年提出了“情景语境”和“文化语境”这一对概念, 语境研究才得以进入一个新的高度。

1、系统功能语言学语境观

在国外语言学界, 研究语境最多的是社会语言学流派, 而叙述这一流派的观点还须追述到伦敦功能学派。伦敦学派领袖, J.R.Firth最早接受Malinowski语境思想, 主张把语境研究的重点放在情景语境上, 认为语境既包括语言因素又包括情景因素。

Halliday继承了Firth的理论, 提出了“语域” (register) 概念并将其界定为“语言的功能变体”。以Halliday为代表的系统功能语言学家注重意义和功能的研究。他们认为, 语境可大致分为文化语境和情景语境两种。文化语境主要指人类在特定的文化背景中的行为模式, 这种模式制约语篇的语类结构 (generic structure) 等带有宏观意义的语义结构。情景语境指的是与语言交际行为直接相关的话语范围 (field of discourse) 、话语基调 (mode of discourse) 和话语方式 (tenor of discourse) 三种因素。话语范围指话题以及与话题有关的活动;话语方式指话语活动所选择的交流渠道, 即口头的还是书面的;话语基调指讲话人和听话人之间的社会关系以及讲话人的交际目的。

2、观照双语词典释义

我们认为, 上文论及的语义类型五分说基本涵盖了系统功能语言学语境观的构成要素 (图1) 。语义类型五分说中的文化义所反映出来的词汇单位所具有的物质文化和精神文化方面的含义, 构成了系统功能语言学语境观中的文化语境。附加义中的文体色彩构成了话语方式。附加义及其所体现的感情色彩、修辞色彩构成了话语基调。概念义、语法义和搭配义涉及语言符号意义的核心部分、词性、词汇单位的形态变化、数的范畴、句法功能以及词汇单位的横向组合关系, 构成了话语范围。

语义类型五分说能够帮助我们在选择“对应词”的过程中做出有效的判断, 但是如果离开了语境这个决定因素, 意义将成为难以捉摸的东西。正如哈特曼曾说过的:“等值概念不是固定、单一的对应关系, 而是基于一些代码转换策略的变动的、双向的过程。这些策略取决于语篇的特点、译者或词典编纂者的双语能力以及所追求的目的”。

如今, 越来越多的语言学家认为特定的语言交际环境决定语词的特定意义。朱永生指出:“任何一部词典的编纂都是与功能主义的语境理论相结合的, 问题是结合的程度如何, 效果如何。”可见, 词典释义与语境理论的结合是一个必然的趋势。作为一种比较完善的语境理论, 系统功能语言学语境观和我们的语义类型五分说基本吻合, 因此可以作为促成这一结合的媒介。

当然, 系统功能语言学语境观也有其不足之处。刘云霞指出, 系统功能语言学语境观“未能全面刻画出语境的动态本质”。而双语词典的释义如果要全方位地反映源语与目的语的异同, 追求在功能、语义、语用、文化和效应等方面的动态等值, 就必须在语境动态性方面找到相应的理论支撑。

3、关联理论动态语境观

为了弥补系统功能语言学语境观在动态性方面的不足, 我们可以采纳关联理论关于“认知语境”的论述。关联理论从认知科学的角度阐释人类的语言交际行为, 认为“语境是一种心理构建 (psychological construct) , 是听话者对世界的一系列假设的一个子集”。关联理论语境观的独到之处在于它提出了不同于所谓“传统语境”的“认知语境”。认知语境是以命题、知识草案和心理图式为基本单位的动态语境观。

因此, 从系统功能语言学和关联理论的语境观着手。我们就能够实现双语词典释义与语境理论的结合。

五、结语

双语心理词典 篇9

1 构建专科双语语料库的必要性

现代词典编纂工作, 尤其是立目和释义, 很大程度上得益于语料库的发展。章宜华 (2004:134) 曾指出传统的选词立目方法的不足, “在词典 (尤其是学习词典、多功能词典等具有很强针对性的词典) 的编写过程中, 用传统的方法很难确定词目词的选择范围, 往往是顾此失彼, 收词难以系统、全面。”语料库可以统计词频并生成单词列表, 为词典收词提供重要标准, 还提供词目词的对等词和大量真实例句, 作为词目词义项归纳和划分的依据。专科双语语料库的缺乏正是制约双语专科词典发展的瓶颈, 双语专科词典在立目和释义上的缺陷都可以借助专科双语语料库得到改善。

普通语料库中专业术语的词频过低, 如机械术语milling machine (铣床) , 在规模为4.1亿词的美国当代英语语料库中查询, 仅有41次。术语词频的不足导致了词典编纂工作中的三个问题, 首先, 无法在大量语料的基础上进行分析, 词条编纂的质量难以保证;第二, 术语之间频率上的高低差异不显著, 难以确定是否收录;第三, 对于既有普通义又有专业义的词语, 专业义容易湮没在语料库中。例如, lead在机械专业中表示“导程”, 同时, 它也具有普通义, 表示“引导, 领导, 导致”。在语料库显示的例句中, 前一百条例句几乎看不到体现该词专业义的例句 (http://corpus.byu.edu/coca/) 。而使用双语专科语料库, 术语的出现频率以及词语专业义的频率都将显著高于普通双语语料库, 上述三个问题就可以解决。

双语专科词典的释义存在错误, 原因之一就是词典学家对某些专业术语不够熟悉, 容易误译或无法检查出翻译错误。若专科双语语料库提供目的语参考语料, 词典学家就可以借助目的语语料勘察源语翻译成目的语时是否存在翻译错误。

比起普通语料库的单词列表, 专科双语语料库生成的单词列表具有显著优势, 生成的单词列表中不仅有术语, 也有普通科技词汇。据章宜华和郭启平 (章宜华, 2009) 对全国30多所大专院校120余名学生进行的调查, 71%的人抱怨, 双语专科词典只有专业术语和专业义项, 不提供科技语言词汇和普通义项, 更不用说例证和和科技外语词汇 (动词、名词、功能词和形容词等) 的用法信息了。调查结果说明用户渴望有含普通科技词汇和提供普通义项的双语专科词典, 而专科双语语料库正好能提供相关信息。

在国内外所建设的语料库中, 鲜见专科语料库。王克非 (2004) 介绍他所在的团队正在建立的双语语料库时, 提到建立专科子语料库的计划, 但该语料库建设暂缓, 尚未实现。利用语料天涯的索引页, 只能找到一个专科双语平行语料库, 即英汉双语商业平行语料库 (http://www.luweixmu.com/ec-corpus/) , 但只有715句平行句。专科双语语料库的数量有待增加, 规模有待扩大。

网络手段也无法满足专科词典的编纂需求, 网络上的信息良莠不齐, 常用的搜索引擎仅提供很少的上下文, 要查询更多上下文, 只能点击进入网页寻找, 费时费力。双语专科语料库可以保证信息质量, 并方便查询上下文信息。

综上, 亟需建立双语专科语料库解决专科双语词典的编纂问题。

2 专科双语语料库的构建设想

2.1 语料库的构成

入库语料来源的专业性和翻译的质量都要严格要求。专科双语语料库应该由几个子语料库构成, 包括两个平行子语料库和两个单语语料库。Sylviane Granger (2010) 提到, 对比语言学的研究者和翻译研究者对于平行语料库的定义是不同的, 此处平行语料库指包含一种语言的源文本和另一种语言的对应翻译文本的语料库。这里的两个子平行语料库应该是两个单向双语语料库, 一个包含源汉语文本和对应的英语翻译, 另一个包含源英语文本和对应的汉语翻译。这是为了保证词频统计更为全面, 因为高频的英语词汇, 其汉语对等词或翻译不一定也是高频。至于两个单语语料库, 则是作为参照, 用来核查英汉和汉英语料之间的翻译是否正确。用源语言作参照, 便于编者核查专业术语翻译的质量。两个单语语料库可以在子平行语料库提供的源语料的基础上, 采集更多专科语料, 扩大规模, 构建而成。除上述子库外, 语料库学家和词典学家也可参照现有的普通英语单语语料库和现有的普通汉语单语语料库, 因为即使是专科双语语料库的单词列表, 也不可避免的含有“噪音词”, 如英文高频词表中可能含that, and等, 中文高频词表中可能含“是, 的”等, 现有普通语料库的单词列表中也会有这些“噪音词”, 通过对比两个单词列表, 可以剔除“噪音词”, 各子语料库关系见图1。

(1) 核查汉英翻译质量; (2) 核查英汉翻译质量; (3) 对比两库高频词; (4) 剔出噪音词如of, that; (5) 剔除噪音词如“是, 的”。

2.2 语料库的功能

为了实现辅助专科双语词典立目, 专科双语语料库应该具有词频统计和单词列表功能。除此之外, 语料库还应该具有KWIC功能, 检索搭配功能, 和义项定位功能。徐树德, 李气纠 (2010) 发现, “在我国高层次专业期刊英文摘要和汉英词典等工具书中, 因英文词序不当而造成的专业术语误译占有相当大的比例。其主要表现是完全按照汉语的词序组织英文译文, 逐字死译, 对号入座。”对这种现象, 徐, 李两位作者在他们的词典中加入了词序辨析项。笔者十分赞同, 并且认为还可在词典中增加相关词语搭配和共现信息, 比如名词和介词的搭配, 两个专业术语如何构成第三个更为具体的专业术语。专科双语语料库作为后备支持, 就需要有检索搭配的功能和KWIC的功能。

至于义项定位功能, 笔者认为可以对例句进行初步划分。虽然使用双语专科语料库, 词语的专业义出现频率会显著提高。然而, 语料库瞬间把成千上万的例句呈现在词典编纂者面前, 词典编纂者归纳整理工作难度极大。“囿于传统印刷版词典的篇幅, 编者们必须精挑细选, 仔细斟酌, 从成千上万个句子中选出那么几个最具有代表性、又最能够表达词汇用法的句子放到词典里去”郭启新 (2001) 。

3 结论

本文分析了现有专科双语词典的立目和释义存在不足的原因, 认为只有构建一个专科双语语料库才能够有效弥补这些缺陷, 该语料库应该由四个子库构成, 互为参照, 同时, 词典编纂工作要求其具有词频统计、搭配检索、义项定位等功能。

参考文献

[1]Sylviane Granger.Comparable and Translation Corpora in Cross-linguistic Research:Design, Analysis and Applications[J].当代外语研究.2010 (2) :14-21, 31.

[2]陈建生.语料库, 专门用途英语与体育英语语料库建设[J].广州体育学院学报.2009 (5) :111-115.

[3]陈明耀.ESP与语料库建设[J].外语研究, 2000 (2) :60-61.

[4]王克非.新型双语对应语料库的设计和构建[J].中国翻译, 2004 (6) :75-77

[5]王毅成.双语专科词典的收词立目和释义[J].辞书研究, 2003 (3) :63-73

[6]徐树德, 李气纠.论多功能汉英专科词典的编纂[J].辞书研究, 2010 (5) :42-47.

[7]张济华.基于语料库的大学基础阶段ESP教学探讨[J].外语电化教学, 2009 (7) :38-42.

[8]章宜华.计算词典学与新型词典[M].上海:上海辞书出版社, 2004.

双语心理词典 篇10

在机器翻译不断发展中, 双语平行语料库起着至关重要的作用, 平行语料库的质量从根本上决定了机器翻译的质量。而构建大型的数量在百万级上的双语平行语料库仅仅依靠人工对齐基本上是不可能完成的任务, 在这种情况下, 句对齐的方法应运而生。传统的双语句子对齐方法主要分为2类:基于词汇的方法和基于长度的方法[1,2]。

基于词汇的方法利用“源文句子与译文句子在语料中的位置大致相同”这个特点, 搜索所有可能的对齐句对。这种算法的不足之处在于搜索空间比较大, 获得词汇对应信息的代价比较高是基于词汇信息方法的最大问题。为了解决该问题, 算法中不得不减少所考虑的词汇对应信息的范围。这又会导致所计算的信息不够准确, 内容不够充分, 从而降低精度。

基于长度的句子对齐方法的根本思想认为, 源语与译文句子的长度越为接近, 其就越有可能成为对译的句对。这种算法的不足之处在于很有可能在某种语言丢失一句的情况下, 因为下一句次或字母数量相同, 而造成连续的错误对齐。或者, 对于某种语言, 如果源文与译文之间单词数出现了较大的偏离, 也同样会造成错误对齐。所以, 单纯的基于长度的算法鲁棒性差, 而且由于忽视了词本身的特征而容易造成根本不相关的结果。

这2类方法由于自身的缺陷, 单独用在句对齐中的情况已经很少见到。现在主流的方法都是将两者结合, 利用混合策略来进行句对齐[3,4,5]。在研究维汉机器翻译的过程中, 本文对文献[5]提出的基于词典和句子长度及位置信息的句对齐方法的一种改进, 使其在针对某一指定领域的维汉双语句对的效率得到了提高。

1基于句长度及空间分布的多策略融合句对齐技术

为了消除单纯基于词汇和基于长度的句对齐方法所存在的缺陷, 研究融合2种对齐方法的混合策略成为一种新的思路, 如何在长度信息的基础上有效利用词汇信息以提高句对齐精度。下面主要介绍文献[5]中提出的基于词典下的长度和位置信息的双语句子对齐方双语句子对齐算法:

对于互译的文本ST, 有如下的对齐评价函数:

Ρ[i, j]= (1/SΙΜ) +α (Ρu[i, j]-Ρ0) 2+ (Ρ1[i, j]-Ρ0) 2+α (Ρd[i, j]-Ρ0) 2

P[i, j]的值小于某一特定阈值时的锚点, 就构成了候选锚点集, 再利用计算SIM的值对进行相似度过滤, 组成最后的对齐锚点。

该算法的不足:

(1) 形式评价函数中α的实际在较长文本中权重系数α的惩罚作用已经很弱, 本文所做的实验中, 当文本句子长度超过500以后, 句对齐的结果比300句以内要差, 因为文本的长度越大, 导致越不敏感。

(2) 文献中的形式评价函数对于较长文本中句对的惩罚具有一定的滞后性, 尤其当字典在需要对齐的句对中没有命中相关词时, 这种滞后性更为突出。这样导致1∶1的句对齐的锚点分布不均匀, 丢失了部分锚点, 而且惩罚的滞后性从一定程度上也影响了结果的正确性。为此要找到一个更为合理的参数, 使锚点的分布更为均匀一些。

2改进后的对齐算法及其实现

针对文献[5]提到的方法的不足, 本文对其形式评价函数进行了如下改进:

Ρ1[i, j]= (1/SΙΜ) + (Ρu[i, j]-Ρ0) 2+ (Ρ1[i, j]-Ρ0) + (Ρd[i, j]-Ρ0) 2

式中:P[i, j]表示句对{S1, Tj}的整体对齐距离函数值, SIM为2个句子的相似度:

SΙΜ=L|Μatch (S) |+L|Μatch (Τ) |L|S|+L|Τ|

式中:所有元素的字节长度和用L| |来表示;Match (S/T) 代表 (字典) 译文中出现在汉语/维语句子中的维语/汉语单词;P1[i, j]=LSi/LTj, P1[i, j]为对应句长度之比;Pu[i, j]=USi/UTj, Pu[i, j]为对应上文部分长度之比;Pd[i, j]=DSi/DTj, Pd[i, j]为对应下文部分长度之比;S文本中的第i句用Si来表示, T文本中的第jtj用来表示, S文本的总长度用LS来表示, T文本的总长度用LT来表示, Si句的长度用LSi来表示, Tj句的长度用表示LTj来表示, Si句的上半部分的长度用USi来表示, Tj句的上半部分的长度用UTj来表示, Si句的下半部分的长度用DSi来表示, Tj句的下半部分的长度用DTj来表示;本文直接将α去掉, 同时对P0参数进行改进:Ρ0=EΤ (LS/LΤ) , 其中ET为根据3 886对维汉族双语平行的法律文献计算得来的维汉句长的长度比的期望值, 此期望值可以使P0更加接近于法律文献类的真实值[6,7,8], 起到平滑数据的作用, 有效避免个别噪声数据引起的过大的偏差, 同时使之能更好的适应较长的文本[9,10]。这样就获得了针对互译的维汉文本句对齐的形式评价函数的公式。

利用此形式评价函数计算各个句对的值之后, 通过对齐阈值的过滤后得到锚点集, 然后在此锚点集中, 对于大于相似度阈值的句对作为对齐锚点, 所有的锚点点集合将双语文本分割为句对齐的文本。该算法的时间复杂度为O (m*n) 。以下是算法实现:

(1) 初始化, 默认文本的第一句和最后一句是对齐的;

(2) 读入维汉双向词典和维汉待对齐文本;

(3) 以“。”、“?”、“;”作为识别句子边界的条件, 同时对各个句子进行编号;

(4) 对于每个维语句子, 从第一句开始, 计算其与每个中文句子的对齐函数值;

(5) 根据对齐阈值过滤, 取出最小值, 如果最小值有相等的情况, 则选取离上次锚点距离最近的句对, 进行步骤 (6) ;如果没有值落进阈值内, 则维语句子编号加1, 进行步骤 (4) ;

(6) 如果相似度大于相似度阈值, 则将该句对作为对齐锚点, 同时限制下一个锚点搜索区域, 进行步骤 ( 4) ;如果搜索区域为空, 进行步骤 (7) ;

(7) 输出对齐后的文本, 结束。

3实验与分析

实验采用3组维汉互译的法律文献作为本文的测试集, 测试集信息如表1所示。

下面利用该测试集对两种算法都进行了测试, 对齐结果如表2所示。

在3组实验中, 文献的采用的方法的准确率和召回率平均值分别为82.2%, 78.6%。本文采用的方法的准确率和召回率平均值分别为87.1%, 82.9%。由此可以看出, 本文提出的方法在针对维汉互译的文本准确率和召回率要更高一些。

以第3组实验为例, 2组实验各获得句珠 (1∶1) 的个数分别为340个和397个。第3组测试集的2种方法得到的锚点分布如图1、图2所示。

图1中锚点的分布在各个局部呈现出有规律的集中, 从密集到稀疏再到密集, 以此循环下去, 这说明文献中原来提出的对齐评价函数中的权重系数对于长文本中锚点的选取惩罚灵敏度不高, 导致原本该在稀疏区域进行对齐的部分句对没有对齐, 而惩罚度的作用稍后才能体现出来, 这样也会导致一部分的对齐结果错误率升高。

图2中可以看出锚点较图1的分布更为均匀。这就验证了改进后的对于维汉文本数据的平滑总用, 从一定程度上提高了锚点选取的惩罚灵敏度, 因此在准确率上得到了提高。

实验结果的准确率还与以下3点有关系:

(1) 词典的命中率, 由于目前还没有一款比较好的维汉双语词典, 这也是制约本文实验的一个重要的因素, 基于此, 本文选取了法律文献类的文本作为实验材料。

(2) 选取的测试集的范围比较狭窄, 这样文本中出现的词汇也相对比较集中, 维汉双向字典的命中率较高, 从而使对齐评价函数的精确度也得到提高, 提高了锚点选取的准确率。

(3) 选取的测试集比较规范, 提高了对句子进行编号时句子边界的选取的准确度。

4结语

本文对基于长度和位置信息的双语句子对齐方法中, 针对较长文本的维汉双语对齐中的不足之处进行了改进, 给出了改进算法, 同时进行了实验验证。从实验结果看, 本文的对齐方法很好的解决了在某一指定领域内的维汉双语文本的对齐问题。

上一篇:调研探究下一篇:第三方营销概念