摘要: 随着全球化的推进,世界各国在经济、科技、文化等领域的联系日益紧密,相互间的影响也在不断加深。在文化领域,近年来以英语为代表的拼音文字的影响力不断扩大,我们可以看到以汉字为代表的表意文字出现了拼音化的趋势;同时随着中国综合国力的不断提高,在世界范围内的影响力的扩大,英文中也出现了具有汉语特色的句型,这一现象的出现使得我们不得不承认以这两种文字开始碰撞、交融了。本文希望通过对两种文字在信息传递方面的比较,能够比较明晰的指出两种文字各自所具有的优劣势。
关键词:拼音文字 表意文字 差异 信息传递
首先我们来看两则关于汉字与英文单词总量的消息,“据设在美国圣迭戈市的全球语言监测组织说,截至2006年3月21日,英语单词总量为98.8968万个。……但受过教育的以英语为母语的人平均使用的词语仅在2.4万个到3万个之间,即便是英国大文豪莎士比亚使用过的单词也不过2.4万个,其中还包括他自创的1700个单词。”[1]第二则消息是“2001年9月26日,新华社公布了最新的统计信息,目前汉字的总数已经超过了8万,而常用的只有3500字。”[2]这两则消息虽然在时间跨度上有些距离,但我们似乎仍旧可以从两者在数量上的巨大差距中推断出汉字在信息传递方面或者更准确的说在信息量大小方面比英文更具优势。
举例来说,“带”字在《现代汉语规范词典》中有12个解释,其中作为名词解释的有3种,作为动词解释的有9种[3],而在英语中与之对应的“bring”这一动词在《朗文当代英语辞典》只有6种解释(不包括对带有“bring”的词组的解释)[4];再比如“花”字在《现代汉语规范词典》中作为名词的解释有13种之多[5],而与之对应的英文单词“flower”在《朗文当代英语辞典》中作为名词的解释只有4种[6],尽管只是做了一组动词和一组名词在信息携带量上的比较,也许会存在局限性,但我们依然可以从中看出汉字在传递信息方面存在的优势。
另外,材料中也有这样一个现象,那就是受过教育的以英语为母语的人平均使用的词语仅在2.4万个到3万个之间, 而常用的中国汉字只有3500个,换句话也就是说一个英国人需要掌握2.5万左右的英文单词才能够比较好的完成交流、工作、生活、学习的等各项活动,而一个中国人只须掌握3500字就可以完成类似的活动,达到传递信息的目的。 从这一点上来看,也证明了汉字在传递信息方面所具有的优势。
第二点,汉字作为一种古老的表意文字,其携带的文化信息的量也是英文不可比拟的。张文轩在《汉字贮存文化信息的特殊功能》一文中提到“汉字在贮存文化信息方面有双倍的能力。一方面,同拼音文字一样,有写成文献的功能,可给人人们展示古今中外绚丽多彩的文化现象;另一方面,它又有自身的特殊形体优势,可表现其主人华夏民族在历史舞台上的种种生活面貌和心态,而这一点正是任何纯表音文字所做不到的。”[7]举例来说,国家的“国”字,原用会意字“或”,表明了国家的主要成分是人口(口)、土地(口下一横象征土地)和武装(戈),后来“或”字外面加了个大方框,从而强调了国家是一个具有固定疆土的。从这一演变的过程中,我们不难看出“国家”这一概念在人们的意识里不断演进、不断的具体化,人们在对“国家”这一概念的认识上也不断加深。从这个例子中我们可以看出,汉字传递了人们思想认识方面的变化,甚至可以说它向我们展示了历史的变迁。
表意文字渊源于象形文字,而象形文字从它诞生之日起就与世间万物有着千丝万缕的联系,这就使得表意文字的代表——汉字天然的就具备了象形文字的一些特点,于是乎我们就可以说从汉字的诞生之日起在携带信息方面就比英文有了优势。例如:一个“火”字,我们可以从它身上比较直观的得到关于火的形态特点以及它所具备的含义这两个信息,而英文中与之相对应的“fire” ,除了能够传递“火”这样一个意思以外,我们很难从中找出更多的信息。不过我们也应该注意到英语中存在的一些外来词,比如说来自希腊文字的单词或者说来自拉丁文的单词,这样的英文单词当然会具有比原生性的英文单词更多的信息,因为他们不仅可以像那些原生性的英文单词一样告诉人们“我的意思是什么”,而且还能够告诉人们“我从哪里来”或者告诉人们“我是怎么被创造出来的”,然而英文中的外来词所能够传递的这一类型的信息几乎每个汉字都有,所以从单个字所蕴含的信息量上来看,汉字仍然是占优势的。
第三点,大多数汉字可以集多种词性于一体,并且没有单复数、人称等的限制,比如说“戒”字就同时具备了动词和名词两种词性,“火”字具有动词、副词、名词、形容词等词性,几乎是集所有词性于一身了。汉字的这一特点为单个汉字能够提供比单个英文单词更多的信息提供了保障,或者说这一特点是汉字能够提供比英文单词更多信息的原因之一。反观英文单词,它们有严格的单复数、人称、词性等的限制,这就使得英文单词在表达意思方面不如汉字来得那么灵活、多变,从这一意义上来说,英文单词在携带信息量方面又略逊于汉字了。
第四点,计算机界有一个用来描述文字系统携带信息量大小的概念叫信息熵,它是数学方法和语言文字学的结合,通过数学公式的计算把每一个文字系统的携带信息量用具体数值呈现出来,这一概念从另一个层面或者说从另一个侧面反映了文字的信息量。
举例来说:50年代,现代信息论介绍到中国;70年代,中国科学家完成了中文汉字字符信息熵的初步计算工作,80年代又做了更完整的计算。
他们的基本方法是:逐渐扩大汉字容量,根据随机试验结果的各种概率,使用公式:“H = - E(n, r=1)LOG(2)P(r)”[8] 来计算熵值H。
公式中,H 是静态信息熵,E(n, r=1)是从r 到n 个结果的和,LOG(2)是以2为底的对数,P(r)是第r 个结果的概率。这个公式是基本公式的一般静态方法,求到的数值是静态平均信息熵。
通过该公式的计算,联合国五种工作语言文字的信息熵数值如下:
“法文:3.98(bit) ;西班牙文:4.01(bit);英文:4.03(bit);俄文:4.35(bit);中文:9.65(bit)”[9]
从这组数据的对比中,我们可以看出汉字系统的信息熵远远高于英文文字系统,进一步说明了汉字在携带信息量方面的优越性。
第五点,汉字在意思表达上面存在着一定的模糊性,这也为汉字具有更多的信息提供了条件。例如:汉字“鸡”就包括了母鸡和公鸡两种意思,而英文中则需要用“cock”和“hen”这两个单词来具体指出是什么性别的鸡。这种在意思表达上的模糊使得一个汉字有时要表达包含了一个类别的信息,而英文单词在表达上的精确性,使得很多单词的词义显得十分的单一,不如汉字在信息量方面有更大的包容性。另外,就文字的音、形、义三个构成要素来说,汉字的义和形结合在一起,没有分开,义与形关联而不是与音关联;英文其义直接与音相联,形只是用来表音。进一步分析,英文由26个字母构成,而这26个字母“不仅使形和声分离或抽象出来,而且使一切语义和字母的声音分割,除了毫无语义的字母和毫无语义的声音的联系之外什么也没有了。”[10]汉字的构字部件(包括偏旁部首)总共有215个,大部分仍然是表意的。所以从构成文字的部件以及文字的形、音、义这两方面来看汉字在信息传递上更具直观性,同时在信息量的携带方面也比英文有了优势。
通过上述几方面的比较,我们从中可以看出汉字不仅具备了文字所拥有的一般功能,而且具备了丰富的文化内涵,携带着大量的文化信息,而这一点是英文单词所不具备的;另外,从整体数量上来看,整个汉字字库的总数远远少于英文单词的数量,从这一对比中我们可以比较直观的看出汉字在传递信息上的优势。 第三点,单个汉字受词性、单复数、人称等的限制远远的小于英文单词,这也就使得单个汉字比单个英文单词有了更多的信息优势。第四点,通过精确的数学运算,从另一个侧面反映了汉字携带信息量方面存在着优越性。
但有人也提出了以下这些例子来进行反驳:
例一:“黛玉见她无精打采的去了,又见眼上好似有哭泣之状,大非往日可比。 Daiyu saw that she looked in low spirits, quite unlike her usual self, and had been crying.(杨宪益等译)”[11]
表一:
| .林海雪原 | Lord Jim | Industrial Revolution |
中文总字数 | 407,000 | 262,000 | 1148 |
印刷面积cm | 86,750.2 | 59,784.3 | 240 |
英文总词数 | 236,060 | 150,900 | 712 |
印刷面积c㎡ | 119,715.2 | 81,151.2 | 383 |
表二:
比较方式 | 邓小平 | 红楼梦 | Vanity Fair | Glory and the Dream |
| 汉语/英语 | 汉语/英语 | 汉语/英语 | 汉语/英语 |
字字对比 | 39 /27 | 28 /17 | 30 /18 | 46/ 30 |
词词对比 | 24 /23 | 17 /15 | 19 /17 | 23 /22 |
(注:表一、表二来源同例一)
上述例子是从宏观和微观两个角度对汉字信息量大于英文信息量提出了反驳。从这些例子中,我们可以看出同样阐述一个意思英文所需的单词数、字数、以及所需的版面大小远小于汉字的词数、字数、版面大小,这是不是就说明了汉字的信息量不如英文单词多呢?我想可以这样解释这一现象。
英语文字系统中一部分英文单词是与单个汉字一一对应的,比如说名词类的“你”、“我”、“他”就分别与英文中的“you”、“I”、“he”对应,而另一部分英文单词则需要包含两个甚至两个以上的字组成的词来解释,比如英文单词“contrary”翻译成中文则需要两个字“反对”,并且正是由于单个汉字信息量太大,单独使用会出现意思表达模糊或者有着很大的不确定性,所以单个汉字只有在于其它汉字搭配、组合之后才能够明确的表达出其在句中所应该表现的意思,比如说“反”字具有“反对、反面”等意思,我们为了使句子意思明确,不能单用一个“反”字来表达,只能把“反”字和“对”字组合在一起在句中出现。而且汉子有严格的字、词之分使得有些字不能被单独拿出来使用,再加上汉字中能够被独立运用得单纯词也不多,并且“英语给出词的层次,是为了分出词类,而分清词类,从某种意义上是为了造句的需要。句子各个成分,如主语、宾语、谓语、定语和状语需要有相应的词类:名词、动词、形容词和副词,也就是说英语名、动、形的词类划分和和主、谓、宾的语句法成分存在一对一的规律性对应关系。”[12]从这一层意义上来说,英、汉两种文字的构词方式的不同导致了两者对于表达同一个意思的句子所需要的字、词数不同,并不能表示汉字在传递信息量方面比英文差。我想这也许就可以解释为什么在表达同一句话的时候汉语文章的字数、词数会多于英文。
以汉字为代表的表意文字与以英文为代表的表音文字在信息携带量或者说信息传递方面孰优孰劣,通过上述说理论证可以得出结论,汉字的博大精深很是值得我们为之骄傲与自豪,汉字作为中华文化的传承者,中华文明的记录者、阐述者,对中华民族来说是一笔莫大的财富,不过我们也不得不正视这样一个现状:汉字正面临着英文的巨大冲击,出现了拼音化的趋势,这让人不免对汉字未来的命运担忧,不管怎样我们必须要保卫汉字,因为当汉字消失的那天来临的时候,也是中华文化消失殆尽的日子的降临。
参考文献:1.《兰州大学学报》1994年04期——《汉字贮存文化信息的特殊功能》作者:张文轩
2.《说文解字》
3.《语言学导论》——熊学亮
[1] http://news.sohu.com/20060414/n242812327.shtml 《英语单词总量今夏将突破百万》
[2] http://news.sina.com.cn/cl/2001-09-26/366542.html 《总数有九万多常用只有三千五 最新汉字统计出炉》
[3] 《现代汉语规范词典》2004年1月第一版 P.256
[4] 《朗文当代英语辞典》2004年10月第一版 P.183
[5] 同(3)P.555
[6] 同(4) P.616
[7] 《兰州大学学报》1994年04期——《汉字贮存文化信息的特殊功能》作者:张文轩
[8] 《从信息熵角度看中文软件和中文信息业的发展(上) 》(作者—米阿仑) 原载《ChinaByte》(1999-07-10)
[9] 《从信息熵角度看中文软件和中文信息业的发展(上) 》(作者—米阿仑) 原载《ChinaByte》(1999-07-10)
[10] 何道宽译:《麦克卢汉精粹》,南京大学出版社2000年10月第1版,第42页。
[11] 《语言学导论——课件1》第32张幻灯片
[12] 语言学导论课件—《形态传》第22张PPT