ZT转载趣文:刘明华:唐人最爱说“不”

来源: 2014-11-23 15:23:15 [博客] [旧帖] [给我悄悄话] 本文已被阅读:

http://www.literature.org.cn/Article.aspx?id=54539

原载:《中国典籍与文化》1999年04期




唐人最爱说“不”——《全唐诗》软件字频检索如是说


刘明华



有志唐诗研究和对唐诗感兴趣的读者,可能产生过对某一语词的使用频率的关注,即一个语词在一个诗人的作品中究竟出现过多少次,进而关心某个词在唐诗中的使用情况。对前一个问题,想的人肯定要多一些,一些别集的“引得”也为人们提供了方便。而对后一个问题,则是一个不大敢想的问题。面对5万余首唐诗,要统计某一个字或词的使用情况,谈何容易!再就是,在学习和写作中,我们常遇到这样的尴尬,对一句诗,尤其是不太熟悉的作品,要么是记不全,要么是记不起作者,要征引时十分不便。那时,我们就感叹,有一个方便的检索系统是多么的好啊!

就在我们感叹时,一批文化工作者早就在埋头苦干了。商务印书馆国际有限公司研制出版,北京灵坷精艺电子技术有限公司制作的“中华文明系列”《全唐诗》(电子版)的出版,给我们带来了惊喜!

这个大型软件对《全唐诗》的检索极为方便。读者可以按卷数、诗人、篇名、体裁进行检索。要而言之,读者可以根据自己掌握的有限的条件进行检索。即你可以从一个字查出你想要找的诗,进行快速的大海捞针。当然,你掌握的条件越多,检索的时间就越短。如果你知道一句诗,要查出作者、篇名和全诗就比知道一个字或词快,如果你知道一个词或一句诗,又知道作者,要查出篇名和全诗就更快了。因为软件设有多条件检索功能。软件的统计功能更是了得。可以对任何一个字进行某一作家或者全部唐诗的使用频率的统计。这对唐诗研究来说,无异提供了一个新的研究领域。

笔者在1998年10月召开的唐代文学学会暨国际学术讨论会上,购得这个软件,回家之后,自然要试一试,在数百个常用字中,电脑软件告诉我们,唐人最爱说的字是“不”!

在该软件收录的50836首唐诗(共2615215字)中,“不”字出现26520次。以篇数计,占50%,即平均二首诗说一次“不’;以字数计,则100个字说一声“不”,占1O1.4066/万。频率之高,令人难以想象。唐人为什么爱说“不”,在哪些场合说“不”,确实是一个值得研究的课题。

在其他词汇中,有这样一些数据:

在数字类,使用率最高的前5位是:“一”:15282次;“千”:6126次;“三”:6094次;“万”:5773次;“十”:3507次。(其他数字的使用率排列为“五”:3294次;“百”:3202次;“九”:2599次;“四”:2744次;“二”:2070次;“六”:1285次;“八”:1142次;“七”:895次。)

在山水类,使用率最高的前5位是:“山”:16180次;“水”:11148次;“江”:7494次;“海”:4320次;“河”:2746次。   

在天象类,使用率最高的前5位是:“风”:15780次;“日”:15011次;“云”:13538次;“月”:11053次;“雪”:4500次。雪的使用率比想象的低。在“风花雪月”中,“雪”的排名在“月”后。

在季节中,四季排序为“春”:11126次;“秋”:8172次;“夏”:942次;“冬”:554次。春恨秋愁是唐人抒情的重要内容之一,从语词上也得到反映。

在植物类,使用率最高的是“花”:11421次;其次为“草”:5451次;“树”:5307次;“松”:3372次;“木”:2194次。

在情感类,使用率最高的前5位是“心”:9080次;“愁”:4331次;“情”:4209次;“乐”:2466次;“苦”:2266次。(“爱”:1980次;“恨”:1875次二)

在色彩类,使用率最高的是“白”:8499次;其次为“青”:6523次;“红”:4119次;“黄”:3860次;“绿”:2774次。(“碧”为2784次,“紫”为2174次,“赤”为751次,“黑”的次数仅为531次,“蓝”为171次。)

在人称类,使用率最高的是“人”:21095次;其次为“子”:6254次;“我”:5482次;“你”的称谓仅有34次,且从晚唐以后才出现,罗隐《代文宣王答》:“吾今尚自披蓑笠,你等何须读典坟。”是《全唐诗》中的第一个“你”。(王梵志的诗《全唐诗》未收,其中“你”亦不少。)之后,寒山的诗中有15个“你”。如“再三劝你早修行,是你顽痴心恍惚”。“你若不爱信,相逢不相遇。任你千圣现,我有天真佛。”多是劝善诗中的口语式的表达。“你”主要在通俗诗中出现。值得注意的是,初唐的王梵志和中唐的寒山大量用“你”,而其间其他诗人“只字不提”此字。这一现象耐人寻味。

在饮食类,使用率最高的是“酒”:5011次。酒之富有诗意,这是一个证明。其余食品,似不宜入诗,如“茶”亦只有410次,“肉”为369次,“饭”为323次,“米”为150次。   

在动物中,使用率最高的前5位是“马”:5008次;“鸟”:3532次;“凤”:2134次(“凤凰”376次,“凰”单独使用仅14次);“鱼”:2028次;“鸡”:1015次。“马”出现的频率高过“河”、“红”、“绿”、“川”及若干表现情绪的词,见出马与人类生活关系之密切。牛、虫、羊、犬等动物,均在700次至400次之间。   

在一些反义词组中,除了表达情绪的语词是愁苦多于欢乐外,大多呈现出“正面”的词汇多于“负面”的词汇的现象。如“多”:6632,“少”:3000;“大”:3188,“小”:2517;“高”:7239,“低”:1184;“远”:5928,“近”:2535;“长”:9214(“长”包括生长之长),“短”:742;“笑”:2223,“哭”:597;“好”:2778,“坏”:172;“上”:11193,“下”:7378;“真”:1962,“假”:320;“美”:1105,“丑”:129……这种现象可以使人思考一个问题,即诗,或者说唐诗,所表现的内容和所表达的情感是以“审美”而不是以“审丑”为主要倾向。   

需要说明的是,本文的统计,范围是有限的。读者和研究者可以根据自己的需要来进行作家作品的检索。这些数据至少可以帮助我们了解一个字被使用的基本情况。对同一个字的不同义项,这个软件未能区别。这应该是辞典软件设计者的任务。不过,我想,要是这个软件(在升级时)以及商务印书馆以后出版的系列软件中,在检索功能中增加一项不同义项的检索内容,对读者来说,又会多一份惊喜。当然,这又是需要设计者们付出许多辛劳的。