小马拉大车 基于语料库的金庸与古龙演义言语作风对比磋议 A Corpus Based Comparative Study of the Language Styles of Jin Yong’s and Gu Long’s Novels
南开大学汉言语文化学院小马拉大车,天津
收稿日历:2022年11月10日;托付日历:2022年12月5日;发布日历:2022年12月13日

选录
金庸与古龙为中国文体孝顺了大批优质且作风迥异的篇章,二者魔力无尽的言语脾气具有分析论证与对比磋议的要害价值。本文通过缔造武侠演义文本语料库,利用定性分析与定量分析相伙同的计量统计纪律,进行言语作风的精粹探究与对比分析,探究二者言语作风的异同。最终,咱们发现款庸文本受传统文化的浸润更深厚,体现奋斗的战役姿态和浓郁的家国情感,而古龙则长于对侠客个体形象的书写与形色,侧重营造孤骄横然的侠客形象及寒冷孤独的叙事环境。
要道词
语料库,金庸,古龙,言语作风,高频词

A Corpus Based Comparative Study of the Language Styles of Jin Yong’s and Gu Long’s Novels
Jilong Pan
College of Chinese Language and Culture, Nankai University, Tianjin
Received: Nov. 10th, 2022; accepted: Dec. 5th, 2022; published: Dec. 13th, 2022

ABSTRACT
Jin Yong and Gu Long have contributed a lot of high-quality and different styles to Chinese literature. Their charming language features are of great value for analysis, demonstration and comparative study. This paper explores the similarities and differences between the two languages through the establishment of a text corpus of martial arts novels, and the careful exploration and comparative analysis of language styles by using the quantitative and qualitative analysis methods. Finally, we find that Jin Yong’s text is more deeply infiltrated by traditional culture, reflecting a high attitude of struggle and a strong sense of family and country, while Gu Long is good at writing and describing the individual image of a chivalrous man, focusing on creating an image of a chivalrous man who is aloof and proud and a cold and lonely narrative environment.
Keywords:Corpus, Jin Yong, Gu Long, Language Style, High-Frequency Words

Copyright © 2022 by author(s) and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
1. 小序
汉语的江湖从不孤独。20世纪50年代,以金庸和古龙为代表的新派武侠演义风靡华东说念主寰宇。金庸、古龙笔下丰富的优质作品形成了中国武侠演义历史上特有的“双子星”表象,武侠演义的崛起也激发了海表里学者的高度关心与粗拙磋议。
早在20世纪末,徐岱(1998) [1] 便从艺术价值角度指出金庸武侠演义中“那种史诗般的气概与假想主义品格之难能宝贵”。21世纪以来,芦海英(2006) [2] 从东说念主物形象角度起程,以为古龙“通过荡子形象的塑造完成了对东说念主性的挖掘和证明”。王开银(2008) [3] 则通过例如论证,从句段及篇章角度对二者作品进行对比分析。胡菁娜(2013) [4] 从题材、言语、情感三方面进行二者的作风比较。赵铭(2016) [5] 则存身于社会与文化成分,分析二者文本异同的原因方位。
然则,此前对二位作者作品的分析磋议多纠合于历史文化、社会配景等文体艺术角度。从言语学角度,尤其是利用计量分析与统计妙技进行的对比磋议仍显重量不及。由此,咱们产生了试图改善此领域磋议空缺近况的想法。
在本文中,咱们通过使用数理统计器具,方案将从常用句式、高频词、色调词等角度磋议两位作者的言语脾气与用语作风。但愿借此匡助读者校正之前朦胧的、笼统的理性融会,缔造对两位作者的作品之系统性、理性化的融会,以便愈加直不雅地感受两种言语作风的不同魔力。
2. 前期准备
2.1. 文本中式与语料库缔造
在现代文体史上,金庸与古龙均属于“高产”作者。据统计,金庸创作武侠演义十五部,古龙则撰写武侠小连络计七十多部。一方面,为了精简统计规则,咱们方案中式最受人人接待的代表性作品。另一方面,为了使语料库的统计规则能从举座上反应作者的言语作风脾气,本次中式二者武侠演义的基本原则是:在中式经典文本的同期,尽量囊括两位作者前、中、后期不同期间段的长、中、短篇作品。
基于以上原则,本次聘用了金庸与古龙各自的5部代表作,分别为:金庸《射雕好汉传》、《白马啸西风》、《倚天屠龙记》、《鹿鼎记》、《越女剑》;古龙《天穹神剑》、《飘香剑雨》、《旷世双骄》、《陆小凤传说》系列(以下简称《陆小凤传说》)、《风铃中的刀声》。
通过在集合上搜索对比,咱们聘用了较无缺的、错漏较少的版块,并下载相应的文本文献。之后,咱们对其中认识的编排邪恶或上传经由中的乱码表象、花样邪恶进行东说念主工校正,发奋缔造能的确反应作者言语作风的语料库。
最终,咱们缔造了金庸、古龙武侠演义代表作语料库,并赢得对于十部作品总字数、总词数的统计表,如表1所示。
表1. 金庸、古龙各自作品的字数、词数统计表
国内自拍2019在线经过初步统计,咱们不难发现发现款庸的武侠演义字数更多,篇幅更长。通过对比,咱们不错发现款庸的武侠演义篇幅不一,除常见的长篇演义除外,《白马啸西风》与《越女剑》分别属于中篇、短篇演义。违反,古龙更偏向于创作长篇、中篇演义,所创作的短篇武侠演义较少。
2.2. 磋议器具与磋议纪律
本次统计主要伙同使用AntConc与freqci2009两种器具。其中,AntConc主要用来进行语境共现、搭配分析、索要要道词表等操作。在进行文分内词、统计词频时期则需要期骗分词软件freqci2009。AntConc四肢日本早稻田大学Laurence Anthony博士实验室研发的、基于Microsoft Windows操作系统的多平台的语料库分析器具包,日益受到言语学领域有关磋议者的留意与崇拜。四肢自动分词软件,freqci2009空洞接管正向最大匹配法与逆向最大匹配法,且具备统计词频的扶持功能。综上,此两种统计器具基本或者闲逸本次磋议的统计条目。
基于统计办法与统计器具的功能,本次统计将从常用句式、高频词、色调词的使用情况及有关搭配脾气等角度进行统计分析。咱们本次是通过定量统计与定性分析相伙同的纪律,具体为不雅察统计规则,列表分析,对比磋议等方式,赢得对于金庸、古龙不同言语作风的定量与定性信息,进而开展系统性的言语作风分析责任。
3. 常用句式脾气与比较
为了进一步磋议两位作者的常用句式特征,咱们通过添加通配符,遐想句型分类法式,统计调换句式等操作,缔造了金庸、古龙演义的句式语料库。新建的句式语料库将用于后续的统计分析责任。
对于辞别句式的法式,本次主要参考了北京大学汉文系现代汉语教研室版《现代汉语》对于现代汉语句子类型的有关讲述 [6]。另外,由于从句子所抒发的本体来看,用口吻分类所赢得的句子更能纠合反应作者意图达到的表意办法。因此,咱们将从口吻角度进行句类辞别。最终,咱们聘用呈报句、疑问句、祈使句、惊叹句、呼应句合计五类常用句式,并将统计规则列入下表2:
表2. 金庸、古龙常用句式使用情况(句类角度)
笔据统计规则,咱们不错发现除了呈报句外,金庸、古龙在行文时王人有偏好使用疑问句的风俗。一般而言,疑问口吻的脾气在于不细则性强,常用作建议问题或磋议情况。在金庸、古龙的武侠演义中,其频繁出当今东说念主物对话与叙事言语中,用以鼓励故事情节的发展。由此可见,恰是武侠演义的行文脾气形成了疑问句使用频率较高的表象。同期,疑问口吻的粗拙使用也营造了武侠演义矛盾强烈,故事节拍快的氛围。
在此基础上,咱们将观念聚焦于金庸、古龙作品的句长及各句式的使用频率各异,尝试探究二者句式的深层隔离。有关统计规则如表3所示:
表3. 金庸、古龙句长统计分析(句类角度)
通过分析表3信息,咱们利用画图器具绘制了如下统计组合图(图1):
图1. 金庸、古龙常用句式统计组合图(句类角度)
从句长统计规则来看,二者的平均句长较为邻近,而古龙平均句长略长。在武侠演义中,古龙多用形容词、副词来堆砌长句,形成句子精深较长的表象。这是由于古龙在演义中常作分析与辩论之语,而长句的形式脾气更便于文体性表述的张开。另外,长句的使用更利于作者心情达意,而古龙的演义更多哲理性与文体性名句的原因也出自于此。从频率方差与法式差的统计规则来看,金庸武侠演义的句式糟塌进程大于古龙。这证实金庸句式愈加无邪多变,不拘一格。古龙演义句式的结实性更强,言语作风更不易转变。
其中,句长及频率方差的不同反应了语体聘用,即书面语与白话使用政策的各异性。相对而言,金庸的言语体现出版面语与白话相伙同的脾气。比较古龙,金庸武侠演义的白话化倾向更强,例如《倚天屠龙记》中丐帮弟子以及《鹿鼎记》的主东说念主公韦小宝多用贩子俚语与方言词汇,甚而平常使用粗鄙之语。相较于古龙多用文体性、书面化言语的脾气,金庸更懂得伙同书面语与白话的脾气,达到雅俗相融的田地。由此,金庸的著述也更易为人人所收受与喜爱。
4. 高频词分析与对比磋议
高频词是反应作者用语风俗的伏击打算。笔据之前统计规则,咱们发现款庸作品的总词数合计1,843,904个,古龙作品的总词数合计1,497,983个。在语料总体鸿沟较大的基础上,统计高频词的使用情况或者更客不雅地反应作者词汇作风以及用词偏向性,进而为对比分析二者用词风俗的相似处与各异性提供可能。
在开启了识别专著名词的基础上,咱们统计了金庸与古龙作品高频词汇的使用情况。由于汉字中存在大批虚词的脾气,斟酌两位作者最高频率的词汇均属于虚词,不可照实地反应作者用语作风。因此,咱们东说念主工剔除了前20位的高频词,将第21~50位词语四肢本次统计的高频词,统计情况见表4:
表4. 金庸、古龙高频词对比统计(第21~50位)
除大批使用的东说念主物姓名外,咱们能从对比情况中发现款庸、古龙善于描摹江湖意气的场合。具体而言,“笑”、“来”、“去”等高频动词的大批使用充分体现了惬心恩怨的江湖气派。两位作者的文本中,“笑”常搭配出现“大笑”、“冷笑”、“微笑”等表述。“来”“去”的频繁出现反应出侠客们体态自如,绚丽不羁的形象特征。
通过删去重合的高频词,咱们发现款庸演义中特有高频词为17个,古龙演义的特有高频词也为17个,特有词高频数目整个止境。具体而言,金庸的特有高频词有“大”(频次6372,频率0.0034557)、“三”(频次4678,频率0.002537)、“好”(频次4041,频率0.0021915)等。伙同文本中词汇的搭配与使用情况,咱们发现款庸笔下的武林好手与武功招式多以“三”定名,例如《白马啸西风》中的“吕梁三杰”、“白马李三”,《倚天屠龙记》中的“张三丰”、“昆仑三圣”与“三才剑阵”等,均体现出作者对数字“三”的偏疼。
另外,“中”(频次6447,频率0.0034964)成为高频词汇之一与“中国”(频次445)、“华夏”(频次230)、“中土”(频次135)等词汇占比较高的情况密不可分。笔据上述常用搭配,咱们不错发现款庸武侠演义多有具体的叙事空间,侧重以古代中国地舆与历史文化四肢配景。这反应出金庸具有自发期骗中国传统文化的强烈将强,笔下的翰墨散漫着中国传统文化的浓郁气味。
比较而言,古龙的特有词为“我方”(频次3925,频率0.0026202)、“莫得”(频次6649,频率0.004438635)、“很”(频次4142,频率0.002765051)等。通过搜索相应词汇的搭配情况,咱们发当今古龙演义中,“我方”常出现于侠客心思描写与作者的辩论翰墨当中,反应了侠客神秘的心思举止以及孤身孑然的脾气。访佛地,“莫得”一词也多由古龙用来营造孤独空旷的叙事环境。其中,“莫得”常搭配用作“莫得东说念主”(频次494)、“莫得说”(频次262)等表述,表现侠士无东说念主匹敌或无东说念主知己的孤独处境。正合张志岩(2019) [7] 所描摹“侠客们身上的虚无色调与孤独内蕴”的气质脾气。比较于金庸弘扬的叙事空间与深厚的文化底蕴,古龙倾向于摹仿东说念主的情感寰宇,以及描摹个体的生计体验。
值得在意的是,古龙演义中“他们”(频次3755,频率0.0025067)亦然一个高频词。然则,“她们”(频次479,频率0.0003197)的频率认识偏低,不可排入前50位高频词的序列。“他们”的粗拙使用充分体现出古龙的武侠寰宇中侧重描摹男性群体,伏击东说念主物以男性为主,男性气质浓厚的特有之处。
5. 色调词使用情况对比与分析
5.1. 表面基础
花样偏好是东说念主在心思上对某些花样的偏疼性。心思学以为,花样的偏好影响了中式也在渺小之处透露出东说念主与东说念主之间的个体各异。连年来,跟着色调心思学的发展,学界对于花样与东说念主物性格及心思的磋议愈加潜入。Palmer和Scholss (2010)对花样偏好建议了一种生态价效表面(The Ecological Valence Theory, EVT)。他们以为,东说念主们之是以会对某种花样产生偏好,是因为其对与该花样有关联的物体或实体存在好感,并系统佐证了花样与东说念主类知觉情感,念念想意志的紧密联系 [8]。
因此,咱们不错将花样词频率的上下四肢判断不同文本各异度大小的依据,进而判断作者是否具有相似的言语作风。
5.2. 统计经由及规则分析
为了增强统计规则的精准性与的确度,咱们在统计之初便洽商到汉语中专著称号或习用词组中可能带有花样字词的情况。因此,咱们在统计之前便删去了的“认识”、“芳华”、“青州”、“黄河”、“阴世”等带色调的常用字样,尽力使得统计规则更能体现作者本人的花样偏好与使用情况。
最终,咱们将金庸、古龙作品中色调词的使用情况列入表5:
表5. 金庸、古龙作品色调词使用情况统计
笔据统计规则,从高频花样词来看,金庸最常用的前三色调词为“黄”(5896次,频率0.00317)、“白”(2871次,频率0.00156)、“青”(1893次,频率0.00103)。咱们不错看出,金庸疼爱“黄”一词。四肢金庸最喜爱的色调词,金庸武侠演义中大批主要变装的名字中王人带有“黄”。例如《射雕好汉传》中的黄蓉、黄药师、黄裳,《倚天屠龙记》中的黄衫女等。在金庸的文本中,“黄”、“红”等暗示明艳、亮丽等暖色调的色调词出现频率较高,而“黑”、“绿”、“蓝”等暗示阴霾的冷色调色调词出现较少。
古龙最常用的前三色调词为“白”(3223次,频率0.00215)、“黑”(1872次,频率0.00125)、“青”(1395次,频率0.00093)。笔据文本中体现的常用搭配,古龙偏疼“白衣”(229次)、“煞白”(229次)、“皑皑”(59次)等表述。除此除外,古龙还冠以好多东说念主物“白”之姓名,例如“许白”(249次)、“白凌霄”(21次)。古龙对“白”情有独钟的特有表象,充分体现其对白衣惨绿少年形象的沉湎。不异地,古龙也偏好“黑”色。在古龙的武侠演义中,“黑”常搭配为“黑衣”(频次411)、“暗澹”(364次)等,以暗示东说念主物举止、事件进展的配景信息及叙事元素。
通过对比,咱们不难发现款庸武侠演善举座上属于偏好绮丽直爽、明朗四射的色调基调,带给读者和气亮丽的氛围体验。古龙的武侠演义“绿”、“紫”、“蓝”等冷色调花样使用频率更高,同期更注重“黑”、“白”反义花样词的使用也有助于映衬强烈对比之下的反差感。总体而言,金庸偏疼使用明媚绚烂的色调来映衬和气和煦的叙事氛围,古龙则偏向于营造一种冷峻严肃的压抑之感。
6. 论断与斟酌
6.1. 结语
经过上述统计分析,咱们不错发现款庸与古龙的言语作风既有相似之处,也存在着认识的各异。咱们现从相似性与各异性两个方面来回首本次统计分析发现的规则。
6.1.1. 言语作风的相似性对比
空洞来看,二者的相似性主要从分析高频词的角度得出。通过统计,咱们发现两位作者王人大批利用“笑”、“来”、“去”等词汇。两位作者在书写武侠演义时,王人侧重于描摹武林寰宇的目田感与超逸感,创作出多个绚丽不羁、惬心恩怨的侠客形象。
6.1.2. 言语作风的各异性对比
相较而言,两位作者的不同之处更为荒谬,主要表现为常用句式、高频词汇以及色调词各方面的各异。
句式层面,古龙风俗使用长句进行表述,其言语更豪阔书面化色调。金庸则将汉语白话与书面语进行交融,既阐扬了书面语长于议论与白描的上风,也利用了白话无邪性强、变化性丰富的脾气,形成句式作风愈加无邪千般的特色。
高频词方面,金庸风俗使用“三”、“中”等词,其高频词的搭配情况充分体现了作者受中国传统历史与文化影响之深。古龙则偏疼“莫得”、“我方”、“他们”等词,留意表现侠客傲视寰宇、孤独孤傲的高凉气场以及男性气质浓厚的特征。
色调词方面,金庸认识偏疼“黄”、“红”等明艳的暖色调,多借此营造和气宜东说念主、哀感顽艳的言语环境。古龙则认识沉湎于“白”的使用,且多辅以“黑”之色调,形成强烈的色调反差成果。
总体而言,金庸的言语很猛进程上受传统文化的浸润,愈加体现了家国一体,寰宇为家的伟大假想。与之相对,古龙的言语受个东说念主的履行感更强,留意体现东说念主本人的精神风貌与形象魔力。恰是二者言语作风的进出,形成了金庸善写大侠,古龙善写令郎的不同脾气。
6.2. 改日磋议标的
本次磋议更多基于常用句式、高频词、色调词的统计分析。受限于统计器具与统计纪律的不及,本文较少触及语义及篇章脉络的计量分析。然则,这一领域的相对空缺的近况也证实此类磋议具有繁多的发展空间与探究价值。咱们确信,跟着统计期间的发展与握住完善,改日的有关学者将会存身于语义、段落、语篇等领域,利用计量纪律潜入磋议作者言语作风与文本脾气,最终得出对于作者语篇脾气的举座性论断。
访佛地,分词器具不异有较大的发展空间。好多中国作者对于效法古东说念主用语风俗以遣意造句的兴致颇丰。金庸、古龙的演义文本中也存在多处使用古诗词与古代文言文的表象。然则,本次磋议使用的分词软件freqci2009以及于今所开垦的大多数理统计软件更多是基于现代汉语信息措置的脾气所研发的,在措置古文、诗句方面的成果认识不尽东说念主意。改日,倘若能研制出配套措置古代汉语的统计器具,将会对分析此类带有古汉语字句的作品提供更全面的匡助,擢升分词的正确率与分析的准确性。
文章援用
潘纪龙. 基于语料库的金庸与古龙演义言语作风对比磋议A Corpus Based Comparative Study of the Language Styles of Jin Yong’s and Gu Long’s Novels[J]. 现代言语学, 2022, 10(12): 2911-2919. https://doi.org/10.12677/ML.2022.1012394
参考文献小马拉大车
上一篇:家有小女 《痴汉》MV黄鸿升当副导 忆高中纯爱
下一篇:爱色影 存眷青少年│老寨苗族乡“山里孩子看全国”主题青少年活动中心揭牌啦