《基于现代汉语词语的语法功能分类.pdf》由会员分享,可在线阅读,更多相关《基于现代汉语词语的语法功能分类.pdf(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于现代汉语词语的语法功能分类 俞士汶 北京大学计算语言学研究所 在朱德熙先生的语法理论的指导下,北大计算语言学研究所与中文系合作,通过几年的研究,提出了一个效劳于语言信息处置的现代汉语词语分类体系,并将数以万计的词语实际进行了归类,与此同时还按类详细描述了每一个词语的多种语法属性,初步建成了“现代汉语语法电子词典”,另外对数十万字的语料进行了切分和词性标注。这就又进一步查验了词类划分的科学性与可操作性。这到如此规模和如此浓度的汉语语言工程实践可能是罕有的。本文介绍现代汉语词语分类体系、分类的理论基础,并以假设干词类例详细介绍具体的划类准那么。现代汉语的词分以下 18 个大体词类,括号中的拉丁
2、字母是各个词类的代码。名词(n),时刻词(t),处所词(s),方位词(f),数词(m),量词(q),区别词(b),代词(r),动词(v),形容词(a),状态词(z),副词(d),介词(p),连词(c),助词(u),语气词(y),拟声词(o),叹词(e)。这些大体词类能够归并为较大的词类。名词、时刻词、处所词、方位词、数词、量词统称为体词,动词、形容词、状态词统称为谓词。有一部份代词属于体词,另一部份代词属于谓词。体词、谓词、区别词和副词又合称为实词。介词、连词、助词、语气词合称虚词。实词与虚词是汉语两大词类。另外还有拟声词与叹词,它们游离于这两大词类之外。自然语言处置的常规技术要求庆自然语言处
3、置系统中配备一部电子词典。关于运算机来讲,能够以为作为电子词典的登录项的语言单位是“词”。大体中大部份确信是语言学家认同的词,这也确实是暗示了其中一部份不能看做“词”。从运算机处置实际文本的需要动身,从提高运算机处置效率的角度考虑,词典中另外包括了以下 7 类语言成份:前接成分(h):阿,老,非,超,单 后接成分(k):儿,子,性,员,器 语素字(g):民,衣,失,遥,郝 非语素字(x):鸳,批,蚣 成语(i):接部就班,八拜之交 习用语(l):总而言之,由此可见 简称略语(j):三好,全总 前 4 类是比“词”更小的单位,不成词。这些成份的数量是有限的,只要电子词典的规模许诺,应当尽可能地将
4、这些成份全数收入。后 3 类是比“词”更大的单位,词典中只能收一部份利用频率高的。本文将电子词典中登录的各类语言万分笼统地叫做“词语”。以下行文中的“词类”是就前面的 18 个大体词类而言的,有时也讨论上述后 7 类语言成份。分类的目的与依据 为了进行语法研究与信息处置,需要把语法功能相同的或相近的词归成一类。那个地址包括两项工作。一项为哪一项要针对汉语词语的全集,依照某种标准,成立一个分类体系。第一章所介绍的确实是面向信息处置的一种汉语词语分类体系。另一项工作是决定该全集中的每一个词语究竟属于哪个词类,这项工作能够叫“归类”,只是人们适应上也在“归类”的意义上利用“分类”那个术语。若是面向人
5、的语言研究,词语分类尚不十分迫切的话,那么面向运算机的语言研究,词语的语法分类及其代码化几乎是不可缺少的。词语分类事实上是将最重要的语法知识与语法规那么层次化,从而为自然语言的分析与生成提供最重要的线索。划分词类的本质依照只能是词的语法功能。所谓词的语法功能主若是指:(1).和某个或某类词语组合的能力;(2).在句法结构中充当句法成份的能力。例如,考察具有如下语法功能的词。a.可以用作主谓结构中的谓语,但不能带真宾语。如“个子高,教室安静”中的“高,安静”是谓语。象“高三公分,安静了两天”中的数量短语“三公分,两天”是准宾语,而不是真宾语。b.可以受“很”一类程度副词修饰,如“很高,挺安静,特
6、别雄伟”。c.可以作述补结构中的补语,如“洗干净,捆得结实”中的“干净、结实”是补语。d.直接或加“地”后作状中结构中的状语,如“迅速提高,安全地转移”中的“迅速、安全”是状语。e.直接或加“的”后作定中结构的定语,如“漂亮小姐,挺拔的山峰”中的“漂亮、挺拔”是定语。f.可以用 a+“不”+a 的形式提问,如“硬不硬,痛苦不痛苦”。g.后可接语所词“着呢”,如“美着呢,痛快着呢”。可将如此的词归成一类,起个名字叫“形容词”,而且一个代码“a”表示。如此,若是判明了一个词具有上述功能,那么能够将它归入形容词;反之,若是能从电子词典查得某个词的词类代码是“a”,那么知它极可能具有上述语法功能,除非
7、电子词典对其中某些词的某些语法功能还有更准确的描述。参照上述语法功能,能够将形容词同其它词类区分开。如名词不具有上述功能中的 b,c,d,f,g,一样地说,也不具有功能 a。同时名词的语法功能中也有一些是形容词所不具有的。划分汉语词类的本质依据确实是这些语法功能的异同。划分词类的本质依据只能是词的语法功能,词的意义不能作为划分词类的依据,这与划分词类的目的是紧密相关的,因为表示同类概念的词的语法功能并非必然相同。例如,“战争”与“打仗”指的是同一个概念,可是“战争”是名词,“打仗”是动词。汉语不象印欧语那样有丰硕的形态,也不能依照形态给汉语的词语分类。在第 1 章描述的分类体系中,有一些词类(
8、如代词、数词、拟声词和叹词)不是严格依照它们的语法功能散布划分出来的。这种情形可不能给词类划分理论造成困难。以代词为例,它是依照一个词是不是具有指代功能划分出来的,这事实上是语义范围的功能。若是严格按功能划分,不妨细分为体词性代词(过去叫代名词)和谓词性代词。此刻仍将它们归入一类,是为了同传统的说法衔接,同时也适合信息处置的需要。关于分类问题的假设干说明 词的同一性问题 尽管说划分词类不是依据意义,可是需要熟悉到,划分词类只能在确信了词的同一性的基础上进行。所谓同一性指的是在不同的语言环境中显现的词形相同的假设干个词应该算同一个词仍是应该算不同的词。书面汉语的同形词限定为汉字相同的词,也能够直
9、接叫做同字词。同字词又可分为同字异音词与同字同音词。如“好人好事”中的“好”与“好管闲事”的“好”是同字异音词,而“专门好”与“好狠”中的“好”却是同字同音词。同字异音词固然是不同的词。因此,同一性老是的研究对象是同字同音词。例 1 门上挂着一把锁。例 2 请把门锁好。例 1 与例 2 中的两个“锁”的意义区别很明显,而且语法功能也有明显的不同,因此有理由说它们是不同的两个词,一个属名词,另一个属动词。例 3 村里死了一口猪。例 4 这个办法很死。例 3 中的“死”是失去生命的意思,能够带体词性宾语,例 4 中的“死”是呆板、不灵活的意思,能够受“很”一类程度副词修饰。若是以为“失去生命”与“
10、不灵活”确实是不同的意思,那就能够够以为例 3 与例 4 中的两个“死”是不同的词,一个是动词,一个是形容词。若是以为“不灵活”的意思是由“失去生命”的意思引申出来的,把例 3 与例 4 两个“死”看成同一个词,这时就需要把有关“死”的各类语法功能合在一路,由此来确信“死”的词类,采取这种观点,“死”兼属动词和形容词这两类词。只是,关于运算机来讲,在句法分析的范围内,只要能在电子词典中查到“锁”即是名词又是动词,“死”既是动词又是形容词就达到要求了。至于分属名词与动词的“锁”,分属动词与形容词的“死”是两个不同的词仍是同一词兼属不同词类的区别就不那么重要了。各类词的划类准那么 既然划分词类的本
11、质依据只能是词的语法功能,那么在确信各类词的分类标准时,是不是都要列举各类词的全数语法功能呢?这是没必要要的,也是不可能的。因为全数语法功能中固然也包括了这一类词与其它类词的某些相同的语法功能,而这些相同的语法功能对划分词类是没有作用的。划分词类时必需注意不同词类之间那些相互有区别的特点,即各个词类的语法特点。在进行将具体的一个词划归某个词类的实际操作时,查验该词是不是具有该类词的全数语法特点往往也是不容易的,通常只要抓住最重要的语法特点即可。例如,节列举了形容词的各类语法功能(固然还不是全数),其中象“做定语”如此的功能就算不上是形容词的语法特点,因为名词、动词一样能够做定语。形容词的划类准
12、那么能够选如此两条:1.能够作谓语但不带真宾语;2.能够被“很”修饰。选择分类标准的原那么应该是由此成立起来的词类,其所属的词语在语法功能上要有足够多的一起点,同时跟别的词类又要有足够多的不同点。划类标准也不是绝对的,不是一成不变的。假设选择的划类标准不同,成立的词语分类体系也会有所不同。不同类的词之间必需要有彼此区别的语法特点,但不是说不同类的词之间毫无一起的地方。动词与形容词都能够做谓语,后面都能够接“了”及趋向动词“起来”,确实是它们一起的语法功能。若是以这些一起的语法功能作为划类标准,那么能够将动词与形容词(还包括状态词)归并为一个更大的类,即谓词。典型性问题 在一个确信的分类体系中,
13、同类的词有一起的语法功能,但不等于说,同类的词的语法功能完全相同。关于任何一种自然语言,实际可行的、有价值的分类只能做到把语法功能相同或相近的词归在一路。如此一来,同类的词,有些是典型的,符合分类的的全数标准或最重要的标准,有些是不典型的,只符合其中一部份标准。例如,“苹果、水泥、勇气、心胸”都是名词,它们的一起特点是做句子的评语与宾语,不受副词修饰。一样地说,名词能够受数量词修饰,只是量词的类型又有不同。如修饰“苹果”的数量结构中的题辞能够是个体量词、气宇词、容器题辞与种类量词等,与“水泥”搭配的就没有个体题辞,与“勇气”搭配的只有种类量词和不定量词,而“心胸”却不能受任何数量结构或数词修饰
14、。在列举各个词类的划类准那么时,应尽可能地把那些重要的列在前面。当判定一个具体的词是不是属于某个词类时,就能够够看它是不是符合这些判定标准。越符合多项标准或前面的标准,越是该类典型的词。反之,虽将一个词划入了该类,但它只符合少数几项标准或只符合较后面的标准,那么那个词在该类中就不是典型的。这也是语言现象的模糊性的一种表现。词语的兼类 在“词的同一性问题”中已经涉及了词的兼类,那个地址更集中地讨论一下那个问题。词的兼类指的是若是同字同音同义的同一个词具有不同词类的语法功能,那么以为那个词兼属不同的词业,简称兼类。兼类问题可用表征形容词与动词关系的图 1 来讲明。在图 1 中,在边的圆代表形容词的
15、集合,右边的圆代表动词的集合。这两个圆不相生命部份别离用 a,v 表示,相重合的阴影部份用$表示。形容词与动词尽管都是谓词,但它们有彼此区别的语法特点,如形容词能够受“很”修饰且不能带真宾语,而动词可者不能受“很”修饰或能带真宾语。依照这些语法特点,能够把绝大部份形容词与动词区分开来。可是,汉语中确实有一些词处于两个圆重合的阴影部份,如“端正,巩固,方便,壮大,繁荣,丰硕”等,这些词既具有形容词的语法功能,又具有动词的语法功能,而且看不出它们作为形容词或作为动词,在意义上有什么区别。因此,本研究报告以为这些词兼属形容词与动词。前面已经提到,划类标准有必然的相对性。仍以图 1 为例,关于 a,v
16、,$能够有以下 4 种处置意见。(一)将 a,v,$各自处置成独立的类,这就需要为$起个适合的名字。本研究报告维持已经划定了的 18 个大体词类的稳固性,不主张如此做。(二)将阴影部份$与 a 归并,形容词的集合确实是左侧的完整的圆。动词的集合只剩下 v,动词集合内的各个元素间语法功能的一致性就加大了。(三)与(二)反过来,将$与 v 归并。动词的集合确实是右边的完整的圆。形容词的集合只剩下了 a。(四)a 为形容词,v 为动词,$为兼类,既是形容词的子集,又是动词的子集。反映在电子词典中确实是将同一个词如“端正,巩固,方便”区分成两个登录项(即词语),别离归入形容词与动词。若是将 a,v,$
17、抽象为任意两个不同的词类及它们的交集,那么在以上 4 种处置的意见中,究竟哪一种更妥当一些呢?这不能一概而论。对形容词与动词的交集中的“端正,巩固,方便”这些词相似,象“研究,教育,批评,团结”这一类兼有动词与名词的功能,但这种词在动词中的比重较大,本技术报告不将它们看做兼类,只将它们划归动词,是动词的一个特殊的子类,叫“名动词”,在电子词典中有关这些动词的名词特性另列专门的语法属性字段加以描述。关于各类兼类现象,本技术报告在第 3 章“各类词的划分方式及有关说明”中将具体介绍。前面已经指出“一把锁”中的指物的“锁”与“锁门”中的指行为动作的“锁”是两个不同词,在电子词典中,在名词“锁”的记录
18、中需指明还有一个同字同音的动词“锁”,一样在动词“锁”记录中也需要指明还有一个同字同音的名词的“锁”。应该第一区分汉语中的实词与虚词,继之区分实词中的体词与谓词,然后再一一说明各个大体词类别的划分准那么。限于篇幅,那个地址只能选择假设干词类作为例子加以介绍。名词是最重要的一类体词。大多数语法论著以为时刻词、处的词、方位词是名词的子类。本文介绍的分类体系将它们处置成与名词平等的类,下面只以时刻词与方位词为例。在谓词中,本文只介绍从形容词中人化出来的状态词。本文还介绍了实词中的区别词。关于虚词,本文只选了介词。另外,对前接成份、后接成份、语素字、非语素字也作了说明。时刻词(1)时刻词是从名词中分化
19、出来的一类体词,如“昨天,此刻,尔后,宋朝”等。(2)时间词能做“在”、“到”和“等到”的宾语。(3)时间词可用“什么时候”、“这(个)时候”或“那(个)时候”提问或指代。(4)普通时间词可以作状语,且作状语时无需加“地”,也不能加“地”。如“我昨天看了电影”。专有时间词象“宋朝”,不能单独作状语。(5)时间词都表示时间。但语义与时间有关的词不一定是时间词。如“时间、时候、功夫”是名词(虽然可以说:“时间到了”但不能说“在时间”或“等到时间”),“已经,刚,忽然”是副词,“半天,三年”是数量词(组)。(6)时间词通常表示“时点”,即时间的位置或早晚,当然,这里说的“时点”并不是数学中时间轴上的
20、一个点。而表示“时量”(即时间的长短)的,都可以划为数量词或数量短语(一会儿,三个,两个钟头)。方位词(1)方位词的数量有限。单纯方位词包括“上,下,前,后,里,外,内,中,左,右,东,西,南,北”等,象“本世纪初,五月底,最近几年来,十年间”中的“初,底,来,间”也可划归方位词。合成方位词是由单纯方位词前接或后接其它成份组成的,如“上边,下面,前头,东头,之下,之间,以前,以后,以来”等。(2)一部份合成方位词能够单独充任主语或宾语。单纯方位词与另一部份全成方位词通常只能附着于名词、时刻词、处所词、数量词等体词性成份以后组成方位短语,如“桌子上,今年之内,长江以北,三年以来”,才能充任句子成
21、份。但在对举的条件下,单纯方位词也可单独充当句法成份,如“上有天堂,下有苏杭”,“前怕狼,后怕虎”。(3)方位短语通常表示空间、时刻的相对方位。方位短语中前面的体词性成份确实是相对方位的参照点。方位词即便单独利用,也是要有参照点的,只只是参照没有明显显现算了,这是从上下文必然能够判定参照点,在对话的环境中,通常以说话人的时空位置为参照点。(4)利用频率很高的“上,下,中”有时不表示实在的方位,有引申的意义。如“理论上”、“思想上”表示方面,“在教师指导下”、“在同窗们的帮忙下”表示条件,“在知识分子中”、“在农村人口中”表示范围。(5)多数方位词附着在体词性成份以后,有些方位词也附着于谓词性成
22、份以后,如“在教师指导下”、“进展中”、“睡觉之前”。(6)表示处所的合成方位词能够受副词“最”修饰,如“最上头,最东面,最后边”。(7)表示时刻或处所的一部份合成方位词能够直接作状语,如“以后去拜望您”,“咱们里面谈”。区别词(1)区别词是只能在名词或助词“的”前边显现的粘着词,要紧用作定语。(2)有一部分区别词过去可能认为是名词,如“金,银,雌,男,女,慢性,微型”等。但这些词都不能独立作主语、宾语。应该注意,“慢性”是区别词,“酸性,弹性”是名词,因为可以说“带酸性,弹性很大”。(3)有一部分区别词过去可能认为是形容词,如“初级,高等,大型,公共”等,但这些词不能作谓语,也不能受“很”、
23、“不”修饰。应该注意,“初级,高等”是区别词,“低级,高级”是形容词。(4)在一定条件下,如在包含对举格式的句子里,区别词也可以做主语和宾语,如“不分男女”,“急性、慢性都不好治”,“彩色比黑白贵”。某些区别词能够代替名词,如“无轨”可替代“无轨电车”。区别词后接“的”构成的结构是体词性的,可以作主语与宾语。(5)一部分区别词,如“共同,局部,自动”兼副词。(6)从意义上看,区别词表示的是一种分类标准,因此区别词往往是成对或成组的,例如:男-女,金-银,国营-私营,大型-中型-小型-微型。可是意义上成对可成组的词并非必然都属于一类,例如“相对-绝对”是成对的,“相对”是区别词,而“绝对”却是形
24、容词。“低级-中级-高级”是成组的,但其中“低级”和“中级”是区别词,“高级”是形容词。依照此刻的划分方式,区别词与名词之间、区别词与形容词之间是可不能有兼类现象的。状态词(1)状态词能够看做是从形容词中分化出来的一类谓词。(2)状态词没有单字词,通常是二字词,三字词或四字词。(3)状态词是不能受“很”修饰的,如“雪白,泪汪汪,满满当当”这些词不能受“很”修饰。(4)绝大多数状态词是不能受“不”修饰的,如“笔直,白茫茫,灰不溜秋”。(5)状态词能作谓语,但不能带宾语及补语。状态词的重要功能之一是作述补结构中的补语。(6)一些双音节形容词有几种变化形态,是人微言轻状态词使用的,在实际的也可以直接
25、标为状态词。如“孤单单,亮堂堂,平平常常,慌里慌张”分别是由“孤单,亮堂,平常,慌张”变化来的,它们不能都收入电子词典,但词典中也收了少量这样的词作为样例。至于单音节形容词,有的可以重叠。但重叠后的形容词必须加“的”才能成为状态词,如“甜甜的,扁扁的”。电子词典只在形容词库中注明这种变化的形式。(7)二个字的状态词只能有 ABAB 的重叠形式,重叠后仍是状态词。状态词没有 AABB 的重叠形式。(8)状态词不会同其它基本词类发生兼类问题。介词(1)介词是虚词,介词必然要和后面的宾语(能够是体词性的,也能够是谓词性的)组成介词结构才能够在句法结构作状语或补语。“被,从,关于,关于”等是典型的介词
26、。(2)由于现代汉语的介词大多数是动词演变来的,大部份介词还保留了动词的用法。以以下举的“在,到,给,跟,比”五个词在下面左侧各句中是动词,在右边各词中是介词:这本书在桌子上 在桌子上写字 列车到北京了 到北京聚会 他给过一支笔 给我了解一下 别老跟着我 你跟他说过了吗 咱们不妨比一比 他比我高 人微言轻动词能够单说,能够单独作谓语(“在,到”),能够带“着,了,过”(“给,跟”),能够有形态转变(“比”)。作为词不能单说,不能单独作谓语,不能后接“着,了,过”,不能有形态转变。即便组成介词结构后,一样也不能单说,不能单独作谓语,只能作状语或补语,即自由的短评结构中必然要有另外的谓语。(3)“
27、跟,和,同”是介词,又是连词。在下边左侧各句中它们的连词,在右边各句中是介词。水仙跟腊梅都开了 我(常)跟他借钱 小李和小王都是大学生 小李(不)和小王讨论问题 老师跟同学生一块儿去了 他的脸色(简直)同纸一样白“跟,和,同”这 3 个词是介词仍是连词的判别条件可归纳为:若是这些词的前后成份不能互换位置或在这此词的前面能够有修饰成份,那么这些词是介词。若是这些词的前后成份能够互换位置即互换位置后句子的意思不变而且在这些词的前面不能有修饰成份,那么这些词是连词。另外,还有一个形式特点可用于区分文本中介词与连词,作为介词的“跟,和,同”老是前置的,因此能够在句首显现,而作为连词它们老是中置的,是可
28、不能在句首显现的。(4)“在,到,给”兼属动词与介词,在以下结构中,他住在北京 已经送到家里 送给他一本书 本项研究以为那个地址的“在”是介词,介词结构“在北京”是“住”的补语。“他住在北京”能够变换为“他在北京住”,意思不变。“到”是趋向动词,是动词“送”的补语,在“送”与“到”之间能够加“得/不”,“送到”以后能够加“了”。“给”也是动词,“送给”也是述补结构,“送给”以后能够加“了”。(5)以下结构:走向胜利 来自全国各地 发源于青海 乘以一百 都能够看做是动词”走,来,发源,乘”后面接一个作补语的介词短语。但这些结构都受到文言残留的阻碍。其中“走向,来自,乘以”在现代汉语中,专门是在信
29、息处置系统中把它们看做是一个动词是最方便的了。前接万分(1)接在语素或词的前面组成合成词的一种构词成份,如此组成的合成词,有的已作为一个词收入电子词典,但多数未被收入电子词典。(2)典型的前接成份有“阿,老,第,初”。“第”与“初”已作为前助数词归入了数词。因此,只剩下了“阿”和“老”。假设“阿爸,阿妈,老鼠”已作为词收入了词典,构词法以为它们是由前缀“阿”和“老”与一个实语素结合面成的合成词。只是从句法分析的角度,可把它们看做一个整体,再也不细分。假设“阿叔,阿婶,老张,老九”这些词未被收入词典,那么可看成是由前接成份“阿”和“老”与一个语素组合而成的。(3)新兴的前接成份很多,它们可能与动
30、词、形容词、副词等类中的词同形,如“反,超,过,无”兼动词,“小”兼形容词,“不”兼副词。(4)前接成份与区别词不该有相交部份。后接成份(1)接在语素或词的后面组成合成词的一种构词成份,如此组成的合成词,有的已作一个词收入电子词典,但多数未被收入电子词典。(2)典型的后接成份有“子,头,们,儿”等。假设“儿子,木头,人们,花儿”已作为一个词收入电子词典,构词法以为其中的的“子,头,们,儿”是后缀,只是从句法分析的角度,那么可把他们看成一个整体,再也不细分。象“帽子,画儿,狗腿子,石头,砖头,朋友们,蝈蝈儿”这些词,假设词典未收,那么能够把他们看做是由一个语素加上一个后接成份组成的。作为后接成份
31、的“子,们,头,儿”读轻声,“儿”不单成音节。象“电子,中子,弹子,鸡子”中的“子”读第 3 声,不读轻声,不算后接成份。“头”作为后接万分,读轻声,如“馒头”。“子弹头”中的“头”读第 2 声,就不算后接成份。(3)新兴的后接成份很多,如“性,论,观,率,界,炎,学,家,员,化”等。其中多数兼属名词,如“性,家”等。(4)“的,地,得,着,了,过”已划归助词。语言学坚信研究了词缀“的”与助词“的”的区分,从信息处置角度只把“的”处置成助词较为简单。助词与后接成份不该有重叠部份。(5)“省,市,县,村,镇,部,司,局,处,军,团,排,班,系,所”等词划归名词,可兼用作后接成份,但再也不划入后接
32、成份。语素字与非语素字(1)除已作为单字词收入电子词典的之外,所有汉字(GB2312-80 的 6763 个汉字范围之内的)均收入电子词典。其中一类是语素,另一类不是语素。(2)“柿,遥,抒”是语素字的例子。“柿”是名词词根,“遥”是形容词词根,“抒”是动词词根。“箱,带”等是名词词根,只是“箱”也是量词,“带”又是动词。(3)“琵,琶,匍,匐”是非语素字的例子。“琵琶,匍匐”才是语素。(4)凡可作为中国人姓氏的字皆划归“语素字”,如“俞,郝”。(5)区别语素字与非语素字同古汉语知识关系甚大。本研究报告只依照现代汉语语词典以为“翡翠,鸳鸯,鹌鹑”各是一个语素,而“翡,翠,鸳,鸯,鹌,鹑”都是非
33、语素字。(6)标点符号另作一类研究。(7)现代汉语文章中还夹杂了很多外文字,阿拉伯数字等字符。这些单个的字符都能够看做非语素字。只是,它们的数量有限,机械内部的代码与汉字又能区分得开,能够不收入电子词典。本文是笔者的一份研究报告信息处置用现代汉语词语分类体系改写的,相地于原报告,篇幅大大紧缩了。本文大体上保留了原报告的体系、理论基础部份的原貌,只是第 3 部份只能选择假设干类其它语法论著较少论及的类别加以论述该研究报告所遵循的划类准那么。如此不免有不平稳的感觉。在研究报告中,笔者已对有关的指导者、支持者致以谢意,那个地址再也不赘述。陈力为,袁琦主编中文信息处置应用平台工程,北京:电子工业出版社.P157164