《“范畴语法”及其在汉语中的应用(共6页).doc》由会员分享,可在线阅读,更多相关《“范畴语法”及其在汉语中的应用(共6页).doc(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上“范畴语法”及其在汉语中的应用作者:孙红举来源:现代语文(语言研究)2008年第06期摘要: 范畴语法通过确立句子中词语对应的范畴及应用一定的演算规则可以判定一定语言中句子的“合法性”。它在对句子的生成的解释上具有一定的解释力,在计算机语言处理上也有很大的应用前景。作为一种纯形式语法,在实际应用中,特别是在汉语中,范畴语法还存在着一系列问题。如何促进形式跟语义的结合,应该是其发展中亟待解决的问题。关键词:范畴语法 语法范畴 计算语言学 形式 语义一、“范畴语法”的简要介绍范畴语法是一种用数学方法构造的、描写自然语言的句法理论,它是从生成的角度来对句子的形成进行的一种“
2、数学运算”,可以说,范畴语法也是生成语法的一种。1953年,著名数理逻辑专家巴尔希列尔(Y.Bar-Hillel)在句法描写的准算术记法一文中,用数学中演算的方法对句法类型进行了描写。1958年,数学家兰姆贝克(J.Lambek)在句子结构的数学中,提出了句法类型演算的理论。接着,巴尔希列尔进一步发展了句法类型演算的理论,并且对自然语言结构的生成制定了一系列判定程序。句法类型是从语法方面对句子结构所作的一种归类,是一种语法范畴,1960年巴尔希列尔等在论范畴语法和短语结构语法中,把这种理论称为范畴语法(categorial grammar)1。这样,范畴语法逐渐成为一种成熟的句法理论,人们将这
3、种语法理论应用到对自然语言的句法研究上,可以判定某个符号串在某种语言中对语言的计算处理产生的影响。作为一种新兴的句法理论,范畴语法对语言的句法分析也产生了较大影响。范畴语法是通过建立句子中词语相对应的“句法类型”或“范畴”,来实现对整个句法结构的“演算”或“推演”的。范畴语法中的两个基本范畴是S和N,S相当于句子,N相当于名词,句子中的句法成分都可以根据它的句法功能用S和N(再加上范畴构造符“/”“”和左右括号“(”“)”,“/”“”分别表示“左缺”“右缺”)以不同的方式组合起来表示自身的“句法类型”或“范畴”,规则是:如果有某个词,其后面的词的句法类型是,而它们所构成的词的序列的功能与相同,
4、则这个词的句法类型记为/;如果有某个词,其前面的词的句法类型为,而它们所构成的词的序列的功能与相同,则这个词的句法类型记为;如果有某个词,其前面的词的句法类型为,其后面的词的句法类型为,而它们所构成的词的序列的功能与相同,则这个词的句法类型为/。例如在汉语中:“苹果”的句法类型为N,“青苹果”中的“青”,它后面为名词“苹果”,而“青苹果”的功能与名词相同,故“青”的句法类型为N/N;“苹果熟了”中的“熟”,它前面为名词“苹果”,而“苹果烂了”的功能与句子相同,故其句法类型为N;“他吃苹果”中的“吃”,它前面为名词“他”,后面为名词“苹果”,而“他吃苹果”的功能与句子相同,故其句法类型为NN;“
5、他吃饱了”中的“饱”,它前面的“吃”的范畴为N,而“吃饱了”的功能与“吃”相同,故其句法类型为(N)N等等。 但是,范畴的标注类型与词类之间并非是一一对应的关系,它主要是针对成分的功能的(这里的功能主要是语法功能),因此,同一个词在不同的句法位置上可以有不同的范畴标注,如,“吃”在“我吃”中属于N,而在“我吃苹果”中属于NN。根据这种范畴标记的方法,语言中词语的“句法类型”,即“范畴”都可以描写出来,这样,符号串之间的关系就可以用一系列的范畴表示出来,句子成分的组配相当于词语对应范畴之间所进行的一系列数学演算,演算规则是“如果有形如a、ar、r的符号序列,那么就用来替换它,同时,它包含两个规则
6、:如果有形如a、 a的符号序列,那么就用来替换它;如果有形如r、r的符号序列,那么就用来替换它。”1根据范畴标注及运算规则可以对语言中的任何符号串进行判定,我们可以根据运算最后所得到的结果是否是“S”来判定句子的语法是否“合格”,即是否能够成句。如果经过有穷的运算步骤,运算结果最后为S,那么这个符号串便是合格的句子。如:首先对该句中的每个词进行范畴标注,根据范畴标注进行演算,最后结果为S,说明“她是一个漂亮女孩儿”是“合法”的句子。当然,这种演算在对自然语言的处理过程中会遇到很多问题,有些句子的处理绝非这么简单,因为语言中的句子既是合规则的又是不合规则的。很多时候,现实语言中的句子并不都是中规
7、中距的,这就给这种理想化了的语言处理方法带来非常大的障碍,在汉语这种缺少形态标志的语言中运用时就会碰到更多的问题。二、范畴语法的应用及对我们的启示范畴语法作为一种生成语法,早在1975年,冯志伟先生就在计算机应用与应用数学杂志上介绍过,但当时并未引起学界的重视,直到近年来才在语言的计算处理方面被广泛关注。“生成语法的一个特点是把语言看作数学客体,跟数学一样,它由一组公理和一组推导规则组成,也跟数学中用公理和推导规则证明一个数学定理是否为真一样,生成语法用公理和推导规则证明一个句子是否符合语法,因此生成语法是一种证明的理论。”2Chomsky并不是生成语法的唯一代表,范畴语法作为生成语法中的一种
8、句法理论,它的光辉几乎被Chomsky的转换生成语法的光芒所遮盖,因此在产生后很长一段时间以来,并未产生如转换生成语法那么大的影响,直到后来人们在机器处理方面才发现了它巨大的应用价值。范畴语法把语言的构成看作是一系列词语的范畴标记的演算过程,通过这种演算我们可以判断一定的句子在一定的语言中是否“合法”。范畴语法对句子生成的描述可以说是通过词语之间的互相依存关系一步一步建立起来的,这种互相依存的关系往往是一种线性的排列关系,因此,可以说它的操作前提是语言本身是一个线性的有序的规则的系统。对于语言的生成范畴语法是从微观的一个个具体的词出发来建立一个跟这个词有关的合法的链条,如果这个链条是按照这个词
9、所应该后加或前加的范畴来建立的话,那么它就是一个合法的链条。而Chomsky的转换生成语法则基本上是从句子格局的宏观着眼,通过建立一系列的规则,通过层层转换来生成一个具体的句子,语言是从一个底层的深层装置(语义层面)通过一系列的转换规则层层转换为表层装置(语音平面)输出来的。可以说转换生成语法在对句子的生成的描写上还注意到了句子的层次性,而范畴语法则较多注意了语言的线性排列。因此,我们说,范畴语法是近年来语言学中词汇主义的典型代表。范畴语法在对句子本身生成的阐释上也有问。范畴语法的实际操作是在一个符号串(而不管它到底是否合法)存在的前提下进行的,对词语范畴的标记必然涉及到其在符号串中所对应的语
10、法功能,这样,就有了一个先入为主的理念在前面。“范畴语法”和“语法范畴”是两个完全不同的概念,但是我们觉得应该在两者之间寻找一种对应关系。在范畴语法中我们过分强调句法的形式特征,而对那些仅仅由语义关系而结合在一起的结构或变式句、移位句难以描述和解释清楚。这就要求我们从语义上去寻求解释的可能性,语义上的寻求必须要建立一定的范畴,即“语义范畴”,即把具有相同或相似的语义功能的词归为一类,在两者之间找到一种联系。现在所出现的词语的语义网络文法可以说是寻求词语之间语义联系的很好代表,我们可以通过这种语义上的网络进行选择,然后,再根据范畴语法里的范畴标记进行数学的演算。这样,就会克服很大一部分范畴语法里
11、的缺点。或者还可以尝试将范畴语法与配价语法(这时应该主要是潜在的语义上的配价)中对语义关系的研究成果结合起来。三、范畴语法存在的主要问题及发展前景范畴语法的提出,它的前提假设是语言的一种理想状态。因为如果我们要从词汇的句法类型中推导出各个上级结构成分的类型,那就必须认为语言中所有的结构都是由词汇负载的。事实上,并非如此,语言中还经常存在一些其他结构,如:汉语中的主谓谓语结构、连谓结构以及复句中小句之间的结构,很难说是词汇结构。而有些语义结构仅仅用词汇的结构是难以描述完备的,特别是在实际的语言运用中,变式句和移位句是经常存在的,这些句子的实际内部结构肯定不能简单的按照词汇结构的标准去认定。范畴语
12、法只有词库而没有规则,它主要是通过词库中词语的范畴标记的运算来生成句子的。如果要按照运算规则实现句法类型的演算,那么它就必须假设语言中所有成分的结合必定是邻接成分的结合,而不能有超越邻接成分的超距离结合。事实上这也是不可能的,像刚才我们所提到的变式句和移位句,它们的内部结构都是超距离的,并不是线性的。再如,语句中有些成分的语义指向并不是简单的前指或后指,它可以跨越语言的层次和别的成分发生语义上的关系等等。特别是在汉语中,句子语言成分之间的意合性非常强,因此对某些句子的存在就更加难以预料和解释清楚。因此,这些理想的假设,就使范畴语法在语言学的句法分析和机器计算上产生了一系列问题:在确定句法成分的
13、范畴标记时,它和词类不是一一对应的,我们必须在一定的符号串中才能确定。而有时候确定起来就相当困难,尤其是遇到虚字词时,困难就更加明显。汉语的词语缺少形态标记,很多词的词性本身就很难确定,汉语词语的兼类现象又大量存在(指绝对数量),这都给范畴标记的确定带来一定的困难;当我们遇到那些超距离成分时,符号串的演算就很难或无法进行,如变式句和移位句的演算,以及遇到那些超常搭配的句子,如:一定语境下,不及物动词带上宾语的句子;动词或形容词做主语或谓语的句子等。范畴语法中存在的两个基本范畴S和N有时候无法承担表达复杂类型之间的演算关系的任务,特别是在汉语这种“意合性”极强的语言中,其对句法完备性的要求是很低
14、的,很多时候句子都可以省掉一些成分或隐含一些成分而不影响句子本身的合法性和理解,如汉语中的主语承前省略或谓词隐含等,用范畴语法描述的时候所遇到的困难就会有很多。应用范畴语法来建立汉语语义范畴的演算系统,还有很多问题需要探索,还有很长的路要走,需要大家的共同努力。范畴语法所存在的问题主要是由于它本身过分注重形式而较少关注句子成分之间的语义关系而造成的,因此,我们应该探求把句法范畴和语义范畴结合起来,以便在句法描述和语义描述之间找到一种对应关系。只能用此方法我们才能不停留在理想的层面,而是更加现实、更加详细完备地描述复杂的规则而又非规则的自然语言。范畴语法作为一种句法理论,它在句子生成领域所作的探
15、讨具有先导性。虽然还存在着种种不足,但是其成果在句法分析和语言的计算处理上还是显示出了它的实际可操作性,特别是在计算机处理领域,越来越多的人认识到了范畴语法的重要性。它已经成为当代计算语言学的理论基石之一,具有很好发展空间和前景。范畴语法存在的问题,需要我们在以后的研究中,逐步建立各种规则去限定它的具体演算过程或(如前面所说)探讨同语义网络文法和配价语法的结合的可能性。这都需要我们大家的共同努力。参考文献:1冯志伟.范畴语法, 语言文字应用J, 2001,(3).2方立.范畴语法, 外国语言文学J, 2003,(3).3刘颖.计算语言学M, 北京:清华大学出版社, 2002.4冯志伟.计算语言学基础M, 北京:商务印书馆, 2001.5侯敏.计算语言学与汉语自动分析M, 北京:北京广播学院出版社,1999.(孙红举,西南大学文学院)专心-专注-专业