自然语言理解技术.doc

上传人:飞****2 文档编号:52747230 上传时间:2022-10-23 格式:DOC 页数:6 大小:25KB
返回 下载 相关 举报
自然语言理解技术.doc_第1页
第1页 / 共6页
自然语言理解技术.doc_第2页
第2页 / 共6页
点击查看更多>>
资源描述

《自然语言理解技术.doc》由会员分享,可在线阅读,更多相关《自然语言理解技术.doc(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、自然语言理解技术,未来人工智能的核动力 摘要:自然语言理解是人工智能研究重要的领域之一,同时也是目前前沿的难题之一。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,是未来人工智能的核动力。因此理解自然语言理解以及自然语言理解技术的含义,阐述自然语言理解的研究及其相关应用,综述自然语言理解技术研究方向变化并对自然语言理解的发展前景进行分析和展望,是十分有意义的。关键词:自然语言理解技术;智能信息服务;1.引言:随着计算机科学的不断发展和成熟,计算机应用开始迈人知识处理、语言理解阶段,人们对计算机的智能提出了新的要求随着社会的日益信息化,人们越来越强烈地希望能更好地同计算机交流。

2、自然语言就是这样一个媒介。2. 1自然语言理解的含义:广义的“语言”是任何一种有结构的符号系统。其中, 最重要的两类语言,自然语言和形式语言。而狭义的“语言”是人类在社会牛活中发展出来的用来互相交际的声音符号系统,是“自然语言”。“自然语言理解”即Natural Language Understanding 俗称人机对话,指的就是使计算机来按照这种语言所表达的意义做出相应反应的机制。它主要研究用电子计算机模拟人的语言交际过程,使计算机能理解和运用人类社会的自然语言如汉语、英语等,实现人机之间的自然语言通信,以代替人的部分脑力劳动,包括查询资料、解答问题、摘录文献、汇编资料以及一切有关自然语言信

3、息的加工处理。这在当前新技术革命的浪潮中占有十分重要的地位。自然语言理解是计算机科学中的一个引人入胜的、富有挑战性的课题。从计算机科学特别是从人工智能的观点看,自然语言理解的任务是建立一种计算机模型,这种计算机模型能够给出象人那样理解、分析并回答自然语言(即人们日常使用的各种通俗语言)的结果。2. 1自然语言理解技术的含义:首先, 自然语言是极其复杂的符号系统。一个人尽管可以对自己的母语运用自如, 但却无法把自己母语的构成规律、意义的表达规律和语言使用的规律用计算机可以接受的方式彻底说清楚。传统的语言学是在没有计算机参照的条件下发展起来的, 虽然为自然语言理解积累了宝贵的财富, 但那是讲给人的

4、, 真正要让语言学知识变成计算机上可操作的, 绝不是那么简单, 也不能那么模糊。这个目标的实现,需要大量又懂语言学又懂计算机的人在正确的技术路线的指导下一起做非常大规模的基本建设, 绝不是一拍脑袋想出个“绝招”就能解决的。其次, 自然语言的各个层次上都含有巨大的不确定性。在语音和文字层次上,有一字多音、一音多字的问题; 在词法和句法层次上, 有词类词性、词边界、句法结构的不确定性问题; 在语义和语用层次上, 也有大量的因种种原因造成的内涵、外延、指代、言外之义的不确定性。语言学上把这些不确定性叫做“歧义”。歧义一般不能通过发生歧义的语言单位自身获得解决, 而必须借助于更大的语言单位乃至非语言的

5、环境背景因素和常识来解决。人类有很强的依靠整体消除局部不确定性的能力和常识推理能力, 体现在语言上就是利用语境信息和常识消除歧义的能力。使计算机获得同样强大的能力, 是从事自然语言理解的学者梦寐以求的目标。另外, 自然语言不是一成不变的死的语言, 它在社会生活中发展, 在操不同语言和同一语言的不同变体的人们之间的相互影响中变化。一个词、一个说法可能在一夜之间突然流行起来; 特殊的人群结构变化会导致新的语言或新的语言变体 (如方言) 的出现。这些都要求理解自然语言的计算机程序要具有对外界语言环境的应变能力。最后一点, 自然语言是人们交流思想的工具。既然交流的是思想, 那思想本身在计算机里的组织结

6、构就显得格外重要。在人工智能里, 这就是“知识表示”的问题。可以说, 在知识表示问题上的突破, 对于自然语言理解的进展将产生决定性的影响。在上述四个方面, 都有许多学者在勇敢地迎接挑战, 使计算机程序一步步地朝着不限领域的自然语言理解的远大目标前进。3.1自然语言处理的层次1.语音分析 根据音位规则,从语音流中区分出一个个独立的音素,再根据音位形态规则找出一个个音节及其对应的词素或词。2.词法分析分析目的是找出词汇的各个词素,从中获得语言学的信息。3.句法分析 对句子和短语的结构进行分析,目的是找出词、短语等的相互关系以及各自在句中的作用。4.语义分析 分析目的是找出词义、结构意义及其结合意义

7、,从而确定语言所表达的真正含义或概念。5.语用分析研究语言所存在的外界环境对语言使用者所产生的影响。3.2自然语言理解的主要思想:1.认知学观点将人类视为一种高级信息处理系统,强调对于人类智能活动的研究以及在计算机上的模拟和实现。2.语用学观点 将语言视为人与人之间的通信媒介,任何对于话语的理解或生成都不能脱离该话语存在的前后语境和该话语使用者的心理背景。3.语言学观点对自然语言进行研究的最初也是最基本的方法,强调对于句子结构和语法的研究,重点在于描述语言,寻找或构造一组能包含尽可能多的语言现象的普遍适用的语法规则。4.1自然语言理解技术研究方向变化:大约90年代开始,自然语言处理领域发生了巨

8、大的变化。这种变化的两个明显的特征是: (1)对系统输入,要求研制的自然语言处理系统能处理大规模的真实文本,而不是如以前的研究性系统那样,只能处理很少的词条和典型句子。只有这样,研制的系统才有真正的实用价值。 (2)对系统的输出,鉴于真实地理解自然语言是十分困难的,对系统并不要求能对自然语言文本进行深层的理解,但要能从中抽取有用的信息。例如,对自然语言文本进行自动地提取索引词,过滤,检索,自动提取重要信息,进行自动摘要等等。 同时,由于强调了“大规模”,强调了“真实文本”,下面两方面的基础性工作也得到了重视和加强。 (1)大规模真实语料库的研制。大规模的经过不同深度加工的真实文本的语料库,是研

9、究自然语言统计性质的基础。没有它们,统计方法只能是无源之水。 (2)大规模、信息丰富的词典的编制工作。规模为几万,十几万,甚至几十万词,含有丰富的信息(如包含词的搭配信息)的计算机可用词典对自然语言处理的重要性是很明显的。 虽然上述新趋势给自然语言处理领域带来了成果,但从理论方法的角度看,由于采集、整理、表示和有效应用大量知识的困难,这些系统更依赖于统计学的方法和其他“简单”的方法或技巧。而这些统计学的方法和其他“简单”的方法似乎也快达到它们的极限了,因此,目前在自然语言处理界广泛争论的一个问题便是:要取得新的更大的进展,主要有待于理论上的突破呢,还是可由目前已有的方法的完善和优化实现?答案还

10、不清楚。大致上,更多的语言学家倾向于前一种意见,而更多的工程师则倾向于后一种意见。回答或许在“中间”,即应将基于知识和推理的深层方法与基于统计等“浅层”方法结合起来。 4.2发展历程:现在的计算机的智能还远远没有达到能够象人一样理解自然语言的水平,而且在可预见的将来也达不到这样的水平。因此,关于计算机对自然语言的理解一般是从实用的角度进行评判的。如果计算机实现了人机会话,或机器翻译,或自动文摘等语言信息处理功能,则认为计算机具备了自然语言理解的能力。目前存在的问题有两个方面:一方面,迄今为止的语法都限于分析一个孤立的句子,上下文关系和谈话环境对本句的约束和影响还缺乏系统的研究,因此分析歧义、词

11、语省略、代词所指、同一句话在不同场合或由不同的人说出来所具有的不同含义等问题,尚无明确规律可循,需要加强语用学的研究才能逐步解决。另一方面,人理解一个句子不是单凭语法,还运用了大量的有关知识,包括生活知识和专门知识,这些知识无法全部贮存在计算机里。因此一个书面理解系统只能建立在有限的词汇、句型和特定的主题范围内;计算机的贮存量和运转速度大大提高之后,才有可能适当扩大范围.4.2.1我国的发展状况:我国自然语言理解的研究起步较晚,比国外晚了17年。国外在1963年就建成了早期的自然语言理解系统,而我国直到1980年才建成了两个汉语自然语言理解模型,都以人机对话的方式来实现。八十年代中期,在国际新

12、一代计算机激烈竞争的影响下,自然语言理解的研究在国内得到了更多的重视,自然语言理解和人机接口列入了新一代计算机的研制规划,研究单位增多了,研究队伍也壮大了。自然语言处理研究在电子计算机问世之初就开始了,并于 50年代初开展了机器翻译试验。当时的研究方法还不能称作带有智能。到了60年代乔姆斯基的转换生成语法得到广泛的认可,生成语法的核心是短语结构规则,分析句子结构的过程就是利用规则自顶向下或自底向上的句法树生成过程。60年代至70年代初期,研究工作一直停留在单词的语音识别上,进展不大。直到70年代中期才有所突破,建立了一些实验系统,能够理解连续语音的内容,但是还限于少数简单的语句大约90年代开始

13、,自然语言处理领域发生了巨大的变化。这种变化的两个明显的特征是: (1)对系统输入,要求研制的自然语言处理系统能处理大规模的真实文本,而不是如以前的研究性系统那样,只能处理很少的词条和典型句子。只有这样,研制的系统才有真正的实用价值。 (2)对系统的输出,鉴于真实地理解自然语言是十分困难的,对系统并不要求能对自然语言文本进行深层的理解,但要能从中抽取有用的信息。例如,对自然语言文本进行自动地提取索引词,过滤,检索,自动提取重要信息,进行自动摘要等等。 同时,由于强调了“大规模”,强调了“真实文本”,下面两方面的基础性工作也得到了重视和加强。 (1)大规模真实语料库的研制。大规模的经过不同深度加

14、工的真实文本的语料库,是研究自然语言统计性质的基础。没有它们,统计方法只能是无源之水。 (2)大规模、信息丰富的词典的编制工作。规模为几万,十几万,甚至几十万词,含有丰富的信息(如包含词的搭配信息)的计算机可用词典对自然语言处理的重要性是很明显的。 5结论:自然语言处理意义在于:一方面,如果计算机能够理解、处理自然语言,将是计算机技术的一项重大突破;另一方面,自然语言处理有助于揭开人类高度智能的奥秘,深化对语言能力和思维本质的认识。和人类进步过程中其他任何一种技术的发展历程一样,自然语言理解技术在任何一个不同的成熟阶段都有一个不同的应用形式和不同的市场定位。在这种技术到市场再到技术的螺旋式上升

15、的过程中,技术越来越成熟,市场也越来越成熟,从而让技术更好地为人类服务。自然语言理解技术给人工智能服务提供了威力巨大的核动力,智能信息服务给人类更自然、自主的信息交流手段,将创造出全新的产业空间。人们渴望发展自然语言理解技术以加速信息、知识与文化的交流,促进社会、经济、科学的进步,这是自然语言理解技术新的强大的推动力量,也是每一个国家都面临的新的挑战。参考文献 :1黄培红基于自然语言理解的认知系统算法初探一人机对话系统算法基础与构造C2004计算机应用技术交流会议论文集2004:2362402 黄培红自然语言理解的机器认知形式系统J湖南:计算机工程与科学,2007,29(6):l13一l163 姚天顺,自然语言理解一种让机器懂得人类语言的研究,清华大学、广西科技出版社,2002(第二版)。4刘伟权. 自然语言理解与汉语文本信息处理理论研究博士论文) D . 北京:北京邮电大学,1997.5 王小捷,常宝宝,自然语言处理基础,北京邮电大学出版社,2002。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁