《毕业论文外文翻译-企业信息化背景下的信息提取系统.doc》由会员分享,可在线阅读,更多相关《毕业论文外文翻译-企业信息化背景下的信息提取系统.doc(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Information extraction system: design and its commercial use After more than 30 years of development of the Information Extraction?(IE) system, it comes to be the focus of the attention of the researchers of information retrieval, database system and natural language processing. The reason is very s
2、imple. Because the traditional information search engine can only give the result of relevant pieces of documents and information users must read them by themself to check if the documents match their requirements or not, but the IE system give the facts directly to the users. The pressure of the in
3、formation explosion makes it impossible to read all the documents, news or Internet pages to locate their interested facts. But all the facts are important for the information usersto make any decision. IE system can help them to archive the goal, which is to know all the things that happened in the
4、 domain which they are interesting. The Information Extraction system filters the great amounts of documents that were written in nature human language or formatted in semi-structured to get the useful description ofthe facts which are interested by the information users. The shallow parsing technol
5、ogy in sentence semantic analysis is the most popular method in the IE system. Most of IE systems use such technology to catch the information points in the text. Then, after post processing, such as co-reference analysis or repeated-facts clearing, all the filtered information points were put into
6、slots of a well-structured template. All the filled templates combine the database which will be outputted. The output data can be read by human being or transfer to an automatic analysis program to process. During the research of the IE system, we know it is veryimportant to have the enough technol
7、ogy backup. The ability of nature language processing, large-scale programming system development and some very serious knowledge base, such as syntactic and semantic dictionary and tree-bank corpus are the necessary parts of the backup. Today, a practically large-scale Information Extraction system
8、 with the ability of easy domain-transformation is the main target of the research of IE. In this thesis, firstly, the development of a prototype of universal Information Extraction system is described. The main features of this system are: 1) using shallow parsing technology with sentence semantic
9、template to extract the information in the text; 2) Easy modular-expansion or exchange;3) multi-thread programming mechanics are used to improve the processing speed; 4) Chinese language is its working language. Secondly, the research of how the IE system to improve the enterprise information utiliz
10、ing are also discussed. Today, many large Chinese enterprises use MIS, MRP-II or ERP system to improve their business management. The knowledge management technology is a very important aid to help the development of the enterprise. IE system can become the main part of the knowledge management syst
11、em. Last part of this thesis is about how to build a proper business model for a practical IE system. Because of the fast development of the Internet, the basic information management technology, such as search engine, has become the base of a business empire. Yahoo is the most famous one. Does the
12、IE technology can? I put forward my opinion that the IE system is avery useful and important information management tool in business but it can not be served as a search engine for public information user on the Internet recently. It can only run behind the scene and be controlled by human experts t
13、o collect information from the Internet. The collected information must take a post-process before it can be provided to the end user.企业信息化背景下的信息提取系统信息提取系统从诞生到现在已经大约30多年了,最近10年得到特别重视,并且成为信息检索系统、数据库系统以及自然语言处理系统发展的热门领域。原因很简单,传统的信息检索只能向用户提供相关性的结果,是否对用户有用还需要用户自己去判断。面对网络时代信息量快速膨胀,以及信息用户要求提供精确和有用的直接信息的双重压
14、力,信息服务者必须掌握更有效地分析信息,从海量信息中提取重要或关键信息的手段。信息提取系统的要点在于通过过滤大量的非格式化或半格式化的文本资料,使用自然语言处理技术中的浅层分析手段,捕捉文本中有用的信息点并填写到所谓的信息槽中,并经过后处理,如解决共指成分,消除重复信息等过程,将难以用人力全部阅读并进行情报分析的自然语言文本过滤掉那些对于解决特定问题的无效内容,并将有用内容转换成容易用人工或机器进行分析的格式化数据。?在信息提取系统的研究过程中,需要丰富的自然语言、形式语言的研究能力和技术储备,以及数据库系统、大规模软件工程开发的能力。大规模,而且具有较高的领域移植能力的通用信息提取系统是研究
15、工作的发展方向。在本论文研究工作中,作者所在的研究小组试图建立一种信息系统的开发原型,其特点在于利用浅层语法语义分析系统配合句法模版提取信息,并充分利用现代计算机系统并行处理的优势,使用多线程的编程技巧充分利用计算机的处理能力加速信息提取系统的运行速度。信息提取系统对于现代化的情报分析工作已经成为必要的和不可缺少的辅助工具了。国外因为人力资源价值高昂的缘故,应用尤其广泛,甚至为了加快信息系统的数据录入工作而在数据库的信息录入模块中嵌入简化的使用自然语言分析技术的信息提取模块。而使用信息提取技术构建数据库,提供定题情报以及分析结果给用户使用的信息服务公司更是兴旺发达,有些已经可以提供有效的经济分
16、析数据供工商业用户使用,并开始大量盈利。?在中国企业的信息化进程中,在使用MIS以及ERP软件完成了财务以及开发、采购、生产、销售的全过程的信息化任务后,知识管理系统成为对于企业发展最有推动力的信息技术。而有效的情报分析工作,更是制定企业发展战略以及企业运作决策的支柱。信息提取技术完全可以成为支持企业信息化工作中这两方面工作的核心软件。探索如何使信息提取技术顺利地融入企业信息化系统之中,让信息提取系统进入商业化运作道路,包括商业运作模式以及商业运作技巧,使系统开发有着更扎实地实用化背景,也是本课题的研究目标之一。Yahoo的系统开发与商业运作经验充分证明了商业化运作是技术开发可以?获得成功的关
17、键因素。在Internet时代,网络是信息提取系统的最主要的信息来源之一。信息提取系统的运行需要Internet的支持。和网络的结合将是信息提取系统获得成功的必由之路。另外,在某些领域,例如在军事情报分析或者辅助分析领域,信息提取技术一样可以显示巨大的应用潜力。五分钟搞定5000字毕业论文外文翻译,你想要的工具都在这里!在科研过程中阅读翻译外文文献是一个非常重要的环节,许多领域高水平的文献都是外文文献,借鉴一些外文文献翻译的经验是非常必要的。由于特殊原因我翻译外文文献的机会比较多,慢慢地就发现了外文文献翻译过程中的三大利器:Google“翻译”频道、金山词霸(完整版本)和CNKI“翻译助手。具
18、体操作过程如下: 1.先打开金山词霸自动取词功能,然后阅读文献; 2.遇到无法理解的长句时,可以交给Google处理,处理后的结果猛一看,不堪入目,可是经过大脑的再处理后句子的意思基本就明了了; 3.如果通过Google仍然无法理解,感觉就是不同,那肯定是对其中某个“常用单词”理解有误,因为某些单词看似很简单,但是在文献中有特殊的意思,这时就可以通过CNKI的“翻译助手”来查询相关单词的意思,由于CNKI的单词意思都是来源与大量的文献,所以它的吻合率很高。 另外,在翻译过程中最好以“段落”或者“长句”作为翻译的基本单位,这样才不会造成“只见树木,不见森林”的误导。四大工具: 1、Google翻
19、译: google,众所周知,谷歌里面的英文文献和资料还算是比较详实的。我利用它是这样的。一方面可以用它查询英文论文,当然这方面的帖子很多,大家可以搜索,在此不赘述。回到我自己说的翻译上来。下面给大家举个例子来说明如何用吧比如说“电磁感应透明效应”这个词汇你不知道他怎么翻译,首先你可以在CNKI里查中文的,根据它们的关键词中英文对照来做,一般比较准确。 在此主要是说在google里怎么知道这个翻译意思。大家应该都有词典吧,按中国人的办法,把一个一个词分着查出来,敲到google里,你的这种翻译一般不太准,当然你需要验证是否准确了,这下看着吧,把你的那支离破碎的翻译在google里搜索,你能看到
20、许多相关的文献或资料,大家都不是笨蛋,看看,也就能找到最精确的翻译了,纯西式的!我就是这么用的。 2、CNKI翻译: CNKI翻译助手,这个网站不需要介绍太多,可能有些人也知道的。主要说说它的有点,你进去看看就能发现:搜索的肯定是专业词汇,而且它翻译结果下面有文章与之对应(因为它是CNKI检索提供的,它的翻译是从文献里抽出来的),很实用的一个网站。估计别的写文章的人不是傻子吧,它们的东西我们可以直接拿来用,当然省事了。网址告诉大家,有兴趣的进去看看,你们就会发现其乐无穷!还是很值得用的。 3、网路版金山词霸(不到1M): 4、有道在线翻译:翻译时的速度:这里我谈的是电子版和打印版的翻译速度,按
21、个人翻译速度看,打印版的快些,因为看电子版本一是费眼睛,二是如果我们用电脑,可能还经常时不时玩点游戏,或者整点别的,导致最终SPPEED变慢,再之电脑上一些词典(金山词霸等)在专业翻译方面也不是特别好,所以翻译效果不佳。在此本人建议大家购买清华大学编写的好像是国防工业出版社的那本英汉科学技术词典,基本上挺好用。再加上网站如:google CNKI翻译助手,这样我们的翻译速度会提高不少。具体翻译时的一些技巧(主要是写论文和看论文方面) 大家大概都应预先清楚明白自己专业方向的国内牛人,在这里我强烈建议大家仔细看完这些头上长角的人物的中英文文章,这对你在专业方向的英文和中文互译水平提高有很大帮助。
22、我们大家最蹩脚的实质上是写英文论文,而非看英文论文,但话说回来我们最终提高还是要从下大工夫看英文论文开始。提到会看,我想它是有窍门的,个人总结如下: 1、把不同方面的论文分夹存放,在看论文时,对论文必须做到看完后完全明白(你重视的论文);懂得其某部分讲了什么(你需要参考的部分论文),在看明白这些论文的情况下,我们大家还得紧接着做的工作就是把论文中你觉得非常巧妙的表达写下来,或者是你论文或许能用到的表达摘记成本。这个本将是你以后的财富。你写论文时再也不会为了一些表达不符合西方表达模式而烦恼。你的论文也降低了被SCI或大牛刊物退稿的几率。不信,你可以试一试 2、把摘记的内容自己编写成检索,这个过程是我们对文章再回顾,而且是对你摘抄的经典妙笔进行梳理的重要阶段。你有了这个过程。写英文论文时,将会有一种信手拈来的感觉。许多文笔我们不需要自己再翻译了。当然前提是你梳理的非常细,而且中英文对照写的比较详细。 3、最后一点就是我们往大成修炼的阶段了,万事不是说成的,它是做出来的。写英文论文也就像我们小学时开始学写作文一样,你不练笔是肯定写不出好作品来的。所以在此我鼓励大家有时尝试着把自己的论文强迫自己写成英文的,一遍不行,可以再修改。最起码到最后你会很满意。呵呵,我想我是这么觉得的。