一种多概念格横向合并算法的分析与实现.docx

上传人:飞****2 文档编号:54340642 上传时间:2022-10-28 格式:DOCX 页数:5 大小:17.84KB
返回 下载 相关 举报
一种多概念格横向合并算法的分析与实现.docx_第1页
第1页 / 共5页
一种多概念格横向合并算法的分析与实现.docx_第2页
第2页 / 共5页
点击查看更多>>
资源描述

《一种多概念格横向合并算法的分析与实现.docx》由会员分享,可在线阅读,更多相关《一种多概念格横向合并算法的分析与实现.docx(5页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、山西大学本科毕业论文(设计)开题报告姓 名毛博韬学 号所在专业软件工程论文(设计)题目一种多概念格横向合并算法的分析与实现选题的目的和意义:作为形式概念分析的核心数据结构- 概念格自从提出以来已经引起了人们的广泛关注, 并且已经在知识发现、软件工程、信息检索等诸多领域得到了一定的应用。概念格的构造是概念格应用的前提。由于概念格自身的完备性, 构造概念格的时间复杂度一直是影响形式概念分析应用的主要障碍。 研究采用新的方法和手段来构造概念格, 就成为概念格研究的主要内容之一。随着网络技术特别是互联网的飞速发展, 数据分布式存储与并行处理的需求越来越迫切。 概念格的分布处理思想就是通过形式背景的拆分

2、, 形成分布存储的多个子背景, 然后构造相应的子概念格, 再由子概念格的合并得到所需的概念格。也就是说通过多个概念格的合并来构造所需的概念格。形式背景的拆分有横向和纵向之分。 因而, 多概念格的合并就有横向合并和纵向合并两种。在这里研究的是一种多概念格横向合并算法。文献综述(国内外研究现状、研究方向、进展情况、存在问题等,并列出所查阅的主要国内外参考文献,要求3000字以上):一数据挖掘技术的产生和发展我们现在已经生活在一个网络化的时代,通信、计算机和网络技术正改变着整个人类和社会。如果用芯片集成度来衡量微电子技术,用CPU处理速度来衡量计算机技术,用信道传输速率来衡量通信技术,那么摩尔定律告

3、诉我们,它们都是以每18个月翻一番的速度在增长,这一势头已经维持了十多年。大量信息在给人们带来方便的同时也带来了一大堆问题:第一是信息过量,难以消化;第二是信息真假难以辨识;第三是信息安全难以保证;第四是信息形式不一致,难以统一处理。人们开始提出一个新的口号:“要学会抛弃信息”。人们开始考虑:“如何才能不被信息淹没,而是从中及时发现有用的知识、提高信息利用率?”面对这一挑战,数据开采和知识发现(DMKD)技术应运而生,并显示出强大的生命力。数据挖掘其实是一个逐渐演变的过程,电子数据处理的初期,人们就试图通过某些方法来实现自动决策支持,当时机器学习成为人们关心的焦点.机器学习的过程就是将一些已知

4、的并已被成功解决的问题作为范例输入计算机,机器通过学习这些范例总结并生成相应的规则,这些规则具有通用性,使用它们可以解决某一类的问题.随后,随着神经网路技术的形成和发展,人们的注意力转向知识工程,知识工程不同于机器学习那样给计算机输入范例,让它生成出规则,而是直接给计算机输入已被代码化的规则,而计算机是通过使用这些规则来解决某些问题。专家系统就是这种方法所得到的成果,但它有投资大、效果不甚理想等不足。80年代人们又在新的神经网络理论的指导下,重新回到机器学习的方法上,并将其成果应用于处理大型商业数据库。随着在80年代末一个新的术语,它就是数据库中的知识发现,简称KDD(Knowledge di

5、scovery in database).它泛指所有从源数据中发掘模式或联系的方法,人们接受了这个术语,并用KDD来描述整个数据发掘的过程,包括最开始的制定业务目标到最终的结果分析,而用数据挖掘(data mining)来描述使用挖掘算法进行数据挖掘的子过程。但最近人们却逐渐发现数据挖掘中有许山西大学本科毕业论文(设计)开题报告多工作可以由统计方法来完成,并认为最好的策略是将统计方法与数据挖掘有机的结合起来。数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。简而言之,数据挖掘其实是一类深层次的数据

6、分析方法。数据分析本身已经有很多年的历史,只不过在过去数据分析和分析的目的是用于科学研究,另外,由于当时计算能力的限制,对大数据量进行分析的复杂数据分析方法受到很大限制。现在,由于各行业业务自动化的实现,商业领域产生了大量的业务数据,这些数据不再是为了分析的目的而收集的,而是由于纯机会的(Opportunistic)商业运作而产生。分析这些数据也不再是单纯为了研究的需要,更主要是为商业决策提供真正有价值的信息,进而获得利润。但所有企业面临的一个共同问题是:企业数据量非常大,而其中真正有价值的信息却很少,因此从大量的数据中经过深层分析,获得有利于商业运作、提高竞争力的信息,就像从矿石中淘金一样,

7、数据挖掘也因此而得名。因此,数据挖掘可以描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。数据挖掘的任务主要是关联分析、聚类分析、分类、预测、时序模式和偏差分析等。关联规则挖掘是由rakesh apwal等人首先提出的。两个或两个以上变量的取值之间存在某种规律性,就称为关联。数据关联是数据库中存在的一类重要的、可被发现的知识。关联分为简单关联、时序关联和因果关联。关联分析的目的是找出数据库中隐藏的关联网。一般用支持度和可信度两个阀值来度量关联规则的相关性,还不断引入兴趣度、相关性等参数,使得所挖掘的规则更符合需

8、求。聚类是把数据按照相似性归纳成若干类别,同一类中的数据彼此相似,不同类中的数据相异。聚类分析可以建立宏观的概念,发现数据的分布模式,以及可能的数据属性之间的相互关系。分类就是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构造模型,一般用规则或决策树模式表示。分类是利用训练数据集通过一定的算法而求得分类规则。分类可被用于规则描述和预测。预测是利用历史数据找出变化规律,建立模型,并由此模型对未来数据的种类及特征进行预测。预测关心的是精度和不确定性,通常用预测方差来度量。时序模式是指通过时间序列搜索出的重复发生概率较高的模式。与回归一样,它也是用己知的数据预测

9、未来的值,但这些数据的区别是变量所处时间的不同。在偏差中包括很多有用的知识,数据库中的数据存在很多异常情况,发现数据库中数据存在的异常情况是非常重要的。偏差检验的基本方法就是寻找观察结果与参照之间的差别。现在先进的数据挖掘工具都提供多种可供选择的数据挖掘算法,因为一种算法不可能完成所有的不同类型的数据挖掘任务,没有一种数据挖掘的方法可以应付所有的要求。对于某一特定的问题,数据本身的特点会影响工具的选择。目前最流行的几种数据挖掘方法有决策树、神经网络、遗传算法、概率论和数理统计以及关联规则等。顾名思义,决策树就像一棵树,它利用树的结构将记录数据进行分类,树的一个节点就代表某一个条件下的一个记录集

10、,根据记录字段的不同取值建立树的分枝;在每个分支子集中建立下层节点和分支,就形成一个决策树。采用决策树,可以将数据规则可视化,也不需要长时间的构造过程,而且每一条从根结点到叶节点的路径的含义是可理解的,精度较高。这种可理解性是它的一个显著有点。神经网络是模拟人类的形象直觉思维,在生物神经网络研究的基础上,根据生物神经元和神经网络的特点,通过简化、归纳、提炼总结出来的一类并行处理网络,利用其非线性映射的思想和并行处理的方法,用神经网络本身的结构来表达输入和输出的关联知识。目前神经网络主要用于两类问题的研究,即:分类和回归。最常用的有基于自组织神经网络的数据挖掘和基于模糊神经网络的山西大学本科毕业

11、论文(设计)开题报告数据挖掘两种。遗传算法是一种基于生物自然选择与遗传机理的随即搜索算法。根据适应度的大小,选择部分后代,淘汰部分后代,从而保持种群大小是常数,适应度高的个体被选中的概率高,这样经过若干代的选择之后,算法收敛于组好的个体,这很可能就是问题的最优解或次优解。二多概念格的研究现状及发展自从德国的Wille 教授提出了形式概念分析 1 以来, 作为形式概念分析的核心数据结构- 概念格已经引起了人们的广泛关注, 并且已经在知识发现、软件工程、信息检索等诸多领域得到了一定的应用 2 4 。概念格的构造是概念格应用的前提。 由于概念格自身的完备性, 构造概念格的时间复杂度一直是影响形式概念

12、分析应用的主要障碍。 研究采用新的方法和手段来构造概念格, 就成为概念格研究的主要内容之一。 现在已经提出了构造概念格的多种算法, 取得了一系列重要成果 5 7 , 但是这些研究基本上是针对单个概念格的。随着网络技术特别是互联网的飞速发展, 数据分布式存储与并行处理的需求越来越迫切。 概念格的分布处理 8 思想就是通过形式背景的拆分, 形成分布存储的多个子背景, 然后构造相应的子概念格, 再由子概念格的合并得到所需的概念格。 也就是说通过多个概念格的合并来构造所需的概念格。参考文献: 1 Gant er B,Wille R. Formal Concept Analysis:Mathematic

13、al FoundationsM . Berlin: Springer-Verlag, 1999. 2 Baltasar Fernandez-Manjon, Alfredo Fernandez-Valmayor. Building educational tools based on formal concept analysis J .Educat ion and Information Technologies, 1998, 3(3- 4) : 187- 201. 3 U Krohn, N J Davies, R Weeks. Concept lattices f or knowl edge

14、 management J . BT Technol J, 1999, 17( 4) : 108- 113. 4 S O Kuznetsov. Machine learning on the basis of formal concept analysis J .Automation and Remote Control, 2001, 62( 10) : 1543- 1564. 5 Godin R, Missaoui R, Alaoui H. Increment al concept formation algorithmsbased on Galois ( concept ) lattice

15、s J . Comput ational Int ell-igence, 1995, 11( 2) : 246- 267. 6 Sergei O Kuznetsov, Sergei A Obiedkov.Algorithms for the constructionof concept latt ices and their diagram graphs A . PKDD 2001, LNAI2168C . Freiburg: Springer-Verlag Heidelberg, 2001. 289- 300. 7 谢志鹏, 刘宗田. 概念格的快速渐进式构造算法 J . 计算机学报, 200

16、2, 25(5) : 490- 496. 8 Yun Li, Zongtian Liu, et al. Theoretical research on the distribut ed con construction of concept lattices A . Proceedings of the Second Internat ional Conference on Machine Learning and Cybernet ics C . Xian: Inst-itude of Electrical and El ectronics, 2003. 474- 479. 9 Zongti

17、an Liu, Liangsheng Li, Qing Zhang. Research on a union algorithm of multiple concept latt ices A . RSFDGrC 2003, LNAI 2639 C . Berlin: Springer-Verlag Heidelberg, 2003. 533- 540. 10 李云, 刘宗田, 陈等. 基于属性的概念格渐进式生成算法 J .小型微型计算机系统, 2004, 25( 10) : 1768- 1771.注:不够可加页。山西大学本科毕业论文(设计)开题报告主要研究内容:1. 针对划分的子形式背景构建

18、其相应的概念格。 2. 使用多概念格的横向合并算法(Horizontal Union Algorithm of Multiple Concept Lattices, 简记为HUMCL 算法)将子概念格合并。 3.实现多概念格横向合并系统。创新之处(如无可不填):山西大学本科毕业论文(设计)开题报告研究路线、方法、措施及实践方案或实验设计:1.根据实际情况将原形式背景通过横向划分为几个子形式背景。 2.通过渐进式概念格构造算法构造出子形式背景所对应的子概念格。 3.通过humcl算法将子概念格合并成原形式背景所对应的原概念格。 4.实现多概念格横向合并系统。 实践方案: 编程语言: Java 。

19、这个系统的实现我计划通过Java来完成。因为Java是一种可以撰写跨平台应用软件的面向对象的程序设计语言,而且提供了方便实用的API供用户使用。 系统整体上通过MVC三层架构体系来实现,分为UI层、Service层和Dao层。UI即为系统界面,这里会提供一个main函数来作为系统的主函数,UI层要调用Service层的方法。Service层是服务层,这里是方法调用的中转站,它调用Dao层里方法的具体实现。Dao层提供所有方法的实现,并与数据库相连接。 数据库使用MySql,因为MySql是免费的而且很实用。 这里系统可以操作的数据可以是数据库里边的数据,也能是导入的外部数据。指导教师意见: 签字: 年 月 日学院意见: 签字: 年 月 日

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁