《数据仓库与数据挖掘.ppt》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘.ppt(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数据仓库与数据挖掘数据仓库与数据挖掘123数据仓库及数据挖掘数据仓库及数据挖掘10网编二班数据仓库概念数据仓库概念 数据仓库的数据量很大,具有GB级到TB级的数据量。而一般的数据库是以二维平面结构形式存储数据,数据量一般为MB级别。数据仓库(Data Warehouse)是一个面向主题的、集成的、稳定的、包含历史数据的数据集合,它用于支持管理中的决策制定过程。数据仓库不仅包含分析所需的数据,而且包含处数据所需的应用程序,这些序包括将数据由外部体转人数据仓库的应用程序,也包括了将数据加以析并呈现给用户的应用程序10网编二班数据挖掘概念数据挖掘概念数据挖掘是从数据库中发现知识(Knowledge
2、Discovery in Database,KDD)的核心技术,它是从人工智能的机器学习(Machine Learning,ML)中发展起来的。数据挖掘(data mining,DM)就是通过对大型数据库和数据仓库中大量似乎无关的数据进行分析,以便发现并提取隐藏在数据深处的、人们事先不知道的、但是潜在有用的信息、知识和规律的过程。数据挖掘是一种基于发现的方法,它能够自动分析数据并进行归纳性的推理,从中挖掘出潜在的规律或模式,以帮助管理决策者建立新的模型。10网编二班数据仓库与数据挖掘共同点数据仓库与数据挖掘共同点两者都是在数据库的基础上发展起来的,它们都是决策支持新技术。数据仓库利用综合数据得
3、到宏观信息,利用历史数据进行预测;而数据挖掘是从数据库中挖掘知识,也用于决策分析。虽然数据仓库和数据挖掘是两项不同的技术,但是它们又有共同之处。虽然数据仓库和数据挖掘支持决策分析的方式不同,但是它们完全可以结合起来,提高决策分析的能力。10网编二班数数据据仓仓库库系系统统的的架架构构数据仓库构架数据仓库构架数数据据仓仓库库设设计计数据仓库及数据挖掘数据仓库及数据挖掘10网编二班数据仓库系统的架构系统管理器数据仓库系统的架构系统管理器系系统管理器管理器03系系统管理器管理器02系系统管理器管理器01加载管理器 (LoadManage)仓库管理器(WarehouseManage:)查询管理器(Qu
4、eryManager)10网编二班数据仓库设计数据仓库设计自顶向下的方法自顶向下的方法方法分为以下方法分为以下3种种自底向上的方法自底向上的方法联合方法联合方法10网编二班数据挖掘数据挖掘AB数数据据挖挖掘掘的的主主要要功功能能数数据据挖挖掘掘的的过过程程10网编二班数据挖掘五类功能数据挖掘五类功能自自动动预预测测趋趋势势和和行行为为聚聚类类分分析析概概念念描描述述偏偏差差检检测测联联分分析析10网编二班确确定定业业务务对对象象数数据据准准备备数数据据挖挖掘掘数据挖掘的过程数据挖掘的过程结结果果分分析析知知识识的的同同化化10网编二班数据挖掘常用技术和算法数据挖掘常用技术和算法人工神经人工神经 网络网络决策树决策树遗传算法遗传算法近邻算法近邻算法代表着决策集的树形结构。基于进化理论,并采用遗传结合、遗传变异、以及自然选择等设计方法的优化技术。将数据集合中每一个记录进行分类的方法从统计意义上对数据中的“如果-那么”规则进行寻找和推导。仿照生理神经网络结构的非线形预测模型,通过学习进行模式识别。规则推导规则推导10网编二班Thank you!队员:黄俊雄、唐敬宁、吴朝勇、张裕添队员:黄俊雄、唐敬宁、吴朝勇、张裕添10网编二班信息检索团队网编二班信息检索团队10网编二班