《数据仓库的决策支持学习教案.pptx》由会员分享,可在线阅读,更多相关《数据仓库的决策支持学习教案.pptx(61页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数据仓库的决策数据仓库的决策(juc)支持支持第一页,共61页。51数据仓库的用户 5.2数据仓库的决策支持与决策支持系统5.3 数据仓库应用(yngyng)实例第1页/共60页第二页,共61页。5 51 1数据仓库的用户数据仓库的用户(yngh)(yngh)5.1.1 数据仓库的信息(xnx)使用者5.1.2 数据仓库的探索者第2页/共60页第三页,共61页。数据仓库的用户数据仓库的用户(yngh)(yngh)有两类:信息使用者和探索者有两类:信息使用者和探索者信息使用者是使用数据仓库的大量用户。信息使用者是使用数据仓库的大量用户。信息使用者以一种可预测的、重发性的方式使用数据信息使用者以一
2、种可预测的、重发性的方式使用数据仓库平台仓库平台(pngti)(pngti)。信息使用者通常查看概括数据或聚集数,查看相同的信息使用者通常查看概括数据或聚集数,查看相同的商业维度(如产品、客户、时间)和指标(如收入和商业维度(如产品、客户、时间)和指标(如收入和成本)随时间的发展趋势。成本)随时间的发展趋势。第3页/共60页第四页,共61页。探索者完全不同于信息使用者,他们有一个完全不可预测的、非重复性的数探索者完全不同于信息使用者,他们有一个完全不可预测的、非重复性的数据使用模式。据使用模式。探索者的任务是寻找公司数据内隐含的价值并且根据过去事件努力预测探索者的任务是寻找公司数据内隐含的价值
3、并且根据过去事件努力预测未来决策未来决策(juc)(juc)的结果。的结果。探索者是典型的数据挖掘者。探索者是典型的数据挖掘者。第4页/共60页第五页,共61页。5.1.1 数据仓库的信息(xnx)使用者1.信息使用(shyng)者使用(shyng)数据仓库的性能优化2.探索者使用(shyng)数据仓库的性能优化第5页/共60页第六页,共61页。信息(xnx)使用者的性能需求 l l非规格化非规格化l l规范化的作用是产生一种完全没有规范化的作用是产生一种完全没有数据冗余的设计方法。数据冗余的设计方法。l l但是,有时在数据仓库设计中引入但是,有时在数据仓库设计中引入一些有限的数据冗余来提高数
4、据访一些有限的数据冗余来提高数据访问效果。问效果。l l创建数据阵列创建数据阵列l l 创建数据阵列,将相关类型创建数据阵列,将相关类型(lixng)的数据的数据(如:如:1月、月、2月、月、3月等月份中的数据月等月份中的数据)存储在一起,提存储在一起,提高访问效果。高访问效果。第6页/共60页第七页,共61页。l l预连接表格预连接表格预连接表格预连接表格l l一个公用键和共同使用的数据将表格合并在一起。一个公用键和共同使用的数据将表格合并在一起。一个公用键和共同使用的数据将表格合并在一起。一个公用键和共同使用的数据将表格合并在一起。l l共享一个公用键,可以共享一个公用键,可以共享一个公用
5、键,可以共享一个公用键,可以(ky)(ky)将多个表格合并到一个物理表将多个表格合并到一个物理表将多个表格合并到一个物理表将多个表格合并到一个物理表格中。这样做可以格中。这样做可以格中。这样做可以格中。这样做可以(ky)(ky)很大程度的提高数据访问效率。很大程度的提高数据访问效率。很大程度的提高数据访问效率。很大程度的提高数据访问效率。l l预聚集数据预聚集数据预聚集数据预聚集数据l l根据根据根据根据“滚动概括滚动概括滚动概括滚动概括”结构来组织数据。结构来组织数据。结构来组织数据。结构来组织数据。l l当数据被输入到数据仓库中时,以每小时为基础存储数据。当数据被输入到数据仓库中时,以每小
6、时为基础存储数据。当数据被输入到数据仓库中时,以每小时为基础存储数据。当数据被输入到数据仓库中时,以每小时为基础存储数据。在这一天结束时,以每天为基础存储累加每小时的数据。在在这一天结束时,以每天为基础存储累加每小时的数据。在在这一天结束时,以每天为基础存储累加每小时的数据。在在这一天结束时,以每天为基础存储累加每小时的数据。在一周结束时,以每周为基础存储累加每天的数据。月末时,一周结束时,以每周为基础存储累加每天的数据。月末时,一周结束时,以每周为基础存储累加每天的数据。月末时,一周结束时,以每周为基础存储累加每天的数据。月末时,则以每月为基础存储累加每周的数据。则以每月为基础存储累加每周的
7、数据。则以每月为基础存储累加每周的数据。则以每月为基础存储累加每周的数据。第7页/共60页第八页,共61页。l l聚类数据聚类数据(shj)l l将不同类型的数据将不同类型的数据(shj)记录放置在相同的物记录放置在相同的物理位置。这为用户查看这些记录,可以在同一理位置。这为用户查看这些记录,可以在同一地点找到它们,提高查询效率。地点找到它们,提高查询效率。l l压缩数据压缩数据(shj)l l 压缩可以使可读取的数据压缩可以使可读取的数据(shj)量极大。量极大。第8页/共60页第九页,共61页。l l定期净化数据定期净化数据l l定期删除数据仓库中不需要的数据,可以为每定期删除数据仓库中不
8、需要的数据,可以为每个用户提高性能。个用户提高性能。l l合并合并(hbng)查询查询l l 如果查询定期发生,那么可以通过把这些查如果查询定期发生,那么可以通过把这些查询合并询合并(hbng)到同一个表格中,从而节省大到同一个表格中,从而节省大量资源。量资源。第9页/共60页第十页,共61页。5.1.2 5.1.2 数据仓库的探索者探索者要做的工作有:概括分析、抽取、建模和分类。探索者要做的工作有:概括分析、抽取、建模和分类。(1)(1)概括分析概括分析探索者开始以分析数据的完整性和准确性(数据质量)。在探索者开始以分析数据的完整性和准确性(数据质量)。在概括分析活动中,要询问的典型问题包括
9、:概括分析活动中,要询问的典型问题包括:家庭收入如何分配?家庭收入如何分配?有多少帐户每月消费超过有多少帐户每月消费超过200200元?元?有多少客户有两个以上的小孩有多少客户有两个以上的小孩(xio hi)(xio hi)并居住在市区?并居住在市区?第10页/共60页第十一页,共61页。(2)(2)抽取抽取从数据仓库中抽取指定的数据,并组织起来,送入支持探索者分析的探索仓库从数据仓库中抽取指定的数据,并组织起来,送入支持探索者分析的探索仓库中。中。(3)(3)建模建模探索者通过概括探索者通过概括(giku)(giku)分析来理解数据,通过抽取来准备数据,通过建模来分分析来理解数据,通过抽取来
10、准备数据,通过建模来分析数据。析数据。第11页/共60页第十二页,共61页。建模是开发一种用来描述实体(如客户、商品、渠道等)的关系模型建模是开发一种用来描述实体(如客户、商品、渠道等)的关系模型的过程。探索者使用的模型有:的过程。探索者使用的模型有:客户分段客户分段后续产品后续产品欺诈欺诈(qzh)(qzh)检测检测渠道响应(例如,电话销售和直接邮寄)渠道响应(例如,电话销售和直接邮寄)信用风险信用风险客户生存期价值客户生存期价值推销响应推销响应第12页/共60页第十三页,共61页。例如,例如,利用建模来确认有可能拖延支付电话利用建模来确认有可能拖延支付电话(dinhu)(dinhu)帐单的
11、帐单的客户:客户:首先,建立一个模型(利用统计学和行为科学)来确认首先,建立一个模型(利用统计学和行为科学)来确认经常拖延支付电话经常拖延支付电话(dinhu)(dinhu)帐单的客户特征。帐单的客户特征。然后,根据客户与模型的密切程度,对所有的客户分类。然后,根据客户与模型的密切程度,对所有的客户分类。这样,可以提供谁将不支付电话这样,可以提供谁将不支付电话(dinhu)(dinhu)帐单的某种可帐单的某种可能性预测。能性预测。第13页/共60页第十四页,共61页。5.2 5.2 5.2 5.2 数数数数据据据据(shj)(shj)(shj)(shj)仓仓仓仓的的的的决决决决策策策策支支支支
12、持持持持与与与与决决决决策策策策支支支支持持持持系统系统系统系统5.2.1 查询与报表查询与报表(bobio)5.2.2 多维分析与原因分析多维分析与原因分析5.2.3 预测未来预测未来5.2.4 实时决策实时决策5.2.5 自动决策自动决策5.2.6 决策支持系统决策支持系统第14页/共60页第十五页,共61页。数据仓库是一种能够提供重要战略信息,并获得竞争优势的新技术,数据仓库是一种能够提供重要战略信息,并获得竞争优势的新技术,从而得到迅速的发展。从而得到迅速的发展。具体的战略信息有:具体的战略信息有:给出销售量最好的产品名单给出销售量最好的产品名单找出出现问题的地区(切片)找出出现问题的
13、地区(切片)追踪查找出现问题原因(向下追踪查找出现问题原因(向下(xin xi)(xin xi)钻取)钻取)对比其他的数据(横向钻取)对比其他的数据(横向钻取)显示最大的利润显示最大的利润当一个地区的销售低于目标值时,提出警告信息。当一个地区的销售低于目标值时,提出警告信息。第15页/共60页第十六页,共61页。建立数据仓库的目的不只是为了存储更多的数据,而是要对这些数据进建立数据仓库的目的不只是为了存储更多的数据,而是要对这些数据进行处理并转换成商业信息和知识,利用这些信息和知识来支持企业进行行处理并转换成商业信息和知识,利用这些信息和知识来支持企业进行正确的商业行动,并最终正确的商业行动,
14、并最终(zu zhn)(zu zhn)获得效益。获得效益。数据仓库的功能是在恰当的时间,把准确的信息传递给决策者,使他能数据仓库的功能是在恰当的时间,把准确的信息传递给决策者,使他能作出正确的商业决策。作出正确的商业决策。第16页/共60页第十七页,共61页。5.2.1 查询(chxn)与报表1.1.查询查询(1 1)能向用户提供查询的初始化,公式表示和结果显)能向用户提供查询的初始化,公式表示和结果显示等功能。示等功能。(2 2)由元数据来引导查询过程)由元数据来引导查询过程(3 3)用户能够轻松地浏览数据结构)用户能够轻松地浏览数据结构(4 4)信息是用户自己主动索取)信息是用户自己主动索
15、取(suq)(suq)的,而不是数的,而不是数据仓库强加给他们的据仓库强加给他们的(5 5)查询环境必须要灵活地适应不同类型的用户)查询环境必须要灵活地适应不同类型的用户第17页/共60页第十八页,共61页。2.2.报表报表(bobio)(bobio)(1)预格式化报表。(2)参数驱动的预定义报表。(3)简单的报表开发。(4)公布和订阅。(5)传递(chund)选项。(6)多数据操作选项。(7)多种展现方式选项。第18页/共60页第十九页,共61页。5.2.2 5.2.2 多维分析与原因多维分析与原因(yunyn)(yunyn)分析分析1 1、多维分析、多维分析通过通过(tnggu)(tngg
16、u)多维分析将获得在各种不同维度下的实际商业活动值(如销售量多维分析将获得在各种不同维度下的实际商业活动值(如销售量等),特别是他们的变化值和差值,达到辅助决策效果。等),特别是他们的变化值和差值,达到辅助决策效果。例如通过例如通过(tnggu)(tnggu)多维分析得到如下信息:多维分析得到如下信息:今年以来,公司的哪些产品量是最有利润的?今年以来,公司的哪些产品量是最有利润的?最有利润的产品是不是和去年一样的?最有利润的产品是不是和去年一样的?第19页/共60页第二十页,共61页。2、原因分析查找问题(wnt)出现的原因是一项很重要的决策支持任务,一般通过多维数据分析的“向下钻取”操作来完
17、成。某公司从分析报表中得知最近几个月来整个企业的利润在急速下滑,通过人机交互找出该企业利润下滑的原因。第20页/共60页第二十一页,共61页。(1 1)查询整个公司最近)查询整个公司最近3 3个月来各个月份的销售额和利润,显示个月来各个月份的销售额和利润,显示销售额正常,但利润下降。销售额正常,但利润下降。(2 2)查询全世界各个区域每个月的销售额和利润,显示欧洲地)查询全世界各个区域每个月的销售额和利润,显示欧洲地区销售额下降,利润急剧下降。区销售额下降,利润急剧下降。(3 3)查询欧洲各国销售额和利润。显示一些国家利润率上升,)查询欧洲各国销售额和利润。显示一些国家利润率上升,一些国家持平
18、,欧盟国家利润率急剧下降。一些国家持平,欧盟国家利润率急剧下降。(4 4)查询欧盟国家中的直接和间接成本。得到直接成本没有)查询欧盟国家中的直接和间接成本。得到直接成本没有(mi yu)(mi yu)问题,但间接成本提高了。问题,但间接成本提高了。(5 5)查询间接成本的详细情况。得出企业征收了额外附加税,)查询间接成本的详细情况。得出企业征收了额外附加税,使利润下降。使利润下降。通过原因分析,得到企业利润下滑的真正原因是欧盟国家征收了通过原因分析,得到企业利润下滑的真正原因是欧盟国家征收了额外附加税造成。额外附加税造成。第21页/共60页第二十二页,共61页。5.2.3 预测(yc)未来预测
19、未来使决策者了解预测未来使决策者了解“将要发生什么将要发生什么”。数据仓库中存放了大量的历史数据,从历史数据中找出变化规律,将可数据仓库中存放了大量的历史数据,从历史数据中找出变化规律,将可以用来预测未来。在进行预测的时候需要用到一些以用来预测未来。在进行预测的时候需要用到一些(yxi)(yxi)预测模型。预测模型。最常用的预测方法是采用回归模型,包括线性回归或非线性回归。最常用的预测方法是采用回归模型,包括线性回归或非线性回归。采用聚类模型或分类模型也能达到一定的预测效果。采用聚类模型或分类模型也能达到一定的预测效果。第22页/共60页第二十三页,共61页。5.2.4 实时(sh sh)决策
20、企业需要准确了解企业需要准确了解“正在发生什么正在发生什么”,从而需要建立动态数据仓库,从而需要建立动态数据仓库(实时数据库),用于支持战术型决策(实时数据库),用于支持战术型决策(juc)(juc),即实时决策,即实时决策(juc)(juc)。战术性决策战术性决策(juc)(juc)支持的重点则在企业外部,支持的是执行公司战支持的重点则在企业外部,支持的是执行公司战略的员工。第四种侧重在战术性决策略的员工。第四种侧重在战术性决策(juc)(juc)支持。支持。第23页/共60页第二十四页,共61页。以货运以货运(huyn)(huyn)为例为例 卡车上的货物常常需要把某些货物从一辆车转移到另一
21、辆车上,以便最终送抵各自的目的卡车上的货物常常需要把某些货物从一辆车转移到另一辆车上,以便最终送抵各自的目的地。地。当某些卡车晚点时,就要做出艰难的决定:是让后继的运输车等待迟到的货物,还是让其按当某些卡车晚点时,就要做出艰难的决定:是让后继的运输车等待迟到的货物,还是让其按时出发。时出发。如果后继车辆按时出发而未等待迟到的包裹,那么迟到包裹的服务等级就会大打折扣。如果后继车辆按时出发而未等待迟到的包裹,那么迟到包裹的服务等级就会大打折扣。反过来说,等待迟到的包裹则将损害在后继的运输车上的其他待运包裹的服务等级。反过来说,等待迟到的包裹则将损害在后继的运输车上的其他待运包裹的服务等级。运输车究
22、竟等待多长时间,取决于需卸装运输车究竟等待多长时间,取决于需卸装(xi zhung)(xi zhung)到该车辆的所有延迟货物的服务等级到该车辆的所有延迟货物的服务等级和已经装载到该车辆的货物的服务等级。和已经装载到该车辆的货物的服务等级。第24页/共60页第二十五页,共61页。5.2.5 自动(zdng)决策利用动态数据库自动决策,达到利用动态数据库自动决策,达到“希望发生什么希望发生什么”。为了寻求决策。为了寻求决策的有效性和连续性,企业就会趋向于采取自动决策。的有效性和连续性,企业就会趋向于采取自动决策。动态数据仓库可以动态数据仓库可以(ky)(ky)为整个企业提供战略决策支持,也可提供
23、为整个企业提供战略决策支持,也可提供战术决策支持。确切地说,动态数据仓库同时支持这两种方式。战术决策支持。确切地说,动态数据仓库同时支持这两种方式。随着技术的进步,越来越多的决策由事件触发,自动发生。随着技术的进步,越来越多的决策由事件触发,自动发生。第25页/共60页第二十六页,共61页。5.2.6 5.2.6 决策支持系统数据仓库整合了企业的各种信息数据仓库整合了企业的各种信息(xnx)(xnx)来源,能确保一致与正确详细的数据。来源,能确保一致与正确详细的数据。它是一个庞大的数据资源。要将数据转换成商业智能,就需要利用数据仓库它是一个庞大的数据资源。要将数据转换成商业智能,就需要利用数据
24、仓库来建立决策支持系统。来建立决策支持系统。基于数据仓库的决策支持系统是针对实际问题,利用分析工具或者编制程序,基于数据仓库的决策支持系统是针对实际问题,利用分析工具或者编制程序,采用一种或多种组合的决策支持能力,对数据仓库中的数据进行多维分析,采用一种或多种组合的决策支持能力,对数据仓库中的数据进行多维分析,从而掌握企业的经营现状,找出现状的原因,并预测未来发展趋势,协助企从而掌握企业的经营现状,找出现状的原因,并预测未来发展趋势,协助企业制定决策增强竞争优势。业制定决策增强竞争优势。第26页/共60页第二十七页,共61页。5.3 5.3 数据仓库应用数据仓库应用(yngyng)(yngyn
25、g)实例实例 5.3.1 航空公司数据仓库决策支持系统简例5.3.2 统计(tngj)业数据仓库解决方案5.3.3 沃尔玛数据仓库系统第27页/共60页第二十八页,共61页。5.3.15.3.1航空公司数据仓库决策支持系统简例航空公司数据仓库决策支持系统简例1.航空公司数据仓库系统的功能(gngnng)2.数据仓库系统的决策支持3.决策支持系统简例第28页/共60页第二十九页,共61页。1.1.航空公司数据仓库系统航空公司数据仓库系统(xtng)(xtng)的功能的功能航空公司数据仓库功能模块有:航空公司数据仓库功能模块有:市场市场(shchng)(shchng)分析:分析国内、国际、地区航线
26、上的各项生产指标;分析:分析国内、国际、地区航线上的各项生产指标;航班分析:分析某个特定市场航班分析:分析某个特定市场(shchng)(shchng)上所有航班的生产情况;上所有航班的生产情况;班期分析:分析某个特定市场班期分析:分析某个特定市场(shchng)(shchng)上各班期的旅客、货运分布上各班期的旅客、货运分布 情况;情况;第29页/共60页第三十页,共61页。2.2.数据仓库系统数据仓库系统(xtng)(xtng)的决策支持的决策支持 利用数据仓库系统提供的决策支持有:利用数据仓库系统提供的决策支持有:l一一 段段 时时 间间 内内 某某 特特 定定 市市 场场 占占 有有 率
27、率、同同 期期 比比 较较、增增 长长(zngzhng)趋势;趋势;l各条航线的收益分析;各条航线的收益分析;l计划完成情况;计划完成情况;l流量、流向分析;流量、流向分析;l航线上各项生产指标变化趋势的分析;航线上各项生产指标变化趋势的分析;第30页/共60页第三十一页,共61页。通通 过过 查查 询询“北北 京京 到到 各各 地地 区区 的的 航航 空空 市市 场场 情情 况况(qngkung)”(qngkung)”,发发现现西西南南地地区区总总周周转转量量出出现现了了最最大大负负增增长长量量。该该决决策策支支持持系系统统简简例例就就是是完完成成对对此此问问题题进进行行多多维维分分析析和原
28、因分析,找出出现原因。和原因分析,找出出现原因。决策支持系统运行结构图如下:决策支持系统运行结构图如下:3.3.决策支持系统简例决策支持系统简例第31页/共60页第三十二页,共61页。数据仓库服务器数据仓库服务器客户端客户端查查询询:全全国国各各地地区区(dq)航航空空总总周周转转量量并并比比较较去去年年同同期期状状况况显示显示(xinsh):图:图1查询:全国各地区航空查询:全国各地区航空(hngkng)客运周转量并比较去年同期状况客运周转量并比较去年同期状况查询:查询:全国各地区航空货运周转量并比较去年同期状况全国各地区航空货运周转量并比较去年同期状况显示:图显示:图3查查询询:全全国国各
29、各地地区区客客运运、货货运运、总总周周转转量量并并比比较较去去年年同同期期状状况况具具体数据体数据显示:显示:表表1查查询询:西西南南地地区区昆昆明明、重重庆庆两两地地航航空空总总周周转转量量并并比比较较去去年年同同期期状状况况显示:图显示:图4查询:查询:昆明航线按不同机型的总周转量,并比较去年同期状况昆明航线按不同机型的总周转量,并比较去年同期状况显示:图显示:图5查查询询:昆昆明明航航线线按按不不同同机机型型的的周周转转量量,并并比比较较去去年年同同期期周周转转量量的的具具体体数数据据显示:显示:表表2显示:图显示:图2结束结束检检索索:数数据据仓仓库库中中今今年年、去去年年两两年年总总
30、周周转转量量综综合数据,并比较。绘制直方图合数据,并比较。绘制直方图下下钻钻:从从总总周周转转量量下下钻钻到到今今年年、去去年年两两年年客客运运周周转转量量,并比较。绘制直方图并比较。绘制直方图下下钻钻:从从总总周周转转量量下下钻钻到到今今年年、去去年年两两年年货货运周转量,并比较。绘制直方图运周转量,并比较。绘制直方图制表:制表:从数据仓库中取数据并制表从数据仓库中取数据并制表下下钻钻:从从西西南南地地区区总总周周转转量量下下钻钻,取取昆昆明明、重重庆庆两地的今年、去年两年数据并比较。绘制直方图两地的今年、去年两年数据并比较。绘制直方图下下钻钻:从从昆昆明明航航线线总总周周转转量量下下钻钻,
31、取取各各机机型型今今年、去年两年数据并比较。绘制直方图年、去年两年数据并比较。绘制直方图制表:制表:从数据仓库中取数据并制表从数据仓库中取数据并制表第32页/共60页第三十三页,共61页。图图1 全国各地区航空周转量与去年对比全国各地区航空周转量与去年对比(dub)状况状况返回(fnhu)(其中,(其中,1:东北地区;:东北地区;2:华北地区;:华北地区;3:华东地区;:华东地区;4:西北地区;:西北地区;5:西南地区;:西南地区;6:新疆地区;:新疆地区;7:中南:中南(zhnnn)地区)地区)从图从图1中看到从北京到国内各地区的总周转量以及与去年同期的比较情况,发现中看到从北京到国内各地区
32、的总周转量以及与去年同期的比较情况,发现“北京西南地区北京西南地区”出现的负增长最大。出现的负增长最大。第33页/共60页第三十四页,共61页。图图2 全国各地区航空客运全国各地区航空客运(kyn)周转量及与去年同期比较周转量及与去年同期比较返回(fnhu)从图从图2 2中看到客运周转量及与去年同期比较中看到客运周转量及与去年同期比较(bjio)(bjio),西南地区负增长在全国是最大的,其次是东北地区。,西南地区负增长在全国是最大的,其次是东北地区。第34页/共60页第三十五页,共61页。图图3 北京到国内各地区北京到国内各地区(dq)货运周转量及与去年同期比较货运周转量及与去年同期比较返回
33、(fnhu)从图从图3 3中看到货运周转量及与去年同期比较中看到货运周转量及与去年同期比较(bjio)(bjio),华东地区负增长在全国是最大的,西南地区也有负增长。,华东地区负增长在全国是最大的,西南地区也有负增长。第35页/共60页第三十六页,共61页。表表1 客运、货运客运、货运(huyn)、总周转量及其去年同期比较、总周转量及其去年同期比较客运周转量对比去年增长量货运周转量对比去年增长量总周转量对比去年增长量东北地区11.86-5.11.29-1.513.15-6.6华北地区34.8815.031.110.753615.78华东地区479.30126.5236.16-25.59515.
34、46100.93西北地区51.6018.059.07.260.625.25西南地区15.43-19.353.29-0.5618.72-19.91新疆地区29.0205.85034.870中南地区643.43295.86116.8560.70760.28356.56返回(fnhu)从表从表1 1中,可以看出航空客运、货运、总周转量以及与去年同期比较的具体数据中,可以看出航空客运、货运、总周转量以及与去年同期比较的具体数据(shj)(shj)。西南地区总周转量的负增长主要是客运负增长为主体。西南地区总周转量的负增长主要是客运负增长为主体。第36页/共60页第三十七页,共61页。图图4 西南地区昆明
35、、重庆两地西南地区昆明、重庆两地(lin d)航空总周转量及与去年同期比较航空总周转量及与去年同期比较返回(fnhu)从图从图4 4中看出,西南地区航空总周转量下降中看出,西南地区航空总周转量下降(xijing)(xijing)最多的是昆明航线。最多的是昆明航线。第37页/共60页第三十八页,共61页。(其中,(其中,A:150座级;座级;B:200座级;座级;C:300座级以上座级以上(yshng);D:200300座级)座级)图图5 昆明航线各机型总周转量以及与去年同期比较的柱形图昆明航线各机型总周转量以及与去年同期比较的柱形图返回(fnhu)从图从图5 5可以看出昆明航线中可以看出昆明航
36、线中200200300300座级机型负增长最大,其次座级机型负增长最大,其次(qc)(qc)是是150150座级机型也有较大的负增长,而座级机型也有较大的负增长,而200200座级以及座级以及300300座级以上机型保持同去年相同航运水平。座级以上机型保持同去年相同航运水平。第38页/共60页第三十九页,共61页。表表2 昆明航线各机型总周转量以及与去年同期比较的数据昆明航线各机型总周转量以及与去年同期比较的数据从表从表2中可以看出中可以看出(kn ch),不同机型的周转量以及对比去年同期增长的具体数据。,不同机型的周转量以及对比去年同期增长的具体数据。总周转量对比去年增长量150座级12.9
37、9-16.83200座级10.070300座级以上10.070200-300座级2.91-26.9返回(fnhu)第39页/共60页第四十页,共61页。以以上上决决策策支支持持系系统统过过程程完完成成了了对对航航空空公公司司全全国国各各地地区区总总周周转转量量对对比比去去年年同同期期出出现现负负增增长长量量最最大大的的西西南南地地区区,经经过过多多维维分分析析和和原原因因分分析析,找找出出其其原原因因发发生生在在昆昆明明航航线线上。上。主主要要是是200200300300座座级级机机型型的的总总周周转转量量负负增增长长以以及及150150座级机型负增长量造成的。座级机型负增长量造成的。其中,其
38、中,200200300300座级负增长最严重。座级负增长最严重。这这为为决决策策者者提提供供(tgng)(tgng)了了解解决决西西南南地地区区负负增增长长问问题辅助决策的信息。题辅助决策的信息。第40页/共60页第四十一页,共61页。数据仓库决策支持系统应用(yngyng)说明以上决策支持系统只是找出了西南地区航运负增长问题(wnt)的原因。还可以昆明航线上航班时间以及其他方面进行原因分析,找出其他原因,为决策者提供更多的辅助决策信息。第41页/共60页第四十二页,共61页。同样,可以同样,可以(ky)(ky)从国内各地区航空市场状况中对比去年同期增长显从国内各地区航空市场状况中对比去年同期
39、增长显著的中南地区,找出总周转量大幅提高的原因。著的中南地区,找出总周转量大幅提高的原因。从正反两方面来进行多维分析和原因分析,将可以从正反两方面来进行多维分析和原因分析,将可以(ky)(ky)得到更多的得到更多的辅助决策信息,减少负增长,增大正增长,提高更大利润。辅助决策信息,减少负增长,增大正增长,提高更大利润。进行多方面分析的大型决策支持系统,将可以进行多方面分析的大型决策支持系统,将可以(ky)(ky)发挥更大的辅助发挥更大的辅助决策效果。决策效果。第42页/共60页第四十三页,共61页。5.3.2 5.3.2 统计统计(tngj)(tngj)业数据仓库系统业数据仓库系统1.统计(tn
40、gj)业数据仓库解决方案2.某市统计(tngj)局企业微观数据仓库系统第43页/共60页第四十四页,共61页。1.1.统计统计(tngj)(tngj)业数据仓库解决方案业数据仓库解决方案统计业面临以下三方面的需求:统计业面临以下三方面的需求:(1 1)数据的集中存储与管理)数据的集中存储与管理统计行业掌握着大量的、各历史年度的原始统计行业掌握着大量的、各历史年度的原始(yunsh)(yunsh)调查资料,这些资料大都调查资料,这些资料大都还保留在纸介质、脱机的磁带和软盘上。还保留在纸介质、脱机的磁带和软盘上。这些宝贵的原始这些宝贵的原始(yunsh)(yunsh)资料不能为统计业务人员随机查询
41、和充分共享,不能资料不能为统计业务人员随机查询和充分共享,不能进行有效的统计分析、预测评估和使用。进行有效的统计分析、预测评估和使用。第44页/共60页第四十五页,共61页。(2 2)查询方式和分析手段的更新)查询方式和分析手段的更新统计报表和统计分析需要从大量各种各样的原始材料中汇总统计报表和统计分析需要从大量各种各样的原始材料中汇总(huzng)(huzng)整理各种整理各种不同需求,反映不同侧面的综合分析数据不同需求,反映不同侧面的综合分析数据.传统的处理手段主要通过编写程序来实现。开发周期长。传统的处理手段主要通过编写程序来实现。开发周期长。第45页/共60页第四十六页,共61页。(3
42、 3)与)与WebWeb技术的有机结合技术的有机结合采用采用(ciyng)(ciyng)目前流行的三层应用体系结构对系统进行应用开发。目前流行的三层应用体系结构对系统进行应用开发。后台是数据仓库,前台是后台是数据仓库,前台是WebWeb服务器,客户端是浏览器的应用模服务器,客户端是浏览器的应用模式。式。利用这种技术,可以做到网上动态信息发布、网上随机查询和网上联利用这种技术,可以做到网上动态信息发布、网上随机查询和网上联机分析处理等功能。机分析处理等功能。第46页/共60页第四十七页,共61页。2.2.某市统计局企业某市统计局企业(qy)(qy)微观数据仓库系统微观数据仓库系统企业微观企业微观
43、(wigun)(wigun)数据仓库设计成以下主题:数据仓库设计成以下主题:(1 1)企业基本情况:各年度、各专业统计调查单位基本情况名录的主要内容及全部)企业基本情况:各年度、各专业统计调查单位基本情况名录的主要内容及全部标识性内容。标识性内容。(2 2)企业财务状况:各年度、各专业企业的资产、经营投入、产出效益等财务经营)企业财务状况:各年度、各专业企业的资产、经营投入、产出效益等财务经营状况。状况。(3 3)企业劳动状况:各年度、各专业企业的就业人数及工资收入情况。)企业劳动状况:各年度、各专业企业的就业人数及工资收入情况。(4 4)企业消耗状况:各年度、各专业企业生产所需的原材料及能源
44、消耗情况,包括)企业消耗状况:各年度、各专业企业生产所需的原材料及能源消耗情况,包括价值量和实物量消耗情况。价值量和实物量消耗情况。(5 5)企业生产状况:各年度、各专业企业的主营生产情况。)企业生产状况:各年度、各专业企业的主营生产情况。第47页/共60页第四十八页,共61页。企业微观数据仓库系统的前端应用都是基于企业微观数据仓库系统的前端应用都是基于WebWeb方式方式(fngsh)(fngsh)开发。开发。它具有:网上随机查询、网上多维分析、网上数据钻取、网上图形分析、它具有:网上随机查询、网上多维分析、网上数据钻取、网上图形分析、网上表格旋转透视、网上多维报表等功能,并且操作方式网上表
45、格旋转透视、网上多维报表等功能,并且操作方式(fngsh)(fngsh)都是都是拖拉方式拖拉方式(fngsh)(fngsh)。今后统计业务人员的月报、年报等数据处理都可以在网上进行。今后统计业务人员的月报、年报等数据处理都可以在网上进行。第48页/共60页第四十九页,共61页。5.3.3 沃尔玛数据仓库系统(xtng)美国的沃尔玛(美国的沃尔玛(Wal*MartWal*Mart)是世界最大的零售商,)是世界最大的零售商,Wal*MartWal*Mart建立了基于建立了基于NCR TeradataNCR Teradata数据仓库的决策支持数据仓库的决策支持系统,它是世界上第二大的数据仓库系统,总
46、容量达系统,它是世界上第二大的数据仓库系统,总容量达到到170TB170TB以上。以上。强大的数据仓库系统将世界强大的数据仓库系统将世界40004000多家分店的每一笔业务数多家分店的每一笔业务数据汇总到一起,让决策者能够在很短的时间里获得准据汇总到一起,让决策者能够在很短的时间里获得准确和及时的信息,并做出正确和有效确和及时的信息,并做出正确和有效(yuxio)(yuxio)的经营的经营决策。决策。沃尔玛的创始人萨姆沃尔顿:沃尔玛的创始人萨姆沃尔顿:“我总是喜欢尽快得到那我总是喜欢尽快得到那些数据、我们越快得到那些信息、我们就能越快据此些数据、我们越快得到那些信息、我们就能越快据此采取行动,
47、这个系统已经成为我们的一个重要工具采取行动,这个系统已经成为我们的一个重要工具”。第49页/共60页第五十页,共61页。利用数据仓库,沃尔玛对商品进行市场类组分析,即分析哪些商品顾利用数据仓库,沃尔玛对商品进行市场类组分析,即分析哪些商品顾客客(gk)(gk)最有希望一起购买。最有希望一起购买。一个意外的发现就是:跟尿布一起购买最多的商品竟是啤酒!按常规一个意外的发现就是:跟尿布一起购买最多的商品竟是啤酒!按常规思维,尿布与啤酒风马牛不相及,若不是借助于数据仓库系统,商家思维,尿布与啤酒风马牛不相及,若不是借助于数据仓库系统,商家决不可能发现隐藏在背后的事实。决不可能发现隐藏在背后的事实。沃尔
48、玛就在它的一个个商店里将它们并排摆放在一起,结果是尿布与沃尔玛就在它的一个个商店里将它们并排摆放在一起,结果是尿布与啤酒的销量双双增长。啤酒的销量双双增长。第50页/共60页第五十一页,共61页。每天要处理每天要处理(chl)(chl)并更新并更新2 2亿条记录,要对来自亿条记录,要对来自60006000多个用户的多个用户的4848,000000条查询语句进行处理条查询语句进行处理(chl)(chl)。销售数据、库存数据每天夜间从。销售数据、库存数据每天夜间从4 4,000000多个商店自动采集过来,并通过卫星线路传到总部的数据仓库多个商店自动采集过来,并通过卫星线路传到总部的数据仓库里。里。
49、利用数据仓库,进行决策支持分析,具体表现为:利用数据仓库,进行决策支持分析,具体表现为:第51页/共60页第五十二页,共61页。1.1.商品商品(shngpn)(shngpn)分组布局分组布局合理的商品布局合理的商品布局(bj)(bj)能节省顾客的购买时间,能刺激顾客的购买欲能节省顾客的购买时间,能刺激顾客的购买欲望。望。分析顾客的购买习惯,掌握不同商品一起购买的概率,甚至考虑购买分析顾客的购买习惯,掌握不同商品一起购买的概率,甚至考虑购买者在商店里所穿行的路线、购买时间和地点,从而确定商品的最佳布者在商店里所穿行的路线、购买时间和地点,从而确定商品的最佳布局局(bj)(bj)。第52页/共6
50、0页第五十三页,共61页。2.降低库存成本(chngbn)沃尔玛通过数据仓库系统,决定对各个商店各色货物进行增减,确保沃尔玛通过数据仓库系统,决定对各个商店各色货物进行增减,确保正确的库存。正确的库存。沃尔玛的经营哲学沃尔玛的经营哲学(zhxu)(zhxu)是是“代销代销”供应商的商品,也就是说,在供应商的商品,也就是说,在顾客付款之前,供应商是不会拿到它的货款的。顾客付款之前,供应商是不会拿到它的货款的。数据仓库系统不仅使沃尔玛省去了商业中介,还把定期补充库存的担数据仓库系统不仅使沃尔玛省去了商业中介,还把定期补充库存的担子转嫁到供应商身上。子转嫁到供应商身上。第53页/共60页第五十四页,