《数据仓库与ETL的实现过程.ppt》由会员分享,可在线阅读,更多相关《数据仓库与ETL的实现过程.ppt(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数据仓库与ETL的实现过程设计数据仓库CubeCube多多维维数数据集据集数据数据仓库仓库源系源系统统客客户户端端设计设计数据数据仓库仓库 导导入数据入数据仓库仓库建建设设Cubes Cubes 查询查询数据数据1 13 34 4查询查询工具工具报报表表分析分析数据挖掘数据挖掘2 2数据仓库的星型结构Employee_DimEmployee_DimEmployeeKeyEmployeeID.EmployeeKeyEmployeeKeyTime_DimTime_DimTimeKeyTheDate.TimeKeyTimeKeyProduct_DimProduct_DimProductKeyProd
2、uctIDProduceNameProductBrandProductCategory.ProductKeyProductKeyCustomer_DimCustomer_DimCustomerKeyCustomerID.CustomerKeyCustomerKeyShipper_DimShipper_DimShipperKeyShipperID.ShipperKeyShipperKeySales_FactSales_FactTimeKeyEmployeeKeyProductKeyCustomerKeyShipperKeyUnitsPrice.TimeKeyTimeKeyCustomerKeyC
3、ustomerKeyShipperKeyShipperKeyProductKeyProductKeyEmployeeKeyEmployeeKey多个外多个外键键事事实实维维度度键键维度与事实一个数据仓库包括了 多个中央事实表 Fact Table多个维度外键和多个可以分析的指标多个维度表 Dimension Tables可以分析的角度ETL过程数据从数据源向目标数据仓库抽取(Extract)、转换(Transform)、装载(Load)的过程ETL过程构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。抽取:将数据从各
4、种原始的业务系统中读取出来。转换:按照预先设计好的规则将抽取得数据进行转换、清洗,以及处理一些冗余、歧义的数据,使本来异构的数据格式能统一起来。装载:将转换完的数据导入到数据仓库中。ETL举例FNameLNameUnitPriceQtyBarrAdam.552ChaiSean1.13EmpKeyName1Barr.Adam2Chai.SeanNameUnitPriceQtyBarr.Adam.552Chai.Sean1.13NameTotalSalesBarr.Adam1.1Chai.Sean3.3EmpKeyTotalSales11.123.3导入合并计算查找案例背景保健品销售部门,各分部门
5、将销售情况记录在各自的表中,记录方式也是不一样的要求计算出各种产品各个员工07年的销售情况 店面 网售 PosDWSQLsheet1sheet2sheet3Pos部门销售情况部门销售情况EmployeeNameGroupNameTime ProductName ProductStyle ProductClass Quantity InformationSource SaleAddress DimProductProductKeyProductNameProductStyleProductClass店面店面销售情况销售情况EmployeeNameGroupNameTime ProductName
6、 ProductStyle ProductClass Quantity CustomerEvaluation CustomerSources网售网售销售情况销售情况EmployeeNameGroupNameTime ProductName ProductStyle ProductClass Quantity ProductNameProductStyleProductClassProductNameProductClassProductStyleProductNameProductClassProductClassProductNameProductStyleProductStyleDimEm
7、pEmployKeyEmployeeNameGroupNameDeptNameGroupeNameEmployeeNameGroupeNameGroupNameEmployeeNameEmployeeNameGroupeNameEmployeeName维度表的抽取维度表的抽取源表源表源表源表源表源表维度表维度表店面店面销售情况销售情况EmployeeNameGroupNameTime ProductName ProductStyle ProductClass Quantity DimProductProductKeyProductNameProductStyleProductClassFactSalesProductKeyProductNameProductStyleProductClassProductNameProductClassProductStyleProductNameProductClassProductStyleProductKeyProductKey事实表的抽取事实表的抽取源表源表维度表维度表事实表事实表DEMO谢谢!