《数据分析与数据挖掘实战案例.ppt》由会员分享,可在线阅读,更多相关《数据分析与数据挖掘实战案例.ppt(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、杨杨杨杨 大大大大 川川川川数据分析与数据挖掘实战案例讲师简介讲师简介杨大川杨大川-迈思奇科技有限公司迈思奇科技有限公司CTOCTO微软微软微软微软MVP.2004MVP.2004MVP.2004MVP.2004(最有价值专家)(最有价值专家)(最有价值专家)(最有价值专家)曾任美国硅谷曾任美国硅谷曾任美国硅谷曾任美国硅谷AnnuncioAnnuncioAnnuncioAnnuncio公司首席工程师公司首席工程师公司首席工程师公司首席工程师招商迪辰产品研发部总经理招商迪辰产品研发部总经理招商迪辰产品研发部总经理招商迪辰产品研发部总经理现兼任中科院客座教授现兼任中科院客座教授现兼任中科院客座教授
2、现兼任中科院客座教授Minesage:Minesage:迈思奇科技有限公司迈思奇科技有限公司微软数据分析微软数据分析微软数据分析微软数据分析/挖掘领域合作伙伴挖掘领域合作伙伴挖掘领域合作伙伴挖掘领域合作伙伴面向企业客户提供完整的数据分析面向企业客户提供完整的数据分析面向企业客户提供完整的数据分析面向企业客户提供完整的数据分析/挖掘解决方挖掘解决方挖掘解决方挖掘解决方案案案案AgendaAgenda从数据到信息从数据到信息传统报表系统的挑战传统报表系统的挑战数据分析与实战案例数据分析与实战案例数据挖掘与实战案例数据挖掘与实战案例总结:商业智能的巨大潜力总结:商业智能的巨大潜力现代企业的现代企业的
3、ITIT系统系统l l企业资源计划系统企业资源计划系统(ERP)(ERP)l l客户关系管理系统客户关系管理系统(CRM)(CRM)l l供应链管理系统供应链管理系统(SCM)(SCM)l l电子商务系统电子商务系统(EBiz)(EBiz)l l人事管理系统人事管理系统(HR)(HR)l l财务系统财务系统(Fin)(Fin)l l 呼叫中心呼叫中心呼叫中心呼叫中心市场市场市场市场活动活动活动活动系统系统系统系统客户关客户关客户关客户关系管理系管理系管理系管理互联网系互联网系互联网系互联网系统统统统财务系统财务系统财务系统财务系统采购系统采购系统采购系统采购系统人事系人事系人事系人事系统统统统
4、库存系统库存系统库存系统库存系统最终结果:大量的最终结果:大量的最终结果:大量的最终结果:大量的数据数据数据数据这里有几根火柴?这里有几根火柴?报表系统的答案:报表系统的答案:40根根AgendaAgenda从数据到信息从数据到信息传统报表系统的挑战传统报表系统的挑战数据分析与实战案例数据分析与实战案例数据挖掘与实战案例数据挖掘与实战案例总结:商业智能的巨大潜力总结:商业智能的巨大潜力挑战挑战难以挖掘出潜在难以挖掘出潜在难以挖掘出潜在难以挖掘出潜在的规则的规则的规则的规则难以交互分析难以交互分析难以交互分析难以交互分析了解各种组合了解各种组合了解各种组合了解各种组合 难以追溯历史难以追溯历史难
5、以追溯历史难以追溯历史数据形成孤岛数据形成孤岛数据形成孤岛数据形成孤岛数据太多数据太多数据太多数据太多信息太少信息太少信息太少信息太少随着数据量的增大随着数据量的增大随着数据量的增大随着数据量的增大难度越来越大难度越来越大难度越来越大难度越来越大AgendaAgenda从数据到信息从数据到信息传统报表系统的挑战传统报表系统的挑战数据分析与实战案例数据分析与实战案例数据挖掘与实战案例数据挖掘与实战案例总结:商业智能的巨大潜力总结:商业智能的巨大潜力现在呢?现在呢?数据分析:数据分析:OLAPOLAP技术技术数据集市数据集市数据集市数据集市数据数据数据数据仓库仓库仓库仓库源系源系源系源系统统统统客
6、客客客户户户户端端端端CubeCubeOLAPOLAPDemoDemo互联网行业互联网行业电信电信财务和预算财务和预算房地产房地产互联网行业互联网行业 门户网站门户网站传统的网站流量分析工具传统的网站流量分析工具简单的静态报表简单的静态报表简单的静态报表简单的静态报表后台处理,大量信息丢失后台处理,大量信息丢失后台处理,大量信息丢失后台处理,大量信息丢失无法针对业务层面深入分析无法针对业务层面深入分析无法针对业务层面深入分析无法针对业务层面深入分析OLAPOLAP解决方案解决方案18181818个角度随心所欲的分析个角度随心所欲的分析个角度随心所欲的分析个角度随心所欲的分析瞬间获得结果瞬间获得
7、结果瞬间获得结果瞬间获得结果非常容易切入业务层面非常容易切入业务层面非常容易切入业务层面非常容易切入业务层面发现更多的宝藏发现更多的宝藏发现更多的宝藏发现更多的宝藏电信行业电信行业手机产业的迅猛发展导致:手机产业的迅猛发展导致:海量的数据海量的数据海量的数据海量的数据海量的用户海量的用户海量的用户海量的用户激烈竞争与频繁的策略调整激烈竞争与频繁的策略调整激烈竞争与频繁的策略调整激烈竞争与频繁的策略调整OLAPOLAP数据分析的价值数据分析的价值发现不断变化的规律发现不断变化的规律发现不断变化的规律发现不断变化的规律辅助正确的决策辅助正确的决策辅助正确的决策辅助正确的决策好的决策好的决策好的决策
8、好的决策=$=$=$=$财务和预算财务和预算财务软件有很多财务软件有很多用友用友用友用友金蝶金蝶金蝶金蝶预算的方式有很多预算的方式有很多ExcelExcelExcelExcel专用系统专用系统专用系统专用系统OLAPOLAP可以分析什么?可以分析什么?鸟瞰图的分析方式鸟瞰图的分析方式鸟瞰图的分析方式鸟瞰图的分析方式房地产房地产买房?卖房?租房?买房?卖房?租房?房价的趋势如何?房价的趋势如何?不同地区的变化不同地区的变化不同地区的变化不同地区的变化不同类型的变化不同类型的变化不同类型的变化不同类型的变化供求关系的变化供求关系的变化供求关系的变化供求关系的变化OLAPOLAP的解决方案的解决方案
9、专业化的专业化的专业化的专业化的KPIKPIKPIKPIAgendaAgenda从数据到信息从数据到信息传统报表系统的挑战传统报表系统的挑战数据分析与实战案例数据分析与实战案例数据挖掘与实战案例数据挖掘与实战案例总结:商业智能的巨大潜力总结:商业智能的巨大潜力商业智能包含的范围商业智能包含的范围数据挖掘数据挖掘数据挖掘数据挖掘数据数据数据数据报报表表表表数据分析数据分析数据分析数据分析深入数据挖掘工具深入数据挖掘工具(SQL 2005)(SQL 2005)关联销售关联销售关联销售关联销售销售预期销售预期销售预期销售预期客户分类客户分类客户分类客户分类客户行为分析客户行为分析客户行为分析客户行为
10、分析风险管理风险管理风险管理风险管理信用评估信用评估信用评估信用评估欺诈检测欺诈检测欺诈检测欺诈检测流量点击分析流量点击分析流量点击分析流量点击分析.DemoDemo图书音像销售图书音像销售 关联模型关联模型自行车销售自行车销售 决策树决策树搜索引擎搜索引擎历史数据历史数据 CustIDCustIDCustIDCustID980001980001980001980001980002980002980002980002980003980003980003980003980004980004980004980004980005980005980005980005980006980006980006
11、980006CustIDCustIDCustIDCustIDBookBookBookBook980001980001980001980001天龙八部天龙八部天龙八部天龙八部980001980001980001980001鹿鼎记鹿鼎记鹿鼎记鹿鼎记980002980002980002980002丁丁历险记丁丁历险记丁丁历险记丁丁历险记-丁丁在刚果丁丁在刚果丁丁在刚果丁丁在刚果980002980002980002980002丁丁历险记丁丁历险记丁丁历险记丁丁历险记-月球探险月球探险月球探险月球探险980002980002980002980002神雕侠侣神雕侠侣神雕侠侣神雕侠侣980003980003
12、980003980003围城围城围城围城980004980004980004980004数据挖掘指南数据挖掘指南数据挖掘指南数据挖掘指南980004980004980004980004数据库实战宝典数据库实战宝典数据库实战宝典数据库实战宝典980004980004980004980004SQL Server 2005SQL Server 2005SQL Server 2005SQL Server 2005历史数据(历史数据(NestedNested)BookBookBookBook天龙八部天龙八部天龙八部天龙八部鹿鼎记鹿鼎记鹿鼎记鹿鼎记丁丁历险记丁丁历险记丁丁历险记丁丁历险记-丁丁在刚果丁丁在
13、刚果丁丁在刚果丁丁在刚果丁丁历险记丁丁历险记丁丁历险记丁丁历险记-月球探险月球探险月球探险月球探险神雕侠侣神雕侠侣神雕侠侣神雕侠侣围城围城围城围城数据挖掘指南数据挖掘指南数据挖掘指南数据挖掘指南数据库实战宝典数据库实战宝典数据库实战宝典数据库实战宝典SQL Server 2005SQL Server 2005SQL Server 2005SQL Server 2005CustIDCustIDCustIDCustID9800019800019800019800019800029800029800029800029800039800039800039800039800049800049800049
14、80004关联模型关联模型:Associationl l同类集合同类集合同类集合同类集合l l规则规则规则规则l l图示图示图示图示l l预测预测预测预测l l自行车销售自行车销售某体育用品商店某体育用品商店某体育用品商店某体育用品商店拥有大量会员拥有大量会员拥有大量会员拥有大量会员部分会员是购买自行车的用户部分会员是购买自行车的用户部分会员是购买自行车的用户部分会员是购买自行车的用户问题:决定客户是否可能购买自行车的因素?问题:决定客户是否可能购买自行车的因素?问题:决定客户是否可能购买自行车的因素?问题:决定客户是否可能购买自行车的因素?性别性别性别性别年龄年龄年龄年龄交通距离交通距离交通
15、距离交通距离拥有的汽车数目拥有的汽车数目拥有的汽车数目拥有的汽车数目拥有的子女数目拥有的子女数目拥有的子女数目拥有的子女数目收入收入收入收入决策树:决策树:Decision Tree找到潜在客户找到潜在客户搜索引擎搜索引擎ITIT新宠新宠百度神话百度神话百度神话百度神话GoogleGoogleYahooYahooMSNMSN如何发现词与词之间的关联?如何发现词与词之间的关联?我们销售关键词给企业我们销售关键词给企业我们销售关键词给企业我们销售关键词给企业如果知道与某个词关联最强的如果知道与某个词关联最强的如果知道与某个词关联最强的如果知道与某个词关联最强的N N N N个词个词个词个词潜在的价
16、值是无限的潜在的价值是无限的潜在的价值是无限的潜在的价值是无限的AgendaAgenda从数据到信息从数据到信息传统报表系统的挑战传统报表系统的挑战数据分析与实战案例数据分析与实战案例数据挖掘与实战案例数据挖掘与实战案例总结:商业智能的巨大潜力总结:商业智能的巨大潜力解决解决商业智能商业智能 数据挖掘找出数据挖掘找出数据挖掘找出数据挖掘找出潜在规则,辅潜在规则,辅潜在规则,辅潜在规则,辅助决策助决策助决策助决策OLAPOLAP、数据分、数据分、数据分、数据分析提供了更及时、析提供了更及时、析提供了更及时、析提供了更及时、更丰富的信息更丰富的信息更丰富的信息更丰富的信息报表系统提供了报表系统提供
17、了报表系统提供了报表系统提供了最基本的信息最基本的信息最基本的信息最基本的信息问题:问题:OLAP OLAP 的目的是什么?的目的是什么?Static ReportingStatic ReportingStatic ReportingStatic ReportingData MiningData MiningData MiningData MiningData AnalysisData AnalysisData AnalysisData Analysis以上案例中涉及的主要软件有哪些?以上案例中涉及的主要软件有哪些?典型的数据分析系统包括哪四层?典型的数据分析系统包括哪四层?联系方式:联系方式:uu杨大川杨大川 uu电话电话