云计算业务应用-数据挖掘.pptx

上传人:wuy****n92 文档编号:60796991 上传时间:2022-11-18 格式:PPTX 页数:56 大小:4.84MB
返回 下载 相关 举报
云计算业务应用-数据挖掘.pptx_第1页
第1页 / 共56页
云计算业务应用-数据挖掘.pptx_第2页
第2页 / 共56页
点击查看更多>>
资源描述

《云计算业务应用-数据挖掘.pptx》由会员分享,可在线阅读,更多相关《云计算业务应用-数据挖掘.pptx(56页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、中文标题字体:黑体字号:35-47pt色彩:主题蓝色中文副标题字体:华文细黑字号:24-28pt色彩:反白秘密 Proprietary Confidential云计算业务应用-数据挖掘秘密 Proprietary Confidential中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:白色目录l数据挖掘基本概念和技术l数据挖掘在电信行业中的应用l总结秘密 Proprietary Confidential中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:白色目录l数据挖掘基本概念和技术l数据挖掘基本

2、概念l数据挖掘典型流程l数据挖掘常用技术l数据挖掘业界工具l数据挖掘可用资源l本章小结l数据挖掘在电信行业中的应用l总结秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色如果你遇到下面的问题,你会怎么做?秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-

3、22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色数据挖掘的原动力怎样借助数据制定合适的决策?数据挖掘是应实际需求而出现的技术数据挖掘是应实际需求而出现的技术秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色什么是数据挖掘?Data mining is the non-trivial process of identifying valid,novel,poten

4、tially useful,and ultimately understandable patterns from huge volume of data.derived from U.Fayyad,et al.s definition of KDD at KDD96 数据挖掘是从巨量数据巨量数据中获取正确的、正确的、新颖的、潜在新颖的、潜在 有用的、最终可理有用的、最终可理解的模式解的模式的非平凡过程非平凡过程。秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:2

5、0-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色数据挖掘?能否找出以下数据挖掘的“身影”?秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色数据挖掘的前景如何?l云计算l移动应用和媒体平板l社交和协作l视频l下一代分析l社交分析l上下文感知计算l存贮级内存l普适计算l基于结构的基础设施和电脑l云计算l高级分析l客户端计算l绿色ITl重塑数据中心l社交化计算l

6、安全-活动监控l闪存l虚拟化的可用性l无限应用l平板电脑与未来产品l行动为主的应用程式与介面l情境与社群使用经验l物联网lApp商店与市集l次时代分析技术l大数据l内存计算l超低耗能服务器l云端计算20102010十大十大技术趋势技术趋势20112011十大十大技术趋势技术趋势20122012十大十大技术趋势技术趋势秘密 Proprietary Confidential中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:白色目录l数据挖掘基本概念和技术l数据挖掘基本概念l数据挖掘典型流程l数据挖掘常用技术l数据挖掘业界工具l数据挖掘可用资源l本章小

7、结l数据挖掘在电信行业中的应用l总结秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色数据挖掘的标准过程:CRISP-DM(CRoss-Industry Standard Process for Data Mining)秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文

8、细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色可以被挖掘的数据源有哪些?普通文件lexcel,txt,csv,arff等格式的文件;传统数据库l关系数据库,事务型数据库,数据仓库,高级数据库l文本数据库lWeb数据库l多媒体数据库l空间及时空数据l异构数据库其他类型数据l流数据(data streams),如传感数据;l时序数据(time-series data),如生产监控数据;l图结构数据(structure data),如社交网络数据等秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题

9、字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色数据挖掘的研究体系:以结构化数据为基础,叠加数据形态的特殊处理结构化数据结构化数据结构化数据结构化数据(基础)(基础)(基础)(基础)流式数据流式数据流式数据流式数据(+实时处理)实时处理)实时处理)实时处理)(+音视频处理)音视频处理)音视频处理)音视频处理)多媒体数据多媒体数据多媒体数据多媒体数据文本数据文本数据文本数据文本数据(+自然语言处理)自然语言处理)自然语言处理)自然语言处理)数据库数据文件文本文件新闻/博客微博客/论坛/短信图片音

10、频视频流媒体网络流量话单流传感流秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色结构化数据挖掘(KDD):整体流程秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色结构化数据挖掘

11、(KDD):数据准备数据采集l根据挖掘的目标,对可能涉及的数据进行全方位的收集、整理;数据预处理l对错误数据、不完整数据、冗余数据、不一致的数据等等进行统一处理;数据选择l结合数据大小、数据质量、数据挖掘目标、可用资源等等,采用采样、降维、规约等手段选取最终要实施挖掘的数据对象;数据质量的好坏决定了最终结果的正确与否,数据准备占据整个工作量的70%秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt

12、色彩:黑色结构化数据挖掘(KDD):数据建模在理解业务背景、熟知数据状况、明确数据挖掘任务的前提下,利用可用的资源(技术/工具),选择合适的数据挖掘算法,获取满意的结果;知识和经验的集中体现秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色结构化数据挖掘(KDD):模型评估知识l满足用户兴趣度和置信度的模式模式用高级语言表示的表达一定逻辑含义的信息;置信度置信度l知识在某一数据域上为真的

13、量度。兴趣度兴趣度l在一定数据上为真的知识被用户关注的程度。有效性有效性l知识的发现过程必须能够有效地在计算机上实现。秘密 Proprietary Confidential中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:白色目录l数据挖掘基本概念和技术l数据挖掘基本概念l数据挖掘典型流程l数据挖掘常用技术l数据挖掘业界工具l数据挖掘可用资源l本章小结l数据挖掘在电信行业中的应用l总结秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体

14、:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色数据挖掘是一门面向应用的综合性技术数据库 数据仓库数据可视化OLTP OLAP机器学习统计分析模式识别粗糙集 并行计算高性能计算流计算信息检索推荐引擎商务智能支支撑撑技技术术:重重在在运运用用理理论论基基础础特特定定应应用用秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色数据处理与建模方法库

15、秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色数据挖掘十大经典算法http:/www.cs.uvm.edu/icdm/algorithms/index.shtml秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字

16、体:华文细黑字号:18pt色彩:黑色数据挖掘的任务及基本方法因素因素 3因素因素 2因素因素 4因素因素 1常用常用方法方法关联规则挖掘分类分析聚类分析预测分析l发现大量数据中项集项集之间有趣的关联或相关联关联或相关联系。系。l将未知数据划分到给定给定的类别的类别中通过训练样本建立分类模型分类模型,根据模型对未知数据进行分类。l将物理或抽象对象集合分组分组成为由类似的对象组成的多个类的过程。l 相比于分类,聚类是无无监督的监督的(没有已知的类标号)l预测未来的数据趋势;l相比于“分类分析”来说,“预测分析”是建建立连续函数模型立连续函数模型。描述预测秘密 Proprietary Confide

17、ntialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色数据分类三个步骤秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色数据挖掘的经典模式及应用秘密 Proprietary Confidential中文标题字体:黑体字号:30-

18、32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:白色目录l数据挖掘基本概念和技术l数据挖掘基本概念l数据挖掘典型流程l数据挖掘常用技术l数据挖掘业界工具l数据挖掘可用资源l本章小结l数据挖掘在电信行业中的应用l总结秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色数据挖掘相关技术及工具发展报表OLAP引擎数据仓库ETL模型评估数据建模数据预处理数据挖掘 数据管理技术

19、数据分析技术学术界及部分企业推动数据库厂商推动秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色业界主流数据挖掘工具名称名称主要功能主要功能是否开源是否开源编程语言编程语言SPSS统计分析、机器学习否SAS统计分析、机器学习否SASMatlab统计分析、机器学习否matlabWeka以机器学习为主是javaR以统计分析为主、图形展示较丰富是ROrange以机器机器学习为主、图形展示较丰富

20、是java秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色Weka工具概览秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色业界主流数据挖掘相关的数据管理工具产品系列产品系列Or

21、acleMicrosoftIBMSybaseETL工具ODI/OWB(ODI可选)SSISDataStageReplication Server PowerStage数据库管理工具Enterprise ManagerSQL ServerVisual Warehouse(或Cognos)Warehouse StudioOLAP工具EssbaseSSASOLAP Server(或cognos)Warehouse Analyzer数据挖掘工具ODM(可选)SSASIntelligent Miner(可选)无报表工具BIEESSRSInsight&Quick view(或Cognos)InfoMake

22、r,后期会整合BO秘密 Proprietary Confidential中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:白色目录l数据挖掘基本概念和技术l数据挖掘基本概念l数据挖掘典型流程l数据挖掘常用技术l数据挖掘业界工具l数据挖掘可用资源l本章小结l数据挖掘在电信行业中的应用l总结秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色扩展

23、学习参考书籍工工具具应应用用 理理论论介介绍绍秘密 Proprietary Confidential中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:白色目录l数据挖掘基本概念和技术l数据挖掘在电信行业中的应用l云计算环境下的数据挖掘需求l海量数据分析与挖掘系统简介l海量电信级数据挖掘应用实践l本章小结l总结秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:

24、18pt色彩:黑色什么是大数据?“大数据是指无法在一定时间内用常规软件工具常规软件工具对其内容进行抓取、管理和处理的数据集合”维基百科 三大特征(3 V)lVolume:数量大(Twitter1.75亿用户每天创建9500万条微博;Facebook每天在30万台服务器上处理25Tb数据;YouTube每天上传168Tb视频)lVelocity:时效性要求高(搜索引擎要求几分钟前的新闻能够被用户查询到)lVariety:种类和来源多样化(结构化/半结构化/非结构化;关系数据库/数据仓库/互联网网页等)秘密 Proprietary ConfidentialTheme1Theme2Theme3The

25、me4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色大数据的出现、数据结构的改变,对电信行业数据管理及分析带来挑战 传统数据仓库无法有效存储日益增长的业务数据 l随着业务发展数据量的增加,随着应用复杂导致的数据量增加,这些数据量导致了数据存储和处理压力;数据仓库无法线性扩容,管理难度加大,成本高扩容压力大,效率下降等 传统数据仓库无法有效处理新型的业务数据 l公司在移劢互联网和物联网上需要有新领域的突破,不同于传统通信业务分析特点,需要对内容等非结构化、大容量信息进行有效分析,传统的

26、架构处理吃力;秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色电信行业大数据分析与处理的需求秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色大数据分析与处理的行业现状BI级级数

27、据的离线离线分析产品分析产品已经成熟;海量级海量级数据的离离线分析线分析是目前的一个热点;借助内存数据库内存数据库的实时分析实时分析会在未来大放异彩;StormS4StreambaseSASSPSSWekaRRhadoop MahoutBCPDM BI级(GB-TB)内存级(GB以下)海量级(PB)离线分析实时分析空间域时间域秘密 Proprietary Confidential中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:白色目录l数据挖掘基本概念和技术l数据挖掘在电信行业中的应用l云计算环境下的数据挖掘需求l海量数据分析与挖掘系统简介l海

28、量电信级数据挖掘应用实践l本章小结l总结秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色海量数据分析与挖掘系统功能架构应用层分析

29、层支撑层分布式文件系统HDFS分布式数据库HBASE分布式计算/并行计算/流计算IT基础设施内存数据库Redis分布式数据仓库Hive网页解析中文分词实体识别网页爬取网页净化网页索引文本建模关键词提取多媒体分割多媒体采集多媒体特征提取多媒体建模特征提取数据抽样数据规约数据集成数据清洗数据转换分类分析聚类分析关联规则分析时间序列分析语义分析情感分析摘要生成主题发现统计分析实时查询流程可视化结果可视化可视化数据探测文本数据采集与处理文本数据采集与处理结构化数据采集与处理结构化数据采集与处理多媒体数据多媒体数据采集与处理采集与处理数据分析与挖掘算法数据分析与挖掘算法数据可视化数据可视化用户分析产品优

30、化业务推荐信息检索安全监控.并行数据挖掘平台PDMP并行数据分析平台PDAP实时分析平台RTDAP秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色海量数据分析与挖掘系统逻辑架构全局全局数据数据块块数据数据流流数据数据流流计算计算触发的事件触发的事件实时计算结果实时计算结果离线计算结果离线计算结果全局计算全局计算块计算块计算数据采集数据采集秘密 Proprietary Confident

31、ialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色海量数据分析与挖掘系统适应的应用场景秘密 Proprietary Confidential中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:白色目录l数据挖掘基本概念和技术l数据挖掘在电信行业中的应用l云计算环境下的数据挖掘需求l海量数据分析与挖掘系统简介l海量电信级数据挖掘应用实践l本章小结l总结秘密 Proprietary Confi

32、dentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色HadoopHbaseHivePigFlumeMahoutHadoop生态系统 相关定制化产品结合具体业务需求,开展相关产品的定制化实践并行数据处理与挖掘并行文本处理与挖掘海量数据统计分析海量数据实时搜索数据抽取与分发中心个性化推荐引擎.基于Hbase和MapReduce,提供结构化数据的海量数据并行处理与挖掘基于HDFS和MapReduce,提供非结构化数据的海量文本并行处理

33、与挖掘基于hive和Pig,提供Web页面的海量数据可视化统计分析基于Hbase和Solr集成,提供千亿级别数据实时查询和全文检索基于Mahout等,提供个性化的业务推荐服务基于Flume等提供批量数据抽取和转载,同时提供准实时消息、日志的分发 秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色基于分布式数据库的海量数据分析平台秘密 Proprietary ConfidentialThe

34、me1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色面向Web访问的海量数据统计分析秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色面向具体业务的个性化推荐引擎秘密 Proprietary ConfidentialTheme1Theme2T

35、heme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色电信业务大数据分析与挖掘典型应用接触时机分析接触时机分析营销渠道分析营销渠道分析上网行为分析上网行为分析业务关联分析业务关联分析营销效果分析营销效果分析 生活圈分析生活圈分析终端特征分析终端特征分析垃圾短信识别与监控垃圾短信识别与监控生活形态分析生活形态分析精细化营销专题精细化营销专题流失预警分析流失预警分析 秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标

36、题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色应用案例1:利用统计分析用户上网行为,优化网络及业务质量用户偏好分析终端类型分析终端流量分析应用类型分析应用流量分析秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色应用案例2:利用聚类分析实现用户生活形态分群,指导营销方案设计秘密 Pr

37、oprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色应用案例3:利用聚类及关联,进行定向营销秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色应用案例4:利用时序分析和社交网络,进行垃圾短信识

38、别,提升服务品质t短信流垃圾短信发送者怀疑名单_模式分类发送时序行为“空间行为指纹”“社会网络行为指纹”社会网络行为分析社会网络图原始话单库在线监测引擎在线监测引擎模式分类离线监测引擎离线监测引擎模式分类“社会网络行为指纹”秘密 Proprietary Confidential中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:白色目录l数据挖掘基本概念和技术l数据挖掘在电信行业中的应用l云计算环境下的数据挖掘需求l海量数据分析与挖掘系统简介l海量电信级数据挖掘应用实践l本章小结l总结秘密 Proprietary ConfidentialTheme

39、1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色本章小结云计算环境下数据挖掘需求l大数据(数据量大、数据异构、处理时效性)对传统数据分析及管理工具提出了挑战,需要重新构建适应大数据的海量数据分析与挖掘系统;海量数据分析与挖掘系统简介l借助云计算提供的分布式计算模式、分布式数据存贮,构建新的、异构性的、适合多种业务需求的海量数据分析与挖掘系统;电信行业数据挖掘应用实践l结合电信的具体业务需求,对海量数据分析与挖掘系统进行定制化实践,并给出部分应用案例

40、以供参考。秘密 Proprietary Confidential中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:白色目录l数据挖掘基本概念和技术l数据挖掘在电信行业中的应用l总结秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色内容回顾1、什么是数据挖掘?2、CRISP-DM具体包含哪些步骤?3、数据挖掘与哪些技术相关?请列举出3-5个4

41、、数据挖掘的基本任务是什么?5、数据挖掘常用的方法各有哪些?请列举3-4个6、数据挖掘的工具有哪些?开源的与非开源的各举一个7、什么是大数据?8、大数据的三大特征是什么?9、云计算环境下,大数据分析与挖掘系统的支撑技术有哪些?请列举2-3个10、电信业务大数据分析与挖掘的典型应用有哪些?请列举2-3个秘密 Proprietary ConfidentialTheme1Theme2Theme3Theme4中文标题字体:黑体字号:30-32pt色彩:蓝色中文副标题字体:华文细黑字号:20-22pt色彩:黑色子目录(2-5级)字体:华文细黑字号:18pt色彩:黑色讨论:搜集哪些数据?使用哪些方法?秘密 Proprietary Confidential

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁