《最新大数据PPT课件.ppt》由会员分享,可在线阅读,更多相关《最新大数据PPT课件.ppt(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、大数据大数据不知道BIGDATA?你out了!指数型增指数型增指数型增指数型增长长的海量数据的海量数据的海量数据的海量数据海量數據就是大數據嗎?大數據就是雲計算嗎?大数据的4V特性体量Volume多样性Variety价值密度Value速度Velocity非结构化数据的超大规模和增长总数据量的8090%比结构化数据增长快10倍到50倍是传统数据仓库的10倍到50倍大数据的异构和多样性很多不同形式(文本、图像、视频、机器数据)无模式或者模式不明显不连贯的语法或句义大量的不相关信息对未来趋势与模式的可预测分析深度复杂分析(机器学习、人工智能Vs传统商务智能(咨询、报告等)实时分析而非批量式分析数据输
2、入、处理与丢弃立竿见影而非事后见效Value價值挖掘大数据的价值类似沙里淘金,从海量数据中挖掘稀疏但珍贵的信息.价值密度低价值密度低,是大数据的一个典型特征是大数据的一个典型特征.Variety多樣性企业内部的经营交易信息;物联网世界中商品,物流信息;互联网世界中人与人交互信息,位置信息等是大数据的主要来源.能够在不同的数据类型中能够在不同的数据类型中,进行交叉分析的技术进行交叉分析的技术,是大数据的核心技术之一是大数据的核心技术之一.语义分析技术,图文转换技术,模式识别技术,地理信息技术等,都会在大数据分析时获得应用.Velocity速度1s是临界点.对于大数据应用而言,必须要在1秒钟内形成
3、答案,否则处理结果就是过时和无效的.实时处理的要求实时处理的要求,是区别大数据引用和传统数据仓库技术是区别大数据引用和传统数据仓库技术,BI技术的关键差别之技术的关键差别之一一.Volume数据量PB是大数据層次的是大数据層次的临界点界点.KB-MB-GB-TB-PB-EB-ZB-YB-NB-DB对大数据的進一步理解大数据比云计算更为落地商业模式驱动应用需求驱动云计算本身也是大数据的一种业务模式大数据不仅仅是“大”多大?PB 级比大大更重要的是数据的复杂性数据的复杂性,有时甚至大数据中的小数据如一条微博就具有颠覆性的价值软件是大数据的引擎和数据中心(DataCenter)一样,软件是大数据的驱
4、动力.软件改变世界软件改变世界!大数据生态:软件是引擎大数据的应用不仅仅是精准营销通过用户行为分析实现精准营销是大数据的典型应用,但是大数据在各行各业特别是公共服务领域具有广阔的应用前景消费行业金融服务食品安全医疗卫生军事交通环保电子商务气象管理大数据“易”,理解大数据“难”目前大数据管理多从架构和并行等方面考虑,解决高并发数据存取的性能要求及数据存储的横向扩展,但对非结构化数据的内容理解仍缺乏实质性的突破和进展,这是实现大数据资源化、知识化、普适化的核心.非结构化海量信息的智能化处理:自然语言理解、多媒体内容理解、机器学习等.大数据为什么重要?大数据为什么重要?更高一层数据层面整合企业内外部
5、更高数据层面整合利用用户”行为指纹”创造新商机用户在线的每一次点击,每一次评论,每一个视频点播,就是大数据的典型来源。互联网企业之所以取得令人瞩目的成绩,其核心的本质就是包括用户网络操作的大数据,进行记录和分析,形成用户“行为指纹”,从而洞悉用户的潜在的、真实的需求,形成预判。这是传统企业花费重金都难以企及的梦想。所有传统的产品公司都只能沦为这种新型用户平台级公司的附庸。大数据组成和展現方式?大数据组成和展現方式?基于基于SQL语言语言:面对OLAP的传统行和列不基于不基于SQL或或map-reduce的的:由谷歌率先发由谷歌率先发起起数据流数据流:基于运行商数据直接生成任意图形新平台技术新平
6、台技术数据入数据入口口/汇聚汇聚数据平台数据平台分析分析不同范围的服务不同范围的服务传统交付模式-单片或基于设备的解决方案云云:能够充分利用物理设施的弹性,以实现处理快速增长数据的能力“数据库将演变成一个虚拟的,基于云计算,超级可扩展的分布式平台。”-ForresteranalystJimKobielus新的传输方案新的传输方案新模式和新技术展现方式展现方式:大型控制中心、移动终端在多在多样性、体量、速度性、体量、速度三大主要特三大主要特征的指引下,大数据将有新型的展征的指引下,大数据将有新型的展现方式:大型控制中方式:大型控制中心和移心和移动终端,端,实现数据的数据的实时处理和快速决策。理和快速决策。Thanks