《第一章-数据可视化基础课件.pptx》由会员分享,可在线阅读,更多相关《第一章-数据可视化基础课件.pptx(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一章:数据可视化基础主讲老师:XXX数据可视化基础与实践目录1数据可视化基础知识2数据可视化方法数据可视化基础数据可视化基础知识知识1 1、什么是大数据可视化、什么是大数据可视化数据可视化基础知识数据可视化是数据加工和处理的基本方法之一,它通过图形、图像、图表、表格等技术来更为直观地表达数据,从而为发现数据的隐含规律提供技术手段。视觉占人类从外界获取信息的通常达到80%左右,可视化是人们有效利用数据的最基本方法。数据可视化使得数据更加友好、易懂,提高了数据资产的利用效率,更好地支持人们对数据认知、数据表达、人机交互和决策支持等方面的应用2 2、可视化的基本特征、可视化的基本特征可视化的特征表
2、现:l 易懂性:可视化可以使数据更加容易被人们理解和认识,进而更加容易与人们的经验知识产生关联,使得碎片化的数据转换为具有特定结构的知识,从而为决策支持提供帮助。l 必然性:大数据所产生的数据量已经远远超出了人们直接阅读和操作数据的能力,必然要求人们对数据进行归纳总结和分析,对数据的结构和形式进行转换处理。l 片面性:数据可视化只能反映数据规律的一个方面。数据可视化的片面性特征要求可视化模式不能替代数据本身,只能作为数据表达的一种特定形式。l 专业性:专业化特征是人们从可视化模型中提取专业知识的环节,它是数据可视化应用的最后流程。数据可视化基础知识3 3、可视化的目标和作用、可视化的目标和作用
3、大数据可视化l 1.数据表达通过计算机图形、图像、图表技术来开展数据表达。常见的形式如文本、表格、图表、图像、二维图形、三维模型、网络图、树结构、符号和电子地图等。l 2.数据操作数据操作是以计算机提供的界面、接口、协议等条件为基础完成人与数据的交互需求。以可视化为基础的人机交互技术快速发展,包括自然交互、可触摸、自适应界面和情景感知等在内的新技术极大地丰富了数据操作的方式。l 3.数据分析数据分析是通过数据计算获得多维、多源、异构和海量数据所隐含信息的核心手段,它是数据存储、数据转换、数据计算和数据可视化的综合应用。数据可视化基础知识4 4、数据可视化流程数据可视化流程数据可视化流程1.数据
4、采集数据获取是通过数据抽取等技术获得的各种类型的结构化、半结构化和非结构化的海量数据,是大数据知识服务模型的根本。按获取的方式不同,大数据采集分为设备数据采集和互联网数据采集。2.数据处理数据处理是指对原始的数据进行质量分析、预处理和计算等步骤。常见的大数据处理技术包括MapReduce分布式计算框架、Spark分布式内存计算系统、Storm分布式流计算系统等。数据处理的目标是保证数据的准确性、完整性、可用性。3.可视化模式可视化模式是数据的一种特殊展现形式,常见的可视化模式有标签云、序列分析、网络结构、电子地图等。4.可视化应用可视化应用是用来观察和展示,通过观察和人脑分析进行推理和认知,辅
5、助人们发现新知识或者得到新结论。也可以帮助人们进行人与数据的交互,辅助人们完成对数据的迭代计算,通过若干步数据的计算实验生产系列化的可视化成果。数据可视化基础知识大数据可视化方法大数据可视化数据:聚焦于解决数据的采集、清洗、预处理、分析、挖掘等。图形:聚焦于解决光学图像的接收、提取信息、加工变换、存储显示等。可视化:聚焦于解决将数据转换位图形,并进行交互处理。大数据可视化方法1、文本可视化文本可视化文本可视化文本信息是大数据时代非结构化数据类型的典型代表,是互联网中最主要的信息类型。文本可视化的意义在于,能够将文本中蕴含的语义特征(例如:词频与重要度、逻辑结构、主题聚类、动态演化规律等)直观地
6、展示出来。常使用方式:标签云动态文本时序信息可视化大数据可视化方法1、文本可视化文本可视化文本可视化标签云可视化大数据可视化方法一般用字号大小代表该关键词的重要性,快速识别网络媒体的主题热度。1、文本可视化文本可视化文本可视化语义结构树可视化大数据可视化方法文本中通常蕴含着逻辑层次结构和一定的叙述模式,为了对结构语义进行可视化1、文本可视化文本可视化文本可视化语义结构树可视化大数据可视化方法一种是将文本的叙述结构语义以树的形式进行可视化,同时展现了相似度统计、修辞结构及相应的文本内容;另一种是以放射状层次圆环的形式展示文本结构。基于主题的文本聚类是文本数据挖掘的重要研究内容,为了可视化展示文本
7、聚类效果,通常将一维的文本信息投射到二维空间中,以便于对聚类中的关系予以展示。1、文本可视化文本可视化文本可视化动态文本时序信息可视化大数据可视化方法文本的形成和变化过程与时间是紧密相关的,因此将动态变化的文本中时间相关的模式与规律进行可视化展示。 (a)文本流(b)事件流网络可视化网络关联关系在大数据中是一种常见的关系,在当前的互联网时代,社交网络可谓是无处不在。2、网络、网络可视化可视化大数据可视化方法社交网络服务是指基于互联网的人与人之间的相互联系、信息沟通和互动娱乐的运作平台。微信、QQ、腾讯微博、新浪微博、LinkedIn、Twitter等都是当前互联网上较为常见的社交平台。基于这些
8、社交平台提供的服务建立起来的虚拟化网络就是社交网络。网络可视化网络型结构2、网络、网络可视化可视化大数据可视化方法网络型结构:其典型特征是由节点与节点之间的连接构成的。这些一个个的节点通常代表一个个人或者组织,节点之间的连接关系有朋友关系、亲属关系、关注或转发关系(微博)、支持或反对关系,或者拥有共同的兴趣爱好等。社会网络图网络可视化层次结构2、网络、网络可视化可视化大数据可视化方法层次结构数据:属于网络信息的一种特殊情况,基于网络节点和连接的拓扑关系,直观地展示网络中潜在的模式关系。网络可视化边捆绑(Edge Bundling)2、网络、网络可视化可视化大数据可视化方法规模达到百万个以上时,
9、可视化界面中会出现节点和边大量聚集、重叠和覆盖问题,使得分析者难以辨识可视化效果,可采用图简化和边捆绑的方法来解决。图简化(Graph Simplification)方法是处理此类大规模图可视化的主要手段;边捆绑(Edge Bundling)的方法,对边进行聚集处理,使得复杂网络可视化效果更为清晰。时空数据可视化时空数据是指带有地理位置与时间标签的数据。随着传感器与移动终端的迅速普及,时空数据已经成为大数据时代典型的数据类型。时空数据可视化与地理制图学相结合,重点对时间与空间维度,以及与之相关的信息对象属性建立可视化表征,对与时间和空间密切相关的模式及规律进行展示。大数据环境下时空数据的高维性
10、、实时性等特点,也是时空数据可视化的重点。为了反映信息对象随时间进展与空间位置所发生的行为变化,通常通过信息对象的属性可视化来展现。3、时空数据可视化、时空数据可视化大数据可视化方法时空数据可视化流式地图(Flow Map)3、时空数据可视化、时空数据可视化大数据可视化方法流式地图是一种将时间事件流与地图进行融合的典型方法。时空数据可视化时空立方体(space-timecube)3、时空数据可视化、时空数据可视化大数据可视化方法一种以三维方式对时间、空间及事件直观展现出来,这种方法被称为时空立方体(space-timecube)。时空立方体能够直观地对该过程中地理位置变化、时间变化、部队人员变
11、化及特殊事件进行立体展现。然而,时空立方体同样面临着大规模数据造成的密集杂乱问题。一类解决方法是结合散点图和密度图对时空立方体进行优化;另一类解决方法是对二维和三维进行融合,引入了堆积图(Stack Graph),在时空立方体中拓展了多维属性显示空间。多维数据可视化多维数据指的是具有多个维度属性的数据变量,广泛存在于基于传统关系数据库及数据仓库的应用中。多维数据分析的目标是探索多维数据项的分布规律和模式,并揭示不同维度属性之间的隐含关系。多维可视化的基本方法,包括基于几何图形、基于图标、基于像素、基于层次结构、基于图结构及混合方法。其中,基于几何图形的多维可视化方法是近年来主要的研究方向。大数
12、据背景下,除了数据项规模扩张带来的挑战,高维所引起的问题也是研究的重点。4、多维数据可视化、多维数据可视化大数据可视化方法多维数据可视化散点图散点图(Scatter Plot)是指在回归分析中,数据点在直角坐标系平面上的分布图,散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的函数对数据点进行拟合。是最为常用的多维可视化方法。4、多维数据可视化、多维数据可视化大数据可视化方法多维数据可视化投影投影(Projection)是能够同时展示多维的可视化方法之一。将各维度属性列集合通过投影函数映射到一个方块形图形标记中,并根据维度之间的关联度对各个小方块进行布局。基于投影的多维可视化方法一方
13、面反映了维度属性值的分布规律,同时也直观地展示了多维度之间的语义关系。4、多维数据可视化、多维数据可视化大数据可视化方法多维数据可视化平行坐标平行坐标(Parallel Coordinates)是研究和应用最为广泛的一种多维可视化技术,将维度与坐标轴建立映射,在多个平行轴之间以直线或曲线映射表示多维信息。4、多维数据可视化、多维数据可视化大数据可视化方法多维数据可视化平行坐标近年来,研究者将平行坐标与散点图等其他可视化技术进行集成,提出了平行坐标散点图PCP(Parallel Coordinate Plots)。如将散点图和柱状图集成在平行坐标中,支持分析者从多个角度同时使用多种可视化技术进行
14、分析。4、多维数据可视化、多维数据可视化大数据可视化方法多维数据可视化聚簇可视化大数据环境下,平行坐标面临的主要问题之一是大规模数据项造成的线条密集与重叠覆盖问题,根据线条聚集特征对平行坐标图进行简化,形成聚簇可视化效果4、多维数据可视化、多维数据可视化大数据可视化方法本章小结本章主要从数据可视化基础入手,主要对可视化的基本特征、可视化的目标和作用、数据可视化的流程进行介绍。同时介绍大数据可视化的基本方法,并重点介绍文本可视化、网络可视化、时空数据可视化、多维数据可视化的方法。本章小结本章小结大数据可视化概述课堂练习简单描述你看过且印象深刻的数据可视化案例?发展大数据可视化,那么传统的数据或信息的表示方式是否还有意义?请简述你的看法。结束 谢谢收看