商务数据可视化最全课件完整版ppt全书电子教案全套教学教程PPT课件.pptx

上传人:春哥&#****71; 文档编号:14910067 上传时间:2022-05-09 格式:PPTX 页数:116 大小:14.09MB
返回 下载 相关 举报
商务数据可视化最全课件完整版ppt全书电子教案全套教学教程PPT课件.pptx_第1页
第1页 / 共116页
商务数据可视化最全课件完整版ppt全书电子教案全套教学教程PPT课件.pptx_第2页
第2页 / 共116页
点击查看更多>>
资源描述

《商务数据可视化最全课件完整版ppt全书电子教案全套教学教程PPT课件.pptx》由会员分享,可在线阅读,更多相关《商务数据可视化最全课件完整版ppt全书电子教案全套教学教程PPT课件.pptx(116页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、项目一了解商务数据可视化认识Power BI本项目分为两个部分,分别是商务数据可视化的介绍和商务数据可视化工具Microsoft Power BI(以下简称Power BI)的介绍。通过对商务数据可视化的基本情况进行学习,读者将会了解到商务数据可视化的意义、熟悉Power BI界面,为将来从事数据可视化与分析工作打下基础 职业能力目标 1目录任务一 初识商务数据可视化2任务二 认识 Power BI 软件项目一任务一 初识商务数据可视化1典型工作任务技术知识储备商务实战演练任务一 初识商务数据可视化典型工作任务n 2018年天猫“双11”活动除了一直同步跳动最后定格在2135亿元的销售数据让人

2、们印象深刻,“全球屏”“新零售屏”“城市屏”也备受关注。这种通过技术手段实现实时数据可视化的数据投屏技术让媒体、消费者与阿里巴巴公司第一次在数据层面实现了信息对称。从那以后,数据大屏就成为“双11”活动进行媒体信息发布不可或缺的一部分。n 请你根据对商务数据可视化的理解,搜索出12个商务数据可视化的案例2典型工作任务技术知识储备商务实战演练任务一 初识商务数据可视化一、数据可视化在生活中的体现人们在日常生活中,无时无刻不在面对着大量的数据,诸如反映身体健康的体征数据、反映锻炼强度的步行数据、反映家庭经济情况的收支数据、反映企业发展的销量数据、反映国家发展的宏观经济数据 “ 小 米 运 动 ”

3、中 的 运 动 数 据 二、数据可视化的意义 (一)数据可视化方便数据的阅读 随着大数据时代的来临,海量的数据扑面而来,数据使用者可以更便捷地获取数据,为进一步分析打下基础。但是采集后的数据处理与分析却在一定程度上困扰着数据使用者,数据可视化将复杂的数据进行整理后呈现出来,为数据使用者读取与阅读数据提供了帮助 国家数据 可视化产品 二、数据可视化的意义 (二)数据可视化方便数据的分析 数据可视化并不是简单地将数据转换为图表, 它不仅能够更直观地呈现数据,还可以通过简单的逻辑和视觉效果使数据的规律呈现出来,方便数据的分析以城镇新增就业人数为例,观察图1-1-4中的变化规律,便可以得出2015年和

4、2016年城镇新增就业人数相较于2014年出现了一定的下降,2017年和2018年再次上升,虽然同样是增长,但是对比20162017年和20172018年的曲线斜率,便可以得出2017年增加的速度更快一些 三、什么是商务数据可视化 数据可视化是指借助不同的可视化工具,将繁杂的数据转换成易于识别和分析的图表, 帮助数据使用者快速完成海量数据的整理与归纳工作,实现更进一步的数据分析 。在商务活动中,企业将面对纷繁复杂的商业数据,自家产品的成本与销量、往来客户的新增与流失、销售团队的业绩、竞争对手的调价等都是企业需要关注的数据四、商务数据可视化的常用工具(一)常用的数据可视化工具 Tableau:全

5、球知名度很高的数据可视化工具。用户可以轻松地将数据转化成想要的形式。Tableau具有非常强大、安全、灵活的分析平台,支持多人协作。用户还可以通过Tableau软件、网页,甚至移动设备来随时浏览已生成的图表,或将这些图表嵌入报告、网页或软件中,或嵌入Salesforce、SharePoint和Jive等应用程序中,实现实时交互。另外,Tableau还支持数据挖掘。QlikView: 一个完整的商业分析软件, 主要用户是企业用户,用户可以轻松地分析内部数据,并且使用QlikView的分析和企业报告功能进行决策。当输入要搜索的关键字时,QlikView可以自动整合数据,帮助用户找到数据间的关系。P

6、lotly:知名的、功能强大的数据可视化框架。Plotly可以根据输入定制的二维和三维图表,构建交互式图形,创建丰富多样的图表和地图。Power BI:微软开发的商业分析工具,可以很好地集成微软的Office办公软件。 其操作界面相对比较熟悉,新用户很容易上手和使用。用户可以自由导入文件、文件夹和数据库等多种数据,自定义创建报告;同时,Power BI还可以实现自然语言问答,并支持使用Power BI软件、网页、手机应用来查看数据 四、商务数据可视化的常用工具(二)为什么要选择Power BI作为本书的数据可视化工具 1操作界面熟悉操作界面熟悉本书的商务数据可视化工作以Power BI为分析工

7、具,首先是因为Power BI是微软开发的工具,对于经常使用Word、Excel、PPT等Office软件的学生而言,操作界面熟悉且比较容易上手;而且Power BI可以直接将Excel查询、数据模型和报表连接到Power BI仪表板上,这有助于以新的方式快速收集、分析、发布和共享Excel业务数据。2软件免费获取软件免费获取Power BI Desktop是免费获取的,即使学生将来使用Pro版(专业版),每个月需要支付的费用也相对较低。专业版更加易于学生下载并使用,方便学生在课后进行练习。3不断更新迭代不断更新迭代Power BI软件自身和自定义可视化图表都还在不断地进行更新,其官网会对产品

8、更新的功能进行讲解,学生在掌握了基础的操作后,还可以拥有很大的提升空间,如果即将从事数据分析工作,在未来的工作岗位中使用该软件进行数据分析将会对自己有一定的帮助。4拥有智能问答与快速见解功能拥有智能问答与快速见解功能在借助Power BI对大量数据进行数据可视化时,刚接触数据分析的学生可能对于规律的挖掘有一定困难,这时借助Power BI的智能问答和快速见解功能,利用Microsoft AI的最新进展,可构建机器学习模型,从而达到快速找到见解的目的,会更易于对数据进行挖掘与分析。 项目一任务二 认识Power BI软件1典型工作任务技术知识储备商务实战演练任务一 初识商务数据可视化借助Powe

9、r BI生成的针对小米手环3用户评价的可视化图表,请通过对软件不同视图的学习,在报表视图下观察该可视化对象,找出用户最关心的小米手环3的五个功能,并在数据视图下找到对“屏幕”进行评价的具体内容 2典型工作任务技术知识储备商务实战演练任务一 初识商务数据可视化一、Power BI的软件界面 Power BI界面由三个区域组成(见图1-2-2),分别是导航栏、报表画布和报表编辑器(以Power BI 2.73.5586.802版本为例 ) 一、Power BI的软件界面 (一)导航栏与其他Office软件类似,Power BI的导航栏也位于顶部,包括“文件”“主页”“视图”“建模”“帮助”。单击“

10、文件” 按钮 ,将会出现“新建”“打开”“保存”“另存为”等熟悉的操作选项 “主页”选项卡(见图1-2-3)下包括“剪贴板”“外部数据”“插入”“自定义视觉对象”“主题”“关系”“计算”与“共享”。其中,“外部数据”是进行数据连接和数据编辑的功能区;“插入”可以在报表画布上新建页面和进行视觉对象或文本框等元素的插入;“自定义视觉对象”可以在官网下载新的自定义视觉对象,增加可以生成的图表形式;“主题”则可进行各种配色的选择;“关系”是用来管理各表格中字段的关系的;“计算”可以新建度量值,更多是对数据进行处理。 一、Power BI的软件界面 “视图”选项卡(见图1-2-4)可以对页面的大小和手机

11、端布局进行调整,同时可以添加网格线等工具辅助报表的制作 “建模”选项卡(见图1-2-5)可以管理数据关系、创建计算列、优化数据模型,还可以创建计算度量值和计算表等。 一、Power BI的软件界面 (二)报表画布Power BI界面中最大的区域便是报表画布,这也是使用Power BI时最主要的工作区域。借助右侧的报表编辑器生成的视觉对象,将在此区域中进行显示一、Power BI的软件界面 (三)报表编辑器 报表编辑器由“字段”窗格、“可视化”窗格、“筛选器”窗格三个窗格组成。 1“字段”窗格“字段”窗格是用来显示当前可以使用的数据表和字段的。勾选某个字段,将其添加进可视化对象, 便可生成可视化

12、图表 一、Power BI的软件界面 2“可视化”窗格 3“筛选器”窗格“筛选器”窗格主要用于查看、设置和修改不同级别的筛选.筛选器有三种级别,分别是视觉级筛选器、页面级筛选器和报告级筛选器。视觉级筛选器是对本视觉对象进行筛选的, 即图1-2-8(b)顶部的“此视觉对象上的筛选器”。页面级筛选器是对当前报表页面的所有对象进行筛选的, 即图1-2-8(b)中部的“此页上的筛选器”。报告级筛选器则是针对整个报表进行筛选的, 即图1-2-8(b)底部的“所有页面上的筛选器”。 二、Power BI的三种视图 Power BI有三个视图界面,分别是报表视图、数据视图和关系视图,切换的按钮在界面最左侧,

13、如图1-2-9所示,单击即可完成切换,同时以黄色竖线标注当前视图,当前页面停留在报表视图界面。 二、Power BI的三种视图 (一)报表视图在报表视图中,使用者可以借助“可视化”窗格中的可视化对象,在若干报表页面上创建可视化内容,制作可视化报表。在此视图下,使用者可以对可视化对象及报表页面进行复制、粘贴等处理。由于画布区域有限,当在一页报表中无法放置所有需要的可视化对象时,便需要在报表视图底部单击 按钮新建页面。当然也可以对当前页面进行复制、重命名、删除或隐藏(见图1-2-10)等操作。 二、Power BI的三种视图 (二)数据视图数据视图是指针对所需要的数据进行处理与检查,单击 按钮便可

14、进入数据视图。 在数据视图下,可以显示选中的表,并可以对其中的所有行和列进行操作。值得注意的是,当有数据列在报表视图中隐藏时,在数据视图下仍可以看见数据,此时该列以灰色显示,在右侧的字段里也会变成灰色。图1-2-11所示的出版时间便是隐藏列, 以灰色显示 二、Power BI的三种视图 1导航栏在数据视图中,可以利用顶部的导航栏“主页”选项卡完成数据的连接和数据的输入等,在“建模”选项卡下完成管理关系、新建度量值和新建列等操作。如果想要修改列的数据类型,也可以在“建模”选项卡下完成。2公式栏在导航栏和数据网格之间有一行是公式栏,在此处可以输入度量值,也可以输入计算列的DAX公式。3数据网格数据

15、网格中显示的便是当前选中表格的全部数据,如图1-2-12(a)所示,单击列名旁边的 按钮可以完成数据的筛选。用鼠标右键单击该按钮会出现快捷菜单,如图1-2-12(b)所示,可以像Excel一样完成升序、降序、新建列、重命名列等操作,也可以完成复制表、新建度量值、编辑查询等其他操作。二、Power BI的三种视图 4字段列表数据视图右侧为字段列表,在字段列表中用鼠标右键单击字段(见图1-2-13)将可以完成新建层次结构以及新建度量值等操作。通过顶部的搜索框,可以对所有的表格和字段进行搜索。5查询编辑器单击导航栏或者用鼠标右键单击菜单中的“编辑查询”都会启动查询编辑器。二、Power BI的三种视

16、图 (三)关系视图 关系视图是指针对模型中的关系进行管理。当模型中有很多表格且各表格关系复杂时,借助关系模型进行管理十分重要。单击 按钮便可进入关系视图,如图1-2-15所示。 二、Power BI的三种视图 项目小结 通过本项目的学习,读者应重点掌握以下知识。(1)读者对商务数据可视化具备初步认知,能够理解商务数据可视化有利于数据的阅读与分析,能够认识到借助数据可视化可以更形象生动地呈现潜在信息。(2)读者能够熟悉商务数据可视化工具Power BI的软件界面及三种不同的视图,并能够进行简单操作,为后续项目的学习奠定基础。 商务数据可视化项目二 商务数据预处理 查询编辑器 351 任务二 数据

17、清洗目录任务一 获取并合并每个月的销量数据2 361典型工作任务技术知识储备商务实战演练任务一 获取并合并每个月的销量数据 37典型工作任务n 我国至少有1.5亿条宠物,宠物经济的市场潜力也达到了250亿人民币,宠物用品蕴藏着巨大的商机。光亮也趁热在淘宝开了一家宠物用品店,为了制订更好的营销策略,每个月都要将新增的店内数据与历史数据进行汇总,如何高效快速的完成这个重复工作呢? 382典型工作任务技术知识储备商务实战演练任务一 获取并合并每个月的销量数据 39一、数据源类型Power BI可连接多种不同类型的数据源,打开 Power BI Desktop,在“主页”选项卡中单击“获取数据”下拉按

18、钮,将会显示最常见的几种数据源类型,如图2-1-1所示。 40一、数据源类型在下拉列表中单击“更多”选项,将会在打开的“获取数据”对话框中列出了Power BI可连接的所有数据源类型:文件、数据库、Power Platform、Azure、联机服务和其他。其中“全部”即包括所有类别的可连接数据源,如图2-1-2所示。 41二、连接文件对于“文件”类型的数据,Power BI提供了Excel、文本/CSV、XML、JSON和文件夹等数据源连接方式。如图2-1-3所示。 42二、连接文件(一)连接Excel文件在“主页”选项卡中单击“获取数据”下拉按钮,在打开的下拉列表中单击“Excel”选项,弹

19、出“打开”对话框,选择“商品基本信息表.xlsx”数据文件并打开,如图2-1-4所示。 43二、连接文件弹出的“导航器”对话框中会显示数据表信息,在左窗格中选中一个表时,在右窗格中就会出现该数据表的数据预览,如图2-1-5所示。 44二、连接文件通常结构化的数据可以直接加载,需要清洗的数据则使用转换数据进入查询编辑器(Power Query,PQ)界面。单击“加载”按钮,数据加载到Power BI后,将会在报表视图右侧的“字段”窗格中显示该表及其列名称,如图2-1-6所示。 45二、连接文件(二)连接文件夹文件夹可作为一种特殊的数据源,Power BI可将文件夹中所有文件的文件名、创建日期、文

20、件内容等相关信息作为记录导入数据表。打开 Power BI Desktop,在“主页”选项卡中单击“获取数据”下拉按钮,在下拉列表中单击“更多”选项,在“文件”类型列表中单击“文件夹”选项,打开文件夹对话框,单击“浏览”按钮选择文件夹的位置,如图2-1-7所示 46二、连接文件单击“确定”按钮后,会弹出如图2-1-8所示的对话框,从中可以查询到该文件夹下的所有文件。 47二、连接文件在对话框的底部有一个“组合”按钮,因为我们的任务是要将该文件夹下的3个文件合并汇总到一张表中,所以单击该按钮,选择合并并转换数据。在弹出的“合并文件”对话框中会询问要选择以哪个文件作为示例文件,也就是说要合并的3个

21、文件要以示例文件的格式为样本来追加内容。通常汇总文件夹中的数据的前提是文件夹中的文件格式要保持一致,如果有文件格式不一致,则需要尽量把每个文件格式修改一致后再做合并汇总。由于本案例中每个案例格式都是相同的,所以默认就以第一个文件作为示例文件,单击左窗格中的表“sheet1”,如图2-1-9所示。 48二、连接文件单击“确定”按钮,进入到PQ界面,能看到2张表的信息都汇总到了一张表中,如图2-1-10所示。 49三、连接到数据库Power BI可连接各种类型的数据库,如SQL Server数据库、MySQL数据库和Oracle Database等,如图2-1-11所示。 50三、连接到数据库(一

22、)连接SQL Server数据库在“主页”选项卡中单击“获取数据”下拉按钮,在打开的下拉列表中选择“SQL Server”选项,如图2-1-12所示。 51三、连接到数据库在打开的“SQL Server数据库”对话框中,输入服务器地址和数据库名称,如图2-1-13所示。 52三、连接到数据库单击“确定”按钮,将会打开“加密支持”对话框,如图2-1-14所示。单击“确定”按钮,打开“导航器”对话框,在左窗格中选中“商品分析表”,同样在右窗格中会出现该数据表的数据预览,如图2-1-15所示。 53三、连接到数据库单击“加载”按钮,Power BI会显示“加载”对话框,如图2-1-16所示。数据库中

23、的“商品分析表”加载到Power BI后,会在Power BI的报表视图右侧的“字段”窗格中显示该表及其列名称,如图2-1-17所示。对于其他类型的数据库,操作方法类似,这里就不逐一介绍了。 54四、连接Web数据Power BI不仅能从本地获取数据,还能从网页上抓取实时数据。在“主页”选项卡中单击“获取数据”下拉按钮,在打开的下拉列表中选择“Web”选项,如图2-1-18所示。在弹出的“从Web”对话框的“URL”文本框中输入网址,如图2-1-19所示。 55四、连接Web数据单击确定按钮,将建立与网页的连接,打开“导航器”对话框,左窗格中会显示网页上可用表的列表,选中Table 0,右窗格

24、中会出现该数据表的数据预览,如图2-1-20所示。 56四、连接Web数据单击“加载”按钮,数据表加载到Power BI后,同样会在Power BI的报表视图右侧的“字段”窗格中显示该表及其列名称,如图2-1-21所示。这里需要注意的是,不是所有网页上的数据都可以直接被获取,这主要取决于网页上数据的格式是否以表格形式提供,Power BI能从网页中识别表格数据,然后将其导入。 573典型工作任务技术知识储备商务实战演练任务一 获取并合并每个月的销量数据 58任务一 获取并合并每个月的销量数据通过以上的操作,我们发现只要把每个月的销售表放到同一个文件夹中,例如,我们将光亮8、9两个月的销售表放进

25、“销售量”这个文件夹内,在Power BI连接数据源时选择“销售量”这个文件夹,就能快速地将两个工作簿的数据汇总到一张表上。更简单的是,当下个月又有销售表更新的时候,例如,现在又增加了10月份的销售明细表,那么只需要将10月份的销售明细表同样加入到“销售量”这个文件夹内,如图2-1-22所示。 59任务一 获取并合并每个月的销量数据在PQ界面直接单击“刷新预览”按钮,如图2-1-23所示。10月份的数据瞬间就被添加进来了,如图2-1-24所示。这个过程基本上是全自动化完成,对光亮来说,以后每个月要做的事情就是把新的数据文件放到“销售量”中,然后单击“刷新预览”按钮即可。 601典型工作任务技术

26、知识储备商务实战演练任务二 数据清洗 61典型工作任务n 一年一度的“双11”即将到来,作为一家新店经营者,光亮面临的首要问题就是选择哪些商品去参加双十一活动?请利用查询编辑器强大的数据清洗功能帮助光亮挑选出店内的爆款商品。 622典型工作任务技术知识储备商务实战演练任务二 数据清洗 63一、查询编辑器的介绍查询编辑器可连接一个或多个数据源,根据用户的需要调整和转换数据。在Power BI“主页”选项卡中单击“编辑查询”下拉按钮,选择“编辑查询”,如图2-2-1所示。 64一、查询编辑器的介绍没有数据连接时,查询编辑器显示为空白窗格,如图2-2-2所示。在查询编辑器“主页”选项卡中单击“新建源

27、”下拉按钮,选中“Excel”导入案例数据“2019年8月销售量”,如图2-2-3所示。 65一、查询编辑器的介绍建立数据连接后,查询编辑器中显示的界面主要由四部分组成:功能区、“查询”窗格、中间窗格、“查询设置”窗格。 66一、查询编辑器的介绍(一)功能区功能区包含“文件”菜单和5个选项卡:“主页”“转换”“添加列”“视图”“帮助”。1.“文件”菜单“文件”菜单如图2-2-5所示,菜单中各命令的含义如下:u 关闭并应用:关闭查询编辑器并应用所做的更改。u 应用:应用所做的更改,但不关闭查询编辑器。u 关闭:关闭查询编辑器,但不关闭查询编辑器。u 保存:保存当前所做的更改。u 另存为:将查询另

28、取一个名称保存。u 选项和设置:可以在子菜单中选择管理Power BI的环境选项和数据源设置。u 帮助:可在子菜单中选择查看各种辅助学习资源。 67一、查询编辑器的介绍2.“主页”选项卡“主页”选项卡提供了常见的查询功能,如图2-2-6所示。3.“转换”选项卡“转换”选项卡提供了对数据的相关转换操作,如图2-2-7所示 68一、查询编辑器的介绍4.“添加列”选项卡“添加列”选项卡提供了各种添加列的功能,如图2-2-8所示。5.“视图”选项卡“视图”选项卡提供了查询编辑器界面相关的选项设置,如图2-2-9所示。 69一、查询编辑器的介绍6.“帮助”选项卡“帮助”选项卡提供了相关的学习辅助资源,如

29、图2-2-10所示。 70一、查询编辑器的介绍(二)查询窗格“查询”窗格用于显示Power BI当前获取数据时使用的所有查询,如图2-2-11所示。在Power BI中,一个查询导入的数据为一个数据表(简称为表)。当从“查询”窗格中选择一个查询后,其数据显示在中间窗格的中间窗格中。我们选中“sheet1”,用鼠标右键单击将查询重命名为“2019年8月销售量”。 71一、查询编辑器的介绍(三)中间窗格中间窗格用于显示已选择的查询中的数据,如图2-2-12所示。 72一、查询编辑器的介绍(四)查询设置窗格“查询设置”窗格包含两个部分:属性和应用的步骤,如图2-2-13所示。1.属性:单击“所有属性

30、”选项,可打开“查询属性”对话框,如图2-2-14所示 73一、查询编辑器的介绍2.应用的步骤“应用的步骤”列出了当前查询所包含的基本步骤。在图2-2-13所示“应用的步骤”包含了以下4个步骤:源、导航、提升的标题和更改的类型。这4个步骤是按顺序执行的,单击某一个步骤,中间窗格就会显示该步骤对应的数据预览。查询编辑器打开后,中间窗格默认会显示“应用的步骤”中最后一个操作时的数据,也是最终加载到Power BI中的数据。 74二、数据清洗(一)数据转换数据转换主要是对查询中的数据执行进一步的加工。1.将第一行用作标题在Excel中,通常第一行为标题行,从第二行开始才是数据,但在PQ界面中,从第一

31、行开始就需要是数据记录,标题要在数据之上。因此从Excel导入数据的第一步就是要提升标题,通常这个操作在Power BI中会自动完成。如图2-2-15所示。 75二、数据清洗在本示例中,由于“2019年8月销售量.xlsx”中前两行都不是数据,还需要再一次提升标题。在“转换”选项卡中单击“将第一行用作标题”下拉按钮,在下拉列表中选择“将第一行用作标题”命令(见图2-2-16),完成标题提升,如图2-2-17所示。 76二、数据清洗2.修改数据类型在“转换”选项卡中单击“数据类型”下拉按钮,可查看到PQ中常用的数据类型,如图2-2-18所示。 77二、数据清洗通常查询能自动识别源数据的数据类型,

32、但不一定准确。例如,在图2-2-17中,“订单号”和“商品ID”被识别为整数,显然不适用。单击“订单号”左侧的数据类型按钮,在下拉列表中选择“文本”,如图2-2-19所示。 78二、数据清洗在打开的“更改列类型”对话框中选择“替换当前转换”,表示在当前步骤中即完成数据类型的更改,如图2-2-20所示。按同样的方法将“商品ID”数据类型也更改为“文本”,完成数据类型转换后的数据预览结果如按同样的方法将“商品ID”数据类型也更改为“文本”,将“下单时间”数据类型由“日期/时间”更改成“日期”,完成数据类型转换后的数据预览结果如图2-2-21所示。 79二、数据清洗3.数据筛选使用标题列右侧的筛选按

33、钮,可以剔除不需要的信息行。例如,我们要查看2019/8/1日的销售数据,单击“下单时间”右侧的筛选按钮,只选中2019/8/1,如图2-2-22所示。筛选后的数据预览结果,如图2-2-23所示。 80二、数据清洗4.删除空值导入后的数据中可能会有空值,单击“商品名称”右侧的筛选按钮,在弹出的筛选条件中选择“删除空”,如图2-2-24所示,则可以将示例查询中的空值删除。 81二、数据清洗5.日期提取PQ中日期格式比较特殊,我们可以按年、月、日等不同颗粒度的组合去提取时间,比如我们要提取月份,选中“下单时间”列,在“转换”选项卡中单击“时间”下拉按钮,在下拉列表中选中“月份”中的“月份名称”,如

34、图2-2-25所示。“下单时间”列中的日期数据就会显示对应的月份“八月”,如图2-2-26所示。 82二、数据清洗6.透视与逆透视逆透视就是把表中的列转换成了值,而透视则是把值变成了列,且在透视过程中还可以选择对值进行聚合函数的运算。(1)在“主页”选项卡中单击“选择列”下拉按钮,选择“选择列”选项,如图2-2-27所示。 83二、数据清洗(2)在弹出的“选择列”对话框中选中“商品数量”“商品名称”“下单时间”,如图2-2-28所示。(3)选中列的数据预览结果如图2-2-29所示。 84二、数据清洗(4)选中“商品名称”列,在“转换”选项卡中单击“透视列”按钮,如图2-2-30所示。 85二、

35、数据清洗(5)在弹出的“透视列”对话框里,默认的“值列”是商品数量,展开“高级选项”,可以看到默认的“聚合值函数”是“求和”如图2-2-31所示, 单击“确定”按钮.(6)数据透视表就完成了,如图2-2-32所示。 86二、数据清洗(7)在这个透视表中,我们可以清楚的看到每个商品在八月份的累计销量。逆透视就是反过来操作,选中“下单时间”,单击“逆透视列”下拉按钮,在下拉列表中选择“逆透视其他列”,如图2-2-33所示。 87二、数据清洗(8)逆透视后的表如图2-2-34所示。 88二、数据清洗7.转置转置就是把列变成行,行变成列,单击“转置”命令,转置后的表如图2-2-35所示。 89二、数据

36、清洗在以上的数据转换中,我们会发现,所有的操作都会被记录在“应用的步骤”面板中,如图2-2-35所示,其中带有设置标记“”的,都是可以更改的。我们也可以删除某一个步骤,单击步骤名左侧的“”按钮,就可以删除该步骤。我们还可以移动步骤,互换操作的顺序。例如,我们可以把“提取月份名称”移动到“删除其他列”的后面,如图2-2-36所示。 90二、数据清洗 需要注意的是,并不是所有的步骤都可以调换顺序的,在进行移动步骤操作时,要避免前后步骤出现冲突。例如,我们把“删除其他列”移动到操作步骤“更改的类型1”前面,在执行“更改的类型1”这个操作时,系统就会报错,如图2-2-37所示。 因为在“删除其他列”这

37、个操作中,我们已经把“订单号”列删除了,再执行对它的类型修改自然就找不到这一列了。 91二、数据清洗(二)数据丰富通常在做数据分析的时候,我们还需要在原有数据的基础上增加一些辅助数据。例如,加入一些新列、新行,或是从其他表中添加更多维度的数据,这就是数据丰富。1.索引列在“添加列”选项卡中单击“索引列”下拉按钮,如图2-2-38所示,可以添加一个从0或者1开头的序号列。这个序号列在后期的数据分析中可以用来排序或者快速的定位到我们想要的行。 92二、数据清洗2.条件列“添加列”命令是一个与Excel中的if函数作用相似的方法,如图2-2-39所示。如果要把“下单时间”分为3个区间:“八月上旬”“

38、八月中旬”“八月下旬”,在“添加条件列”对话框中添加如图2-2-40的设置即可。 93二、数据清洗图2-2-41所示为添加的条件列,使用这种方法的好处是我们能够清楚的设置多重条件,避免使用If函数进行嵌套。 94二、数据清洗3.追加查询追加查询就是把多张表纵向的汇总到一起,用来汇总的表必须具有相同的字段属性,与之前在用文件夹导入数据实现多个文件合并在一起的功能是一样的,不同的是在追加查询中我们需要将要合并的表先添加到PQ中。例如,我们要获取9月到10月的销售量数据,我们先将“2019年9月销售量”“2019年10月销售量”添加到PQ中,选中“2019年9月销售量”,单击“追加查询”下拉按钮,下

39、拉列表中有以下两个子命令。“追加查询”是指在当前选中表的基础上追加其他表。“将查询追加为新查询”是指把追加后的结果生成一张新表。 95二、数据清洗首先选择“将查询追加为新查询”命令(见图2-2-42),在弹出的“追加”对话框中选择要追加到主表的表“2019年10月销售量”(见图2-2-43),单击“确定”按钮后,如图2-2-44所示,便完成了将两张表汇总到一张表的操作。 96二、数据清洗 97二、数据清洗4.合并查询合并查询是指横向的汇总多张表,需要注意的是合并查询的表之间必须有相互关联的字段。例如,我们要在“2019年8月的销售量”表中添加商品类别信息,首先我们在PQ中导入“商品类别表”,使

40、用第一行作为标题如图2-2-45所示。 98二、数据清洗在查询窗格先选中“2019年8月的销售量”,单击“合并查询”下拉按钮,选择“合并查询”命令,如图2-2-46所示。在弹出的“合并”对话框中选择“商品类别”表,并选中两张表的关联列“商品名称”,联接种类采用默认的“左外部”,此时系统会自动识别出“所选内容匹配第一个表中的20行(共23行)”,如图2-2-47所示。 99二、数据清洗单击“确定”按钮后,在“2019年8月销售量”表的右侧会增加一个新列“商品类别表”,单击其右上角的图标,会显示可以扩展的列,因为“商品名称”在原表中已经存在了,因此可以不选中此列,只选择“商品类别”这列,如图2-2

41、-48所示。 100二、数据清洗单击“确定”按钮后可以看到合并的结果,如图2-2-49所示。可以看到添加进来的“商品类别”列中有空值,原因是因为在联接的时候使用的是“左外部”,所以左侧表中的所有行都会被保存下来,但是扩展和合并列并没有匹配项 ,所以显示为空值。 101二、数据清洗联接种类有以下几种,如图2-2-50所示。如果在刚刚的合并查询中使用“右外部”连接的话,此时系统会自动识别出“所选内容匹配第二个表中的11行(共32行)”,如图2-2-51所示。 102二、数据清洗当对合并后的查询进行列的展开,我们会看到左侧的“2019年8月销售量”表中多了“32-11=21”行空值,这是因为在“20

42、19年8月销售量”表中并没有这21个商品的销售记录,而在右外部联接中,要保留右侧表即“商品图片”表中的所有信息。除去左侧表中不匹配的数据,即我们在“左外部”联接结果中看到的“商品图片1”列是空值的行,共三行。所以“右外部”联接结果中有“21+23-3=41”行,如图2-2-52示。 103二、数据清洗完全外部联接的含义是保留两张表中的所有行,相互找到匹配行,所以结果内会有44行数据,如图2-2-53所示。 104二、数据清洗内部联接的含义则是把两张表中仅匹配的行保留,所以结果将保留20行数据,如图2-2-54所示。 105二、数据清洗左反联接是指在左侧的表中找到没有匹配的行,所以结果中将会保留

43、3行数据,如图2-2-55所示。 106二、数据清洗右反联接则是指保留在右侧表中没有匹配的行,所以结果将会保留21行数据,如图2-2-56所示。 107二、数据清洗5.对行进行分组在PQ中,我们还可以对行进行分组统计。例如,我们现在需要了解8月份每个商品的总销售情况。选中查询“2019年8月销售量”,单击“分组依据”按钮,如图2-2-57所示。 108二、数据清洗在“分组依据”对话框中,第一个下拉框是要选择要进行分组的列,在这里我们选择“商品名称”列。新列名对应的文本框中输入“商品8月销量”,操作选择默认的“对行进行计数”,如图2-2-58所示。单击“确定”按钮后,PQ将执行分组依据操作并返回

44、结果,如图2-2-59所示。 1093典型工作任务技术知识储备商务实战演练任务二 数据清洗 110任务二 数据清洗通常情况下,进行活动推广的产品都是本店内销量最火爆的产品。如图2-2-60所示在任务一中,我们已经把8、9、10三个月的产品销售情况汇总到一张表里面。目前这张数据表中仍然存在着很多的问题:数据格式不正确,有重复以及无效的订单,数据行中加入了每张表的表头等。需要利用使用PQ完成数据清洗。 111任务二 数据清洗首先选中“source.Name”列并用鼠标右键单击,在弹出的快捷菜单中单击“删除”命令来删除多余的列。然后单击“转换”选项卡中的“将第一行用作标题”命令,将原表中的第二行作为

45、标题,如图2-2-61所示。 112任务二 数据清洗对于空行等无用的信息行,需要使用表头的筛选按钮剔除。对于因为目前的表格是由多张表汇总到一起,每张表的表头也被加了进来,这几行也必须要删除,如图2-2-62所示。 113任务二 数据清洗将“订单号”和“商品ID”两列的数据类型修改为文本,“下单时间”列数据类型改为日期,然后单击中间窗格左上角的按钮,在弹出的菜单中单击“删除重复项”命令,如图2-2-63所示。 114任务二 数据清洗去掉重复订单以后的查询结果共102行,单击“分组依据”按钮,在弹出的“分组依据”对话框中进行相关输入,如图2-2-64所示。 115任务二 数据清洗单击“确定”按钮后,PQ将执行分组依据操作并返回结果,选中“商品销售数量”列,进行“降序排序”,排序后的结果如图2-2-65所示,从中我们选出销量前五的商品作为我们参加“双11”活动的备选名单。商务数据可视化

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁