《教学课件(02)第2章数据处理(Excel-1).pptx》由会员分享,可在线阅读,更多相关《教学课件(02)第2章数据处理(Excel-1).pptx(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、教材配套资源页完整PPT课件教学课件(02)第2章 数据处理(Excel-1)2 - 2数据分析基础Excel实现(贾俊平)2022-7-11课程结构第1章 数据分析概述第2章 数据处理第3章 数据可视化分析第4章 数据的描述分析第5章 推断分析基本方法第6章 相关与回归分析第7章 时间序列分析2 - 3数据分析基础Excel实现(贾俊平)2022-7-112 - 4数据分析基础Excel实现(贾俊平)2022-7-11l 学习目标学习目标了解数据审核的内容掌握频数分布表的生成方法掌握数值数据类别化方法使用Excel的生成频数分布表l 思政目标思政目标数据处理是数据分析的前期工作。在数据处理过
2、程中要本着实事求是的态度,避免为达到个人目的而有意加工和处理数据数值数据分组的目的是通过数据组别对实际问题进行分类,分组的应用要反映社会正能量,避免利用不合理的分组歪曲事实学习目标和思政目标2 - 5数据分析基础Excel实现(贾俊平)2022-7-11l数据审核就是检查数据中是否有错误l对于通过调查取得的原始数据(raw data),主要从完整性和准确性两个方面去审核。完整性审核主要是检查应调查个体是否有遗漏,所有的调查项目是否填写齐全等。准确性审核主要是检查数据是否有错误,是否存在异常值等l对于通过其他渠道取得的二手数据,应着重审核数据的适用性和时效性应弄清楚数据的来源、数据的口径以及有关
3、的背景材料,以便确定这些数据是否符合自己分析研究的需要,不能盲目生搬硬套还要对数据的时效性进行审核,对于有些时效性较强的问题,如果所取得的数据过于滞后,可能失去了研究的意义 数据的预处理2 - 6数据分析基础Excel实现(贾俊平)2022-7-11l数据录入就是生成电子数据文件l用Excel进行数据验证第第1步:步:用鼠标在工作表中选定录入数据的单元格区域,如A1:B10单元格区域第2步:选择【数据】【数据验证】第3步:在【验证条件】的【允许】框内选择要录入的数据类型,比如,“整数”(默认为任何值)。在【介于】框内选择验证条件,或者在“最小值”和“最大值”框内输入数据范围。比如,在【最小值】
4、框内输入0,在【最大值】框内输入100。出现的界面如下图所示第4步:点击【出错警告】,在【式样】下选择“警告”,在【错误信息】下输入警告信息,比如“NA”。然后点击【确定】,即可完成设置完成上述设置后,在此区域内录入不符合验证条件的数据将会出现以下错误信息。比如,在A1单元格录入1000,显示的错误信息。选择【是】,忽略此错误,选择【否】则返回单元格,再重新录入 数据的预处理2 - 7数据分析基础Excel实现(贾俊平)2022-7-11 数据的预处理2 - 8数据分析基础Excel实现(贾俊平)2022-7-11【例【例2-1】表2-1是50个学生的学生编号、性别、专业和考试分数数据。按考试
5、分数降序排列第第1步:步:将光标放在数据区域的任意单元格。然后点击【数据】【排序】第第2步:步:在【主要关键字】框中选择要排序的变量,本例为“考试分数”,在【次序】中选择降序(默认为升序),然后点击【确定】(如果要专业排序,点击【选项】,在【方法】下选中“字母排序”或“笔划排序”) 数据的预处理学生编号学生编号性别性别专业专业考试分数考试分数学生编号学生编号性别性别专业专业考试分数考试分数1男会计学8226男管理学782男金融学8127女金融学893女会计学7528男会计学794女管理学8629女金融学845男会计学7730女会计学986女金融学9731女会计学797男管理学7732女金融学7
6、68女会计学9233男会计学799女金融学7134男会计学5610男会计学8535女会计学8811女金融学8036女会计学8612男金融学5537男管理学7913男管理学8138男管理学8514男会计学7839男管理学7315男会计学5140女会计学7916女金融学7941男金融学8217男会计学6342男管理学8218男管理学8943男管理学7419女管理学7144女金融学8320男金融学8245女金融学7421男管理学9146女管理学8622男金融学9047男管理学7523女管理学7848男会计学7024男金融学7449女会计学7325男金融学6650女会计学802 - 9数据分析基础Ex
7、cel实现(贾俊平)2022-7-11数据筛选(data filter)是根据需要找出符合特定条件的某类数据 数据的预处理l用Excel进行数据筛选的过程【例例2-2】筛选出考试分数大于等于筛选出考试分数大于等于90的学生的学生第1步:将光标放在数据区域的任意单元格。然后点击【数据】【筛选】。这时绘在每个变量名中出现下拉箭头第2步:点击要筛选的变量的下拉箭头即可对该变量进行筛选。比如,要筛选出考试分数大于等于90的学生,点击考试分数变量的下拉箭头第3步:点击“大于或等于”,并在后面的框内输入90。点击【确定】2 - 10数据分析基础Excel实现(贾俊平)2022-7-11 数据的预处理【例例
8、2-2】筛选出会计学专业考试分数筛选出会计学专业考试分数小于小于60男生男生使用【高级筛选】命令第1步:在工作表的上方插入3个空行,将数据表的第一行(变量名)复制到第1个空行;在第2个空行的相应变量名下依次输入筛选的条件第2步:选择【数据】【高级】。在列表区域输入要筛选的数据区域;在条件区域输入条件区域单击【确定】2 - 11数据分析基础Excel实现(贾俊平)2022-7-11l频数频数(frequency)落在某一特定类别(或组)中的数据个数l频数分布频数分布(frequency distribution)把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来由于类别数据本身就是用文
9、字表达的类别,因此,只要先把所有的类别都列出来,然后计算出每一类别的频数,即可生成一张频数分布表频数分布表中落在某一特定类别的数据个数就是频数根据观察变量的多少,可以生成简单频数表、二维列联表和多维列联表等简单的频数表简单的频数表l也称为一维列联表l只涉及一个分类变量时,这个变量的各类别(取值)可以放在频数分布表中“行”的位置,也可以放在“列”的位置,将该变量的各类别及其相应的频数列出来 生成频数分布表2 - 12数据分析基础Excel实现(贾俊平)2022-7-11【例【例2.3】沿用例2-1。分别制作学生性别和专业的简单频数表l用用Excel生成频数分布表的步骤生成频数分布表的步骤第第1步
10、:步:选择【插入】【数据透视表】第第2步:步:在【表/区域】框内选定数据区域(在操作前将光标放在任意数据单元格内,系统会自动选定数据区域)。选择放置数据透视表的位置。系统默认是新工作表,如果要将透视表放在现有工作表中,选择【现有工作表】,并在【位置】框内点击工作表的任意单元格(不要覆盖数据)。点击【确定】第第3步:步:用鼠标右键单击数据透视表,选择【数据透视表选项】,在弹出的对话框中点击【显示】,并选中【经典数据透视表布局】,然后【确定】第第4步:步:将数据透视的一个字段拖至“行”位置,将“另一个字段”拖至 “列”的位置(行列可以互换),再将要计数的变量拖至“值字段”位置,即可生成需要的频数分
11、布表 生成频数分布表2 - 13数据分析基础Excel实现(贾俊平)2022-7-11二维列联表二维列联表(contingency table)l也称为交叉表(cross table)l涉及两个分类变量时,通常将一个变量的各类别放在“行”的位置,另一个变量的各类别放在“列”的位置(行和列可以互换)生成频数分布表,这样表格就是列联表【例【例2-4】例如沿用例2-1。将性别放在行的位置、专专业放在列的位置,制作一个二维列联表 生成频数分布表2 - 14数据分析基础Excel实现(贾俊平)2022-7-11频数表的分析统计量频数表的分析统计量l可以使用比例比例(proportion)、百分比百分比(
12、percentage)、比率比率(ratio)等统计量进行描述。如果是有序类别数据,还可以计算累积百分比累积百分比(Cumulative Percent)进行分析l比例也称构成比,它是一个样本(或总体)中各类别的频数与全部频数之比,通常用于反映样本(或总体)的构成或结构。将比例乘以100得到的数值称为百分比,用%表示。比率是样本(或总体)中各不同类别频数之间的比值,反映各类别之间的比较关系。由于比率不是部分与整体之间的对比关系,因而比值可能大于1。累积频数是将各有序类别的频数逐级累加的结果(注意:对于无序类别的频数计算累积频数没有意义),累积百分比则是将各有序类别的百分比逐级累加的结果表2-3
13、数据的分析 生成频数分布表专业专业人数人数(人)(人)百分比百分比(%)累积人数累积人数(人)(人)累积百分累积百分比(比(%)管理学管理学1530.01530.0会计学会计学1938.03468.0金融学金融学1632.050100.0合计合计50100.02 - 15数据分析基础Excel实现(贾俊平)2022-7-11l生成数值数据的频数分布表时,需要先将其类别化,即转化为类别数据,然后再生成频数分布表。类别化的方法是将原始数据分成不同的组别l数据分组是将数值数据转化成类别数据的方法之一,它是先将数据按照一定的间距划分成若干个区间,然后再统计出每个区间的频数,生成频数分布表【例【例2-4
14、】 某电商平台2022年前4个月的销售额数据如表所示。对销售额做适当分组,分析销售额的分布特征 数值数据类别化28220723519321022722021520119619124618220523226321522723424823520826220621121622224721422620920619724923425822822723424419820922620621219122722819820925021025320820321722421323524520118225621821318221622923223021424421720927121722521721924820217
15、12532622132262752322362062222641772102282152252282382432041812132482452192432362392162512132342102182202262332402532 - 16数据分析基础Excel实现(贾俊平)2022-7-11 数值数据类别化2 - 17数据分析基础Excel实现(贾俊平)2022-7-11 数值数据类别化销售额分组(万元)销售额分组(万元)天数(天)天数(天)频率(频率(%)17018565.0018520075.832002153025.002152303428.332302452117.50245260
16、1512.5026027554.1727529021.67合计合计120100.00销售额分组(万元)销售额分组(万元)天数(天)天数(天)频率(频率(%)17018021.6718019043.3319020075.832002101714.172102202722.502202302016.672302401613.332402501310.8325026075.8326027043.3327028021.6728029010.83合计合计120100.002 - 18数据分析基础Excel实现(贾俊平)2022-7-11思维导图思维导图清理类别化制表2 - 19数据分析基础Excel实现(贾俊平)2022-7-11 THANKS THE END2022-7-11 THE END THANKS2 - 20数据分析基础Excel实现(贾俊平)2022-7-11本课件制作整理者:郭迎春 仅可用于教学、学习、交流使用 如内容、图片、字体等有侵权,请联系删除。