教案数据分析与挖掘实战专.docx

上传人:叶*** 文档编号:34966614 上传时间:2022-08-19 格式:DOCX 页数:49 大小:388.01KB
返回 下载 相关 举报
教案数据分析与挖掘实战专.docx_第1页
第1页 / 共49页
教案数据分析与挖掘实战专.docx_第2页
第2页 / 共49页
点击查看更多>>
资源描述

《教案数据分析与挖掘实战专.docx》由会员分享,可在线阅读,更多相关《教案数据分析与挖掘实战专.docx(49页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、西南财经高校天府学院教 案任课老师: 刘强课程名称: 数据分析与挖掘实战任课班级:授课时间:2017-2018-1西南财经高校天府学院教务处制教 案编号:01章节第一讲 SPSS简介授课方式讲授/查阅资料教学目的l 理解SPSS的根本作用l 区分SPSS与EXCEL的应用场景l 能安装SPSS22.0教学重点l SPSS与EXCEL的应用场景l SPSS的安装教学难点l SPSS的安装时间安排教 学 过 程一、课程目的驾驭对数据资料进展整理、录入、驾驭SPSS软件的操作,完成从建立数据文件到常用统计分析的操作通过本课程的学习,促进对将来职业过程中数据的处理与应用实力,提升职业层次。课程考察方式

2、及要求考察方式: 上课纪律(考勤、课堂纪律、提问等)10分,可加分 平常作业50分 综合工程(不低于2个)40分,期末总分不超过100分课堂纪律: 三次请假算一次旷课,旷课3次,取消考试资格 作业严禁抄袭,一旦发觉,取消抄袭人与被抄袭人的考试资格 由于有些数须要保存,上课请自带电脑三、 SPSS简介l 与SAS,STATA一起,成为世界公认的三大数据分析软件。SAS合适高级用户运用,STATA也是功能强大,易于运用的分析软件。l 供应多种好用的分析方法,具有强大的图形绘制与编辑图形的功能l 易于学习与运用,操作简洁,多数可以通过菜单、对话框完成,熟识SPSS语言的用户可以干脆输入SPSS吩咐,

3、提交系统执行l 兼容多种数据文件格式,具有强大的图表功能四、 学习SPSS对于学生的用途l 以财务、会计、市场、工程造价专业为主的商科院校学生,将来职业离不开数据,学习SPSS有助于对数据的运用程度与实力l 大数据时代,从数据中获得有价值的信息,提升对事物的洞察实力l 数据分析岗位的必备技能之一五、SPSS与EXCELl 对于不会编程、不想记公式、不会VBA的用户来说,运用“傻瓜式”的SPSS,更能体会到数据统计分析的简洁与强大l EXCEL也能完成局部的统计功能,但对专业的统计而言,尚不能满足要求,SPSS根本上能满足大多数的统计要求l SPSS结合SPSS MODELER,能实现数据的建模

4、与挖掘l 数据的计算与数据挑选、根本图表的制作,选择excel,在不熟识编程与众多公式的状况下,要完成困难的数据的统计分析,数据建模等,用SPSSl 用SPSS处理数据,将结果导出为excel,用excel做图表l 用EXCEL计算数据,然后用SPSS倒入做困难统计分析六、SPSS三大窗口数据(data)窗口变量(variable)窗口结果(output)窗口作业布置下载安装SPSS 22.0课后总结教 案编号:02章节第二讲:SPSS数据编辑与整理(一)授课方式讲授/试验教学目的l 驾驭SPSS数据编辑的根本方法l 能对个案排序l 能合并与拆分文件l 能对数据分类汇总教学重点l 驾驭SPSS

5、数据编辑的根本方法l 能对数据分类汇总l 能合并与拆分文件教学难点l 能合并与拆分文件时间安排教 学 过 程一、数据编辑 由【编辑】菜单吩咐,弹出子菜单 1、 插入变量(Insert Variable) 在数据编辑窗口选定要插入变量位置的后一个变量,可以从工具条干脆点击插入变量 按钮,或从菜单中选择【编辑】【插入变量】,数据编辑窗口产生一个新的变量列。新变量的名称是系统默认的名称,假如须要修变更量名称,须要进入变量视图窗口进展修改。2 、插入个案(Insert Case)在数据编辑窗口选定要插入个案位置的后一个个案,可以从工具条干脆点击插入个案 按钮,或从菜单中选择【编辑】【插入个案】菜单吩咐

6、。数据编辑窗口产生一个新的个案行。3、选项 :从菜单中选择【编辑】【选项】菜单吩咐,点击“语言”选项卡标签。一、 数据整理:排序个案 由【数据】菜单吩咐,弹出子菜单,对个案根据某一变量或多个变量的依次进展排序案例:以“考试成果.sav”文件为例,从菜单中选择【数据】【个案排序】菜单吩咐,弹出视察值排序对话框。 排序根据: 选择排序变量。 排列依次: 升序。数值型变量由小到大排列,字符型变量按ABCD字母依次排列。系统默认项。 降序。数值型变量由大到小排列,字符型变量按ZYX字母依次由后向前排列。保存已分类数据:(可选)。此时,可以实现分别按性别进展对总分排序,即先对全部的男生,按总分从低到高排

7、序;然后再按全部女性,按总分从低到高排序。二、 数据整理:转置有时用户须要将数据管理器中原先按行(列)方向排列的数据转换成按列(行)方向排列的数据。案例:翻开数据文件“七个评委.sav”从菜单中选择【数据】【转置】菜单吩咐,弹出【转置】对话框。三、 数据整理:合并文件 文件合并的目的是,将其他数据文件的个案(变量)添加到当前文件中,合并后新数据的个案(变量)应当为两文件之与。分为两种形式:添加个案、添加变量。2.4.1 添加个案添加个案,即将其他数据文件的个案添加到当前文件中。应用情境包括:(1)多个合作者输入问卷数据汇总、合作单位的数据进展汇总,须要并成一个总的文件。留意:多个合作者输入时,

8、须要统一约定变量定义规则与输入规则,并指定其中一个合作者定义变量与建立数据文件,然后其他合作者复制该数据文件,并在该复制文件中输入数据。(2)不同部门、不同学院的数据汇总到上一级局部。 案例:将“数据文件1.sav”与“数据文件2.sav”合并为例,其根本操作如下:第1步:先翻开“数据文件1.sav”。从菜单选择【数据】【合并文件】【添加个案】菜单吩咐。 第2步:选定单选框“外部SPSS Statistics数据文件”,点击【阅读】按钮,选择须要合并的文件“数据文件2.sav”后,点击【接着】按钮。弹出“添加个案”对话框如下图。第3步:完成有关设置,点击【确定】按钮。在文件添加后,原来的数据集

9、窗口顶栏的文件名称前面会出现*标识,如下图所示。在SPSS中,只要数据出现变更,都会出现* 标识。点击【保存】按钮后,“*”将消逝。将其他文件的变量及其数据添加到当前文件中。适用范围:(1)在一次探讨中对同一批被试进展测量了多份测验、或进展了屡次试验,获得了该批被试的多份测量数据;或者数据输入时不同的合作者输入了不同的测验问卷。(2)不同部门的数据合并。例如教务科的成果,与学工处的学生信息合并,将学生的成果信息,与个人生理心理安康档案合并。案例:将“横向文件1.sav”与“横向文件2.sav”合并为例。第1步:先翻开“横向文件1.sav”。从菜单选择【数据】【合并文件】【添加变量】菜单吩咐。

10、如下图:第2步:选定单选框“外部SPSS Statistics数据文件”,点击【阅读】按钮,选择须要合并的文件“横向文件2.sav”后,点击【接着】按钮。弹出添加个案对话框。 第3步:在本例中,选中复选框“ 根据排序文件中的关键变量匹配个案”,并选择在“解除的变量:”、“新的活动数据集:”两个变量框中都选择“ID”,并移入到关键变量中。第4步:完成有关设置,点击【确定】按钮,就将以上文件合并添加,全部的变量及其数据都会添加到新的数据集中,并排列在原数据集的变量的右侧。在文件添加后,原来的数据集窗口顶栏的文件名称前面会出现*标识。点击【保存】按钮后,“*”将消逝。四、 数据整理:分类汇总 用户还

11、可对数据管理器中的数据按指定变量的数值进展归类分组汇总,汇总的形式多种多样。案例:翻开“心理安康调查数据.sav”,按变量民族、年级进展汇总计算智力测验分数的平均分、英语成果的平均分。选“性别”、“民族”变量进入分界变量列表框,选择“智力分数”进入变量摘要列表框,因“智力分数”欲作平均值汇总,系统默认的是平均值MEAN汇总。假如须要选择总与、标准差以及其他函数,可以点击【函数】按钮,弹出“汇总数据:汇总函数”对话框,选择相对应的函数。在主对话框中,选择复选框“个案数”;在“保存”列表框中,选择“创立只包含汇总变量的新数据集”,须要输入名称;再点击【确定】按钮即可。结果犹如所示,在一个新的窗口展

12、示了新的数据集。作业布置课后总结 教 案编号:03章节第三讲:SPSS数据编辑与整理(二)授课方式讲授/试验教学目的l 驾驭选择个案与加权个案的根本方法l 驾驭数据重新编码的根本方法教学重点l 驾驭选择个案与加权个案的根本方法l 驾驭数据重新编码的根本方法教学难点l 驾驭数据重新编码的根本方法时间安排教 学 过 程一、 数据整理:选择个案 在数据分析时,有时可能只对某些个案进展分析。例如,(1)在判别分析时,可能用其中90%的个案数据建立判别函数,用其余10%的个案来考核判别函数。此时,可以通过选择个案的操作。(2)在艾森克问卷分析时,选择L量表分数小于18的个案数据才进展分析。案例:在数据编

13、辑窗口翻开一个例子文件“心理安康调查数据.sav”,从菜单选择【数据】【选择个案】菜单吩咐。图中有五种选择方式,说明如下: 全部个案,系统默认。 假如条件满足。选择此项后,【假如】按钮被激活,单击该按钮,弹出条件设置对话框。本例设置“情商分数 70”如下图所示。 随机个案样本: 随机抽取肯定比例的观测个案。 基于时间或个案范围: 按个案编号抽取个案。设置观测个案的起始个案号,缺省为第1个个案号开场;设置完毕个案号。 运用过滤变量: 用过滤变量选取个案。过滤变量值大于0的个案将被选取。输出:选取的、或未被选取个案的处理方式 过滤未选定的个案:未被选取的个案保存在文件中,未被选中的个案其编号内标有

14、对角斜线,其过滤变量filter_$赋值为0。系统默认该选项。 将选定个案复制到新数据集:被选取的个案复制、并新建一个数据集。 删除未选定个案:未被选取的个案从文件中删除。二、 数据整理:加权个案在计算的过程中须要利用变量对数据进展加权处理时采纳。例如在后面的穿插表分析(列联表分析),计数变量的卡方检验时,须要对人数、数量进展加权;计算加权平均数时,也须要对数据进展加权。案例:翻开数据文件“某一同学的课程分数.sav” ,从菜单选择【数据】【个案加权】,翻开个案加权的对话框。 选择“个案加权系数”,将“课程权重”变量选择到右边。点击【确定】按钮,完成加权设置。此时,再计算该同学的课程成果的总平

15、均分(或者说综合素养总分)。点击菜单吩咐【分析】【描绘统计】【描绘】,在【描绘统计】对话框中选择“课程成果”变量作为分析变量,点击【确定】,可以得到如下。取消加权取消对“课程权重”变量的加权,将“课程权重”变量选择到左边;并选择”不对个案加权”。再次计算该同学的课程成果的总平均分,可以得到如下结果。选择加权变量的留意事项:可以加权的变量一般在含义上表达为人数、次数、频数、数量、比例、权重、占比等。加权变量为分数、小数,加权的作用也是有效的。加权变量中含有零、负数或缺省值的观测量将被解除在分析之外。一旦对数据进展了加权处理,那么在该数据文件以后的分析中加权处理始终有效,直到取消加权变量(即关闭加

16、权处理)。三、 重新编码在菜单【转换】下有【重新编码为一样的变量】【重新编码为不同变量】不同之处:【重新编码为一样的变量】菜单吩咐,旧的变量名称不变,旧变量值会转换为新变量值;【重新编码为不同变量】菜单吩咐会生成一个新的变量,旧变量名称与变量值都保持不变。 案例:翻开数据文件“艾森克人格问卷.sav”,点击菜单【转换】【重新编码为一样的变量】菜单吩咐 第1步:选择变量。将V2、V8、V10、V17、V33、V50、V62、V80这些变量从左边的对话框选择到右边的“数字变量”列表框;第2步:点击【旧值与新值】按钮。第2-1步:在“旧值”框内,选择第一个单选按钮“值”,并输入1,在“新值”框内,输

17、入0,此时,右边【添加】按钮就被激活了,单击此按钮,就把这个旧的变量区间(值)以及新的码值到“旧新”栏中。第2-2步:在“旧值”框内,选择第一个单选按钮“值”,并输入0,在“”框内,输入1,此时,右边【添加】按钮就被激活了,单击此按钮,就把这个旧的变量区间(值)以及新的码值到“旧新”栏中。第2-3步:点击【接着】按钮回到【重新编码为一样的变量】主对话框,点【确定】按钮执行菜单吩咐,在数据窗口可得到重新编码后的数据。作业布置提交第一次作业:数据的编辑与整理 课后总结 教 案编号:04章节第四讲:SPSS统计分析前的打算授课方式讲授/试验教学目的l 驾驭SPSS文件属性及变量设置的方法l 数据文件

18、的打算教学重点l 变量设置的根本方法教学难点l 变量设置的根本方法时间安排教 学 过 程一、SPSS数据文件的建立建立数据文件的四种方法:l 新建数据文件l 干脆翻开已有的数据文件l 运用数据库查询l 从文本向导倒入数据二、 新建数据文件 文件菜单 新建-数据,可以创立一个新的数据编辑窗口SPSS默认的数据文件,扩展名为sav三、翻开已有的数据文件l 文件菜单-翻开-数据l 可以干脆翻开excel文件l 可以干脆翻开有固定格式的文本文件四、利用数据库导入数据 文件-翻开数据库-新建查询n 可以连接到几乎全部主流数据库,如access,sql server,oracle等,通过查询从数据获得想要

19、的数据,这些都可以通过界面来完成n 假如须要更进一步,当然理解SQL 语句,是必要的五、 案例:股票指数的导入上证指数2014年第一季度数据.xls文件中,包含了2014年1月2日到2014年3月31日的资料数据,包括开盘价、最高价、最低价与收盘价等数据,如今须要将该EXCEL文件数据导入到SPSS中六、 SPSS数据文件属性 一个完好的SPSS文件构造,应包括变量名称、变量类型、变量名标签、变量值标签。通过左下角的“变量视图”设置文件的各属性与EXCEL不同的是,SPSS的一列数据称为一个变量,每个变量有一个变量名。SPSS每一行数据称为一个个案或一个观测量七、 变量类型设定 每个变量都必需

20、设定类型常用的数据类型为:数值、日期与字符串对数值类型变量,须要指定小数位数,对日期变量,须要指定日期显示类型,用于对变量可能的取值的进一步设定,变量值标签对于用数值表示非数值变量尤其有用。如性别,只有男与女,可以用数值1 表示男,用数值2表示女。变量的测度类型只有三种:度量、有序与名义名义测量是最低的一种测量等级。其数值仅代表某些分类或属性。比方,用来表示性别(1或2)、民族(1、2、3)等。这类变量一般不做凹凸大小区分。有序测量程度高于名义测量,用于的测量的数值代表了一些有序分类。例如用于表示受教化程度凹凸的数字(1,2,3),具有肯定的依次性度量测量:表示可以加减或加减乘除的实际测量值,

21、如成果、开盘价、涨跌等案例:顾客满足度调查表的数据属性设计 翻开“顾客满足度.sav”文件按如下完成变量的设置 作业布置提交第二次作业:设置变量的属性及文件导入导出课后总结 教 案编号:05章节第五讲:SPSS根本统计分析(一)授课方式讲授/试验教学目的l 驾驭频数统计的根本方法与应用l 驾驭描绘性分析的根本方法与应用l 驾驭探究性分析的根本方与与应用教学重点l 驾驭频数统计的根本方法与应用l 驾驭描绘性分析的根本方法与应用教学难点l 驾驭探究性分析的根本方与与应用时间安排教 学 过 程一、 概述统计分析的目的,是探讨总体的数量特征,可采纳两种方式来实现第一:数值计算。计算常用的根本统计量的值

22、,通过数值来反响那个数据的根本统计特征第二:图形绘制。绘制根本统计图形,通过图形来只管呈现数据的分布特点实际应用中,两种方法通常都是混合运用的。二、 SPSS常用的根本统计方法频数分析:产生频数(出现的次数)统计表描绘性分析:进展根本的统计分析,挖掘常用统计量的根本特征探究性分析:对数据进展初步检查,推断数据有无奇异值或极端值,推断数据是否符合正态分布,对数据的规律进展初步考察列联表分析:指两个或多个变量各程度的频数(出现的次数)分布表,又叫频数穿插表三、 频数分析案例:产品销量统计假设某公司每周大约卖出2000万件产品,但市场的需求不稳定,该公司的消费经志向更好的驾驭近期产品的销售状况,市场

23、营销部门给出了近期每周产品的销售数据(单位:百万),利用这些数据,可以得到哪些有助于消费及销售的信息?24、18、18、26、24、23、16、18、21、20、21、24、19、19、14、22、21、26、27、15、19、17、20、20、19、22、23、16、23、21、15、19、21、20、22、15、24、19四、 SPSS描绘统计分析主要用于对连续变量进展描绘性分析统计,可以输出多种类型的统计变量主要统计以下统计目的:l 刻画集中趋势的统计量l 刻画离散程度的统计量l 刻画分布形态的统计量案例 :统计某公司的男、女员工年龄状况五、 探究性分析探究性分析用于对变量的分布特点不理

24、解时,都变量进展相关的分析,为下一步的数据分析供应相应的参考其根本思想是从数据的本身动身,用以分析数据的大致状况,位传统的统计供应良好的数据根底与削减分析的盲目性其主要作用:l 检查数据是否有错,检查是否有异样值,确定是否从分析中剔除这些数据l 获得数据的分布特征l 对数据进展初步视察,发觉一些内在的规律探究性分析案例:城市的温度差异分析及数据解读对几个选项的说明因变量列表:是我们关注的目的变量,有时也叫分析变量。在本案例中,我们关注温度的变更,因此,我们将候选变量“平均温度”选入到因变量列表因子列表:影响因变量的因素,有时也叫分组变量,在本案例中,既可以按城市来分组,也可以按月份来分组,由于

25、我们主要考察城市的温度变更,因此将候选变量“城市”选入到因子列表标注个案:若系统在探究分析时发觉异样值,便可以用标识变量加以标识,便于用户找寻这些值作业布置提交第三次作业:数据处理与根本统计课后总结 教 案编号:06章节第六讲:SPSS根本统计分析(二)授课方式讲授/试验教学目的l 列联表分析(穿插分析)教学重点l 列联表分析(穿插分析)教学难点l 列联表分析(穿插分析)时间安排教 学 过 程一、 SPSS列联表分析列联表分析可以进展非数值型的变量的相关性分析用一个变量对行进展分类,另一个变量对列进展分类,在行与列穿插点,显示行数据出现的频率其作用主要表如今:l 根据搜集到的样本数据产生二维或

26、者多维的穿插列联表l 在列联表的根底上,对两两变量之间是否存在肯定的相关性进展分析案例:两所中学升学状况分析现有两所中学的升学数据,据此对两所学校的升学状况进展列联表分析,演剧两所学校的学生升学率之间有无明显的差异三个变量分别为学校、升学与计数。把学校定义为字符型变量,用“1”表示甲学校,用“2”表示乙学校。升学定义为数值型变量,“1”表示升学,“0”表示未升学。数据如下所示变量加权:当数据文件中存在有大量一样的变量值时,增加一个频数变量来表示一样变量值出现的频数,可带来很大的便利,变量加权就可用于设定某个变量为频数变量二、 对分析结果的解读 作业布置提交第四次作业:穿插分析课后总结 教 案编

27、号:07章节第七讲:均值比拟与T检验授课方式讲授/试验教学目的l 驾驭均值比拟分析法l 理解T检验分析法教学重点l 驾驭均值比拟分析法教学难点l 均值比拟分析法时间安排教 学 过 程一、 概述l 假如要对统计的样本根据某个类别计算相应的统计量,如平均数、标准差等。l 假如要检验两个相关的样本是否来自具有一样均值的样本l 以上状况,可以通过均值比拟与T检验来完成 二、 SPSS均值比拟均值过程计算指定变量的综合描绘统计量,包括均值、标准差、总与、方差等,当观测量按一个分类变量分组时,均值过程可以分组计算。运用均值比拟的目的在于比拟,因此必需分组求均值案例:探讨工作阅历与工作薪水的关系某公司600

28、名计数与管理岗位的工作阅历与工资状况,利用均值比拟来分析不同的工作阅历是否导致薪水的不同原始数据参照教材P58页员工岗位有两个类别,分别为管理岗位与技术岗位,为了便利统计分析,分别用1与0表示将工作阅历从少到多,分别用数字1,2,3,4,5,6表示,员工岗位与工作阅历的设置都须要通过设置值标签来完成翻开案例数据文件4.1.3均值过程.sav,并细致探讨其工作岗位与工作阅历值标签的设置分析-比拟平均值-平均值,由于须要探讨工作阅历与薪水的关系,因此薪水作为随工作阅历变更而变更的因变量,而工作阅历为自变量分析结果解读:从分析报告可以发觉,随着工作阅历的增长,员工每小时的薪水稳定上升,但在大于等于3

29、6这项,标准偏向较大,说明薪水的变更大,存在被平均的状况。标准偏向说明了该类数据中偏离平均值的程度,标准差越大,说明偏离程度越大,反之就越接近平均值平均值的差异是否显著,须要进一步借助方差分析才能确定三、 单样本T检验单样本T检验的目的,是利用来自总体的样本数据,推断该总体的均值是否与指定的检验值之间存在明显的差异,是对总体均值的假设检验。案例:保健品销售量与预料模型比拟 某保健品上个月在30各销售网点的销售量如下,根据市场预料模型的分析,该产品在各销售网点的平均销量为90箱,用单样本T检验来分析该产品的实际销量逾市场预料模型是否一样翻开数据文件 4.2.3单样本T检验_1.sav分析-比拟均

30、值-单样本T检验我们须要检验的是销售量,因此将销售量作为检验变量须要检验与预料模型的90箱是否一样,因此在检验变量处填写90作业布置提交第五次作业:均值检验课后总结 教 案编号:08章节第八讲:方差分析授课方式讲授/试验教学目的l 驾驭单因素方差分析l 驾驭多因素方差分析教学重点l 驾驭单因素方差分析教学难点l 单因素方差分析时间安排教 学 过 程一、 概述l 方差分析是用于两个以上样本均数差异的显著性检验。由于各种因素的影响,探讨所得的数据呈现波动,造成波动的缘由可分成两类,一是不行控的随机因素,另一是探讨中施行的对结果形成影响的可控因素。l 方差分析的根本思想是:通过分析探讨不同来源的变异

31、对总变异的奉献大小,从而确定可控因素对探讨结果影响力的大小。 二、 单因素方差分析单因素方差分析在单一因素影响一个因变量时,检验因素的各程度分组的均值之间的差异是否具有统计意义,并可以进展均值的多重比拟案例:某农业探讨所对运用不同的化肥后的粮食产量的比照试验数据,试验堆同一个作物的不同试验田分别用一般钾肥、控释肥与复合肥并观测产量,现要分析不同的化肥对产量的影响。原始数据请参照P78用数字1代表一般钾肥,数字2代表控释肥,数字3代表复合肥,对数据进展整理在本案例中,肥料为影响产量的唯一因素,是属于可控的因素 统计检验分析的原假设H0为:三种肥料所对应的产量的样本平均值之间没有显著差异。备择假设

32、H1为:三种肥料所对应的产量的样本平均值不全相等。翻开数据文件,5.2.3化肥对产量的影响.sav,检查数据是否经过整理分析过程:点击【分析】【比拟平均值】【单因素ANOVA检验】菜单吩咐选择一个或多个变量,进入因变量列表,本例选择产量选择一个或多个变量,进入因子,本例选择施肥类型选项按钮:选择【方差同性质检验】与【平均值图】事后多重比拟:选择Bonferroni,显著性程度保持默认0.05,接着Levene方差齐性检验后的显著性值为0.08显著性程度0.05(前面已设定),因此可以认为样本数据的方差是齐次的。表示可以运用方差分析,温忠麟教授的心理与教化统计著作中对方差齐性检验的原理意义进展了

33、具体阐述,可参考文献:温忠麟. 心理与教化统计M. 广东广州: 广东教化出版社, 2016 , p.210.组之间(不同肥料)的显著性程度)0.000显著性程度0.05,回绝原假设H0,因此不同的施肥类型对产量有显著影响。带*号的表示该组均值差是显著的,并且显著性0.0000.05,回绝原假设,因此,第一组(一般钾肥)与第二组(控释肥)以及第三组(复合肥)的均值差特别明显,但第二组与第三组均值差却不明显。三、 多因素方差分析 多因素方差分析是一个因变量是否受两个或多个因素影响的方差分析。多因素方差分析,可以检验不同程度组合之间的因变量均数,由于受不同因素影响是否有差异的问题。在这个过程中可以分

34、析每一个因素的作用,也可以分析多因素之间的交互作用。例如:对稻谷产量进展分析时,耕地深度或施肥种类都会影响产量,若耕地深度与适当的施肥同时进展,可能会使产量成倍的增加,因此,耕地深度与施肥种类就可能存在互相穿插作用某一个杂志社的记者,要考察职业为财务管理、计算机程序员与药剂师的男、女雇员的每周薪金之间是否有显著性差异。从每种职业中选择了5名男性与5名女性组成样本,并且记录了样本中每个人的薪水,请分析职业与性别对薪金是否有显著性影响。原始数据详见P93分析思路:由于薪金与从事的职业与性别可能都有关系,因此考虑两个因素下的差异问题。建立双因素的方差分析模型,本案例中,职业与性别是两个影响因素,而薪

35、金是因变量,同时还要考虑职业与性别这两个因素之间有无互相穿插作用原假设H0:职业与性别对薪金无影响备择假设H1:职业与性别至少有一个对薪金有影响对数据进展解读作业布置提交第六次作业:方差分析课后总结 教 案编号:09章节第九讲:相关性分析(一)授课方式讲授/试验教学目的l 驾驭简洁相关性分析方法与数据解读教学重点l 驾驭简洁相关性分析方法与数据解读教学难点l 驾驭简洁相关性分析方法与数据解读时间安排教 学 过 程一、 概述l 相关性分析是探讨现象之间是否存在某种依存关系,并对具有依存度的现象分析相关方向或者相关程度。l 按相关的形式可分为线性相关与非线性相关,按相关的程度可分为完全相关,不完全

36、相关与零相关。完全相关指变量Y与X间呈线性函数关系,此时 r =1或 r =-1;不完全相关指变量Y与X间呈统计关系,此时有0r0,表示正相关,反之表示负相关。四、 SPSS的简洁相关性分析简洁相关分析是探讨两个变量之间的关联程度的统计方法,主要是通过计算简洁相关系数来反响变量之间的关系强弱,可以用图形与数值两种方法表示。常见的相关系数有皮尔逊(Pearson)相关系数、斯皮尔曼(Spearman)等级相关系数与肯德尔(Kendall)相关系数皮尔逊积差相关系数的大小评判标准如下:l | r |0.8为高度相关;l 0.5 | r |0.8为中度相关;l 0.3 | r |0.5 为低度相关;

37、l | r |0.01,因此得出语文与数学的成果弱相关作业布置提交第七次作业:相关性分析课后总结 教 案编号:11章节第十一讲:回来分析(一)授课方式讲授/试验教学目的l 驾驭一元线性回来分析方法与数据解读l 驾驭多元线性回来分析方法与数据解读教学重点l 驾驭一元线性回来分析方法与数据解读l 驾驭多元线性回来分析方法与数据解读教学难点l 驾驭一元线性回来分析方法与数据解读时间安排教 学 过 程一、 概述回来是统计分析方法中最常用的方法之一。假如所探讨的现象有若干个影响因素,且这些因素对现象的综合影响是线性的,则可以运用回来的方法建立现象 (因变量)与影响因素(自变量)之间的线性函数关系式,从而

38、根据变量的取值来预料或限制另一个特定变量的取值,并给出这种预料或限制的准确程度。这里仅介绍SPSS软件进展线性回来分析的常用类型,包括一元线性回来、多元线性回来以及在曲线拟合中的应用二、 一元线性回来也称简洁线性回来分析,他的特色只涉及一个自变量,主要用来处理一个因变量与一个自变量的线性关系,建立变量之间的线性关系并根据模型进展评价与预料。线性回来模型主要考察变量之间的数据变更规律,并通过线性表达式,即线性回来方程,来描绘两者之间的关系,今儿确定一个或几个变量对另一个变量的影响程度,为预料供应科学根据案例:失业率与通货膨胀的关系如图是我国从2002年到2011年的通货膨胀率以及失业率,试用简洁

39、回来分析方法分析两者之间的有什么关系翻开 8.1.3失业率与通货膨胀的关系.sav数据文件选择【分析】-【回来】-【线性】将失业率变量选入因变量列表,通过膨胀率置入自变量列表,表示探讨随着通货膨胀率的变更,失业率如何变更其他采纳默认变量,确定,输出分析结果模型的拟合状况反映了模型对数据的说明实力,修订后的确定系数R平方说明了自变量对因变量的说明程度,越接近于1,模型的说明实力就越强,此处为-0.114,说明模型的说明实力若。在一元回来分析方法中,确定系数R平方一般要在0.5以上,假如超过0.8,则说明特别好,在多元回来中,确定系数R平方要求在0.3以上,0.5为良好,0.6以上为特别好,当样本容量比拟大,确定系数在0.1也认为可以承受差分析:显著性值0.785,大大高于方差分析默认的显著性程度0.05,说明模型是不显著的回来方程系数是各个变量在回来方程中的系数值,显著性的值表示回来系数的显著性,越小越显著,一般将其与0.05比拟,小于0.05,表示显著,大于0.05,表示不显著。从表中可以看出,常量4.153是显著的,而通过膨胀率系数-0.005是不显著的根据该表,可以得出失业率与通过膨胀率的线性关系为:R(失业率)=4.153-0.005*I(通过膨胀率)结论:两者之间的线性关系存在,但不显著三、 多元线性回来多元线性回来也称多重线性回来,是最为

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 初中资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁