资料统计分析.pptx

上传人:莉*** 文档编号:87368598 上传时间:2023-04-16 格式:PPTX 页数:137 大小:1.45MB
返回 下载 相关 举报
资料统计分析.pptx_第1页
第1页 / 共137页
资料统计分析.pptx_第2页
第2页 / 共137页
点击查看更多>>
资源描述

《资料统计分析.pptx》由会员分享,可在线阅读,更多相关《资料统计分析.pptx(137页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第二部分 多元分析1、详析模式与多元分析2、相关分析3、多元方差分析4、多元线性回归分析5、路径分析6、聚类分析7、因素分析第一部分 卡方检验第三部分 非线性回归分析第1页/共137页第一部分:参数检验 非参数检验一、参数检验二、非参数检验三、卡方检验第2页/共137页一、参数检验参数检验即对于总体参数的检验。常用的参数检验方法有三种:Z检验、t检验和F检验。1、Z检验:条件一是样本必须是随机抽取的,二是变量必须是定距层次的变量,三是应呈正态分布。Z检验适用于大样本(n30)以下情况适用于Z检验:(1)大样本的总体均值、总体成数,大样本的总体均值差、成数差检验,G相关系数的检验。第3页/共13

2、7页2、t 检验 要求一是被检验总体成正态分布,二是样本必须是随机抽取的,三是变量应为定距尺度的变量。适用于小样本的总体均值、均值差检验,配对样本适用于小样本的总体均值、均值差检验,配对样本的比较。的比较。配对T检验 第4页/共137页3、F检验,是检验一个定类变量和一个定距变量关系存在与否的方法,它要求一是样本必须是随机抽取的,二是有一个变量是定距变量,三是要求各子总体为正态分布并具有相等的方差一般适用于(1)方差分析的检验(2)对两个总体或多个总体的差异的检验(3)r相关系数与回归系数的检验第5页/共137页二、非参数检验适用于定序变量(顺序衡量)的分析。介绍曼惠特尼U检验方法。其它方法参

3、照卢淑桦社会统计学(第三版)第十四章 P415-439)虚无假设:对相比较的变量而言,样本所代表的两个总体不相一致。第6页/共137页其中、分别为第一个、第二个样本所有顺序的总和。经简化可知在实际应用中,必须比较U与U值的大小,并选其中的较小值。曼惠特尼U所使用的推断统计方法是Z检验。其中U为U或U的较小值最后一步比较Z的计算值与Z的临界值。第7页/共137页男顺序女顺序132132124.5132124.5117117117101091310108161010816913618913420816321.5519321.5左边例子关于男女两组学生关于早恋问题的数据(z的临界值为1.96):得出

4、U=78,U=43 因为U比U小,所以在Z检验中采用43.其它数值计算略Z1.15因为Z的绝对值1.15小于Z的临界值1.96,因此无法排除虚无假设。第8页/共137页卡方检验与T检验和方差分析不同,它对总体的形态分布没有特殊要求。卡方检验的目的在于发现两个名称衡量或顺序衡量等级的变量在总体中是否相关。研究的是两个变量在总体中相关。卡方检验的计算以实测频数与期望频数的比较为基础卡方检验的先决条件有两条:1)样本通过独立的随机取样获得2)自变量与应变量都是分隔变量三、卡方检验第9页/共137页48(63.79)67(51.21)11569(74.89)66(60.11)135106(84.32)

5、46(67.68)152223179 402工资总计高中低 男 女 性别总计期望频数的计算公式:列子:实测频数与期望频数(见下表)第10页/共137页3.914.87 0.460.58 5.576.94 22.33工资总计高中低 男 女 性别总计卡方值的计算:自由度Df(r-1)(c-1)第11页/共137页当概率水平设在0.05时,卡方检验(自由度为2)的临界值为5.991,如果卡方检验计算值大于临界值,那么我们就可以排除虚无假设,作出两个变量之间互相关联的决定;反之,无法排除虚无假设,即检验的结果为两个变量在总体中互不相关。第12页/共137页第二部分 多元分析第一章、详析模式 一、详析模

6、式 (一)、两变量的交互分类 资料分析的第一步就是检验这些假设所预言的这种关系是否存在,如果存在或不存在,第二步就是要分析为什么。对两变量间关系进行描述的最基本方法是“交互分类”法,又称列联表。(见下表)第13页/共137页夫妻冲突住房拥护程度高低高低63.836.241.658.4n599401G=+0.423Z=5.233P1,不旋转)比较有用的结果:两个主成分(因子)f1,f2及因子载荷矩阵(Component Matrix),根据该表可以写出每个原始变量(标准化值)的因子表达式:Pop 0.581f1+0.806f2 School 0.767f1-0.545f2 employ 0.67

7、2f1+0.726f2 Services 0.932f1-0.104f2 house 0.791f1-0.558f2每个原始变量都可以是5个因子的线性组合,提取两个因子f1和f2,可以概括原始变量所包含信息的93.4%。f1和f2前的系数表示该因子对变量的影响程度,也称为变量在因子上的载荷。但每个因子(主成分)的系数(载荷)没有很明显的差别,所以不好命名。因此为了对因子进行命名,可以进行旋转,使系数向0和1两极分化,这就要使用选择项。第131页/共137页因子分析实例旋转Rotation由于系数没有很明显的差别,所以要进行旋转(Rotation:method一般用Varimax方差最大旋转),

8、使系数向0和1两极分化,例子同上菜单:AnalyzeData ReductionFactorVariables:pop,School,employ,Services,houseExtraction:使用默认值(method:Principal components,选取特征值1)Rotation:method选VarimaxScore:Save as variables 和Display factor score Coefficient matrix比较有用的结果:两个主成分(因子)f1,f2及旋转后的因子载荷矩阵(Rotated Component Matrix),根据该表可以写出每个原始变

9、量(标准化值)的因子表达式:Pop 0.01602 f1+0.9946f2 School 0.941f1-0.00882f2 employ 0.137f1+0.98f2 Services 0.825f1+0.447f2 house 0.968f1-0.00605f2第一主因子对中等学校平均校龄,专业服务项目,中等房价有绝对值较大的载荷(代表一般社会福利-福利条件因子);而第二主因子对总人口和总雇员数有较大的载荷(代表人口-人口因子).比较有用的结果:因子得分fac1_1,fac2_1。其计算公式:因子得分系数和原始变量的标准化值的乘积之和。然后可以利用因子得分进行聚类(Analyze-Clas

10、sify-Hierarchical Cluster)。第132页/共137页小小 结结 因子分析是由Charles SpearmanCharles Spearman在19041904年首次提出,其在某种程度上可以被看成是主成分分析的推广和扩展。因子分析就是用少量几个因子来描述许多指标或因素之间的联系,以较少的几个因子反应原资料的大部分信息的统计方法。第133页/共137页小小 结结 因子分析有两个核心问题:一是如何构造变量,二是如何对因子变量命名解释。因子分析的基本步骤有四步:(1 1)确定带分析的原有若干变量是否适于因子分析;(2 2)构造因子变量;(3 3)利用旋转使得因子变量更具有可解释性;(4 4)计算因子变量得分。第134页/共137页小小 结结 选中SPSSSPSS中“AnalyzeAnalyze”/“Data Data ReductionReduction”/“FactorFactor”子菜单可进行因子分析,应计算相应的因子得分。第135页/共137页第136页/共137页感谢您的观看!第137页/共137页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁