常用统计方法与SPSS软件的使用.ppt

上传人:可**** 文档编号:79393944 上传时间:2023-03-21 格式:PPT 页数:36 大小:1.78MB
返回 下载 相关 举报
常用统计方法与SPSS软件的使用.ppt_第1页
第1页 / 共36页
常用统计方法与SPSS软件的使用.ppt_第2页
第2页 / 共36页
点击查看更多>>
资源描述

《常用统计方法与SPSS软件的使用.ppt》由会员分享,可在线阅读,更多相关《常用统计方法与SPSS软件的使用.ppt(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、常用统计方法与常用统计方法与SPSS软件的使用软件的使用第一页,编辑于星期五:六点 五十六分。书籍介绍1 1、张文彤,、张文彤,“SPSS11.0“SPSS11.0统计分析教程(基础篇、高级篇)统计分析教程(基础篇、高级篇)”北京希望电子出版社,北京希望电子出版社,20022002(操作详细,有助于理解模块)(操作详细,有助于理解模块)2 2、马庆国,、马庆国,“管理统计管理统计”,科学出版社,科学出版社,20052005(侧重于理论与实践的结侧重于理论与实践的结合,分阶段学习容易接受合,分阶段学习容易接受 )3 3、吴明隆,、吴明隆,“SPSS“SPSS统计应用实务统计应用实务”,科学出版社

2、,科学出版社,20032003年年 (适用于社会学、管理学、心理学使用问卷调查的实证研究)适用于社会学、管理学、心理学使用问卷调查的实证研究)其余书籍其余书籍4 4、余建英,何旭宏,、余建英,何旭宏,“数据统计分析与数据统计分析与SPSSSPSS应用应用”,人民邮电出版社,人民邮电出版社,20032003年年5 5、阮桂海等,、阮桂海等,“统计应用分析教程统计应用分析教程SPSSSPSS、LISREL&SAS LISREL&SAS实例实例精选精选”,清华大学出版社,清华大学出版社,20032003年年软件使用:软件使用:SPSS11.5,SPSS11.5,目前最高版本:目前最高版本:SPSS1

3、3.0SPSS13.0第二页,编辑于星期五:六点 五十六分。一、量化研究 量化研究与质化研究都重视研究的客观性、科学性与数据量化研究与质化研究都重视研究的客观性、科学性与数据分析的正确性,这是两种不同的研究派别,分析的正确性,这是两种不同的研究派别,量化研究的特征:量化研究的特征:量化研究注重减少量化研究注重减少“垃圾进、垃圾出垃圾进、垃圾出”,研究者通过正确收集数据,选择合适而正确的统计方法,以客观的研究者通过正确收集数据,选择合适而正确的统计方法,以客观的立场分析数据,立场分析数据,使之形成有用的信息,以检验研究假设,进而发现研究结使之形成有用的信息,以检验研究假设,进而发现研究结果,整理

4、归纳形成结论。果,整理归纳形成结论。第三页,编辑于星期五:六点 五十六分。一、量化研究 量化研究与质化研究的区别:1 1、“量量”采用逻辑实证主义,将现象背后的原理简化为采用逻辑实证主义,将现象背后的原理简化为单一的客观实在,不因人的主观意志而转移单一的客观实在,不因人的主观意志而转移(内部动力机制)(内部动力机制);“质质”采用自然现象主义,认为自然和社会是多元的采用自然现象主义,认为自然和社会是多元的(描述多元的现(描述多元的现象)象)。2 2、“量量”注重变量间必然的因果关系或相关情形,注重变量间必然的因果关系或相关情形,“质质”注重变量脉络间关系的诠释和分析。注重变量脉络间关系的诠释和

5、分析。3 3、“量量”重视假设演绎法,重视假设演绎法,“质质”注重经验归纳法。注重经验归纳法。4 4、“量量”的研究者保持中立,借助仪器或问卷等收集信息,的研究者保持中立,借助仪器或问卷等收集信息,“质质”的研究者一般采用参与性的活动通过互动收集信息。的研究者一般采用参与性的活动通过互动收集信息。5 5、“量量”的研究重视由受试样本推论到总体,的研究重视由受试样本推论到总体,“质质”的情景限制的情景限制推论。推论。第四页,编辑于星期五:六点 五十六分。二、量的研究步骤n n选择定义研究问题(设计问卷)选择定义研究问题(设计问卷)研究问题必须是可以检验的、有研究价值或重要的问题研究问题必须是可以

6、检验的、有研究价值或重要的问题 方法:通过相关文献的研究分析,挖掘相关研究问题,制定方法:通过相关文献的研究分析,挖掘相关研究问题,制定研究主题,草拟研究问题,对于重要的关键词要给予完整解释研究主题,草拟研究问题,对于重要的关键词要给予完整解释n n执行研究程序执行研究程序 实施程序包括:样本的选择、测量工具的改进、数据的搜集实施程序包括:样本的选择、测量工具的改进、数据的搜集n n数据分析 检验研究假设、选择合适而正确的统计方法(描述性统计、推检验研究假设、选择合适而正确的统计方法(描述性统计、推断性统计)断性统计)n n结果分析与结论结果分析与结论 根据数据分析的结果,结论应该与最初拟订的

7、假设或研究问题根据数据分析的结果,结论应该与最初拟订的假设或研究问题有关,研究结论要指出假设是否得到支持。有关,研究结论要指出假设是否得到支持。第五页,编辑于星期五:六点 五十六分。理论假设概念的操作性定义选取样本调查、相关设计访问或问卷调查实验设计设计实验组事实观察、访问、问卷搜集资料分析资料结果发现例1第六页,编辑于星期五:六点 五十六分。三、量表的编制n n变量的属性变量的属性 名义变量名义变量:变量分类,如性别、年级、企业性质等:变量分类,如性别、年级、企业性质等 (控制性变量)(控制性变量)次序变量次序变量:方向性,如表示优劣、多少、高低、次序等:方向性,如表示优劣、多少、高低、次序

8、等 等距(比率)变量等距(比率)变量:间距相等、具有可加、可乘性,如经:间距相等、具有可加、可乘性,如经营额、学生成绩、各种财务杠杆等营额、学生成绩、各种财务杠杆等 *不同的变量属性,所使用的统计方法也不同,如果设计的变不同的变量属性,所使用的统计方法也不同,如果设计的变量属性不符合所要求使用的统计方法,会导致统计结果的错量属性不符合所要求使用的统计方法,会导致统计结果的错误误(在回归分析中应该特别注意在回归分析中应该特别注意)例如:多元回归分析的自变量与因变量应该都是例如:多元回归分析的自变量与因变量应该都是“连续变连续变量量”,自变量如果是类别变量或次序变量应该首先转换为虚拟,自变量如果是

9、类别变量或次序变量应该首先转换为虚拟变量(与研究相关的变量的矢量方向一致及变量属性一致)变量(与研究相关的变量的矢量方向一致及变量属性一致)。第七页,编辑于星期五:六点 五十六分。n n量表编制的原则量表编制的原则(如何使用量表将定性问题转换为定量)(如何使用量表将定性问题转换为定量)量表的属性应该是次序变量,但次序变量与名义变量都属量表的属性应该是次序变量,但次序变量与名义变量都属于于“离散变量离散变量”,离散变量无法求平均数或进行相关性统计、,离散变量无法求平均数或进行相关性统计、回归等分析,因此必须转变成等距的虚拟变量来统计。回归等分析,因此必须转变成等距的虚拟变量来统计。五点量表法(五

10、点量表法(LiketLiketfive pointfive point,李克特),李克特):最可靠的方法,适合:最可靠的方法,适合与一般群体来设计,其好处在于不但能分清矢量的高低程度,而且等与一般群体来设计,其好处在于不但能分清矢量的高低程度,而且等确定中心距,以保持变量的内部平衡。确定中心距,以保持变量的内部平衡。七点量表法(七点量表法(LiketLiketSeven pointSeven point,李克特),李克特):适合与高精确度的:适合与高精确度的问卷设计,一般适合与专家群体,其确定的准确度更高,但如果问卷设计,一般适合与专家群体,其确定的准确度更高,但如果受试群体没有能力分清这种高

11、精确性的矢量,会导致问卷收集数受试群体没有能力分清这种高精确性的矢量,会导致问卷收集数据的不准确性。据的不准确性。第八页,编辑于星期五:六点 五十六分。非常符合非常符合符合符合有时符合有时符合不符合不符合非常不符合非常不符合5 54 45 52 21 1总是如此总是如此时常如此时常如此有时如此有时如此很少如此很少如此从为如此从为如此5 54 43 32 21 1非常同意非常同意同意同意不能确定不能确定不同意不同意非常不同意非常不同意5 54 43 32 21 1非常重要非常重要重要重要不能确定不能确定不重要不重要非常不重要非常不重要5 54 43 32 21 1n n问卷设计:问卷设计:n n

12、 我认为参加在职训练能增进工作效率我认为参加在职训练能增进工作效率n n 非常同意非常同意非常不同意非常不同意n n 5 4 3 2 1 5 4 3 2 1n n 你认为安全在你外出旅游中的作用是:你认为安全在你外出旅游中的作用是:n n 1.1.很不重要很不重要 2.2.不重要不重要 3.3.无所谓无所谓 4.4.较重要较重要 5.5.很重要很重要 例2第九页,编辑于星期五:六点 五十六分。四、统计与数据挖掘方法论DatabaseODBCInterfaceData cleaningData transformingData selectingObjectiveDataDataminingMo

13、deExplainingMan-machine interactionData preprocessingData preprocessing第十页,编辑于星期五:六点 五十六分。五、数据处理常用方法n n将问卷各个题目按照关键字段依次输入将问卷各个题目按照关键字段依次输入EXCELEXCEL,形成二维的数据库,形成二维的数据库编号编号字段字段1 1字段字段2 2字段字段3 3字段字段4 4字段字段5 5字段字段6 6字段字段7 7字段字段8 81 13 34 45 53 35 52 24 45 52 22 23 35 54 42 25 53 34 4n n选择合适的方法进行数据库的数据的转换

14、选择合适的方法进行数据库的数据的转换n n 字符性转换为数字性,尽量使用字符性转换为数字性,尽量使用EXCELEXCEL强大的转换功能强大的转换功能n n 数据的非正常值的转换,如通过查找原始问卷、变量属性的转换数据的非正常值的转换,如通过查找原始问卷、变量属性的转换n n 数据格式的转换,如数据格式的转换,如spssspss的强大的的强大的RestructureRestructure功能(行列转置等)功能(行列转置等)n n导入导入SPSSSPSS可使用可使用SPSSSPSS的的OPEN DATA OPEN DATA 文件文件单选编号编号1.A1.A1.B1.B1.C1.C1.D1.D2.A

15、2.A2.B2.B2.C2.C2.D2.D2.E2.E1 11 10 00 01 10 00 01 11 11 12 21 10 00 01 11 11 11 10 01 1多选2004新生原始数据新生原始数据第十一页,编辑于星期五:六点 五十六分。六、SPSS软件的界面与数据控制第十二页,编辑于星期五:六点 五十六分。第十三页,编辑于星期五:六点 五十六分。接受域拒绝域=0.05F=3.24Sig.=0.000466F=10.4862第十四页,编辑于星期五:六点 五十六分。n n信度分析信度分析n n一般用于问卷(试卷)问题测量的稳定性和可靠性一般用于问卷(试卷)问题测量的稳定性和可靠性n

16、nReliablity Analysis Reliablity Analysis 过程通过过程通过ALPHA(ALPHA(克郎巴哈系数克郎巴哈系数)来截定来截定n n0.9 0.9 稳定性很好,效果极佳稳定性很好,效果极佳n n0.9 0.8 0.9 0.8 可以接受,应该做小幅改进可以接受,应该做小幅改进n n0.8 0.7 0.8 0.7 有价值,做部分改进有价值,做部分改进n n0.60.7 有价值,做较大改进有价值,做较大改进n n0.60.6应该重新设计应该重新设计n n注意:如果问卷数量较少,系数可以稍微降低。注意:如果问卷数量较少,系数可以稍微降低。案例1和2第十五页,编辑于星期

17、五:六点 五十六分。七、常用的统计方法七、常用的统计方法 描述性统计描述性统计描述性统计描述性统计基本的数据分布状况基本的数据分布状况基本的数据分布状况基本的数据分布状况 参数假设检验参数假设检验参数假设检验参数假设检验判别显著性判别显著性判别显著性判别显著性 相关分析相关分析相关分析相关分析判别相关度(线性、非线性)判别相关度(线性、非线性)判别相关度(线性、非线性)判别相关度(线性、非线性)回归回归回归回归因素确定、因素间关系因素确定、因素间关系因素确定、因素间关系因素确定、因素间关系 1 1、线性回归(多元回归)、线性回归(多元回归)2 2、分类资料回归、分类资料回归 多元统计多元统计多

18、元统计多元统计因素结构因素结构因素结构因素结构 1 1、聚类分析和判别分析、聚类分析和判别分析 2 2、因子分析、因子分析第十六页,编辑于星期五:六点 五十六分。n n描述性统计描述性统计n n常用指标:平均值(常用指标:平均值(MeanMean)、标准方差()、标准方差(S.DS.D)、最小值()、最小值(MinMin)、最)、最大值(大值(MaxMax)、偏度系数()、偏度系数(SkeSke)、峰度系数()、峰度系数(KurKur)n n目的:目的:发现基本的数据分布状况,为下一步有针对性的数据分析做准备发现基本的数据分布状况,为下一步有针对性的数据分析做准备判断正态分布:判断正态分布:偏

19、度系数(偏度系数(SkeSke)0 0、峰度系数(、峰度系数(KurKur)3 3案例案例3课程体系评价课程体系评价第十七页,编辑于星期五:六点 五十六分。n n描述性统计描述性统计我国主要来源城市竞争力分析我国主要来源城市竞争力分析第十八页,编辑于星期五:六点 五十六分。全国调查上海、苏州调查第十九页,编辑于星期五:六点 五十六分。北京广州调查省内调查第二十页,编辑于星期五:六点 五十六分。市内调查第二十一页,编辑于星期五:六点 五十六分。n n多项选择题分析多项选择题分析n nMultiple Response Multiple Response 菜单菜单只要数据输入没问题,才做更简单案例

20、4第二十二页,编辑于星期五:六点 五十六分。n n均数间的比较均数间的比较(compare mean)(compare mean)假设检验假设检验n n通过通过P P值来判断值来判断n nP0.05,P0.05,P0.05,否定假设否定假设H H1 1两个两个T检验案例检验案例一个单因素方差分析案例一个单因素方差分析案例第二十三页,编辑于星期五:六点 五十六分。n n两种电子商务水平下企业两种电子商务水平下企业各流程的差异检验各流程的差异检验第二十四页,编辑于星期五:六点 五十六分。n n相关分析(相关分析(BivariateBivariate过程、过程、PartialPartial过程过程)

21、n nBivariateBivariate过程过程通过通过R R值(相关系数)判断因素之间的值(相关系数)判断因素之间的线性相关程度。线性相关程度。0.80.8 R R 11 高度相关高度相关 0.5 0.5 R R 0.80.8 显著相关显著相关 0.3 0.3 R R 0.5 0.5 低度相关低度相关 0 0 R R 0.3 0.3 弱微相关弱微相关 R=0 R=0 不相关不相关注意:注意:只有在只有在0.050.05水平下具有水平下具有显著作用显著作用的关系才具有分析价值的关系才具有分析价值 案例7第二十五页,编辑于星期五:六点 五十六分。n nPartial过程(协相关分析)核心:核心

22、:核心:核心:因素过多会产生干扰,应该在消除这些干扰因因素过多会产生干扰,应该在消除这些干扰因素的情况下进行因素的分析。素的情况下进行因素的分析。1 1、如果发现、如果发现C C变量的消失会导致原来两个变量(变量的消失会导致原来两个变量(A A、B B)的显著性关系突然变的不显著了,则证明)的显著性关系突然变的不显著了,则证明C C变量是变量是A A、B B变量的中间变量,变量的中间变量,A A、B B两个变量的相关性主要通过两个变量的相关性主要通过C C变量来实现。变量来实现。2 2、如果、如果C C变量的消失没有使变量的消失没有使A A、B B变量之间的显著变量之间的显著性关系消失,则证明

23、性关系消失,则证明C C变量不是变量不是A A、B B变量的中间变量。变量的中间变量。ABC情况1情况2案例7 支持电子商务战略的因素关系案例8 第二十六页,编辑于星期五:六点 五十六分。n n多元线性回归 适用条件:适用条件:1 1、避免共线性(、避免共线性(TorerlanceTorerlance,VIF=1/Torerlance 10VIF=1/Torerlance 10PN10P,810810个为佳),可以结合主成分进行分析。个为佳),可以结合主成分进行分析。第三十二页,编辑于星期五:六点 五十六分。案例12 我国上市公司的预警模型第三十三页,编辑于星期五:六点 五十六分。因子分析n

24、n用来在复杂的结构数据中通过主成分提取来确定大致的因素,用来在复杂的结构数据中通过主成分提取来确定大致的因素,并将这些因素归为不同的类别,能够并将这些因素归为不同的类别,能够避免共线性避免共线性的问题,得出的问题,得出哪些问题能够用来研究这些因子,寻找这些哪些问题能够用来研究这些因子,寻找这些变量间的潜在结构变量间的潜在结构。n n因子分析各变量间应该存在一定的相关性,可以使用因子分析各变量间应该存在一定的相关性,可以使用KMOKMO统统计量计量和和Bartletts TestBartletts Test球型检验球型检验加以判定;加以判定;n n在因子分析中重点应该放在主成分的可解释上在因子分

25、析中重点应该放在主成分的可解释上n n确定多少主成分可以通过提取主成分积累贡献率来判断,一般在确定多少主成分可以通过提取主成分积累贡献率来判断,一般在7085%7085%以上就比较满意了。以上就比较满意了。第三十四页,编辑于星期五:六点 五十六分。因子分析n nKMOKMO统计量判断统计量判断 KMO0.9,KMO0.9,效果极佳;效果极佳;KMO0.8,KMO0.8,效果很好;效果很好;KMO0.7,KMO0.7,效果尚可;效果尚可;KMO0.6,KMO0.6,效果接受;效果接受;KMO 0.6,KMO 0.6,不能使用不能使用n n成分与因子分析的区别成分与因子分析的区别n n1.1.主成

26、分分析目的在于避免共线性问题,不在于解释主成分包含的主成分分析目的在于避免共线性问题,不在于解释主成分包含的确切涵义;因子分析目的在于确定潜在的确切涵义;因子分析目的在于确定潜在的“类别类别”,寻求潜在的,寻求潜在的结构;结构;n n2.2.因子分析需要满足因子分析需要满足KMOKMO和球形检验;主成分不用关注。和球形检验;主成分不用关注。n n3.3.因子分析因子分析 主成分主成分第三十五页,编辑于星期五:六点 五十六分。因子分析因子分析案例13 看看电子商务的教学情况n n帮助修正因子分析(主成帮助修正因子分析(主成分)的方法分)的方法n n原则原则:根据研究的主题和研究:根据研究的主题和研究的要求的要求n n方法方法:n n1.1.观察最后一个主成分包含指标的特观察最后一个主成分包含指标的特征根值(解释率);征根值(解释率);n n2.2.每一个主成分钟低于每一个主成分钟低于0.50.5的指的指标或最后一个指标(根据研究标或最后一个指标(根据研究要求)要求)n n3.3.主成分钟相互交叉没有办法解释主成分钟相互交叉没有办法解释的指标的指标第三十六页,编辑于星期五:六点 五十六分。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作计划

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁