《第四章相关分析精选文档.ppt》由会员分享,可在线阅读,更多相关《第四章相关分析精选文档.ppt(40页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章相关分析本讲稿第一页,共四十页相关与相关系数n因果关系n一种现象是另一种现象的原因,而另一种现象则是结果。n因 果。n自变量&因变量n努力程度&学习成绩本讲稿第二页,共四十页n共变关系n表面看起来有联系的两种事物都与第三种现象有关,此时这两种事物之间的关系即共变关系。nC A,C B 严格的说不叫相关,只是A和B之间有某些共同点n语文&数学n工资收入&受教育程度本讲稿第三页,共四十页n相关关系n两类现象在发展变化的方向与大小方面存在一定的联系,不能确定是否为因果关系,但不存在共变关系。n物理成绩与数学成绩n广告费支出与商品销售额的关系n大学生自我价值感与应对方式的关系本讲稿第四页,共四十
2、页n相关n事物之间存在联系,但不能直接作出因果关系的解释时,称事物之间的这种联系为相关。n相关分析n运用合理的量化指标对相关事物的观测值进行的统计分析。n相关分析是多元分析的基础。n相关系数本讲稿第五页,共四十页两个变量之间的变化方向有:n正相关:两个变量的变化方向相同。n负相关:两个变量的变化方向相反。n零相关:两个变量的变化方向无一定规律。本讲稿第六页,共四十页本讲稿第七页,共四十页n从关系密切程度来看,两个变量的变化程度课大致划分为:n完全相关:两个变量的变化程度完全一致。n强相关:两个变量变化的一致性比较强。n中等相关:两个变量变化的一致程度中等。n弱相关:两个变量变化的一致性比较差。
3、n完全不相关:两个变量变化程度没有一致性。本讲稿第八页,共四十页n相关系数n两列变量间相关程度的数字表现形式,或者表示两列变量间相关程度的数量化指标。n总体参数,样本统计量r rn|r|1相关系数的绝对值总是小于等于1。n完全相关:1.00 或 1.00n不完全相关:0|r|1n零相关:r=0n正相关:两个变量的变化方向一致,0 r 1n负相关:两个变量的变化方向相反,1 r 0本讲稿第九页,共四十页(a)完全正相关(b)完全负相关(c)无相关关系(d)非线性关系(e)正相关(f)负相关本讲稿第十页,共四十页相关系数的性质n相关系数不是由相等单位度量而来的,因此只能比较大小,不能做任何加、减、
4、乘、除运算。n有相关不一定有因果!nX与Y之间存在相关关系,可能的解释:nX是Y的因或者果。nX与Y均为第三个变量Z的因或者果。n对存在相关关系的变量之间要进一步作出因果关系的解释,则必须进行相应的控制自变量因变量实验。本讲稿第十一页,共四十页计算相关系数时应注意的问题n相关系数受样本容量n的影响n如果n很小,可能完全没有相关的两事物,却计算出较大的相关系数。n一般以n大于30为宜。n相关系数不是等距数据也不是比例数据。n计算相关系数要求成对数据。n没有线性相关,不一定没有关系,可能是非线性的。n相关系数的计算不受以下因素影响。n互换两个变量n某一变量的所有值都增加同一数值n某一变量的所有值都
5、乘以同一正数本讲稿第十二页,共四十页散点图 scatter diagram本讲稿第十三页,共四十页本讲稿第十四页,共四十页本讲稿第十五页,共四十页本讲稿第十六页,共四十页积差相关n积矩相关,皮尔逊相关。rXYn当两个变量都是正态连续变量,而且两者之间呈线性关系,表示这两个变量之间的相关称为积差相关。本讲稿第十七页,共四十页n积差相关的使用条件n两列变量都是等距或者等比的测量数据;n两列变量所来自的总体必须是正态的或者近似正态的对称单峰分布;n两列变量必须具备一一对应的关系;n两列变量之间的关系应该是线性的,如果是非线性的两列变量,不能计算线性相关。n大样本,即n不少于30。本讲稿第十八页,共四
6、十页本讲稿第十九页,共四十页本讲稿第二十页,共四十页本讲稿第二十一页,共四十页本讲稿第二十二页,共四十页等级相关n当测量得到的数据不是等距或等比数据,而是等级顺序的测量数据。n得到的数据是等距或等比的测量数据,但其所来自的总体分布不是正态的。n等级相关n斯皮尔曼等级相关n肯德尔W系数本讲稿第二十三页,共四十页等级相关n斯皮尔曼等级相关:rRn两列变量具有等级顺序的测量数据两列变量具有等级顺序的测量数据n总体为非正态的等距或等比数据总体为非正态的等距或等比数据n不要求样本的容量必须大于不要求样本的容量必须大于3030。本讲稿第二十四页,共四十页斯皮尔曼等级相关系数本讲稿第二十五页,共四十页本讲稿
7、第二十六页,共四十页斯皮尔曼等级相关系数的修正本讲稿第二十七页,共四十页P63 例2-15本讲稿第二十八页,共四十页本讲稿第二十九页,共四十页肯德尔W系数n肯德尔和谐系数n表示两列以上(多列等级变量)相关程度的一个方法。n肯德尔W系数反映多个等级变量变化的一致性。本讲稿第三十页,共四十页肯德尔W系数本讲稿第三十一页,共四十页本讲稿第三十二页,共四十页质量相关n一列变量为性质变量,另一列变量为数量变量,这样的两列变量之间的相关称为质量相关。n一列变量按照事物的某一属性划分为种类,另一列变量则为等距或等比的测量数据。求这两列变量的直线相关,即质量相关。n点二列相关点二列相关n二列相关二列相关本讲稿
8、第三十三页,共四十页点二列相关n适用条件:n两列变量中一列为等距或等比的测量数据而且总体分布为正态,另一列变量为二分的类别变量。n如男与女,文盲与非文盲,成功与失败,对与错如男与女,文盲与非文盲,成功与失败,对与错本讲稿第三十四页,共四十页点二列相关n应用n点二列相关多用于编制是非测验题评价测验内部一致性等问题。n注:每个题目(二分类别变量)与总分(数值)变量的相关,称为每个题目的区分度。相关高说明该题答对答错与总分的一致性高,即区分度高。本讲稿第三十五页,共四十页点二列相关系数本讲稿第三十六页,共四十页本讲稿第三十七页,共四十页二列相关n适用条件n两列变量都为来自正态总体的等距(比例)变量,其中一列变量被人为地划分成两类。n及格与不及格,健康与不健康n应用n教育和心理测量中问答题的区分度指标n n二列相关与点二列相关的主要区别在于二分变量二列相关与点二列相关的主要区别在于二分变量是否正态。是否正态。本讲稿第三十八页,共四十页二列相关系数本讲稿第三十九页,共四十页本讲稿第四十页,共四十页