《第八章相关分析.ppt》由会员分享,可在线阅读,更多相关《第八章相关分析.ppt(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2023/1/52023/1/51 1第第 8 章章相相 关关 分分 析析2023/1/52023/1/52 28.1 相关分析的理论与方法相关分析的理论与方法1、函数关系与相关关系、函数关系与相关关系2、相关分析的类型划分(按数据度量尺度的不同)、相关分析的类型划分(按数据度量尺度的不同)(1)连续变量)连续变量Pearson简单相关简单相关(2)定序变量)定序变量Spearman秩相关或秩相关或Kendall秩相关秩相关(3)定类变量)定类变量列联表分析(列联表分析(Crosstabulation)2023/1/52023/1/53 38.2 连续变量的相关分析连续变量的相关分析1、Pea
2、rson简单相关系数简单相关系数用来测定两个连续变量之间相关关系的密切程度。用来测定两个连续变量之间相关关系的密切程度。Pearson简单相关系数的取值简单相关系数的取值范围:范围:2023/1/52023/1/54 48.2 连续变量的相关分析连续变量的相关分析2、Pearson简单相关系数的检验简单相关系数的检验实实际际分分析析中中,相相关关系系数数大大都都是是利利用用样样本本数数据据计计算算的的,带带有有一一定定的的随随机机性性,需需要要对对相相关关关关系系的的显显著著性性进进行行检检验验。该该检检验验的的原原假假设设是是认认为为两两变变量量总总体体相相关关系系数数为为0(即两变量不相关
3、)。(即两变量不相关)。在原假设成立的条件下,构造如下在原假设成立的条件下,构造如下t 统计量:统计量:该统计量服从自由度为该统计量服从自由度为n-2的的t分布。分布。2023/1/52023/1/55 58.3 定序变量的相关分析定序变量的相关分析1、Spearman秩相关系数秩相关系数假假设设有有容容量量为为n的的x和和y两两个个变变量量构构成成的的随随机机样样本本。分分别别计计算算每每个个观观测测关关于于变变量量x和和y的的秩秩变变量量ui和和vi(i=1,2,3 n),用用di=ui-vi表表示示第第i个个观观测测对对应应于于两两个个变变量量的的秩秩之之差差,则则Spearman秩相关
4、系数的计算公式为:秩相关系数的计算公式为:2023/1/52023/1/56 68.3 定序变量的相关分析定序变量的相关分析2、Kendall秩相关系数秩相关系数Kendall秩秩相相关关系系数数和和Spearman秩秩相相关关系系数数类类似似,都都是是利利用用变变量量的的秩秩计计算算相相关关系系数数,只只是是计计算方式不同。算方式不同。2023/1/52023/1/57 78.4 定类变量的相关分析定类变量的相关分析l利利用用2统统计计量量可可以以对对单单一一随随机机样样本本的的分分布布进进行行检检验验,其其实实2还还有有一一个个重重要要用用途途就就是是对对离离散散变变量量的的相相关关性性进
5、进行行检检验验,这种方法有时也叫做这种方法有时也叫做“列联表分析列联表分析”。l例例如如:抽抽样样调调查查某某地地区区500名名待待业业人人员员的的性性别别和和文文化化程程度度资资料料如如下下表表。试试检检验验此此项项调调查查结结果果能能否否说说明明该该地地区区待待业业人人员中的文化程度与性别是相互独立的(不相关)?员中的文化程度与性别是相互独立的(不相关)?2023/1/52023/1/58 8待业人员文化程度与性别列联表待业人员文化程度与性别列联表高中及以上高中及以上初初 中中小学及以下小学及以下合合 计计边缘分布边缘分布男男44(46)36(42)140(132)2200.440女女60
6、(58)60(54)160(168)2800.560合计合计10496300500边缘分布边缘分布0.2080.1920.6001.000联合观察频数联合观察频数(上面数值)(上面数值)联合期望频数联合期望频数(括号数值)(括号数值)2023/1/52023/1/59 98.4 定类变量的相关分析定类变量的相关分析l在在得得出出对对应应的的期期望望频频数数后后,就就可可以以运运用用Pearson 2统统计计量量来来检检验验两两个个变变量量的的相相关关性性。该该检检验验的的原原假假设设为为:两两个个变变量相互独立。构造的统计量为:量相互独立。构造的统计量为:l其其中中,s 和和 t 分分别别为为两两个个离离散散变变量量取取值值的的个个数数,fij 为为第第一一个个变变量量取取第第i个个值值、第第二二个个变变量量取取第第j个个值值时时的的联联合合观观察察频频数数。在在原原假假 设设 成成 立立 的的 条条 件件 下下,该该 统统 计计 量量 服服 从从 一一 个个 自自 由由 度度 为为(s-1)(t-1)的的2分布。分布。2023/1/52023/1/51010实例实例l连续变量相关分析(相关与回归)连续变量相关分析(相关与回归)l离散变量相关分析(补钙产品市场调查数据)离散变量相关分析(补钙产品市场调查数据)