第七章相关和回归PPT讲稿.ppt

上传人:石*** 文档编号:50188432 上传时间:2022-10-13 格式:PPT 页数:23 大小:1.70MB
返回 下载 相关 举报
第七章相关和回归PPT讲稿.ppt_第1页
第1页 / 共23页
第七章相关和回归PPT讲稿.ppt_第2页
第2页 / 共23页
点击查看更多>>
资源描述

《第七章相关和回归PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第七章相关和回归PPT讲稿.ppt(23页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第七章相关和回第七章相关和回归第1页,共23页,编辑于2022年,星期二第七章 相关和回归Spearman秩相关检验秩相关检验1235Kendall秩相关系数检验秩相关系数检验Theil非参数回归和几种稳健回归非参数回归和几种稳健回归第2页,共23页,编辑于2022年,星期二v一、适用范围一、适用范围vSpearman秩相关系数是最早、最著名评秩统计量秩相关系数是最早、最著名评秩统计量,主要用于研究两变量间的相关程度及其显著性检验主要用于研究两变量间的相关程度及其显著性检验,其资料要求两变量都至少是以定序尺度测量的。其资料要求两变量都至少是以定序尺度测量的。v二、理论依据和方法二、理论依据和方

2、法v1理论依据:理论依据:vSpearman秩相关系数,用秩相关系数,用rs代表。是对容量为代表。是对容量为n的的xi和和yi的秩的秩(i=1,2,n)进行相关性测量。如两变量进行相关性测量。如两变量x与与y完完全正相关,则应有全正相关,则应有xi=yi;如完全负相关,应有;如完全负相关,应有x1=yn,x2=yn-1,xn=y1。Spearman秩相关系数通过秩相关系数通过di=xiyi研究总的偏离程度研究总的偏离程度。第一节 Spearman秩相关第3页,共23页,编辑于2022年,星期二v在计算相关系数时,直接研究在计算相关系数时,直接研究di是不合适的,因是不合适的,因为正的为正的di

3、与负的与负的di相互抵消,因此采用相互抵消,因此采用di2,当,当di越大时,越大时,di2也越大。也越大。vrs的计算公式为的计算公式为:v(7.1)v当当di2为为0时,时,rs=1,可认为两个变量完全正相,可认为两个变量完全正相关。关。rs所量度的是两个等级之间的联系强度,所量度的是两个等级之间的联系强度,rs处于处于+1和和-1之间。之间。第一节 Spearman秩相关第4页,共23页,编辑于2022年,星期二v2.显著性检验显著性检验v假设组假设组Ho:X和和Y相互独立相互独立(X和和Y正或负相关正或负相关)vH1:X与与Y相互不独立相互不独立(X与与Y负或正相关负或正相关)v检验检

4、验rs的显著性的显著性,在小样本情况下,即在小样本情况下,即n从从4到到30时,可查附表时,可查附表13来检验。该表列出了在来检验。该表列出了在H0成立时成立时相伴概率分别为相伴概率分别为a0.05和和a0.01的的rs值。这是值。这是一个单尾表适合用于检验单侧假设。即当一个单尾表适合用于检验单侧假设。即当rs大大于或等于表中临界值时,拒绝于或等于表中临界值时,拒绝Ho。第一节 Spearman秩相关第5页,共23页,编辑于2022年,星期二v在大样本情况下,即在大样本情况下,即n10时,在零假设成立时得时,在零假设成立时得到的到的rs的显著性可用统计量的显著性可用统计量t来检验:来检验:vv

5、t统计量近似服从统计量近似服从df=n-2的的T分布。分布。v如如n很大时,即很大时,即n30,还可用统计量还可用统计量Z来检验。来检验。近似服从正态分布。近似服从正态分布。(7.2)v3.耦合修正。耦合修正。v两变量的秩相等即耦合。这时用它们的平均秩两变量的秩相等即耦合。这时用它们的平均秩作耦合项的秩。作耦合项的秩。第一节 Spearman秩相关第6页,共23页,编辑于2022年,星期二v在耦合现象出现的比例不大时,可以忽略它们在耦合现象出现的比例不大时,可以忽略它们对对rs的影响;但当其比例较大时,的影响;但当其比例较大时,rs用下式来修正:用下式来修正:(7.3)vv式中式中,Tx=(t

6、3-t)/12,t等于等于x变量中同一个秩的耦合数变量中同一个秩的耦合数;Ty=(t3-t)/12,t代表代表y变量中耦合的观察数。变量中耦合的观察数。第一节 Spearman秩相关第7页,共23页,编辑于2022年,星期二v三、检验步骤三、检验步骤v1.据题意,作正确假设;据题意,作正确假设;v2.将变量将变量X和和Y的观察值分别从的观察值分别从1到到n评秩,如观察值相评秩,如观察值相同,用平均秩代替。同,用平均秩代替。v3.将两样本配对成将两样本配对成(xi,yi),xi,yi分别代表两变量的秩。分别代表两变量的秩。v4.定出定出di=xi-yi;算出;算出di2。v5.如无耦合现象或比例

7、较小时,用公式如无耦合现象或比例较小时,用公式(7.1)算出算出rs,如,如耦合现象比例较大,则用耦合现象比例较大,则用(7.3)公式计算公式计算rs。v6.小样本小样本4n30时时,查附表查附表13;大样本时大样本时,N30用公式用公式(7.2)。第一节 Spearman秩相关第8页,共23页,编辑于2022年,星期二v四、例四、例7.1(小样本举例小样本举例)学习时间长短与学生考试成绩间是否学习时间长短与学生考试成绩间是否有关。调查某大学有关。调查某大学10个学生每周学习的时间与期末平均成绩个学生每周学习的时间与期末平均成绩的资料如表的资料如表7-1所示所示v解:假设解:假设H0:学习时间

8、:学习时间X与平均成绩等级与平均成绩等级Y之间是相互之间是相互独立的;独立的;H1:学习时间:学习时间X与平均成绩等级与平均成绩等级Y之间是正相关。之间是正相关。根据根据(9.22)式计算得到式计算得到:v取取a=0.05的显著性水平,样本容量的显著性水平,样本容量n10,查附表,查附表13临界值临界值rs(n,a)=0.5515第一节 Spearman秩相关第9页,共23页,编辑于2022年,星期二v表表7-1大学生的学习时间与期末成绩调查表大学生的学习时间与期末成绩调查表变量变量秩次秩次di=xdi=xi i-y-yi id di i2 2周学习时周学习时期末平均成绩期末平均成绩时间排秩时

9、间排秩成绩等级成绩等级(x x)(y y)(x xi i)(y yi i)242484846 67.57.5-1.5-1.52.252.25171740402.52.51 11.51.52.252.25202058584 44 40 00 0414184848 87.57.50.50.50.250.255252858510109 91 11 1232380805 55 50 00 0464690909 91010-1-11 1171755552.52.53 3-0.5-0.50.250.25151548481 12 2-1-11 1292982827 76 61 11 1合计合计9.009.0

10、0第一节 Spearman秩相关第10页,共23页,编辑于2022年,星期二v因为因为rs=0.9460.5515(临界值)故拒绝(临界值)故拒绝Ho假设假设,而而接受接受H1假设,即学生的学习时间与学生的平均成假设,即学生的学习时间与学生的平均成绩等级之间存在着正相关关系。绩等级之间存在着正相关关系。v这里变量这里变量x和和y中都分别有一对存在耦合即中都分别有一对存在耦合即t2,所,所占比例不大,可以不必进行修正。但为说明方法,占比例不大,可以不必进行修正。但为说明方法,在此作一修正。在此作一修正。v用公式用公式(7.3),首先要算出首先要算出v代入公式得:代入公式得:v修正后比修正前略有减

11、小。修正后比修正前略有减小。第一节 Spearman秩相关第11页,共23页,编辑于2022年,星期二v例例7.2(大样本举例大样本举例)从一个大企业的生产线上抽出从一个大企业的生产线上抽出15名雇员名雇员组成一个随机样本,然后让这些雇员的同事和管理人员根据组成一个随机样本,然后让这些雇员的同事和管理人员根据他们对工作的兴趣及合作精神分别对他们进行排序,结果列他们对工作的兴趣及合作精神分别对他们进行排序,结果列于表于表7-2,企业当局想知道同事和管理人员的看法是否正相关。,企业当局想知道同事和管理人员的看法是否正相关。v解:假设解:假设Ho:同伴对雇员的等级评定与管理人员对雇员的:同伴对雇员的

12、等级评定与管理人员对雇员的等级评定间相互独立;等级评定间相互独立;H1:同伴对雇员的等级评定与管理人:同伴对雇员的等级评定与管理人员对雇员的等级评定正相关员对雇员的等级评定正相关v由由(7.1)式算得式算得rs=1-(6148)/(15(152-1)=0.7357v查附表查附表13得得r15,0.050.446rs。因此我们以。因此我们以0.05的显著的显著性水平否定零假设性水平否定零假设,作出作出“两种等级正相关两种等级正相关”的结论的结论第一节 Spearman秩相关第12页,共23页,编辑于2022年,星期二v这里这里n=1510。我们也可用。我们也可用T统计量来检验。统计量来检验。v查

13、查T分布表当分布表当df13,a=0.05时,临界值时,临界值ta/2=2.160,因,因t=3.92ta/2,所以我们可以在,所以我们可以在a=005的显著的显著性水平上拒绝性水平上拒绝Ho,从而得出结论:同伴和管理,从而得出结论:同伴和管理人员对这人员对这15个雇员的评价正相关。个雇员的评价正相关。第一节 Spearman秩相关第13页,共23页,编辑于2022年,星期二v一、适用范围一、适用范围v肯德尔(肯德尔(Kendall)秩相关系数)秩相关系数(读为(读为Tao)是测度两)是测度两组秩间的相关程度。组秩间的相关程度。v二、理论依据和方法二、理论依据和方法v在容量为在容量为n的成对样

14、本的成对样本(xi,yi)中,如果某对观察值都比另一中,如果某对观察值都比另一对观察值大,则称这两对观察值为一致对对观察值大,则称这两对观察值为一致对(协同协同)。如。如(1.3,2.2)和和(1.6,2.7)就是一致对就是一致对(用用Nc表示在表示在n2个可能个可能对中一致对的数目对中一致对的数目);反之如果某对观察值与另一对观察值以;反之如果某对观察值与另一对观察值以相反的方向变化相反的方向变化(即一个减少而另一个增加即一个减少而另一个增加),我们称之为非,我们称之为非一致对,并用一致对,并用Nd表示在表示在n2个可能对中非一致对个可能对中非一致对(不协同不协同)的的数目。数目。第二节 K

15、endall相关检验第14页,共23页,编辑于2022年,星期二v如果两对观察值相等,就不能算是一致对,也不能算作如果两对观察值相等,就不能算是一致对,也不能算作非一致对。非一致对。v肯德尔秩相关系数的计算公式为:肯德尔秩相关系数的计算公式为:v(7.4)v如所有观察值对都是一致对,则如所有观察值对都是一致对,则1;如所有观察值对都是;如所有观察值对都是非一致对,则非一致对,则1v在计算在计算值时值时,可以将所有观察对可以将所有观察对(xi,yi)按变量值按变量值xi的递增次的递增次序排列序排列,将与其对应的将与其对应的yi与后面的每一个与后面的每一个yi比较比较,有多少对有多少对yi是是按递

16、增次序排列的按递增次序排列的,就有多少个一致对;有多少对就有多少个一致对;有多少对yi不是递增不是递增次序排列次序排列,就有多少个非一致对。就有多少个非一致对。第二节 Kendall相关检验第15页,共23页,编辑于2022年,星期二v例例9.21:双胞胎儿童间的智力相关程度分析。双胞胎儿童间的智力相关程度分析。v某幼儿园对某幼儿园对9对双胞胎的智力进行测验,并按百分制打分。对双胞胎的智力进行测验,并按百分制打分。现将资料列示如表现将资料列示如表7-3:v表表7-3v解:根据解:根据计算要求,首先将资料(计算要求,首先将资料(xi,yi)按)按xi的递增的递增次序排列,并将计算结果列如表次序排

17、列,并将计算结果列如表7-4所示:所示:双胞胎的对数编号双胞胎的对数编号(i)123456789先出生的儿童(先出生的儿童(xi)867768917071858763后出生的儿童(后出生的儿童(yi)887664966580817260第二节 Kendall相关检验第16页,共23页,编辑于2022年,星期二v表表74(xi,yi)(xi,yi)以下的一致对(xi,yi)以下的非一致对63,608068,647070,656071,803277,763185,812186,881187,721091,9600-c=31d=5第二节 Kendall相关检验第17页,共23页,编辑于2022年,星

18、期二v计算计算Kendall秩相关系数秩相关系数v即双胞胎儿童间的智力相关程度为即双胞胎儿童间的智力相关程度为0.722v三、显著性检验三、显著性检验v求出求出Nc和和Nd后后,用统计量用统计量T(T=Nc-Nd)检验下面的假设:检验下面的假设:vHo:X与与Y是相互独立的是相互独立的;H1:X与与Y不是相互独立的。不是相互独立的。(正相关或负相关)(正相关或负相关)v再根据样本大小再根据样本大小n和显著水平和显著水平a,可查附表,可查附表14T的临界值的临界值如果如果TWn(1-a)就接受正相关的备择假设;如果就接受正相关的备择假设;如果n(a)就接受负相关的备择假设。就接受负相关的备择假设

19、。第二节 Kendall相关检验第18页,共23页,编辑于2022年,星期二v上例中,上例中,T=Nc-Nd=31-5=26。v又因又因n9,a=0.05,查附表,查附表14,得出双侧检验的两个临,得出双侧检验的两个临界值为:界值为:W0.97518,W0。02518v而而T26W097518,因此以,因此以0.05的显著水平拒绝的显著水平拒绝Ho,接受接受X与与Y之间存在正相关的备择假设。之间存在正相关的备择假设。v四、耦合处理四、耦合处理v在观察对在观察对(Xi,Yi)中有两个或两个以上的数值相等时,用平中有两个或两个以上的数值相等时,用平均秩来代替。这种情况只影响均秩来代替。这种情况只影

20、响(7.4)式中的分母式中的分母v(7.5)其中其中Tx=Ty=1/2t(t-1),t为观察对中有相同值为观察对中有相同值X(Y)的数目的数目.第二节 Kendall相关检验第19页,共23页,编辑于2022年,星期二v五、大样本检验五、大样本检验v当当N10时,时,遵从如下的正态分布:遵从如下的正态分布:v均值均值U=0,标准差:标准差:v所以正态变量:所以正态变量:vv上例中上例中N12于于10,可用正态近似法计算,可用正态近似法计算v=0.822vv查正态分布表,当查正态分布表,当Z3.72时大于时大于1.96,所以拒绝,所以拒绝Ho假设。假设。而接受学生所花的学习时间与取得的学习成绩之

21、间存在而接受学生所花的学习时间与取得的学习成绩之间存在相关的结论。相关的结论。第二节 Kendall相关检验第20页,共23页,编辑于2022年,星期二v六、功效讨论六、功效讨论v斯氏秩相关系数斯氏秩相关系数rs与肯氏秩相关系数与肯氏秩相关系数之间对比,两者采用之间对比,两者采用两种不同的方法计算相关系数,所以即使用同样的资料,两种不同的方法计算相关系数,所以即使用同样的资料,也会得出不同的数值。在大多数情况下,斯氏的也会得出不同的数值。在大多数情况下,斯氏的rs的绝对的绝对值比肯氏的值比肯氏的的绝对值为大(不是所有的情况均如此)。的绝对值为大(不是所有的情况均如此)。但我们绝不能根据它们计算

22、的数值不同,而得出前者但我们绝不能根据它们计算的数值不同,而得出前者的相关程度密切,后者相关程度不太密切的错误结论。的相关程度密切,后者相关程度不太密切的错误结论。v如果进行显著性检验,两种方法都有同样的优越性,如果进行显著性检验,两种方法都有同样的优越性,即当资料可应用即当资料可应用r检验时,检验时,和和rs都具都具91的效率,因而的效率,因而即使用同一组资料计算出的即使用同一组资料计算出的rs和和尽管在数值上有所不同,尽管在数值上有所不同,但他们将在同样显著性水平上拒绝但他们将在同样显著性水平上拒绝Ho假设。假设。第二节 Kendall相关检验第21页,共23页,编辑于2022年,星期二v一、一、Theil回归回归第三节 Theil非参数回归和几种稳健回归第22页,共23页,编辑于2022年,星期二第23页,共23页,编辑于2022年,星期二

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁