《应用多元分析多元正态总体.pptx》由会员分享,可在线阅读,更多相关《应用多元分析多元正态总体.pptx(152页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章 多元正态总体的统计推断4.1 一元情形的回顾1、置信区间就称随机区间(,)是 的置信度为1-的置信区间,称 为置信下限,称 为置信上限。设总体X的分布函数为F(x;),是未知参数,是来自总体X的样本,若存在两个统计量 使得对任何 0 F Wilks Lambda 0.18889877 8.59 3 6 0.0137 Pillais Trace 0.81110123 8.59 3 6 0.0137Hotelling-Lawley Trace 4.29384071 8.59 3 6 0.0137Roys Greatest Root 4.29384071 8.59 3 6 0.0137第78
2、页/共152页 例 在爱情和婚姻的调查中,对一个由若干名丈夫和妻子组成的样本进行了问卷调查,请他们回答以下几个问题:(1)你对伴侣的爱情的“热度”感觉如何?(2)伴侣对你的爱情的“热度”感觉如何?(3)你对伴侣的爱情的“可结伴”水平感觉如何?(4)伴侣对你的爱情的“可结伴”水平感觉如何?回答采用没有、很小、有些、很大和非常大 5个等级,得到结果如表.第79页/共152页丈夫对妻子丈夫对妻子妻子对丈夫妻子对丈夫 X1 X2 X3 X4 X1 X2 X3 X42355445555444555455544554344455533554455334533443444435444553455455544
3、54443334444455455555445555第80页/共152页 现在我们关心均值分量间的差异是否满足某种结构关系。比如每个指标均值间的差异是否相等。1、丈夫对妻子以及妻子对丈夫的回答在0.05显著水平上没有差异。2、在四个指标上他们是否会有相同的分数。即检验四个分数的平均值是否相等。第81页/共152页 检验 在原假设为真的条件下,检验的统计量为:统计量与检验第82页/共152页data a;input class x1 x2 x3 x4;cards;1 2 3 5 5 2 4 4 5 5 1 5 5 4 4 2 4 5 5 51 4 5 5 5 2 4 4 5 5 1 4 3 4
4、4 2 4 5 5 51 3 3 5 5 2 4 4 5 5 1 3 3 4 5 2 3 3 4 41 3 4 4 4 2 4 3 5 4 1 4 4 5 5 2 3 4 5 51 4 5 5 5 2 4 4 5 4 1 4 4 3 3 2 3 4 4 41 4 4 5 5 2 4 5 5 5 1 5 5 4 4 2 5 5 5 5;run;proc anova;class class;model x1-x4=class;manova h=class m=(1-1 0 0,1 0-1 0,1 0 0-1);run;第83页/共152页 MANOVA Test Criteria and Exac
5、t F Statistics for the Hypothesis of No Overall g Effect on the Variables Defined by the M Matrix Transformation H=Anova SSCP Matrix for g E=Error SSCP Matrix S=1 M=0.5 N=9 Statistic Value F Value Num DF Den DF Pr F Wilks Lambda 0.83193980 1.35 3 20 0.2876 Pillais Trace 0.16806020 1.35 3 20 0.2876 H
6、otelling-Lawley Trace 0.20201005 1.35 3 20 0.2876 Roys Greatest Root 0.20201005 1.35 3 20 0.2876第84页/共152页prociml;sigma1=0.57586206900.3758620690-.1034482759-.1655172414,0.37586206900.5850574713-.0919540230-.1586206897,-.1034482759-.09195402300.43678160920.4137931034,-.1655172414-.15862068970.413793
7、10340.4551724138;mu1=3.90000,3.96667,4.33333,4.40000;sigma2=0.4885057471-.01724137930.04022988510.0229885057,-.01724137930.43793103450.07241379310.1172413793,0.04022988510.07241379310.24022988510.2022988506,0.02298850570.11724137930.20229885060.2574712644;mu2=3.83333,4.10000,4.63333,4.53333;c=1-100,
8、10-10,100-1;mu=(mu1+mu2)/2;a=c*mu;sigma=29#(sigma1+sigma2)/58;t2=60#t(a)*inv(c*sigma*t(c)*a;F=20/(3*22)*t2;printt2f;第85页/共152页第86页/共152页4.6 多个总体均值的比较检验 (多元方差分析)欲检验方法:方差分析检验统计量 威尔克斯(Wilks)统计量 第87页/共152页第88页/共152页第89页/共152页 例4.6.1 为了研究销售方式对商品额的影响,选择四种商品(甲、乙、丙、丁)按三种不同的销售方式(I,II,III)进行销,这四种商品的销售额分别为x1,x
9、2,x3,x4,其数据见表4.6.1.问这三种销售方式的平均销售额是否显著不同?(设这三种销售方式的销售额 x1,x2,x3,x4 均服从正态分布.)第90页/共152页经计算第91页/共152页第92页/共152页由附录4-3中(4-3.4)可得第93页/共152页查F分布表得从而,在 0.01的显著性水平下,拒绝原假设(p=0.004).差异的进一步分析(用一元方差分析).第94页/共152页第95页/共152页第96页/共152页表4.6.1 销售额数据 编号 销售方式 I 销售方式 II 销售方式 III 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1
10、7 18 19 20 125 60 338 210 119 80 233 330 63 51 260 203 65 51 429 150 130 65 403 205 69 45 350 190 46 60 585 200 146 66 273 250 87 54 585 240 110 77 507 270 107 60 364 200 130 61 391 200 80 45 429 270 60 50 442 190 81 54 260 280 135 87 507 260 57 48 400 285 75 52 520 260 76 65 403 250 55 42 411 170 6
11、6 54 455 310 82 45 403 210 65 65 312 280 40 51 477 280 67 54 481 293 38 50 468 210 42 45 351 190 113 40 390 310 80 55 520 200 76 60 507 189 94 33 260 280 60 51 429 190 55 40 390 295 65 48 481 177 69 48 442 225 125 63 312 270 120 56 416 280 70 45 468 370 62 66 416 224 69 60 377 280 65 33 480 260 100
12、34 468 295 65 63 416 265 117 48 468 250 114 63 395 380 55 30 546 235 64 51 507 320 110 90 442 225 60 62 440 248 110 69 377 260 88 78 299 360 73 63 390 320 114 55 494 240 103 54 416 310 100 33 273 312 140 61 312 345 80 36 286 250 135 54 468 345 130 69 325 360 60 57 273 260第97页/共152页Data ex461;Input g
13、 x1-x4;Cards;1 120 60 338 210 1 119 80 233 330 1 63 51 260 203 1 65 51 429 150 1 130 65 403 205 1 69 45 350 190 1 46 60 585 200 1 146 66 273 250 1 87 54 585 200 1 110 77 507 200 1 107 60 364 200 1 130 61 391 200 1 80 45 429 270 1 60 50 442 190 1 81 54 260 280 1 135 87 507 260 1 57 48 400 285 1 75 52
14、 520 260 1 76 65 403 250 1 55 42 411 170 2 66 54 455 310 2 82 45 403 210 2 65 65 312 280 2 40 51 477 280 2 67 54 481 293 2 38 50 468 210 2 42 45 351 190 2 113 40 390 310 2 80 55 520 200 2 76 60 507 189 2 94 33 260 280 2 60 51 429 190 2 55 40 390 295 2 65 48 481 177 2 59 48 442 225 2 125 63 312 270 2
15、 120 56 416 280 2 70 45 468 370 2 62 66 416 224 2 69 60 377 280 3 65 33 480 260 3 100 34 468 295 3 65 63 416 265 3 117 48 468 250 3 114 63 395 380 3 55 30 546 235 3 64 51 507 320 3 110 90 442 225 3 60 62 440 248 3 110 69 377 260 3 88 78 299 360 3 73 63 390 320 3 114 55 494 240 3 103 54 416 310 3 100
16、 33 273 312 3 140 61 312 345 3 80 36 286 250 3 135 54 468 345 3 130 69 325 360 3 60 57 273 260;Proc print;Run;第98页/共152页proc anova data=ex461;class g;model x1-x4=g;manova h=g;run;第99页/共152页proc iml;x=125 60 338 210,119 80 233 330,63 51 260 203,65 51 429 150,130 65 403 205,69 45 350 190,46 60 585 200
17、,146 66 273 250,87 54 585 240,110 77 507 270,107 60 364 200,130 61 391 200,80 45 429 270,60 50 442 190,81 54 260 280,135 87 507 260,57 48 400 285,75 52 520 260,76 65 403 250,55 42 411 170;Y=66 54 455 310,82 45 403 210,65 65 312 280,40 51 477 280,67 54 481 293,38 50 468 210,42 45 351 190,113 40 390 3
18、10,80 55 520 200,76 60 507 189,94 33 260 280,60 51 429 190,55 40 390 295,65 48 481 177,69 48 442 225,125 63 312 270,120 56 416 280,70 45 468 370,62 66 416 224,69 60 377 280;z=65 33 480 260,100 34 468 295,65 63 416 265,117 48 468 250,114 63 395 380,55 30 546 235,64 51 507 320,110 90 442 225,60 62 440
19、 248,110 69 377 260,88 78 299 360,73 63 390 320,114 55 494 240,103 54 416 310,100 33 273 312,140 61 312 345,80 36 286 250,135 54 468 345,130 69 325 360,60 57 273 260;i=t(20 1);x1=T(x)*i/20;y1=T(y)*i/20;z1=T(z)*i/20;s=(x1+y1+z1)/3;t=60*s*T(s);sstr=20*(x1*T(x1)+y1*T(y1)+z1*T(z1)-t;sst=(T(x)*x+T(y)*y+T
20、(z)*z)-t;sse=sst-sstr;l=det(sse)/det(sst);f=(57-4+1)*(1-sqrt(l)/(4*sqrt(l);f1=sstr1,1*57/(sse1,1*2);f2=sstr2,2*57/(sse2,2*2);f3=sstr3,3*57/(sse3,3*2);f4=sstr4,4*57/(sse4,4*2);print x1 y1 z1 s sstr sst sse l f f1 f2 f3 f4;第100页/共152页第101页/共152页第102页/共152页第103页/共152页第104页/共152页第105页/共152页第106页/共152页pr
21、ociml;n1=20;n2=20;n3=20;n=n1+n2+n3;k=3;p=4;x1=260754018,200723417,240874518,170653917,2701103924,2051303423,190692715,200464515,2501172120,2001072820,2251303611,2101252617,170643114,270763313,190603416,280812018,3101192515,27057318,250673114,2601353929;x2=3101223021,310603518,190402715,225653416,170
22、653716,210823117,280673718,210383617,280653023,200764017,200763920,280942611,190603317,295553016,2701252421,2801203218,240623220,280692920,370703020,280403717;x3=320643917,260593711,360882826,2951003612,270653221,3801143621,240554210,260553420,2601102920,295733321,2401143818,3101033218,3301122111,34
23、51272420,250622216,260592119,2251003430,3451203618,3601072523,2501173616;xx=x1/x2/x3;第107页/共152页n1阶单位均矩阵ln=201;x10=(ln*x1)/n1;printx10;mm1=i(n1)-j(n1,n1,1)/n1;mm=i(n)-j(n,n,1)/n;a1=x1*mm1*x1;printa1;a2=x2*mm1*x2;printa2;a3=x3*mm1*x3;printa3;tt=xx*mm*xx;printtt;a=a1+a2+a3;lambda=det(a)/det(tt);f=(n-p
24、-k+1)*(1-sqrt(lambda)/(p*sqrt(lambda);p0=1-probf(f,8,108);printap0;产生20个1的行向量产生x1的均值向量产生n1行n1列全为1的矩阵产生离差阵第108页/共152页dt=det(tt/(n-k);da1=det(a1/(n1-1);da2=det(a2/(n2-1);da3=det(a3/(n3-1);m5=(n-k)*log(dt)-19*(log(da1)+log(da2)+log(da3);b=(2*p*p+3*p-1)*(k+1)/(6*(p+3)*(n-k)-(p-k+2)/(n-k)*(p+3);df=p*(p+3
25、)*(k-1)/2;kc=(1-b)*m5;printdtda1da2da3;printm5bdf;p0=1-probchi(kc,df);printkcp0;run;h=130;t11=h*tt*t(h);a11=h*a*t(h);f1=(t11-a11)/(k-1)/(a11/(n-k);p1=1-probf(f1,2,57);Printf1p1;第109页/共152页4.7 总体相关系数的推断一、简单相关系数的推断(1)欲检验第110页/共152页(2)欲检验第111页/共152页第112页/共152页二、偏相关系数的检验二、偏相关系数的检验欲检验第113页/共152页第114页/共15
26、2页欲检验:第115页/共152页第116页/共152页三、复相关系数的推断欲检验第117页/共152页第118页/共152页 为研究日、美两国在华投资企业对中国经营环境的评价是否存在差异,今从两国在华投资企业中各抽出10家,让其对中国的政治、经济、法律、文化等环境进行打分,评分结果如表3.2所示(表中序号1-10为美国在华投资企业的代号,11-20为日本在华投资企业的代号,数据来源:国务院发展研究中心APEC在华投资企业情况调查).第119页/共152页第120页/共152页协方差矩阵的检验第121页/共152页其中第122页/共152页则其中第123页/共152页第124页/共152页令第
27、125页/共152页或等价于第126页/共152页第127页/共152页第128页/共152页其中第129页/共152页例1第130页/共152页第131页/共152页第132页/共152页第133页/共152页第134页/共152页prociml;n1=20;n2=20;n3=20;n=n1+n2+n3;k=3;p=4;x1=260754018,200723417,240874518,170653917,2701103924,2051303423,190692715,200464515,2501172120,2001072820,2251303611,2101252617,170643114
28、,270763313,190603416,280812018,3101192515,27057318,250673114,2601353929;x2=3101223021,310603518,190402715,225653416,170653716,210823117,280673718,210383617,280653023,200764017,200763920,280942611,190603317,295553016,2701252421,2801203218,240623220,280692920,370703020,280403717;x3=320643917,260593711
29、,360882826,2951003612,270653221,3801143621,240554210,260553420,2601102920,295733321,2401143818,3101033218,3301122111,3451272420,250622216,260592119,2251003430,3451203618,3601072523,2501173616;xx=x1/x2/x3;第135页/共152页ln=201;x10=(ln*x1)/n1;printx10;mm1=i(n1)-j(n1,n1,1)/n1;mm=i(n)-j(n,n,1)/n;s1=x1*mm1*x
30、1/(n1-1);s2=x2*mm1*x2/(n2-1);s3=x3*mm1*x3/(n3-1);tt=xx*mm*xx/(n-1);s=(s1+s2+s3)*(n1-1)/(n-3);ds1=det(s1);ds2=det(s2);ds3=det(s3);ds=det(s);d=(2*p*2+3*p-1)*(k+1)/(6*p+1)*(n-k);f=p*(p+1)*(k-1)/2;m=(n-k)*log(det(s)-(n1-1)*(log(det(s1)+log(det(s2)+log(det(s3);kc=(1-d)*m;p0=1-probchi(kc,df);prints1s2s3sf
31、dmkc;第136页/共152页记第137页/共152页第138页/共152页其中其中第139页/共152页 对例1 中的数据,判断三个组(即三个总体)的均值向量和协方差矩阵是否全相等(=0.05)第140页/共152页第141页/共152页prociml;n1=20;n2=20;n3=20;n=n1+n2+n3;k=3;p=4;x1=260754018,200723417,240874518,170653917,2701103924,2051303423,190692715,200464515,2501172120,2001072820,2251303611,2101252617,17064
32、3114,270763313,190603416,280812018,3101192515,27057318,250673114,2601353929;x2=3101223021,310603518,190402715,225653416,170653716,210823117,280673718,210383617,280653023,200764017,200763920,280942611,190603317,295553016,2701252421,2801203218,240623220,280692920,370703020,280403717;x3=320643917,26059
33、3711,360882826,2951003612,270653221,3801143621,240554210,260553420,2601102920,295733321,2401143818,3101033218,3301122111,3451272420,250622216,260592119,2251003430,3451203618,3601072523,2501173616;xx=x1/x2/x3;第142页/共152页ln=201;x10=(ln*x1)/n1;printx10;mm1=i(n1)-j(n1,n1,1)/n1;mm=i(n)-j(n,n,1)/n;s1=x1*m
34、m1*x1/(n1-1);s2=x2*mm1*x2/(n2-1);s3=x3*mm1*x3/(n3-1);tt=xx*mm*xx;s=(s1+s2+s3)*(n1-1)/(n-3);ds1=det(s1);ds2=det(s2);ds3=det(s3);dt=det(tt/n-k);d=(2*p*2+3*p-1)*(k+1)/(6*p+1)*(n-k);f=p*(p+3)*(k-1)/2;b=(1/(n1-1)+1/(n2-1)+1/(n3-1)-1/(n-k)*(2*p*2+3*p-1)/(6*(p+3)*(k-1)-(p-k+2)/(n-k)*(p+3);m=(n-k)*log(det(t
35、t/(n-k)-(n1-1)*(log(det(s1)+log(det(s2)+log(det(s3);ki=(1-b)*m;p0=1-probchi(ki,f);prints1s2s3sfbdmds1ds2ds3dtkip0;第143页/共152页第144页/共152页检验检验:对任意两个子向量,其协方差矩阵是否成立.对正态总体,转化为检验:设是来自于总体X的样本,将其均值向量和样本离差阵作相应剖分第145页/共152页第146页/共152页似然比统计量为第147页/共152页试检验随机向量X的三个分量是否独立.第148页/共152页第149页/共152页第150页/共152页proc im
36、l;n=20;p=3;p1=1;p2=1;p3=1;x=3.7 48.5 9.3,4.7 65.1 8.0,3.8 47.2 10.9,3.2 53.2 12.0,3.1 55.5 9.7,4.6 36.1 7.9,2.4 24.8 14.0,7.2 33.1 7.6,6.7 47.4 8.5,5.4 54.1 11.3,3.9 36.9 12.7,4.5 58.8 12.3,3.5 27.8 9.8,4.5 40.2 8.4,1.5 13.5 10.1,8.5 56.4 7.1,4.5 71.6 8.2,6.5 52.8 10.9,4.1 44.1 11.2,5.5 40.9 9.4 ;i=20 1;xbar=t(i*x)/n;a=t(x)*x-n*xbar*t(xbar);a0=det(a);a1=det(diag(a);v=a0/a1;b=n-3/2-(p#3-(p1#3+p2#3+p3#3)/(3*(3#2-(1#2+1#2+1#2);ki=-b*log(v);f=(p*(p+1)-(p1*(p1+1)+p2*(p2+1)+p3*(p3+1)/2;p0=1-probchi(ki,f);printxbaraa0a1vbfkip0;第151页/共152页感谢您的观看。第152页/共152页