《高级生物统计优秀PPT.ppt》由会员分享,可在线阅读,更多相关《高级生物统计优秀PPT.ppt(85页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、高级生物统计第一页,本课件共有85页(一)数学模型(一)数学模型其中:x预先确定,不受试验误差影响;y随x而变,且受试验误差影响;或 x、y都受试验误差的影响(x、y都为可观测的随机变量)第二页,本课件共有85页总体回归截距,总体回归截距,总体回归系数,总体回归系数,i为随机变量,相互独立,且都服从为随机变量,相互独立,且都服从N(0,2)即即iN(0,2),E(i)=0,V(i)=2;yN(+x,2),E(y)=+x,V(y)=2第三页,本课件共有85页(二)回归方程a估计估计b估计估计估计估计+x第四页,本课件共有85页b、a的计算公式为:的计算公式为:其中第五页,本课件共有85页离回归标
2、准误,表示回离回归标准误,表示回 归方程估测的偏离度归方程估测的偏离度离回归均方离回归均方第六页,本课件共有85页(三)显著性检验第七页,本课件共有85页1、t检验Ho:=0,HA:0回归系数标准误回归系数标准误其中:其中:第八页,本课件共有85页2、F检验Ho:=0,HA:0平方和与自由度的划分式:平方和与自由度的划分式:第九页,本课件共有85页SSyy的总平方和的总平方和,SSR 回归方平方和回归方平方和,SSr离回归平方和,离回归平方和,dfy=n-1y的总自由度的总自由度,dfR=1回归自由度回归自由度,dfr=n-2离回归自由度离回归自由度(剩余自由度剩余自由度)第十页,本课件共有8
3、5页(舍入误差小)舍入误差小)(便于推广便于推广)各项平方和的计算公式如下:第十一页,本课件共有85页可用可用 df1=1,df2=n-2来检验来检验 Ho:=0成立与否。成立与否。第十二页,本课件共有85页 在直线回归分析中,在直线回归分析中,F 检验与检验与t 检验等检验等价,这是因为价,这是因为t(n-2)与与F(1,n-2)有如下关系:有如下关系:也就是说,凡是也就是说,凡是F 检验中的大均方自由检验中的大均方自由度为度为1,则相应有一个与之等价的,则相应有一个与之等价的t 检验,检验,反之亦然。反之亦然。第十三页,本课件共有85页 相关系数r 表示x与y线性相关的性质与程度 将将 r
4、 与与r0.05(n-2)、r0.01(n-2)比比较较,进进行行显显著著性性检检验验,从而推断从而推断y与与x间是否存在线性关系。间是否存在线性关系。3、由相关系数由相关系数r的显著性检验进行判断的显著性检验进行判断第十四页,本课件共有85页(四)决定系数四)决定系数r2 决定系数决定系数r2决定系数决定系数r2表示回归方程估测的可靠程表示回归方程估测的可靠程度。度。第十五页,本课件共有85页(五)区间估计第十六页,本课件共有85页1、的置信区间的置信区间a是是的点估计值的点估计值其中其中样本回归截距标准误样本回归截距标准误第十七页,本课件共有85页于是,可以得出:于是,可以得出:的的95%
5、置信区间:置信区间:at0.05(n-2)Sa的的99%置信区间:置信区间:at0.01(n-2)Sa第十八页,本课件共有85页b是是的点估计值的点估计值其中其中样本回归系数标准误样本回归系数标准误2、的置信区间的置信区间第十九页,本课件共有85页于是,可以得出:于是,可以得出:的的95%置信区间:置信区间:b t0.05(n-2)Sb的的99%置信区间:置信区间:b t0.01(n-2)Sb第二十页,本课件共有85页是是+x的点估计值的点估计值其中其中回归估计值标准误回归估计值标准误3、E(y)=+x 的置信区间第二十一页,本课件共有85页于是,可以得出:于是,可以得出:+x的的95%置信区
6、间:置信区间:+x的的99%置信区间:置信区间:第二十二页,本课件共有85页其中其中观测值观测值y的标准误的标准误4、单个、单个y 值值的置信区间的置信区间第二十三页,本课件共有85页于是可以得出:于是可以得出:y的的95%置信区间:置信区间:y 的的99%置信区间:置信区间:第二十四页,本课件共有85页二、加权回归(weighted regression)【例1.1】为了研究某品种水稻中蛋白质和赖氨酸含量的关系,把不同地区的水稻进行分组,每组抽测若干个样品的蛋白质和赖氨酸,结果如表1-1所示,进行回归分析。第二十五页,本课件共有85页mi样本数;样本数;xi、yi 均为平均数均为平均数。组号
7、12345678910mi35481174629xi8.90 8.41 9.80 8.09 9.00 10.22 8.56 8.78 10.08 9.90 yi0.283 0.320 0.276 0.299 0.267 0.255 0.290 0.295 0.263 0.270 表1-1 水稻蛋白质和赖氨酸测定结果 第二十六页,本课件共有85页 此例各组样本数不等,须以样本数此例各组样本数不等,须以样本数mi 为权进行加权回归分析。为权进行加权回归分析。第二十七页,本课件共有85页第二十八页,本课件共有85页第二十九页,本课件共有85页回归方程的建立于是于是回归方程回归方程第三十页,本课件共有
8、85页回归方程的显著性检验由于由于说明说明y与与x间存在极显著的线性关系,间存在极显著的线性关系,可以用所可以用所建立的回归方程来进行预测与控制。建立的回归方程来进行预测与控制。第三十一页,本课件共有85页决定系数决定系数表明回归方程估测可靠程度高。表明回归方程估测可靠程度高。回归方程估测可靠程度回归方程估测可靠程度第三十二页,本课件共有85页变异系数:变异系数:表明回归方程估测值相对偏离度较小。表明回归方程估测值相对偏离度较小。第三十三页,本课件共有85页三、有重复观察值的回归 t=b/sb或或F=MSR/MSr 显显著著表表明明相相对对于于其其它它因因素素、x的的高高次次项项及及试试验验误
9、误差差来来说说,因因素素x的的一一次次项项对对y的的影影响响是是主主要要的的,但但未未回回答答:影影响响y的的除除x外外是是否否还还有有其其它它不不可可忽忽略略的的因因素素,x与与y是是否否确确是是线线性性关关系系。也也就就是是说说,还还须须检检验验一一个个回回归归方方程程的的失失拟拟性性。这这个个问问题题可可以以通过做一些重复试验从而估计出真正的试验误差来解决。通过做一些重复试验从而估计出真正的试验误差来解决。第三十四页,本课件共有85页设设一个一个试验试验有有n个个处处理,其中理,其中x1、x2、xn-1重复重复1次,次,xn重复重复m次,次,观测结观测结果如下:果如下:x1x2xn-1x
10、nxn+1xn+m-1(xn=xn+1=xn+m-1)y1y2yn-1ynyn+1yn+m-1 m次重复次重复(一一)部分部分试验试验有重复的回有重复的回归归第三十五页,本课件共有85页对这一资料可按有对这一资料可按有(n+m-1)组观测值进行回归分组观测值进行回归分析。析。进行显著性检验时各项平方和与自由度计算如进行显著性检验时各项平方和与自由度计算如下:下:第三十六页,本课件共有85页 利用利用xn处理的处理的m个重复观测值,可以计算出反应个重复观测值,可以计算出反应真正的试验误差的平方和真正的试验误差的平方和称为纯误平方和相应的称为纯误平方和相应的自由度:自由度:纯误平方和纯误平方和纯误
11、自由度纯误自由度第三十七页,本课件共有85页失拟平方和及其自由度失拟平方和及其自由度此此时时,SSr-SSe反反映映除除x的的一一次次项项以以外外的的其其它它因因素素(包包含含别别的的因因素素和和x的的高高次次项项)所所引引起起的的变变异异,是是x的的一一次次项项所所未未能能拟拟合合的的部部分分,称称为为失失拟拟平平方方和和,记记为为SSLf,相应的自由度记为,相应的自由度记为dfLf。SSLf、dfLf计算公式如下:计算公式如下:SSLf=SSr-SSedfLf=(n+m-1)-2-(m-1)=n-2第三十八页,本课件共有85页SSrdfr或或SSLf+SSedfLf+dfe平方和与自由度的
12、划分式平方和与自由度的划分式第三十九页,本课件共有85页用统计量用统计量来检验回归方程的失拟性。来检验回归方程的失拟性。回归方程的失拟性检验回归方程的失拟性检验第四十页,本课件共有85页1、若若FLf显著显著(1)影响影响y除除x外,至少还有一个不可忽略外,至少还有一个不可忽略的因素;的因素;或或(2)y与与x是曲线关系;是曲线关系;或或(3)y与与x无关。无关。此时用此时用MSe 估计估计2。第四十一页,本课件共有85页可把可把SSLf 与与SSe 合并来检验合并来检验 SSR2.FLf不显著不显著第四十二页,本课件共有85页若若FLf不不显显著著,FR显显著著,则则称称回回归归方方程程是是
13、拟合得好的;拟合得好的;若若FLf不显著,不显著,FR也不显著:也不显著:1没有什么因素对没有什么因素对y有系统影响;有系统影响;或或2试验误差过大。试验误差过大。第四十三页,本课件共有85页3、FLf显著,显著,FR亦显著亦显著 说明所得的一元线性回归方程有一定说明所得的一元线性回归方程有一定作用,但不能说明此方程是拟合得好的,作用,但不能说明此方程是拟合得好的,需查明原因,选用别的数学模型,作进一需查明原因,选用别的数学模型,作进一步研究。步研究。第四十四页,本课件共有85页(二二)全部试验都有重复的回归全部试验都有重复的回归(等重复等重复)设一试验有设一试验有n个处理,每个处理重复个处理
14、,每个处理重复m次,观测结果如下:次,观测结果如下:第四十五页,本课件共有85页x ax1x2xaxnmmmmmyaiy11y12y1my21y22y2mya1ya2yamyn1yn2ynm第四十六页,本课件共有85页 此时,由此时,由xa、计算计算b、a,建立回归方,建立回归方程:程:回归方程的建立回归方程的建立第四十七页,本课件共有85页而其中其中第四十八页,本课件共有85页SSL f+SSedfLf+dfe平方和与自由度的划分式平方和与自由度的划分式第四十九页,本课件共有85页平方和和自由度的计算平方和和自由度的计算第五十页,本课件共有85页失拟性检验失拟性检验第五十一页,本课件共有85
15、页回归方程的显著性检验回归方程的显著性检验若若FLf不显著,则不显著,则第五十二页,本课件共有85页(三三)全部试验都有重复的回归全部试验都有重复的回归(不等重复不等重复)第五十三页,本课件共有85页设一试验有设一试验有n个处理,每个处理的重复数不等,分个处理,每个处理的重复数不等,分别为别为m1、m2、mn,观测结果如下:,观测结果如下:xax1x2xaxnmam1m2mamnyaiy11 y12 y1m1y21 y22 y2m2ya1 ya2 yama yn1 yn2 ynmn 第五十四页,本课件共有85页上表中:上表中:第五十五页,本课件共有85页此时,由此时,由xa、利用利用加权法加权
16、法计算计算b、a,建立,建立回归方程:回归方程:其中:其中:第五十六页,本课件共有85页平方和与自由度的划分式仍为:平方和与自由度的划分式仍为:SSLf+SSe dfLf +dfe第五十七页,本课件共有85页各项平方和与自由度的计算公式为:各项平方和与自由度的计算公式为:第五十八页,本课件共有85页第五十九页,本课件共有85页若若FLf不显著,则不显著,则第六十页,本课件共有85页例1-2已知观测结果如下,试进行回归分析a123456 xa49.049.349.549.850.050.2297.8ya116.616.816.816.917.017.0ya216.716.816.917.017.
17、117.116.6516.8016.8516.9517.0517.05101.35第六十一页,本课件共有85页这是一个有这是一个有6个处理,每个处理有个处理,每个处理有2个重复个重复观测值的资料,即观测值的资料,即n=6,m=2。进行回归分析。进行回归分析的具体步骤如下:的具体步骤如下:第六十二页,本课件共有85页1、作出散点图(scatter diagram)第六十三页,本课件共有85页2、利用xa、求b、a,建立回归方程因为因为第六十四页,本课件共有85页所以所以回归方程为回归方程为第六十五页,本课件共有85页3 3、进行显著性检验、进行显著性检验第六十六页,本课件共有85页平方和的计算平
18、方和的计算第六十七页,本课件共有85页当当m2时时=第六十八页,本课件共有85页自由度的计算自由度的计算dfy=nm-1=62-1=11;dfR=1;dfr=nm-2=62-2=10;dfe=n(m-1)=6(2-1)=6;dfLf=dfr dfe=n-2=6 2=4。第六十九页,本课件共有85页失拟性检验失拟性检验第七十页,本课件共有85页回归方程的显著性检验回归方程的显著性检验表明:表明:此线性回归模型与测得的数据是拟合得较此线性回归模型与测得的数据是拟合得较好的,回归方程估测可靠程度达好的,回归方程估测可靠程度达87.67%第七十一页,本课件共有85页四、两条回归直线的比较四、两条回归直
19、线的比较两条回归直线的比较包括二个内容:两条回归直线的比较包括二个内容:一是一是回归系数的比较回归系数的比较,判断这两条回归,判断这两条回归直直线是否平线是否平行;行;二是二是回归截距的比较回归截距的比较,判断这两条回归,判断这两条回归直直线与线与y 轴轴的交点是否相同。的交点是否相同。若经比较,两条回归若经比较,两条回归直直线平行,且与线平行,且与y轴交点相同,轴交点相同,则可将这两条回归则可将这两条回归直直线合并为一条回归线合并为一条回归直直线。线。第七十二页,本课件共有85页【例13】某试验研究变量某试验研究变量x和和y的关系,观测了两组试验数的关系,观测了两组试验数据,分别进行了直线回
20、归分析,有关统计数如据,分别进行了直线回归分析,有关统计数如表表1-6所所示。对这两条回归直线进行比较。若两个回归系数示。对这两条回归直线进行比较。若两个回归系数b1,b2和两个回归截距和两个回归截距a1,a2差异均不显著,建立共同差异均不显著,建立共同的回归方程。的回归方程。第七十三页,本课件共有85页(1)检验检验、差异是否显著差异是否显著(误差方差误差方差齐性检验齐性检验)(将较大的均方放在分子)(将较大的均方放在分子)(两尾两尾F检验检验)第七十四页,本课件共有85页查查两尾两尾F检验临界值表检验临界值表:两尾两尾F0.05(6,5)=6.98。表明表明与与差异不显著,可以将差异不显著
21、,可以将S1、S2合并估计共同的离回归标准误。合并估计共同的离回归标准误。第七十五页,本课件共有85页第七十六页,本课件共有85页(2)检验检验b1与与b2差异是否显著差异是否显著(检验两条回归直线是否平行检验两条回归直线是否平行)回归系数差异标准误回归系数差异标准误Ho:1=2,HA:12df=dfr(1)+dfr(2)=(n1-2)+(n2-2)第七十七页,本课件共有85页此例第七十八页,本课件共有85页表明两个回归系数表明两个回归系数b1、b2差异不显著,可以认差异不显著,可以认为这两条回归直线平行,并将两个回归系数为这两条回归直线平行,并将两个回归系数b1、b2合并,合并,合并回归系数
22、合并回归系数b 的计算公式如下:的计算公式如下:第七十九页,本课件共有85页此例第八十页,本课件共有85页回归截距差异标准误。回归截距差异标准误。df=dfr(1)+dfr(2)=(n1-2)+(n2-2)Ho:1=2,HA:12(3)检验a1与a2差异是否显著(检验两条回归直线与y轴的交点是否相同)第八十一页,本课件共有85页此例第八十二页,本课件共有85页表明两个回归截距表明两个回归截距a1、a2差异不显著差异不显著,可以认为,可以认为这两条回归线与这两条回归线与y轴的交点相同,并将两个回归截距合并,轴的交点相同,并将两个回归截距合并,合并回归回归截距合并回归回归截距计算公式为:计算公式为:第八十三页,本课件共有85页经经过过比比较较,两两条条回回归归直直线线平平行行,且且与与y轴轴的的交交点点相相同,可将两条回归同,可将两条回归直直线合并为一条回归线合并为一条回归直直线。线。第八十四页,本课件共有85页合并的回归方程合并的回归方程为为第八十五页,本课件共有85页