《高级生物统计优秀课件.ppt》由会员分享,可在线阅读,更多相关《高级生物统计优秀课件.ppt(85页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、高级生物统计第1页,本讲稿共85页(一)数学模型(一)数学模型其中:x预先确定,不受试验误差影响;y随x而变,且受试验误差影响;或 x、y都受试验误差的影响(x、y都为可观测的随机变量)第2页,本讲稿共85页总体回归截距,总体回归截距,总体回归系数,总体回归系数,i为随机变量,相互独立,且都服从为随机变量,相互独立,且都服从N(0,2)即即iN(0,2),E(i)=0,V(i)=2;yN(+x,2),E(y)=+x,V(y)=2第3页,本讲稿共85页(二)回归方程a估计估计b估计估计估计估计+x第4页,本讲稿共85页b、a的计算公式为:的计算公式为:其中第5页,本讲稿共85页离回归标准误,表示
2、回离回归标准误,表示回 归方程估测的偏离度归方程估测的偏离度离回归均方离回归均方第6页,本讲稿共85页(三)显著性检验第7页,本讲稿共85页1、t检验Ho:=0,HA:0回归系数标准误回归系数标准误其中:其中:第8页,本讲稿共85页2、F检验Ho:=0,HA:0平方和与自由度的划分式:平方和与自由度的划分式:第9页,本讲稿共85页SSyy的总平方和的总平方和,SSR 回归方平方和回归方平方和,SSr离回归平方和,离回归平方和,dfy=n-1y的总自由度的总自由度,dfR=1回归自由度回归自由度,dfr=n-2离回归自由度离回归自由度(剩余自由度剩余自由度)第10页,本讲稿共85页(舍入误差小)
3、舍入误差小)(便于推广便于推广)各项平方和的计算公式如下:第11页,本讲稿共85页可用可用 df1=1,df2=n-2来检验来检验 Ho:=0成立与否。成立与否。第12页,本讲稿共85页 在直线回归分析中,在直线回归分析中,F 检验与检验与t 检验等检验等价,这是因为价,这是因为t(n-2)与与F(1,n-2)有如下关系:有如下关系:也就是说,凡是也就是说,凡是F 检验中的大均方自由检验中的大均方自由度为度为1,则相应有一个与之等价的,则相应有一个与之等价的t 检验,检验,反之亦然。反之亦然。第13页,本讲稿共85页 相关系数r 表示x与y线性相关的性质与程度 将将 r 与与r0.05(n-2
4、)、r0.01(n-2)比比较较,进进行行显显著著性性检检验验,从从而推断而推断y与与x间是否存在线性关系。间是否存在线性关系。3、由相关系数由相关系数r的显著性检验进行判断的显著性检验进行判断第14页,本讲稿共85页(四)决定系数四)决定系数r2 决定系数决定系数r2决定系数决定系数r2表示回归方程估测的可靠程表示回归方程估测的可靠程度。度。第15页,本讲稿共85页(五)区间估计第16页,本讲稿共85页1、的置信区间的置信区间a是是的点估计值的点估计值其中其中样本回归截距标准误样本回归截距标准误第17页,本讲稿共85页于是,可以得出:于是,可以得出:的的95%置信区间:置信区间:at0.05
5、(n-2)Sa的的99%置信区间:置信区间:at0.01(n-2)Sa第18页,本讲稿共85页b是是的点估计值的点估计值其中其中样本回归系数标准误样本回归系数标准误2、的置信区间的置信区间第19页,本讲稿共85页于是,可以得出:于是,可以得出:的的95%置信区间:置信区间:b t0.05(n-2)Sb的的99%置信区间:置信区间:b t0.01(n-2)Sb第20页,本讲稿共85页是是+x的点估计值的点估计值其中其中回归估计值标准误回归估计值标准误3、E(y)=+x 的置信区间第21页,本讲稿共85页于是,可以得出:于是,可以得出:+x的的95%置信区间:置信区间:+x的的99%置信区间:置信
6、区间:第22页,本讲稿共85页其中其中观测值观测值y的标准误的标准误4、单个、单个y 值值的置信区间的置信区间第23页,本讲稿共85页于是可以得出:于是可以得出:y的的95%置信区间:置信区间:y 的的99%置信区间:置信区间:第24页,本讲稿共85页二、加权回归(weighted regression)【例1.1】为了研究某品种水稻中蛋白质和赖氨酸含量的关系,把不同地区的水稻进行分组,每组抽测若干个样品的蛋白质和赖氨酸,结果如表1-1所示,进行回归分析。第25页,本讲稿共85页mi样本数;样本数;xi、yi 均为平均数均为平均数。组号12345678910mi35481174629xi8.9
7、0 8.41 9.80 8.09 9.00 10.22 8.56 8.78 10.08 9.90 yi0.283 0.320 0.276 0.299 0.267 0.255 0.290 0.295 0.263 0.270 表1-1 水稻蛋白质和赖氨酸测定结果 第26页,本讲稿共85页 此例各组样本数不等,须以样本数此例各组样本数不等,须以样本数mi 为权进行加权回归分析。为权进行加权回归分析。第27页,本讲稿共85页第28页,本讲稿共85页第29页,本讲稿共85页回归方程的建立于是于是回归方程回归方程第30页,本讲稿共85页回归方程的显著性检验由于由于说明说明y与与x间存在极显著的线性关系,间
8、存在极显著的线性关系,可以用所建可以用所建立的回归方程来进行预测与控制。立的回归方程来进行预测与控制。第31页,本讲稿共85页决定系数决定系数表明回归方程估测可靠程度高。表明回归方程估测可靠程度高。回归方程估测可靠程度回归方程估测可靠程度第32页,本讲稿共85页变异系数:变异系数:表明回归方程估测值相对偏离度较小。表明回归方程估测值相对偏离度较小。第33页,本讲稿共85页三、有重复观察值的回归 t=b/sb或或F=MSR/MSr 显显著著表表明明相相对对于于其其它它因因素素、x的的高高次次项项及及试试验验误误差差来来说说,因因素素x的的一一次次项项对对y的的影影响响是是主主要要的的,但但未未回
9、回答答:影影响响y的的除除x外外是是否否还还有有其其它它不不可可忽忽略略的的因因素素,x与与y是是否否确确是是线线性性关关系系。也也就就是是说说,还还须须检检验验一一个个回回归归方方程程的的失失拟拟性性。这这个个问问题题可可以以通通过过做做一些重复试验从而估计出真正的试验误差来解决。一些重复试验从而估计出真正的试验误差来解决。第34页,本讲稿共85页设设一个一个试验试验有有n个个处处理,其中理,其中x1、x2、xn-1重复重复1次,次,xn重复重复m次,次,观测结观测结果如下:果如下:x1x2xn-1xnxn+1xn+m-1(xn=xn+1=xn+m-1)y1y2yn-1ynyn+1yn+m-
10、1 m次重复次重复(一一)部分部分试验试验有重复的回有重复的回归归第35页,本讲稿共85页对这一资料可按有对这一资料可按有(n+m-1)组观测值进行回归分组观测值进行回归分析。析。进行显著性检验时各项平方和与自由度计算如进行显著性检验时各项平方和与自由度计算如下:下:第36页,本讲稿共85页 利用利用xn处理的处理的m个重复观测值,可以计算出反应真个重复观测值,可以计算出反应真正的试验误差的平方和正的试验误差的平方和称为纯误平方和相应的自由称为纯误平方和相应的自由度:度:纯误平方和纯误平方和纯误自由度纯误自由度第37页,本讲稿共85页失拟平方和及其自由度失拟平方和及其自由度此此时时,SSr-S
11、Se反反映映除除x的的一一次次项项以以外外的的其其它它因因素素(包包含含别别的的因因素素和和x的的高高次次项项)所所引引起起的的变变异异,是是x的的一一次次项项所所未未能能拟拟合合的的部部分分,称称为为失失拟拟平平方方和和,记记为为SSLf,相相应应的自由度记为的自由度记为dfLf。SSLf、dfLf计算公式如下:计算公式如下:SSLf=SSr-SSedfLf=(n+m-1)-2-(m-1)=n-2第38页,本讲稿共85页SSrdfr或或SSLf+SSedfLf+dfe平方和与自由度的划分式平方和与自由度的划分式第39页,本讲稿共85页用统计量用统计量来检验回归方程的失拟性。来检验回归方程的失
12、拟性。回归方程的失拟性检验回归方程的失拟性检验第40页,本讲稿共85页1、若若FLf显著显著(1)影响影响y除除x外,至少还有一个不可忽略外,至少还有一个不可忽略的因素;的因素;或或(2)y与与x是曲线关系;是曲线关系;或或(3)y与与x无关。无关。此时用此时用MSe 估计估计2。第41页,本讲稿共85页可把可把SSLf 与与SSe 合并来检验合并来检验 SSR2.FLf不显著不显著第42页,本讲稿共85页若若FLf不不显显著著,FR显显著著,则则称称回回归归方方程程是是拟合得好的;拟合得好的;若若FLf不显著,不显著,FR也不显著:也不显著:1没有什么因素对没有什么因素对y有系统影响;有系统
13、影响;或或2试验误差过大。试验误差过大。第43页,本讲稿共85页3、FLf显著,显著,FR亦显著亦显著 说明所得的一元线性回归方程有一定作说明所得的一元线性回归方程有一定作用,但不能说明此方程是拟合得好的,需用,但不能说明此方程是拟合得好的,需查明原因,选用别的数学模型,作进一步查明原因,选用别的数学模型,作进一步研究。研究。第44页,本讲稿共85页(二二)全部试验都有重复的回归全部试验都有重复的回归(等重复等重复)设一试验有设一试验有n个处理,每个处理重复个处理,每个处理重复m次,次,观测结果如下:观测结果如下:第45页,本讲稿共85页x ax1x2xaxnmmmmmyaiy11y12y1m
14、y21y22y2mya1ya2yamyn1yn2ynm第46页,本讲稿共85页 此时,由此时,由xa、计算计算b、a,建立回归方,建立回归方程:程:回归方程的建立回归方程的建立第47页,本讲稿共85页而其中其中第48页,本讲稿共85页SSL f+SSedfLf+dfe平方和与自由度的划分式平方和与自由度的划分式第49页,本讲稿共85页平方和和自由度的计算平方和和自由度的计算第50页,本讲稿共85页失拟性检验失拟性检验第51页,本讲稿共85页回归方程的显著性检验回归方程的显著性检验若若FLf不显著,则不显著,则第52页,本讲稿共85页(三三)全部试验都有重复的回归全部试验都有重复的回归(不等重复
15、不等重复)第53页,本讲稿共85页设一试验有设一试验有n个处理,每个处理的重复数不等,分别为个处理,每个处理的重复数不等,分别为m1、m2、mn,观测结果如下:,观测结果如下:xax1x2xaxnmam1m2mamnyaiy11 y12 y1m1y21 y22 y2m2ya1 ya2 yama yn1 yn2 ynmn 第54页,本讲稿共85页上表中:上表中:第55页,本讲稿共85页此时,由此时,由xa、利用利用加权法加权法计算计算b、a,建立,建立回归方程:回归方程:其中:其中:第56页,本讲稿共85页平方和与自由度的划分式仍为:平方和与自由度的划分式仍为:SSLf+SSe dfLf +df
16、e第57页,本讲稿共85页各项平方和与自由度的计算公式为:各项平方和与自由度的计算公式为:第58页,本讲稿共85页第59页,本讲稿共85页若若FLf不显著,则不显著,则第60页,本讲稿共85页例1-2已知观测结果如下,试进行回归分析a123456 xa49.049.349.549.850.050.2297.8ya116.616.816.816.917.017.0ya216.716.816.917.017.117.116.6516.8016.8516.9517.0517.05101.35第61页,本讲稿共85页这是一个有这是一个有6个处理,每个处理有个处理,每个处理有2个重复个重复观测值的资料,
17、即观测值的资料,即n=6,m=2。进行回归分析。进行回归分析的具体步骤如下:的具体步骤如下:第62页,本讲稿共85页1、作出散点图(scatter diagram)第63页,本讲稿共85页2、利用xa、求b、a,建立回归方程因为因为第64页,本讲稿共85页所以所以回归方程为回归方程为第65页,本讲稿共85页3 3、进行显著性检验、进行显著性检验第66页,本讲稿共85页平方和的计算平方和的计算第67页,本讲稿共85页当当m2时时=第68页,本讲稿共85页自由度的计算自由度的计算dfy=nm-1=62-1=11;dfR=1;dfr=nm-2=62-2=10;dfe=n(m-1)=6(2-1)=6;
18、dfLf=dfr dfe=n-2=6 2=4。第69页,本讲稿共85页失拟性检验失拟性检验第70页,本讲稿共85页回归方程的显著性检验回归方程的显著性检验表明:表明:此线性回归模型与测得的数据是拟合得较好的,此线性回归模型与测得的数据是拟合得较好的,回归方程估测可靠程度达回归方程估测可靠程度达87.67%第71页,本讲稿共85页四、两条回归直线的比较四、两条回归直线的比较两条回归直线的比较包括二个内容:两条回归直线的比较包括二个内容:一是一是回归系数的比较回归系数的比较,判断这两条回归,判断这两条回归直直线是否平行;线是否平行;二是二是回归截距的比较回归截距的比较,判断这两条回归,判断这两条回
19、归直直线与线与y 轴轴的交点是否相同。的交点是否相同。若经比较,两条回归若经比较,两条回归直直线平行,且与线平行,且与y轴交点相同,则轴交点相同,则可将这两条回归可将这两条回归直直线合并为一条回归线合并为一条回归直直线。线。第72页,本讲稿共85页【例13】某试验研究变量某试验研究变量x和和y的关系,观测了两组试验数的关系,观测了两组试验数据,分别进行了直线回归分析,有关统计数如据,分别进行了直线回归分析,有关统计数如表表1-6所所示。对这两条回归直线进行比较。若两个回归系数示。对这两条回归直线进行比较。若两个回归系数b1,b2和和两个回归截距两个回归截距a1,a2差异均不显著,建立共同的回归
20、方程。差异均不显著,建立共同的回归方程。第73页,本讲稿共85页(1)检验检验、差异是否显著差异是否显著(误差方差齐性误差方差齐性检验检验)(将较大的均方放在分子)(将较大的均方放在分子)(两尾两尾F检验检验)第74页,本讲稿共85页查查两尾两尾F检验临界值表检验临界值表:两尾两尾F0.05(6,5)=6.98。表明表明与与差异不显著,可以将差异不显著,可以将S1、S2合并估计共同的离回归标准误。合并估计共同的离回归标准误。第75页,本讲稿共85页第76页,本讲稿共85页(2)检验检验b1与与b2差异是否显著差异是否显著(检验两条回归直线是否平行检验两条回归直线是否平行)回归系数差异标准误回归
21、系数差异标准误Ho:1=2,HA:12df=dfr(1)+dfr(2)=(n1-2)+(n2-2)第77页,本讲稿共85页此例第78页,本讲稿共85页表明两个回归系数表明两个回归系数b1、b2差异不显著,可以认为这差异不显著,可以认为这两条回归直线平行,并将两个回归系数两条回归直线平行,并将两个回归系数b1、b2合并,合并,合合并回归系数并回归系数b 的计算公式如下:的计算公式如下:第79页,本讲稿共85页此例第80页,本讲稿共85页回归截距差异标准误。回归截距差异标准误。df=dfr(1)+dfr(2)=(n1-2)+(n2-2)Ho:1=2,HA:12(3)检验a1与a2差异是否显著(检验两条回归直线与y轴的交点是否相同)第81页,本讲稿共85页此例第82页,本讲稿共85页表明两个回归截距表明两个回归截距a1、a2差异不显著差异不显著,可以认为,可以认为这两条回归线与这两条回归线与y轴的交点相同,并将两个回归截距合并,轴的交点相同,并将两个回归截距合并,合并回归回归截距合并回归回归截距计算公式为:计算公式为:第83页,本讲稿共85页经经过过比比较较,两两条条回回归归直直线线平平行行,且且与与y轴轴的的交交点点相相同同,可将两条回归可将两条回归直直线合并为一条回归线合并为一条回归直直线。线。第84页,本讲稿共85页合并的回归方程合并的回归方程为为第85页,本讲稿共85页