《2014年生物统计学总结.pdf》由会员分享,可在线阅读,更多相关《2014年生物统计学总结.pdf(23页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、一、生物统计学的思路及作用一、生物统计学的思路及作用 总体总体 样本样本 抽抽样样 参数参数 抽抽样样分分布布理理论论 个体的个体的异质性异质性 随机性随机性 误误差差 条件的条件的异质性异质性 实验设计原实验设计原理与方法理与方法 抽样调查的抽样调查的原理与方法原理与方法 统计量统计量 统统计计推推断断 误误差差理理论论 实实验验设设计计 二、生物统计学的主要内容二、生物统计学的主要内容 1.1.误差理论与实验设计误差理论与实验设计 2.2.抽样分布理论抽样分布理论 3.3.假设检验原理与方法假设检验原理与方法 4.4.方差分析的原理与方法方差分析的原理与方法 5.5.一一元回归分析的原理与
2、方法元回归分析的原理与方法 6.6.一一元相关分析元相关分析的原理与的原理与方法方法 1.1.误差理论与实验设计误差理论与实验设计 误差理论:误差理论:不可避免不可避免,但服从但服从N(0,2),可通过),可通过科学的实验设计对误差进行科学的实验设计对误差进行控制控制和和估计估计;误差的概念、来源、估计误差的概念、来源、估计 误差与重复、误差与精确度关系;误差与重复、误差与精确度关系;抽样调查的原理与方法抽样调查的原理与方法样本容量估计与方法样本容量估计与方法 实验设计的原理与方法实验设计的原理与方法基本要求、要素、原则基本要求、要素、原则 常用的实验设计方法常用的实验设计方法随机区组和正交试
3、验设计随机区组和正交试验设计 正交实验设计的原理与步骤正交实验设计的原理与步骤 (1 1)确定因素数和水平数)确定因素数和水平数 (2 2)选用合适的正交表)选用合适的正交表 (3 3)表头设计)表头设计 (4 4)列出试验方案)列出试验方案 (5 5)实验实施)实验实施 (6 6)结果分析)结果分析 正交设计是利用正交设计是利用正交表正交表从试验的全部水平组合中,从试验的全部水平组合中,挑选挑选部分有代表性的水平组合部分有代表性的水平组合,并借助正交表,并借助正交表,通过对部通过对部分试验结果的分析,分试验结果的分析,找出实验的最优水平组合的一种找出实验的最优水平组合的一种不完全方案的实验设
4、计方法不完全方案的实验设计方法。2.抽样分布理论的主要知识点抽样分布理论的主要知识点 常见变量的概率分布类型及其关系常见变量的概率分布类型及其关系 二项分布二项分布 泊松分布泊松分布 正态分布正态分布 样本统计量样本统计量的抽样分布的抽样分布:U/t/:U/t/2 2/F/F分布分布 适用条件、特征数适用条件、特征数 与与正态分布的关系正态分布的关系 正态分布的标准化正态分布的标准化 (1 1)样本均数的抽样分布类型)样本均数的抽样分布类型 nx/stdfnxxt/2Se)(221dfn/S-dtdddf)n,(Nx2)nn,(Nx-x2221212121)n,(d2ddNbN(,2/SSx)
5、S Sr r2 2 2 2 xdfSSbt/S-r(2 2)样本频率的抽样分布类型)样本频率的抽样分布类型 )30qn,pn,qn,pn5(/)(n5.0-n5.0)(U)30qn,pn,qn,pn(/)()(U22221111222111212121222211112221112121nqpnqpppppnqpnqppppp)30nq,np5(/pq5.0ppU)30nq,np(/pqppUnnppnpppp)pq,p(Nnp)nqpnqp,pp(N-2221112121pp(3 3)样本方差的抽样分布类型)样本方差的抽样分布类型 2221222)(Udfsxniiidf2222222212
6、1121)1()1(SnSn22212,1dfdfF222,121ssFdfdf)11;5()5.0()21;5()(2222kdfEEEOkdfEEEOici=?H0:;HA:12 统统计计推推断断 小概率原理小概率原理 构建并计算合适的构建并计算合适的检验统计量检验统计量 找找概率概率 设定小概率标准设定小概率标准 误差误差 1=2?H H0 0条件下,依据条件下,依据抽样分布抽样分布 接受接受H H0 0 拒绝拒绝H H0 0 接受接受HA 概率概率 21xx 推断推断 P P 3.假设检验假设检验(1)基本原理)基本原理 3.假设检验假设检验(2 2)假设检验)假设检验的两类的两类错误
7、错误 型错误型错误/错误错误:H H0 0不成立,假设检验却接受了它,不成立,假设检验却接受了它,就犯了“纳伪”就犯了“纳伪”错误。错误。即把真实差异错判为非真实差异即把真实差异错判为非真实差异。I I型错误型错误/错误错误 :真实情况为真实情况为H H0 0成立(即小概率事件成立(即小概率事件真实发生了),根据小概率原理却否定了它,就犯了真实发生了),根据小概率原理却否定了它,就犯了“弃真”错误。即把非真实差异(“弃真”错误。即把非真实差异(误差误差)错判为真实差)错判为真实差异(异(两总体的本质差异两总体的本质差异)。仅在仅在拒绝拒绝H H0 0时时有可能犯错有可能犯错,犯错概率犯错概率p
8、p。仅在接受仅在接受H H0 0时有可能犯错,犯错概率不确定,但与小时有可能犯错,犯错概率不确定,但与小概率标准、两事物的本质差异及样本容量大小有关。概率标准、两事物的本质差异及样本容量大小有关。x2 2 2 x1 22H0接受域接受域()(),()()(-),()(),犯弃真错误的概率与犯弃真错误的概率与有关有关 犯纳伪错误的概率犯纳伪错误的概率 21xx 实际原则实际原则:保证弃真:保证弃真错误概率一定的情况错误概率一定的情况下下,尽可能,尽可能减小犯纳减小犯纳伪错误的伪错误的概率。概率。(3 3)减少统计推断)减少统计推断犯犯错概率的方法错概率的方法 若一个试验耗费大,试验结论的使用事关
9、重大若一个试验耗费大,试验结论的使用事关重大,可靠性要求高,可靠性要求高,值应取小些;值应取小些;对于一些试验条件不易控制,则对于一些试验条件不易控制,则值应大一些值应大一些;(2 2)减小标准误)减小标准误减少犯减少犯错误的概率;错误的概率;(1 1)设定合适的显著水平)设定合适的显著水平减少犯减少犯错误概率;错误概率;22122x1xnn标准误21尽可能增大样本容量尽可能增大样本容量 4.4.方差分析方差分析的基本原理与应用小结的基本原理与应用小结 数据作为一个整体数据作为一个整体 总变异总变异 处理效应处理效应/组间差异组间差异 误差效应误差效应/组内差异组内差异(1)基本)基本指导思想
10、指导思想 (2)基本)基本假定假定)2,0(服从正态分布误差*Nij正态性正态性(normality)同质性同质性(homogeneity))()-(*ii-ijijxx可加性可加性(additivity)梯形法和字母标记法显示结果梯形法和字母标记法显示结果 多重比较多重比较(LSD法,法,Ducan 法、法、SNK)(4)基本)基本步骤步骤;自由度分布与计算:平方和分解与计算:teTTdfdfdfSSeSStSS2e2tS,S方差计算:22222,/)/(值计算:FeeettdfdftsnsFe22,etdfdftssFe012)(2:0HkittTeBABABATSSSSSSSSSSSSS
11、SSSSStSSeSStSStBA2jB2iA2ijSSSSC-Tan1SSC-Tbn1SSC-Tn1SSt;)1()1)(1(1111nabdfbadfbdfadfabkdfdfdfdfdfdfdfdfeBABAtBABAtetT(5 5)两)两因素因素有重复观测值有重复观测值的方差分析的方差分析 (平方和和自由度的分解)(平方和和自由度的分解)BATeijTetTSSSSSSSSCXSSSSSSSSC-Ta1SSC-Tb1SS;2jB2iA2)1b()1-a(111abeBATetTdfbdfadfdfdfdfdf(6 6).两因素两因素无重复无重复观测值观测值/单因素区组实验单因素区组实
12、验设计设计的方差分析(的方差分析(平方和和自由度的分解)平方和和自由度的分解)变量变量Y Y和和X X的线性关系为:的线性关系为:iiixy图图1212-5.5.雏鹅重与雏鹅重与7070日龄重的关系日龄重的关系 5.5.一一元线性回归分析的原理元线性回归分析的原理 Y.XY.X =+x+xi i (为回归系数为回归系数)xbay 2iiix.y)()(xxyyxxbxbya(1 1)两变量直线回归关系显著性的)两变量直线回归关系显著性的F F检验检验 图图1212-4 4 依变量依变量y y变异来源的分解图变异来源的分解图 )(总 变 异yy自变量自变量x x对对y y的影的影响响回归变异回归
13、变异 误差导致散点误差导致散点偏离回归线偏离回归线 )(yy)(yy2R)y-y(SS2e/r)y(SSy1dfR2-ndfr2/)(1/)(MS22剩余回归nyyyyMSF(2 2)两变量直线回归关系显著性的)两变量直线回归关系显著性的t t检验检验 bxSbSSbt-/S-r2-ndfr给定给定n n对(对(x xi i,y yi i),),就可以求得一个就可以求得一个b by.xy.x b by.xy.x是样本统计量,是样本统计量,是一个随机变量是一个随机变量 bNbN(,2 2/SSxSSx))1,0(/-bU2NSSxS Sr r2 2 2 2 HO:=0 xSSbt/Sr2-ndf
14、r统计推断统计推断 05.0pt05.0,2nt 0 0,变量,变量x x和和y y真实相关真实相关 6 6、一元直线相关分析一元直线相关分析 相关主要针对两个互为因果关系的变量间的相关性。相关主要针对两个互为因果关系的变量间的相关性。yxy2iiiy.xSSSP)yy()(yyxxbxxy2iiix.ySSSP)()(xxyyxxb若若x x为自变量,为自变量,y y对对x x的回归的回归 若若y y为自变量,为自变量,x x对对y y的回归的回归 决定系数决定系数 yx2xy2i2i2iiy.xx.y2SSSSSP)yy()xx(】)(【ryyxxbb相关系数相关系数r yxxy2i2ii
15、iSSSSSP)yy()xx(】)(【ryyxx在资料要求上,回归要求因变量在资料要求上,回归要求因变量Y Y服从正态分服从正态分布;布;X X可以是精确测量和严格控制的变量(非可以是精确测量和严格控制的变量(非随机变量),一般称为随机变量),一般称为I I型回归型回归。相关要求两个变量相关要求两个变量X X、Y Y均服从正态分布。这均服从正态分布。这种资料若进行回归分析称为种资料若进行回归分析称为型回归型回归。可以计。可以计算两个回归方程。算两个回归方程。应用上,存在依存关系的两变量的关系用回归,应用上,存在依存关系的两变量的关系用回归,存在双向的依存关系的变量间用相关。存在双向的依存关系的变量间用相关。直线相关与回归的区别直线相关与回归的区别 对对一组数据若同时计算一组数据若同时计算r r与与b b,它们的正负,它们的正负号号是一致是一致的。的。r r为正号说明两变量间的相为正号说明两变量间的相互关系互关系同向同向变化的。变化的。b b为正说明为正说明X X增增(减减)一一个单位,个单位,Y Y平均平均增增(或减或减)b)b个单位个单位。r r和和b b的假设检验是等价的假设检验是等价的。的。回归回归与相关分析结果可互相解释。与相关分析结果可互相解释。直线相关与回归的联系直线相关与回归的联系