《第五章统计推断.doc》由会员分享,可在线阅读,更多相关《第五章统计推断.doc(15页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五章 统计推断 总体与样本之间的关系-从总体到样本的研究。-由样本推断总体:样本统计量的分布规律一般是正态分布、t 分布、c2分布和F分布。 对总体做统计推断的两种途径 先对所估计的总体做一假设,然后通过样本数据推断这个假设是否接受,这种途径称为统计假设检验(statistical test of hypothesis) 通过样本统计量估计总体参数,称为总体参数估计(estimation of population parameter) 本章重点讲解统计推断的一般原理以及对总体平均数及标准差的推断。一、假设检验假设检验就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种被此对
2、立的假设,然后由样本的实际结果,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。如果抽样结果使小概率发生,则拒绝假设,如抽样结果没有使小概率发生,则接受假设。小概率原理在一次试验中,某事件几乎是不会发生的,若根据一定的假设条件计算出来的该事件发生的概率很小,而在一次试验中它竟然发生了,则可认为原假设条件不正确,给予否定。在生物统计的显著性检验中,通常取5%或1%小概率为显著性水平,记为“a”例5.1 根据以往的经验,用一般疗法治疗某种疾病,其死亡率为40,治愈率为60。今用一种新药治疗染上该病的6名患者,这6人均治愈了,问该新药是否显著优于一般疗法? 小概率原理用于显著性检验例5
3、.2用实验动物作实验材料,现从一批动物(s = 0.4)中抽取含量n = 10的样本并已经计算出平均值为10.23 g。已知这批动物饲养时间较长,不可能小于10g,问此批动物材料是否是抽自于=10的总体中? 解:1 样本平均数满足何种分布?2 从正态分布表查出P = 0.03438 m0,如下左图。 下尾检验(lower tailed test):拒绝H0后,接受m m0,故为上尾单侧检验,当m m0.05时拒绝H0,a=0.05的上侧分位数m0.05=1.645。4、结论:因为m m0.05所以拒绝H0,接受HA.上述样本很可能不是抽自 N (377.2,3.32)的总体,抽出样本的那个总体
4、的平均数是大于377.2的某个值,即栽培条件的改善显著提高了豌豆籽粒重量。5.1.2 s未知时平均数显著性检验:t检验例5.5 母猪的怀孕期为114天,今抽测10头母猪的怀孕期分别为116、115、113、 112、114、117、 115、 116、 114、 113(天),试检验所得样本的平均数与总体平均数114天有无显著差异? 根据题意,本例应进行双侧t检验。1、提出无效假设与备择假设2、计算t值 3、查临界t值,作出统计推断由df=9,查t值表(附表3)得t0.05(9)=2.262,因为|t|0.05, 故不能否定H0:m = 114, 表明样本平均数与总体平均数差异不显著,可以认为
5、该样本取自母猪怀孕期为114天的总体。 5.1.3 变异性的显著性检验:c2检验例5.6 一个混杂的小麦品种,株高标准差s0 =14cm,经提纯后随机抽取10株,它们的株高为:90, 105, 101, 95, 100, 100, 101, 105, 93, 97, 考察提纯后的群体是否比原群体整齐?1、小麦株高是服从正态分布的随机变量2、提出假设关于备择假设的说明:小麦经提纯后只能变得更整齐,绝不会更离散,即s只能小于s0,因此HA:s s0 。3、显著性水平规定a0.054、统计量的值:5、建立的拒绝域:因HA:s s0 ,故为下尾单侧检验,当c2c21-a时拒绝H0 ,从附表6中可以查出
6、c29,0.99 = 2.096、结论,因c2 s2 若已知s1不可能小于s2 。HA : s1 s2和s1 s2,上尾单侧检验,F Fa时拒绝s1 s2,下尾单侧检验,F Fa/2 及F F1a/2时拒绝。6 作出结论并解释。例5.7 测定了20位青年男子和20位老年男子的血压值(收缩压mmHg)如下表所示。问老年人血压值个体间的波动是否显著高于青年人?解:根据检验的基本程序:(1)人类血压值是服从正态分布的随机变量,而且上述两样本是独立获得的。(2)假设:H0:1=2 HA:12(由于老年人的血压值波动只会大于青年人,单侧)(3)显著性水平:根据问题的要求(是否显著),选=0.05。(4)
7、统计量的值:Fdf1,df2=S12/s22,根据表中数据计算可得S12=193.4,s22=937.7,故F=0.206。(5)建立H0的拒绝域: 由于HA:12,故为下尾单侧检验,当FF0.95时拒绝H0。查表可得F19,19,0.95=1/ F19,19,0.05=0.459(6)结论:F2(2)确定显著性水平:=0.05。(3)计算统计量。(4)建立H0的拒绝域:因HA:12,故为上尾单侧检验。当uu0.05时拒绝H0,由附表查出u0.05=1.645。5.2.3 标准差(i)未知,但相等时,两个平均数间差异显著性的检验成组数据t检验检验程序与5.2.2基本相同,只是所使用的统计量不同
8、,当两个总体的标准差相等时,检验统计量t由下式给出: 在H0:1=2下变为在平均数检验中应用最为广泛。先做方差齐性检验(F-双侧检验)判断i 是否相等;按上式计算统计量t,进行t检验以判断两个平均数之间差异是否显著。例 5.9 研究两种激素类药物对肾组织切片的氧消耗的影响,结果是:研究第一种药物的样本数为9,平均数为27.92,样本方差为8.673。研究第二种药物的样本数为6,平均数为25.11,样本方差为1.843。问两种药物对肾组织切片氧消耗的影响差异是否显著?解:第一步,做方差齐性检验: H0:1=2,HA:12 ,=0.05 F8,5=8.673/1.843=4.71,F8,5,0.0
9、25=6.757F8,5,0.975=1/4.817=0.208, F8,5,0.975F t0.05,结论是在=0.05水平上两种药物对肾组织切片氧消耗的影响刚刚达到显著。4.2.4 标准差(i )未知且可能不相等时, 两个平均数间差异显著性的检验 若经F(双尾)检验,发现12可用Aspin-Welch检验,近似t检验。例5.10 两组类似的大鼠,一组做对照,另一组做药物处理,然后测定血糖。已知对照组的样本数为12,平均数为109.17,样本方差为97.430。经过催产素药物处理组的样本数为8,平均数为106.88,样本方差为7.268。问药物对大鼠血糖含量的影响是否显著?解:第一步,做方差
10、齐性检验:H0:1=2,HA: 12 ,=0.05F11,7=97.430/7.268=13.41 ,F11,7,0.025=4.714(如何查?)FF0.025,结论是方差不具齐性(12)第二步,做平均数之间的差异显著性检验。 H0:1=2,HA: 12 ,=0.05;计算df=13.35,统计量 t=0.76。 用线性内插法(如何查?)可以求出t13.35,0.05(双侧)=2.15,tt0.01(9),P0.01,否定H0,接受HA,表明家兔注射该批注射液前后体温差异极显著,这里表现为注射该批注射液可使体温极显著升高。4.2.6 配对法与成组法的比较平均数及样本含量均相同的条件下,s愈小
11、 则t值愈大配对法比成组法更容易检出两组数据平均数之间的差异。在条件许可的情况下,尽量把实验安排成配对法做比较。EX5.4根据多年的资料,某杂交黑麦从播种到开花的天数的标准差为6.9d现在相同试验条件下采取两种方法取样调查,A法调查400株,得出从播种到开花的平均天数为69.5d,B法调查200株,得出从播种到开花的平均天数为70.3d,试比较两种调查方法所得黑麦从播种到开花的天数有无显著差别?解题过程:EX 5.6解题思路 首先进行方差齐性检验,用F检验。 用方差大的作为分子,方差小的作为分母。 查F检验的临界值F表。 根据方差齐性与否决定用何种公式。解题过程方差齐性检验,F检验方差不齐这两
12、个品种蛋白质的含量差异显著。成对数据平均数比较EX 5.7 在研究饮食中缺乏维生素E与肝中维生素A的关系时,将试验动物按性别、体重等配成8对,并将每对中的两头试验动物用随机分配法分配在正常饲料组和维生素E缺乏组,然后将试验动物杀死,测定其肝中的维生素A的含量,其结果如表4-l,试检验两组饲料对试验动物肝中维生素A含量的作用是否有显著差异。表4-l小结一、名词解释假设检验(显著性检验) 无效假设 备择假设 显著水平 型错误 型错误 双侧检验(双尾检验) 单侧检验(单尾检验) 成组设计 配对设计二、简答题1、显著性检验的基本步骤是什么?根据什么确定显著水平?2、什么是统计推断?为什么统计推断的结论
13、有可能发生错误?有哪两类错误?如何降低犯两类错误的概率?3、配对试验设计与成组试验设计有何区别?三、计算题 1、随机抽测了10只兔的直肠温度,其数据为:38.7、39.0、38.9、39.6、39.1、39.8、38.5、39.7、39.2、38.4(),已知该品种兔直肠温度的总体平均数=39.5(),试检验该样本平均温度与总体是否存在显著差异? 2、给幼鼠喂以不同饲料,研究每日钙的留存量(mg)是否有显著不同,以两种方式设计本实验。第一种方式:同一鼠先后喂予不同饲料。第二种方式,甲组12只喂A饲料,乙组9只喂B饲料。以a=0.05的水平,检验每种方式中,两种不 同饲料钙的留存量差异是否显著。并对结果加以解释。第 15 页