《生物统计学第四章抽样分布幻灯片.ppt》由会员分享,可在线阅读,更多相关《生物统计学第四章抽样分布幻灯片.ppt(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、生物统计学第四章抽生物统计学第四章抽样分布样分布第1页,共36页,编辑于2022年,星期一2第四章抽样分布第四章抽样分布第2页,共36页,编辑于2022年,星期一3抽样分布抽样分布n n 研究总体与从中抽取的样本之间总体与从中抽取的样本之间的关系的关系是统计学的中心内容。n n生物统计学的最基本问题是研究总体和样本间的关系。n n总体类型:(1)实际研究对象所构成的总体(2)数字的总体第3页,共36页,编辑于2022年,星期一4n n对这种关系(总体与样本)的研究可从两方面着手:一是从总体到样本从总体到样本,这就是研究抽样分布的问题;二是从样本到总体从样本到总体,这就是统计推断问题。n n统计
2、推断是以总体分布和样本抽样分布的理论关系为基础的。抽样分布抽样分布第4页,共36页,编辑于2022年,星期一5总体随机样本1234无穷多个样本总体和样本的关系示意图第5页,共36页,编辑于2022年,星期一6总体与样总体与样本间的关本间的关系系从总体从总体到样本到样本从样本到从样本到总体总体统计推统计推断断(目的目的)抽样分布(基础)抽样分布抽样分布本章研究的内容就是:从总体到样本(抽样分布)第6页,共36页,编辑于2022年,星期一7n n抽样分布全部建立在正态分布的基础之上(在正态分布的总体中抽样)。n n平均数的抽样分布对总体正态性的要求不十分严格。(根据中心极限定理,从非正态分布的总体
3、中抽取的含量为n的样本,当n充分大时,样本平均数渐近服从正态分布)n n方差的抽样分布对总体正态性的要求十分严格。抽样分布抽样分布第7页,共36页,编辑于2022年,星期一841 从一个正态总体分布从一个正态总体分布中抽取的样本统计量的分中抽取的样本统计量的分布布第8页,共36页,编辑于2022年,星期一9一、样本平均数的抽样及其分布一、样本平均数的抽样及其分布n n如果从容量为如果从容量为N的有限总体抽样,若每次抽取容量为n的样本,那么一共可以得到Nn个样本。个样本。n n每个样本可以计算一个平均数,这样就得到许多每个样本可以计算一个平均数,这样就得到许多 平均数,平均数,如果将这些平均数集
4、合起来便构成一个新总体。由于每如果将这些平均数集合起来便构成一个新总体。由于每次随机抽样所得的平均数可能会存在差异,所以由平均次随机抽样所得的平均数可能会存在差异,所以由平均数构成的新总体也应该有其分布,这种分布称为数构成的新总体也应该有其分布,这种分布称为平均数平均数的抽样分布的抽样分布。第9页,共36页,编辑于2022年,星期一10n n下面用一个抽样实验进一步说明样本平均数的抽样分布及其分布的参数。n n假定用一个很小的总体N=3,其观察值为2、4、6以样本容量n=2从中进行抽样。n n首先计算出总体参数:n n=(2+4+6)/3=4n n2=(2-4)(2-4)2+(4-4)+(4-
5、4)2 2+(6-4)+(6-4)2 2/3=8/3n n所有可能的样本数所有可能的样本数=NNn n=32 2=9第10页,共36页,编辑于2022年,星期一11总体总体N=3N=3,样本容量,样本容量n=2n=2时所有样本的总和数、平均数和方差表时所有样本的总和数、平均数和方差表 第一个第一个观察值观察值第二个第二个观察值观察值样本(y)s2s2 22 22 22 24 42 20 00 00.0000.0000 02 24 42 24 46 63 31 12 21.4141.4142 22 26 62 26 68 84 44 48 82.8282.8284 44 42 24 42 26
6、63 31 12 21.4141.4142 24 44 44 44 48 84 40 00 00.0000.0000 04 46 64 46 610105 51 12 21.4141.4142 26 62 26 62 28 84 44 48 82.8282.8284 46 64 46 64 410105 51 12 21.4141.4142 26 66 66 66 612126 60 00 00.0000.0000 0总总 和和727236361212242411.31311.3136 6第11页,共36页,编辑于2022年,星期一12从表中我们可以算出从表中我们可以算出样本平均数样本平均数
7、的平均数:的平均数:以自由度为除数的样本方差的平均数:以样本容量为除数的样本方差的平均数:第12页,共36页,编辑于2022年,星期一13样本标准差s的平均数:在统计上,如果所有可能样本的某一统计数等于总体的相应参数,则称该统计数为总体相应参数的无偏估计值无偏估计值(unbiased estimate)第13页,共36页,编辑于2022年,星期一143、以n为除数的样本方差 不是2的无偏估计值。4、s不是的无偏估计值。1、是的无偏估计值。2、s2是2的无偏估计值。第14页,共36页,编辑于2022年,星期一15标准差已知时的平均数分布标准差已知时的平均数分布变量是正态的或近似正态的,则标准化的
8、变量服从或近似服从N(0,1)分布。如果整体是非正态分布,当n足够大的时,其样本平局数还是服从正态分布。第15页,共36页,编辑于2022年,星期一16标准差未知时的平均数分布标准差未知时的平均数分布第16页,共36页,编辑于2022年,星期一17标准差未知时的平均数分布标准差未知时的平均数分布nn自由度(df):自由度是指独立观测值的个数,在计算s时所使用的n个观测值受到平均值的约束,这就等于有一个观测值不能独立取值,因此自由度df=n-1。第17页,共36页,编辑于2022年,星期一18第18页,共36页,编辑于2022年,星期一19二、方差的抽样及其分布n n从方差为2 正态总体中,急速
9、抽取含量为n的样本,计算样本方差s2。在讨论样本方差的分布时,通常并不直接谈论s2而是给他先标准化:这个变量就是服从n-1个自由度的卡方分布(2 distribution)。第19页,共36页,编辑于2022年,星期一20其密度函数为:第20页,共36页,编辑于2022年,星期一21如何查表,附表如何查表,附表6.第21页,共36页,编辑于2022年,星期一2242 从两个正态总体分布从两个正态总体分布中抽取的样本统计量的分中抽取的样本统计量的分布布第22页,共36页,编辑于2022年,星期一23一、标准差已知时,两个平均数的和与差的分布第23页,共36页,编辑于2022年,星期一24如果两个
10、总体都是正态分布,则有标准化第24页,共36页,编辑于2022年,星期一25二、标准差未知时,两个平均数的和与差的分布第25页,共36页,编辑于2022年,星期一26三、两个样本方差比的分布第26页,共36页,编辑于2022年,星期一27F分布的概率密度曲线图分布的概率密度曲线图如何查表,附表如何查表,附表7.第27页,共36页,编辑于2022年,星期一28例题例题例例1:某类药物产品的有效性服从正态分:某类药物产品的有效性服从正态分布,其总体平均数为布,其总体平均数为100,总体标准差为,总体标准差为5.现从该总体中抽取一个容量为现从该总体中抽取一个容量为25的简单随机的简单随机样本,求这一
11、样本的样本平均数介于样本,求这一样本的样本平均数介于99101的概率。的概率。第28页,共36页,编辑于2022年,星期一29例题例题例例2:某次测量老鼠的体重,其服从正态分布,:某次测量老鼠的体重,其服从正态分布,其总体平均数为其总体平均数为100,样本标准差为,样本标准差为4。现从。现从该总体中抽取一个容量为该总体中抽取一个容量为16的简单随机样本,的简单随机样本,求问其样本平均数服从怎么样的分布。如果求问其样本平均数服从怎么样的分布。如果样本容量是样本容量是64呢?如果样本容量是呢?如果样本容量是64,样本,样本平均数大于平均数大于102 的概率有多大?的概率有多大?第29页,共36页,
12、编辑于2022年,星期一30例题例题例例3:已知男生智商平均数为:已知男生智商平均数为100,方差为,方差为64,女生智商平均为,女生智商平均为102,方差为,方差为49.现随机现随机抽取抽取25男生和男生和16名女生进行智力测验,问名女生进行智力测验,问两个样本平均数之差两个样本平均数之差(男生男生-女生女生)介于介于13之间的概率是多少?之间的概率是多少?第30页,共36页,编辑于2022年,星期一31例题例题例例4:某次试验欲采购一批药品,已知两:某次试验欲采购一批药品,已知两个公司的产品的使用寿命分别为个公司的产品的使用寿命分别为1270小时小时和和1260小时,样本方差分别为小时,样
13、本方差分别为802和和942,现,现从该两个公司的产品中各自抽取从该两个公司的产品中各自抽取50个样本进个样本进行寿命检验。假设两者之间没有显著性差行寿命检验。假设两者之间没有显著性差别。那么,两公司的样本平均数使用寿命别。那么,两公司的样本平均数使用寿命之差(第一个公司之差(第一个公司-第二个公司)服从怎么第二个公司)服从怎么样的分布呢?样的分布呢?第31页,共36页,编辑于2022年,星期一32例题例题例例6:某实验室让一组:某实验室让一组10人用第一种工艺进人用第一种工艺进行试验,方差为行试验,方差为25;让另一组;让另一组10人用第二种人用第二种工艺进行试验,方差为工艺进行试验,方差为
14、144。现假定工作时。现假定工作时间服从正态分布,两个总体平均数相等,间服从正态分布,两个总体平均数相等,两总体方差有显著性差别。问;两种工艺两总体方差有显著性差别。问;两种工艺平均数用时之差服从怎样的分布呢?平均数用时之差服从怎样的分布呢?第32页,共36页,编辑于2022年,星期一第33页,共36页,编辑于2022年,星期一第34页,共36页,编辑于2022年,星期一第35页,共36页,编辑于2022年,星期一36总结总结n n从一个正态总体中抽取样本:样本平均数的分布与正态分布、t分布有关。样本方差的分布与卡方分布有关。n n从两个正态总体中抽取样本:两个平均数的和与差,与正态分布、t分布有关。两个样本方差比的分布,与F分布有关。第36页,共36页,编辑于2022年,星期一