《第四章抽样及分布药学精选文档.ppt》由会员分享,可在线阅读,更多相关《第四章抽样及分布药学精选文档.ppt(27页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章抽样及分布药学本讲稿第一页,共二十七页 通过抽取总体中的部分通过抽取总体中的部分(样本样本)进行观察获得数据进行观察获得数据(抽样),并通过这些数据对总体进行推断。(抽样),并通过这些数据对总体进行推断。一、数理统计研究的问题一、数理统计研究的问题(1)(1)怎样设计试验,决定观察的数目;怎样设计试验,决定观察的数目;(2)(2)怎样利用试验观察的结果作出一个怎样利用试验观察的结果作出一个“好好”的推断的推断等。等。第一个问题是怎样进行抽样,使抽得的样本更合理第一个问题是怎样进行抽样,使抽得的样本更合理,并有更好并有更好的代表性?这是的代表性?这是抽样方法和试验设计抽样方法和试验设计问题
2、问题.第二个问题是怎样从取得的样本去推断总体?这种推断具第二个问题是怎样从取得的样本去推断总体?这种推断具有多大的可靠性?这是有多大的可靠性?这是统计推断统计推断问题问题.本讲稿第二页,共二十七页统计方法具有统计方法具有“部分推断整体部分推断整体”的特征的特征 .因为从一小部分样本观察值去推断全体对象(总体),即由因为从一小部分样本观察值去推断全体对象(总体),即由部分推断全体。这里使用了部分推断全体。这里使用了“归纳推理归纳推理”的方法,它的方法,它不同于数不同于数学中的学中的“演绎推理演绎推理”。归纳推理归纳推理-根据观察到的大量个别情况,归纳推断总体。根据观察到的大量个别情况,归纳推断总
3、体。演绎推理演绎推理-从一些假设、命题、已知的事实等出发,按一定的逻从一些假设、命题、已知的事实等出发,按一定的逻辑推理得出结果。辑推理得出结果。二、数理统计方法的特点二、数理统计方法的特点本讲稿第三页,共二十七页 例如,在几何学中要证明例如,在几何学中要证明“等腰三角形底角相等等腰三角形底角相等”,只须只须从从“等腰等腰”这个前提出发,运用几何公理,一步一步推出这这个前提出发,运用几何公理,一步一步推出这个结论个结论.这是演绎推理。这是演绎推理。而一个习惯于统计思想的人,可能这样推理:而一个习惯于统计思想的人,可能这样推理:做很多大小形状不一的等腰三角形,实地测量其底角,做很多大小形状不一的
4、等腰三角形,实地测量其底角,看差距如何,根据所得资料看看可否作出看差距如何,根据所得资料看看可否作出“底角相等底角相等”的结论的结论.这样做就是归纳式的方法这样做就是归纳式的方法.本讲稿第四页,共二十七页 问题问题:用局部观察对总体下结论:用局部观察对总体下结论,有没有片面性?结论有没有片面性?结论是否可靠?是否可靠?显然这不仅显然这不仅依赖于进行局部观察的依赖于进行局部观察的“样本样本”是否具有总体的是否具有总体的代表性代表性,也,也依赖于对从这些样本得到数据的合理加工、分析依赖于对从这些样本得到数据的合理加工、分析并得出并得出论断论断.事实上,如果一切都建立在可靠的科学基础上,则对事实上,
5、如果一切都建立在可靠的科学基础上,则对总体下结论是可能的,也是可靠的总体下结论是可能的,也是可靠的.但也应记住但也应记住,毕竟是由毕竟是由“局部局部”推断推断“整体整体”,因,因而仍可能犯错误,而仍可能犯错误,结论往往是在某个结论往往是在某个“可靠性水平可靠性水平”之之下得出的下得出的.本讲稿第五页,共二十七页 概率论是数理统计的基础,而数理统计是概率论的重要应用概率论是数理统计的基础,而数理统计是概率论的重要应用.但它但它们是并列的两个数学学科,并无从属关系。们是并列的两个数学学科,并无从属关系。学习数理统计无须把过多时间化在计算上,可学习数理统计无须把过多时间化在计算上,可以更有效地以更有
6、效地把时间用在基本概念、方法原理及方法把时间用在基本概念、方法原理及方法适用对象的正确理解上适用对象的正确理解上.国内外著名的统计软件包:国内外著名的统计软件包:SASSAS,SPSSSPSS,STATSTAT等,都可以让等,都可以让你快速、简便地进行数据处理和分析你快速、简便地进行数据处理和分析.本讲稿第六页,共二十七页第四章第四章 随机抽样和抽样分布随机抽样和抽样分布 4.1 4.1 抽样的基本概念和方法抽样的基本概念和方法本讲稿第七页,共二十七页一、总体一、总体(Population)与个体与个体(Sample)一个统计问题总有它明确的研究对象一个统计问题总有它明确的研究对象.研究某批灯
7、泡的质量研究某批灯泡的质量总体总体-研究对象的全体(或集合)。研究对象的全体(或集合)。总体总体个体个体-总体中每个对象(或元素)。总体中每个对象(或元素)。每个个体具有的数量指标的全体就是总体每个个体具有的数量指标的全体就是总体.总体通常以一个概率总体通常以一个概率分布描述。分布描述。本讲稿第八页,共二十七页实例实例 研究某地区研究某地区1212岁儿童生长发育情况岁儿童生长发育情况,总体和个体应为什么?总体和个体应为什么?显然,总体为该地区的全体儿童显然,总体为该地区的全体儿童 个体为每一个儿童。个体为每一个儿童。当然,衡量儿童生长发育情况要通过诸如身高、当然,衡量儿童生长发育情况要通过诸如
8、身高、体重等数量指标进行,所以对总体的研究实际上是体重等数量指标进行,所以对总体的研究实际上是对该地区的全体儿童的这些指标值概率分布进行研对该地区的全体儿童的这些指标值概率分布进行研究。究。本讲稿第九页,共二十七页 根据研究指标的多少,总体分为根据研究指标的多少,总体分为一维总体一维总体-研究一项描述指标,常用随机变量研究一项描述指标,常用随机变量X X表示;表示;多维总体多维总体-研究多项描述指标,常用随机向量表示,研究多项描述指标,常用随机向量表示,如二维总体(如二维总体(X,YX,Y)。)。根据含个体数量多少,总体分为根据含个体数量多少,总体分为有限总体有限总体和和无限总体无限总体。本讲
9、稿第十页,共二十七页二、简单随机样本二、简单随机样本(simple random samplesample)研究总体通常有两种方法:一是全面地观察统研究总体通常有两种方法:一是全面地观察统计计(普查普查),二是从总体中抽取一部分个体观察统计,二是从总体中抽取一部分个体观察统计(抽抽样样)。抽样抽样(samplingsampling)从总体中抽取部分个体的过程。从总体中抽取部分个体的过程。从国产轿车中抽从国产轿车中抽5 5辆辆进行耗油量试验进行耗油量试验样本容量为样本容量为5样本样本(samplesample)在一维总体中在一维总体中,抽取得到的抽取得到的n n个体。个体。样本容量样本容量(sa
10、mple Sizesample Size)样本中所含个体的样本中所含个体的数量数量。本讲稿第十一页,共二十七页注意注意:(:(1 1)一维总体的每个个体的描述指标常)一维总体的每个个体的描述指标常用一个随机变量表达,所以容量为用一个随机变量表达,所以容量为n n的样本一般的样本一般用用n n个随机变量个随机变量X X1 1,X,X2 2,X,Xn n 表达。表达。(2 2)一维总体)一维总体X X的取值,是每个个体对应的指标的取值,是每个个体对应的指标数据数据x x;而样本而样本X X1 1,X,X2 2,X,Xn n的取值,是指每抽取一次样的取值,是指每抽取一次样本所对应本所对应n n个个体
11、的指标数据,称为个个体的指标数据,称为样本观察值样本观察值(简称(简称样本值样本值),记作),记作x x1 1,x,x2 2,x,xn n。本讲稿第十二页,共二十七页总体、样本、样本值的关系:总体、样本、样本值的关系:总体总体(理论分布)(理论分布)?样本样本 样本值样本值样本是联系二者的桥梁样本是联系二者的桥梁本讲稿第十三页,共二十七页简单随机样本简单随机样本在随机抽样中,在随机抽样中,与总体与总体X X有相同概率分有相同概率分布,且相互独立的样本布,且相互独立的样本X X1 1,X,X2 2,X,Xn n 。简单随机样本的性质简单随机样本的性质:1 1、随机性随机性 X Xi i的取每个个
12、体的的取每个个体的概率相等概率相等。2 2、独立性独立性 X X1 1,X,X2 2,X,Xn n的的相互独立相互独立,其样本观察,其样本观察值互不影响。值互不影响。3 3、代表性代表性 X X1 1,X,X2 2,X,Xn n与总体与总体X X有有相同概率分布相同概率分布。后面提到的样本如不说明,都是指简单随机样本。后面提到的样本如不说明,都是指简单随机样本。本讲稿第十四页,共二十七页 一般地一般地,对有限总体,应采用有放回抽样,对无对有限总体,应采用有放回抽样,对无限总体(或数量较多),可采用无放回抽样(近限总体(或数量较多),可采用无放回抽样(近似看作有放回),否则违背独立性。似看作有放
13、回),否则违背独立性。简单随机抽样具体实施的方法:简单随机抽样具体实施的方法:抽签法抽签法随机数法随机数法本讲稿第十五页,共二十七页三、统计量三、统计量(Statistic)样本是对总体的代表和反映,抽样的目的是利用样本值对总体样本是对总体的代表和反映,抽样的目的是利用样本值对总体进行统计推断。进行统计推断。而对总体进行统计推断,常根据需要的不同,利用样本构而对总体进行统计推断,常根据需要的不同,利用样本构造一些包含所需要的多种信息的量,就是关于造一些包含所需要的多种信息的量,就是关于样本样本X X1 1,X,X2 2,X,Xn n的一些函数,这些函数统称为统计量。的一些函数,这些函数统称为统
14、计量。统计量实际上表示统计量实际上表示样本的数字特征样本的数字特征。若若X X1 1,X,Xn n为总体为总体X X的一个样本,的一个样本,g(Xg(X1 1,X,X2 2,X,Xn n)是一个是一个不包含任何未知参数不包含任何未知参数的函数,则的函数,则g(Xg(X1 1,X,Xn n)称为一个)称为一个统计量。统计量。统计量定义统计量定义:本讲稿第十六页,共二十七页统计量的特点:统计量的特点:(1)(1)统计量是样本中统计量是样本中n n个随机变量个随机变量X X1 1,X,X2 2,X,Xn n的函数,的函数,它是完全由样本决定的量,它是完全由样本决定的量,仍是一个随机变量仍是一个随机变
15、量。(2)(2)统计量统计量不包含任何未知参数不包含任何未知参数。本讲稿第十七页,共二十七页几种常用统计量:几种常用统计量:用于反映总体均值的信息用于反映总体均值的信息注意与总体数学期望的区别和联系。注意与总体数学期望的区别和联系。用于反映总体方差的信息用于反映总体方差的信息 注意与总体方差的区别和联系。注意与总体方差的区别和联系。分母为分母为n-1n-1的原因的原因:本讲稿第十八页,共二十七页本讲稿第十九页,共二十七页SD与与SE的区别的区别:SD是描述个体观察值变异程度的大小,样本标准差越小,样本均是描述个体观察值变异程度的大小,样本标准差越小,样本均数对一组样本观察值的数对一组样本观察值
16、的代表性代表性就越好;就越好;SE是描述样本均数变异程度和是描述样本均数变异程度和抽样误差抽样误差的大小,样本标准误越的大小,样本标准误越小,用样本均数估计总体均数的小,用样本均数估计总体均数的可靠性可靠性就越高。就越高。在实际中,一般在实际中,一般用样本标准差与样本均数结合用样本标准差与样本均数结合,用于描述样本,用于描述样本观察值的分布范围;观察值的分布范围;样本标准误与样本均数结合,样本标准误与样本均数结合,用于估计总体用于估计总体均数可能出现的范围。均数可能出现的范围。五、变异系数五、变异系数 见课本见课本P49P49案例4-1本讲稿第二十页,共二十七页四、常用抽样方法四、常用抽样方法
17、抽样方法就是获取样本的方法。抽样方法就是获取样本的方法。1、单纯随机抽样、单纯随机抽样 是一种是一种等概率抽样等概率抽样,即总体中每个个体都有,即总体中每个个体都有相等的机会被抽取。相等的机会被抽取。对有限总体,应采用对有限总体,应采用有放回有放回抽样,对无限总体抽样,对无限总体(或数量较多),可采用无放回抽样(近似看作有放(或数量较多),可采用无放回抽样(近似看作有放回)。回)。本讲稿第二十一页,共二十七页 例例:从某年级:从某年级10001000名学生抽查名学生抽查100100名调查上网情况名调查上网情况 该法是其他抽样方法的基础该法是其他抽样方法的基础。优点是均数及标。优点是均数及标准差
18、(误)计算简单,且抽得的样本是简单随机样本;准差(误)计算简单,且抽得的样本是简单随机样本;缺点是总体量较大时,编号及随机抽取工作量大。缺点是总体量较大时,编号及随机抽取工作量大。把学号后把学号后4位作为编号,做成签,充分混合后,从中摸出位作为编号,做成签,充分混合后,从中摸出100个,则把这个,则把这100位同学作为样本。或用微机随机产生。位同学作为样本。或用微机随机产生。常用实施方法:抽签法和随机数法。常用实施方法:抽签法和随机数法。本讲稿第二十二页,共二十七页2、系统抽样(机械抽样)、系统抽样(机械抽样)按按一定顺序和间隔一定顺序和间隔从总体中抽取样本的方法。从总体中抽取样本的方法。步骤
19、:编号 分段 确定起始编号 获取样本 例例:从某年级:从某年级10001000名学生抽查名学生抽查100100名调查上网情况名调查上网情况 该法优点是简单易行,样本观察值在总体中分布均该法优点是简单易行,样本观察值在总体中分布均匀;缺点是样本观察值总按一定周期趋势得到,易产生匀;缺点是样本观察值总按一定周期趋势得到,易产生偏性。偏性。可把学号的后可把学号的后4位作为编号,把个位数位作为编号,把个位数0-9做成签,充分混合后,做成签,充分混合后,从中摸从中摸1个数(如摸得个数(如摸得6),则把这),则把这1000位同学中个位数字为位同学中个位数字为6的的100位同学作为样本。位同学作为样本。本讲
20、稿第二十三页,共二十七页3、分层抽样、分层抽样 按某种特征将总体分成若干互不重叠组别、类按某种特征将总体分成若干互不重叠组别、类型或区域等(称为分层),再从各层中随机抽样组型或区域等(称为分层),再从各层中随机抽样组成样本。成样本。例例:调查某校同学上网情况:调查某校同学上网情况 该法要求该法要求各层间差异尽可能大各层间差异尽可能大,才能得到有较好代,才能得到有较好代表性的样本,并便于各层间分析比较。表性的样本,并便于各层间分析比较。可采用以年级分层抽样的方法,但上面例子则不适用,可采用以年级分层抽样的方法,但上面例子则不适用,因差异较小。因差异较小。本讲稿第二十四页,共二十七页4、整群抽样、
21、整群抽样 先将总体分成若干互不重叠部分(称为群),再先将总体分成若干互不重叠部分(称为群),再从各群中随机抽取某群或几群作为样本。从各群中随机抽取某群或几群作为样本。例例:调查某年级学生上网情况:调查某年级学生上网情况 该法适用于大规模调查,易于组织,节省人该法适用于大规模调查,易于组织,节省人力物力,但误差较大,适于力物力,但误差较大,适于群体差异较小群体差异较小的调查对的调查对象。象。可把每班作为一群,从中随机抽取一班或几班作为样可把每班作为一群,从中随机抽取一班或几班作为样本。本。本讲稿第二十五页,共二十七页5、多阶段抽样、多阶段抽样 先将总体分成若干互不重叠组,再将各组分成先将总体分成
22、若干互不重叠组,再将各组分成几个亚组,各亚组再分成几个小组等,每一分组看成几个亚组,各亚组再分成几个小组等,每一分组看成一个阶段,然后在各阶段进行随机抽样。一个阶段,然后在各阶段进行随机抽样。实际中常采用二阶段抽样。实际中常采用二阶段抽样。注意:上述各种抽样方法中,注意:上述各种抽样方法中,只有只有单纯随机抽样单纯随机抽样抽得的样本是简单随机样本。抽得的样本是简单随机样本。而利用简单和非简单随机样本来推断总体的统而利用简单和非简单随机样本来推断总体的统计方法是不同的。计方法是不同的。本讲稿第二十六页,共二十七页小小 结结1 1、基本概念基本概念:总体、个体、抽样、样本、样本:总体、个体、抽样、样本、样本 容量、样本值、简单随机样本、统计量。容量、样本值、简单随机样本、统计量。2 2、常用、常用抽样方法抽样方法及特点。及特点。3 3、几种、几种常见统计量常见统计量.本讲稿第二十七页,共二十七页