《概率概率分布与抽样分布.ppt》由会员分享,可在线阅读,更多相关《概率概率分布与抽样分布.ppt(32页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、概率概率分布与抽样分布现在学习的是第1页,共32页第三章第三章 概率、概率分布与抽样分布概率、概率分布与抽样分布第一节 常用的抽样方法 第二节 抽样分布现在学习的是第2页,共32页第一节 常用的抽样方法简单随机抽样分层抽样整群抽样系统抽样概率抽样非概率抽样抽样方法现在学习的是第4页,共32页一、概率抽样(probability sampling)1、含义:根据一个已知的概率来抽取样本单位,也称随机抽样。2、特点:!按随机原则抽取样本:每个单位都有机会!每个单位被抽取的概率是已知或可计算的!当用样本对总体估计时,要考虑每个样本单位被抽中的概率随机原则:在从总体中抽取样本单位时,每一个单位被随机原
2、则:在从总体中抽取样本单位时,每一个单位被抽中的可能性相等,且不被人为确定。抽中的可能性相等,且不被人为确定。现在学习的是第5页,共32页3、常用的概率抽样方法(1)简单随机抽样(simple random sampling)从总体N个单位中随随机机抽抽取取n个单位作为样本,使得每一个单位都有相同的概率被抽中的抽样方式。两种抽取方法:重复抽样(sampling with replacement)不重复抽样(sampling without replacement优点:简单、直观 用样本统计量对总体参数进行估计比较方便局限性:当N和n很大时,工作量太大 抽出的单位分散,给实施调查增加了困难 现在
3、学习的是第6页,共32页(2)分层抽样(stratified sampling)将总体单位按某种特征划划分分为为若若干干不不同同的的层层,然后从各各个个层层中中抽抽取取一定数量的单位共同构成样本的抽样方式。优点:保证样本与总体结构相近,可提高估计精度组织实施调查方便既可估计总体,也可估计各层子总体分层注意事项:层的划分应尽可能符合数据规律,使样本很好代表总体,应遵循“层间差异大,层内差异小”。现在学习的是第7页,共32页(3)系统抽样(systematic sampling)l将总体所有单位按一定顺顺序序排排列列后,按某种规则随机地确定一个单位为抽样起点,每间间隔隔一一定定距距离离抽取一个单位
4、组成样本的抽样方式。l也称等距抽样或机械抽样l实施方法:排序后,将单位编号1,2,N;确定距离k=N/n,随机取r1,k作为初始位置;依次取r+k,r+2k,r+(n-1)k等位置单位,组成样本。rr+kr+(n-1)k1 2 3Nk2k(n-1)k现在学习的是第8页,共32页l优点:操作简便;总体数量均匀分布时可提高估计精度l缺点:对估计量方差的估计比较困难现在学习的是第9页,共32页(4)整群抽样(cluster sampling)将总体划分为若干个组(群),随机抽抽取取部部分分群群,然后对中选群中的所有单位进行调查中选群中的所有单位进行调查的抽样方式。优点:抽样时只需群的抽样框,简化工作
5、量 调查相对集中,节省调查费用,方便调查实施缺点:估计的精度较差整群抽样注意事项:组群的划分应尽可能符合数据规律,体现出“群内差异大,群间差异小”的原则。现在学习的是第10页,共32页二、非概率抽样(non-probability sampling)1、含义:抽取样本时不是依据随机原则,而是根据研究目的的要求,采用从总体中人人为为的选取部分单位实施调查。2、主要抽样方式:!方便抽样:确定样本单位时主要考虑到方便抽取的因素。!判断抽样:研究人员根据研究内容和以往的经验来确定所抽取的样本单位。3、特点:不能对总体进行推断现在学习的是第11页,共32页第二节 抽样分布一、参数与统计量二、抽样分布的概
6、念三、样本均值的抽样分布四、样本比率的抽样分布五、样本方差的抽样分布现在学习的是第12页,共32页一、参数与统计量1、参数(Parameter)用来描述总体特征总体特征的综合指标。基于总体资料计算:2、统计量(Statistic)用来描述样本特征样本特征的指标。基于样本资料计算得到:或、相关提示:相关提示:统计量是根据具体样本数据计算而得的一个函数统计量中不包含任何未知参数现在学习的是第13页,共32页3、参数与统计量的关系u 对于一个既定总体来说,参数是确定的、唯一的。而从同一个总体由于抽取的样本组成单位不同,由此计算出的统计量则是随机变量统计量则是随机变量。u 实践工作中,总体特征往往未知
7、,需要由样本资料进行估计,即由统计量来估计参数。现在学习的是第14页,共32页1 1、总体分布:总体各元素的观察值所形成的分布。、总体分布:总体各元素的观察值所形成的分布。2 2、样本分布:一个样本容量为、样本分布:一个样本容量为n n的样本中的样本中n n个观察值的分布。个观察值的分布。3 3、抽样分布:统计量所有可能取值形成的概率分布。、抽样分布:统计量所有可能取值形成的概率分布。1 1)是一种理论概率分布)是一种理论概率分布2 2)样本统计量是随机变量)样本统计量是随机变量样本均值样本均值,样本比例等样本比例等3 3)结果来自容量相同的所有可能样本)结果来自容量相同的所有可能样本二、抽样
8、分布现在学习的是第15页,共32页三、样本均值的抽样分布、概念要点1 1)在重复选取容量为)在重复选取容量为n n的样本时,由样本均值的所有可能的样本时,由样本均值的所有可能取值形成的概率分布。取值形成的概率分布。2 2)一种理论概率分布)一种理论概率分布3 3)是推断总体均值)是推断总体均值 的理论基础的理论基础现在学习的是第16页,共32页、形成过程(一个例子)【例例例例】设设设设一一一一个个个个总总总总体体体体,含含含含有有有有4 4 4 4个个个个元元元元素素素素(个个个个体体体体),即即即即总总总总体体体体单单单单位位位位数数数数N N N N=4=4=4=4。4 4 4 4 个个个
9、个个个个个体体体体分分分分别别别别为为为为X X X X1 1 1 1=1=1=1=1、X X X X2 2 2 2=2=2=2=2、X X X X3 3 3 3=3=3=3=3、X X X X4 4 4 4=4=4=4=4。总总总总体体体体的的的的均均均均值值值值、方差及分布如下方差及分布如下方差及分布如下方差及分布如下均值和方差均值和方差均值和方差均值和方差总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3现在学习的是第17页,共32页 现现从从总总体体中中抽抽取取n n n n2 2 2 2的的简简单单随随机机样样本本,在在重重复复抽抽样样条条件件下下
10、,共共有有4 4 4 42 2 2 2=16=16个个个个样样样样本本本本。所所所所有有有有样样样样本本本本的的的的结结结结果果果果如如如如下下下下表表表表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n=2 的样本(共的样本(共16个)个)现在学习的是第18页,共32页 计计算算出出各各样样本本的的均均值值,如如下下表表。并并给给出出样样本本均均值的抽样分布值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.0
11、3211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值(个样本的均值(x)样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 0.1.1.2.2.3.3P P(x x)1.51.53.03.04.04.03.53.52.02.02.52.5x x现在学习的是第19页,共32页3、抽样分布形式抽样分布抽样分布 =2.5 2=1.25总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3P P(x x)1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5x
12、 x的分布形式与原有总体和样本容量的分布形式与原有总体和样本容量的分布形式与原有总体和样本容量的分布形式与原有总体和样本容量n n n n的大小有关的大小有关的大小有关的大小有关现在学习的是第20页,共32页 =50=50=50 =10=10=10X X X总体分布总体分布总体分布总体分布n n=4=4抽样分布抽样分布抽样分布抽样分布Xn n=16=16当总体服从正态分布N N (,2 2)时时,来来自自该该总总体体的的所所有有容容量量为为n的的样样本本的的均均值值 X X也也服服从从正正态态分分布布,X X 的的数数学期望为学期望为,方差为,方差为2/2/n n。即 X X X XN N N
13、 N(,2/2/2/2/n n n n)。现在学习的是第21页,共32页中心极限定理当样本容量足够当样本容量足够当样本容量足够当样本容量足够大时大时大时大时(n n 30)30),样本均值的抽样样本均值的抽样样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正分布逐渐趋于正分布逐渐趋于正态分布态分布态分布态分布中中中中心心心心极极极极限限限限定定定定理理理理:从从从从均均均均值值值值为为为为 ,方方方方差差差差为为为为 2 2 2 2的的的的总总总总体体体体中中中中抽抽抽抽取取取取容容容容量量量量为为为为n n n n的的的的样样样样本本本本,当当当当n n n n充充充充分分分分大大大大
14、时时时时(通通通通常常常常n=30n=30n=30n=30),样样样样本本本本均均均均值值值值的的的的抽抽抽抽样样样样分分分分布布布布近似服从均值为近似服从均值为近似服从均值为近似服从均值为、方差为、方差为、方差为、方差为2 2 2 2/n n n n的正态分布。的正态分布。的正态分布。的正态分布。一个任意分一个任意分一个任意分一个任意分布的总体布的总体布的总体布的总体X X现在学习的是第22页,共32页中心极限定理 x x 的分布的分布趋于正态趋于正态分布的过分布的过程程现在学习的是第23页,共32页样本均值的抽样分布与总体分布的关系总体分布总体分布正态分布正态分布非正态分布非正态分布大样本
15、大样本大样本大样本小样本小样本小样本小样本正态分布正态分布正态分布正态分布非正态分布非正态分布大样本大样本大样本大样本小样本小样本小样本小样本现在学习的是第24页,共32页4、样本均值抽样分布的特征1 1样本均值的数学期望样本均值的数学期望2 2样本均值的方差样本均值的方差 重复抽样重复抽样不重复抽样不重复抽样现在学习的是第25页,共32页 从从从从总总总总体体体体中中中中抽抽抽抽取取取取n n n n2 2的的简简单单随随机机样样本本,在在重重复复抽抽样样条条件件下下,共共有有4 4 4 42 2 2 2=16=16=16=16个个个个样样样样本本本本。所所所所有有有有样样样样本本本本均均均
16、均值值值值的的的的结结结结果果果果如如如如下下下下表:表:表:表:3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值(个样本的均值(x)现在学习的是第26页,共32页式中:M为可能样本数目,是指从一个有N个单位的总体中抽取容量为n的样本时,出现的所有可能样本的个数。结论:)样本均值的均值(数学期望)等于总体均值)样本均值的方差等于总体方差的1/n 现在学习的是第27页,共32页三、样本比率的抽样分布(适于研究品质数据)(适于研究品质数据)、比率的概念:、比率的概念:比率
17、:又叫成数比率:又叫成数,总体总体(或样本或样本)中具有某种属中具有某种属 性的单位与全部单位总数之比。性的单位与全部单位总数之比。不同性别的人与全部人数之比不同性别的人与全部人数之比 合格品合格品(或不合格品或不合格品)与全部产品总数之比与全部产品总数之比1 1)总体比率可表示为)总体比率可表示为2 2)样本比率可表示为)样本比率可表示为 现在学习的是第28页,共32页2、概念要点)在重复选取容量为)在重复选取容量为n n的样本时,由样本比率的样本时,由样本比率的所有可能取值形成的概率分布。的所有可能取值形成的概率分布。)一种理论概率分布。)一种理论概率分布。)当样本容量很大时()当样本容量
18、很大时(np5np5和和n(1-p)5 n(1-p)5)样本比率的抽样分布可用正态分布近似。样本比率的抽样分布可用正态分布近似。)推断总体比例)推断总体比例 的理论基础。的理论基础。现在学习的是第29页,共32页3、样本比例的抽样分布特征1 1)样本比例的数学期望)样本比例的数学期望2 2)样本比例的方差)样本比例的方差重复抽样重复抽样不重复抽样不重复抽样现在学习的是第30页,共32页四、样本方差的抽样分布在重复选取容量为在重复选取容量为n n的样本时,由样本方的样本时,由样本方差的所有可能取值形成的频数分布。差的所有可能取值形成的频数分布。对于来自正态总体的简单随机样本,则对于来自正态总体的
19、简单随机样本,则比值比值的抽样分布服从自由度为的抽样分布服从自由度为 (n n-1)-1)的的 2 2分分布,即布,即现在学习的是第31页,共32页单总体参数推断时样本统计量的抽样分布形式 2 2样本统计量样本统计量样本统计量样本统计量正态总体或非正态总体或非正态总体或非正态总体或非正态总体大样本正态总体大样本正态总体大样本正态总体大样本非正态总体非正态总体非正态总体非正态总体小样本小样本小样本小样本大样本大样本大样本大样本样本均值样本均值样本均值样本均值样本比率样本比率样本比率样本比率p p样本方差样本方差样本方差样本方差正态分布正态分布正态分布正态分布 非正态分布非正态分布非正态分布非正态分布正态分布正态分布正态分布正态分布 分布分布分布分布现在学习的是第32页,共32页