《统计7抽样推断.pptx》由会员分享,可在线阅读,更多相关《统计7抽样推断.pptx(60页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一节第一节 抽样推断的意义抽样推断的意义第二节第二节 抽样误差抽样误差第三节第三节 抽样推断的方法抽样推断的方法第四节第四节 抽样调查的组织方式抽样调查的组织方式2022-1-131一、抽样推断的概念和特点一、抽样推断的概念和特点1、概念、概念: 抽样推断抽样推断是按随机原则从全部研究对是按随机原则从全部研究对象中抽取部分单位象中抽取部分单位(样本样本)进行观察,并根据进行观察,并根据样本的实际数据对总体的数量特征作出具样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断有一定可靠程度的估计和判断。第一节第一节 抽样推断的意义抽样推断的意义2022-1-1322、意义、意义: (1
2、 1)有些现象是无法进行全面调查的,为)有些现象是无法进行全面调查的,为了测算全面资料,必须采用抽样调查的方法。了测算全面资料,必须采用抽样调查的方法。例如,对无限总体不能采用全面调查。另外,例如,对无限总体不能采用全面调查。另外,有些产品的质量检查具有破坏性,不可能进有些产品的质量检查具有破坏性,不可能进行全面调查,只能采用抽样调查。行全面调查,只能采用抽样调查。第一节第一节 抽样推断的意义抽样推断的意义 (2)从理论上讲,有些现象虽然可以进行)从理论上讲,有些现象虽然可以进行全面调查,但实际上没有必要或很难办到,全面调查,但实际上没有必要或很难办到,也要采用抽样调查。也要采用抽样调查。 2
3、022-1-133 (3 3)抽样调查的结果可以对全面调查的结抽样调查的结果可以对全面调查的结果进行检查和修正。果进行检查和修正。第一节第一节 抽样推断的意义抽样推断的意义(5 5)利用抽样调查原理,可以对某些总体)利用抽样调查原理,可以对某些总体的假设进行检验,来判别这种假设的真伪,的假设进行检验,来判别这种假设的真伪,依决定行动的取舍。依决定行动的取舍。(4 4)抽样调查可以用于工业生产过程的质抽样调查可以用于工业生产过程的质量控制。量控制。2022-1-1343、特点:、特点: (1)它是由部分推断整体的一种认识方法它是由部分推断整体的一种认识方法。 (2)抽样推断建立在随机取样的基础上
4、抽样推断建立在随机取样的基础上。 (3)抽样推断运用概率估计的方法抽样推断运用概率估计的方法。 (4)抽样推断的抽样误差是不可避免的,抽样推断的抽样误差是不可避免的,但可以事先计算并加以控制。但可以事先计算并加以控制。第一节第一节 抽样推断的意义抽样推断的意义2022-1-1351统计学统计学:描述统计学:研究如何全面收集被研究客观事描述统计学:研究如何全面收集被研究客观事物的数据资料并进行简缩处理,描述其群体特征物的数据资料并进行简缩处理,描述其群体特征和数量规律性。和数量规律性。 推断统计学:研究如何有效地收集和使用被推断统计学:研究如何有效地收集和使用被研究客观事物的不完整并且带有随机干
5、扰的数据研究客观事物的不完整并且带有随机干扰的数据资料,以对其群体特征和数量规律性给出尽可能资料,以对其群体特征和数量规律性给出尽可能精确、可靠的推断性结论。精确、可靠的推断性结论。2022-1-1362推断统计推断统计 参数估计:由对部分进行观测取得的参数估计:由对部分进行观测取得的数据对研究对象整体的数量特征取值给出数据对研究对象整体的数量特征取值给出估计方法。估计方法。 假设检验:由对部分进行观测取得的假设检验:由对部分进行观测取得的数据对研究对象的数量规律性是否具有某数据对研究对象的数量规律性是否具有某种指定特征进行检验。种指定特征进行检验。 2022-1-1372022-1-138l
6、全及总体全及总体是所要研究的是所要研究的对象,又称母体,简称总体,它是对象,又称母体,简称总体,它是指所要认识的,具有某种共同性质指所要认识的,具有某种共同性质的许多单位的集合体。的许多单位的集合体。l全及总体单位数(全及总体单位数(N N)一般很大。一般很大。三、有关抽样的基本概念三、有关抽样的基本概念2022-1-139 又称子样。是从全及总体中随机抽取出来又称子样。是从全及总体中随机抽取出来的的,做为代表这一总体的部分单位组成的集做为代表这一总体的部分单位组成的集合体。样本单位总数用合体。样本单位总数用“n”表示。表示。 样本选取的基本原则:样本选取的基本原则: 代表性:样本的每个分量都
7、与总体有相同代表性:样本的每个分量都与总体有相同的分布的分布 独立性:样本的每个分量都是相互独立的独立性:样本的每个分量都是相互独立的2022-1-1310 随着样本容量的增大,样本对总体随着样本容量的增大,样本对总体的代表性越来越高,并且当样本单位数的代表性越来越高,并且当样本单位数足够多时,样本平均数愈接近总体平均足够多时,样本平均数愈接近总体平均数。数。 对于一次抽样调查,全及总体是唯对于一次抽样调查,全及总体是唯一确定的,样本总体不是这样,样本是一确定的,样本总体不是这样,样本是不确定的,一个全及总体可能抽出很多不确定的,一个全及总体可能抽出很多个样本总体,样本的个数和样本的容量个样本
8、总体,样本的个数和样本的容量有关,也和抽样的方法有关。有关,也和抽样的方法有关。2022-1-1311(二)(二)参参 数数 和和 统统 计计 量量参数参数:指反映总体数量特征的综合指标。指反映总体数量特征的综合指标。参数参数研究总体中研究总体中的数量标志的数量标志总体平均数总体平均数总体方差总体方差X=X NX=XF F(X-X) N2=2(X-X)F F2=2研究总体中研究总体中的品质标志的品质标志总体成数总体成数成数方差成数方差2= P(1-P)P = N1N2022-1-1312统计量统计量:根据样本数据计算的综合指标根据样本数据计算的综合指标。研究数研究数量标志量标志 样本平均数样本
9、平均数 x=xnx=xff样本标准差样本标准差研究品研究品质标志质标志样本成数样本成数 成数标准差成数标准差 np=nnxxsx2ffxxsx2ppsp12022-1-1313(三)样本容量和样本个数(三)样本容量和样本个数样本容量:样本容量:一个样本包含的单位数。用一个样本包含的单位数。用 “n”表示。表示。一般要求一般要求 n 30大样本大样本样本个数:样本个数:从一个全及总体中可能抽取的样本数目。从一个全及总体中可能抽取的样本数目。(四)(四)重复抽样和不重复抽样重复抽样和不重复抽样重复抽样:又称回置抽样。重复抽样:又称回置抽样。不重复抽样:又称不回置抽样。不重复抽样:又称不回置抽样。考
10、虑顺序时,可能组成的样本数目:考虑顺序时,可能组成的样本数目:不考虑顺序时,可能组成的样本数目:不考虑顺序时,可能组成的样本数目:nNnnNC1考虑顺序时,可能组成的样本数目:考虑顺序时,可能组成的样本数目:不考虑顺序时,可能组成的样本数目:不考虑顺序时,可能组成的样本数目:nNCnNP2022-1-1314抽样方法抽样方法不重复抽样不重复抽样考虑顺序考虑顺序不考虑顺序不考虑顺序432是否考虑顺序是否考虑顺序11考虑顺序的重复抽样;考虑顺序的重复抽样;2不考虑顺序的重复抽样;不考虑顺序的重复抽样;3考虑顺序的不重复抽样;考虑顺序的不重复抽样;4不考虑顺序的不重复抽样。不考虑顺序的不重复抽样。重
11、复抽样重复抽样2022-1-1315)!( !) 1() 2)(1(!nNnNnnNNNNnPCnNnNNNNNCCCCNNNNNnN1111) 1() 2() 1(1112111nNNNNCCCCPnNNNNnN)!1( !) 1(1NnnNCnnN!2022-1-1316四、抽样推断的理论基础四、抽样推断的理论基础 1、抽样推断的理论基础:大数(定律)法则抽样推断的理论基础:大数(定律)法则 大数定律即关于大量的随机现象具有稳定大数定律即关于大量的随机现象具有稳定性质的法则。它说明如果被研究的总体是由大性质的法则。它说明如果被研究的总体是由大量的相互独立的随机因素所构成,而且因素对量的相互
12、独立的随机因素所构成,而且因素对总体的影响都相对地小,那么对这些大量因素总体的影响都相对地小,那么对这些大量因素加以综合平均的结果,因素的个别影响将相互加以综合平均的结果,因素的个别影响将相互抵消,而呈现出它们共同作用的倾向,使总体抵消,而呈现出它们共同作用的倾向,使总体具有稳定的性质。具有稳定的性质。2022-1-1317 大数定律证明,如果随机变量总体存在着有大数定律证明,如果随机变量总体存在着有限的平均数和方差,则对于充分大的抽样单限的平均数和方差,则对于充分大的抽样单位为位为n,可以以几乎趋近于可以以几乎趋近于1的概率,来期望的概率,来期望平均数与总体平均数的绝对离差为任意小,平均数与
13、总体平均数的绝对离差为任意小,即对于任意的正数即对于任意的正数a有:有:式中:式中: 为抽样平均数;为抽样平均数; 为总体平均数;为总体平均数;n为为抽样单位数。抽样单位数。 2022-1-13182、抽样推断的理论基础:中心极限定理、抽样推断的理论基础:中心极限定理 人们已经知道,在自然界和生产实践中遇到的人们已经知道,在自然界和生产实践中遇到的大量随机变量都服从或近似服从正态分布,正因大量随机变量都服从或近似服从正态分布,正因如此,正态分布占有特别重要的地位。那么,如如此,正态分布占有特别重要的地位。那么,如何判断一个随机变量服从正态分布显得尤为重要。何判断一个随机变量服从正态分布显得尤为
14、重要。如经过长期的观测,人们已经知道,很多工程测如经过长期的观测,人们已经知道,很多工程测量中产生的误差量中产生的误差X都是服从正态分布的随机变量。都是服从正态分布的随机变量。在什么条件下,在什么条件下, , 这是十八世纪这是十八世纪以来概率论研究的中心课题,因而,从二十世纪以来概率论研究的中心课题,因而,从二十世纪二十年代开始,习惯上把研究随机变量和的分布二十年代开始,习惯上把研究随机变量和的分布收敛到正态分布的这类定理称为收敛到正态分布的这类定理称为中心极限定理中心极限定理(Central Limit Theorems))(limxxYPnn2022-1-1319 (林德伯格林德伯格莱维(
15、莱维(Lindeberg-Lvy)中心极限中心极限定理定理) 设设 是一相互独立同分布随机变量序列,是一相互独立同分布随机变量序列, 则对任意的实数,总有则对任意的实数,总有nX, 2 , 1,0,22iDXEXii2111211limlimd( )2nnnxtiiiiiinnniiXEXXnPxPxetxnDX2022-1-1320 本定理的证明在本定理的证明在20世纪世纪20年代由林德伯格和莱年代由林德伯格和莱维给出,因证明较复杂,在此从略。维给出,因证明较复杂,在此从略。 由定理可知,当由定理可知,当n充分大时,充分大时,)1 ,0( 1NnnXnii近似) ,( 21nnNXnii近似
16、) ,( 121nNXnnii近似 由于它对由于它对 的分布形式没有要求,因而得到的分布形式没有要求,因而得到广泛使用。广泛使用。nX2022-1-1321l第二节抽样误差第二节抽样误差l一、抽样误差一、抽样误差l二、抽样平均误差二、抽样平均误差l三、抽样极限误差三、抽样极限误差l四、抽样误差的概率度四、抽样误差的概率度2022-1-1322第二节第二节 抽抽 样样 误误 差差一、抽样误差的含义一、抽样误差的含义 (一)(一) 统计误差有两种:统计误差有两种: 1、登记性误差:由于调查整理过程中登记错误、登记性误差:由于调查整理过程中登记错误和计算不准而产生的。和计算不准而产生的。 2、代表性
17、误差:由于用样本资料代表总体资料、代表性误差:由于用样本资料代表总体资料而产生的,全面调查中不存在这种误差,其中由而产生的,全面调查中不存在这种误差,其中由于不按照随机原则抽样造成的误差为系统性误差,于不按照随机原则抽样造成的误差为系统性误差, 由于随机抽样的偶然因素使样本各单位的结构由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差为抽样误差。全及指标之间的绝对离差为抽样误差。2022-1-1323(二)影响抽样误差大小的因素(二)影响抽样误差大小的因素1 1、总体各单位标志值的变异程度、总体
18、各单位标志值的变异程度2 2、样本的单位数、样本的单位数3 3、抽样方法、抽样方法4 4、抽样推断的组织形式、抽样推断的组织形式2022-1-1324二、抽样平均误差二、抽样平均误差1、概念:、概念:抽样平均误差是抽样平均数或抽样成数的抽样平均误差是抽样平均数或抽样成数的 标准差。反映了抽样平均数与总体平均数标准差。反映了抽样平均数与总体平均数 抽样成数与总体成数的平均误差程度。抽样成数与总体成数的平均误差程度。2、计算方法:、计算方法:抽样平均数抽样平均数的平均误差的平均误差抽样成数抽样成数平均误差平均误差(以上两个公式实际上就是第四章讲的标准差。以上两个公式实际上就是第四章讲的标准差。但反
19、映的是样本指标与总体指标的平均离差程度)但反映的是样本指标与总体指标的平均离差程度)MXxix2MPpip22022-1-1325抽样平均数平均误差的计算公式抽样平均数平均误差的计算公式:采用重复抽样采用重复抽样:此公式说明,抽样平均误差与总体标准差成正比,此公式说明,抽样平均误差与总体标准差成正比,与样本容量开方成反比。(当总体标准差未知时,与样本容量开方成反比。(当总体标准差未知时,可用样本标准差代替)可用样本标准差代替)通过计算可说明以下几点通过计算可说明以下几点:样本平均数的平均数等于总体平均数样本平均数的平均数等于总体平均数。抽样平均数的标准差仅为总体标准差的抽样平均数的标准差仅为总
20、体标准差的可通过调整样本单位数来控制抽样平均误差可通过调整样本单位数来控制抽样平均误差。nxn12022-1-1326例题:假定抽样单位数增加例题:假定抽样单位数增加 2 2 倍、倍、0.50.5 倍时,抽样平均误差怎样变化?倍时,抽样平均误差怎样变化?解解:抽样单位数增加抽样单位数增加 2 倍,即为原来的倍,即为原来的 3 倍倍则:则:抽样单位数增加抽样单位数增加 0.5倍,即为原来的倍,即为原来的 1.5倍倍则:则:577. 0313nx8165. 05 . 115 . 1nx即:即:当样本单位数增加当样本单位数增加2 2倍时,抽样平均误差为原来的倍时,抽样平均误差为原来的0.5770.5
21、77倍倍。即:即:当样本单位数增加当样本单位数增加0.50.5倍时,抽样平均误差为原来的倍时,抽样平均误差为原来的0.81650.8165倍倍。2022-1-1327采用不重复抽样:采用不重复抽样:公式表明:抽样平均误差不仅与总体变异程度、样本容量有关,而且与抽样方法有关。例题一例题一:随机抽选某校学生随机抽选某校学生100100人,调查他们的体人,调查他们的体重。得到他们的平均体重为重。得到他们的平均体重为5858公斤,标公斤,标准差为准差为1010公斤。问抽样推断的平均误差公斤。问抽样推断的平均误差是多少?是多少?例题二:例题二:某厂生产一种新型灯泡共某厂生产一种新型灯泡共20002000
22、只,随机只,随机抽出抽出400400只作耐用时间试验,测试结果只作耐用时间试验,测试结果平均使用寿命为平均使用寿命为48004800小时,样本标准差小时,样本标准差为为300300小时,求抽样推断的平均误差?小时,求抽样推断的平均误差?Nnnx122022-1-1328例题一解例题一解:)(110010公斤nx即即:当根据样本学生的平均体重估计全部学生的平均当根据样本学生的平均体重估计全部学生的平均 体重时体重时, ,抽样平均误差为抽样平均误差为1 1公斤。公斤。例题二解例题二解:)(15400300小时nxNnnx12)(42.13200040014003002小时计算结果表明:计算结果表明
23、:根据部分产品推断全部产品的平均使用寿命根据部分产品推断全部产品的平均使用寿命 时,采用不重复抽样比重复抽样的平均误差要小。时,采用不重复抽样比重复抽样的平均误差要小。已知:已知:10,58,100sxn则:则:已知:已知:300,4800,400,2000sxnN则:则:2022-1-1329抽样成数平均误差的计算公式抽样成数平均误差的计算公式采用重复抽样采用重复抽样:采用不重复抽样:采用不重复抽样:例题三例题三: 某校随机抽选某校随机抽选400400名学生,发现戴眼镜的学名学生,发现戴眼镜的学生有生有8080人。根据样本资料推断全部学生中戴人。根据样本资料推断全部学生中戴眼镜的学生所占比重
24、时,抽样误差为多大?眼镜的学生所占比重时,抽样误差为多大?例题四例题四:一批食品罐头共一批食品罐头共6000060000桶,随机抽查桶,随机抽查300300桶,桶,发现有发现有6 6桶不合格,求合格品率的抽样平均桶不合格,求合格品率的抽样平均误差?误差?nppp1Nnnppp112022-1-1330例例 题题 三三 解解:已知:已知:400n801n则:样本成数则:样本成数%20400801nnp02. 04008 . 02 . 01nppp即:即:根据样本资料推断全部学生中戴眼镜的学根据样本资料推断全部学生中戴眼镜的学 生所占的比重时,推断的平均误差为生所占的比重时,推断的平均误差为2%2
25、%。2022-1-1331例例 题题 四四 解:解:已知已知:60000N300n61n则:样本合格率则:样本合格率98. 030063001nnnp(%)808. 030002. 098. 01npppNnnppp11(%)806. 060000300130002. 098. 0计算结果表明:计算结果表明:不重复抽样的平均误差小于重复抽样,不重复抽样的平均误差小于重复抽样, 但是但是“N”N”的数值越大,则两种方法计算的数值越大,则两种方法计算 的抽样平均误差就越接近。的抽样平均误差就越接近。2022-1-1332三、抽三、抽 样样 极极 限限 误误 差差含义含义:抽样极限误差指在进行抽样估
26、计时,根据研究抽样极限误差指在进行抽样估计时,根据研究对象的变异程度和分析任务的要求所确定的样对象的变异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的最大误差范围。本指标与总体指标之间可允许的最大误差范围。计算方法计算方法:它等于样本指标可允许变动的上限它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。或下限与总体指标之差的绝对值。= pp - Pp P ppp抽样平均数极限误差抽样平均数极限误差:抽样成数极限误差:抽样成数极限误差:XxxxxXxx2022-1-1333四、抽样误差的概率度四、抽样误差的概率度含义含义:抽样误差的概率度是测量抽样估计可靠抽样误差的概率度是
27、测量抽样估计可靠程度的一个参数。用符号程度的一个参数。用符号“ “ t ”t ”表示。表示。公式表示:公式表示: t = = t (t t 是极限误差与抽样平均误差的比值)是极限误差与抽样平均误差的比值)(极限误差是(极限误差是 t t 倍的抽样平均误差)倍的抽样平均误差)上式可变形为:上式可变形为:2022-1-1334第三节第三节 抽样估计的方法抽样估计的方法一、作为优良估计量的条件一、作为优良估计量的条件总体参数优良估计的标准总体参数优良估计的标准 无偏性无偏性一致性一致性有效性有效性2022-1-1335),(21nXXXTE2022-1-1336l一致性:随着样本容量的增大,估计量一
28、致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数的值越来越接近被估计的总体参数2022-1-1337122022-1-1338第三节第三节 抽样估计的方法抽样估计的方法二、总体参数的点估计二、总体参数的点估计总体参数点估计的特点总体参数点估计的特点: 直接使样本指标等于总体指标:即令直接使样本指标等于总体指标:即令pPxX,2022-1-1339三、总体参数的区间估计三、总体参数的区间估计(一)总体参数区间估计的特点:(一)总体参数区间估计的特点:第三节第三节 抽样估计的方法抽样估计的方法区间估计三要素区间估计三要素估计值估计值抽样误差范围抽样误差范围概率保证程度概率保证程度px
29、 ,px, tFpx ,2022-1-13401 1、根据给定的概率、根据给定的概率F F(t t),),推算抽样推算抽样 极限误差及总体参数的可能范围极限误差及总体参数的可能范围分分 析析 步步 骤骤:(1 1)抽取样本,计算样本指标。)抽取样本,计算样本指标。(2 2)根据给定的)根据给定的F F(t t)查表求得概率度查表求得概率度 t t 。(3 3)根据概率度和抽样平均误差计算)根据概率度和抽样平均误差计算 抽样极限误差。抽样极限误差。(4 4)计算被估计值的上、下限,对总体参数)计算被估计值的上、下限,对总体参数 作出区间估计。作出区间估计。(二)总体参数区间估计的方法(二)总体参
30、数区间估计的方法2022-1-13412 2、根据给定的抽样误差范围,、根据给定的抽样误差范围, 求概率保证程度求概率保证程度分析步骤:分析步骤:(1 1)抽取样本,计算抽样指标。)抽取样本,计算抽样指标。(2 2)根据给定的极限误差范围估计总体)根据给定的极限误差范围估计总体 参数的上限和下限。参数的上限和下限。(3 3)计算概率度)计算概率度。(4 4)查表求出概率)查表求出概率F F(t t),),并对总体参并对总体参 数作出区间估计。数作出区间估计。2022-1-1342某农场进行小麦产量抽样调查,小麦某农场进行小麦产量抽样调查,小麦播种总面积为播种总面积为1 1万亩,采用不重复简单万
31、亩,采用不重复简单随机抽样,从中抽选了随机抽样,从中抽选了100100亩作为样本亩作为样本进行实割实测,测得样本平均亩产进行实割实测,测得样本平均亩产400400斤,方差斤,方差144144斤。斤。1、以以95.45%95.45%的可靠性推断该农场小的可靠性推断该农场小 麦平均亩产可能在多少斤之间?麦平均亩产可能在多少斤之间?要求计算要求计算:例例 题题 一一:2、以以99.73%99.73%的可靠性推断该农场小的可靠性推断该农场小 麦平均亩产可能在多少斤之间?麦平均亩产可能在多少斤之间?2022-1-1343例题一解题过程:例题一解题过程:已知:已知:N=10000 n=100 9545.
32、0,144,4002tFx问题一解问题一解:1 1、计算抽样平均误差、计算抽样平均误差 斤19. 110000100110014412Nnnx2 2、计算抽样极限误差、计算抽样极限误差 斤38. 219. 12xxt3 3、计算总体平均数的置信区间、计算总体平均数的置信区间上限:上限: 斤38.40238. 2400 xx下限:下限: 斤62.39738. 2400 xx即:以即:以95.45%的可靠性估计该农场小麦平均亩产量在的可靠性估计该农场小麦平均亩产量在 397.62斤至斤至402.38斤之间斤之间.2022-1-1344同上解题过程:同上解题过程:已知:已知:N=10000 n=10
33、0 9973. 0,144,4002tFx问题二解问题二解:1 1、计算抽样平均误差、计算抽样平均误差 斤19. 110000100110014412Nnnx2 2、计算抽样极限误差、计算抽样极限误差 斤57. 319. 13xxt3 3、计算总体平均数的置信区间、计算总体平均数的置信区间上限:上限: 斤57.40357. 3400 xx下限:下限: 斤43.39657. 3400 xx即:以即:以99.73%的可靠性估计该农场小麦平均亩产量在的可靠性估计该农场小麦平均亩产量在 396.43斤至斤至403.57斤之间斤之间.2022-1-1345例例 题题 二:二:某纱厂某时期内生产了某纱厂某
34、时期内生产了1010万个单位的纱,按纯随机万个单位的纱,按纯随机抽样方式抽取抽样方式抽取20002000个单位检验,检验结果合格率为个单位检验,检验结果合格率为95%95%,废品率为,废品率为5%5%,试以,试以95%95%的把握程度,估计全部的把握程度,估计全部纱合格品率的区间范围及合格品数量的区间范围?纱合格品率的区间范围及合格品数量的区间范围?已知:已知:100000N2000n%95p%51 p 95.0tF96.1tNnnppp11%48. 010000020001200005. 095. 0%94. 0%48. 096. 1ppt区间下限:区间下限:%06.940094. 095.
35、 0pp区间下限:区间下限:%94.950094. 095. 0pp2022-1-1346例例 题题 三:三:为调查农民生活状况,在某地区为调查农民生活状况,在某地区5000户农民户农民中,按不重复简单随机抽样法,抽取中,按不重复简单随机抽样法,抽取400户户进行调查,得知这进行调查,得知这400户中拥有彩色电视机户中拥有彩色电视机的农户为的农户为87户。户。要求计算:要求计算:1、以、以95%的把握程度估计该地区全部农户的把握程度估计该地区全部农户中拥有彩色电视机的农户在多大比例之间?中拥有彩色电视机的农户在多大比例之间?2022-1-1347例例 题题 三三 的的 问问 题题 一一 解:解
36、:已知:已知:N=5000n=400871n 95. 0tF1、计算样本成数、计算样本成数:%75.21400871nnp2、计算抽样平均误差:、计算抽样平均误差:Nnnppp110198. 0500040014007825. 02175. 03、计算抽样极限误差:、计算抽样极限误差:0388. 00198. 096. 1ppt4、计算总体、计算总体P的置信区间的置信区间:下限:%87.17pp上限:%63.25pp即:以即:以95%的把握程度估计该地区农户中拥有彩电的农户在的把握程度估计该地区农户中拥有彩电的农户在 17.87%至至25.63%之间。之间。2022-1-1348(三)样本单位
37、数的计算方法(三)样本单位数的计算方法:通过抽样极限误差公式计算必要的样本单位数。通过抽样极限误差公式计算必要的样本单位数。重复抽样重复抽样:不重复抽样:不重复抽样:抽样平均数抽样平均数抽样成数抽样成数22222xxxtNNtnpptNpNptnp11222222xxtn221ppptn2022-1-1349某农场进行小麦产量抽样调查,小麦某农场进行小麦产量抽样调查,小麦播种总面积为播种总面积为1 1万亩,采用不重复简单万亩,采用不重复简单随机抽样,从中抽选了随机抽样,从中抽选了100100亩作为样本亩作为样本进行实割实测,测得样本平均亩产进行实割实测,测得样本平均亩产400400斤,方差斤,
38、方差144144斤。斤。要求计算要求计算:3、若概率保证程度为若概率保证程度为95.45%不变,不变,要求抽样允许误差不超过要求抽样允许误差不超过1 1斤,问至少斤,问至少应抽多少亩作为样本?应抽多少亩作为样本?接接 例例 题题 一一:2022-1-1350问题三解:问题三解:已知:已知: 不变tF斤1x则样本单位数:则样本单位数:22222tNNtnx 亩6 .5441442100001144100002222即:当即:当斤1x ,9545.0时为tF至少应抽至少应抽544.6亩作为样本。亩作为样本。2022-1-1351接接 例例 题题 三:三:为调查农民生活状况,在某地区为调查农民生活状
39、况,在某地区5000户农民户农民中,按不重复简单随机抽样法,抽取中,按不重复简单随机抽样法,抽取400户户进行调查,得知这进行调查,得知这400户中拥有彩色电视机户中拥有彩色电视机的农户为的农户为87户。户。以以95%的把握程度。的把握程度。要求计算:要求计算:2、抽样允许误差不超过、抽样允许误差不超过0.02,其它条件不变,其它条件不变,问应抽多少户作为样本?问应抽多少户作为样本?2022-1-1352 解:解:当当02. 0p其他条件不变时:其他条件不变时:pptNpNptnp112227825. 02175. 096. 102. 050007825. 02175. 0500096. 12
40、22=1635(户户)2022-1-13531.从总体从总体N个单位中随机地抽取个单位中随机地抽取n个单位作为样本,个单位作为样本,使使得每一个容量为样本都有相同的机会得每一个容量为样本都有相同的机会( (概率概率) )被抽中被抽中 2.抽取元素的具体方法有重复抽样和不重复抽样抽取元素的具体方法有重复抽样和不重复抽样3.特点特点简单、直观,在抽样框完整时,可直接从中抽取样本简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便用样本统计量对目标量进行估计比较方便4.局限性局限性当当N很大时,不易构造抽样框很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难抽
41、出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率没有利用其他辅助信息以提高估计的效率第四节第四节 抽样的组织形式抽样的组织形式2022-1-1354l将抽样单位按某种特征或某种规则划分为将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机不同的层,然后从不同的层中独立、随机地抽取样本地抽取样本l优点优点保证样本的结构与总体的结构比较相近,从保证样本的结构与总体的结构比较相近,从而提高估计的精度而提高估计的精度组织实施调查方便组织实施调查方便既可以对总体参数进行估计,也可以对各层既可以对总体参数进行估计,也可以对各层的目标量进行估计的目标量进行估计20
42、22-1-1355l将总体中若干个单位合并为组将总体中若干个单位合并为组(群群),抽样时抽样时直接抽取群,然后对中选群中的所有单位直接抽取群,然后对中选群中的所有单位全部实施调查全部实施调查l特点特点抽样时只需群的抽样框,可简化工作量抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的地点相对集中,节省调查费用,方便调查的实施调查的实施缺点是估计的精度较差缺点是估计的精度较差2022-1-1356l将总体中的所有单位将总体中的所有单位(抽样单位抽样单位)按一定顺按一定顺序排列,在规定的范围内随机地抽取一个序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先
43、规定好的单位作为初始单位,然后按事先规定好的规则确定其他样本单位规则确定其他样本单位先从数字先从数字1到到k之间随机抽取一个数字之间随机抽取一个数字r作为作为初始单位,以后依次取初始单位,以后依次取r+k,r+2k等单位等单位l优点:操作简便,可提高估计的精度优点:操作简便,可提高估计的精度l缺点:对估计量方差的估计比较困难缺点:对估计量方差的估计比较困难2022-1-13571.先抽取群,但并不是调查群内的所有单位,而是再先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进进行一步抽样,从选中的群中抽取出若干个单位进行调查行调查群是初级抽样单位,第二阶段抽
44、取的是最终抽样单位。群是初级抽样单位,第二阶段抽取的是最终抽样单位。将该方法推广,使抽样的段数增多,就称为多阶段抽样将该方法推广,使抽样的段数增多,就称为多阶段抽样2.不需要对每个高级别的抽样单元建立关于低级别抽不需要对每个高级别的抽样单元建立关于低级别抽样单元的抽样框,节约调查费用样单元的抽样框,节约调查费用3.需要包含所有低阶段抽样单位的抽样框;同时由于需要包含所有低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开实行了再抽样,使调查单位在更广泛的范围内展开4.在大规模的抽样调查中,经常被采用的方法在大规模的抽样调查中,经常被采用的方法 2022-1-1358简
45、单 随 机 抽 样分 层 抽 样整 群 抽 样系 统 抽 样二 阶 抽 样 与 多 阶 段 抽 样概 率 抽 样方 便 抽 样判 断 抽 样自 愿 样 本滚 雪 球 抽 样配 额 抽 样非 概 率 抽 样抽 样 方 式2022-1-13591.抽样方案设计抽样方案设计 抽样方法的选择和组合抽样方法的选择和组合 样本容量的确定样本容量的确定2.调查方法确定调查方法确定 例:问卷调查、座谈会调查、电话调查等例:问卷调查、座谈会调查、电话调查等3.估计量的构造估计量的构造 建立由所得数据能够给出目标量估计值的估计方建立由所得数据能够给出目标量估计值的估计方法估计量具有较好的概率性质,例如无偏性、方差法估计量具有较好的概率性质,例如无偏性、方差小构造估计量方差的估计量采用自加权估计量小构造估计量方差的估计量采用自加权估计量 2022-1-1360