抽样推断概述优秀PPT.ppt

上传人:石*** 文档编号:65269001 上传时间:2022-12-04 格式:PPT 页数:61 大小:3.14MB
返回 下载 相关 举报
抽样推断概述优秀PPT.ppt_第1页
第1页 / 共61页
抽样推断概述优秀PPT.ppt_第2页
第2页 / 共61页
点击查看更多>>
资源描述

《抽样推断概述优秀PPT.ppt》由会员分享,可在线阅读,更多相关《抽样推断概述优秀PPT.ppt(61页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、抽样推断概述你现在浏览的是第一页,共61页第一节第一节 抽样推断概述抽样推断概述 指样本单位的抽取不受主观因指样本单位的抽取不受主观因素及其他系统性因素的影响,素及其他系统性因素的影响,每个总体单位都有均等的被抽每个总体单位都有均等的被抽中机会中机会一、抽样推断一、抽样推断按照按照随机原则随机原则从总体中抽取一部分单位进行从总体中抽取一部分单位进行观察,并依据所获得数据的处理结果,对总体观察,并依据所获得数据的处理结果,对总体的数量特征做出具有一定可靠程度的估计和判的数量特征做出具有一定可靠程度的估计和判断,从而达到对总体的分布状况及其数量特征断,从而达到对总体的分布状况及其数量特征认识的目的

2、。认识的目的。你现在浏览的是第二页,共61页统计推断统计推断全及总体指标:全及总体指标:参数(未知量)参数(未知量)样本总体指标:样本总体指标:统统计量(已知量计量(已知量)抽样推断抽样推断你现在浏览的是第三页,共61页q按按随机原则随机原则抽取样本单位抽取样本单位q以以样本样本的数量特征推断的数量特征推断总体总体的数量特征的数量特征q抽样推断产生抽样推断产生抽样误差抽样误差,但抽样误差可以,但抽样误差可以事先事先计算并控制计算并控制抽样推断的特点抽样推断的特点你现在浏览的是第四页,共61页()()用于无法采用或不必采用全面调用于无法采用或不必采用全面调查的现象;查的现象;(2 2)对全面调查

3、的结果进行复核;)对全面调查的结果进行复核;(3 3)生产过程的质量控制;)生产过程的质量控制;(4 4)对总体的假设进行检验。)对总体的假设进行检验。抽样推断的应用抽样推断的应用你现在浏览的是第五页,共61页设设计计抽抽样样方方案案抽抽取取样样本本单单位位收收集集样样本本数数据据计计算算样样本本统统计计量量推推断断总总体体参参数数抽样推断的一般步骤抽样推断的一般步骤你现在浏览的是第六页,共61页二、抽样推断的基本概念二、抽样推断的基本概念全及总体全及总体抽样总体抽样总体又称总体或母体,是所要认识研究对象又称总体或母体,是所要认识研究对象的全体,它由具有某种共同性质或特征的全体,它由具有某种共

4、同性质或特征的单位所组成。常用的单位所组成。常用N表示全及总体的表示全及总体的单位数目。单位数目。又称样本或子样,是指从全及总体中按又称样本或子样,是指从全及总体中按照随机原则抽取的那部分个体的组合。照随机原则抽取的那部分个体的组合。抽样总体的单位数称为抽样总体的单位数称为样本容样本容量量,通常,通常用用n表示。表示。1nN。例如:例如:在在100100万户居民中,随机抽取万户居民中,随机抽取10001000户居民进行家庭户居民进行家庭收支情况调查,其中的收支情况调查,其中的100100万户居万户居民就是全及总体,而民就是全及总体,而被抽中的被抽中的1000户居民则构成抽样总体。户居民则构成抽

5、样总体。n30称为大样本称为大样本,n 30称为小样本称为小样本.n/N称为抽样比称为抽样比.你现在浏览的是第七页,共61页设总体中设总体中 个总体单位某项标志的标志值分别个总体单位某项标志的标志值分别为为 ,其中具有某种属性的有,其中具有某种属性的有 个个单位,不具有某种属性的有单位,不具有某种属性的有 个单位,则个单位,则 总体平均数(又叫总体均值):总体平均数(又叫总体均值):根据全及总体各个单位的标志值或标根据全及总体各个单位的标志值或标志特征所计算的反映总志特征所计算的反映总体某种属性的体某种属性的综合指标综合指标,又称,又称总体参数总体参数。全及指标全及指标你现在浏览的是第八页,共

6、61页 总体单位标志值的标准差:总体单位标志值的标准差:总体单位标志值的方差总体单位标志值的方差:你现在浏览的是第九页,共61页 总体成数:总体成数:总体是非标志的标准差:总体是非标志的标准差:总体是非标志的方差:总体是非标志的方差:你现在浏览的是第十页,共61页设样本中设样本中 个样本单位某项标志的标志值个样本单位某项标志的标志值分别为分别为 ,其中具有和不具有某,其中具有和不具有某种属性的样本单位数目分别为种属性的样本单位数目分别为 和和 个,则个,则 样本平均数(又叫样本均值):样本平均数(又叫样本均值):指根据抽样总体各个单位的标志值指根据抽样总体各个单位的标志值或标志特征计算的综合指

7、标,又被或标志特征计算的综合指标,又被称为称为统计量,统计量,它是它是随机变量。随机变量。抽样指标抽样指标你现在浏览的是第十一页,共61页 样本单位标志值的标准差:样本单位标志值的标准差:样本单位标志值的方差:样本单位标志值的方差:为自由度为自由度为 的无偏估计为 的无偏估计你现在浏览的是第十二页,共61页 样本成数:样本成数:样本单位是非标志的标准差:样本单位是非标志的标准差:样本单位是非标志的方差:样本单位是非标志的方差:为为 的的无偏估计无偏估计为为 的的无偏估计无偏估计你现在浏览的是第十三页,共61页抽样方法的分类抽样方法的分类重复抽样重复抽样从总体从总体N N个单位中随机抽取一个样本

8、容量为个单位中随机抽取一个样本容量为n n的样本,每次从总体中抽取一个,的样本,每次从总体中抽取一个,并把结并把结果登记下来,又放回总体中重新参加下一次果登记下来,又放回总体中重新参加下一次的抽选。又称的抽选。又称放回抽样放回抽样不重复抽样不重复抽样每次从总体中抽选一个单位后就不再每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。又称将其放回参加下一次的抽选。又称不不放回抽样放回抽样.总体单位数总体单位数N N不变,同一单位可能多次不变,同一单位可能多次被抽中。被抽中。总体单位数减少总体单位数减少n n,同一单位只可能,同一单位只可能被抽中一次。被抽中一次。根据取样方式不同,可分为:根

9、据取样方式不同,可分为:你现在浏览的是第十四页,共61页三、抽样误差三、抽样误差 1、统计误差的种类统计误差是指统计数据与客观实际数量之间的差距。有两种情况:(1)登记性误差。指在调查、整理过程中,由于各种主观原因引起的误差。(2)代表性误差。指由于样本单位的结构情况不足以代表总体所产生的误差。又分两种:你现在浏览的是第十五页,共61页系统性误差。由于违反了抽样调查的随机原则而产生的误差。随机性误差。由于遵守抽样的随机原则,但可能抽到不同的样本而产生的误差。又分两种:实际误差:某一样本指标与总体指标之间的差异;平均误差:所有可能出现的样本指标与总体指标的平均离差。你现在浏览的是第十六页,共61

10、页举例计算抽样平均误差设有4个工人,每人的日产量分别为40、50、70、80,现随机抽选2人,求平均日产量,用以代表4人总体的平均日产量。总体平均日产量总体标准差你现在浏览的是第十七页,共61页序序号号样本变量样本变量样本平均样本平均数数平均数离差平均数离差离差平方和离差平方和1234567891011121314151640,4040,5040,7040,8050,4050,5050,7050,8070,4070,5070,7070,8080,4080,5080,7080,8040455560455060655560707560657580-20-15-50-15-1005-50101505

11、1520400225250225100025250100225025225400和和-960-2000你现在浏览的是第十八页,共61页 重复抽样条件下:样本平均数的平均数 样本平均误差你现在浏览的是第十九页,共61页序序号号样本变量样本变量样本平均样本平均数数平均数离差平均数离差离差平方和离差平方和1234567891011121314151640,5040,7040,8050,4050,7050,8070,4070,5070,8080,4080,5080,70455560456065556075606575-15-50-1505-5015051522525022502525022502522

12、5和和-720-1000你现在浏览的是第二十页,共61页 不重复抽样条件下:样本平均数的平均数 样本平均误差你现在浏览的是第二十一页,共61页四、抽样平均误差的计算四、抽样平均误差的计算 样本平均数的抽样平均误差样本平均数的抽样平均误差当N500时,有重复抽样时:重复抽样时:不重复抽样时:不重复抽样时:你现在浏览的是第二十二页,共61页 样本成数的抽样平均误差样本成数的抽样平均误差重复抽样时:重复抽样时:不重复抽样时不重复抽样时:当N500时,有抽样平均误差的计算公式抽样平均误差的计算公式你现在浏览的是第二十三页,共61页以上例验证抽样误差的公式:重复抽样条件下不重复抽样条件下你现在浏览的是第

13、二十四页,共61页关于总体方差的估计方法关于总体方差的估计方法q用过去同类问题全面调查或抽样调查的经用过去同类问题全面调查或抽样调查的经验数据代替;验数据代替;q用样本标准差用样本标准差 代替总体标准差代替总体标准差 ,用,用 代替代替 。抽样平均误差的计算公式抽样平均误差的计算公式你现在浏览的是第二十五页,共61页影响抽样误差的因素影响抽样误差的因素q总体各单位标志值的差异程度(即标准总体各单位标志值的差异程度(即标准差的大小):差的大小):越大,抽样误差越大;越大,抽样误差越大;q样本单位数的多少:样本单位数的多少:越大,抽样误越大,抽样误差越小;差越小;q抽样方法:抽样方法:不重复抽样的

14、抽样误差比重不重复抽样的抽样误差比重复抽样的抽样误差小;复抽样的抽样误差小;q抽样组织方式:抽样组织方式:简单随机抽样的误差简单随机抽样的误差最大。最大。你现在浏览的是第二十六页,共61页例:已知某一总体的平均数未知,总体方差为0.09,现简单随机抽取4个单位,其样本单位的标志值为15.7、16.3、15.9、16.1,试求其抽样误差。你现在浏览的是第二十七页,共61页例:从一批产品中随机抽取100件,测得一级品为95件,试求一级品率的抽样误差。你现在浏览的是第二十八页,共61页抽样极限抽样极限误差误差指在一定的概率保证程度下,抽样指在一定的概率保证程度下,抽样指标与总体指标之间抽样误差的最指

15、标与总体指标之间抽样误差的最大可能范围,也称作大可能范围,也称作抽样允许误差。抽样允许误差。常用常用表示表示。上式表明,样本平均数(成数)是以总体平均数(成数)上式表明,样本平均数(成数)是以总体平均数(成数)为中心,在相应的区间内变动。为中心,在相应的区间内变动。你现在浏览的是第二十九页,共61页由于总体成数和总体平均数是未知的,它要求靠实测由于总体成数和总体平均数是未知的,它要求靠实测的抽样平均数和抽样成数来估计,因而抽样误差的抽样平均数和抽样成数来估计,因而抽样误差的实的实际意义是希望总体平均数(成数)落在某个已知的范围内。际意义是希望总体平均数(成数)落在某个已知的范围内。抽样极限误差

16、抽样极限误差所以前面的不等式应变换为所以前面的不等式应变换为:在一个特定的全及总体中,当抽样方法和样本容量固在一个特定的全及总体中,当抽样方法和样本容量固定时,抽样平均误差是一个定值,因此,抽样极限误定时,抽样平均误差是一个定值,因此,抽样极限误差通常以抽样平均误差为标准单位来衡量。即抽样极差通常以抽样平均误差为标准单位来衡量。即抽样极限误差通常表示为抽样平均误差的限误差通常表示为抽样平均误差的多少倍。多少倍。由于由于t t值与样本估计值落入允许误值与样本估计值落入允许误差范围内的概率有关,因此,差范围内的概率有关,因此,t t也称为也称为概率度概率度。你现在浏览的是第三十页,共61页抽样估计

17、的置信度抽样估计的置信度抽样指标和总体指标的误差不超过一定范围抽样指标和总体指标的误差不超过一定范围的概率大小,我们将它称之为概率保的概率大小,我们将它称之为概率保证程度,证程度,也叫抽样估计的置信度,一般用也叫抽样估计的置信度,一般用F(t)表示。表示。即:即:置信度置信度t值与相应的概率保证程度存在一一对应关,值与相应的概率保证程度存在一一对应关,常用常用t值及相应的概率保证程度为:值及相应的概率保证程度为:t值值 概率保证程度概率保证程度1.00 0.6827 1.96 0.9500 2.00 0.9545 3.00 0.9973在在大大样样本本下下你现在浏览的是第三十一页,共61页68

18、.27%95.45%99.73%抽样极限误差与置信度抽样极限误差与置信度你现在浏览的是第三十二页,共61页第二节第二节 参数估计参数估计 也叫抽样估计,就是根据也叫抽样估计,就是根据样本指标样本指标数值对数值对总体指标总体指标数值作出估计或推数值作出估计或推断。断。参数估计参数估计通常,把用来估计总体特征的样本指标叫通常,把用来估计总体特征的样本指标叫估计量估计量或统计量,或统计量,待估计的总体指标叫待估计的总体指标叫总体参数总体参数。方方法法点估计点估计区间估计区间估计你现在浏览的是第三十三页,共61页点估计量的优良标准点估计量的优良标准无偏性、有效性、一致性无偏性、有效性、一致性你现在浏览

19、的是第三十四页,共61页区间估计区间估计给出一个区间给出一个区间(置信区间置信区间)并推断并推断真正的参数以一定的概率存在于真正的参数以一定的概率存在于这个区间的方法。这个区间的方法。你现在浏览的是第三十五页,共61页以样本统计量为中心,以以样本统计量为中心,以抽样平均误差为距离单位,可抽样平均误差为距离单位,可以构造一个区间,并可以一定以构造一个区间,并可以一定的概率保证待估计的总体参数的概率保证待估计的总体参数落在这个区间之中。区间越大,落在这个区间之中。区间越大,则概率保证程度越高。则概率保证程度越高。区间估计原理区间估计原理你现在浏览的是第三十六页,共61页总体平均数的区间估计总体平均

20、数的区间估计表表达达式式其中,其中,为极限误差为极限误差你现在浏览的是第三十七页,共61页步骤步骤 计算样本平均数计算样本平均数 ;搜集总体方差的经验数据搜集总体方差的经验数据 ;或计;或计算样本标准差算样本标准差 ,即,即总体平均数的区间估计总体平均数的区间估计你现在浏览的是第三十八页,共61页步步骤骤 计算抽样平均误差计算抽样平均误差:重复抽样时:重复抽样时:不重复抽样时:不重复抽样时:总体平均数的区间估计总体平均数的区间估计你现在浏览的是第三十九页,共61页步步骤骤 计算抽样极限误差:计算抽样极限误差:确定总体平均数的置信区间:确定总体平均数的置信区间:总体平均数的区间估计总体平均数的区

21、间估计你现在浏览的是第四十页,共61页【例例A A】某企业生产某种产品的工人某企业生产某种产品的工人有有10001000人,某日采用不重复抽样从中人,某日采用不重复抽样从中随机抽取随机抽取100100人调查他们的当日产量,人调查他们的当日产量,要求在要求在9595的概率保证程度下,的概率保证程度下,估计估计该厂全部工人的日平均产量和日总产该厂全部工人的日平均产量和日总产量。量。总体平均数的区间估计总体平均数的区间估计你现在浏览的是第四十一页,共61页按按 日产量分组日产量分组(件)(件)组中值组中值(件)(件)工人数工人数(人)(人)110114114118118122122126126130

22、13013413413813814211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合计合计100126004144100100名工人的日产量分组资料名工人的日产量分组资料你现在浏览的是第四十二页,共61页解:解:你现在浏览的是第四十三页,共61页则该企业工人人均产量则该企业工人人均产量 及日总产及日总产量量 的置信区间为:的置信区间为:即该企业工人人均产量在即该企业工人人均产量在124.124.至至127.127.件之间,其日总产量在件之间,其日总产量在124124至至

23、127127件之间,估计的可靠程度为件之间,估计的可靠程度为9595你现在浏览的是第四十四页,共61页总体成数的区间估计总体成数的区间估计表表达达式式其中,其中,为极限误差为极限误差你现在浏览的是第四十五页,共61页步步骤骤 计算样本成数计算样本成数 ;搜集总体方差的经验数据搜集总体方差的经验数据 ;计算抽样平均误差:计算抽样平均误差:重复抽样条重复抽样条件下件下不重复抽样不重复抽样条件下条件下总体成数的区间估计总体成数的区间估计你现在浏览的是第四十六页,共61页步步骤骤 计算抽样极限误差:计算抽样极限误差:确定总体成数的置信区间:确定总体成数的置信区间:总体成数的区间估计总体成数的区间估计你

24、现在浏览的是第四十七页,共61页【例例B B】若例若例A A中工人日产量在中工人日产量在118118件件以上者为完成生产定额任务,要求在以上者为完成生产定额任务,要求在9595的概率保证程度下,估计该厂的概率保证程度下,估计该厂全部工人中完成定额的工人比重及全部工人中完成定额的工人比重及完成定额的工人总数。完成定额的工人总数。总体成数的区间估计总体成数的区间估计你现在浏览的是第四十八页,共61页按按 日产量分组日产量分组(件)(件)组中值(件)组中值(件)工人数(人)工人数(人)1101141141181181221221261261301301341341381381421121161201

25、24128132136140371823211864合计合计100100名工人的日产量分组资料名工人的日产量分组资料完成定额完成定额的人数的人数你现在浏览的是第四十九页,共61页解:解:你现在浏览的是第五十页,共61页则该企业全部工人中完成定额的工人比则该企业全部工人中完成定额的工人比重重 及完成定额的工人总数及完成定额的工人总数 的置信的置信区间为:区间为:即该企业工人中完成定额的工人比重在即该企业工人中完成定额的工人比重在0.840.84至至0.950.95之间,完成定额的工之间,完成定额的工人总数在人总数在8484.至至9595.人之间,估计人之间,估计的可靠程度为的可靠程度为9595。

26、你现在浏览的是第五十一页,共61页样本容量的确定样本容量的确定影响样本容量的因素影响样本容量的因素q总体各单位标志值的差异程度(即标准差的总体各单位标志值的差异程度(即标准差的大小):大小):越大,所需样本容量越多越大,所需样本容量越多q允许的极限误差允许的极限误差的大小:的大小:越大,所越大,所需样本容量越小;需样本容量越小;q推断的可靠程度,即置信度:推断的可靠程度,即置信度:对可靠程度对可靠程度要求越高,所需样本容量越大;要求越高,所需样本容量越大;q抽样方法和抽样组织方式:抽样方法和抽样组织方式:重复抽样比不重复抽样比不重复抽样所需样本容量要多;类型抽样比重复抽样所需样本容量要多;类型

27、抽样比简单随机抽样所需样本容量多。简单随机抽样所需样本容量多。你现在浏览的是第五十二页,共61页确确定定方方法法推断总体平均数所需的样本容量推断总体平均数所需的样本容量 重复抽样条件下:重复抽样条件下:通常的做法是先确定通常的做法是先确定置信度,然后限定抽置信度,然后限定抽样极限误差。样极限误差。或或 S S通常未知。一般通常未知。一般按以下方法确定其估计值:按以下方法确定其估计值:过去的经验数据;过去的经验数据;试试验调查样本的验调查样本的S S。计算结果通常向上进位计算结果通常向上进位你现在浏览的是第五十三页,共61页 不重复抽样条件下:不重复抽样条件下:确确定定方方法法推断总体平均数所需

28、的样本容量推断总体平均数所需的样本容量你现在浏览的是第五十四页,共61页【例例A A】某食品厂要检验本月生产的某食品厂要检验本月生产的1000010000袋某产品的重量,根据上月袋某产品的重量,根据上月资料,这种产品每袋重量的标准差资料,这种产品每袋重量的标准差为为2525克。要求在克。要求在95.4595.45的概率保的概率保证程度下,平均每袋重量的误差范证程度下,平均每袋重量的误差范围不超过围不超过5 5克,应抽查多少袋产品克,应抽查多少袋产品?你现在浏览的是第五十五页,共61页解:解:在不重复抽样下在不重复抽样下:你现在浏览的是第五十六页,共61页确确定定方方法法推断总体成数所需的样本容

29、量推断总体成数所需的样本容量 重复抽样条件下:重复抽样条件下:通常的做法是先确通常的做法是先确定置信度,然后限定置信度,然后限定抽样极限误差。定抽样极限误差。计算结果通常向上进位计算结果通常向上进位 通常未知。一般按以下通常未知。一般按以下方法确定其估计值:方法确定其估计值:过过去的经验数据;去的经验数据;试验调试验调查样本的查样本的 ;取方差取方差的最大值的最大值0.250.25。你现在浏览的是第五十七页,共61页 不重复抽样条件下:不重复抽样条件下:确确定定方方法法推断总体成数所需的样本容量推断总体成数所需的样本容量你现在浏览的是第五十八页,共61页【例例B】某企业对一批总数为某企业对一批

30、总数为5000件的件的产品进行质量检查,过去几次同类调查产品进行质量检查,过去几次同类调查所得的产品合格率为所得的产品合格率为93、95、96,为,为了使合格率的允许误差不超过了使合格率的允许误差不超过3,在,在99.73 的概率保证程度下,应抽查多少件的概率保证程度下,应抽查多少件产品?产品?【分析分析】因为共有三个过去的合格率的因为共有三个过去的合格率的资料,为保证推断的把握程度,应选其资料,为保证推断的把握程度,应选其中方差最大者,即中方差最大者,即P=93。你现在浏览的是第五十九页,共61页解解你现在浏览的是第六十页,共61页必要样本容量的影响因素必要样本容量的影响因素q总体方差的大小;总体方差的大小;q允许误差范围的大小;允许误差范围的大小;q概率保证程度;概率保证程度;q抽样方法;抽样方法;q抽样的组织方式。抽样的组织方式。重复抽样条件下:重复抽样条件下:不重复抽样条件下:不重复抽样条件下:你现在浏览的是第六十一页,共61页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁