统计学第八章ppt幻灯片.ppt

上传人:石*** 文档编号:48380213 上传时间:2022-10-06 格式:PPT 页数:41 大小:2.67MB
返回 下载 相关 举报
统计学第八章ppt幻灯片.ppt_第1页
第1页 / 共41页
统计学第八章ppt幻灯片.ppt_第2页
第2页 / 共41页
点击查看更多>>
资源描述

《统计学第八章ppt幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计学第八章ppt幻灯片.ppt(41页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、统计学第八章统计学第八章ppt第1页,共41页,编辑于2022年,星期二第一节第一节 抽样推断概述抽样推断概述一、抽样推断的概念及特点一、抽样推断的概念及特点 按按随随机机原原则则从从总总体体中中抽抽取取一一部部分分单单位位(称称为为样样本本),根根据据样样本本的的信信息息对对总总体体的的数数量量特特征征进进行行科学估计与推断的方法称为抽样推断科学估计与推断的方法称为抽样推断。第2页,共41页,编辑于2022年,星期二抽样推断的主要特点:抽样推断的主要特点:第一、按随机原则抽取调查单位。第一、按随机原则抽取调查单位。随机原则:(随机原则:(1 1)每个单位有相同的中选可能性。()每个单位有相同

2、的中选可能性。(2 2)每个单位的中选不中选不)每个单位的中选不中选不是主观所决定的。是主观所决定的。第二、根据部分推断总体第二、根据部分推断总体,是对总体的间接认识,属是对总体的间接认识,属于非全面调查。于非全面调查。第三、抽样误差可以估计和控制,推断第三、抽样误差可以估计和控制,推断 结果具有结果具有一定的可靠性和准确性。一定的可靠性和准确性。是运用概率的估计方法是运用概率的估计方法。例如:通过抽样推断得出,深大学生的平均月支出在(例如:通过抽样推断得出,深大学生的平均月支出在(10201020,10701070)元上的可靠性为)元上的可靠性为90%90%。第3页,共41页,编辑于2022

3、年,星期二二、抽样的若干基本概念二、抽样的若干基本概念 总体均值:总体均值:m m 样本均值样本均值:总体成数总体成数:P P 样本成数样本成数:p p 总体方差总体方差:s s2 2 样本方差样本方差:S S2 2 总体标准差总体标准差:s s 样本标准差样本标准差:S 第4页,共41页,编辑于2022年,星期二 1.总体:又称全及总体、母体,指所要研究对象的全体,由许多客观存在的具有某种共同性质的单位构成。组成总体的个别事物称为总体单位。分有限总体和无限总体,总体单位数用 N 表示。2.样本:又称子样,来自总体,是从总体中按随机原则抽选出来的部分,由抽选的单位构成。样本单位数用 n 表示。

4、3.总体是唯一的、确定的,而样本是不确定的、可变的、随机的。样本的个数为M。第5页,共41页,编辑于2022年,星期二 总体指标和样本指标总体指标和样本指标1.总体指标:反映总体数量特征的指标。其数值是唯一的、总体指标:反映总体数量特征的指标。其数值是唯一的、确定的。(又称参数)确定的。(又称参数)(1)常用的总体指标有:(均值、总体方差)常用的总体指标有:(均值、总体方差)(2)对)对01分布的是非标志总体有:设总体中分布的是非标志总体有:设总体中N个单个单位中,有位中,有N1个单位具有某种性质,个单位具有某种性质,N0个不具有某种性质,个不具有某种性质,且且N1+N0=N,则,则第6页,共

5、41页,编辑于2022年,星期二2.样本指标(统计量样本指标(统计量):根据样本分布计算的指标。:根据样本分布计算的指标。有有(样本平均数、样本方差)样本平均数、样本方差)样本统计量是可变的、不确定的,是随机变量。样本统计量是可变的、不确定的,是随机变量。为简便起见,分母中的n-1常用n近似代替。一般是n较大时。第7页,共41页,编辑于2022年,星期二 样本容量与样本个数样本容量与样本个数1.样本容量:一个样本中所包含的单位数,用n表示。2.样本个数:又称样本可能数目,指从一个总体中所可能抽取的样本的个数。对于有限总体,样本个数可以计算出来。样本个数的多少与抽样方法有关。(1)重置抽样:例如

6、从例如从A、B、C、D、E五个字母中随机抽取两个作为样本。五个字母中随机抽取两个作为样本。N=5,n=2考虑顺序时:样本个数考虑顺序时:样本个数=Nn=52=25不考虑顺序时:样本个数不考虑顺序时:样本个数=第8页,共41页,编辑于2022年,星期二(2 2)不重置抽样)不重置抽样例如从例如从A、B、C、D、E五个字母中随机抽取两个作为样本。五个字母中随机抽取两个作为样本。N=5,n=2考虑顺序时:样本个数考虑顺序时:样本个数不考虑顺序时:样本个数不考虑顺序时:样本个数第9页,共41页,编辑于2022年,星期二一、简单随机抽样一、简单随机抽样 简简单单随随机机抽抽样样又又称称纯纯随随机机抽抽样

7、样(有有时时简简称称为为随随机机抽抽样样),是是直直接接从从总总体体中中按按随随机机的的原原则则重重复复抽抽取取样样本本,每每一一个个总总体体单单位位有有相相同同的可能性被抽中。的可能性被抽中。第二节第二节 抽样的组织方式抽样的组织方式第10页,共41页,编辑于2022年,星期二2.计算样本平均数和抽样平均误差 1.定义:又称分层(类)抽样。对总体各单位按一定标志加以分组,然后从每一组中按随机原则抽取一定单位构成样本。3.两点结论两点结论(1)抽样效果一般来说好于简单随机抽样。)抽样效果一般来说好于简单随机抽样。(2)在分组时应尽量扩大组间方差(组间差异)在分组时应尽量扩大组间方差(组间差异)

8、,缩小组内方差(组内差异),从而减少抽样误,缩小组内方差(组内差异),从而减少抽样误差,提高抽样效果。差,提高抽样效果。二、类型抽样二、类型抽样第11页,共41页,编辑于2022年,星期二三、机械抽样三、机械抽样1.定义:又称等距抽样或系统抽样。先按某个标志对总体单位进行排序,然后依固定的间隔来抽取样本单位。这样可以保证样本单位均匀地分布在总体的各个部分,有较高的代表性。2.无关标志排队3.有关标志排队(1)半距中点取样:取每一部分位于中间位置的单位。(2)对称等距取样4.在排队时,要注意避免抽样间隔与现象本身的周期性节奏相重合。5.抽样平均误差的计算第12页,共41页,编辑于2022年,星期

9、二四、整群抽样四、整群抽样 1.定义:又称聚点抽样或群体抽样。将总体各单位分为若干群,然后从中抽取部分群,对中选群的所有单位进行全面调查。2.抽样平均误差的计算实质是以群代替总体单位,以群平均数代替总体标志值的简单随机抽样。有 3.抽样效果评价抽样效果评价(1)在日常工作中,)在日常工作中,“自然群自然群”。误差较大,但操作方便、省时、省力。可以增加样本。误差较大,但操作方便、省时、省力。可以增加样本单位来减少误差单位来减少误差。(2)分群时,应尽量扩大群内方差(群内差异),缩小群间方差(群间差异)分群时,应尽量扩大群内方差(群内差异),缩小群间方差(群间差异)来提高抽样效果。来提高抽样效果。

10、第13页,共41页,编辑于2022年,星期二 五、多阶段抽样五、多阶段抽样 多多阶阶段段抽抽样样是是先先将将一一个个很很大大的的总总体体划划分分为为若若干干个个子子总总体体,即即一一阶阶单单位位,再再把把一一阶阶单单位位划划分分为为若若干干个个更更小小的的单单位位,称称为为二二阶阶单单位位,照照此此继继续续下下去去划划分分出出更更小小的的单单位位,依依次次称称为为三三阶阶单单位位、四四阶阶单单位位等等。然后分别按随机原则逐阶段抽样。然后分别按随机原则逐阶段抽样。第14页,共41页,编辑于2022年,星期二 第三节第三节 抽样误差抽样误差一、抽样误差概述一、抽样误差概述 (一)抽样误差概念(一)

11、抽样误差概念 抽抽样样误误差差是是指指由由于于随随机机抽抽样样的的偶偶然然因因素素使使样样本本各各单单位位的的结结构构不不足足以以代代表表总总体体各各单单位位的的结结构构,而引起样本指标和总体指标之间的绝对离差。而引起样本指标和总体指标之间的绝对离差。第15页,共41页,编辑于2022年,星期二二、抽样平均误差二、抽样平均误差(一)、抽样平均误差的概念(一)、抽样平均误差的概念 抽样平均误差就是样本指标的标准差。抽样平均误差就是样本指标的标准差。第16页,共41页,编辑于2022年,星期二 抽样分布:由样本统计量的全部可抽样分布:由样本统计量的全部可能取值和与之相应的概率(频率)组能取值和与之

12、相应的概率(频率)组成的分配数列。成的分配数列。(一)重置抽样分布下的平均误差(一)重置抽样分布下的平均误差1、样本平均数的分布 某班组某班组5个工人的日工资为个工人的日工资为34、38、42、46、50元。元。现用重置抽样的方法从现用重置抽样的方法从5人中随机抽人中随机抽2个个构成样本。共有构成样本。共有52=25个样本个样本。第17页,共41页,编辑于2022年,星期二 此指标反映所有的样本平均数与总此指标反映所有的样本平均数与总体平均数的平均误差,称为抽样平均误差,体平均数的平均误差,称为抽样平均误差,用用 表示。表示。得出两个结论:得出两个结论:第18页,共41页,编辑于2022年,星

13、期二 总体方差总体方差为为 从总体中抽取容量为从总体中抽取容量为n的样本,样本成数的样本,样本成数p的分布实质是样本平均的分布实质是样本平均数的分布。有:数的分布。有:抽样平均误差为:抽样平均误差为:对于(对于(0,1)分布的总体,总体平均数为)分布的总体,总体平均数为2、样本成数的分布、样本成数的分布to14第19页,共41页,编辑于2022年,星期二(二)不重置抽样分布下的平均误差(二)不重置抽样分布下的平均误差1 1、样本平均数的分布、样本平均数的分布 某班组某班组5个工人的日工资为个工人的日工资为34、38、42、46、50元。元。现用不重置抽样的方法从现用不重置抽样的方法从5人中随人

14、中随机抽机抽2个构成样本。共有个构成样本。共有20个样本。个样本。第20页,共41页,编辑于2022年,星期二得出两个结论:得出两个结论:此指标反映所有的样本平均数与总体此指标反映所有的样本平均数与总体平均数的平均误差,称为抽样平均误差,用平均数的平均误差,称为抽样平均误差,用 表示。表示。第21页,共41页,编辑于2022年,星期二 总体方差为总体方差为 从总体中抽取容量为从总体中抽取容量为n的样本,样本成数的样本,样本成数p的分布实质是样本平均数的的分布实质是样本平均数的分布。有:分布。有:抽样平均误差为:抽样平均误差为:对于(对于(0,1)分布的总体,总体平均数为)分布的总体,总体平均数

15、为2、样本成数的分布、样本成数的分布to14第22页,共41页,编辑于2022年,星期二例:例:1.已知一批产品的合格率为已知一批产品的合格率为90%,现采用重置抽样方法从中抽,现采用重置抽样方法从中抽取取400件,求样本合格率的抽样平均误差。件,求样本合格率的抽样平均误差。2.现从一批产品中,采用重置抽样方法从中抽取现从一批产品中,采用重置抽样方法从中抽取400件,经检验有件,经检验有360件件合格,求样本合格率的抽样平均误差。合格,求样本合格率的抽样平均误差。3.现从一批产品共现从一批产品共10000件中,采用不重置抽样方法从中抽取件中,采用不重置抽样方法从中抽取400件,件,经检验有经检

16、验有360件合格,求样本合格率的抽样平均误差。件合格,求样本合格率的抽样平均误差。第23页,共41页,编辑于2022年,星期二抽样误差的影响因素抽样误差的影响因素1 1、总体方差或标准差、总体方差或标准差2 2、样本容量、样本容量3 3、抽样方法、抽样方法4 4、抽样调查的组织形式、抽样调查的组织形式第24页,共41页,编辑于2022年,星期二第四节第四节 参数估计参数估计所谓参数估计,就是指以样本统计量对总体参数进行估计。参数估计通常有两种形式,一种叫点估计,另外一种叫区间估计。一、点估计一、点估计(一)、点估计的概念及特点(一)、点估计的概念及特点 所谓点估计,就是直接以样本统计量作为相应

17、的总体参数的估计量。(二)、估计量优劣的衡量标准(二)、估计量优劣的衡量标准 无偏性;有效性;一致性 第25页,共41页,编辑于2022年,星期二 优良估计标准:(1)无偏性:要求样本统计量的平均数等于被估计的总体参数本身。(2)一致性:当样本容量充分大时,样本统计量充分靠近总体参数本身。(3)有效性:)有效性:第26页,共41页,编辑于2022年,星期二二、区间估计二、区间估计 区间估计的原理区间估计的原理 所谓区间估计,就是在一定的概率保证下,由样本指标推断总体指标可能在的区间。第27页,共41页,编辑于2022年,星期二 区间估计的基本要素:区间估计的基本要素:样本点估计值样本点估计值、

18、抽样极限误差抽样极限误差、估估计的可靠程度计的可靠程度1.抽样极限误差:可允许的误差范围。即样本统计量可允许变动的上(下)限与被估计总体参数的离差绝对值。例:根据样本资料计算深大学生的月平均支出为例:根据样本资料计算深大学生的月平均支出为700元,若可允许元,若可允许误差为误差为20元,即总体真值在(元,即总体真值在(680,720)内即为有效,()内即为有效,(680,720)就是估计的区间。)就是估计的区间。第28页,共41页,编辑于2022年,星期二2.抽样估计的可靠程度(置信度、概率保证程度)及概率度第29页,共41页,编辑于2022年,星期二例:经抽样调查计算样本亩产粮食例:经抽样调

19、查计算样本亩产粮食600600公斤,并求得抽样平均误差为公斤,并求得抽样平均误差为3 3公公斤,现给定允许极限误差为斤,现给定允许极限误差为6 6公斤,求总体平均亩产落在估计区间的概率。公斤,求总体平均亩产落在估计区间的概率。结果表明,如果多次反复抽样,每次都可以由样本值确定一个估计区间,每结果表明,如果多次反复抽样,每次都可以由样本值确定一个估计区间,每个区间或者包含总体参数的真值,或者不包含总体参数的真值,包含真值的个区间或者包含总体参数的真值,或者不包含总体参数的真值,包含真值的区间占区间占F(t),即每一万次抽样,就有即每一万次抽样,就有9545个样本区间包括总体亩产,其个样本区间包括

20、总体亩产,其余余455个样本区间不包括总体平均数,即若接受估计区间的判断要冒个样本区间不包括总体平均数,即若接受估计区间的判断要冒4.55%的机会犯错误的风险。的机会犯错误的风险。第30页,共41页,编辑于2022年,星期二总体平均数总体平均数(成数成数)的估计的估计:第31页,共41页,编辑于2022年,星期二例:对某型号的电子元件进行耐用性能检查,抽查资料分组如下表,要求耐用性能例:对某型号的电子元件进行耐用性能检查,抽查资料分组如下表,要求耐用性能的允许误差范围为的允许误差范围为10.510.5小时,(小时,(1 1)试估计该批电子元件的平均耐用时数。)试估计该批电子元件的平均耐用时数。

21、(2 2)设该厂的产品质量检验标准规定,元件耐用时数达到)设该厂的产品质量检验标准规定,元件耐用时数达到10001000小时以上为合格品。要求以小时以上为合格品。要求以95%95%的概率保证程度估计该批电子元件的合格率。的概率保证程度估计该批电子元件的合格率。Z或第32页,共41页,编辑于2022年,星期二三、样本容量的确定三、样本容量的确定(一)确定样本容量的意义(一)确定样本容量的意义 找找出出在在规规定定误误差差范范围围内内的的最最小小样样本本容容量量,这这样样确确定定的的样样本本容容量量可可以以在在保保证证满满足足误误差差要要求求下,使得调查费用最小下,使得调查费用最小 第33页,共4

22、1页,编辑于2022年,星期二 在设计抽样时,先确定在设计抽样时,先确定允许的误差范围允许的误差范围和和必要的概率保证程度必要的概率保证程度,然后根据历史资料或试点资料确定然后根据历史资料或试点资料确定总体的标准差或方差总体的标准差或方差,来确定,来确定样本容量。样本容量。第34页,共41页,编辑于2022年,星期二 例例1 1:对某批木材进行检验,根据以往经验,木材长度的标准差为:对某批木材进行检验,根据以往经验,木材长度的标准差为0.40.4米,而合格率为米,而合格率为90%90%。现采用重复抽样方式,要求在。现采用重复抽样方式,要求在95.45%95.45%的概率保证程的概率保证程度下,

23、木材平均长度的极限误差不超过度下,木材平均长度的极限误差不超过0.080.08米,抽样合格率的极限误差米,抽样合格率的极限误差不超过不超过5%5%,问必要的样本单位数应该是多少?,问必要的样本单位数应该是多少?例例2 2:对某批木材进行检验,根据以往经验,木材的合格率为:对某批木材进行检验,根据以往经验,木材的合格率为90%90%、92%92%、95%95%。现采用重复抽样方式,要求在。现采用重复抽样方式,要求在95.45%95.45%的概率保证程度下,抽样的概率保证程度下,抽样合格率的极限误差不超过合格率的极限误差不超过5%5%,问必要的样本单位数应该是多少?,问必要的样本单位数应该是多少?

24、第35页,共41页,编辑于2022年,星期二一、假设检验基本概念一、假设检验基本概念(一)、假设检验基本原理(一)、假设检验基本原理假设检验的一般步骤:假设检验的一般步骤:第一步:确定原假设和备择假设;第一步:确定原假设和备择假设;第二步:明确检验统计量;第二步:明确检验统计量;第三步:根据显著性水平,确定拒绝域;第三步:根据显著性水平,确定拒绝域;第四步:计算检验统计量的数值;第四步:计算检验统计量的数值;第五步:给出判断结论。第五步:给出判断结论。第五节第五节 假设检验假设检验第36页,共41页,编辑于2022年,星期二(二)、两种类型的错误(二)、两种类型的错误原假设是成立的,检验结果是

25、拒绝原假设,这是一原假设是成立的,检验结果是拒绝原假设,这是一种错误的决策,属于种错误的决策,属于“弃真错误弃真错误”,也称为,也称为“第一第一类错误类错误”;原假设是不成立的,检验结果是接受原假设,这又原假设是不成立的,检验结果是接受原假设,这又是一种错误的决策,它属于是一种错误的决策,它属于“取伪错误取伪错误”,也称为,也称为“第二类错误第二类错误”。第37页,共41页,编辑于2022年,星期二二、总体均值的检验二、总体均值的检验 检检验验问问题题:H0 0:m m m m0 0 H1 1:m mm m0 0(m m0 0为为已已知知常常数)数)(一)、总体方差已知情形(一)、总体方差已知

26、情形(z检验)检验)通通过样过样本本计计算算统计统计量量如果如果,即若即若或则则拒拒绝绝H H0 0,否,否则则,接受,接受H H0 0 第38页,共41页,编辑于2022年,星期二(二)、总体方差未知情形(二)、总体方差未知情形(t检验)检验)拒拒绝绝域域为为:第39页,共41页,编辑于2022年,星期二 三、总体成数的检验三、总体成数的检验检验的问题为检验的问题为 H H0 0:P P=p p0 0 H H1 1:P P p p0 0 拒绝域为拒绝域为 其中其中第40页,共41页,编辑于2022年,星期二四、假设检验与区间估计的关系四、假设检验与区间估计的关系置信区间与假设检验的关系为:置信区间与假设检验的关系为:若置信区间包括若置信区间包括m m0 0在内,则接受在内,则接受H H0 0;若置信区间;若置信区间不包括不包括m m0 0在内,则要拒绝在内,则要拒绝H H0 0,接受,接受H H。第41页,共41页,编辑于2022年,星期二

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁