《应用统计学第四章推断统计讲稿.ppt》由会员分享,可在线阅读,更多相关《应用统计学第四章推断统计讲稿.ppt(33页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、应用统计学第四章推断统计第一页,讲稿共三十三页哦一、一、概念概念 1 1、参数估计:在抽样分布及抽样分布的基础上,据样本统计、参数估计:在抽样分布及抽样分布的基础上,据样本统计量来推断总体参数的统计方法。量来推断总体参数的统计方法。2 2、估计量:用来估计总体参数的统计量的名称;估计量:用来估计总体参数的统计量的名称;估计值:计算得到的样本估计量的具体数值估计值:计算得到的样本估计量的具体数值第二页,讲稿共三十三页哦 点估计:点估计:用样本估计量直接作为总体参数估计值用样本估计量直接作为总体参数估计值 3 3、区间估计:在点估计基础上,依照一定的概率保证度区间估计:在点估计基础上,依照一定的概
2、率保证度 用样本估计值估计出总体参数取值的区间用样本估计值估计出总体参数取值的区间 范围。范围。4 4、置信区间:、置信区间:由样本统计量所构造的总体参数的估计区间,用由样本统计量所构造的总体参数的估计区间,用 ()来表示,即(置信下限,置信上限)。)来表示,即(置信下限,置信上限)。第三页,讲稿共三十三页哦 5 5、置信水平也称为置信度用、置信水平也称为置信度用 表示表示 表示置信区间表示置信区间 包括总体参数真值包括总体参数真值 的概率,记为的概率,记为 ,则总体参数真值,则总体参数真值有有 的可能性落在置信区间的可能性落在置信区间 内内。其中其中 为事先给定的概率值,称为显著性水平。为事
3、先给定的概率值,称为显著性水平。第四页,讲稿共三十三页哦(一一)无偏性无偏性 样本估计量的均值等于该样本统计量所估计的总体参数样本估计量的均值等于该样本统计量所估计的总体参数的真实值,则称该估计量为无偏估计量。的真实值,则称该估计量为无偏估计量。也称为相合性,当样本容量也称为相合性,当样本容量n n增加时,如果估计量越来越接近增加时,如果估计量越来越接近总体参数的真实值,则称这个估计量为一致估计量。总体参数的真实值,则称这个估计量为一致估计量。(二)一致性(二)一致性第五页,讲稿共三十三页哦 是指估计量与总体参数的离散程度应该很小,即估计量的方差应是指估计量与总体参数的离散程度应该很小,即估计
4、量的方差应该很小,这样才能保证估计量的取值集中在被估计的总体参数的该很小,这样才能保证估计量的取值集中在被估计的总体参数的附近,对总体参数的估计和推断更可靠。附近,对总体参数的估计和推断更可靠。(三)有效性(三)有效性第六页,讲稿共三十三页哦第七页,讲稿共三十三页哦第八页,讲稿共三十三页哦 1、一个总体均值、一个总体均值 的置信区间的置信区间:(1 1)大样本(大样本(n 30n 30)时,总体均值的置信区间为:)时,总体均值的置信区间为:方差方差 已知时:已知时:方差方差 未知时:未知时:(用(用 代替代替 )补充:当样本来自非正态总体时,应将样本容量增加到补充:当样本来自非正态总体时,应将
5、样本容量增加到3030以上,再进行抽样和区间估计,均值的置信区间同上面推导的以上,再进行抽样和区间估计,均值的置信区间同上面推导的大样本大样本(n 30n 30)的情况。的情况。第九页,讲稿共三十三页哦(2 2)样本来自正态总体样本来自正态总体 样本容量为小样本即(样本容量为小样本即(n n 3030)时,总体均值的置信区间为:)时,总体均值的置信区间为:已知时,已知时,未知时,未知时,第十页,讲稿共三十三页哦第十一页,讲稿共三十三页哦例例1 1 现从一批灯泡中随机地取现从一批灯泡中随机地取1616只,测的其使用寿命(以小时为单位)如下表所示。只,测的其使用寿命(以小时为单位)如下表所示。设灯
6、泡的使用寿命近似地服从正态分布,试求灯泡的平均使用寿命设灯泡的使用寿命近似地服从正态分布,试求灯泡的平均使用寿命95%95%的置信区间的置信区间 。解解 :总体的方差未知,故总体均值的置信区间为:总体的方差未知,故总体均值的置信区间为:而,经过计算得,而,经过计算得,又查表得,又查表得,故所求的置信区间为(故所求的置信区间为(1476.8,1503.21476.8,1503.2)。)。1510152014801500145014801510152014801490153015101460146014701470第十二页,讲稿共三十三页哦例例2 2:某食品生产企业以生产袋装食品为主,每天的产量为
7、:某食品生产企业以生产袋装食品为主,每天的产量为80008000袋左右,按照规定每袋的重量应为袋左右,按照规定每袋的重量应为100100克,为对产品质量进行监测,克,为对产品质量进行监测,企业质检部门从某天生产的一批产品中随机抽取了企业质检部门从某天生产的一批产品中随机抽取了6464袋,测得该袋,测得该样本的均值为样本的均值为105.36105.36克,标准差为克,标准差为1010克,试估计该批产品平均重克,试估计该批产品平均重量的置信区间为多少?(置信度为量的置信区间为多少?(置信度为95%95%)例例3 3:从某公司生产的一批瓶装产品中,随机抽取:从某公司生产的一批瓶装产品中,随机抽取10
8、10罐产品,测得每罐产品,测得每罐的重量分别为罐的重量分别为318318、320320、322322、321321、321321、323323、319319、320320、320320、324324(克),以(克),以95%95%的置信度求该公司这批产品平均重量的置信区间。的置信度求该公司这批产品平均重量的置信区间。(产品重量服从正态分布)(产品重量服从正态分布)第十三页,讲稿共三十三页哦复习:设复习:设 来自正态总体来自正态总体 的样本,的样本,分别为样本的均值和方差。则分别为样本的均值和方差。则 样本来自正态总体,则总体方差样本来自正态总体,则总体方差 的置信区间为的置信区间为第十四页,讲
9、稿共三十三页哦由样本比率的抽样分布可以知,当样本容量由样本比率的抽样分布可以知,当样本容量 足够足够(一般指不小于(一般指不小于3030,且且 都大于都大于5 5),),样本比率的抽样分布近似正态分布。设总体比率为样本比率的抽样分布近似正态分布。设总体比率为 ,则有,则有 对于置信度对于置信度 ,P P的置信区间为的置信区间为第十五页,讲稿共三十三页哦由样本比率的抽样分布可以知,当样本容量由样本比率的抽样分布可以知,当样本容量 足够足够(一般指不小于(一般指不小于3030,且且 都大于都大于5 5),),样本比率的抽样分布近似正态分布。设总体比率为样本比率的抽样分布近似正态分布。设总体比率为
10、,则有,则有 对于置信度对于置信度 ,P P的置信区间为的置信区间为第十六页,讲稿共三十三页哦例例4 4:对某种奶粉进行检查,从中随机抽取:对某种奶粉进行检查,从中随机抽取2020袋,测得样本的平袋,测得样本的平均重量为均重量为250.8250.8克,标准差为克,标准差为1.251.25克,已知其重量服从克,已知其重量服从 正态分布,正态分布,求总体方差在置信度为求总体方差在置信度为90%90%时的置信区间为多少?时的置信区间为多少?例例5 5:某城市要估计下岗职工中女性所占的比例,随机抽取了:某城市要估计下岗职工中女性所占的比例,随机抽取了100100个职工,其中个职工,其中6565人为女性
11、。对于置信度人为女性。对于置信度95%95%,试求该城市下岗,试求该城市下岗职工中女性所占的比例的置信区间为多少?职工中女性所占的比例的置信区间为多少?第十七页,讲稿共三十三页哦一、一、假设检验的基本问题假设检验的基本问题 1 1、假设检验假设检验:在总体的分布函数已知,但参数未知时,先对:在总体的分布函数已知,但参数未知时,先对总体分布中的未知参数(均值、比率、方差)提出假设,利总体分布中的未知参数(均值、比率、方差)提出假设,利用样本提供的信息来检验这个假设,即接受此假设还是拒绝用样本提供的信息来检验这个假设,即接受此假设还是拒绝此假设。此假设。第十八页,讲稿共三十三页哦第十九页,讲稿共三
12、十三页哦第二十页,讲稿共三十三页哦“弃真弃真”错误:错误:原假设为真时原假设为真时,我们却作出拒绝的错我们却作出拒绝的错 误决误决策策,称这类为第一类错误。该错误发生的概率为称这类为第一类错误。该错误发生的概率为 。“取伪取伪”错误:错误:当原假设为假时当原假设为假时,我们却接受了原假设我们却接受了原假设,称这称这类错误为第二类错误。类错误为第二类错误。第二十一页,讲稿共三十三页哦第二十二页,讲稿共三十三页哦5 5、拒绝域、拒绝域:拒绝原假设的统计量所有可能取值组成的集合。:拒绝原假设的统计量所有可能取值组成的集合。6 6、检验统计量:、检验统计量:据样本观测计算得到的,并据此对原假设和备择假
13、设据样本观测计算得到的,并据此对原假设和备择假设 做出决策的某个样本统计量做出决策的某个样本统计量7、假设检验的类型及拒绝域的决定:假设检验的类型及拒绝域的决定:双侧检验,备择假设为双侧检验,备择假设为“”,拒区域位于临界值两侧;,拒区域位于临界值两侧;右侧检验,备择假设为右侧检验,备择假设为“”,拒区域位于临界值右侧;,拒区域位于临界值右侧;左侧检验,备择假设为左侧检验,备择假设为“”,拒区域位于临界值左侧;,拒区域位于临界值左侧;第二十三页,讲稿共三十三页哦第一步:根据实际问题的要求第一步:根据实际问题的要求,提出原假设和备择假设;提出原假设和备择假设;第二步:第二步:给定显著性水平以及样
14、本容量;给定显著性水平以及样本容量;第第三三步步:确确定定检检验验统统计计量量及及其其分分布布,并并由由原原假假设设的的内内容容 确确定定拒绝域的形式(构建统计量);拒绝域的形式(构建统计量);第四步:第四步:由由 拒绝拒绝|为真为真=求出拒绝域;求出拒绝域;第五步;根据样本观测值计算检验统计量的具体值;第五步;根据样本观测值计算检验统计量的具体值;第六步;作出拒绝还是接受原假设的统计判断。第六步;作出拒绝还是接受原假设的统计判断。第二十四页,讲稿共三十三页哦第二十五页,讲稿共三十三页哦例例1 1 某某厂厂生生产产某某种种型型号号的的内内胎胎,从从长长期期的的生生产产经经验验知知道道其其扯扯断
15、断强强力力服服从从均均值值 =1380=1380(N/N/),标标准准差差 =50=50(N/N/)的的正正态态分分布布。该该厂厂为为提提高高产产品品的的质质量量,改改变变了了原原来来的的配配方方进进行行现现场场生生产产试试验验。设设新新配配方方生生产产的的内内胎胎其其扯扯断断强强力力仍仍服服从从正正态态分分布布。由由于于在在试试验验中中除除配配方方外外,其其他他条条件件都都保保持持不不变变,因因此此可可以以认认为为新新配配方方未未改改变变此此型型号号内内胎胎扯扯断断强强力力的的方方差差。采采用用新新配配方方的的5 5 次次试试验验,测测得得内内胎胎扯扯断断强强力力为为(单单位位:N/N/):
16、14501450,14601460,13601360,14301430,14201420,试试问问采采用用新新配配方方,是是否否能提高内胎的扯断强力?能提高内胎的扯断强力?第二十六页,讲稿共三十三页哦解:第一步:提出假设解:第一步:提出假设 第二步:计算检验统计量第二步:计算检验统计量 解得解得 ,=50=50,=1380=1380,求得,求得 第三步:确定拒绝域,备择假设为第三步:确定拒绝域,备择假设为“”,则为右侧检验,拒绝,则为右侧检验,拒绝 域为域为 Z Z ,=0.05,=,=0.05,=第四步:由第四步:由 ,可知,可知Z Z ,落在拒绝域,拒绝原假设。,落在拒绝域,拒绝原假设。第
17、二十七页,讲稿共三十三页哦第二十八页,讲稿共三十三页哦例例2 2 某种元件,按照标准其使用寿命不低于某种元件,按照标准其使用寿命不低于10001000(小时),现从生产出的一批元件(小时),现从生产出的一批元件中随机抽取中随机抽取2525件,测得其平均寿命为件,测得其平均寿命为950950(小时),样本标准差为(小时),样本标准差为100100(小时)。(小时)。假设该种元件寿命服从正态分布,对于置信度假设该种元件寿命服从正态分布,对于置信度95%,95%,试问这批元件是否可以认为试问这批元件是否可以认为合格?合格?解解 此问题即要检验此问题即要检验 检验统计量检验统计量 而由已知可得,而由已
18、知可得,,,n=25n=25,计算得到,计算得到 备择假设为备择假设为“”,则是左侧检验,拒绝域为,则是左侧检验,拒绝域为 。查表求得查表求得 ,可知,可知 故拒绝原假设,认为这批元件不合格。故拒绝原假设,认为这批元件不合格。第二十九页,讲稿共三十三页哦例例3 3:有人说某学院学生平均每天锻炼时间至少为:有人说某学院学生平均每天锻炼时间至少为3030分钟,分钟,随随机在该学院抽取机在该学院抽取100100名学生,测得他们每天的平均锻炼时间名学生,测得他们每天的平均锻炼时间为为3131分钟,标准差为分钟,标准差为1212分钟,试在显著性水平为分钟,试在显著性水平为0.050.05时,时,检验该人
19、的说法是否可信?检验该人的说法是否可信?例例4 4:某停车场管理员认为,该停车场每辆车平均停车时间:某停车场管理员认为,该停车场每辆车平均停车时间不会超过不会超过3030分钟,现从该停车场随机抽取分钟,现从该停车场随机抽取1616辆汽车进行辆汽车进行观测,测得平均停车时间为观测,测得平均停车时间为2828分钟,标准差为分钟,标准差为5.35.3分钟,分钟,试在试在=0.05=0.05时,检验该管理人员的说法是否可信?(车辆时,检验该管理人员的说法是否可信?(车辆的停车时间服从正态分布)的停车时间服从正态分布)第三十页,讲稿共三十三页哦复习:设复习:设 来自正态总体来自正态总体 的样本,的样本,
20、分别为样本的均值和方差。则分别为样本的均值和方差。则方差的检验统计量为方差的检验统计量为:第三十一页,讲稿共三十三页哦由样本比率的抽样分布可以知,当样本容量由样本比率的抽样分布可以知,当样本容量 足够大足够大(一般指不小于(一般指不小于3030,且且 都大于都大于5 5),),样本比率的抽样分布近似正态分布。设总体比率为样本比率的抽样分布近似正态分布。设总体比率为 ,则有,则有 比率的检验统计量为比率的检验统计量为第三十二页,讲稿共三十三页哦例5:某公司为了分析新产品的电视广告效果,随机访问了100名用户,了解到其中有36人是通过电视广告了解该产品的。试以0.05的显著性水平作出判断,此项调查结果是否支持全部用户有一半以上是通过电视广告了解该产品的假定是否正确?例6:一家制造厂仅当原材料的抗强度方差不超过5时,方予接受材料,今从一批新到的原材料中抽出24个样本,测得方差为7,这个数据能否为制造厂拒绝这批原材料提供充分依据?(=0.05)第三十三页,讲稿共三十三页哦