《4第四章 假设检验-2.ppt》由会员分享,可在线阅读,更多相关《4第四章 假设检验-2.ppt(77页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、4.4 非正态总体参数的假设检验非正态总体参数的假设检验设总体 X 服从参数为 p 的(01)分布,即 设 为 X 的样本,检验假设 1 1(01)(01)分布参数的假设检验分布参数的假设检验由于 因此由中心极限定理可知,当 成立且样本容量 n充分大时,统计量 服从标准正态分布N(0,1).=该假设检验问题的拒绝域为 近似地例例1 1 某种产品在通常情况下次品率为5%.现在从生产出的一批产品中随机地抽取50件进行检验,发现有4件次品.问能否认为这批产品的次品率为5%?(=0.05)解解 设这批产品的次品率为 p.在这批产品中任 任意取一件产品,定义随机变量 X 如下 检验假设 该假设检验问题的
2、拒绝域为 现在 统计量U的值为 =接受假设=可以认为这批产品的次品率为5%2.2.总体均值的假设检验总体均值的假设检验假设总体X 的均值为,方差为 为 X 的样本,检验假设 由中心极限定理知,当样本容量n充分大时,近似地服从标准正态分布N(0,1)由于样本方差 为 的无偏估计量,=可以用 近似代替,并且当 为真 且样本容量n充分大时,统计量 仍近似地服从标准正态分布N(0,1)=该假设检验问题的拒绝域为 例例2 2 某电器元件的平均电阻一直保持在2.64.改变加工工艺后,测得100个元件的电阻,计算得平均电阻为 2.58,样本标准差为0.04.在显著性水平=0.05下,判断新工艺对此元件的平均
3、电阻有无显著影响.解解 设该电器元件的电阻为X,其均值为 检验假设 拒绝域为 现在 统计量U的值为=拒绝假设 接受假设=新工艺对电子元件的平均电阻有显著影响.3.3.两个总体均值的假设检验两个总体均值的假设检验 设总体 和 相互独立,的样本,是 是 Y 的样本.记 设总体 X的均值为,方差为 总体 Y的均值为,方差为 的拒绝域.由中心极限定理知,当样本容量 和 都充分大时,近似地服从标准正态分布 由于样本方差 和 分别为 和 的无偏估计量,因此 可以分别用 和 近似代替 和,并且当 求假设检验问题 和 近似地服从标准正态分布,从而当原假设 成立时,统计量 仍近似地服从标准正态分布.都充分大时,
4、=当 成立且 都充分大时,统计量U的值应该在零附近摆动,当 过大时就认为 不成立.=该假设检验问题的拒绝域为 例例3 两台机床加工同一中轴承,现在从他们加工的轴承中分别随机地抽取200根和100根,测量其椭圆度(单位:mm),经计算得 能否认为这两台机床加工的轴承的平均椭圆度是相同的(=0.05)解解设这两台机床加工的轴承的椭圆度分别为X,Y 且 检验假设 由于题目给出的两个样本都是大样本,因此该假设检验问题的拒绝域为 现在=拒绝原假设 即认为这两台机床加工的轴承的平均椭圆度是不相同的.4.5 非参数假设检验非参数假设检验一个总体的检验一个总体的检验分布的卡方拟合检验分布的卡方拟合检验/柯尔莫
5、哥洛夫拟合检验柯尔莫哥洛夫拟合检验二个总体相等的检验二个总体相等的检验柯尔莫哥洛夫柯尔莫哥洛夫-斯米尔诺夫斯米尔诺夫/符号检验法符号检验法/秩和检验秩和检验法法/游程检验法游程检验法1 分布拟合检验分布拟合检验设总体X的实际分布函数为F(x),它是未知的.为来自总体 X的样本.根据这个样本来检验总体X的分布函数F(x)是否等于某个给定的分布函数 F0(x),即检验假设:注意注意:若总体 X 为离散型的,则 相当于 总体 X 的分布律为 若总体 X 为连续型的,则 相当于总体 X 的 概率密度为 f(x).(1)若中 的分布函数 不含未知参数.记 为 的所有可能取值的全体,将 分为k个两两互不相
6、交的子集 以 表示样本观察值 中落入 的个数,=在n次试验中,事件 Ai发生的频率为 fi/n另一方面,当H0 0为真时,可以根据H0所假设的 X 的分布函数来计算 选取统计量 来度量样本与H0中所假设的分布的吻合程度,hi是给定的常数。如果选取 则上述统计量变成 定理定理1 1(皮尔逊)(皮尔逊)当H0为真且n充分大时,统计量 近似服从 分布.由定理1,若给定显著性水平,则前述假设检验问题的拒绝域为(2)若H0中X 的的分布函数含有未知参数.此时,首先在假设下利用样本求出未知参数的最大似然估计,以估计值作为参数值,然后再根据 H0中所假设的 X 的分布函数 F(x)求出 pi的估计值 并在
7、中以 代替,得到统计量 为真且 充分大时,统计量定理定理2 2(皮尔逊)(皮尔逊)当 近似服从 分布,其中r是 X的分布函数 F(x)包含的未知参数的个数.若给定显著性水平,则前述假设检验问题的拒绝域为 注意:注意:运用 检验法检验总体分布,把样本数据进(1)大样本,通常取(2)要求各组的理论频数 或(3)一般数据分成7到14组.有时为了保证各组 行分类时,组数可以少于7组解例1试检验这颗骰子的六个面是否匀称?根据题意需要检验假设把一颗骰子重复抛掷 300 次,结果如下:H0:这颗骰子的六个面是匀称的.其中X表示抛掷这骰子一次所出现的点数(可能值只有6个),当 H0 为时,所以拒绝 H0,认为
8、这颗骰子的六个面不是匀称的.例例2 2 孟德尔在著名的豌豆杂交实验中,用结黄色圆形种子与结绿色皱形种子的纯种豌豆作为亲本进行杂交,将子一代进行自交得到子二代共556株豌豆,发现其中有四种类型植株(黄圆)(黄皱)(绿圆)(绿皱)总计 315株 101株 108株 32株 556株 试问这些植株是否符合孟德尔所提出的 的理论比例 解解 检验假设 这些植株符合的理论比例.这些植株不符合 的理论比例.由 由 的理论比例可知 由n=556,得 而 计算得 由=0.05,自由度查 分布表得=在=0.05下接受=这些植株是符合孟德尔所提出的 的理论比例解解例例3试检验试检验每年爆每年爆发战发战争的次数争的次
9、数X是否服从泊松分布?是否服从泊松分布?根据根据题题意提出原假意提出原假设设 H0:X服从参数服从参数为为的泊松分布的泊松分布1500年年-1931年的年的432年年间间,每年爆,每年爆发战发战争的次数可以争的次数可以看做一个随机看做一个随机变变量,据量,据统计统计,这这432年年间间共爆共爆发发了了299次次战战争,具体数据争,具体数据见见下表:下表:先估先估计计未知参数未知参数,由极大似然估,由极大似然估计计法得参数法得参数的极大似然的极大似然估估计值为计值为战战争次数争次数X01234发发生生X战战争的年数争的年数22314248154拒拒绝绝域域为为计计算得算得 ,未落入拒,未落入拒绝
10、绝域,接受域,接受H0例例4 4 某农科站为了考察某种大麦穗长的分布情况,在一块实验地里随机抽取了100个麦穗测量其长度,得到数据如下(单位:cm)6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6 5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8 6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4 6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.46.0 5.4 6.5 6.0 6.8 5.8 6.3
11、6.0 6.3 5.65.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.05.5 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 5.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3试检验大麦穗长是否服从正态分布?(=0.05)解解 检验假设 X的概率密度为 是未知的,所以应首先估计 的最大似然估计为 把X可能取值的全体 划分为 k=12个互不重叠的小区间:=大麦穗长的频数、频率分布表 3.954.254.254.554.554.854.8
12、55.155.155.455.455.755.756.056.056.356.356.656.656.956.957.257.257.55合计频率 频数 累计频率 0.09 11152813110.110.150.280.130.110.200.350.630.760.871.00 1001.00由由此可计算 若则的值见下表 的计算表 组号分组 频数 13.955.1590.099769.9760.0954925.155.45110.117411.740.0466435.455.75150.17217.20.281445.756.05280.193519.353.866856.056.3513
13、0.177917.791.2897266.356.65110.125812.580.1984476.657.55130.1096310.9630.37849合计1000.9959999.5996.15698由 k=7,r=2,得自由度 k-r-1=4,查表得而=接受原假设,即在检验水平=0.05下,下可认为大麦的穗长服从正态分布拟合优度拟合优度2 2检验的问题检验的问题1.1.分组不同,拟合的结果可能不同。分组不同,拟合的结果可能不同。2.2.需要有足够的样本容量。需要有足够的样本容量。对于对于连续型变量连续型变量的优度拟合,卡方检验并不是理想的优度拟合,卡方检验并不是理想的方法。的方法。4.
14、6 独立性检验独立性检验设设(X,Y)为为二二维总维总体体,通常要求通常要求检验检验假假设设城市的大气污染是否与汽车尾气排放有关?城市的大气污染是否与汽车尾气排放有关?地下水位的变化是否与地震有关?地下水位的变化是否与地震有关?独立独立不独立不独立慢性气管炎是否与吸烟有关?慢性气管炎是否与吸烟有关?高血压是否与食盐摄入过多有关?高血压是否与食盐摄入过多有关?城市家庭养猫是否与灭鼠有关?城市家庭养猫是否与灭鼠有关?上述问题可以用一个表格上述问题可以用一个表格列联表列联表来表示如下来表示如下列联表检验的问题为:检验的问题为:统计量选择为统计量选择为拒绝域为拒绝域为例例1 1 调查调查339名名50
15、岁岁以上的吸烟者与慢性以上的吸烟者与慢性气管炎的关系,结果如下表气管炎的关系,结果如下表21.020516243吸烟16.533928356合合计计9.713412113不吸烟患病率合计未患慢性气管炎者患慢性气管炎者 检验的问题为:检验的问题为:解统计量为统计量为观察值为观察值为上侧分位数上侧分位数显然显然因而拒绝原假设,即认为慢性气管炎与吸烟有关因而拒绝原假设,即认为慢性气管炎与吸烟有关 例例2 某大城市某大城市为为了了解城市养猫是否了了解城市养猫是否对灭对灭鼠有明鼠有明显显效果效果,进进行了行了一一项调查项调查:119户户养猫养猫户户中有老鼠活中有老鼠活动动的的15户户,418户户无猫无猫
16、户户中有老中有老鼠活鼠活动动的的58户户.试试分析养猫与不养猫分析养猫与不养猫对对大城市大城市灭灭鼠有无鼠有无显显著差异?著差异?养猫养猫户户数数 合合计计无猫无猫户户数数 合合计计有鼠有鼠户户数数无鼠无鼠户户数数 统计统计量量观观察察值值故故不拒不拒绝绝 即养猫与否即养猫与否对对大城市大城市灭灭鼠无鼠无显显著差异著差异.解解 依依题题意要意要检验检验养猫与养猫与灭灭鼠无关鼠无关有关有关现现4.7 秩和检验秩和检验 设设(X,Y)为为二二维总维总体体,通常要求比通常要求比较较两个两个总总体的分布函数是否相等?体的分布函数是否相等?(1)如果它如果它们们是同一种分布函数,是同一种分布函数,则则问
17、题转问题转化化为为参数假参数假设检验问题设检验问题(2)如果分布函数完全未知,只能用如果分布函数完全未知,只能用非参数方法非参数方法进进行行检验检验1.假设中的等价问题假设中的等价问题设有两个连续型总体设有两个连续型总体,(均为未知均为未知)要检验的各假设为要检验的各假设为它们的概率密度函数分别为它们的概率密度函数分别为此时此时,上述各假设分别等价于上述各假设分别等价于2.秩的定义秩的定义例如例如:某旅行团人员的行李重某旅行团人员的行李重量数据如表量数据如表写出重量写出重量 33 的秩的秩.故故 33 的秩为的秩为 2.特殊情况特殊情况:如果在排列大小时出现了相同大小的观察如果在排列大小时出现
18、了相同大小的观察值值,则其秩的定义为足标的平均值则其秩的定义为足标的平均值.例如例如:抽得的样本观察值按次序排成抽得的样本观察值按次序排成0,1,1,1,2,3,3,3.秩和的定义秩和的定义4.秩和检验法的基本原理秩和检验法的基本原理 秩和检验法秩和检验法是一种非参数检验法是一种非参数检验法,它是一种用样它是一种用样本秩来代替样本值的检验法本秩来代替样本值的检验法.用用秩和检验法秩和检验法可以检验两个总体的分布函数是否可以检验两个总体的分布函数是否相等的问题相等的问题.分析分析:此时此时,两个独立样本实际上来自同一个总体两个独立样本实际上来自同一个总体.检验检验犯第犯第I类错误的概率类错误的概
19、率是是5.求临界点的方法求临界点的方法见下表见下表:秩秩秩秩秩123124125126127134135 6 7 8 910 8 91361371451461471561571011101112121316723423523623724524614 910111211122472562572673453463471313141512131435635736745645746756714151615161718由于这由于这35种情况的出现是等可能的种情况的出现是等可能的,由上表可由上表可求得求得R1的分布律和分布函数如下表的分布律和分布函数如下表:6789101112 1/35 1/35 1/3
20、5 2/35 2/35 4/35 3/35 7/35 4/3511/35 4/3515/35 5/3520/35131415161718 4/3524/35 4/3528/35 3/3531/35 2/3533/35 1/3534/35 1/351R1R1R1的分布律和分布函数如下表的分布律和分布函数如下表由上表可知由上表可知参照上表可以写出双边检验的临界值和拒绝域参照上表可以写出双边检验的临界值和拒绝域.6789101112 1/35 1/35 1/35 2/35 2/35 4/35 3/35 7/35 4/3511/35 4/3515/35 5/3520/35131415161718 4/
21、3524/35 4/3528/35 3/3531/35 2/3533/35 1/3534/35 1/351R1的分布律和分布函数如下表的分布律和分布函数如下表R1R1犯第犯第I类错误的概率是类错误的概率是左边检验和右边检验左边检验和右边检验 为查明某种血清是否会抑制白血病为查明某种血清是否会抑制白血病,选取患选取患白血病已到晚期的老鼠白血病已到晚期的老鼠9只只,其中有其中有5至接受这种至接受这种治疗治疗,另另4只则不作这种治疗只则不作这种治疗.设两样本相互独立设两样本相互独立.从试验开始时计算从试验开始时计算,其存活时间其存活时间(以月计以月计)如下如下:设治疗与否的存活时间的概率密度至设治疗
22、与否的存活时间的概率密度至多只差一个平移多只差一个平移.问这种血清对白血问这种血清对白血病是否有抑制作用病是否有抑制作用?例例1解解根据题意需检验老鼠的存活期是否有增长根据题意需检验老鼠的存活期是否有增长,需要检验的假设是需要检验的假设是:将两组数据放在一起按自小到大的次序排列将两组数据放在一起按自小到大的次序排列,故拒绝故拒绝H0.认为这种血清对白血病有抑制作用认为这种血清对白血病有抑制作用.查附表查附表7知知附表附表7 秩和临界值表秩和临界值表(2,4)(4,4)(6,7)3110.06711250.02928560.026(2,5)12240.05730540.0513130.047(4
23、,5)(6,8)(2,6)12280.03229610.0213150.03613270.05632580.0544140.071(4,6)(6,9)(2,7)12320.01931650.0253170.02814300.05733630.0446.特殊情况特殊情况(1)来检验假设检验问题来检验假设检验问题解解 某商店为了确定向公司某商店为了确定向公司 A 或公司或公司 B 购买某购买某种商品种商品,将将 A,B 公司以往各次进货的次品率进行公司以往各次进货的次品率进行比较比较,数据如下数据如下,设两样本独立设两样本独立.问两公司的商问两公司的商品的质量有无明显差异品的质量有无明显差异.设两
24、公司的商品的次品设两公司的商品的次品率的密度最多只差一个平移率的密度最多只差一个平移.需要检验的假设是需要检验的假设是:例例2先将数据按大小次序排列先将数据按大小次序排列,故接受故接受H0.认为两个公司商品的质量无显著差异认为两个公司商品的质量无显著差异.两位化验员各自读得某种液体粘度如下两位化验员各自读得某种液体粘度如下:设数据可以认为来自仅均值可能有差异的总体的设数据可以认为来自仅均值可能有差异的总体的样本样本.解解 将两样本的元素混合将两样本的元素混合,按自小按自小到大次序排列到大次序排列.并求出各元素的秩并求出各元素的秩如下如下.例例3故接受故接受H0.认为两个化验员所测得的数据无显著
25、差异认为两个化验员所测得的数据无显著差异.小小 结结基本概念基本概念:秩的定义、秩和的定义、秩和检验法的定义秩的定义、秩和的定义、秩和检验法的定义.提出提出假设假设 根据统计调查的目的根据统计调查的目的,提出提出原假设原假设H0 和备选假设和备选假设H1作出作出决策决策抽取抽取样本样本检验检验假设假设 对差异进行定量的分析,对差异进行定量的分析,确定其性质确定其性质(是随机误差是随机误差还是系统误差还是系统误差.为给出两为给出两者界限,找一检验统计量者界限,找一检验统计量T,在在H0成立下其分布已知成立下其分布已知.)拒绝还是不能拒绝还是不能拒绝拒绝H0显著性显著性水平水平P(T W)=-犯第一犯第一类错误的概率,类错误的概率,W为拒绝域为拒绝域总总 结结