2.1--符号检验ppt课件.ppt

上传人:醉**** 文档编号:15158485 上传时间:2022-05-11 格式:PPT 页数:28 大小:1.14MB
返回 下载 相关 举报
2.1--符号检验ppt课件.ppt_第1页
第1页 / 共28页
2.1--符号检验ppt课件.ppt_第2页
第2页 / 共28页
点击查看更多>>
资源描述

《2.1--符号检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《2.1--符号检验ppt课件.ppt(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第二章第二章单一样本的推断问题单一样本的推断问题12.12.1符号检验及分位数的符号检验及分位数的推断问题推断问题( (连续分布连续分布) )22. 1 符号检验及分位数的推断问题(连续分布)例例1:假设某城市:假设某城市16座预出售的楼盘均价座预出售的楼盘均价(单位单位:百元百元/ )如下表所示:如下表所示: 16座预出售的楼盘均价座预出售的楼盘均价 问:该地区平均楼盘价格是否与媒体公布的问:该地区平均楼盘价格是否与媒体公布的3700元元/ 的说法相等?的说法相等? 2m 36 32 31 25 28 36 40 32 41 26 35 35 32 87 33 352m3解:若假设楼盘均价服

2、从正态分布,则由参数统计分析,若假设楼盘均价服从正态分布,则由参数统计分析,建立假设检验问题如下建立假设检验问题如下: : 由于由于 为小样本,为小样本, ,构造枢轴,构造枢轴量量 在零假设在零假设 成立下,代入数值得成立下,代入数值得 ,而又知而又知P P值为值为 ,在显著性水平,在显著性水平以下,都不能拒绝零假设以下,都不能拒绝零假设. .01:37,:37HH236.5,200.53XS() (1)n XTt nS0H00.1412t 0()0.89P Tt0.8916 30n4 以上以上16个数据中,其中有个数据中,其中有3个楼盘的均价高于个楼盘的均价高于37,13个楼盘的均价低于个楼

3、盘的均价低于37,由正态分布的对称性,若,由正态分布的对称性,若37为为楼盘均价格的平均水平,则从总体中抽取的数据分布楼盘均价格的平均水平,则从总体中抽取的数据分布在在37左右的个数应该大致相等,不应该出现比例失衡,左右的个数应该大致相等,不应该出现比例失衡,因此因此37不能作为正态分布的对称中心。不能作为正态分布的对称中心。 然而若知道某一连续数据总体中心位置的参数(中然而若知道某一连续数据总体中心位置的参数(中位数和均值),总体均值的点估计是样本均值,总体位数和均值),总体均值的点估计是样本均值,总体中位数的点估计是样本中位数,对于单峰对称分布来中位数的点估计是样本中位数,对于单峰对称分布

4、来说,两者差别不大,而对于非对称分布来说,中位数说,两者差别不大,而对于非对称分布来说,中位数较均值对总体的中心位置来说,将是更稳健的估计。较均值对总体的中心位置来说,将是更稳健的估计。 由于分布未知,使用参数估计会出现错误,则以上检验由于分布未知,使用参数估计会出现错误,则以上检验用中位数检验较为合理,由此引入非参数统计。用中位数检验较为合理,由此引入非参数统计。51. 符号检验的基本概念4 定义:定义:通过符号通过符号“ + ”和和“ - ”的个数来进行统计推的个数来进行统计推断的方法,我们称为符号检验。符号检验是最古老的断的方法,我们称为符号检验。符号检验是最古老的检验方法之一检验方法之

5、一. 符号检验的基本原理符号检验的基本原理基本原理:基本原理:对于例对于例1中的数据,要么大于中的数据,要么大于37,要么小于,要么小于37,记,记 , , ,由于每一个样本由于每一个样本等可能的出现在等可能的出现在37的左右,从而有的左右,从而有 而而 过大或者过小都表示过大或者过小都表示37不能作为总体的中心,故不能作为总体的中心,故在在 过大或者过小时我们拒绝零假设过大或者过小时我们拒绝零假设. 0#iSXM0#iSXM ( ,0.5)Sb nSS6中位数检验的过程4 假设总体为假设总体为 , 为总体的中位数,则可以建为总体的中位数,则可以建立以下假设检验问题:立以下假设检验问题: 其中

6、其中 为待检验的中位数,为待检验的中位数, 为来自于为来自于 的简单随机样本的简单随机样本.()F MMe左侧检验左侧检验右侧检验右侧检验双边检验双边检验0010:,:HMeMHMeM0M12,nXXX()F M0010:,:HMeMHMeM0010:,:HMeMHMeM7 记:记: , (其中(其中#表示满足括号表示满足括号中表达式的个数)中表达式的个数)而而 ,令,令 则在零假设则在零假设 下,以双侧检验为例,检验问题就变为下,以双侧检验为例,检验问题就变为 其中其中 此时,此时, ,可以按抽样分布,可以按抽样分布 求解得到求解得到.在给定显著性水平在给定显著性水平 下,检验的拒绝域为下,

7、检验的拒绝域为0#iSXM0#iSXMSSnnmin,KS S0H01:0.5,:0.5HpHp00 (1,),()iiXMYIbppp XMKk( ,0.5)b n2 (|,0.5)p Kk n p0010:,:HMeMHMeM8p p值值 当当 时,则在显著性水平时,则在显著性水平 下拒绝零假设下拒绝零假设 当当 时,则在显著性水平时,则在显著性水平 下接受零假设下接受零假设中位数检验的结果中位数检验的结果 当当 时,时, ;当;当 时,时, ;2 (|,0.5)p Kk nppp 零假设零假设 备择假设备择假设 检验统计量检验统计量 p值值其中其中 是满足上式中的是满足上式中的 的取值的

8、取值0M eM0M eM0M eM0M eM0M eM0M eMKSKSmin,KSSkK(,0.5)Kb n()p Kk()p Kk2 ()p Kk2nS2nSKSKS9例:(续前面的例1) 由于分布未知,考虑非参数统计由于分布未知,考虑非参数统计解:解: ,P值值 在给定显著性水平在给定显著性水平 下,下, ,拒绝零假设,故认为该地平均楼盘,拒绝零假设,故认为该地平均楼盘价格与与媒体公布的价格与与媒体公布的37之间存在显著性差异之间存在显著性差异 36 32 31 25 28 36 40 32 41 26 35 35 32 87 33 35-+-+-+-min,KS S3k16nSS 2

9、(3|16,0.5)p Knp31601612( )0.02132ii0.05p01:37,:37HMeHMe10 在在t t检验中,不能拒绝零假设,但是也并不意味着接受零假设,而检验中,不能拒绝零假设,但是也并不意味着接受零假设,而是得到了不犯第二类错误的概率,而符号检验仅在假定数据为常规连续是得到了不犯第二类错误的概率,而符号检验仅在假定数据为常规连续分布下,得到了拒绝的结论,这一决策的风险至少是分布下,得到了拒绝的结论,这一决策的风险至少是0.050.05以下,说明已以下,说明已收集的数据对于下可靠性的结论是充分的收集的数据对于下可靠性的结论是充分的. . 综上可得,综上可得,t t检验

10、在正态假设下得到了不可靠的结论,(可能由于检验在正态假设下得到了不可靠的结论,(可能由于信息不足,也有其他原因,如假定不当),由于符号检验说明了信息的信息不足,也有其他原因,如假定不当),由于符号检验说明了信息的充分性,于是分布假定不当才是使用充分性,于是分布假定不当才是使用t t检验失败的原因检验失败的原因. . 所以,符号检验的结果较所以,符号检验的结果较t t检验的结果更可信检验的结果更可信. . 112.分位数检验(广义符号检验 ) 同样记:同样记: , (其中(其中#表示满足表示满足括号中表达式的个数)括号中表达式的个数) 在零假设在零假设 下下 ,由于由于 , (当(当 所有样本点

11、都不等于所有样本点都不等于 时,时, ,而如果有些样本点等于,而如果有些样本点等于 ,那么这些样,那么这些样本点就不能参与推断,此时,本点就不能参与推断,此时, )0#iSXq0#iSXq0010:HQqHQq0H0Qq ( , ),()Sb n ppp XMnSSn0qnn 0qnn12分位数检验的结果分位数检验的结果 零假设零假设 备择假设备择假设 p值值检验有意义的条件检验有意义的条件其中其中 是满足上式最大得是满足上式最大得 ,且且0Qq0Qq0Qq0()HPKskK(,0.5)Kb n0Qq0Qq0Qq01(1)HPKs002min(),1(1)HHP K sP K s0Qq0Qq如

12、果检验不满足条件,不用计算也知道检验结果不显著如果检验不满足条件,不用计算也知道检验结果不显著0001(1)()()HHHP K sP K sP K s 002min(),()HHP K sP K s13例2.(书中的例2.1)分位数检验分位数检验P P值值 在给定显著性水平在给定显著性水平 下,下, ,拒绝零假设,即下四分位,拒绝零假设,即下四分位点点 应该小于应该小于6464 00.2510.25:64:64HQH Q1 ( , ),28,43,714Sb nSSnSS001(1) 1(27)0.00515HHPKsPK 0.01p0.25Q14中位数检验中位数检验P P值值 在给定显著性

13、水平在给定显著性水平 下,下, ,拒绝零假设,即中位数,拒绝零假设,即中位数 应该大于应该大于6464 01:64:64HMeHMe ( ,0.5),28,43,71Sb nSSnSS28710711()(28)( )0.047962iP KkP Ki0.05pMe153.大样本近似 当样本较大时(当样本较大时( ),可以使用二项分布的正),可以使用二项分布的正态近似进行检验,而当样本容量不够大时,可以使用态近似进行检验,而当样本容量不够大时,可以使用正态性修正来近似正态性修正来近似. a.中位数的近似检验中位数的近似检验 当当 较大时,由较大时,由 30Nn1(,),(,)224nnSb n

14、SN2(0,1)4LnSZNn 16 当当 不够大时,可以使用不够大时,可以使用Z的正态连续性修正,如的正态连续性修正,如下式下式 一般地,当一般地,当 时,时, ;当;当 时,时, ;n2(0,1)4LnScZNn 2nS12c12c2nS17 由绪论知识可知,一个离散分布的点的概率由绪论知识可知,一个离散分布的点的概率 可以用连续(如正态分布)分布的相应区间可以用连续(如正态分布)分布的相应区间 来近似,则离散分布的概率来近似,则离散分布的概率 可以用连续分布可以用连续分布 来近似来近似. . 因此,较大点处的分布函数作正态分布正修正结果因此,较大点处的分布函数作正态分布正修正结果 与二项

15、分与二项分布的精确分布比较接近,而对于较小点处的分布函数作正态分布负修正布的精确分布比较接近,而对于较小点处的分布函数作正态分布负修正结果结果与二项分布的精确分布比较接近与二项分布的精确分布比较接近. .()P Xx11()22P xXx1()2P Xx ()P Xx1()2c 1()2c 18 b.分位数的近似检验分位数的近似检验 当当 较大时,在零假设较大时,在零假设 下,下, 当当 不够大时,可以使用不够大时,可以使用 的连续性修正的连续性修正 一般地,当一般地,当 , ; 当当 , ;n00:HQq ( , )Kb n p(0,1)(1)LKnZNn nZ(0,1)(1)LKncZNn

16、 2nK12c2nK12c19近似检验的结果 零假设零假设 备择假设备择假设 p p值值 0H1H0M eM0M eM0MeM0MeM0MeM0MeM(0,1)()NPZz(0,1)()NPZz(0,1)2()NPZz20例例3 3:设某化妆品厂商有设某化妆品厂商有A A和和B B两个品牌,为了解客户对两个品牌,为了解客户对A A,B B两品牌化妆两品牌化妆品在使用上的差异,将品在使用上的差异,将A,BA,B品牌化妆品同时交给品牌化妆品同时交给4545位客户使用,一个月位客户使用,一个月以后得到如下数据:以后得到如下数据: 喜欢喜欢A A品牌的客户人数为:品牌的客户人数为:2222人人 喜欢喜

17、欢B B品牌的客户人数为:品牌的客户人数为:1818人人 不能区分的人数:不能区分的人数:5 5人人分析在显著性水平分析在显著性水平 下,是否认为两种品牌在市场上的被喜欢程下,是否认为两种品牌在市场上的被喜欢程度有差异?度有差异?0.121解:设 表示喜欢A A,B B品牌的客户比例建立假设检验:建立假设检验: 记记 表示喜欢表示喜欢A A品牌的客户人数,品牌的客户人数, 为喜欢为喜欢B B品牌的客户人数品牌的客户人数由于由于 ,所以取正态分布正修正,所以取正态分布正修正 ( ), ( )P A P B01: ( )( ): ( )( )HP AP BHP AP BSS22 1840,202n

18、nSS20S1222020.7906404Z22 在给定显著性水平在给定显著性水平 下下,由于由于 , ,证据不足,不能拒绝零假设,没有证据显示客户在品牌证据不足,不能拒绝零假设,没有证据显示客户在品牌A A和和B B上存在显著差异上存在显著差异 而实际中,而实际中,A A品牌和品牌和B B品牌固然存在差异,可能由于随机抽样产生,品牌固然存在差异,可能由于随机抽样产生,并非本质差异并非本质差异. .随机性是客观存在而无法避免的,检验中表现出来统计随机性是客观存在而无法避免的,检验中表现出来统计量显著的差异则是本质差异量显著的差异则是本质差异. .0.1121.96Z1.96Z 234.置信区间

19、 有时不仅要估计参数的位置有时不仅要估计参数的位置, ,也想知道它的也想知道它的的置信区间的置信区间用顺序统计量构造分位数的置信区间用顺序统计量构造分位数的置信区间 令令 独立取自同一分布,独立取自同一分布, 为样本的顺序统计量,若为样本的顺序统计量,若 对于对于 ,若满足,若满足 则称则称 为为 的的 置信区间置信区间100(1)%1,nXX(1)(2)( ),nXXX()ipP Xmpij 1( )()()(1)1jhnhipjhinP XmXpph( )( )(,)ijXXpm100 (1)%24当当 时,时, 为为 的置信度为的置信度为 的置信区间的置信区间2)2)中位数中位数 的对称

20、置信区间的对称置信区间 不失一般性,假定不失一般性,假定 , ,如果如果 时可以拒绝零假设,而时可以拒绝零假设,而在在 时不能拒绝零假设,或者说时不能拒绝零假设,或者说 是最大地能够拒绝是最大地能够拒绝 的的数目,等价地,数目,等价地, 为最小的能够拒绝为最小的能够拒绝 的数目,则的数目,则 或或 为为 的的 的置信区间的置信区间0.5p( )( )(,)ijXXMe100 (1)%MeSS1Sk1Sk 1Sk S1Sn k 0H( )(1)(,)kn kXX (1)(),kn kXXMe100 (1)%1( )()1()()12jniejhinP XmXh25例例4 4:某一企业生产一种钢管

21、,规定长度的中位数为某一企业生产一种钢管,规定长度的中位数为10m10m,现随机地从正,现随机地从正在生产的生产线上取在生产的生产线上取1010根进行测量如下:根进行测量如下: 9.8 10.1 9.7 9.9 9.8 10.0 9.7 10.0 9.9 9.8 9.8 10.1 9.7 9.9 9.8 10.0 9.7 10.0 9.9 9.81 1)问生产需要调整吗?)问生产需要调整吗?2 2)在给定置信度为)在给定置信度为0.950.95下,求测量钢管长度的中位数的置信区间?下,求测量钢管长度的中位数的置信区间?26解:解:建立假设检验问题:建立假设检验问题:试验数据符号表试验数据符号表

22、 P P值值= =01:10:10HMeHMe9.8 10.1 9.79.9 9.8 10.0 9.7 10.0 9.9 9.8 - + - - - 0 -0 - -1,7,8 10SSnSS 180812 (1)2( )2 0.03520.07042ip Si 27 在给定显著性水平在给定显著性水平 下,下, , ,所以生产暂时不需要调整所以生产暂时不需要调整将数据按照从小到大的顺序排列,得到顺序统计量将数据按照从小到大的顺序排列,得到顺序统计量 9.7 9.7 9.8 9.8 9.8 9.9 9.9 10.0 10.0 10.1 9.7 9.7 9.8 9.8 9.8 9.9 9.9 10.0 10.0 10.1在显著性水平在显著性水平 下,样本数据个数为下,样本数据个数为n,n,查到左尾的正好和右尾的负查到左尾的正好和右尾的负号的数目为号的数目为 ,因此中位数,因此中位数 的的 置信区间为置信区间为 故中位数故中位数 的的 的置信区间为的置信区间为0.05p0.052kMe95%(2 1)(10 2)XMeXMe95%9.8,1028

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 其他杂项

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁