《N假设检验的基本思想.pptx》由会员分享,可在线阅读,更多相关《N假设检验的基本思想.pptx(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 例1.设某厂生产一种灯管,其寿命 XN(m m ,200 2),原来灯管的平均寿命为m m=1500小时.现在采用新工艺后,在所生产的灯管中抽取25只,测得平均寿命为1675小时.问采用新工艺后,灯管寿命是否有显著提高?问题表现为:判断 m m 1500?例2.某种农作物的农药残留量 X 是否服从正态分布?问题表现为:农药残留量 X 服从正态分布?一、假设检验的基本思想一、假设检验的基本思想 以上例子共同点是,根据样本值去判断一个“看法”是否成立.例1的“m m 1500”,例2的“残留量 X 服从正态分布”.“看法”即对总体分布状态的一种陈述,称为统计假设.8.1 假设检验的基本思想和概念
2、假设检验的基本思想和概念下页第1页/共10页 如何提出原假设如何提出原假设H0:m m =m m0H1:m m m m0双侧检验H0:m m =m m0 (m m m m0)右单侧检验左单侧检验要点:含等号“=”的作为原假设(这样做就是为了数学处理的方便).下页统计假设包括原假设与备择假设.如何提出原假设?-问题 原假设 备择假设 名称(类型)-m m比m m0有显著 变化(差异)?m m比m m0有显著 提高(增大)?m m比m m0有显著 降低(减少)?H1:m m m m0H1:m m m m0H0:m m =m m0 (m m m m0)-第2页/共10页 例3.3.设某考试成绩XN(
3、m m,202),从中任抽36人的成绩,算得平均分为75,问在显著性水平a a =下,是否可以认为全体考生的平均成绩为70分?要点:某考试(所有)成绩是总体,任意抽取的36人的成绩为样本.欲通过样本信息推断总体分布中的 m m 是否为70分?检验逻辑(形而上):假设总体分布中的假设总体分布中的m m是是7070,即,即 H0:m m=70;推导出样本均值所服从的分布;推导出样本均值所服从的分布;确定样本均值分布的小概率确定样本均值分布的小概率(或大概率或大概率)事件取值范围;事件取值范围;观察观察所给样本均值所给样本均值是否落在小概率是否落在小概率(或大概率或大概率)事件取值范围内;事件取值范
4、围内;做出统计推断:若属小概率事件发生,则拒绝做出统计推断:若属小概率事件发生,则拒绝H0,否则接受否则接受H0.检验的逻辑过程检验的逻辑过程下页 检验依据:小概率事件在一次试验中一般不发生,若发生了,则认为小概率事件在一次试验中一般不发生,若发生了,则认为不合理;反之,大概率事件在一次试验中发生了,则认为合理不合理;反之,大概率事件在一次试验中发生了,则认为合理.最朴素最自然来自内心深处的最初思考:最朴素最自然来自内心深处的最初思考:样本均值为样本均值为7575分分,是大概率事件吗?是大概率事件吗?怎么能知道怎么能知道:样本均值为样本均值为7575分是否为大概率事件,分是否为大概率事件,即样
5、本均值的分布是什么?即样本均值的分布是什么?样本均值的分布取决于总体的分布,那么,总体的分样本均值的分布取决于总体的分布,那么,总体的分布是什么?布是什么?(显然显然:!)第3页/共10页即总体XN(70,202),下页 例3.3.设某考试成绩XN(m m,202),从中任抽36人的成绩,算得平均分为75,问在显著性水平a a =下,是否可以认为全体考生的平均成绩为70分?检验过程(形而下):H0:m m =m m0=70,从而知 样本均值的小(大)概率事件的取值范围 给定的样本均值75在大概率事件的取值范围内!推断:接受H0.第4页/共10页 检验过程的标准化检验过程的标准化查表得U的接受域
6、(大概率事件域)为|U|,所给样本值转化为显然,样本值U在接受域内,接受H0.可认为总平均为70分.在实际问题中,为了便于查表计算,一般不直接讨论样本均值的分布规律,而是选择一个含有样本均值与被检验参数的统计量来讨论,这样做就相当于进行了一个一一对应的映射,所以问题的本质不变!但问题的矛盾却转移到常见的统计量上了.下页 在本例中的具体做法是,因为原假设为H0:m m =m m0=70,所以选择统计量第5页/共10页 当H0为真时,统计量的大概率事件取值范围,称为H0的接受域;统计量的小概率事件取值范围,称为H0的拒绝域.比如右单侧检验的拒绝域为右单侧分位点右边区域;同理左单侧检验的拒绝域为左单
7、侧分位点左边区域;双侧检验的拒绝域为双侧分位点的外侧区域.a a 称为显著性水平.接受域与拒绝域接受域与拒绝域下页二、假设检验的基本方法二、假设检验的基本方法 根据问题的要求提出原假设H0和备择H1;根据 H0选取统计量 U=U(X1,X2,Xn;q q)并确定其分布;对给定的显著性水平a a,确定拒绝域和接收域;计算统计量的值U=U(x1,x2,xn);推断:当U落入拒绝域,就拒绝H0;否则就接受H0.含要检验的参数q q第6页/共10页下页 例3.3.设某考试成绩XN(m m,202),从中任抽36人的成绩,算得平均分为75,问在显著性水平a a =下,是否可以认为全体考生的平均成绩为70
8、分?解:属单正态总体s s 2已知时,m m 的双侧检验问题.依题意有 H0:m m =70,H1:m m 70.选择统计量选择统计量 提出原假设提出原假设 确定拒绝域确定拒绝域 计算统计量的值计算统计量的值 推断推断U1.96.因为U=1.5,不在拒绝域内,所以接受H0 ,即可以认为全体考生的平均成绩为70分.完整解答第7页/共10页第类错误:“弃真”,H0为真时,H0被拒绝了.且第类错误:“纳伪”,H0不真时,H0被接受了.且P H0被拒绝/H0为真=a.a.P H0被接受/H0不真=.下页三、两类错误三、两类错误 在样本容量 n 确定后,a a 和b b不可能同时减小,除非增大样本容量 n,但 n无限增大是不可能的.奈曼与皮尔逊(Neyman-pearson)提出在控制犯第一类错误的概率a a 的条件下,尽量使犯第二类错误的概率b b小,基于这一原则寻求最优检验,也很难实现.于是只好再降低要求,实际中通常只控制犯第一类错误的概率a a.第8页/共10页F 检验 用 F分布一般说来,按照检验所用的统计量的分布,分为U 检验 用正态分布t 检验 用 t 分布检验用分布结束四、检验名称四、检验名称第9页/共10页感谢您的观看!第10页/共10页