《第七章 假设检验课件.ppt》由会员分享,可在线阅读,更多相关《第七章 假设检验课件.ppt(32页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、利用样本统计量对总体某些性质或数量利用样本统计量对总体某些性质或数量特征进行推断。特征进行推断。随机原则随机原则总体参数总体参数统计量统计量推断估计推断估计参数估计参数估计检验检验假设检验假设检验抽样分布抽样分布 基本思想基本思想 检验规则检验规则 检验步骤检验步骤 常见的假设检验常见的假设检验 方差分析方差分析 基本思想基本思想小概率原理:小概率原理:如果对总体的某种假设是如果对总体的某种假设是的,那么不利于的,那么不利于或不能支持这一假设的事件或不能支持这一假设的事件A(小概率事件)(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中几乎不可能发生的;要是,就有理由怀疑该假设的,就
2、有理由怀疑该假设的真实性,真实性,这一假设。这一假设。总总 体体(某种假设)(某种假设)抽样抽样样样 本本(观察结果)(观察结果)检验检验(接受)(接受)(拒绝)(拒绝)小概率事件小概率事件未未 发发 生生小概率事件小概率事件发发 生生假设的形式:假设的形式: H0原假设,原假设, H1备择假设备择假设 双侧检验:双侧检验:H0:=0 , H1:0单侧检验:单侧检验: H0: = 0 , H1:0 H0: = 0 , H1:0 假设检验就是根据样本观察结果对原假设(假设检验就是根据样本观察结果对原假设(H0)进行检验,)进行检验,接受接受H0,就否定,就否定H1;拒绝;拒绝H0,就接受,就接受
3、H1。 检验规则检验规则检验过程是比较样本观察结果与总体假设的差异。差异显著,检验过程是比较样本观察结果与总体假设的差异。差异显著,超过了临界点,拒绝超过了临界点,拒绝H0;反之,差异不显著,接受;反之,差异不显著,接受H0差差 异异|0X|0X两类错误两类错误接受或拒绝接受或拒绝H0,都可能犯错误,都可能犯错误I类错误类错误弃真错误,弃真错误, 发生发生 的概率为的概率为 II类错误类错误取伪错误,发生取伪错误,发生 的概率为的概率为检验决策检验决策 H0为真为真 H0非真非真拒绝拒绝H0 犯犯I类错误(类错误() 正确正确接受接受H0 正确正确 犯犯II类错误(类错误() 怎样确定怎样确定
4、c?大大就小,就小,小小就大就大 显著性水平,取值:显著性水平,取值:0.1, 0.05, 0.01, 等。如果犯等。如果犯I类错误损类错误损失更大,为减少损失,失更大,为减少损失,值取小;如果犯值取小;如果犯II类错误损失更,类错误损失更,值值取大。取大。 确定确定,就确定了临界点,就确定了临界点c。),(2nNXX) 1 , 0 (NnXZ|2Z2Z2Z0 当检验判断为接受原假设当检验判断为接受原假设H0时,就有可能犯取伪的错误即时,就有可能犯取伪的错误即II类错误。类错误。确定犯第确定犯第类错误的概率类错误的概率比较困难比较困难 ,具体计算可根,具体计算可根据书上的例子。据书上的例子。统
5、计上把统计上把 称为统计检验的势,它是原假设实际上是错误的称为统计检验的势,它是原假设实际上是错误的应该被拒绝的概率。应该被拒绝的概率。 II类错误的概率类错误的概率的计算的计算1 检验步骤检验步骤根据具体问题的要求,根据具体问题的要求,建立总体假设建立总体假设H0,H112选择统计量选择统计量确定确定H0为真时的抽样分布为真时的抽样分布3给定显著性水平给定显著性水平,当原假,当原假设设H0为真时,求出临界值。为真时,求出临界值。计算检验统计量的数计算检验统计量的数值与临界值比较值与临界值比较4 几种常见的假设检验几种常见的假设检验条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0
6、:=0 H1:022z(2) H0: = 0 H1:0(3) H0: = 0 H1:z0z0nxZ0正态总正态总体体2已已知知2Z2ZZZ2Z条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0:=0 H1:022t(2) H0: = 0 H1:0(3) H0: = 0 H1:t0t0nsxt02t2t0正态总正态总体体2未未知知(n30)tt条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0:=0 H1:022z(2) H0: = 0 H1:0(3) H0: = 0 H1:z0z02Z2Z0nxZ0nSxZ0非正态非正态总体总体n302已知已知或未知或未知ZZ条件条件检
7、验条件量检验条件量拒绝域拒绝域H0、H1(1) H0: 1=2 H1: 1 2 22z(2) H0:1 = 2 H1: 1 2 (3) H0: 1 = 2 H1:1 2 z0z02Z2Z022212121nnxxZ两个正两个正态总体态总体2122,已知已知ZZ条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0: 1 = 2 H1: 1 2 22t(2) H0: 1 = 2 H1: 1 2 (3) H0: 1 = 2 H1: 1 2 t0t02t2t0两个正两个正态总体态总体2122,未知,未知,但相等但相等2) 1() 1(21222211nnSnSnSptt212111nnsxx
8、tp条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0:1 = 2 H1:1 2 22(2) H0:1 = 2 H1:1 2 (3) H0:1 = 2 H1:1 2 0z02Z2Z0两个非两个非正态体正态体n130 n2302122,已知或已知或未知未知22212121nnxxZ22212121nSnSxxZzzZZ条件条件检验条件量检验条件量拒绝域拒绝域H0、H1(1) H0:P=P0 H1:PP022z(2) H0:P = P0 H1:PP0(3) H0:P = P0 H1:PP0z0z02Z2Z0np5nq5nqpppZ000ZZ条件条件检验条件量检验条件量拒绝域拒绝域H0、
9、H1(1) H0:P1=P2 H1:P1 P2 22z(2) H0: P1 P2 H1:P1 P2(3) H0:P1 P2 H1:P1 P2z0z02Z2Z0n1p15n1q15n2p25n2q252122112121nnpnpnpnqpnqpppZZZ条件条件检验条件量检验条件量拒绝域拒绝域H0、H1总体服总体服从正态从正态分布分布222) 1(Sn2020:H2021:H22) 1(22) 1(21nn2020:H2021:H2020:H2021:H222) 1( n2) 1(1n条件条件检验条件量检验条件量拒绝域拒绝域H0、H1总体服总体服从正态从正态分布分布22210:H22211:H
10、22210:H22211:H22210:H22211:H22222221/SSF ) 1, 1(2) 1, 1(212121nnnnFF)1, 1(21 nnF) 1, 1(121nnFFFF 方差分析方差分析一、问题的提出一、问题的提出同一原材同一原材料加工产料加工产品质量品质量产地产地各组产品各组产品的质量是的质量是否有显著否有显著差异?差异?随机随机 原则原则一个班级一个班级 的学生,的学生,某门课程某门课程的成绩的成绩专业专业 分组分组各组学生的成各组学生的成绩是否有显著绩是否有显著差异?差异?差异差异随机误差随机误差系统误差系统误差随机随机 原则原则加以比较加以比较若存在显著性差异,
11、则说明该因素的影响是显著的若存在显著性差异,则说明该因素的影响是显著的二、假定条件二、假定条件各组水平都服从正态分布,均值和方差未知,但各组水平都服从正态分布,均值和方差未知,但方差相同方差相同),(2iiNX(i=1,2,3, ,k)三、单因素方差分析三、单因素方差分析H0:各水平的均值相等:各水平的均值相等 H1:各水平均值不全相等各水平均值不全相等总离差平方和总离差平方和=组间离差平方和组间离差平方和+组内离差平方和组内离差平方和 离差平方和:离差平方和:SST= SSB + SSE自由度:自由度: n-1 = k-1 + n-k方差:方差: MST MSB MSE检验量检验量=系统误差
12、系统误差/随机误差随机误差即:即: F=MSB/MSE), 1(knkF检验规则检验规则学员成绩表1234职员家庭6.27.89.18.9工人家庭5.45.86.97.5农民家庭5.16.35.97.5方差分析:单因素方差分析SUMMARY组计数求和平均方差职员家庭4328 1.766667工人家庭425.66.40.94农民家庭424.86.21方差分析差异源SSdfMSFP-valueF crit组间7.7866672 3.893333 3.151079 0.091771 4.256492组内11.129 1.235556总计18.9066711因为:因为:F=3.15 (0.05)所以接
13、受原假设,认为不同的家庭背景对学员成绩没所以接受原假设,认为不同的家庭背景对学员成绩没有显著影响。有显著影响。 四、不考虑交互作用的两因素方差分析四、不考虑交互作用的两因素方差分析H0 (A):因素因素A的的k个水平的均值相等个水平的均值相等 H1 (A): 不全相等不全相等总离差平方和总离差平方和=组间离差平方和组间离差平方和 +组内离差平方和组内离差平方和 离差平方和:离差平方和:SST= SS(A)+SS(B)+ SSE自由度:自由度: kh-1 = k-1 +h-1 + (k-1)(h-1)方差:方差: MST MS(A) MS(B) MSE检验量检验量=系统误差系统误差/随机误差随机
14、误差即:即: F(A)=MS(A)/MSE F(B)=MS(B)/MSE H0(B): 因素因素B的的h个水平的均值相等个水平的均值相等 H1(B):不全相等不全相等)1)(1( , 1(hkkF检验规则检验规则)1)(1( , 1(hkhFB1B2B3B4A115171518A219151815A316191817方差分析:无重复双因素分析SUMMARY计数求和平均方差A146516.252.25A246716.754.25A347017.5 1.666667B1350 16.66667 4.333333B2351174B3351173B4350 16.66667 2.333333 方差分析
15、差异源SSdfMSFP-valueF crit行3.1666672 1.583333 0.3931030.69115 5.143249列0.3333333 0.111111 0.0275860.99317 4.757055误差24.166676 4.027778总计27.6666711因为:因为:F(A)=0.3935.14 F(B)=0.028 (0.05) P(B)(0.99) (0.05)所以接受原假设,认为不同的机器设备和不同的工艺所以接受原假设,认为不同的机器设备和不同的工艺方法对生产量都没有显著影响。方法对生产量都没有显著影响。 五、考虑交互作用的两因素方差分析五、考虑交互作用的两
16、因素方差分析H0 (A):因素因素A的的k个水平的均值相等个水平的均值相等 H1(A):不全相等不全相等总离差平方和总离差平方和=组间离差平方和组间离差平方和 +组内离差平方和组内离差平方和离差平方和离差平方和:SST= SS(A)+SS(B)+SS(AB)+ SSE自由度:自由度: khm-1 = k-1 + h-1 + (k-1)(h-1)+kh(m-1)方差:方差: MST MS(A) MS(B) MS(AB) MSE检验量检验量=系统误差系统误差/随机误差随机误差即:即: F(A)=MS(A)/MSE F(B)=MS(B)/MSE F(AB)=MS(AB)/MSEH0(B): 因素因素
17、B的的h个水平的均值相等个水平的均值相等 H1(B) :不全相等不全相等H0(AB): AB之间不存在交互影响的作用之间不存在交互影响的作用 H1(AB):有交互影响有交互影响 )1(, 1(mkhkF检验规则检验规则)1(, 1(mkhhF)1(),1)(1(mkhkhF例:例:B1B2B3B4A1151715181517172017171622A2191518151915171616151617A3161918171822181721221817 方差分析:可重复双因素分析SUMMARYB1B2B3B4总计A1计数333312求和47514860206平均15.66667171620 17
18、.16667方差1.333333014 4.333333A2计数333312求和54455148198平均1815171616.5方差3011 2.272727A3计数333312求和55635451223平均18.33333211817 18.58333方差6.333333300 4.083333 总计计数9999求和156159153159平均17.33333 17.6666717 17.66667方差4.257.751.254.5方差分析差异源SSdfMSFP-valueF crit样本27.166672 13.58333 7.8870970.00233 3.402832列2.753 0
19、.916667 0.532258 0.664528 3.008786交互73.5612.25 7.112903 0.000192 2.508187内部41.3333324 1.722222 因为:因为:F(A)=7.893.40 F(B)=0.532.51或或 P(A)(0.002) (0.05) P(AB)(0.0002) (0.05) 所以认为不同的机器设备对日产量有显著影响。不同所以认为不同的机器设备对日产量有显著影响。不同的工艺方法对日产量没有显著影响。不同机器设备与的工艺方法对日产量没有显著影响。不同机器设备与工艺搭配的交互作用对日产量有显著的影响。工艺搭配的交互作用对日产量有显著的影响。