《第4章 推断统计(参数估计与假设检验).ppt》由会员分享,可在线阅读,更多相关《第4章 推断统计(参数估计与假设检验).ppt(109页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、应用统计学应用统计学Applied StatisticsApplied Statistics4-12011年8月重庆工商大学重庆工商大学应用应用统计统计应应 用用 统统 计计 学学Applied StatisticsApplied Statistics应用统计学应用统计学Applied StatisticsApplied Statistics4-2不象其他科学,统计从来不打算使自己完美无缺,统计意味着你永远不需要确定无疑。Gudmund R.Iversen统计名言统计名言应用统计学应用统计学Applied StatisticsApplied Statistics4-3怎样解决下面的问题?怎样解
2、决下面的问题?l一个水库里有多少鱼?l一片原始森林里的木材储蓄量有多少?l一批灯泡的平均使用寿命是多少?l一批产品的合格率是多少?l怎样才能知道这些问题的答案?你不可能把一个水库里的水抽干去称鱼的重量,不可能把森林伐完去量木材有多少,不可能把一批灯泡都用完去计算它的平均寿命,也不可能把每一件产品都检测完才知道它的合格率第第 4 章章 推断统计推断统计4.1 怎样进行推断?怎样进行推断?4.2 估计总体参数估计总体参数4.3 检验总体假设检验总体假设4.1 怎样进行推断?怎样进行推断?4.1.1 用估计量估计总体参数用估计量估计总体参数 4.1.2 用什么方法进行估计?用什么方法进行估计?4.1
3、.3 用什么样的估计量去估计?用什么样的估计量去估计?第第 4 章章 推断统计推断统计4.1.1 用估计量估计总体参数用估计量估计总体参数4.1 怎样进行推断?怎样进行推断?应用统计学应用统计学Applied StatisticsApplied Statistics4-72008年5月关心总体的哪些参数?关心总体的哪些参数?一个总体一个总体两个总体两个总体参数参数符号符号估计量估计量参数参数符号符号估计量估计量均均值值均均值值差差比例比例比例差比例差方差方差方差比方差比应用统计学应用统计学Applied StatisticsApplied Statistics4-81.估计量:用于估计总体参数
4、的随机变量n如样本均值,样本比例,样本方差等如样本均值,样本比例,样本方差等n例如例如:样本均值就是总体均值样本均值就是总体均值 的一个估计量的一个估计量2.参数用 表示,估计量用 表示3.估计值:估计参数时计算出来的统计量的具体值n如果样本均值如果样本均值 x x =80=80,则,则8080就是就是 的估计值的估计值估计量与估计值估计量与估计值(estimator&estimated value)4.1.2 用什么方法进行估计?用什么方法进行估计?4.1 怎样进行推断?怎样进行推断?应用统计学应用统计学Applied StatisticsApplied Statistics4-10点估计点
5、估计(point estimate)1.用样本的估计量的某个取值直接作为总体参数的估计值 例例如如:用用样样本本均均值值直直接接作作为为总总体体均均值值的的估估计计;用用两个样本均值之差直接作为总体均值之差的估计两个样本均值之差直接作为总体均值之差的估计2.无法给出估计值接近总体参数程度的信息n n虽虽然然在在重重复复抽抽样样条条件件下下,点点估估计计的的均均值值可可望望等等于于总总体体真真值值,但但由由于于样样本本是是随随机机的的,抽抽出出一一个个具具体体的样本得到的估计值很可能不同于总体真值的样本得到的估计值很可能不同于总体真值n n一一个个点点估估计计量量的的可可靠靠性性是是由由它它的的
6、抽抽样样标标准准误误差差来来衡衡量量的的,这这表表明明一一个个具具体体的的点点估估计计值值无无法法给给出出估估计的可靠性的度量计的可靠性的度量 应用统计学应用统计学Applied StatisticsApplied Statistics4-11区间估计区间估计(interval estimate)1.1.在在点点估估计计的的基基础础上上,给给出出总总体体参参数数估估计计的的一一个个区区间间范范围,该区间由样本统计量加减估计误差而得到围,该区间由样本统计量加减估计误差而得到2.2.根根据据样样本本统统计计量量的的抽抽样样分分布布能能够够对对样样本本统统计计量量与与总总体体参数的接近程度给出一个概
7、率度量参数的接近程度给出一个概率度量n n比如,某班级平均分数在比如,某班级平均分数在75758585之间,置信水平是之间,置信水平是95%95%样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量 (点估计点估计点估计点估计点估计点估计)置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限应用统计学应用统计学Applied StatisticsApplied Statistics4-122008年5月区间估计的图示区间估计的图示 x95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的
8、样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58 x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x应用统计学应用统计学Applied StatisticsApplied Statistics4-131.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 2.表示为(1-n 为是总体参数未在区间内的比例3.常用的置信水平值有 99%,95%,90%n相应的相应的 为0.01,0.05,0.10置信水平置信水平(confidence level)应用统计学应用统计学Applied St
9、atisticsApplied Statistics4-141.由样本统计量所构造的总体参数的估计区间称为由样本统计量所构造的总体参数的估计区间称为置信区间置信区间2.统计学家在某种程度上确信这个区间会包含真正统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间的总体参数,所以给它取名为置信区间 3.用一个具体的样本所构造的区间是一个特定的区用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包间,我们无法知道这个样本所产生的区间是否包含总体参数的真值含总体参数的真值n n我们只能是希望这个区间是大量包含总体参数真值的我们只能是希望这个区间
10、是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个值的区间中的一个n n总体参数以一定的概率落在这一区间的表述是错误的总体参数以一定的概率落在这一区间的表述是错误的置信区间置信区间(confidence interval)应用统计学应用统计学Applied StatisticsApplied Statistics4-152008年5月置信区间置信区间(95%的置信区的置信区间间)重复构造出重复构造出重复构造出重复构造出 的的的的2020个个个个置信区间置信区间置信区间置信区间 点估计值点估计值点估计值点估计值我没
11、有抓住参数!我没有抓住参数!应用统计学应用统计学Applied StatisticsApplied Statistics4-162008年5月置信区间与置信水平置信区间与置信水平 均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布(1-(1-)%)%区间包含了区间包含了区间包含了区间包含了%的区间未包含的区间未包含的区间未包含的区间未包含 1 1 /2 2/2 24.1.3 用什么样的估计量去估计?用什么样的估计量去估计?4.1 怎样进行推断?怎样进行推断?应用统计学应用统计学Applied StatisticsApplied Statistics4-18无偏性无偏性(unbiasedn
12、ess)无偏性:无偏性:估计量抽样分布的数学期望等于被 估计的总体参数P P P()B BA A无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏应用统计学应用统计学Applied StatisticsApplied Statistics4-19有效性有效性(efficiency)有效性:有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效 AB 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分布P P()应用统计学应用统计学Applied StatisticsApplied Statistics4-20一致性一致性(consistency)一致
13、性:一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量P P()4.2 估计总体参数估计总体参数 4.2.1 总体均值的估计总体均值的估计 4.2.2 总体比例的估计总体比例的估计 4.2.3 总体方差的估计总体方差的估计第第 4 章章 推断统计推断统计4.2.1 总体均值的估计总体均值的估计4.2 估计总体参数估计总体参数应用统计学应用统计学Applied StatisticsApplied Statistics4-23一个总体均值的区间估计一个总体均值的区间估
14、计总体均值总体均值 在在1-1-置信水平下的置信水平下的置信区间置信区间1.大样本大样本(n n 30)30)2.小样本小样本(n n 30)30),总体方差,总体方差()未未知知样本均值样本均值分位数值分位数值样本均值的标准误差样本均值的标准误差应用统计学应用统计学Applied StatisticsApplied Statistics4-24一个总体均值的区间估计一个总体均值的区间估计(例题分析例题分析大样本大样本)【例例例例】一一家家保保险险公公司司收收集集到到由由3636个个投投保保人人组组成成的的随随机机样样本本,得得到到每每个个投投保保人人的的年年龄龄(单单位位:周周岁岁)数数据据
15、如如下表。试建立投保人年龄下表。试建立投保人年龄90%90%的置信区间的置信区间 3636个投保人年龄的数据个投保人年龄的数据个投保人年龄的数据个投保人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532应用统计学应用统计学Applied StatisticsApplied Statistics4-25一个总体均值的区间估计一个总体均值的区间估计(例题分析例题分析大样本大样本)解解解解:已已知知n n=36,=36,1-1-=90%90%,z z/2/2=1.645=1.645。根根据据样样
16、本本数数据据计算得:计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为投保人平均年龄的置信区间为投保人平均年龄的置信区间为37.3737.37岁岁41.6341.63岁岁 统计函数统计函数统计函数统计函数CONFIDENCECONFIDENCE应用统计学应用统计学Applied StatisticsApplied Statistics4-26一个总体均值的区间估计一个总体均值的区间估计(例题分析例题分析小样本小样本)【例例例例】已已知知某某种种灯灯泡泡的的寿寿命命服服从从正正态态分分布布,现现从从一一批批灯灯泡泡中中随随机机抽抽取取1616只只,测测得得其其使
17、使用用寿寿命命(单单位位:小小时时)如下。建立该批灯泡平均使用寿命如下。建立该批灯泡平均使用寿命95%95%的置信区间的置信区间1616灯泡使用寿命的数据灯泡使用寿命的数据灯泡使用寿命的数据灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470应用统计学应用统计学Applied StatisticsApplied Statistics4-27一个总体均值的区间估计一个总体均值的区间估计(例题分析例题分析小样本小样本)解:解:解:解:已知已知 N N(,2 2),n n=16,1-=16,1-=95%=
18、95%,t t/2/2=2.131=2.131 根据样本数据计算得:根据样本数据计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为该该种种灯灯泡泡平平均均使使用用寿寿命命的的置置信信区区间间为为1476.81476.8小小时时1503.21503.2小时小时应用统计学应用统计学Applied StatisticsApplied Statistics4-28两个总体均值之差的区间估计两个总体均值之差的区间估计(独立大样本独立大样本)1 1-2 2在在1-1-置信水平下的置信水平下的置信区间置信区间l独立大样本独立大样本(n n1 1 30 30,n n2 2 3
19、0)30)(x1 -x2)分位数值分位数值(x1 -x2)的标准误差的标准误差应用统计学应用统计学Applied StatisticsApplied Statistics4-29两个总体均值之差的区间估计两个总体均值之差的区间估计(独立小样本独立小样本:1 1 )l两个两个正态总体,方差正态总体,方差未知但相等:未知但相等:1 1=2 2 两个独立小样本两个独立小样本(n n1 1 3030和和n n2 2 30)30)估计估计量量 x x1 1-x x2 2的标准化的标准化总体方差的合并估计量总体方差的合并估计量应用统计学应用统计学Applied StatisticsApplied Stat
20、istics4-30两个总体均值之差的区间估计两个总体均值之差的区间估计(独立小样本独立小样本:1 1 )l两个两个正态总体,方差正态总体,方差未知且不等:未知且不等:1 1 2 2 两个独立小样本两个独立小样本(n n1 1 3030和和n n2 2 30)30)估计估计量量 x x1 1-x x2 2的标准化的标准化自由度自由度应用统计学应用统计学Applied StatisticsApplied Statistics4-31两个总体均值之差的区间估计两个总体均值之差的区间估计(匹配样本匹配样本)l两个匹配大样本(n1 30和n2 30)d 分位数值分位数值 d 的标准误差的标准误差 d
21、d=(=(1 1-2 2)在在1-1-置信水平下的置信水平下的置信区间置信区间l两个匹配小样本(n1 30和n2 30)应用统计学应用统计学Applied StatisticsApplied Statistics4-322008年5月两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析独立小样本独立小样本)【例例例例】为为估估计计两两种种方方法法组组装装产产品品所所需需时时间间的的差差异异,分分别别对对两两种种不不同同的的组组装装方方法法各各随随机机安安排排1212名名工工人人,每每个个工工人人组组装装一一件件产产品品所所需需的的时时间间(单单位位:分分钟钟)下下如如表表。假假定定两
22、两种种方方法法组组装装产产品品的的时时间间服服从从正正态态分分布布,且且方方差差相相等等。试试以以95%95%的的置置信信水水平平建建立立两两种种方方法法组组装装产产品品所所需平均时间差值的置信区间需平均时间差值的置信区间两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.52 21 1应用统计学应用统计学Applied Statis
23、ticsApplied Statistics4-33两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析独立小样本独立小样本)解解解解:根据样本数据计算得根据样本数据计算得 合并估计量为合并估计量为两种方法组装产品所需平均时间之差的置信区间为两种方法组装产品所需平均时间之差的置信区间为0.140.14分钟分钟7.267.26分钟分钟应用统计学应用统计学Applied StatisticsApplied Statistics4-34两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析匹配样本匹配样本)【例例例例】由由 1010名名学学 生生 组组 成成 一一 个个随随 机机
24、样样 本本,让让他他们们分分别别采采用用A A和和B B两两套套试试卷卷进进行行 测测 试试,结结 果果如如下下表表 。试试建建立立 两两 种种 试试 卷卷 分分数数 之之 差差 d d=1 1-2 2 95%95%的的置置信信区间区间 1010名学生两套试卷的得分名学生两套试卷的得分名学生两套试卷的得分名学生两套试卷的得分 学生编号学生编号试卷试卷A试试卷卷B差差值值d17871726344193726111489845691741754951-27685513876601698577810553916应用统计学应用统计学Applied StatisticsApplied Statistic
25、s4-35两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析匹配样本匹配样本)解解解解:根据样本数据计算得根据样本数据计算得两种试卷所产生的分数之差的置信区间为两种试卷所产生的分数之差的置信区间为6.36.3分分15.715.7分分4.2.2 总体比例的估计总体比例的估计4.2 估计总体参数估计总体参数应用统计学应用统计学Applied StatisticsApplied Statistics4-37一个总体比例的区间估计一个总体比例的区间估计(传统方法传统方法)1.1.设设总总体体服服从从二二项项分分布布,即即X X(n n,p p),P P为为n n次次独独立立伯伯努努利利试验
26、成功的概率试验成功的概率2.2.试试验验次次数数n n非非常常大大(npnp1010;n n(1-(1-p p)10)10),否否则则该该方方法法不不能用能用3.3.当当样样本本很很小小时时,传传统统方方法法计计算算出出的的1-1-置置信信水水平平下下的的置置信区间能够覆盖总体真实比例的概率小于小于信区间能够覆盖总体真实比例的概率小于小于1-1-4.4.传统方法仍被广泛使用传统方法仍被广泛使用5.5.当当样样本本量量非非常常大大时时,传传统统方方法法与与现现代代方方法法的的结结果果几几乎乎相相同。小样本情况下,现代方法更适用同。小样本情况下,现代方法更适用总体比例总体比例 在在1-1-置信水平
27、下的置信水平下的置信区间置信区间样本比例样本比例分位数值分位数值样本比例的标准误差样本比例的标准误差应用统计学应用统计学Applied StatisticsApplied Statistics4-38一个总体比例的区间估计一个总体比例的区间估计(传统方法传统方法)总体比例总体比例 在在1-1-置信水平下置信水平下的置信区间的置信区间 样本比例样本比例p p的标准化的标准化应用统计学应用统计学Applied StatisticsApplied Statistics4-39一个总体比例的区间估计一个总体比例的区间估计(传统方法传统方法)【例例例例】某某城城市市想想要要估估计计下下岗岗职职工工中中女
28、女性性所所占占的的比比例例,随随机机地地抽抽取取了了100100名名下下岗岗职职工工,其其中中6565人人为为女女性性职职工工。试试以以95%95%的的置置信信水水平平估估计计该该城城市市下下岗岗职职工工中中女女性性比比例例的置信区间的置信区间解解解解:已已知知 n n=100=100,p p65%65%,1 1-=95%95%,z z/2/2=1.96=1.96该该城城市市下下岗岗职职工工中中女女性性比比例例的的置置信信区间为区间为55.65%74.35%55.65%74.35%应用统计学应用统计学Applied StatisticsApplied Statistics4-401.1.设设两
29、两总总体体都都服服从从二二项项分分布布,即即X X1 1(n n1 1,p p1 1),X X2 2(n n2 2,p p2 2)。x x1 1为为n n1 1次次独独立立伯伯努努利利试试验验成成功功的的次次数数,P P1 1位位成成功功的的概概率率概概率率,x x2 2 为为n n2 2次独立伯努利试验成功的次数,次独立伯努利试验成功的次数,P P2 2为成功的概率为成功的概率2.2.试试验验次次数数n n1 1和和n n2 2都都非非常常大大(n n1 1p p1 11010,n n1 1(1-(1-p p1 1)10)10;n n2 2p p2 21010,n n2 2(1-(1-p p
30、2 2)10)10),否则该方法不能用,否则该方法不能用3.3.对对于于大大样样本本,传传统统方方法法的的结结果果与与现现代代方方法法比比较较接接近近,但但对对于于小小样样本本,传传统统方方法法计计算算出出的的1-1-置置信信水水平平下下的的置置信信区区间间能能够够覆覆盖总体真实比例的概率小于小于盖总体真实比例的概率小于小于1-1-两个总体比例之差的区间估计两个总体比例之差的区间估计(传统方法传统方法)比例比例 之差之差 1 1-2 2在在1-1-置信水平下的置信水平下的置信区间置信区间(p1-p2)分位数值分位数值(p1-p2)的标准误差的标准误差应用统计学应用统计学Applied Stat
31、isticsApplied Statistics4-41lp p1 1-p p2 2的标准化的标准化两个总体比例之差的区间估计两个总体比例之差的区间估计(传统方法传统方法)l1-2在1-置信水平下的置信区间4.2.3 总体方差的估计总体方差的估计4.2 估计总体参数估计总体参数应用统计学应用统计学Applied StatisticsApplied Statistics4-43一个总体方差的区间估计一个总体方差的区间估计1.假设总体服从正态分布假设总体服从正态分布2.一个一个总体方差在总体方差在1-1-置信水平下的置信区间置信水平下的置信区间3.两个总体方差比在两个总体方差比在1-1-置信水平下
32、的置信区间置信水平下的置信区间应用统计学应用统计学Applied StatisticsApplied Statistics4-442008年5月总体方差的区间估计总体方差的区间估计(图示图示)1-1-1-1-总体方差的总体方差的总体方差的1-1-1-的置信区间的置信区间的置信区间自由度为自由度为自由度为自由度为n n-1-1的的的的 应用统计学应用统计学Applied StatisticsApplied Statistics4-452008年5月两个总体方差比的区间估计两个总体方差比的区间估计(图示图示)F FF F1-1-1-1-F F 总体方差比的总体方差比的总体方差比的1-1-1-的置信
33、区间的置信区间的置信区间方差比置信区间示意图方差比置信区间示意图方差比置信区间示意图方差比置信区间示意图4.3 检验总体假设检验总体假设 4.3.1 怎样提出假设?怎样提出假设?4.3.2 依据什么作出决策?依据什么作出决策?4.3.3 总体均值的检验总体均值的检验 4.3.4 总体比例的检验总体比例的检验 4.3.5 总体方差的检验总体方差的检验第第 4 章章 推断统计推断统计4.3.1 怎样提出假设?怎样提出假设?4.3 检验总体假设检验总体假设应用统计学应用统计学Applied StatisticsApplied Statistics4-48假设与假设检验假设与假设检验(hypothes
34、is&hypothesis test)1.假设是对总体参数的具体数值所作的陈述2.假假设设检检验验是是利利用用样样本本信信息息判判断断假假设设是是否否成成立立的的过程过程3.逻逻辑辑上上运运用用反反证证法法,统统计上依据小概率原理计上依据小概率原理我认为这种新药的疗效我认为这种新药的疗效比原有的药物更有效比原有的药物更有效!应用统计学应用统计学Applied StatisticsApplied Statistics4-49原假设原假设(null hypothesis)1.研究者想收集证据予以反对的假设研究者想收集证据予以反对的假设2.表达参数没有变化或变量间没有关系表达参数没有变化或变量间没有
35、关系3.假定样本反映的结果是由于样本与总体之间的假定样本反映的结果是由于样本与总体之间的随机差异导致的随机差异导致的4.又称又称“0 0假设假设”5.总是有符号总是有符号 ,或或 4.4.表示为表示为 H H0 0n nH H0 0:=某一数值某一数值 n n指定为符号指定为符号 =,或或 n n例如例如,H H0 0:10cm10cm应用统计学应用统计学Applied StatisticsApplied Statistics4-501.研究者想收集证据予以支持的假设2.假定样本反映的结果是真实的3.也称“研究假设”4.总是有符号 ,或 5.表示为 H1n nH H1 1:某一数值,或某一数值
36、,或 某一数值某一数值n n例如例如,H H1 1:10cm 10cm,或,或 10cm10cm备择假设备择假设(alternative hypothesis)应用统计学应用统计学Applied StatisticsApplied Statistics4-51【例例例例】某某品品牌牌洗洗涤涤剂剂在在它它的的产产品品说说明明书书中中声声称称:平平均均净净含含量量不不少少于于500500克克。从从消消费费者者的的利利益益出出发发,有有关关研研究究人人员员要要通通过过抽抽检检其其中中的的一一批批产产品品来来验验证证该该产产品品制制造造商商的的说说明明是是否否属属实实。试试陈陈述述用用于于检验的原假设
37、与备择假设检验的原假设与备择假设提出假设提出假设(例题分析例题分析)解解解解解解:研研研究究究者者者抽抽抽检检检的的的意意意图图图是是是倾倾倾向向向于于于证证证实实实这这这种种种洗洗洗涤涤涤剂剂剂的的的平平平均均均净净净含含含量量量并并并不不不符符符合合合说说说明明明书书书中中中的的的陈陈陈述述述 。建建建立的原假设和备择假设为立的原假设和备择假设为立的原假设和备择假设为 H H H0 0 0:500 500 500 H H H1 1 1:500 500”或“”的假设检验,称为单侧检验或单尾检验(one-tailed test)n备择假设的方向为备择假设的方向为“”,称为,称为右侧检验右侧检验
38、右侧检验右侧检验 双侧检验与单侧检验双侧检验与单侧检验4.3.2 依据什么作出决策?依据什么作出决策?4.3 检验总体假设检验总体假设应用统计学应用统计学Applied StatisticsApplied Statistics4-561.检检验验统统计计量量:根根据据样样本本观观测测结结果果计计算算得得到到的的,并并据据以以对对原原假假设设和和备备择择假假设设作作出出决决策策的的某某个个样样本本统统计量计量2.对样本估计量的标准化结果对样本估计量的标准化结果n原假设原假设H H0 0为真为真n点估计量的抽样分布点估计量的抽样分布 用统计量决策用统计量决策(test statistic)3.3.
39、标准化的检验统计量标准化的检验统计量标准化的检验统计量 应用统计学应用统计学Applied StatisticsApplied Statistics4-572008年5月用统计量决策用统计量决策(双侧检验双侧检验)抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H HH000临界值临界值临界值临界值临界值临界值 /2/2 /2/2/2 拒绝拒绝拒绝H HH000拒绝拒绝拒绝H HH0001-1-1-置信水平置信水平置信水平置信水平置信水平置信水平Region of RejectionRegion of RejectionRegion of RejectionRegion of Nonrejec
40、tionRegion of NonrejectionRegion of NonrejectionRegion of RejectionRegion of RejectionRegion of Rejection应用统计学应用统计学Applied StatisticsApplied Statistics4-582008年5月用统计量决策用统计量决策(左侧检验左侧检验)抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H HH000临界值临界值临界值 拒绝拒绝拒绝H HH0001-1-1-置信水平置信水平置信水平置信水平置信水平置信水平Region of RejectionRegion of Rej
41、ectionRegion of RejectionRegion of NonrejectionRegion of NonrejectionRegion of Nonrejection应用统计学应用统计学Applied StatisticsApplied Statistics4-592008年5月用统计量决策用统计量决策(右侧检验右侧检验)抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H HH000临界值临界值临界值2 2 拒绝拒绝拒绝H HH0001-1-1-置信水平置信水平置信水平置信水平置信水平置信水平Region of NonrejectionRegion of Nonrejectio
42、nRegion of NonrejectionRegion of RejectionRegion of RejectionRegion of Rejection应用统计学应用统计学Applied StatisticsApplied Statistics4-60用用P 值决策值决策(P-value)1.如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率P P值值值值告告告告诉诉诉诉我我我我们们们们:如如果果原原假假设设是是正正确确的的话话,我我们们得得到到得得到到目目前前这这个个样样本本数数据据的的可可能能性性有有多多大大,如果这个可能性很小,就应该拒绝原假设如果这个可能性很
43、小,就应该拒绝原假设 2.被称为观察到的(或实测的)显著性水平3.决策规则:若p值,拒绝 H0应用统计学应用统计学Applied StatisticsApplied Statistics4-612008年5月双侧检验的双侧检验的P 值值 /2 2 /2 2 Z Z拒绝拒绝拒绝拒绝H H0 0拒绝拒绝拒绝拒绝H H0 00 0 0临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1
44、/2 P P P 值值值1/2 1/2 1/2 P P P 值值值应用统计学应用统计学Applied StatisticsApplied Statistics4-622008年5月左侧检验的左侧检验的P 值值 Z Z拒绝拒绝拒绝拒绝H H0 00 0 0临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量1/2 1/2 1/2 P P P 值值值应用统计学应用统计学Applied StatisticsApplied Statistics4-632008年5月右侧检验的右侧检验的P 值值 Z Z拒绝拒绝拒绝拒绝H H0 0
45、0 0 0计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P P 值值值应用统计学应用统计学Applied StatisticsApplied Statistics4-642008年5月拒绝拒绝拒绝拒绝H H0 0P 值值决策与统计量的比较决策与统计量的比较拒绝拒绝拒绝拒绝拒绝拒绝H HH0 00的两个统计量的不同显著性的两个统计量的不同显著性的两个统计量的不同显著性的两个统计量的不同显著性的两个统计量的不同显著性的两个统计量的不同显著性 Z Z拒绝拒绝拒绝拒绝H H0 00 0 0统计量
46、统计量统计量统计量统计量统计量1 11 P PP1 11 值值值统计量统计量统计量统计量统计量统计量2 22 P PP2 22 值值值拒绝拒绝拒绝拒绝H H0 0临界值临界值临界值临界值临界值临界值应用统计学应用统计学Applied StatisticsApplied Statistics4-65 原原原原假假假假设设设设的的的的可可可可信信信信度度度度又又又又多多多多高高高高?如如果果H H0 0所所代代表表的的假假设设是是人人们们多多年年来来一一直直相相信信的的,就就需需要要很很强强的的证证据据(小小的的P P值值)才能说服他们才能说服他们 拒拒拒拒绝绝绝绝的的的的结结结结论论论论是是是是
47、什什什什么么么么?如如果果拒拒绝绝H H0 0而而肯肯定定H H1 1 ,你你就就需需要要有有很很强强的的证证据据显显示示要要支支持持H H1 1。比比如如,H H1 1代代表表要要花花很很多多钱钱把把产产品品包包装装改改换换成成另另一一种种包包装装,你你就就要要有有很很强强的的证证据据显显示示新新包包装装一一定定会会增增加加销销售售量量(因因为为拒拒绝绝H H0 0要花很高的成本要花很高的成本)多大的多大的P 值合适值合适?显显显著著著性性性检检检验验验的的的目目目的的的是是是要要要描描描述述述样样样本本本所所所提提提供供供不不不利利利于于于原原原假假假设设设的的的证证证据据据有有有多多多强
48、强强。P P P值值值就就就在在在做做做这这这件件件事事事。但但但是是是,要要要证证证明明明原原原假假假设设设不不不正正正确确确,P P P值值值要要要多多多小小小,才才才能能能令令令人人人信信信服服服呢呢呢?这这这要要要根根根据据据两两两种情况来确定种情况来确定种情况来确定应用统计学应用统计学Applied StatisticsApplied Statistics4-66决策就有可能犯错误决策就有可能犯错误1.第第类错误类错误(弃真错误弃真错误)l原假设为正确时拒绝原假设原假设为正确时拒绝原假设l第第类错误的概率记为类错误的概率记为 l l被称为显著性水平被称为显著性水平2.第第类错误类错误
49、(取伪错误取伪错误)l原假设为错误时未拒绝原假设原假设为错误时未拒绝原假设l第第类错误的概率记为类错误的概率记为 (Beta)(Beta)应用统计学应用统计学Applied StatisticsApplied Statistics4-672008年5月 错误和错误和 错误的关系错误的关系你要同时减少两类你要同时减少两类错误的惟一办法错误的惟一办法是增加样本量是增加样本量 和和和和 的关系就像的关系就像的关系就像的关系就像翘翘板,翘翘板,翘翘板,翘翘板,小小小小 就就就就大,大,大,大,大大大大 就小就小就小就小应用统计学应用统计学Applied StatisticsApplied Statis
50、tics4-68两类错误的控制两类错误的控制1.1.一般来说,对于一个给定的样本,如果犯第一般来说,对于一个给定的样本,如果犯第 类错误类错误的代价比犯第的代价比犯第类错误的代价相对较高,则将犯第类错误的代价相对较高,则将犯第类错误的概率定得低些较为合理;反之,如果犯类错误的概率定得低些较为合理;反之,如果犯第第 类错误的代价比犯第类错误的代价比犯第类错误的代价相对较低,类错误的代价相对较低,则将犯第则将犯第类错误的概率定得高些类错误的概率定得高些2.2.一般来说,发生哪一类错误的后果更为严重,就应一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第该首要控制哪