《区间估计与假设检验(2).ppt》由会员分享,可在线阅读,更多相关《区间估计与假设检验(2).ppt(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、n 一、使用一、使用INSIGHT模块模块n 二、使用二、使用“分析家分析家”n 三、使用三、使用TTEST过程过程3.2总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SASSAS实现实现二、使用二、使用“分析家分析家”1.总体均值的置信区间总体均值的置信区间【例例3-4】在在“分分析析家家”中中求求【例例3-1】中中每每箱箱药药材材平平均重量在均重量在95%置信水平下的置信区间。置信水平下的置信区间。50505651495347525353495355485055 步骤如下:步骤如下:1)在在“分析家分析家”模块中打开数据集模块中打开数据集Mylib.yczl;2)选选 择择
2、菜菜 单单“Statistics”“Hypothesis Tests”“One Sample t test for a Mean(单单样样本本均均值值t-检验)检验)”;3)在在打打开开的的“One Sample t test for a Mean”对对话话框中设置均值的置信区间。框中设置均值的置信区间。结结果果表表明明,药药材材的的平平均均重重量量以以95%的的概概率率位位于于50.08千克至千克至52.92千克之间。千克之间。第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现2.单样本总体均值的假设检验单样本总体均值的假设检验【例例3-5】使使
3、用用“分分析析家家”检检验验【例例3-2】中中食食品品重重量是否符合要求。量是否符合要求。检验变量检验变量WEIGHT:H0:=100,H1:100 由于方差未知,所以使用由于方差未知,所以使用 t 检验法检验法。步骤如下:步骤如下:1)在在“分析家分析家”中打开数据集中打开数据集Mylib.spzl;2)选选 择择 菜菜 单单“Statistics”“Hypothesis Tests”“One Sample t test for a Mean”,打开打开“One Sample t test for a Mean”对话框;对话框;第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区
4、间估计与假设检验的SAS实现实现 4)按图所示设置均值检验,单击按图所示设置均值检验,单击“OK”按钮按钮.第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现显示结果表明显示结果表明 t 统计量的统计量的 p 值为值为 0.0105 0.05,所以拒绝原假设,即认为总体的均值不等于所以拒绝原假设,即认为总体的均值不等于100。3.两样本总体均值的比较:成对匹配样本两样本总体均值的比较:成对匹配样本【例例3-6】使使用用“分分析析家家”对对例例3-3中中两两套套试试卷卷检检验验有无显著差异。有无显著差异。1和和2分别表示两套试卷的平均成绩,分别表示两
5、套试卷的平均成绩,检验:检验:H0:1 2=0,H1:1 2 0;分析步骤如下:分析步骤如下:1)在在“分析家分析家”中打开数据集中打开数据集Mylib.sjdf;2)选选 择择 菜菜 单单“Statistics”“Hypothesis Tests”“Two Sample Paired t-Test for a Mean(均均值值的的成对双样本成对双样本t-检验)检验)”;第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现 3)在在打打开开的的对对话话框框中中,按按图图左左所所示示设设置置双双样样本本均均值检验,单击值检验,单击“OK”,t 统计量
6、的统计量的 p 值值=0.0005 0.05,所以拒绝原假设,两总体的均值有显著差异。所以拒绝原假设,两总体的均值有显著差异。第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现4.两样本总体均值的比较:独立样本两样本总体均值的比较:独立样本【例例3-7】为为估估计计两两种种方方法法组组装装产产品品所所需需时时间间的的差差异异,分分别别对对两两种种不不同同的的组组装装方方法法各各随随机机安安排排一一些些个个工工人人进进行行操操作作试试验验,每每个个工工人人组组装装一一件件产产品品所所需需的的时时间间如如下下表表所所示示。试试以以95%的的置置信信水水
7、平平推推断断两两种种方方法法组组装装产产品品所需平均时间有无差异。所需平均时间有无差异。方法方法128.330.12937.632.128.836.037.238.534.428.030方法方法227.622.23133.820.030.231.726.032.031.2第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现两种方法组装产品所需的时间(单位:分钟)两种方法组装产品所需的时间(单位:分钟)这是一个(独立)两样本均值检验问题,这是一个(独立)两样本均值检验问题,1,2分别为两种方法组装一件产品所需平均时间,分别为两种方法组装一件产品所需平均
8、时间,则检验:则检验:H0:1 2=0,H1:1 2 0;方法方法128.330.12937.632.128.836.037.238.534.428.030方法方法227.622.23133.820.030.231.726.032.031.2两种方法组装产品所需的时间(单位:分钟)两种方法组装产品所需的时间(单位:分钟)试以试以95%的置信水平推断两种方法组装产品所需的置信水平推断两种方法组装产品所需平均时间有无差异。平均时间有无差异。将将数数据据存存放放在在数数据据集集Mylib.zzcpsj中中,将将两两个个样样本本观观测值记在测值记在同一分析变量同一分析变量F下,下,不同的样本用一个不同
9、的样本用一个分类变量分类变量 g 加以区分。加以区分。分析步骤如下分析步骤如下:1)在在“分析家分析家”中打开数据集中打开数据集Mylib.zzcpsj;2)选择菜单选择菜单“Statistics”“Hypothesis Tests”“Two Sample t-Test for Mean(两两样样本本均均值值的的t-检验)检验)”;第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现 3)在在打打开开的的对对话话框框中中,按按图图所所示示设设置置双双样样本本均均值值检验,单击检验,单击“OK”由于由于 t 统计量的统计量的 p 值值 0.05,所以在
10、所以在95%的置信水平下,拒绝原假设,的置信水平下,拒绝原假设,即两种方法所需时间有差异。即两种方法所需时间有差异。第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现三、使用三、使用TTEST过程过程 单样本均值的单样本均值的t检验、配对数据的检验、配对数据的 t 检验、检验、双样本均值比较的双样本均值比较的t检验。检验。1.语法格式语法格式PROC TTEST;CLASS;VAR;PAIED;BY;RUN;其中,其中,PROC TTEST和和RUN语句是必须的,语句是必须的,其余语句都是可选的,而且可调换顺序。其余语句都是可选的,而且可调换顺序。
11、第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现CLASS语句语句指定的分组变量用来进行指定的分组变量用来进行组间组间比较;比较;BY语语句句指指定定的的分分组组变变量量将将数数据据分分为为若若干干更更小小样样本本,以以便分别在各小样本内进行各自独立的处理。便分别在各小样本内进行各自独立的处理。VAR语语句句引引导导要要检检验验的的所所有有变变量量列列表表,对对引引导导的的所所有有变量分别进行变量分别进行组间均值比较的组间均值比较的 t 检验检验。第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现PA
12、IED语语句句指指定定配配对对 t 检检验验中中进进行行比比较较的的变变量量对对,所带变量名列表一般形式及产生的效果见下表。所带变量名列表一般形式及产生的效果见下表。变量名列表形式变量名列表形式产生的效果产生的效果a*ba ba*b c*da b,c d(a b)*(c d)a c,a d,b c,b d(a b)*(c b)a c,a b,b c第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现PROC TTEST后选项及其表示的含义如表所示。后选项及其表示的含义如表所示。选项选项代表的含义代表的含义data=等号后为等号后为SAS数据集名,指定
13、数据集名,指定ttest过程所要处理的过程所要处理的数据集,默认值为最近处理的数据集数据集,默认值为最近处理的数据集alpha=等号后为等号后为01之间的任何值,指定置信水平,默认之间的任何值,指定置信水平,默认为为0.05ci=等号后为等号后为“equal,umpu,none”中的一个,表示标中的一个,表示标准差的置信区间的显示形式,默认为准差的置信区间的显示形式,默认为ci=equalcochran有此选项时,有此选项时,ttest过程对方差不齐时的近似过程对方差不齐时的近似t检验增检验增加加cochran近似法近似法h0=等号后为任意实数,表示检验假设中对两均值差值等号后为任意实数,表示
14、检验假设中对两均值差值的设定,默认值为的设定,默认值为0第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现2.总体均值的置信区间总体均值的置信区间【例例3-8】考考虑虑【例例3-3】中中的的样样本本数数据据。假假定定其其中中数数据据使使用用如如下下数数据据步步存存放放在在数数据据集集sjcj中中,两两套套试试卷卷得分的变量名分别为得分的变量名分别为A和和B。data sjcj;input A B;cards;78 71 63 44 72 61 89 84 91 7449 51 68 55 76 60 85 77 55 39;run;第三章第三章 3
15、.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现使用最简代码求均值、标准差的置信区间:使用最简代码求均值、标准差的置信区间:proc ttest data=sjcj;run;结结果果给给出出两两个个变变量量在在95%置置信信水水平平下下的的均均值值、标标准准差差的置信区间,以及对原假设的置信区间,以及对原假设0=0的的 t 检验的检验的p值。值。第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现3.单样本总体均值的假设检验单样本总体均值的假设检验在例在例3-8中增加原假设选项以及置信水平,如下:中增加原假设选项以及置
16、信水平,如下:proc ttest h0=70 alpha=0.01 data=sjcj;var A;run;第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现结结 果果 显显 示示 t统统 计计 量量 的的 p值值 =0.5734,不不 能能 拒拒 绝绝(57.34%的把握)原假设:均值的把握)原假设:均值=70。4.配对两样本均值的假设检验配对两样本均值的假设检验在例在例3-8中检验两套试卷有无显著差异,中检验两套试卷有无显著差异,proc ttest data=sjcj;paired A*B;run;结结果果显显示示t统统计计量量的的p值值=
17、0.0005 0.05,因因此此拒拒绝绝原原假设。说明两套试卷有显著差异。假设。说明两套试卷有显著差异。第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现5.独立两样本均值的假设检验独立两样本均值的假设检验格式为:格式为:PROC TTEST DATA=;CLASS;VAR;RUN;注注意意:要要求求将将两两个个样样本本中中被被比比较较均均值值的的变变量量的的观观测测值记在值记在同一分析变量同一分析变量下,下,不不同同的的样样本本用用另另一一个个分分类类变变量量的的不不同同值值加加以以区区分分,而且分类变量只能取两个值,否则将报错。而且分类变量只能
18、取两个值,否则将报错。第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现【例例3-9】考考虑虑例例3-7中中的的样样本本数数据据。假假定定其其中中数数据据使用如下数据步存放在数据集使用如下数据步存放在数据集zzcpsj中:中:data zzcpsj;input f g$;cards;28.3 1 27.6 2 30.1 1 22.2 2 29 1 31 237.6 1 33.8 2 32.1 1 20 2 28.8 1 30.2 236 1 31.7 2 37.2 1 26 2 38.5 1 32 234.4 1 31.2 2 28 1 30 1;
19、run;第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现将将两两批批工工人人的的测测量量结结果果看看作作两两个个样样本本,其其数数据据都都放放在一个数据集之中同一分析变量在一个数据集之中同一分析变量 f 之下,之下,而两种方法的差别是由分类变量而两种方法的差别是由分类变量g 的值加以区分。的值加以区分。检验代码如下:检验代码如下:proc ttest data=zzcpsj;class g;var f;run;第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现在在检检验验中中,先先看看其其最最后后关关
20、于于方方差差等等式式的的检检验验结结果果,检验方差相等用检验方差相等用F 统计量,其数值为统计量,其数值为1.29,相应的相应的p值值=0.67790.05=,所以不能拒绝方差相等的假设。所以不能拒绝方差相等的假设。在在方方差差相相等等的的前前提提下下,检检验验均均值值差差异异用用Pooled方方法法,统计量的统计量的 t 值为值为2.16,p值为值为0.04330.05=,所以两种方法所需的时间是有显著差异的。所以两种方法所需的时间是有显著差异的。在在异异方方差差的的情情况况下下,使使用用Satterthwaite法法检检验验均均值值的差异。的差异。第三章第三章 3.2 总体均值的区间估计与
21、假设检验的总体均值的区间估计与假设检验的SAS实现实现n 一、总体比例的置信区间一、总体比例的置信区间n 二、单样本总体比例的假设检验二、单样本总体比例的假设检验n 三、两总体比例的比较三、两总体比例的比较3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SASSAS实现实现一、总体比例的置信区间一、总体比例的置信区间【例例3-10】2004年年底底北北京京市市私私家家车车拥拥有有量量已已达达到到129.8万万辆辆,位位居居全全国国之之首首,据据业业内内人人士士分分析析其其中中国国产产中中低低档档汽汽车车的的比比例例较较大大,为为了了估估计计目目前前北北京京市市场场个个人人购
22、购车车的的平平均均价价格格,调调查查人人员员于于某某日日在在北北京京最最大大的的车车市市随随机机抽抽取取36位位私人消费购车者,得到他们所购汽车的价格。私人消费购车者,得到他们所购汽车的价格。年底购车价格年底购车价格(单位:万元单位:万元)根根据据以以上上调调查查数数据据,试试以以95的的置置信信水水平平推推断断该该地地区区购购买私家车在买私家车在15万元以上的消费者占有的比例。万元以上的消费者占有的比例。6.8811.2819.98 13.610.614.86.8811.7820.9824.412.314.86.8813.68 13.630.314.614.88.2814.98 14.79.
23、614.617.49.615.68 15.89.612.95.3810.18 15.68 20.510.614.87.38第三章第三章 3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现设设购购车车价价格格数数据据存存放放在在数数据据集集Mylib.gcjg中中,价价格格变变量名为量名为price。这是一个这是一个单样本比例的区间估计单样本比例的区间估计问题。问题。由由于于在在SAS中中只只能能对对两两水水平平的的分分类类变变量量作作比比例例的的区区间间估估计计与与检检验验,所所以以首首先先要要按按变变量量price生生成成一一个个新新的分类变量的分类变量pri
24、ce _f步骤如下:步骤如下:1)在在“分析家分析家”中打开数据集中打开数据集Mylib.gcjg;2)选选择择主主菜菜单单“Edit”“Mode”“Edit”,使数据集可以被编辑(修改);使数据集可以被编辑(修改);第三章第三章 3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现 3)选选择择主主菜菜单单“Data”“Transform”“Recode Ranges(重重编码范围)编码范围)”,打开对话框打开对话框,设置有关内容;设置有关内容;4)单单击击“OK”按按钮钮,打打开开“Recode Ranges”对对话话框框,按图所示生成新变量按图所示生成新变量
25、price_f;第三章第三章 3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现 6)选选 择择 菜菜 单单“Statistics”“Hypothesis Tests”“One Sample Test for a Proportion(单单样样本本比比例例检验)检验)”;7)在在打打开开的的“One Sample Test for a Proportion”对对话框中,按图设置比例的置信区间。话框中,按图设置比例的置信区间。第三章第三章 3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现置信区间:置信区间:(0.109,0.391
26、)即即可可以以95%的的概概率率估估计计该该地地区区所所购购买买车车辆辆在在15万万元元以上所占比例在以上所占比例在10.9%39.1%之间。之间。第三章第三章 3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现二、单样本总体比例的假设检验二、单样本总体比例的假设检验【例例3-11】考考虑虑例例3-10中中的的数数据据,试试检检验验总总体体中中购购买车辆在买车辆在15万元以上者所占比例是否超过万元以上者所占比例是否超过30%。这是一个单样本比例检验问题,这是一个单样本比例检验问题,若若 表示总体中购买车辆在表示总体中购买车辆在15万元以上者所占比例,万元以上者所
27、占比例,则检验:则检验:H0:0.3,H1:0.05,不能拒绝原假设。,不能拒绝原假设。结结果果表表明明:在在95%的的置置信信水水平平下下,购购买买车车辆辆在在15万万元以上者所占比例超过元以上者所占比例超过30%。第三章第三章 3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现三、两总体比例的比较三、两总体比例的比较【例例3-12】2004年年底底很很多多类类型型的的国国产产轿轿车车价价格格都都比比年年中中有有所所下下降降,为为了了对对比比2004年年底底与与年年中中私私家家购购车车族族购购车价格的差异,在年中新购车者中随机抽取车价格的差异,在年中新购车者中
28、随机抽取32人。人。年中购车价格年中购车价格(单位:万元单位:万元):综综合合【例例3-10】与与上上表表的的调调查查数数据据,试试以以95的的置置信信水水平平推推断断该该地地区区年年底底与与年年中中购购买买私私家家车车在在15万万元元以以上上的消费者占有比例有无差异。的消费者占有比例有无差异。5.3810.7812.8814.718.8830.37.3811.213.61519.9815.287.9811.7813.6515.820.59.999.3811.7814.615.920.989.3610.312.314.71724.48.9911.38 10.28第三章第三章 3.3 总体比例的
29、区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现这是一个这是一个双样本比例检验问题双样本比例检验问题,1 年底购买私家车在年底购买私家车在15万元以上所占的比例,万元以上所占的比例,2 年中购买私家车在年中购买私家车在15万元以上所占的比例,万元以上所占的比例,检检验验假假设设:H0:1 2=0,H1:1 2 0;建立数据集建立数据集Mylib.gcjgQ,价格变量名为价格变量名为price,变变量量period区区别别年年中中数数据据(2)与年底数据与年底数据(1)。按按例例3-10中中的的步步骤骤由由price生生 成成 两两 水水 平平 分分 类类 变变 量量price_
30、F。第三章第三章 3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现检验步骤:检验步骤:1)在分析家中打开数据集在分析家中打开数据集Mylib.gcjgQ,选选择择菜菜单单“Statistics”“Hypothesis Tests”“Two Sample Test for Proportion(双双样样本本比例检验)比例检验)”,第三章第三章 3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现p值值=0.5664 0.05,在在95%的置信水平下,不能拒绝原假设。的置信水平下,不能拒绝原假设。即即该该地地区区2004年年底底与与年年中中私私家家购购车车价价格格在在15万万元元以以上者所占比例无明显差异。上者所占比例无明显差异。