《第3章区间估计与假设检验PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第3章区间估计与假设检验PPT讲稿.ppt(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第3章区间估计与假设检验第1页,共39页,编辑于2022年,星期一二、使用二、使用“分析家分析家”1.总体均值的置信区间总体均值的置信区间【例例3-4】在在“分析家分析家”中求中求【例例3-1】中每箱药材平均重中每箱药材平均重量在量在95%置信水平下的置信区间。置信水平下的置信区间。50505651495347525353495355485055 步骤如下:步骤如下:1)在在“分析家分析家”模块中打开数据集模块中打开数据集Mylib.yczl;2)选择菜单选择菜单“Statistics”“Hypothesis Tests”“One Sample t test for a Mean(单样本均值(
2、单样本均值t-检验)检验)”;第2页,共39页,编辑于2022年,星期一 3)在打开的在打开的“One Sample t test for a Mean”对话框中设对话框中设置均值的置信区间。置均值的置信区间。结果表明,药材的平均重量以结果表明,药材的平均重量以95%的概率位于的概率位于50.08千克千克至至52.92千克之间。千克之间。第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现第3页,共39页,编辑于2022年,星期一2.单样本总体均值的假设检验单样本总体均值的假设检验【例例3-5】使用使用“分析家分析家”检验检验【例例3-2】中食品重量
3、是中食品重量是否符合要求。否符合要求。检验变量检验变量WEIGHT:H0:=100,H1:100 由于方差未知,所以使用由于方差未知,所以使用 t 检验法检验法。步骤如下:步骤如下:1)在在“分析家分析家”中打开数据集中打开数据集Mylib.spzl;2)选择菜单选择菜单“Statistics”“Hypothesis Tests”“One Sample t test for a Mean”,打开打开“One Sample t test for a Mean”对话框;对话框;第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现第4页,共39页,编辑于2
4、022年,星期一 4)按图所示设置均值检验,单击按图所示设置均值检验,单击“OK”按钮按钮.第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现第5页,共39页,编辑于2022年,星期一显示结果表明显示结果表明 t 统计量的统计量的 p 值为值为 0.0105 0.05,所以拒绝原假设,即认为总体的均值不等于所以拒绝原假设,即认为总体的均值不等于100。第6页,共39页,编辑于2022年,星期一第7页,共39页,编辑于2022年,星期一3.两样本总体均值的比较:成对匹配样本两样本总体均值的比较:成对匹配样本【例【例3-6】使用使用“分析家分析家”对例
5、对例3-3中两套试卷检验有无显中两套试卷检验有无显著差异。著差异。1和和2分别表示两套试卷的平均成绩,分别表示两套试卷的平均成绩,检验:检验:H0:1 2=0,H1:1 2 0;分析步骤如下:分析步骤如下:1)在在“分析家分析家”中打开数据集中打开数据集Mylib.sjdf;2)选择菜单选择菜单“Statistics”“Hypothesis Tests”“Two Sample Paired t-Test for a Mean(均值的成对(均值的成对双样本双样本t-检验)检验)”;第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现第8页,共39页,编
6、辑于2022年,星期一 3)在打开的对话框中,按图左所示设置双样本均值检在打开的对话框中,按图左所示设置双样本均值检验,单击验,单击“OK”,t 统计量的统计量的 p 值值=0.0005 0.05,所以拒绝原假设,两总体的均值有显著差异。所以拒绝原假设,两总体的均值有显著差异。第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现第9页,共39页,编辑于2022年,星期一4.两样本总体均值的比较:独立样本两样本总体均值的比较:独立样本【例【例3-7】为估计两种方法组装产品所需时间的差异,分为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各
7、随机安排一些个工人进行操别对两种不同的组装方法各随机安排一些个工人进行操作试验,每个工人组装一件产品所需的时间如下表所示。作试验,每个工人组装一件产品所需的时间如下表所示。试以试以95%的置信水平推断两种方法组装产品所需平均时的置信水平推断两种方法组装产品所需平均时间有无差异。间有无差异。方法128.330.12937.632.128.836.037.238.534.428.030方法227.622.23133.820.030.231.726.032.031.2第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现两种方法组装产品所需的时间(单位:分钟
8、)两种方法组装产品所需的时间(单位:分钟)第10页,共39页,编辑于2022年,星期一这是一个(独立)两样本均值检验问题,这是一个(独立)两样本均值检验问题,1,2分别为两种方法组装一件产品所需平均时间,分别为两种方法组装一件产品所需平均时间,则检验:则检验:H0:1 2=0,H1:1 2 0;方法128.330.12937.632.128.836.037.238.534.428.030方法227.622.23133.820.030.231.726.032.031.2两种方法组装产品所需的时间(单位:分钟)两种方法组装产品所需的时间(单位:分钟)试以试以95%的置信水平推断两种方法组装产品所需
9、的置信水平推断两种方法组装产品所需平均时间有无差异。平均时间有无差异。第11页,共39页,编辑于2022年,星期一将数据存放在数据集将数据存放在数据集Mylib.zzcpsj中,将两个样本观测值中,将两个样本观测值记在记在同一分析变量同一分析变量F下,下,不同的样本用一个不同的样本用一个分类变量分类变量 g 加以区分。加以区分。分析步骤如下:分析步骤如下:1)在在“分析家分析家”中打开数据集中打开数据集Mylib.zzcpsj;2)选择菜单选择菜单“Statistics”“Hypothesis Tests”“Two Sample t-Test for Mean(两样本均值的(两样本均值的t-检
10、验)检验)”;第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现第12页,共39页,编辑于2022年,星期一 3)在打开的对话框中,按图所示设置双样本均值检验,在打开的对话框中,按图所示设置双样本均值检验,单击单击“OK”由于由于 t 统计量的统计量的 p 值值 0.05,所以在所以在95%的置信水平下,拒绝原假设,的置信水平下,拒绝原假设,即两种方法所需时间有差异。即两种方法所需时间有差异。第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现第13页,共39页,编辑于2022年,星期一三、使用三、使用T
11、TEST过程过程 单样本均值的单样本均值的t检验、配对数据的检验、配对数据的 t 检验、检验、双样本均值比较的双样本均值比较的t检验。检验。1.语法格式语法格式PROC TTEST;CLASS;VAR;PAIED;BY;RUN;其中,其中,PROC TTEST和和RUN语句是必须的,语句是必须的,其余语句都是可选的,而且可调换顺序。其余语句都是可选的,而且可调换顺序。第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现第14页,共39页,编辑于2022年,星期一CLASS语句语句指定的分组变量用来进行指定的分组变量用来进行组间组间比较;比较;BY语句
12、语句指定的分组变量指定的分组变量将数据分为若干更小样本将数据分为若干更小样本,以便,以便分别在各小样本内进行各自独立的处理。分别在各小样本内进行各自独立的处理。VAR语句语句引导要检验的所有变量列表引导要检验的所有变量列表,对引导的所有变量对引导的所有变量分别进行分别进行组间均值比较的组间均值比较的 t 检验检验。第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现第15页,共39页,编辑于2022年,星期一PAIED语句语句指定配对指定配对 t 检验中进行比较的检验中进行比较的变量对,变量对,所带变所带变量名列表一般形式及产生的效果见下表。量名列表
13、一般形式及产生的效果见下表。变量名列表形式产生的效果a*ba ba*b c*da b,c d(a b)*(c d)a c,a d,b c,b d(a b)*(c b)a c,a b,b c第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现第16页,共39页,编辑于2022年,星期一PROC TTEST后选项及其表示的含义如表所示。后选项及其表示的含义如表所示。选项代表的含义data=等号后为SAS数据集名,指定ttest过程所要处理的数据集,默认值为最近处理的数据集alpha=等号后为01之间的任何值,指定置信水平,默认为0.05ci=等号后为“e
14、qual,umpu,none”中的一个,表示标准差的置信区间的显示形式,默认为ci=equalcochran有此选项时,ttest过程对方差不齐时的近似t检验增加cochran近似法h0=等号后为任意实数,表示检验假设中对两均值差值的设定,默认值为0第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现第17页,共39页,编辑于2022年,星期一2.总体均值的置信区间总体均值的置信区间【例例3-8】考虑考虑【例例3-3】中的样本数据。假定其中数据中的样本数据。假定其中数据使用如下数据步存放在数据集使用如下数据步存放在数据集sjcj中,两套试卷得分的中,
15、两套试卷得分的变量名分别为变量名分别为A和和B。data sjcj;input A B;cards;78 71 63 44 72 61 89 84 91 7449 51 68 55 76 60 85 77 55 39;run;第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现第18页,共39页,编辑于2022年,星期一使用最简代码求均值、标准差的置信区间:使用最简代码求均值、标准差的置信区间:proc ttest data=sjcj;run;结果给出两个变量在结果给出两个变量在95%置信水平下的均值、标准差的置置信水平下的均值、标准差的置信区间,以
16、及对原假设信区间,以及对原假设0=0的的 t 检验的检验的p值。值。第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现第19页,共39页,编辑于2022年,星期一3.单样本总体均值的假设检验单样本总体均值的假设检验在例在例3-8中增加原假设选项以及置信水平,如下:中增加原假设选项以及置信水平,如下:proc ttest h0=70 alpha=0.01 data=sjcj;var A;run;第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现结果显示结果显示t统计量的统计量的p值值=0.5734,不能拒
17、绝(,不能拒绝(57.34%的的把握)原假设:均值把握)原假设:均值=70。第20页,共39页,编辑于2022年,星期一4.配对两样本均值的假设检验配对两样本均值的假设检验在例在例3-8中检验两套试卷有无显著差异,中检验两套试卷有无显著差异,proc ttest data=sjcj;paired A*B;run;结果显示结果显示t统计量的统计量的p值值=0.0005 0.05,因此拒绝原假设。,因此拒绝原假设。说明两套试卷有显著差异。说明两套试卷有显著差异。第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现第21页,共39页,编辑于2022年,星期
18、一5.独立两样本均值的假设检验独立两样本均值的假设检验格式为:格式为:PROC TTEST DATA=;CLASS;VAR;RUN;注意:注意:要求将两个样本中被比较均值的变量的观测值记在要求将两个样本中被比较均值的变量的观测值记在同一分析变量同一分析变量下,下,不同的样本用另一个分类变量的不同值加以区分,而且分不同的样本用另一个分类变量的不同值加以区分,而且分类变量只能取两个值,否则将报错。类变量只能取两个值,否则将报错。第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现第22页,共39页,编辑于2022年,星期一【例例3-9】考虑例考虑例3-7
19、中的样本数据。假定其中数据使用中的样本数据。假定其中数据使用如下数据步存放在数据集如下数据步存放在数据集zzcpsj中:中:data zzcpsj;input f g$;cards;28.3 1 27.6 2 30.1 1 22.2 2 29 1 31 237.6 1 33.8 2 32.1 1 20 2 28.8 1 30.2 236 1 31.7 2 37.2 1 26 2 38.5 1 32 234.4 1 31.2 2 28 1 30 1;run;第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现第23页,共39页,编辑于2022年,星期一
20、将两批工人的测量结果看作两个样本,其数据都放将两批工人的测量结果看作两个样本,其数据都放在一个数据集之中同一分析变量在一个数据集之中同一分析变量 f 之下,之下,而两种方法的差别是由分类变量而两种方法的差别是由分类变量g 的值加以区分。的值加以区分。检验代码如下:检验代码如下:proc ttest data=zzcpsj;class g;var f;run;第三章第三章 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现第24页,共39页,编辑于2022年,星期一第25页,共39页,编辑于2022年,星期一在检验中,先看其最后关于方差等式的检验结果,检验在检验中
21、,先看其最后关于方差等式的检验结果,检验方差相等用方差相等用F 统计量,其数值为统计量,其数值为1.29,相应的相应的p值值=0.67790.05=,所以不能拒绝方差相等的假设。所以不能拒绝方差相等的假设。在方差相等的前提下,检验均值差异用在方差相等的前提下,检验均值差异用Pooled方法方法,统计量,统计量的的 t 值为值为2.16,p值为值为0.04330.05=,所以两种方法所需的时间是有显著差异的。所以两种方法所需的时间是有显著差异的。在异方差的情况下,使用在异方差的情况下,使用Satterthwaite法检验均值的差法检验均值的差异。异。第三章第三章 3.2 总体均值的区间估计与假设
22、检验的总体均值的区间估计与假设检验的SAS实现实现第26页,共39页,编辑于2022年,星期一n 一、总体比例的置信区间一、总体比例的置信区间n 二、单样本总体比例的假设检验二、单样本总体比例的假设检验n 三、两总体比例的比较三、两总体比例的比较3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SASSAS实现实现第27页,共39页,编辑于2022年,星期一一、总体比例的置信区间一、总体比例的置信区间【例例3-10】2004年底年底北京市私家车拥有量已达到北京市私家车拥有量已达到129.8万万辆,位居全国之首,据业内人士分析其中国产中低档汽辆,位居全国之首,据业内人士分析其中
23、国产中低档汽车的比例较大,为了估计目前北京市场个人购车的平均车的比例较大,为了估计目前北京市场个人购车的平均价格,调查人员于某日在北京最大的车市随机抽取价格,调查人员于某日在北京最大的车市随机抽取36位位私人消费购车者,得到他们所购汽车的价格。私人消费购车者,得到他们所购汽车的价格。年底购车价格年底购车价格(单位:万元单位:万元)根据以上调查数据,试以根据以上调查数据,试以95的置信水平推断该地区购的置信水平推断该地区购买私家车在买私家车在15万元以上的消费者占有的比例。万元以上的消费者占有的比例。6.8811.2819.9813.610.614.86.8811.7820.9824.412.3
24、14.86.8813.6813.630.314.614.88.2814.9814.79.614.617.49.615.6815.89.612.95.3810.1815.6820.510.614.87.38第三章第三章 3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现第28页,共39页,编辑于2022年,星期一设设购车价格购车价格数据存放在数据集数据存放在数据集Mylib.gcjg中,价格变量中,价格变量名为名为price。这是一个这是一个单样本比例的区间估计单样本比例的区间估计问题。问题。由于在由于在SAS中只能对两水平的分类变量作比例的区间估计中只能对两水平
25、的分类变量作比例的区间估计与检验,所以首先要按变量与检验,所以首先要按变量price生成一个新的分类变量生成一个新的分类变量price _f步骤如下:步骤如下:1)在在“分析家分析家”中打开数据集中打开数据集Mylib.gcjg;2)选择主菜单选择主菜单“Edit”“Mode”“Edit”,使数据集可,使数据集可以被编辑(修改);以被编辑(修改);第三章第三章 3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现第29页,共39页,编辑于2022年,星期一 3)选择主菜单选择主菜单“Data”“Transform”“Recode Ranges(重编码范围)(重编码
26、范围)”,打开对话框打开对话框,设置有关内容;设置有关内容;4)单击单击“OK”按钮,打开按钮,打开“Recode Ranges”对话框,对话框,按图所示生成新变量按图所示生成新变量price_f;第三章第三章 3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现第30页,共39页,编辑于2022年,星期一 6)选择菜单选择菜单“Statistics”“Hypothesis Tests”“One Sample Test for a Proportion(单样本比例检验)(单样本比例检验)”;7)在打开的在打开的“One Sample Test for a Prop
27、ortion”对话框对话框中,按图设置比例的置信区间。中,按图设置比例的置信区间。第三章第三章 3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现第31页,共39页,编辑于2022年,星期一置信区间:置信区间:(0.109,0.391)即可以即可以95%的概率估计该地区所购买车辆在的概率估计该地区所购买车辆在15万元以万元以上所占比例在上所占比例在10.9%39.1%之间。之间。第三章第三章 3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现第32页,共39页,编辑于2022年,星期一二、单样本总体比例的假设检验二、单样本总体比例
28、的假设检验【例例3-11】考虑例考虑例3-10中的数据,试检验总体中购买车中的数据,试检验总体中购买车辆在辆在15万元以上者所占比例是否超过万元以上者所占比例是否超过30%。这是一个单样本比例检验问题,这是一个单样本比例检验问题,若若 表示总体中购买车辆在表示总体中购买车辆在15万元以上者所占比例,万元以上者所占比例,则检验:则检验:H0:0.3,H1:0.05,不能拒绝原假设。,不能拒绝原假设。结果表明:在结果表明:在95%的置信水平下,购买车辆在的置信水平下,购买车辆在15万元以上万元以上者所占比例超过者所占比例超过30%。第三章第三章 3.3 总体比例的区间估计与假设检验的总体比例的区间
29、估计与假设检验的SAS实现实现第35页,共39页,编辑于2022年,星期一三、两总体比例的比较三、两总体比例的比较【例例3-12】2004年底很多类型的国产轿车价格都比年中有所年底很多类型的国产轿车价格都比年中有所下降,为了对比下降,为了对比2004年底与年底与年中年中私家购车族购车价格的差私家购车族购车价格的差异,在年中新购车者中随机抽取异,在年中新购车者中随机抽取32人。人。年中购车价格年中购车价格(单位:万元单位:万元):综合综合【例例3-10】与上表的调查数据,试以与上表的调查数据,试以95的置信水平的置信水平推断该地区年底与年中购买私家车在推断该地区年底与年中购买私家车在15万元以上
30、的消费万元以上的消费者占有比例有无差异。者占有比例有无差异。5.3810.7812.8814.718.8830.37.3811.213.61519.9815.287.9811.7813.6515.820.59.999.3811.7814.615.920.989.3610.312.314.71724.48.9911.3810.28第三章第三章 3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现第36页,共39页,编辑于2022年,星期一这是一个这是一个双样本比例检验问题双样本比例检验问题,1 年底购买私家车在年底购买私家车在15万元以上所占的比例,万元以上所占的比
31、例,2 年中购买私家车在年中购买私家车在15万元以上所占的比例,万元以上所占的比例,检验假设:检验假设:H0:1 2=0,H1:1 2 0;建立数据集建立数据集Mylib.gcjgQ,价格变量名为价格变量名为price,变量变量period区别年中数据区别年中数据(2)与与年底数据年底数据(1)。按例按例3-10中的步骤由中的步骤由price生生成两水平分类变量成两水平分类变量price_F。第三章第三章 3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现第37页,共39页,编辑于2022年,星期一检验步骤:检验步骤:1)在分析家中打开数据集在分析家中打开数据集
32、Mylib.gcjgQ,选择菜单选择菜单“Statistics”“Hypothesis Tests”“Two Sample Test for Proportion(双样本比例检验)(双样本比例检验)”,第三章第三章 3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现第38页,共39页,编辑于2022年,星期一p值值=0.5664 0.05,在在95%的置信水平下,不能拒绝原假设。的置信水平下,不能拒绝原假设。即该地区即该地区2004年底与年中私家购车价格在年底与年中私家购车价格在15万元以上者万元以上者所占比例无明显差异。所占比例无明显差异。第39页,共39页,编辑于2022年,星期一