《SAS软件与统计应用教程 第3章区间估计与假设检验.ppt》由会员分享,可在线阅读,更多相关《SAS软件与统计应用教程 第3章区间估计与假设检验.ppt(89页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程第三章 区间估计与假设检验n3.1 区间估计与假设检验的基本概念区间估计与假设检验的基本概念n3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SAS实现实现n3.3 总体比例的区间估计与假设检验的总体比例的区间估计与假设检验的SAS实现实现n3.4 总体方差的区间估计与假设检验的总体方差的区间估计与假设检验的SAS实现实现n3.5 分布检验分布检验STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n3.1 3.1 区间估计与假设检验的基本概念区间估计与假设检验的基本
2、概念n3.1.1 区间估计区间估计n3.1.2 假设检验假设检验STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.1.1 区间估计区间估计1.1.点估计和区间估计点估计和区间估计 参数的估计方法主要有两种:点估计和区间估计。参数的估计方法主要有两种:点估计和区间估计。点点估估计计是是用用样样本本的的观观测测值值估估计计总总体体未未知知参参数数的的值值。由由于于样样本本的的随随机机性性,不不同同样样本本观观测测值值计计算算得得出出的的参参数数的的估估计计值值间间存存在在着着差差异异,因因此此常常用用一一个个区区间间估估计计总总体体的的参参数数,并并把把具具有有一
3、一定定可可靠靠性性和和精精度度的的估估计计区区间间称称为为置置信信区区间间。利利用用构构造造的的统统计计量量及及样样本本观观测测值值,计计算算得得出出参参数数的的置置信信区间的方法称为参数的区间估计。区间的方法称为参数的区间估计。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.参数的置信区间参数的置信区间 在在区区间间估估计计中中,对对于于总总体体的的未未知知参参数数,需需要要求求出出两两个个统统计计量量1(X1,X2,.,Xn)和和2(X1,X2,.,Xn)来来分分别别估估计计总总体体参参数数的的上上限限和和下下限限,使使得得总总体体参参数数在在区间(
4、区间(1,2)内的概率为)内的概率为P1 2=1 其其中中1 称称为为置置信信水水平平,而而(1,2)称称为为的的置置信信区区间间,1,2分分别别称称为为置置信信下下限限和和置置信信上上限限。置置信信水水平平为为1 的的含含义义是是随随机机区区间间(1,2)以以1 的的概概率率包包含含了了参参数数。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.正态总体均值和方差的置信区间正态总体均值和方差的置信区间 参参数数的的区区间间估估计计大大多多是是对对正正态态总总体体的的参参数数进进行行估估计计,如如对对单单总总体体均均值值、方方差差的的估估计计、两两总总体体
5、均均值值差差的的估估计计和和两总体方差比的估计等。两总体方差比的估计等。正态总体参数的各种置信区间见表正态总体参数的各种置信区间见表3-1。被估参数条件枢轴量及其分布参数的置信区间单正态总体2已知2未知2已知未知STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程正态总体参数的各种置信区间见表正态总体参数的各种置信区间见表3-1。其中被估参数条件枢轴量及其分布参数的置信区间两正态总体1-2两样本独立,12,22已知两样本独立,12=22=2 未知两样本独立,1,2未知STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4.4.总体比例与比
6、例差的置信区间总体比例与比例差的置信区间 实实际际应应用用中中经经常常需需要要对对总总体体比比例例进进行行估估计计,如如产产品品的的合合格格率率、大大学学生生的的就就业业率率和和手手机机的的普普及及率率等等。记记和和P分分别别表表示示总总体体比比例例和和样样本本比比例例,则则当当样样本本容容量量n很很大大时时(一一般般当当nP和和n(1 P)均均大大于于5时时,就就可可以以认认为为样样本本容容量量足足够够大大),样样本本比比例例P的的抽抽样样分分布布可可用用正正态态分分布布近近似似。总体比例与比例差的置信区间如表总体比例与比例差的置信区间如表3-2所示。所示。待估参数枢轴量及其分布参数的置信区
7、间总体比例两总体比例差1-2其中P1,P2为两个样本比例 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.1.2 假设检验假设检验1.1.假设检验的基本原理假设检验的基本原理 对对总总体体参参数数进进行行假假设设检检验验时时,首首先先要要给给定定一一个个原原假假设设H0,H0是是关关于于总总体体参参数数的的表表述述,与与此此同同时时存存在在一一个个与与H0相相对对立立的的备备择择假假设设H1,H0与与H1有有且且仅仅有有一一个个成成立立;经经过过一一次次抽抽样样,若若发发生生了了小小概概率率事事件件(通通常常把把概概率率小小于于0.05的的事事件件称称为为小
8、小概概率率事事件件),可可以以依依据据“小小概概率率事事件件在在一一次次实实验验中中几几乎乎不不可可能能发发生生”的的理理由由,怀怀疑疑原原假假设设不不真真,作作出出拒拒绝绝原原假假设设H0,接接受受H1的的决决定定;反反之之,若若小小概概率率事事件件没没有有发发生生,就就没没有有理理由由拒拒绝绝H0,从从而而应应作作出出拒拒绝绝H1的决定。的决定。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.假设检验的步骤假设检验的步骤 1)根据问题确立原假设根据问题确立原假设H0和备选假设和备选假设H1;2)确确定定一一个个显显著著水水平平,它它是是衡衡量量稀稀有
9、有性性(小小概概率率事事件)的标准,常取为件)的标准,常取为0.05;3)选选定定合合适适的的检检验验用用统统计计量量W(通通常常在在原原假假设设中中相相等等成成立立时时,W的的分分布布是是已已知知的的),根根据据W的的分分布布及及 的的值值,确定确定H0的拒绝域。的拒绝域。4)由由样样本本观观测测值值计计算算出出统统计计量量W的的观观测测值值W0,如如果果W0落落入入H0的的拒拒绝绝域域,则则拒拒绝绝H0;否否则则,不不能能拒拒绝绝原原假假设设H0。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 注注意意:在在SAS系系统统中中,是是由由样样本本观观测测值值
10、计计算算出出统统计计量量W的的观观测测值值W0和和衡衡量量观观测测结结果果极极端端性性的的p值值(p值值就就是是当当原原假假设设成成立立时时得得到到样样本本观观测测值值和和更更极极端端结结果果的的概概率率),然然后后比比较较p和和 作作判判断断:p ,拒拒绝绝原原假假设设H0;p,不不能拒绝原假设能拒绝原假设H0。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 p值通常由下面公式计算而得到。值通常由下面公式计算而得到。p=P|W|W0|=2 P W|W0|(拒绝域为两边对称的区域时)(拒绝域为两边对称的区域时)p=minPW W0,PW W0(拒绝域为两边非对
11、称区域时)(拒绝域为两边非对称区域时)p=PW W0 (拒绝域为右边区域时)(拒绝域为右边区域时)p=PW W0 (拒绝域为左边区域时)(拒绝域为左边区域时)只只需需根根据据SAS计计算算出出的的p值值,就就可可以以在在指指定定的的显显著著水水平下,作出拒绝或不能拒绝原假设的决定。平下,作出拒绝或不能拒绝原假设的决定。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.正态总体均值和方差的假设检验正态总体均值和方差的假设检验 对对正正态态总总体体的的参参数数进进行行假假设设检检验验是是假假设设检检验验的的重重要要内内容容,如如对对单单总总体体均均值值、方方差
12、差的的检检验验、两两总总体体均均值值之之差差的的检检验验和和两两总总体体方方差差比比的的检检验验等等。正正态态总总体体参参数数的的各各种种检检验方法见下表验方法见下表3-3至表至表3-5。表3-3 单正态总体N(,2)均值的检验法检验名称条件检验类别H0H1检验统计量分布拒绝域Z检验已知双边检验=0 0N(0,1)|Z|Z/2左边检验 0 0Z Zt检验未知双边检验=0 0t(n 1)|t|t/2(n 1)左边检验 0 0t t(n 1)STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程表3-4 单正态总体N(,2)方差2的检验法或检验名称条件检验类别H0H1检验
13、统计量分布拒绝域2检验已知双边检验左边检验右边检验未知双边检验左边检验右边检验STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程表3-5 两正态总体的均值差与方差比的检验名称条件类别H0H1检验统计量分布拒绝域Z检验两样本独立,12=22=2未知双边检验1-2=01-20t(n1+n2 2)左边检验1-201-20t检验成对匹配样本,12,22未知双边检验d=0d0左边检验d0d0F检验两样本独立,1,2未知双边检验F(n11,n21)左边检验右边检验STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4.4.总体比例与比例差的检验总体
14、比例与比例差的检验 当当样样本本容容量量n很很大大时时,可可根根据据表表3-6对对总总体体比比例例与与比比例例差进行假设检验。差进行假设检验。表3-6 总体比例与比例差的检验检验名称检验类别H0H1 检验统计量分布拒绝域比例检验双边检验=0 0N(0,1)|z|z/2左边检验 0 0|z|z两总体比例差检验双边检验1=21 2N(0,1)|z|z/2左边检验1 21 2|z|zSTATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n3.2 3.2 总体均值的区间估计与假设检验的总体均值的区间估计与假设检验的SASSAS实现实现n3.2.1 使用使用INSIGHT模块模
15、块n3.2.2 使用使用“分析家分析家”n3.2.3 使用使用TTEST过程过程STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.2.1 使用使用INSIGHT模块模块1.1.总体均值的区间估计总体均值的区间估计【例例3-1】某某药药材材生生产产商商要要对对其其仓仓库库中中的的1000箱箱药药材材的的平平均均重重量量进进行行估估计计,药药材材重重量量的的总总体体方方差差未未知知,随随机机抽抽取取16箱样本称重后结果如表箱样本称重后结果如表3-7所示。所示。表3-7 16箱药材重量(单位:千克)设设药药材材重重量量数数据据存存放放于于数数据据集集Mylib.yc
16、zl中中,其其中中重重量量变变量量名名为为weight。求求该该仓仓库库中中每每箱箱药药材材平平均均重重量量在在95%置信水平下的置信区间。置信水平下的置信区间。50505651495347525353495355485055STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程步骤如下:步骤如下:1)启动启动INSIGHT模块,并打开数据集模块,并打开数据集Mylib.yczl;2)选择菜单选择菜单“Analyze”“Distribution(Y)”;3)在在打打开开的的“Distribution(Y)”对对话话框框中中进进行行区区间间估计的设置(如图)。估计的设置
17、(如图)。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 结结果果包包括括一一个个名名为为“95Confidence Intervals(95%置置信信区区间间)”的的列列表表,表表中中给给出出了了均均值值、标标准准差差、方方差差的的估估计计值值(Parameter)、置置信信下下限限(LCL)和和置置信信上上限限(UCL),如如图图3-2所所示示。结结果果表表明明,根根据据抽抽样样样样本本,该该仓仓库库中中药药材材的的平平均均重重量量以以95%的的可可能能性性位位于于50.08千千克克至至52.92千克之间。千克之间。STATSTATSTATSTATSASS
18、AS软件与统计应用教程软件与统计应用教程2.2.单样本总体均值的假设检验单样本总体均值的假设检验【例例3-2】一一家家食食品品厂厂以以生生产产袋袋装装食食品品为为主主,每每天天的的产产量量大大约约为为8000袋袋,每每袋袋重重量量规规定定为为100克克。为为了了分分析析每每袋袋重重量量是是否否符符合合要要求求,质质检检部部门门经经常常进进行行抽抽检检。现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了25袋袋,测测得得每每袋袋重重量量如如表表3-8所示。所示。表3-8 25袋食品的重量(单位:克)试试从从抽抽检检的的样样本本数数据据出出发发,检检验验变变量量WEIGHT的的均
19、均值值与与100克克是是否否有有显显著著差差异异。假假定定表表3-8数数据据存存放放在在数数据据集集Mylib.spzl中,重量变量名为中,重量变量名为WEIGHT。112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 设设变变量量WEIGHT的的均均值值为为,问问题题是是希希望望通通过过样样本本数数据检验变量据检验变量WEIGH
20、T均值的如下假设:均值的如下假设:H0:=100,H1:100。使用使用INSIGHT对均值进行检验的步骤如下:对均值进行检验的步骤如下:1)首先启动首先启动INSIGHT,并打开数据集,并打开数据集Mylib.spzl;2)选择菜单选择菜单“Analyze”“Distribution(Y)”;3)在在打打开开的的“Distribution(Y)”对对话话框框中中选选定定分分析析变量变量WEIGHT;4)单击单击“OK”按钮,得到变量的描述性统计量;按钮,得到变量的描述性统计量;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 5)选选 择择 菜菜 单单“Tab
21、les(表表)”“Tests for Location(位位 置置 检检 验验)”;在在 弹弹 出出 的的“Tests for Location”对对话话框框中中输输入入100,单单击击“OK”按按钮钮得得到到输输出出结果如图所示。结果如图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 结结果果显显示示,观观测测值值不不等等于于100克克的的观观测测有有24个个,其其中中19个观测值大于个观测值大于100。图图中中第第一一个个检检验验为为t检检验验(Students t),需需要要假假定定变变量量服服从从正正态态分分布布,检检验验的的p值值为为0.010
22、5,这这个个检检验验在在0.05水水平平下下是是显显著著的的,所所以以可可认认为为均均值值与与100克克有有显显著著差差异异。第第二二个个检检验验(Sign)是是叫叫做做符符号号检检验验的的非非参参数数检检验验,其其p值值为为0.0066,在在0.05水水平平下下也也是是显显著著的的,结结论论不不变变。第第三三个个检检验验(Sgned Rank)是是叫叫做做符符号号秩秩检检验验的的非非参参数数检检验验,其其p值为值为0.0048,在,在0.05水平下是显著的,结论不变。水平下是显著的,结论不变。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.两样本总体均
23、值的比较:成对匹配样本两样本总体均值的比较:成对匹配样本 在在INSIGHT中中比比较较成成对对样样本本均均值值是是否否显显著著差差异异,可可以以计计算算两两变变量量的的差差值值变变量量,再再检检验验差差值值变变量量的的均均值值是是否否显显著为著为0。【例例3-3】由由10名名学学生生组组成成一一个个随随机机样样本本,让让他他们们分分别别采用采用A和和B两套试卷进行测试,结果如表两套试卷进行测试,结果如表3-9所示。所示。表3-9 10名学生两套试卷的成绩试从样本数据出发,分析两套试卷是否有显著差异。试从样本数据出发,分析两套试卷是否有显著差异。试卷A78637289914968768555试
24、卷B71446184745155607739差值71911517-21316816STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 步骤如下:步骤如下:1)首先生成差值变量:首先生成差值变量:启启动动INSIGHT,并并打打开开数数据据集集Mylib.sjdf。选选择择菜菜单单“Edit”“Variables”“Other”,打打 开开“Edit Variables”对对话话框框,选选择择A为为Y变变量量,B为为X变变量量,然然后后选选择择变变换换(Transformation):Y X,如如图图,生生成成新新的的差值变量差值变量d;STATSTATSTATST
25、ATSASSAS软件与统计应用教程软件与统计应用教程 2)然后对变量然后对变量d的均值做如下假设:的均值做如下假设:H0:d=0,H1:d 0。3)选选择择菜菜单单“Analyze”“Distribution(Y)”;在在打打开开的的“Distribution(Y)”对对话话框框中中选选定定分分析析变变量量:选选择择变变量量差差值值d,单单击击“Y”按按钮钮,将将变变量量d移移到到右右上上方方的列表框中的列表框中;4)单单击击“Output”按按钮钮,在在打打开开的的对对话话框框中中选选中中“Tests for Location(位置检验)(位置检验)”复选框;复选框;5)两次单击两次单击“O
26、K”按钮,得到变量的描述性统计量;按钮,得到变量的描述性统计量;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 6)选选 择择 菜菜 单单“Tables(表表)”“Tests for Location(位位 置置 检检 验验)”;在在 弹弹 出出 的的“Tests for Location”对对话话框框中中输输入入0,单单击击“OK”按按钮钮得得到到输输出出结结果如图所示。果如图所示。结结果果显显示示三三个个检检验验的的结结论论都都是是p值值小小于于0.05,所所以以应应拒拒绝绝原原假假设设,即即总总体体的的均均值值与与0有有显显著著差差异异。所所以以两两套套
27、试试卷有显著差异。卷有显著差异。虽虽然然SAS给给出出三三个个检检验验结结果果,其其实实作作结结论论时时只只需需其其中中一一个个。如如果果可可以以认认为为分分析析变变量量服服从从正正态态分分布布只只要要看看t检检验验结结果果;否否则则只只须须看看符符号号秩秩检检验验结结果果。只只有有在在数数据据为为两两两两比较的大小结果而没有具体数值时符号检验才有用。比较的大小结果而没有具体数值时符号检验才有用。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.2.2 使用使用“分析家分析家”1.1.总体均值的置信区间总体均值的置信区间【例例3-4】在在“分分析析家家”中中求
28、求例例3-1中中每每箱箱药药材材平平均均重重量量在在95%置信水平下的置信区间。置信水平下的置信区间。步骤如下:步骤如下:1)在在“分析家分析家”模块中打开数据集模块中打开数据集Mylib.yczl;2)选选择择菜菜单单“Statistics(统统计计)”“Hypothesis Tests(假假设设检检验验)”“One Sample t test for a Mean(单样本均值(单样本均值t-检验)检验)”;3)在在打打开开的的“One Sample t test for a Mean”对对话话框框中设置均值的置信区间(如图中设置均值的置信区间(如图3-6)。)。STATSTATSTATST
29、ATSASSAS软件与统计应用教程软件与统计应用教程 3)在在打打开开的的“One Sample t test for a Mean”对对话话框框中中设置均值的置信区间(如图设置均值的置信区间(如图3-6)。)。结结果果表表明明(下下图图),根根据据抽抽样样样样本本,该该仓仓库库中中药药材材的的平平均均重重量量以以95%的的可可能能性性位位于于50.08千千克克至至52.92千千克克之之间。间。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.单样本总体均值的假设检验单样本总体均值的假设检验【例例3-5】使使用用“分分析析家家”检检验验例例3-2中中食食品
30、品重重量量是是否否符符合合要要求求。希希望望通通过过样样本本数数据据检检验验变变量量WEIGHT均均值值的的如如下假设:下假设:H0:=100,H1:100。由于此时的方差未知,所以使用由于此时的方差未知,所以使用t检验法。步骤如下:检验法。步骤如下:1)在在“分析家分析家”中打开数据集中打开数据集Mylib.spzl;2)选选择择菜菜单单“Statistics(统统计计)”“Hypothesis Tests(假假设设检检验验)”“One Sample t test for a Mean(单单样样本本均均值值t-检检验验)”,打打开开“One Sample t test for a Mean”
31、对话框;对话框;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 4)按按图图3-8所所示示设设置置均均值值检检验验,单单击击“OK”按按钮钮,得得到到结果如图左所示。;结果如图左所示。;显显示示结结果果(图图右右)表表明明t统统计计量量的的p值值为为0.01050.05,所以拒绝原假设,即认为总体的均值不等于所以拒绝原假设,即认为总体的均值不等于100。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.两样本总体均值的比较:成对匹配样本两样本总体均值的比较:成对匹配样本【例例3-6】使使用用“分分析析家家”对对例例3-3中
32、中两两套套试试卷卷检检验验有有无无显著差异。显著差异。这这是是一一个个(成成对对匹匹配配)双双样样本本均均值值检检验验问问题题,若若1和和2分别表示两套试卷的平均成绩,则检验的是:分别表示两套试卷的平均成绩,则检验的是:H0:1 2=0,H1:1 2 0;分析步骤如下:分析步骤如下:1)在在“分析家分析家”中打开数据集中打开数据集Mylib.sjdf;2)选选择择菜菜单单“Statistics(统统计计)”“Hypothesis Tests(假假设设检检验验)”“Two Sample Paired t-Test for a Mean(均值的成对双样本(均值的成对双样本t-检验)检验)”;STA
33、TSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3)在在打打开开的的“Two Sample Paired t-Test for a Mean”对对话话框框中中,按按图图左左所所示示设设置置双双样样本本均均值值检检验验,单单击击“OK”按钮,得到结果如图右所示按钮,得到结果如图右所示 结结果果显显示示,无无论论两两总总体体的的方方差差是是否否相相等等,t统统计计量量的的p值值=0.0005 0.05,所所以以在在95%的的置置信信水水平平下下,拒拒绝绝原原假设,两总体的均值有显著差异。假设,两总体的均值有显著差异。结果表明可以结果表明可以95%的把握认为两套试卷有显著
34、差异。的把握认为两套试卷有显著差异。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4.4.两样本总体均值的比较:独立样本两样本总体均值的比较:独立样本【例例3-7】为为估估计计两两种种方方法法组组装装产产品品所所需需时时间间的的差差异异,分分别别对对两两种种不不同同的的组组装装方方法法各各随随机机安安排排一一些些个个工工人人进进行行操操作作试试验验,每每个个工工人人组组装装一一件件产产品品所所需需的的时时间间如如表表3-10所所示示。试试以以95%的的置置信信水水平平推推断断两两种种方方法法组组装装产产品品所所需需平均时间有无差异。平均时间有无差异。表3-10
35、 两种方法组装产品所需的时间(单位:分钟)这这是是一一个个(独独立立)两两样样本本均均值值检检验验问问题题,若若1和和2分分别别表表示示两两种种方方法法组组装装一一件件产产品品所所需需的的平平均均时时间间,则则检检验验的是:的是:H0:1 2=0,H1:1 2 0;方法128.330.129.037.632.128.836.037.238.534.428.030.0方法227.622.231.033.820.030.231.726.032.031.2STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 假假定定表表3-10数数据据存存放放在在数数据据集集Mylib.
36、zzcpsj中中,将将两两个个样样本本中中被被比比较较均均值值的的变变量量的的观观测测值值记记在在同同一一分分析析变变量量F下下,不不同同的的样样本本用用一一个个分分类类变变量量g的的不不同同值值加加以以区区分分,而且分类变量而且分类变量g只能取两个值,否则无法进行。只能取两个值,否则无法进行。分析步骤如下分析步骤如下:1)在在“分析家分析家”中打开数据集中打开数据集Mylib.zzcpsj;2)选选择择菜菜单单“Statistics(统统计计)”“Hypothesis Tests(假假 设设 检检 验验)”“Two Sample t-Test for Mean(两样本均值的(两样本均值的t-
37、检验)检验)”;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3)在在打打开开的的“Two Sample t-Test for a Mean”对对话话框框中中,按按图图3-12所所示示设设置置双双样样本本均均值值检检验验,单单击击“OK”按按钮,得到结果如图钮,得到结果如图3-13所示所示 结结果果显显示示,由由于于t统统计计量量的的p值值=0.0433,所所以以在在95%的的置置信信水水平平下下,应应该该拒拒绝绝原原假假设设,即即两两种种方方法法所所需需时时间间有有差异。表明有差异。表明有95%的把握认为两种方法所需时间有差异。的把握认为两种方法所需时间有
38、差异。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.2.3 使用使用TTEST过程过程TTEST过过程程可可以以执执行行单单样样本本均均值值的的t检检验验、配配对对数数据据的的t检验以及双样本均值比较的检验以及双样本均值比较的t检验。检验。1.1.语法格式语法格式PROC TTEST;CLASS;VAR;PAIED;BY;RUN;其其中中,PROC TTEST和和RUN语语句句是是必必须须的的,其其余余语语句都是可选的,而且可调换顺序。句都是可选的,而且可调换顺序。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 CLASS
39、语语句句所所指指定定的的分分组组变变量量是是用用来来进进行行组组间间比比较较的的;而而BY语语句句所所指指定定的的分分组组变变量量是是用用来来将将数数据据分分为为若若干干个个更更小小的的样样本本,以以便便SAS分分别别在在各各小小样样本本内内进进行行各各自自独独立立的处理。的处理。VAR语语句句引引导导要要检检验验的的所所有有变变量量列列表表,SAS将将对对VAR语句所引导的所有变量分别进行组间均值比较的语句所引导的所有变量分别进行组间均值比较的t检验。检验。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 PAIED语语句句用用来来指指定定配配对对t检检验验中
40、中要要进进行行比比较较的的变变量量对对,其其后后所所带带的的变变量量名名列列表表一一般般形形式式及及其其产产生生的的效效果果见见表表3-11。表3-11 选项及其含义变量名列表形式产生的效果a*ba ba*b c*da b,c d(a b)*(c d)a c,a d,b c,b d(a b)*(c b)a c,a b,b cSTATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 PROC TTEST语语句句后后可可跟跟的的选选项项及及其其表表示示的的含含义义如如表表3-12所示。所示。表3-12 选项及其含义选项代表的含义data=等号后为SAS数据集名,指定ttes
41、t过程所要处理的数据集,默认值为最近处理的数据集alpha=等号后为01之间的任何值,指定置信水平,默认为0.05ci=等号后为“equal,umpu,none”中的一个,表示标准差的置信区间的显示形式,默认为ci=equalcochran有此选项时,ttest过程对方差不齐时的近似t检验增加cochran近似法h0=等号后为任意实数,表示检验假设中对两均值差值的设定,默认值为0STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.总体均值的置信区间总体均值的置信区间【例例3-8】仍仍然然考考虑虑例例3-3中中的的样样本本数数据据。假假定定其其中中数数据据使使
42、用用如如下下数数据据步步存存放放在在数数据据集集sjcj中中,两两套套试试卷卷得得分分的的变量名分别为变量名分别为A和和B。data sjcj;input A B;cards;78 71 63 44 72 61 89 84 91 7449 51 68 55 76 60 85 77 55 39;run;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程【例例3-8】仍仍然然考考虑虑例例3-3中中的的样样本本数数据据。假假定定其其中中数数据据使使用用如如下下数数据据步步存存放放在在数数据据集集sjcj中中,两两套套试试卷卷得得分分的的变量名分别为变量名分别为A和和B。
43、使用最简代码求均值、标准差的置信区间:使用最简代码求均值、标准差的置信区间:proc ttest data=sjcj;run;代代码码运运行行结结果果给给出出两两个个变变量量在在95%置置信信水水平平下下的的均均值值、标标准准差差的的置置信信区区间间,以以及及对对原原假假设设0=0所所作作的的t检检验验的的p值,如图所示。值,如图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.单样本总体均值的假设检验单样本总体均值的假设检验 在例在例3-8中增加原假设选项以及置信水平,代码如下:中增加原假设选项以及置信水平,代码如下:proc ttest h0=7
44、0 alpha=0.01 data=sjcj;var A;run;代代码码运运行行结结果果除除了了给给出出变变量量A在在99%置置信信水水平平下下的的均均值值、标标准准差差的的置置信信区区间间外外,还还给给出出对对假假设设0=70,所所作作的的t-检验的检验的p值,如图值,如图3-15所示。所示。结结果果显显示示t统统计计量量的的p值值=0.5734,不不能能拒拒绝绝(57.34%的的把握)原假设:均值把握)原假设:均值=70。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4.4.配对两样本均值的假设检验配对两样本均值的假设检验 在例在例3-8中检验两套试卷有
45、无显著差异,代码如下:中检验两套试卷有无显著差异,代码如下:proc ttest data=sjcj;paired A*B;run;代代码码运运行行结结果果给给出出了了对对原原假假设设1 2=0所所作作的的t检检验验的的p值,如图值,如图3-16所示。所示。结结果果显显示示t统统计计量量的的p值值=0.0005 0.05,因因此此拒拒绝绝原原假假设。说明两套试卷有显著差异。设。说明两套试卷有显著差异。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程5.5.独立两样本均值的假设检验独立两样本均值的假设检验 过过程程TTEST还还可可以以用用于于进进行行独独立立双双
46、样样本本均均值值比比较较的的t检验法。它的用法为检验法。它的用法为PROC TTEST DATA=;CLASS;VAR;RUN;使使用用这这一一格格式式要要求求将将两两个个样样本本中中被被比比较较均均值值的的变变量量的的观观测测值值记记在在同同一一分分析析变变量量下下,不不同同的的样样本本用用另另一一个个分分类类变变量量的的不不同同值值加加以以区区分分,而而且且分分类类变变量量只只能能取取两两个个值值,否则将报错。否则将报错。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程【例例3-9】仍仍然然考考虑虑例例3-7中中的的样样本本数数据据。假假定定其其中中数数据据
47、使用如下数据步存放在数据集使用如下数据步存放在数据集zzcpsj中:中:data zzcpsj;input f g$;cards;28.3 1 27.6 2 30.1 1 22.2 2 29 1 31 237.6 1 33.8 2 32.1 1 20 2 28.8 1 30.2 236 1 31.7 2 37.2 1 26 2 38.5 1 32 234.4 1 31.2 2 28 1 30 1;run;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 将将两两批批工工人人的的测测量量结结果果看看作作两两个个样样本本,但但其其数数据据都都放放在在一一个个数数据据
48、集集之之中中,所所需需的的时时间间值值是是记记录录在在同同一一分分析析变变量量f之之下下,而而两两种种方方法法的的差差别别是是由由变变量量g的的值值加加以以区区分分的的,所以所以g可作为分类变量。检验代码如下:可作为分类变量。检验代码如下:proc ttest data=zzcpsj;class g;var f;run;检验结果如图所示。检验结果如图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程在在检检验验中中,先先看看其其最最后后关关于于方方差差等等式式的的检检验验结结果果,检检验验方方差差相相等等是是用用的的F 统统计计量量,其其数数值值为为1.29
49、,相相应应的的p值值为为0.67790.05=,所以不能拒绝方差相等的假设。,所以不能拒绝方差相等的假设。在在方方差差相相等等的的前前提提下下,检检验验均均值值差差异异使使用用Pooled方方法法,对对应应统统计计量量的的t值值为为2.16,相相应应的的p值值为为0.04330.05=,所以两种方法所需的时间是有显著差异的。,所以两种方法所需的时间是有显著差异的。在在异异方方差差的的情情况况下下,使使用用Satterthwaite法法检检验验均均值值的的差异。差异。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n3.3 3.3 总体比例的区间估计与假设检验的总
50、体比例的区间估计与假设检验的SASSAS实现实现n3.3.1 总体比例的置信区间总体比例的置信区间n3.3.2 单样本总体比例的假设检验单样本总体比例的假设检验n3.3.3 两总体比例的比较两总体比例的比较STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.1 总体比例的置信区间总体比例的置信区间【例例3-10】2004年年底底北北京京市市私私家家车车拥拥有有量量已已达达到到129.8万万辆辆,位位居居全全国国之之首首,据据业业内内人人士士分分析析其其中中国国产产中中低低档档汽汽车车的的比比例例较较大大,为为了了估估计计目目前前北北京京市市场场个个人人购购车