《数值变量资料的统计推断.ppt》由会员分享,可在线阅读,更多相关《数值变量资料的统计推断.ppt(94页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数值变量资料的统计推断数值变量资料的统计推断 第三章第三章教学要求教学要求o掌握标准误计算公式及意义o熟悉t分布的特征o掌握总体均数的估计方法o掌握均数的假设检验方法统计推断的过程统计推断的过程总总体体样样本本抽抽样样总体均值、比总体均值、比例、方差例、方差统统计计推推断断样本均数、样本均数、率、标准差率、标准差统计量统计量参数参数假如我们想了解假如我们想了解我国正常成年男我国正常成年男子的红细胞计数子的红细胞计数?普查:对我国普查:对我国全部正常成年全部正常成年男子进行抽血,男子进行抽血,测定红细胞计测定红细胞计数。数。抽样:随机抽样测抽样:随机抽样测定我国定我国300名正常名正常成年男子红
2、细胞计成年男子红细胞计数,通过分析该部数,通过分析该部分男子的红细胞计分男子的红细胞计数推断全国情况。数推断全国情况。思考:变量?总体?样本?思考:变量?总体?样本?现实生活中的抽样现象现实生活中的抽样现象o炒菜时尝尝咸淡炒菜时尝尝咸淡o评价河水污染情况评价河水污染情况o就医时做血常规检验就医时做血常规检验 假设正常成年男子红细胞假设正常成年男子红细胞N(5.00,0.502)的正态分布总体,从该总体中重复进行的正态分布总体,从该总体中重复进行1000次抽次抽样,样本量分别为样,样本量分别为5,10,30。计算其均数和标。计算其均数和标准差。准差。10001000份样本抽样计算结果份样本抽样计
3、算结果总体总体均数均数总体总体标准差标准差 均数的均数的均数均数均数的标准差均数的标准差n=55.000.504.9870.23000.2236n=105.000.505.0110.15860.1581n=305.000.505.0000.09200.09131.各样本均数未必等于总体均数;各样本均数未必等于总体均数;2.样本均数之间存在差异;样本均数之间存在差异;3.样本均数的变异较之原变量的变异大大缩小;样本均数的变异较之原变量的变异大大缩小;4.样本均数分布很有规律,样本均数分布很有规律,围绕着总体均数,中间多,围绕着总体均数,中间多,两边少,左右基本对称,两边少,左右基本对称,服从正态
4、分布。服从正态分布。第一节第一节 均数的抽样误差均数的抽样误差o由于抽样造成的样本均数与总体均数之间、样由于抽样造成的样本均数与总体均数之间、样本均数与样本均数之间的差异。本均数与样本均数之间的差异。o这种差异可用样本均数这种差异可用样本均数 的变异,的变异,即样本均数的标准差来表示,又称标准误。即样本均数的标准差来表示,又称标准误。o标准误反映样本均数之间的离散程度,也反映标准误反映样本均数之间的离散程度,也反映样本均数抽样误差的大小。样本均数抽样误差的大小。o公式:公式:o当当S S一定时,一定时,n n越大,即样本量越大,标准误越大,即样本量越大,标准误越小;故:我们可以通过增加样本量来
5、减小越小;故:我们可以通过增加样本量来减小抽样误差。抽样误差。例例 20032003年某地年某地2020岁应征男青年中随机抽取岁应征男青年中随机抽取8585人,平均身高为人,平均身高为171.2cm171.2cm,标准差为,标准差为5.3cm5.3cm,计算当地计算当地2020岁应征男青年身高的标准误。岁应征男青年身高的标准误。o来自同一正态总体的样本:来自同一正态总体的样本:o来自同一非正态总体的样本:来自同一非正态总体的样本:小样本小样本 非正态分布非正态分布 大样本(大样本(n30)服从正态分布服从正态分布 中心极限定理:以数值中心极限定理:以数值变量为例,若从正态总变量为例,若从正态总
6、体中以固定体中以固定n反复多次反复多次抽样,所得样本均数的抽样,所得样本均数的分布是正态分布;即使分布是正态分布;即使从偏态总体中抽样,只从偏态总体中抽样,只要要n足够大,样本均数足够大,样本均数的分布也近似正态分布的分布也近似正态分布 标准差标准差 VS VS 标准误标准误第二节第二节t 分布分布o以以0为中心,左右对称,类为中心,左右对称,类似于标准正态分布似于标准正态分布o与标准正态分布相比,曲与标准正态分布相比,曲线峰值较矮,两尾部翘得线峰值较矮,两尾部翘得高;自由度越小,高;自由度越小,t值越分值越分散,曲线峰值越小。散,曲线峰值越小。o随着自由度逐渐增大,随着自由度逐渐增大,t分分
7、布逐渐逼近标准正态分布;布逐渐逼近标准正态分布;当自由度趋于无穷,当自由度趋于无穷,t分布分布即为标准正态分布。即为标准正态分布。P 101t t分布曲线下面积分布曲线下面积规律:规律:1.1.同一同一 下,下,P P值越小,值越小,t t值越大值越大 2.2.同一同一P P值下,值下,越大,越大,t t值越小值越小0第三节第三节 总体均数的估计总体均数的估计区间估计区间估计置信上限置信上限置信上限置信上限可信可信可信可信/置信区间置信区间置信区间置信区间(区间估计区间估计区间估计区间估计)置信下限置信下限置信下限置信下限样本统计量样本统计量 (点估计点估计)1-1-a a称为置信水平或置信度
8、,常用的有称为置信水平或置信度,常用的有90%90%、95%95%、99%99%;相应的区间可表示为;相应的区间可表示为90%CI90%CI、95%CI95%CI、99%CI99%CI。1-/2/21.1.已知,或已知,或 未知但未知但n n足够大足够大:u:u分布法分布法 1-/2/21.1 已知已知1.2 未知但未知但n n足够大足够大 样本量足够大,样本量足够大,t t分布趋向于分布趋向于u u分布分布2.2.未知未知:20032003年某地年某地2020岁应征男青年中随机抽取岁应征男青年中随机抽取8585人,平均身人,平均身高为高为171.2cm171.2cm,标准差为,标准差为5.3
9、cm5.3cm,估计,估计20032003年当地年当地2020岁岁应征男青年身高总体均数的应征男青年身高总体均数的9595的可信区间。的可信区间。解:解:,求总体均数的,求总体均数的95可信区间。可信区间。影响区间宽度的因素影响区间宽度的因素1.数据的离散程度,数据的离散程度,用用 S或或 来测度来测度2.样本容量,样本容量,3.置信水平置信水平(1-),影响,影响 或或 的大小的大小 可信区间可信区间参考值范围参考值范围含含义义 当当=0.05时,时,CI以以95%的可能性包含总体均数。的可能性包含总体均数。“正常人正常人”的解剖、生理、生化的解剖、生理、生化某项指标个体值的波动范围。某项指
10、标个体值的波动范围。计计算算公公式式 未知未知:正态分布:正态分布:已知或已知或 未知但为大样本未知但为大样本:偏态分布:偏态分布:PXP100 X 用用途途 总体均数的区间估计总体均数的区间估计 绝大多数绝大多数(如如95%)95%)观察对象某项指观察对象某项指标的分布范围标的分布范围 某某某某医医医医生生生生测测测测量量量量了了了了36363636名名名名从从从从事事事事铅铅铅铅作作作作业业业业男男男男性性性性工工工工人人人人的的的的血血血血红红红红蛋蛋蛋蛋白白白白含含含含量量量量,算算算算得得得得其其其其均均均均数数数数为为为为130.83g/L130.83g/L130.83g/L130
11、.83g/L,标标标标准准准准差差差差为为为为25.74g/L25.74g/L25.74g/L25.74g/L。问问问问从从从从事事事事铅铅铅铅作作作作业业业业男男男男性性性性工工工工人人人人的的的的血血血血红红红红蛋蛋蛋蛋白白白白是是是是否否否否不不不不同同同同于于于于正正正正常常常常成成成成年年年年男男男男性性性性平平平平均均均均值值值值140g/L140g/L140g/L140g/L?n=36已知总体已知总体已知总体已知总体未知总体未知总体未知总体未知总体第四节第四节 假设检验的基本步骤假设检验的基本步骤?造成样本均数造成样本均数造成样本均数造成样本均数 与已知总体与已知总体与已知总体与
12、已知总体 不等的原因:不等的原因:不等的原因:不等的原因:非同一总体非同一总体非同一总体非同一总体,即,即,即,即 是同一总体是同一总体是同一总体是同一总体,即,即,即,即 ,差异是由于,差异是由于,差异是由于,差异是由于抽样误差抽样误差抽样误差抽样误差造成的;造成的;造成的;造成的;如如果果 与与 很很接接近近,其其差差别别可可用用抽抽样样误误差解释差解释,可认为,可认为 来自来自 总体;总体;如如果果 与与 相相差差甚甚远远,不不宜宜用用抽抽样样误误差差来解释来解释,则怀疑,则怀疑 不是来自不是来自 总体。总体。如果如果 与与 相差较远,相差较远,t t 值就大,值就大,P P值就小。值就
13、小。假设假设 成立,成立,当当P P小于或等于预先规定的概率小于或等于预先规定的概率(如(如0.050.05),则),则有理由怀疑原假设有理由怀疑原假设 不成立,认为其对立不成立,认为其对立面面 成立。该结论犯错误的风险仅为成立。该结论犯错误的风险仅为 。一、假设检验的概念及基本原理一、假设检验的概念及基本原理o概念:概念:事先对总体参数或分布类型作出某种假设,判断事先对总体参数或分布类型作出某种假设,判断这种假设是否成立的方法。这种假设是否成立的方法。o特点:特点:反证法;小概率原理。反证法;小概率原理。o原理:原理:先假定提出的关于总体的假设成立,样本是通过先假定提出的关于总体的假设成立,
14、样本是通过合理设计获得的总体的代表,那么样本应体现总体的特合理设计获得的总体的代表,那么样本应体现总体的特点,如样本均数的值应在总体均数值附近,如果偏离太点,如样本均数的值应在总体均数值附近,如果偏离太远,则根据反证法和小概率原理拒绝原假设。远,则根据反证法和小概率原理拒绝原假设。链接:链接:反证法反证法即两种说即两种说法非法非A即即B,要证明,要证明A或或B真,只需证明对立方真,只需证明对立方伪。伪。小概率原理小概率原理:当某事件发生:当某事件发生的概率的概率P0.05时,称为小概时,称为小概率事件,表示某事件发生的率事件,表示某事件发生的可能性很小,是几乎不可能可能性很小,是几乎不可能发生
15、的事件。发生的事件。二、假设检验的基本步骤二、假设检验的基本步骤1.建立检验假设建立检验假设o无效假设:又称零假设,用无效假设:又称零假设,用H0表示。一般是假设总体表示。一般是假设总体参数相等参数相等 或服从某种分布。或服从某种分布。o备择假设:用备择假设:用H1表示。一般是假设总体参数不等或不表示。一般是假设总体参数不等或不服从某种分布。服从某种分布。检验假设是针对总体而言,而不是针对样本;如检验假设是针对总体而言,而不是针对样本;如 或或 。对于检验假设需要注意的几个问题:对于检验假设需要注意的几个问题:H H1 1的内容直接反映了检验单双侧。的内容直接反映了检验单双侧。假设假设双侧检验
16、双侧检验单侧检验单侧检验H0H1假设检验单双侧之分,需根据研究目的和专业知识而定。假设检验单双侧之分,需根据研究目的和专业知识而定。目的是推断两总体均目的是推断两总体均数是否不等数是否不等双侧检验双侧检验H H0 0:0 0,H H1 1:0 0;若从专业知识已知不若从专业知识已知不会出现会出现0 0的情况的情况(或已知不会出现或已知不会出现0 0的情况的情况)单侧检验单侧检验H H0 0:=0 0,H H1 1:0 0(或或0 0)双侧检验的例子双侧检验的例子单侧检验的例子单侧检验的例子2.2.确定显著性水平确定显著性水平 又又称称检检验验水水准准,是是预预先先规规定定的的概概率率值值,它它
17、确确定定了了小小概概率率事事件件的的标标准准。当当某某事事件件发发生生的的概概率率P P 时时,则则认认为为该该事事件件为为小小概概率率事事件件。在在实实际际工工作作中中常常取取=0.05=0.05或或0.010.01。可根据不同研究目的给予不同设置。可根据不同研究目的给予不同设置。3.3.计算统计量计算统计量 不同的检验方法采用不同的检验统计量不同的检验方法采用不同的检验统计量 例如:例如:4.4.确定概率值确定概率值P P查查表表得得到到检检验验水水平平 所所对对应应的的界界值值,将将计计算算得得到到的统计量与之比较,得到的统计量与之比较,得到P P 值大小。值大小。5.5.做出推断结论做
18、出推断结论 根据获得的事后概率根据获得的事后概率P P与事先规定的检验水与事先规定的检验水准准 进行比较,看其是否为小概率事件而得出进行比较,看其是否为小概率事件而得出结论。结论。一般来说,推断结论应该包含统计结论和一般来说,推断结论应该包含统计结论和专业结论两部分。统计结论只说明差别有无统专业结论两部分。统计结论只说明差别有无统计学意义,而不能说明专业上的差异大小。要计学意义,而不能说明专业上的差异大小。要与专业结论有机地结合,才能得出恰当的推断与专业结论有机地结合,才能得出恰当的推断结论。结论。若若 ,按所取检验水准,按所取检验水准 ,拒绝,拒绝 ,接受,接受 ,样本统计量样本统计量差别有
19、统计学意义(差别有统计学意义(统计结论统计结论)。可)。可以认为以认为总体参数总体参数不等或不同(不等或不同(专业结论专业结论)。)。若若 ,按按所所取取检检验验水水准准 ,不不拒拒绝绝 ,样样本本统统计计量量差差别别无无统统计计学学意意义义(统统计计结结论论)。还还不不能能认为认为总体参数总体参数不等或不同(不等或不同(专业结论专业结论)。)。第五节第五节均数的假设检验均数的假设检验1 1单单个个样样本均数的假本均数的假设检验设检验p设计设计:样样本均数与一已知本均数与一已知总总体均数的比体均数的比较较p目的:目的:推断推断样样本均数本均数 (代表未知(代表未知总总体均数体均数 )和)和已知
20、已知总总体均数体均数 (理(理论值论值、标标准准值值、稳稳定定值值)有无)有无差差别别。p检验检验方法:方法:根据根据样样本来自的本来自的总总体的分布体的分布类类型、型、样样本本含量含量n n的大小及的大小及总总体体标标准差准差 是否已知是否已知选择选择t t检验检验、u u检验检验或其他或其他检验检验方法。方法。o计算公式:计算公式:n n 6060或或 已知时,用已知时,用u u检验检验n n 6060时,用时,用t t检验检验 某某医医生生测测量量了了3636名名从从事事铅铅作作业业男男性性工工人人的的血血红红蛋蛋白白含含量量,算算得得其其均均数数为为130.83g/L130.83g/L
21、,标标准准差差为为25.74g/L25.74g/L。问问从从事事铅铅作作业业男男性性工工人人的的血血红红蛋蛋白白是是否否不不同同于于正正常常成成年年男男性性平平均均值值140g/L140g/L?n=36已知总体已知总体已知总体已知总体未知总体未知总体未知总体未知总体?(1)(1)建立检验假设,确定检验水准建立检验假设,确定检验水准H H0 0:=0 0=140g/L140g/L,即即从从事事铅铅作作业业的的男男性性工工人人平平均血红蛋白含量与正常成年男性平均值相等均血红蛋白含量与正常成年男性平均值相等H H1 1:0 0=140g/L140g/L,即即从从事事铅铅作作业业的的男男性性工工人人平
22、平均均血红蛋白含量与正常成年男性平均值不等血红蛋白含量与正常成年男性平均值不等=0.05(2)(2)计算检验统计量计算检验统计量本例本例n=36n=36,=130.83g/L=130.83g/L,S=25.74g/LS=25.74g/L,=140g/L=140g/L。按公式按公式按按=0.05=0.05水水准准,拒拒绝绝H H0 0,接接受受H H1 1,3636名名从从事事铅铅作作业业男男性性工工人人的的平平均均血血红红蛋蛋白白含含量量与与正正常常成成年年男男性性血血红红蛋蛋白白含含量量平平均均值值差差别别有有统统计计学学意意义义,可可认认为为从从事事铅铅作作业业的的男男性性工工人人血血红红
23、蛋蛋白白含含量量均均数数与与正正常常成成年年男男性性血血红红蛋蛋白含量均数不同。白含量均数不同。随机抽样调查泉州市区某医院随机抽样调查泉州市区某医院2020名男婴出生名男婴出生体重,其均数为体重,其均数为3.343.34,标准差为,标准差为0.420.42。o已知泉州市区男婴出生体重均数为已知泉州市区男婴出生体重均数为3.293.29。试比较该院男婴出生体重均数与全市男婴出试比较该院男婴出生体重均数与全市男婴出生体重均数是否不同?生体重均数是否不同?o在郊区抽查在郊区抽查2020名男婴出生体重,均数为名男婴出生体重,均数为3.23 3.23,标准差,标准差0.470.47,问市区和郊区男婴出生
24、,问市区和郊区男婴出生体重均数是否不同?体重均数是否不同?二、两个独立样本均数的假设检验二、两个独立样本均数的假设检验o设计:设计:两个独立样本均数的比较两个独立样本均数的比较o目的:目的:通过比较两个样本均数通过比较两个样本均数 的大的大小,推断两样本均数所代表的总体均数小,推断两样本均数所代表的总体均数 是否相同。是否相同。o检验方法:检验方法:根据两样本来自的总体分布类型、根据两样本来自的总体分布类型、例数的大小及两样本所代表的总体方差是否相例数的大小及两样本所代表的总体方差是否相同来选择同来选择t检验、检验、u检验或其他检验方法。检验或其他检验方法。o计算公式:计算公式:o两样本含量均
25、两样本含量均60,用,用U检验检验o样本含量样本含量n n1 1和和/或或n n2 26060,用,用t t检验检验p两总体方差相同两总体方差相同o两总体方差不同,校正两总体方差不同,校正t t检验检验为了解氨甲喋呤对外周血为了解氨甲喋呤对外周血IL-2IL-2水平的影响,某医水平的影响,某医生将生将6060名哮喘患者随机分为两组。其中对照组名哮喘患者随机分为两组。其中对照组2929例,采用安慰剂;实验组例,采用安慰剂;实验组3131例,采用小剂量氨甲例,采用小剂量氨甲喋呤进行治疗。测得对照组治疗前喋呤进行治疗。测得对照组治疗前IL-2IL-2的均数为的均数为20.00 IU/ml 20.00
26、 IU/ml,标准差为,标准差为7.00 IU/ml 7.00 IU/ml;试验组治;试验组治疗前疗前IL-2IL-2的均数为的均数为17.00 IU/ml 17.00 IU/ml,标准差为,标准差为8.50 8.50 IU/ml IU/ml。问两组总体均数有无差别?。问两组总体均数有无差别?判断两组治疗前判断两组治疗前IL-2的总体方差是否齐性?的总体方差是否齐性?本例:本例:(1)建立检验假设,确定检验水准建立检验假设,确定检验水准(2)计算检验统计量计算检验统计量(3)(3)确定确定P P值,作出推断结论值,作出推断结论 按按=0.05=0.05水准,不拒绝水准,不拒绝H H0 0,两组
27、治,两组治疗前疗前IL-2IL-2均数差异无统计学意义均数差异无统计学意义,尚不能尚不能认为两组治疗前认为两组治疗前IL-2IL-2水平不同。水平不同。o某研究表明新研制的一种安眠药比旧安眠药增加睡眠时间。某医师从已确诊的神经衰弱病人中随机抽取40例病人并进行随机分组,一组20例病人服用该种新药,计算得到平均睡眠时间为6.39小时,标准差为2.24小时;另一组20例病人服用旧药,计算得到平均睡眠时间为6.45小时,标准差为2.51小时。试比较新安眠药与旧安眠药平均睡眠时间是否不同?o同样研究新安眠药与旧安眠药睡眠时间。另一位医师也从已确诊的神经衰弱病人中随机抽取40例病人,按病人体重、神经衰弱
28、严重程度相近配成对子,共20对。每对的病人随机分至新药组与旧药组。试比较新安眠药与旧安眠药平均睡眠时间是否不同?三、配对设计资料的假设检验三、配对设计资料的假设检验o设计:设计:配对设计,具体形式有配对设计,具体形式有1.将研究对象按某种特征(主要非处理因素)配将研究对象按某种特征(主要非处理因素)配成对,同对的两对象随机分别接受不同处理成对,同对的两对象随机分别接受不同处理2.同一对象接受不同的处理同一对象接受不同的处理3.同一对象接受某种处理前后同一对象接受某种处理前后o目的:目的:控制可能存在的非处理因素的影响,判控制可能存在的非处理因素的影响,判断不同处理效果或同一处理前后效果是否有差
29、断不同处理效果或同一处理前后效果是否有差别。别。o某单位研究饮食中缺乏维生素某单位研究饮食中缺乏维生素E与肝中维生素与肝中维生素A含量的关系,将同种属的大白鼠按性别相同,年含量的关系,将同种属的大白鼠按性别相同,年龄、体重相近者配成对子,共龄、体重相近者配成对子,共8对,并将每对中对,并将每对中的两只大白鼠随机分到正常饲料组和维生素的两只大白鼠随机分到正常饲料组和维生素E缺缺乏组。乏组。o用简便法和常规法分别对用简便法和常规法分别对12份人尿进行尿铅含份人尿进行尿铅含量测定量测定o为观察静脉注射人血丙种球蛋白治疗小儿急性毛为观察静脉注射人血丙种球蛋白治疗小儿急性毛细支气管炎,某儿科分别测量患儿
30、用药前后血清细支气管炎,某儿科分别测量患儿用药前后血清免疫球蛋白含量。免疫球蛋白含量。o检验方法:根据资料类型不同,选择不同的检检验方法:根据资料类型不同,选择不同的检验方法验方法o公式:配对公式:配对t检验检验o =对子数对子数-1为为比比较较两两种种方方法法对对乳乳酸酸饮饮料料中中脂脂肪肪含含量量测测定定结结果果是是否否不不同同,某某人人随随机机抽抽取取了了1010份份乳乳酸酸饮饮料料制制品品,分分别别用用脂脂肪肪酸酸水水解解法法和和哥哥特特里里罗罗紫紫法法测测定定,其其结结果果见见下下表表。问问两两法法测测定定结结果果是否不同?是否不同?n=10n=10已知总体已知总体已知总体已知总体未
31、知总体未知总体未知总体未知总体?(1)(1)建立检验假设,确定检验水准建立检验假设,确定检验水准 H H0 0:d d0 0,即两种方法的测定结果相同,即两种方法的测定结果相同 H H1 1:d d00,即两种方法的测定结果不同,即两种方法的测定结果不同 =0.05=0.05 (2)(2)计算检验统计量计算检验统计量(3)(3)确定确定P P值,作出推断结论值,作出推断结论 查查t t界界值值表表得得P P0.050.05。按按=0.05=0.05水水准准,拒拒绝绝H H0 0,接接受受H H1 1,有有统统计计学学意意义义。认认为为两两种种方方法法对对脂脂肪肪含含量量的的测测定定结结果果不不
32、同同,哥哥特特里里罗罗紫紫法法测测定定结结果果较高较高。小白鼠小白鼠 编编 号号12345678910随机数随机数18242207295733496592排序号排序号24315867910分分 组组乙乙乙乙甲甲甲甲甲甲乙乙乙乙甲甲甲甲乙乙将将1010只小白鼠按成组设计分成两组,分组方法见只小白鼠按成组设计分成两组,分组方法见下表:下表:独立样本资料比较的数据格式独立样本资料比较的数据格式对照组对照组 实验组实验组.n1 n2糖尿病加糖尿病加钒组钒组糖尿病糖尿病组组26.4626.4646.8946.8925.1925.1947.2147.2128.7028.7042.4242.4223.702
33、3.7047.7047.7024.4824.4840.7540.7525.1925.1941.0341.0328.0128.0145.9845.9823.7023.7043.4643.4626.1026.1044.3444.3424.6224.6245.3245.32 在探在探讨讨硫酸氧硫酸氧钒钒降糖作用的降糖作用的实验实验中,中,测测得两得两组动组动物每物每日日进进食量如表所示。食量如表所示。试问试问两两组动组动物每日物每日进进食量是否相同?食量是否相同?配对号配对号12345小白鼠小白鼠12345678910随机数随机数18 24 220729573349 65 92排序号排序号12211
34、21212分分 组组甲甲乙乙乙乙甲甲甲甲乙乙甲甲乙乙甲甲乙乙将将1010只小白鼠按配对设计分成两组,分组方法只小白鼠按配对设计分成两组,分组方法见下表:见下表:对子号对子号对照组对照组实验组实验组差值差值d1.2.3.4.5.合计合计.成对样本均数比较的数据格式成对样本均数比较的数据格式不同形式均数的假设检验的比较不同形式均数的假设检验的比较均数假设检验的比较均数假设检验的比较.doc.doc 假假设设检检验验采采用用小小概概率率反反证证法法的的思思想想,根根据据P P值值作作出出的的推推断断结结论论具具有有概概率率性性,无无论论拒拒绝还是不拒绝绝还是不拒绝H H0 0,都可能犯错误。,都可能
35、犯错误。第六节第六节 假设检验的注意事项假设检验的注意事项可能发生的两类错误可能发生的两类错误I I型错误:型错误:“实际无差别,但下了有差别的结论实际无差别,但下了有差别的结论”。也叫假阳。也叫假阳性错误或称性错误或称“弃真弃真”错误。错误。I I型错误的概率用型错误的概率用 表示表示。IIII型错误:型错误:“实际有差别,但下了无差别的结论实际有差别,但下了无差别的结论”。也叫假阴。也叫假阴性错误或称性错误或称“取伪取伪”错误。错误。IIII型错误的概率用型错误的概率用 表示表示。二、假设检验应注意的问题二、假设检验应注意的问题 1.1.不同的资料应选用不同检验方法。不同的资料应选用不同检
36、验方法。实验目的、设计、资料类型和分布、样本量实验目的、设计、资料类型和分布、样本量2.2.正确理解正确理解“显著性显著性”一词的含义。一词的含义。差别差别“有无显著性有无显著性”(不提倡)(不提倡)差别差别“有无统计学意义有无统计学意义”()3.3.结论不能绝对化,统计结论具有概率性。结论不能绝对化,统计结论具有概率性。写论文时,列出检验统计量及具体写论文时,列出检验统计量及具体P P值。值。4.4.注意注意“统计学意义统计学意义”与医学与医学/临床临床/生物学意义的区生物学意义的区别别6.6.可信区间与假设检验有不同的作用,要结合使用。可信区间与假设检验有不同的作用,要结合使用。可信区间:量的大小可信区间:量的大小 假设检验:质的不同假设检验:质的不同(1 1)可信区间可以回答假设检验的问题。)可信区间可以回答假设检验的问题。(2 2)可信区间不但能回答是否有统计学意义,而且还)可信区间不但能回答是否有统计学意义,而且还能比假设检验提供更多的信息,即实际的专业意义。能比假设检验提供更多的信息,即实际的专业意义。(3 3)可信区间只能在预先给定的概率)可信区间只能在预先给定的概率 前提下进行计前提下进行计算,而假设检验可以获得一个确切概率算,而假设检验可以获得一个确切概率P P。