总体均数的区间估计和假设检验.ppt

上传人:石*** 文档编号:47079822 上传时间:2022-09-29 格式:PPT 页数:78 大小:3.37MB
返回 下载 相关 举报
总体均数的区间估计和假设检验.ppt_第1页
第1页 / 共78页
总体均数的区间估计和假设检验.ppt_第2页
第2页 / 共78页
点击查看更多>>
资源描述

《总体均数的区间估计和假设检验.ppt》由会员分享,可在线阅读,更多相关《总体均数的区间估计和假设检验.ppt(78页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、总体均数的区间估计和假设检验现在学习的是第1页,共78页目 录q 第五节第五节 均数的均数的 u 检验检验q 第二节第二节 t 分布分布q 第三节第三节 总体均数的区间估计总体均数的区间估计q 第四节第四节 假设检验的意义和基本步骤假设检验的意义和基本步骤q 第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误q 第六节第六节 均数的均数的 t 检验检验q 第八节第八节 型错误和型错误和型错误型错误q 第九节第九节 应用假设检验应注意的问题应用假设检验应注意的问题q 第七节第七节 两总体方差的齐性检验和t检验现在学习的是第2页,共78页学习要求w掌握:抽样误差的概念和计算方法w掌握:总体

2、均数区间的概念,意义和计算方法w掌握:假设检验的基本步骤及思路w掌握:u检验和t检验的概念,意义,应用条件和计算方法w熟悉:第一类错误和第二类错误的概念和意义w熟悉:假设检验的注意问题现在学习的是第3页,共78页w w统计推断统计推断统计推断统计推断(statistical inferencestatistical inference):根据样本信息来根据样本信息来推论总体特征。推论总体特征。w w均数的抽样误差均数的抽样误差均数的抽样误差均数的抽样误差 :由抽样引起的:由抽样引起的样本均数与总体均数样本均数与总体均数的差异的差异称为均数的抽样误差。称为均数的抽样误差。w w标准误标准误标准误

3、标准误(standard error)(standard error)(standard error)(standard error):反映均数:反映均数抽样误差大小抽样误差大小的指的指标。标。第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误一、标准误的意义及其计算一、标准误的意义及其计算现在学习的是第4页,共78页PopulationPopulationPopulationPopulationsample2sample2sample1sample1sample3sample3sample4 sample4 sample5sample5现在学习的是第5页,共78页已知:标准误计算公式

4、标准误计算公式未知:现在学习的是第6页,共78页 实例:如某年某市实例:如某年某市120120名名1212岁健康男孩,已求岁健康男孩,已求得均数为得均数为143.07143.07cmcm,标准差为,标准差为5.705.70cmcm,按公式计算,按公式计算,则标准误为:则标准误为:现在学习的是第7页,共78页w1.1.表示抽样误差的大小表示抽样误差的大小 ;w2.2.进行总体均数的区间估计;进行总体均数的区间估计;w3.3.进行均数的假设检验等。进行均数的假设检验等。二、标准误的应用二、标准误的应用 现在学习的是第8页,共78页第二节第二节 t t 分布分布一、一、t 分布的概念分布的概念w t

5、分布于1908年由英国统计学家W.S.Gosset以“Student”笔名发表,故又称“Student t”分布现在学习的是第9页,共78页w正态变量X采用u(X)/变换,则一般的正态分布N(,)即变换为标准正态分布N(0,1)。w又因从正态总体抽取的样本均数服从正态分布 N(,),同样可作正态变量的u变换,即现在学习的是第10页,共78页v 实际工作中由于理论的标准误往往未知,而用样本的标准误作为的估计值,此时就不是u变换而是t变换了,即下式:现在学习的是第11页,共78页二、t分布曲线的特征 vt分布曲线是单峰分布,以0为中心,左右两侧对称,v曲线的中间比标准正态曲线(u分布曲线)低,两侧

6、翘得比标准正态曲线略高。vt分布曲线随自由度而变化,当样本含量越小(严格地说是自由度=n-1越小),t分布与u分布差别越大;当逐渐增大时,t分布逐渐逼近于u分布,当=时,t分布就完全成正态分布。vt分布曲线是一簇曲线,而不是一条曲线。vT界值表。现在学习的是第12页,共78页t t 分布示意图分布示意图现在学习的是第13页,共78页t分布曲线下双侧或单侧尾部合计面积w 我们常把自由度为的t分布曲线下双侧尾部合计面积或单侧尾部面积为指定值时,则横轴上相应的t界值记为t,。w 如当=20,=0.05时,记为t0.05,20;当=22,=0.01时,记为t0.01,22。对于t,值,可根据和值,查附

7、表,t界值表。现在学习的是第14页,共78页v t分布是t检验的理论基础。由公式可知,t值与样本均数和总体均数之差成正比,与标准误成反比。v 在t分布中t值越大,其两侧或单侧以外的面积所占曲线下总面积的比重就越小,说明在抽样中获得此t值以及更大t值的机会就越小,这种机会的大小是用概率P来表示的。v t值越大,则P值越小;反之,t值越小,P值越大。根据上述的意义,在同一自由度下,t t,则P ;反之,tt,则P。现在学习的是第15页,共78页第三节 总体均数的区间估计 w参数估计:用样本指标(统计量)估计总体指标(参数)称为参数估计。w估计总体均数的方法有两种,即:w点值估计(point est

8、imation)w区间估计(interval estimation)。现在学习的是第16页,共78页一、点值估计 w点值估计:是直接用样本均数作为总体均数的估计值。w 此法计算简便,但由于存在抽样误差,通过样本均数不可能准确地估计出总体均数大小,也无法确知总体均数的可靠程度。现在学习的是第17页,共78页二、区间估计 区间估计是按一定的概率(1-)估计包含总体均数可能的范围,该范围亦称总 体 均 数 的 可 信 区 间(confidence interval,缩写为CI)。1-称为可信度,常取1-为0.95和0.99,即总体均数的95%可信区间和99%可信区间。1-(如95)可信区间的含义是:

9、总体均数被包含在该区间内的可能性是1-,即(95),没有被包含的可能性为,即(5)。现在学习的是第18页,共78页总体均数的可信区间的计算总体均数的可信区间的计算 w1.未知且n较小(n100),可用u检验。不同的统计检验方法,可得到不同的统计量,如t值和u值。现在学习的是第29页,共78页w4.确定概率P值 P值是指在H0所规定的总体中作随机抽样,获得等于及大于(或小于)现有统计量的概率。t t,则P ;t。现在学习的是第30页,共78页w5.作出推断结论 w当P时,表示在H0成立的条件下,出现等于及大于现有统计量的概率是小概率,根据小概率事件原理,现有样本信息不支持H0,因而拒绝H0,结论

10、为:按所取检验水准拒绝H0,接受H1,即差异有统计学意义。如例3.3 认为两总体脉搏均数有差别。w当P时,表示在H0成立的条件下,出现等于及大于现有统计量的概率不是小概率,现有样本信息还不能拒绝H0,结论为按所取检验水准不拒绝H0,即差异无统计意义,如例3.3 尚不能认为两总体脉搏均数有差别。现在学习的是第31页,共78页下结论时的注意点:wP ,拒绝H0,不能认为H0肯定不成立,因为虽然在H0成立的条件下出现等于及大于现有统计量的概率虽小,但仍有可能出现;w同理,P ,不拒绝H0,更不能认为H0肯定成立。w由此可见,假设检验的结论是具有概率性的,无论拒绝H0或不拒绝H0,都有可能发生错误,即

11、第一类错误或第二类错误 现在学习的是第32页,共78页第五节 均数的u检验v国外统计书籍及统计软件亦称为单样本u检验(one sample u-test)。v样本均数与总体均数比较的u检验适用于:v总体标准差已知的情况;v样本含量较大时,比如n100时。对于后者,是因为n较大,也较大,则t分布很接近u分布的缘故。一、样本均数与总体均数比较的一、样本均数与总体均数比较的u u检验检验现在学习的是第33页,共78页u 值的计算公式为:总体标准差已知时,不管n的大小。总体标准差未知时,但n100时。现在学习的是第34页,共78页例3.4 某托儿所三年来测得2124月龄的47名男婴平均体重11kg。查

12、得近期全国九城市城区大量调查的同龄男婴平均体重11.18kg,标准差为1.23kg。问该托儿所男婴的体重发育状况与全国九城市的同期水平有无不同?(全国九城市的调查结果可作为总体指标)现在学习的是第35页,共78页w(1)建立检验假设 wH0:0,即该托儿所男婴的体重发育状况与全国九城市的同期水平相同,0.05(双侧)wH1:0,即该托儿所男婴的体重发育状况与全国九城市的同期水平不同。w(2)计算u值 本例因总体标准差已知,故可用u检验。w本例n=47,样本均数=11,总体均数=11.18,总体标准差=1.23,代入公式现在学习的是第36页,共78页w(3)确定P值,作出推断结论 w 查u界值表

13、(t界值表中为一行),得u0.05=1.96,u=1.0030.05。按=0.05水准,不拒绝H0,差异无统计学意义。w结论:可认为该托儿所男婴的体重发育状况与全国九城市的同期水平相同。现在学习的是第37页,共78页二、两样本均数比较的u检验w该检验也称为独立样本u检验(independent sample u-test),适用于两样本含量较大(如n150且n250)时,u值可按下式计算:现在学习的是第38页,共78页 例3.5 测得某地2024岁健康女子100人收缩压均数为15.27kPa,标准差为1.16kPa;又测得该地2024岁健康男子100人收缩压均数为16.11kPa,标准差为1.

14、41kPa。问该地2024岁健康女子和男子之间收缩压均数有无差别?现在学习的是第39页,共78页(1)建立检验假设 H0:1 2,即该地2024岁健康女子和男子之间收缩压均数相同;H1:12,即该地2024岁健康女子和男子之间收缩压均数不同。0.05(双侧)(2)计算u值 本例 n1=100,均数1=15.27,S1=1.16 n2=100,均数2=16.11,S2=1.41现在学习的是第40页,共78页w(3)确定P值,作出推断结论 w 查u界值表(附表7,t界值表中为一行),得u0.05=1.96,现uu0.05=1.96,故P0.05。按水准=0.05,拒绝H0,接受H1,差异有统计学意

15、义。w 结论:可认为该地2024岁健康人的收缩压均数男性不同于女性。现在学习的是第41页,共78页第六节 均数的 t 检验 v当样本含量较小(如n50)时,t分布和u分布有较大的出入,所以小样本小样本的样本均数与总体均数的比较以及两个样本均数的比较要用t检验。vt检验的适用条件:样本来自正态总体或近似正态总体;两样本总体方差相等。现在学习的是第42页,共78页t检验的类型w1.单样本t检验(样本均数与总体均数比较t检验)w2.配对样本t检验w3.独立样本t检验(两样本均数比较t检验)现在学习的是第43页,共78页w 即样本均数代表的未知总体均数与已知的总体均数(一般为理论值、标准值或经过大量观

16、察所得的稳定值等)进行比较。w 这时检验统计量t值的计算在H0成立的前提条件下为:一、单样本t检验(样本均数与总体均数比较的t检验)现在学习的是第44页,共78页w例3.3 根据调查,已知健康成年男子脉搏的均数为72次/分钟,某医生在一山区随机测量了25名健康成年男子脉搏数,求得其均数为74.2次/分钟,标准差为6.5次/分钟,能否认为该山区成年男子的脉搏数与一般健康成年男子的脉搏数不同?现在学习的是第45页,共78页例3.6 对例3.3资料进行t检验。(1)建立检验假设 H0:0,即该山区健康成年男子脉搏均数与一般健康成年男子脉搏均数相同;H1:0,即该山区健康成年男子脉搏均数与一般健康成年

17、男子脉搏均数不同。0.05(双侧)(2)计算t值 本例n=25,s=6.5,样本均数=74.2,总体均数=72,代入公式现在学习的是第46页,共78页(3)确定P值,作出推断结论 本例=251=24,查t界值表,得t0.05,24=2.064,现t=1.6920.05。按=0.05的水准,不拒绝H0,差异无统计学意义。结论:即根据本资料还不能认为此山区健康成年男子脉搏数与一般健康成年男子不同。现在学习的是第47页,共78页w配对实验设计得到的资料称为配对资料。w医学科研中配对资料的四种主要类型:w同一批受试对象治疗前后某些生理、生化指标的比较;w同一种样品,采用两种不同的方法进行测定,来比较两

18、种方法有无不同;w配对动物试验,各对动物试验结果的比较等。w同一观察对象的对称部位。二、配对资料的t检验现在学习的是第48页,共78页v 先求出各对子的差值d的均值,若两种处理的效应无差别,理论上差值d 的总体均数应为0。所以这类资料的比较可看作是样本均数与总体均数为0的比较。要求差值的总体分布为正态分布。v 配对资料的配对资料的 t t 检验检验(paired(paired samples t-test)samples t-test)t检验的公式为:现在学习的是第49页,共78页例3.7 设有12名志愿受试者服用某减肥药,服药前和服药后一个疗程各测量一次体重(kg),数据如表3-4所示。问此

19、减肥药是否有效?(1)建立检验假设 H0:d=0,即该减肥药无效;H1:d0,即该减肥药有效。单侧=0.05 现在学习的是第50页,共78页表3-4 某减肥药研究的体重(kg)观察值 现在学习的是第51页,共78页w(2)计算t值w本例n=12,d=-16,d2=710,w差值的均数=d/n=-16/12=-1.33(kg)现在学习的是第52页,共78页w(3)确定P值,作出推断结论 自由度=n-1=12-1=11,查t界值表,得单侧t0.05,11=1.796,现t=0.58 0.05。按=0.05水准,不拒绝H0,差异无统计学意义。w结论:故尚不能认为该减肥药有减肥效果。现在学习的是第53

20、页,共78页w两样本均数比较的t检验亦称为成组t检验,又称为独立样本独立样本t t检验(检验(independent samples t-testindependent samples t-test)。w适用于比较按完全随机设计而得到的两组资料,比较的目的是推断它们各自所代表的总体均数和是否相等。三、两样本均数比较的t检验现在学习的是第54页,共78页 样本估计值为:总体方差已知:总体方差已知:标准误的计算公式标准误的计算公式合并方差:现在学习的是第55页,共78页若n1=n2时:w已知S1和S2时:现在学习的是第56页,共78页例3.9 测得14名慢性支气管炎病人与11名健康人的尿中17酮类

21、固醇(mol/24h)排出量如下,试比较两组人的尿中17酮类固醇的排出量有无不同。w原始调查数据如下:w病 人X1:n=14;10.05 18.75 18.99 15.94 13.96 17.67 20.51 17.22 14.69 15.10 9.42 8.21 7.24 24.60w健康人X2:n=11;17.95 30.46 10.88 22.38 12.89 23.01 13.89 19.40 15.83 26.72 17.29 现在学习的是第57页,共78页(1 1)建立检验假设)建立检验假设 H H0 0:1 1 2 2 ,即病人与健康人的尿,即病人与健康人的尿中中1717酮类固醇

22、的排出量相同酮类固醇的排出量相同H H1 1:1 1 2 2 ,即病人与健康人的尿,即病人与健康人的尿中中1717酮类固醇的排出量不同酮类固醇的排出量不同 0.050.05 现在学习的是第58页,共78页w(2)计算t值 w本例n1=14,X1=212.35,X12=3549.0919wn2=11,X2=210.70,X22=4397.64 现在学习的是第59页,共78页w(3)确定P值 作出推断结论 =14+11-2=23,查t界 值 表,得t0.05,23=2.069,现t=1.80350.05。按=0.05水准,不拒绝H0,差异无统计学意义。结论:尚不能认为慢性支气管炎病人与健康人的尿中

23、17酮类固醇的排出量不同。现在学习的是第60页,共78页v比较两样本几何均数的目的是推断它们各自代表的总体几何均数有无差异。v适用于:v观察值呈等比关系,如血清滴度;v观察值呈对数正态分布,如人体血铅含量等。v两样本几何均数比较的t检验公式与两样本均数比较的t检验公式相同。v只需将观察X用lgX来代替就行了 四、两样本几何均数t检验现在学习的是第61页,共78页w例3.10 将20名钩端螺旋体病人的血清随机分为两组,分别用标准株和水生株作凝溶试验,抗体滴度的倒数(即稀释度)结果如下。问两组抗体的平均效价有无差别?标准株标准株(11(11人人):100 200 400 400 400 400 8

24、00 1600 1600 100 200 400 400 400 400 800 1600 1600 1600 3200 1600 3200水生株水生株(9(9人人):100 100 100 200 200 200 200 400 1600 100 100 100 200 200 200 200 400 1600将两组数据分别取对数,记为将两组数据分别取对数,记为x1,x2。x1:2.000 2.301 2.602 2.602 2.602 2.602 2.903 3.204 3.204 3.204 3.505x2:2.000 2.000 2.000 2.301 2.301 2.301 2.30

25、1 2.602 3.204现在学习的是第62页,共78页w一、两样本方差的齐性检验(F检验)w用较大的样本方差S2比较小的样本方差S2 1 1为分子自由度,为分子自由度,2 2为分母自由度为分母自由度 查查F F界值表界值表:F:F,1,2,1,2界值做出推断界值做出推断第七节 两总体方差的齐性检验和t检验现在学习的是第63页,共78页v注意:v方差齐性检验本为双侧检验,F界值表单侧0.05的界值,实对应双侧检验P=0.1;v当样本含量较大时(如n1和n2均大于50),可不必作方差齐性检验。现在学习的是第64页,共78页w深层水:n1=8,样本均数=1.781(mg/L),S1=1.899(m

26、g/L)w表层水:n2=10,样本均数=0.247(mg/L),S2=0.210(mg/L)例3.11 某研究所为了了解水体中汞含量的垂直变化,对某氯碱厂附近一河流的表层水和深层水作了汞含量的测定,结果如下。试检验两个方差是否齐性。现在学习的是第65页,共78页w 确定P值 作出推断结论 本例18-1=7,210-1=9,查附表F界值表,w 得F0.05,7,9=4.197,本例F80.97 F 0.05,7,9=4.197;故P0.05,按=0.05 水准,拒绝H0,接受H1,w结论:故可认为两总体方差不齐。现在学习的是第66页,共78页w方差不齐时,两小样本均数的比较,可选用以下方法:w采

27、用适当的变量变换,使达到方差齐的要求;w采用非参数检验;w采用t 检验。二、t 检验现在学习的是第67页,共78页计算统计量计算统计量tt 值值 现在学习的是第68页,共78页w例3.12 由例3.11已知表层水和深层水含汞量方差不齐,试比较其均数有无差别?自学内容现在学习的是第69页,共78页w假设检验中作出的推断结论可能发生两种错误:w拒绝了实际上是成立的H0,这叫型错误(typeerror)或第一类错误,也称为错误。w不拒绝实际上是不成立的H0,这叫型错误(typeerror)或第二类错误,也称为错误。第八节 型错误和型错误现在学习的是第70页,共78页表3-6 可能发生的两类错误现在学

28、习的是第71页,共78页现在学习的是第72页,共78页现在学习的是第73页,共78页现在学习的是第74页,共78页w联系:一般增大,则减小;减小,则增大;w区别:w(1)一般为已知,可取单侧或双侧,如0.05,或0.01。w(2)一般为未知,只取单侧,如取0.1或0.2。1(把握度)0.75。两类错误的联系与区别现在学习的是第75页,共78页w1-1-称为称为检验效能检验效能(power of test)(power of test)或或把把握度握度,其意义是两总体确有差别,按其意义是两总体确有差别,按水水准能发现它们有差别的能力。准能发现它们有差别的能力。w与与的大小应根据实际情况适当取值。的大小应根据实际情况适当取值。现在学习的是第76页,共78页w1.资料要来自严密的抽样研究设计w2.选用假设检验的方法应符合其应用条件 w3.正确理解差别有无显著性的统计涵义 正确理解差别有统计学意义 及临床上的差别的统计学意义。w4.假设检验的推断结论不能绝对化 w5.要根据资料的性质事先确定采用双侧检验或单侧检验 第九节第九节 应用假设检验的注意问题应用假设检验的注意问题现在学习的是第77页,共78页THANK YOU FOR LISTENING现在学习的是第78页,共78页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁