《数值变量资料的统计推断.pptx》由会员分享,可在线阅读,更多相关《数值变量资料的统计推断.pptx(87页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1样样样样本本本本总体总体总体总体样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量例如:样本均例如:样本均例如:样本均例如:样本均例如:样本均例如:样本均值、比例、方值、比例、方值、比例、方值、比例、方值、比例、方值、比例、方差差差差差差总体均值、比总体均值、比总体均值、比总体均值、比例、方差等例、方差等例、方差等例、方差等现实中的研究过程现实中的研究过程 第1页/共87页2统计推断统计推断 采用抽样研究的方法,由某总体中随机抽取采用抽样研究的方法,由某总体中随机抽取一个有代表性的样本,并根据样本提供的信息一个有代表性的样本,并根据样本提供的信息(统计量)推断总体特征、性质(参数)
2、的过程(统计量)推断总体特征、性质(参数)的过程称为统计推断称为统计推断 statistical inference 第2页/共87页3统计推断统计推断 统计推断包括两个重要的方面:统计推断包括两个重要的方面:一是利用样本统计量的信息对相应总体参数值做出推断,如用样本均数估计总体均数,用样本标准差估计总一是利用样本统计量的信息对相应总体参数值做出推断,如用样本均数估计总体均数,用样本标准差估计总体标准差等,称之为参数估计体标准差等,称之为参数估计另一个是利用样本统计量来推断我们是否接受一个事先关于总体的假设,称之为假设检验另一个是利用样本统计量来推断我们是否接受一个事先关于总体的假设,称之为假
3、设检验第3页/共87页4使用样本统计量过程中的问题使用样本统计量过程中的问题不同的研究者对相同的总体作类似的抽样研究可能会得到不同的样本统计量不同的研究者对相同的总体作类似的抽样研究可能会得到不同的样本统计量各自用样本统计量估计总体的参数,样本统计量与总体参数间是否完全相等?各自用样本统计量估计总体的参数,样本统计量与总体参数间是否完全相等?如何评价他们的准确性?如何评价他们的准确性?第4页/共87页5 已知某地高中三年级男生的身高满足正态分布,已知某地高中三年级男生的身高满足正态分布,其平均身高为其平均身高为168.15厘米,这里,将该地高中厘米,这里,将该地高中三年级男生的身高视为一个总体
4、。现从该总体三年级男生的身高视为一个总体。现从该总体中随机抽样中随机抽样5次,每次抽取一个样本含量次,每次抽取一个样本含量n=10的样本,得到的的样本,得到的5个样本的数据及各样本均数个样本的数据及各样本均数如下:如下:一、均数抽样误差和标准误第5页/共87页6样本号样本号样本含量样本含量(n=10)m=168.15m=168.15cm样本样本均数均数1161.1173.7173.7167.3162.2162.2166.6166.6157.4157.4164.822166.8159.1159.1166.1173.3173.3169.1169.1165.2165.2166.633157.4174
5、.0172.3175.8166.6182.1163.1159.4159.4177.3168.744174.5182.1168.5171.3174.1165.6173.7171.9167.5164.1171.335164.1166.6169.6169.6173.8173.2164.3166.6182.1165.4169.53第6页/共87页7各个样本均数之间都不相同各个样本均数之间都不相同抽样误差表现形式抽样误差表现形式之一之一各个样本均数都不等于总体均数,有的比总体均数各个样本均数都不等于总体均数,有的比总体均数大,有的比它小大,有的比它小抽样误差表现形式之二抽样误差表现形式之二相对于各样本的
6、个体值,样本均数间的变异程度较相对于各样本的个体值,样本均数间的变异程度较小小样本均数的特点样本均数的特点第7页/共87页8样本均数的抽样分布样本均数的抽样分布 仍以某地高三男生的身高为例,设身高变量为仍以某地高三男生的身高为例,设身高变量为x,假定,假定x服从正态分布,记为服从正态分布,记为xN(168.15,62)从总体从总体X中反复随机抽样,样本含量分别为中反复随机抽样,样本含量分别为n=4,n=16和和n=36,分别随机抽,分别随机抽10000个样本并计算样本均数,把同一样本含量的个样本并计算样本均数,把同一样本含量的10000个样本均数视为一个新个样本均数视为一个新的样本资料作频数图
7、的样本资料作频数图第8页/共87页9 从正态分布总体从正态分布总体N(168.15,62)中随机抽样中随机抽样10000次的结果次的结果曲线是正态总体曲线是正态总体N(168.15,62)的概率密度曲线的概率密度曲线直方图为正态分布总体直方图为正态分布总体N(168.15,62)的样本均数的频率密度图的样本均数的频率密度图样本含量样本含量n=36样本含量样本含量n=16样本含量样本含量n=4第9页/共87页10大多数的样本均数相互之间存在差异,绝大多数的样本大多数的样本均数相互之间存在差异,绝大多数的样本均数不等于均数不等于x的总体均数的总体均数样本均数的集中趋势位置与个体资料样本均数的集中趋
8、势位置与个体资料x的集中趋势位置的集中趋势位置较为接近,样本均数的频数图均呈现出中间多、两边少较为接近,样本均数的频数图均呈现出中间多、两边少且基本对称的正态分布特征。且基本对称的正态分布特征。样本均数的分布范围较个体值小;随着样本含量的增大,样本均数的分布范围较个体值小;随着样本含量的增大,样本均数的频数分布范围越来越窄样本均数的频数分布范围越来越窄每种样本量的每种样本量的10000个样本均数值所计算出的样本均数个样本均数值所计算出的样本均数的标准差都非常接近的标准差都非常接近 (为个体资料为个体资料x的总体标准差,的总体标准差,n为个体数为个体数)样本均数的分布规律样本均数的分布规律第10
9、页/共87页11 理论上可以证明:从正态分布的总体理论上可以证明:从正态分布的总体 中随机中随机抽取样本含量为抽取样本含量为n的一批样本,样本均数的一批样本,样本均数 有如下性质有如下性质:样本均数样本均数 服从正态分布服从正态分布 样本均数样本均数 的总体均数为的总体均数为 样本均数的分布规律样本均数的分布规律第11页/共87页12样本均数的标准误样本均数的标准误为了与个体的标准差相互区别,样本均数的标准差又称为了与个体的标准差相互区别,样本均数的标准差又称为样本均数的标准误为样本均数的标准误standard error,SE,或理论标准,或理论标准误误反映了样本均数间的离散程度,如果反映了
10、样本均数间的离散程度,如果SE很大则不同的样很大则不同的样本均数间参差不齐,同时样本均数的分布范围较大,也本均数间参差不齐,同时样本均数的分布范围较大,也反映了样本均数与总体均数间的差异可能较大,因而标反映了样本均数与总体均数间的差异可能较大,因而标准误反映均数抽样误差的大小;它与总体标准差成正比,准误反映均数抽样误差的大小;它与总体标准差成正比,与总体中的个体数的平方根成反比与总体中的个体数的平方根成反比 代表样本均数的标准误,其表达式为代表样本均数的标准误,其表达式为第12页/共87页13均数的标准误的影响因素均数的标准误的影响因素从标准误的计算公式中看出它与原先个体观察值的总体标准从标准
11、误的计算公式中看出它与原先个体观察值的总体标准差差 有关,同时也和样本含量有关,同时也和样本含量n有关有关在固定样本含量的情况下,总体标准差越大,则样本均数间在固定样本含量的情况下,总体标准差越大,则样本均数间越参差不齐,抽样误差越大;但是总体标准差是参数,在抽越参差不齐,抽样误差越大;但是总体标准差是参数,在抽样之前就已经存在,无法改变它的大小样之前就已经存在,无法改变它的大小故可行的方法是通过扩大样本含量减少标准误;从而减少抽故可行的方法是通过扩大样本含量减少标准误;从而减少抽样误差样误差第13页/共87页14均数标准误的估计值均数标准误的估计值 由于在实际研究中,我们往往只抽一次样,由于
12、在实际研究中,我们往往只抽一次样,得到一个样本均数,而且大多数情况下得到一个样本均数,而且大多数情况下 未知未知,此此时常用样本标准差时常用样本标准差S S估计总体标准差估计总体标准差,这样我们,这样我们就得到样本均数标准误的估计值就得到样本均数标准误的估计值 抽样误差越小,表示样本均数与总体均数越接近,抽样误差越小,表示样本均数与总体均数越接近,用样本均数估计总体均数的可靠性越高;反之则用样本均数估计总体均数的可靠性越高;反之则越低越低 第14页/共87页15例:例:2000年某研究者随机调查某地健康成年女性年某研究者随机调查某地健康成年女性248人,得到血红细胞的人,得到血红细胞的均数为均
13、数为4.181012/L,标准差为,标准差为0.281012/L,试估计该样本的抽样误,试估计该样本的抽样误差?差?第15页/共87页16二、t分布 对于某个资料,其个体变量对于某个资料,其个体变量 服从正态分布,服从正态分布,记作:记作:总体总体总体总体个体值正态分布第16页/共87页17u值标准正态分布值标准正态分布 对服从正态分布的个体变量值对服从正态分布的个体变量值 作下列转换:作下列转换:变量值变量值u也服从正态分布,记作也服从正态分布,记作 个体变量值个体变量值个体变量值个体变量值经过经过经过经过Z Z Z Z转换后的变量转换后的变量转换后的变量转换后的变量值值值值u u u u1
14、 1 1 1、u u u u2 2 2 2、u u u u3 3 3 3第17页/共87页18样本均数正态分布样本均数正态分布 总体总体总体总体样样样样本本本本样样样样本本本本样样样样本本本本样样样样本本本本第18页/共87页19样本均数样本均数u转换标准正态分布转换标准正态分布 样样样样本本本本样样样样本本本本样样样样本本本本u1u2u3第19页/共87页20既往资料表明某市区新生女婴的平均出生体既往资料表明某市区新生女婴的平均出生体重为重为3.10kg,标准差为,标准差为0.59kg。某研究者从。某研究者从该市区中随机抽取一个由该市区中随机抽取一个由100个女婴组成的样个女婴组成的样本,请
15、问出现样本均数超过本,请问出现样本均数超过2.87kg算不算是算不算是小概率事件?小概率事件?第20页/共87页21样本均数标准正态性转换中的实际问题样本均数标准正态性转换中的实际问题要对样本均数进行要对样本均数进行u转换,必须要知道总体的标准转换,必须要知道总体的标准差差;但是在实际的情况下,并没有对总体中所有;但是在实际的情况下,并没有对总体中所有的个体进行观察,所以无法得知的个体进行观察,所以无法得知 ;而且通常我们;而且通常我们也只作一次抽样研究,只能得到也只作一次抽样研究,只能得到s,只能用样本标,只能用样本标准误的估计值准误的估计值 估计估计 那么那么 是否仍然满足标准正态分布?是
16、否仍然满足标准正态分布?假定假定 ,我们比较一下,我们比较一下u与与u之间是否之间是否存在不同存在不同第21页/共87页22在正态总体在正态总体N(168.18,62)中随机抽样,样本量分别取中随机抽样,样本量分别取n=5,n=100,均抽,均抽10000个样本,分别计算个样本,分别计算u值和值和u值,其值,其结果如下:结果如下:样本量样本量统计量统计量平均值平均值P2.5P97.5n=5u0.0149031-1.9500671.969157u0.0319309-2.6542142.838163n=100u0.0033231-1.9508861.971245u0.0347047-1.98118
17、32.000407u vs.u第22页/共87页23样本含量样本含量n=5样本含量样本含量n=100(a)(b)u统计量的频数分布图统计量的频数分布图(10000个样本个样本),轮廓曲线为标准正态分布轮廓曲线为标准正态分布u曲线曲线第23页/共87页24上述上述10000个样本所计算出的个样本所计算出的u值和值和u值的平均值都非常接近标值的平均值都非常接近标准正态分布的集中位置准正态分布的集中位置0对于对于u值而言,无论值而言,无论n=5和和n=100,u值的值的P2.5和和P97.5都十分接近都十分接近标准正态分布标准正态分布95的双侧分位点的双侧分位点1.96;但对于;但对于u值而言,样值
18、而言,样本量本量n=5时,其时,其P2.5和和P97.5明显远离明显远离1.96,而样本量,而样本量n=100时,时,u值的值的P2.5和和P97.5相对比较靠近相对比较靠近 当样本量较大时,同样可以发现统计量当样本量较大时,同样可以发现统计量u的频数图与标准正态的频数图与标准正态分布曲线非常接近,而当样本含量较小时,统计量分布曲线非常接近,而当样本含量较小时,统计量u的分布与的分布与标准正态分布则有所区别标准正态分布则有所区别峰较矮,尾部较高,数据相对峰较矮,尾部较高,数据相对u值分散值分散 u vs.u第24页/共87页25u的分布的分布 并不满足标准正态分布并不满足标准正态分布!在样本含
19、量较大时它与标准正态分布接近,但是当样本含量较小时,它与标准在样本含量较大时它与标准正态分布接近,但是当样本含量较小时,它与标准正态分布相差较远正态分布相差较远第25页/共87页26William Sealey Gosset(1876-1937)Gosset invented the t-test to handle small samples for quality control in brewing(Guinness).He wrote under the name Student.第26页/共87页27t分布分布第27页/共87页28n nt t分布曲线是单峰的,且关于分布曲线是单峰的
20、,且关于分布曲线是单峰的,且关于分布曲线是单峰的,且关于t=0t=0对称,这一特征对称,这一特征对称,这一特征对称,这一特征与标准正态分布很相似与标准正态分布很相似与标准正态分布很相似与标准正态分布很相似标准正态分布和标准正态分布和t分布的图形分布的图形=时的时的t分布即标准正态分布分布即标准正态分布012345-1-2-3-4-50.00.10.20.30.4n=3n=3n=1n=1n=n=(标标准准正正态态分分布布)第28页/共87页29n n当自由度当自由度当自由度当自由度v v改变时(实际上是样本含量改变时(实际上是样本含量改变时(实际上是样本含量改变时(实际上是样本含量n n改变时)
21、,改变时),改变时),改变时),t t分布曲分布曲分布曲分布曲线的形态也不一样,因此线的形态也不一样,因此线的形态也不一样,因此线的形态也不一样,因此t t分布是分布是分布是分布是一簇分布一簇分布一簇分布一簇分布;而标准正态分;而标准正态分;而标准正态分;而标准正态分布是唯一的布是唯一的布是唯一的布是唯一的标准正态分布和标准正态分布和t分布的图形分布的图形=时的时的t分布即标准正态分布分布即标准正态分布012345-1-2-3-4-50.00.10.20.30.4n=3n=3n=1n=1n=n=(标标准准正正态态分分布布)第29页/共87页30n nv v越小(越小(越小(越小(n n越小)则
22、标准误越大,样本均数经过越小)则标准误越大,样本均数经过越小)则标准误越大,样本均数经过越小)则标准误越大,样本均数经过t t转换后的转换后的转换后的转换后的t t值越分散,值越分散,值越分散,值越分散,t t分布的峰越低矮,而且尾部翘得也越高;当自分布的峰越低矮,而且尾部翘得也越高;当自分布的峰越低矮,而且尾部翘得也越高;当自分布的峰越低矮,而且尾部翘得也越高;当自由度逼近由度逼近由度逼近由度逼近,因,因,因,因s s逼近逼近逼近逼近 ,t t分布也逼近分布也逼近分布也逼近分布也逼近u u分布,所以标准正分布,所以标准正分布,所以标准正分布,所以标准正态分布是态分布是态分布是态分布是t t
23、分布的特例分布的特例分布的特例分布的特例标准正态分布和标准正态分布和t分布的图形分布的图形=时的时的t分布即标准正态分布分布即标准正态分布012345-1-2-3-4-50.00.10.20.30.4n=3n=3n=1n=1n=n=(标标准准正正态态分分布布)第30页/共87页31t分布曲线的特征分布曲线的特征 t分布是一簇分布分布是一簇分布t分布的形态随自由度分布的形态随自由度v改变而改变改变而改变t分布是单峰分布,关于分布是单峰分布,关于t0对称对称v越小,越小,t分布曲线也越矮胖,当分布曲线也越矮胖,当v趋向无穷大时,趋向无穷大时,t分分布无限逼近标准正态分布(布无限逼近标准正态分布(u
24、分布)分布)第31页/共87页32t分布曲线下面积分布曲线下面积 与标准正态分布曲线下面积的算法一样,都是采用微积分的方法与标准正态分布曲线下面积的算法一样,都是采用微积分的方法其含义也与标准正态分布曲线下面积接近,表示某个样本含量(自其含义也与标准正态分布曲线下面积接近,表示某个样本含量(自由度)的样本均数经由度)的样本均数经t转换后转换后t值落在某个区间的概率有多大值落在某个区间的概率有多大与标准正态分布不同,与标准正态分布不同,t分布曲线下面积为分布曲线下面积为95%或或99%的界值不是一的界值不是一个常量个常量,因为对于不同的自由度取值,就有不同的,因为对于不同的自由度取值,就有不同的
25、t分布曲线分布曲线 第32页/共87页33t分布曲线下面积分布曲线下面积统计学家为了计算方便编制了统计学家为了计算方便编制了t分布曲线下面积表分布曲线下面积表在在t值表中,横标目为自由度值表中,横标目为自由度 v,纵标目为概率(,纵标目为概率(P或或)。一)。一侧尾部面积称为单尾概率(侧尾部面积称为单尾概率(one-tailed probability),两侧),两侧尾部面积之和称为双尾概率(尾部面积之和称为双尾概率(two-tailed probability)1-1-a a a aa a a a/2/2a a a a/2/21-1-a a a aa a a a第33页/共87页34t分布曲
26、线下面积分布曲线下面积可见如果可见如果t值越远离值越远离0,它所对应的单侧或双侧尾部面积就越小,它所对应的单侧或双侧尾部面积就越小即即 越大,曲线下面积越大,曲线下面积a a或或a a/2越小越小通常使用不同的符号:通常使用不同的符号:t a a,v、t a a/2,v区别单侧或双侧的曲线下面积区别单侧或双侧的曲线下面积另外如果在相同自由度的情况下,双侧另外如果在相同自由度的情况下,双侧0.05的曲线下面积的曲线下面积=单侧单侧0.025的曲线下面积的曲线下面积第34页/共87页35 求自由度求自由度v为为10,单尾概率,单尾概率a a=0.05时的时的t界值,并简述其含义界值,并简述其含义由
27、表中查得单侧由表中查得单侧t0.05,101.812从一个正态总体中随机抽样,每次抽从一个正态总体中随机抽样,每次抽11个个体,分别计算各个样本的均数与标准个个体,分别计算各个样本的均数与标准差,并对之进行差,并对之进行t转换后,理论上有转换后,理论上有P(t-1.812)=0.05或或P(t1.812)=0.05第35页/共87页36 求自由度求自由度v为为100,双尾概率,双尾概率a a=0.05时的时的t界值,并简述其含义界值,并简述其含义由表中查得双侧由表中查得双侧t0.05/2,1001.984从一个正态总体中随机抽样,每次抽从一个正态总体中随机抽样,每次抽101个个体,分别计算各个
28、样本的均数与标个个体,分别计算各个样本的均数与标准差,并对之进行准差,并对之进行t转换后,理论上有转换后,理论上有 P(t-1.984)P(t1.984)=0.05第36页/共87页37样本均数的抽样分布小结样本均数的抽样分布小结o从总体均数为从总体均数为m m,总体标准差为,总体标准差为 的正态分布的总体中抽样,的正态分布的总体中抽样,每次样本含量均为每次样本含量均为n,样本均数,样本均数X满足正态分布满足正态分布N(m m,x2)o如果未知总体标准差,样本均数无法作如果未知总体标准差,样本均数无法作u转换,而需作转换,而需作t转换,转换,t值满足自由度为值满足自由度为n-1的的t分布分布o
29、在在n较大较大(n100)时,时,t值接近值接近u值值第37页/共87页38三、总体均数的估计三、总体均数的估计参数估计参数估计parameter estimation:用样本的统计量估计所来源总体的参数:用样本的统计量估计所来源总体的参数估计的方法有以下两种:点估计与区间估计估计的方法有以下两种:点估计与区间估计第38页/共87页39点估计点估计point estimate:用样本的估计量直接作为总体参数的估计值;例如,用用样本的估计量直接作为总体参数的估计值;例如,用样本均值直接样本均值直接作为作为总体均值的估计总体均值的估计其方法简单,但未考虑抽样误差的大小其方法简单,但未考虑抽样误差的
30、大小点估计点估计第39页/共87页40 为了解某地为了解某地1岁婴儿的血红蛋白浓度,从该地随岁婴儿的血红蛋白浓度,从该地随机抽取了机抽取了1岁婴儿岁婴儿25人,测得其血红蛋白的平均数人,测得其血红蛋白的平均数为为123.7gL,标准差为,标准差为11.9gL;试估计该地;试估计该地1岁岁婴儿的血红蛋白的平均浓度婴儿的血红蛋白的平均浓度本例样本均数为本例样本均数为123.7gL,若用点值估计,则该若用点值估计,则该地地1岁婴儿血红蛋白浓度的总体均数岁婴儿血红蛋白浓度的总体均数为为123.7gL 通常情况由于抽样误差的存在下样本均数并不与总通常情况由于抽样误差的存在下样本均数并不与总体均数相等,而
31、且不同的抽样研究样本均数也会不体均数相等,而且不同的抽样研究样本均数也会不同;因而对于一个连续性随机变量来讲,样本均数同;因而对于一个连续性随机变量来讲,样本均数=总体均数的可能性为总体均数的可能性为0所以对于总体均数的估计,使用点估计的方法是不所以对于总体均数的估计,使用点估计的方法是不理想的理想的第40页/共87页41区间估计区间估计区间估计区间估计interval estimate:在点估计的基础上,:在点估计的基础上,结合抽样误差的大小,给出总体参数估计的一个结合抽样误差的大小,给出总体参数估计的一个区间范围(由上、下限构成的区间范围(由上、下限构成的可信区间)可信区间)该区间按照一定
32、的概率可能性,包含所推断的总该区间按照一定的概率可能性,包含所推断的总体参数体参数第41页/共87页42可信区间可信区间假设已知的样本均数是从较小的假设已知的样本均数是从较小的m m总体中抽取的,它成立的总体中抽取的,它成立的统计条件是从该总体中抽取一个样本,其均数为当前均数以统计条件是从该总体中抽取一个样本,其均数为当前均数以及更大的可能性并非小概率事件及更大的可能性并非小概率事件m=m=m=m=A A已知的已知的已知的已知的样本均数样本均数样本均数样本均数第42页/共87页43可信区间可信区间而如果从而如果从m mA的总体中在一次抽样的前提下,几乎是不可能的总体中在一次抽样的前提下,几乎是
33、不可能得到当前的样本的,因为它是一个小概率事件!得到当前的样本的,因为它是一个小概率事件!mmmmB的总体中在一次抽样的前提下,几乎是不可能的总体中在一次抽样的前提下,几乎是不可能得到当前的样本的,因为它是一个小概率事件!得到当前的样本的,因为它是一个小概率事件!mmmmB B已知的已知的已知的已知的样本均数样本均数样本均数样本均数m=m=m=m=B B第45页/共87页46可信区间可信区间(confidence interval)因而如果因而如果m m的取值在的取值在AB间,在一次抽样的前提下,是有可能间,在一次抽样的前提下,是有可能得到当前的样本均数的得到当前的样本均数的这样就把区间这样就
34、把区间(A,B)称为样本均数所来源的未知总体均数的可称为样本均数所来源的未知总体均数的可信区间信区间m=m=m=m=A A已知的已知的已知的已知的样本均数样本均数样本均数样本均数m=m=m=m=B B第46页/共87页47可信度可信度(confidence coefficient)我们之所以说我们之所以说m m=A的总体像是样本所来源的总体,那是因为从它中得的总体像是样本所来源的总体,那是因为从它中得到该样本不是小概率事件到该样本不是小概率事件但是小概率事件是有可能发生的,例如该样本真的来自于但是小概率事件是有可能发生的,例如该样本真的来自于m m100),由于),由于ta a/2,v与与ua
35、 a/2十十分接近,故上述公式可以近似表达为:分接近,故上述公式可以近似表达为:第54页/共87页55例例某地某地27健康成年男性的血红蛋白均数为健康成年男性的血红蛋白均数为125g/L,标准差为标准差为15g/L。假。假定血红蛋白值服从正态分布定血红蛋白值服从正态分布,试估计总体均数的试估计总体均数的95%置信区间和置信区间和99%置信区间置信区间解:解:第55页/共87页56例例248名健康成年女性血红蛋白值,其均数为名健康成年女性血红蛋白值,其均数为118.8 g/L,标准差为,标准差为10.6g/L,估计健康成年女性血红蛋白值的,估计健康成年女性血红蛋白值的95%可信区间可信区间解:解
36、:第56页/共87页57可信区间的评价可信区间的评价我们取得未知总体参数的可信区间,如何评价这个区间到底好不好,可信不可信,实用性强不强?我们取得未知总体参数的可信区间,如何评价这个区间到底好不好,可信不可信,实用性强不强?从可信区间的准确度与精确度两个方面进行评价从可信区间的准确度与精确度两个方面进行评价第57页/共87页58可信区间的准确度与精确度可信区间的准确度与精确度假设从急救医学生中抽取一份样本假设从急救医学生中抽取一份样本n=10人,求得预防医学平均分为人,求得预防医学平均分为75分,标准差为分,标准差为10分,求总体平均分的分,求总体平均分的可信区间?可信区间?现有两位同学求得两
37、个可信区间,甲同学为现有两位同学求得两个可信区间,甲同学为6090分分(99.9999%CI),乙同学的为乙同学的为7278分分(60%CI)如何评价?如何评价?第58页/共87页59可信区间的准确度与精确度可信区间的准确度与精确度从实用性角度来说,乙同学的结果应该更实用些从实用性角度来说,乙同学的结果应该更实用些区间的跨度只有区间的跨度只有6分,估计得很精确!分,估计得很精确!但是从可靠程度来说,似乎甲同学的结果更值得信赖但是从可靠程度来说,似乎甲同学的结果更值得信赖总体均数在该区间外的可能性几乎为总体均数在该区间外的可能性几乎为0,该区间的,该区间的可信度极高!可信度极高!第59页/共87
38、页60可信区间的准确度与精确度可信区间的准确度与精确度可信区间的可信度反映了其准确度,可信度越大,错误估计的可能性越小,结果越准确可信区间的可信度反映了其准确度,可信度越大,错误估计的可能性越小,结果越准确可信区间的跨度反映了其精确度,精确度越高,区间跨度越小,更趋于某一个点值可信区间的跨度反映了其精确度,精确度越高,区间跨度越小,更趋于某一个点值但是,这二者的关系是但是,这二者的关系是“鱼和熊掌不可兼得鱼和熊掌不可兼得”!第60页/共87页61可信区间的准确度与精确度可信区间的准确度与精确度在样本含量与样本标准差固定的情况下,如果要获得精确的参数估在样本含量与样本标准差固定的情况下,如果要获
39、得精确的参数估计,则可信度必然下降计,则可信度必然下降极端的情况就是使用点估计,此时十分精确,但估计正确的可能性极端的情况就是使用点估计,此时十分精确,但估计正确的可能性几乎为几乎为0!如果想要得到一个把握很大的参数估计,那么就要把区间扩大些,如果想要得到一个把握很大的参数估计,那么就要把区间扩大些,使得漏估计的可能性尽可能小,此时准确性很高使得漏估计的可能性尽可能小,此时准确性很高极端的情况就是宣称极端的情况就是宣称“总体平均分应该在总体平均分应该在0100分间吧!分间吧!”但是没但是没有任何实用价值!有任何实用价值!第61页/共87页62准确度与精确度的取舍准确度与精确度的取舍根据研究目的
40、与性质取舍根据研究目的与性质取舍如果没有特殊要求,应该以准确度为主,在保证估计准确的情况下如果没有特殊要求,应该以准确度为主,在保证估计准确的情况下通过适当增大样本含量的方法,改善区间的精确度通过适当增大样本含量的方法,改善区间的精确度所以通常求所以通常求95的的CI,同时保证样本含量,同时保证样本含量第62页/共87页63四、假设检四、假设检验验第63页/共87页64法官的判决法官的判决n法庭上,陪审团需要建立以下两种假设:法庭上,陪审团需要建立以下两种假设:n事先并不知道哪种假设是正确的,需要根据呈庭证供,才可下结论事先并不知道哪种假设是正确的,需要根据呈庭证供,才可下结论无罪无罪有罪有罪
41、第64页/共87页65胎儿的性别胎儿的性别n有人声称能够预测胎儿的性别,我们对此有两种假设:有人声称能够预测胎儿的性别,我们对此有两种假设:n事先并不知道哪种假设是正确的,需要根据她推测的结果,才可下结论事先并不知道哪种假设是正确的,需要根据她推测的结果,才可下结论无此能力无此能力有此能力有此能力第65页/共87页66商家信誉商家信誉n某商家宣称他所卖的鸡蛋绝对新鲜,可以达到某商家宣称他所卖的鸡蛋绝对新鲜,可以达到“百里挑一百里挑一”;是否可以相信商家信誉?;是否可以相信商家信誉?n事先并不知道哪种假设是正确的,需要对其鸡蛋检验后,才可下结论事先并不知道哪种假设是正确的,需要对其鸡蛋检验后,才
42、可下结论商家有信誉商家有信誉商家无信誉商家无信誉第66页/共87页67?否定否定肯定肯定第67页/共87页68胎儿性别胎儿性别统计学的思维方式统计学的思维方式n女士说她可以预测胎儿的性别女士说她可以预测胎儿的性别n暂时认为她是瞎猜,每个孕妇被猜对的可能性均为暂时认为她是瞎猜,每个孕妇被猜对的可能性均为50%n让她对让她对6个孕妇作推断,结果是全部说对了;在瞎猜的情况下,全对个孕妇作推断,结果是全部说对了;在瞎猜的情况下,全对的可能性为的可能性为0.56=0.015625n在一次试验中出现小概率事件是不太可能的,故认为她真的有这种在一次试验中出现小概率事件是不太可能的,故认为她真的有这种能力!能
43、力!第68页/共87页69关于商家信誉关于商家信誉某商家宣称他所卖的鸡蛋绝对新鲜,可以达到某商家宣称他所卖的鸡蛋绝对新鲜,可以达到“百里挑一百里挑一”;结果;结果有人买了有人买了10个鸡蛋,其中个鸡蛋,其中2个坏了,是否还可以相信商家广告?个坏了,是否还可以相信商家广告?暂时认为商家是有信誉的,在此前提下暂时认为商家是有信誉的,在此前提下10个鸡蛋中出现个鸡蛋中出现2个或更多变个或更多变质的可能性为质的可能性为0.004,是小概率事件!,是小概率事件!但是对于该顾客而言,他仅仅购买了一次,就碰上了小概率事件,但是对于该顾客而言,他仅仅购买了一次,就碰上了小概率事件,所以商家的信誉度值得怀疑所以
44、商家的信誉度值得怀疑第69页/共87页70假设检验假设检验n先对先对总体的参数总体的参数提出某种假设,然后利用样本信息判断是否提出某种假设,然后利用样本信息判断是否拒绝拒绝该假设过程该假设过程n反证法反证法 +小概率事件原理小概率事件原理第70页/共87页71假假设设检检验验hypothesis test:先先对对总总体体的的参参数数(或或分分布布形形式式)提提出出某某种种假设,然后利用样本信息判断假设是否成立的过程假设,然后利用样本信息判断假设是否成立的过程逻逻辑辑上上运运用用反反证证法法(暂暂且且认认为为总总体体的的情情况况如如此此,而而后后看看样样本本信信息息是是否否能能够够驳驳倒倒原原
45、先先的的假假设设),统统计计上上依依据据小小概概率率原原理理(如如果果样样本本的的情情况况属属于于小小概概率率事事件件,那那么么小小概概率率事事件件不不应应该该在在一一次次抽抽样样的的情情况下发生)况下发生)第71页/共87页72假设检验的基本步骤假设检验的基本步骤例:已知一般健康男性的脉搏均数为例:已知一般健康男性的脉搏均数为72.0次次/分,标准差为分,标准差为6.0次次/分;某医生在某山区随机抽取了分;某医生在某山区随机抽取了25名健康名健康成年男性,测得他们的脉搏均数为成年男性,测得他们的脉搏均数为74.6次次/分,问该山区男性的脉搏均数是否高于一般健康成年男性?分,问该山区男性的脉搏
46、均数是否高于一般健康成年男性?第72页/共87页73假设检验的基本步骤假设检验的基本步骤从资料提供的信息来看,样本均数从资料提供的信息来看,样本均数74.6与总体均数与总体均数72.0不相不相等,其原因可有以下两个方面:等,其原因可有以下两个方面:样本对应的总体均数等于样本对应的总体均数等于72.0,差别仅仅是由于,差别仅仅是由于抽样抽样误差误差所致;所致;该地区的男性的脉搏均数与一般男性存在该地区的男性的脉搏均数与一般男性存在本质上的差本质上的差异异:高海拔导致脉搏较快?高海拔导致脉搏较快?两种情况两种情况只有一个只有一个是正确的,且是正确的,且二者必居其一二者必居其一,需要我们,需要我们作
47、出选择。作出选择。第73页/共87页74假设检验的基本步骤假设检验的基本步骤 :建立假设:建立假设步骤步骤1:建立假设:建立假设在假设的前提下有规律可寻在假设的前提下有规律可寻 无效假设无效假设null hypothesis,记为,记为H0,表示目前的差异是由于抽样误差引起的,表示目前的差异是由于抽样误差引起的备择假设备择假设alternative hypothesis,记为,记为H1,表示目前的差异是主要由于本质上的差别引起,表示目前的差异是主要由于本质上的差别引起第74页/共87页75研究者想收集证据予以反驳的假设研究者想收集证据予以反驳的假设总是含有符号总是含有符号“”,又称,又称“0假
48、设假设”总是针对未知的总体参数作假设总是针对未知的总体参数作假设表示为表示为 H0,记为,记为H0:m m=某一数值;表示样本某一数值;表示样本所来源的总体参数某具体数值所来源的总体参数某具体数值无效假设无效假设第75页/共87页76研究者想收集证据予以支持的假设研究者想收集证据予以支持的假设又称为又称为“研究假设研究假设”,总是含有符号,总是含有符号“”同样总是针对样本所来源的总体参数同样总是针对样本所来源的总体参数表示为表示为H1,记为,记为H1:m m 某一数值(单侧)某一数值(单侧)m m72.0,并没有指明具体值,那么总体的情况是很复杂的)并没有指明具体值,那么总体的情况是很复杂的)
49、根据备择假设的取值趋向,将假设分为双侧或单侧(如果仅根据备择假设的取值趋向,将假设分为双侧或单侧(如果仅仅是含有仅是含有“”,则称为双侧;而具体指明是,则称为双侧;而具体指明是“”或或“72.0,该地区男性的脉搏均数高于一般(但是具体高多少不知道),该地区男性的脉搏均数高于一般(但是具体高多少不知道)H0假设比较单纯、明确,且在该假设的前提下就有规律可寻;而假设比较单纯、明确,且在该假设的前提下就有规律可寻;而H1假设包含的假设包含的情况比较复杂;因此,检验是针对情况比较复杂;因此,检验是针对H0的的 第78页/共87页79假设检验的基本步骤:确定假设检验的基本步骤:确定a ao步骤步骤2:确
50、立检验水准:确立检验水准(significance level)n n小概率事件是否发生小概率事件是否发生小概率事件是否发生小概率事件是否发生拒绝拒绝拒绝拒绝HH0 0n n究竟概率小到多少称为究竟概率小到多少称为究竟概率小到多少称为究竟概率小到多少称为“小概率小概率小概率小概率”n n“小概率小概率小概率小概率”的标准的标准的标准的标准检验水准,记为检验水准,记为检验水准,记为检验水准,记为a a a an n通常将其定为通常将其定为通常将其定为通常将其定为0.050.05或或或或0.010.01o请注意:因为用到了小概率事件原理,我们的结论最终不是完全肯定的,而是带有一定概率请注意:因为用