《统计学第6章统计量及其抽样分布精品文稿.ppt》由会员分享,可在线阅读,更多相关《统计学第6章统计量及其抽样分布精品文稿.ppt(27页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学第统计学第6 6章统计量及其章统计量及其抽样分布抽样分布第1页,本讲稿共27页6.1 6.1 统计量统计量1.1.统计量的形成统计量的形成2.2.统计量是样本统计量是样本X X1 1,X X2 2XXn n的一个函数的一个函数3.3.统计量不依赖任何未知参数统计量不依赖任何未知参数4 4.将一组样本的具体观测值代入统计量函将一组样本的具体观测值代入统计量函数,可以计算出一个具体的统计量值。数,可以计算出一个具体的统计量值。抽样抽样样本样本构造函数函数第2页,本讲稿共27页6.2 6.2 样本均值的抽样分布样本均值的抽样分布和中心极限定理和中心极限定理1.1.从一个总体中随机抽出容量相同的
2、各种样本,从一个总体中随机抽出容量相同的各种样本,从这些样本计算出的某统计量所有可能值的概率从这些样本计算出的某统计量所有可能值的概率分布,称为这个分布,称为这个统计量的统计量的抽样分布抽样分布。2.2.设设X1,X2,Xn是取自总体是取自总体X的样本,样本的样本,样本均值均值,所有可能样本的均值,所有可能样本的均值 构成构成的概率分布即为的概率分布即为样本均值的抽样分布样本均值的抽样分布。第3页,本讲稿共27页【例】【例】【例】【例】设一个总体,含有设一个总体,含有设一个总体,含有设一个总体,含有4 4 4 4个元素(个体),即总体单个元素(个体),即总体单个元素(个体),即总体单个元素(个
3、体),即总体单位数位数位数位数N N N N=4=4=4=4。4 4 4 4个个体分别为个个体分别为个个体分别为个个体分别为X X X X1 1 1 1=1=1=1=1、X X X X2 2 2 2=2=2=2=2、X X X X3 3 3 3=3=3=3=3、X X X X4 4 4 4=4=4=4=4。总体的均值、方差及分布如下总体的均值、方差及分布如下总体的均值、方差及分布如下总体的均值、方差及分布如下总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2 2.3.3第4页,本讲稿共27页 现从总体中抽取现从总体中抽取现从总体中抽取现从总体中抽取n n n n2 2
4、2 2的简单随机样本,在重复抽的简单随机样本,在重复抽的简单随机样本,在重复抽的简单随机样本,在重复抽样条件下,共有样条件下,共有样条件下,共有样条件下,共有4 4 4 42 2 2 2=16=16=16=16个样本。所有样本的结果如个样本。所有样本的结果如个样本。所有样本的结果如个样本。所有样本的结果如下表下表下表下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n=2 的样本(共的样本(共16个)个)第5页,本讲稿共27页 计算出各样本的均值,如下表。并给出
5、样本计算出各样本的均值,如下表。并给出样本计算出各样本的均值,如下表。并给出样本计算出各样本的均值,如下表。并给出样本均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值1616个样本的均值(个样本的均值(x x)样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 0.1.1.2.2.3.3P P(x x)1.51.53.03.04.04.03.53.52.02.02.52.5x x第6页,本讲稿
6、共27页所有样本均值的均值和方差所有样本均值的均值和方差式中:式中:式中:式中:M M M M为样本均值的个数为样本均值的个数为样本均值的个数为样本均值的个数第7页,本讲稿共27页 样本均值的分布样本均值的分布 当总体服从正态分布当总体服从正态分布N N N N(,2 2)时,来时,来时,来时,来自该总体的所有容量为自该总体的所有容量为自该总体的所有容量为自该总体的所有容量为n n的样本的均值的样本的均值 X X也服从也服从也服从也服从正态分布,正态分布,正态分布,正态分布,X X X X 的数学期望为的数学期望为 ,方差为方差为方差为方差为2 2/n n n n。即。即 X XN N(,2
7、2/n n)第8页,本讲稿共27页中心极限定理中心极限定理 设从均值为设从均值为 ,方差为,方差为 2 2的一个任意总体的一个任意总体中抽取容量为中抽取容量为n n n n的样本,当的样本,当n n充分大时,样本充分大时,样本均值的抽样分布近似服从均值为均值的抽样分布近似服从均值为、方差为、方差为2 2/n n n n的正态分布。的正态分布。当样本容量足够大时当样本容量足够大时当样本容量足够大时当样本容量足够大时(n n n n 30)30)30)30),样本均值的抽样分布逐,样本均值的抽样分布逐,样本均值的抽样分布逐,样本均值的抽样分布逐渐趋于正态分布渐趋于正态分布渐趋于正态分布渐趋于正态分
8、布第9页,本讲稿共27页标准误差标准误差标准误差:样本统计量与总体参数之间的平均差异标准误差:样本统计量与总体参数之间的平均差异1.1.所有可能的样本均值的标准差,测度所有样本均值的离所有可能的样本均值的标准差,测度所有样本均值的离所有可能的样本均值的标准差,测度所有样本均值的离所有可能的样本均值的标准差,测度所有样本均值的离散程度散程度散程度散程度2.2.样本均值的标准误差小于总体标准差样本均值的标准误差小于总体标准差样本均值的标准误差小于总体标准差样本均值的标准误差小于总体标准差3.3.计算公式为计算公式为计算公式为计算公式为第10页,本讲稿共27页【例】设从一个均值【例】设从一个均值=8
9、=8、标准差、标准差=0.7=0.7的总的总 体中随机抽取容量为体中随机抽取容量为n=49n=49的样本。要求:的样本。要求:(1 1)计算样本均值小于)计算样本均值小于7.97.9的近似概率的近似概率 (2 2)计算样本均值超过)计算样本均值超过7.97.9的近似概率的近似概率 (3 3)计算样本均值在总体均值)计算样本均值在总体均值=8=8附近附近 0.1 0.1范围的近似概率范围的近似概率第11页,本讲稿共27页【例】某公司有【例】某公司有400400人,平均工龄为人,平均工龄为1010年,标准年,标准差为差为3 3年。随机抽出年。随机抽出4949名组成一个简单随机样本,名组成一个简单随
10、机样本,试问样本中工作人员的平均年龄不低于试问样本中工作人员的平均年龄不低于9 9年的概率年的概率有多大。有多大。解:虽然该总体的分布未知,但样本容量解:虽然该总体的分布未知,但样本容量n=49n=49较大较大 由中心极限定理可知,样本均值的抽样分布近由中心极限定理可知,样本均值的抽样分布近 似服从正态分布。则均值的期望似服从正态分布。则均值的期望 均值的标准差均值的标准差=1-(-2.33)=(2.33)=0.9901第12页,本讲稿共27页练习题练习题 某类产品的抗拉强度服从正态分布,平均某类产品的抗拉强度服从正态分布,平均值为值为99.899.8公斤公斤/平方厘米,标准差为平方厘米,标准
11、差为5.485.48公斤公斤/平平方厘米,从这个总体抽出一个容量为方厘米,从这个总体抽出一个容量为1212的样本,的样本,问这一样本的平均值介于问这一样本的平均值介于98.898.8公斤公斤/平方厘米和平方厘米和100.9100.9公斤公斤/平方厘米之间的概率有多大。平方厘米之间的概率有多大。第13页,本讲稿共27页6.3 6.3 由正态分布导出的几个由正态分布导出的几个由正态分布导出的几个由正态分布导出的几个重要分布重要分布重要分布重要分布第14页,本讲稿共27页卡方(c2)分布定义:设随机变量定义:设随机变量X X1 1,X X2 2,XnXn相互独立,且相互独立,且X Xi i服从标准正
12、态分布服从标准正态分布N N(0 0,1 1),则它们的平方和),则它们的平方和 服从自由度为服从自由度为n n的的c c2 2分布。分布。c c2 2分布的数学期望为:分布的数学期望为:E E(c c2 2)=n=nc c2 2分布的方差为:分布的方差为:D D(c c2 2)=2n2n当自由度当自由度n足够大时足够大时,c c2 2分布的概率密度曲线趋于对称;分布的概率密度曲线趋于对称;当当n+时时,c c2 2分布的极限分布是正态分布。分布的极限分布是正态分布。第15页,本讲稿共27页t t分布和分布和T T统计量统计量1.t1.t分布:设随机变量分布:设随机变量X XN N(0,10,
13、1),),Y Y c c2 2(n),n),且且X X与与Y Y独立,则独立,则其分布称为其分布称为t t分布,记为分布,记为t(n)t(n),其中,其中n n为自由度。为自由度。当当n2时时,t分布的分布的E(t)=0当当n3时时,t分布的分布的D(t)=n/(n-2)第16页,本讲稿共27页2.T2.T统计量统计量 设设设设X X X X1 1 1 1,X X X X2 2 2 2,X X X Xn n n n是来自正态总体是来自正态总体是来自正态总体是来自正态总体N N N N(,2 2 2 2)的一个样本,的一个样本,的一个样本,的一个样本,称为称为称为称为T T T T统计量统计量统
14、计量统计量,它服从自由度为它服从自由度为它服从自由度为它服从自由度为(n n n n-1)-1)-1)-1)的的的的t t t t分布。分布。分布。分布。则则第17页,本讲稿共27页F F分布分布定义:设随机变量定义:设随机变量Y Y与与Z Z相互独立,且相互独立,且Y Y和和Z Z分别服分别服从自由度为从自由度为m m和和n n的的c c2 2分布,随机变量分布,随机变量X X有如下表达式:有如下表达式:则称则称X X服从第一自由度为服从第一自由度为m m,第二自由度为,第二自由度为n n的的F F分布,分布,记为记为X XF F(m,n)m,n)。第18页,本讲稿共27页6.4 6.4 样
15、本比例的抽样分布样本比例的抽样分布如果在样本大小为如果在样本大小为n n的样本中具有某一特征的的样本中具有某一特征的个体数为个体数为X X,则样本比例用,则样本比例用p p来表示:来表示:当当n n充分大时,充分大时,p p近似服从均值为近似服从均值为 ,方差为,方差为的正态分布。的正态分布。第19页,本讲稿共27页【例】已知对某超市服务水平不满意的人数的比【例】已知对某超市服务水平不满意的人数的比例为例为5%5%,现随机抽取,现随机抽取475475名顾客组成的简单随机名顾客组成的简单随机样本,问这样本,问这475475名顾客中不满意的比例在名顾客中不满意的比例在0.030.030.0750.
16、075之间的概率有多大之间的概率有多大?解:解:设设475475名顾客中不满意的比例为名顾客中不满意的比例为p,p,则则 E(p)=0.05 E(p)=0.05,D(p)=0.050.95/475=0.0001 D(p)=0.050.95/475=0.0001 p pN N(0.05,0.0001)0.05,0.0001)第20页,本讲稿共27页 某医院治愈某种疾病的成功率为某医院治愈某种疾病的成功率为90%90%,现从该医院治疗过该种疾病的患者中,现从该医院治疗过该种疾病的患者中随机抽取随机抽取100100名,则试计算这名,则试计算这100100名患者名患者治愈成功的比例在治愈成功的比例在8
17、5%85%至至95%95%的概率是的概率是多少?多少?第21页,本讲稿共27页解:设解:设100名患者治疗成功的比例为名患者治疗成功的比例为p,根根据中心极限定理,据中心极限定理,pN(0.9,0.0009)因此,估计这因此,估计这100名患者治愈成功的比例名患者治愈成功的比例在在85%至至95%的概率为的概率为90.5%第22页,本讲稿共27页6.5 6.5 两个样本平均值之差的分布两个样本平均值之差的分布设设 是独立地抽自总体是独立地抽自总体 的一个容量的一个容量为为n n1 1的样本的均值。的样本的均值。是独立地抽自总体是独立地抽自总体 的一个容量为的一个容量为n n2 2的样本的均值,
18、则的样本的均值,则有有第23页,本讲稿共27页【例例】居民区甲有居民区甲有20002000个家庭,平均居住时个家庭,平均居住时间为间为130130个月,服从正态分布个月,服从正态分布,标准差为标准差为3030个月;居民区乙有个月;居民区乙有30003000个家庭,平均居住个家庭,平均居住时间为时间为120120个月,也服从正态分布个月,也服从正态分布,标准差标准差为为3535个月。从两个居民区中独立地各自抽个月。从两个居民区中独立地各自抽取一个简单随机样本,样本容量为取一个简单随机样本,样本容量为7070和和100100。问居民区甲样本中的平均居住时间。问居民区甲样本中的平均居住时间超过居民区
19、乙样本中的居民平均居住时间超过居民区乙样本中的居民平均居住时间的概率是多大。的概率是多大。第24页,本讲稿共27页【例例】A班统计学考试平均分为班统计学考试平均分为75分,分分,分数服从正态分布,标准差为数服从正态分布,标准差为5分;分;B班统班统计学考试平均分为计学考试平均分为72分,也服从正态分分,也服从正态分布,标准差为布,标准差为7分。现在从分。现在从A、B两班分两班分别随机抽出别随机抽出10名学生的统计学成绩,名学生的统计学成绩,A班班10名学生的统计学平均成绩高于名学生的统计学平均成绩高于B班班10名同学的统计学平均成绩的可能性有名同学的统计学平均成绩的可能性有多大?多大?第25页
20、,本讲稿共27页两个样本比例之差的分布两个样本比例之差的分布 设分别从具有参数为设分别从具有参数为1和和2的两个总体中的两个总体中抽取包含抽取包含n1个观测值和个观测值和n2个观测值的独立样本,当个观测值的独立样本,当n1和和n2很大时,(很大时,(p1-p2)的抽样分布近似服从正)的抽样分布近似服从正态分布:态分布:第26页,本讲稿共27页【例】某厂甲、乙两个车间生产同一种产【例】某厂甲、乙两个车间生产同一种产品,根据经验其产品的不合格率分别为品,根据经验其产品的不合格率分别为3.5%3.5%和和4%4%。从甲车间随机独立地抽取。从甲车间随机独立地抽取200200个产品,从乙车间随机独立地抽取个产品,从乙车间随机独立地抽取150150个个产品。问两个样本中产品不合格率相差不产品。问两个样本中产品不合格率相差不超过超过1%1%的概率。的概率。第27页,本讲稿共27页