《参数估计基础讲稿.ppt》由会员分享,可在线阅读,更多相关《参数估计基础讲稿.ppt(45页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、参数估计基础参数估计基础1第一页,讲稿共四十五页哦第六章第六章 参数估计基础参数估计基础第一节第一节 抽样分布与抽样误差抽样分布与抽样误差第二节第二节 t分布分布第三节第三节 总体均数及总体概率的估计总体均数及总体概率的估计2第二页,讲稿共四十五页哦总体(总体(population)与样本()与样本(sample)参数(参数(parameter)与统计量()与统计量(statistics)参数的获取途径参数的获取途径对总体进行研究对总体进行研究抽样研究抽样研究 3第三页,讲稿共四十五页哦样本随机抽样随机抽样 统计推断样本4第四页,讲稿共四十五页哦第一节第一节 抽样分布与抽样误差抽样分布与抽样误
2、差一、样本均数的抽样分布与抽样误差一、样本均数的抽样分布与抽样误差二、样本频率的抽样分布与抽样误差二、样本频率的抽样分布与抽样误差5第五页,讲稿共四十五页哦一、样本均数的抽样分布与抽样误差一、样本均数的抽样分布与抽样误差1 1、样本均数的抽样分布、样本均数的抽样分布 抽样模拟实验:抽样模拟实验:假定总体:某年某地假定总体:某年某地13岁女学生身高值岁女学生身高值 XN(155.4,5.3)随机抽样:随机抽样:n30,K100 6第六页,讲稿共四十五页哦实验6-1从已知13岁女学生身高总体中随机抽样示意图(n30,k100)=155.4=5.31152.3x 2155.2x 100154.8x7
3、第七页,讲稿共四十五页哦样本号均数样本号均数1156.751155.72158.152153.73155.653154.84155.254155.65155.055154.86156.456155.67154.957158.245155.495156.146155.996152.747155.397155.148154.698155.349156.199154.650154.7100156.68第八页,讲稿共四十五页哦2、样本均数抽样分布的特点样本均数抽样分布的特点9第九页,讲稿共四十五页哦表6-2 从正态总体(155.4,5.3)随机抽样得到样本均数的频数分布(n=30,k100)组段频数频
4、率(%)152.61 1.0153.24 4.0153.84 4.0154.42222.0155.02525.0155.62121.0156.21717.0156.83 3.0157.42 2.0158.0158.61 1.0合计100100.010第十页,讲稿共四十五页哦样本均数抽样分布的特点:样本均数抽样分布的特点:(1)各样本均数未必等于总体均数)各样本均数未必等于总体均数(2)样本均数之间存在差异)样本均数之间存在差异(3)样本均数的分布呈对称分布)样本均数的分布呈对称分布(4)样本均数的变异较原变量的变异大大缩小)样本均数的变异较原变量的变异大大缩小11第十一页,讲稿共四十五页哦 3
5、 3、样本均数的抽样误差、样本均数的抽样误差 (1 1)概念:由个体变异产生,抽样引起)概念:由个体变异产生,抽样引起 的样本均数与总体均数间的差的样本均数与总体均数间的差 异。异。(2 2)表现形式:样本均数与总体均数间)表现形式:样本均数与总体均数间 的差异;的差异;样本均数之间的差异样本均数之间的差异12第十二页,讲稿共四十五页哦(3)产生的条件产生的条件抽样研究抽样研究个体变异个体变异(4)特点:随机、不可避免、有规律可循特点:随机、不可避免、有规律可循13第十三页,讲稿共四十五页哦4、样本均数的标准误样本均数的标准误如何度量抽样误差的大小?如何度量抽样误差的大小?均数的抽样误差可表现
6、为样本均数与总体均均数的抽样误差可表现为样本均数与总体均数的差值数的差值均数的抽样误差也可表现为多个样本均数间均数的抽样误差也可表现为多个样本均数间的离散程度的离散程度14第十四页,讲稿共四十五页哦 中心极限定理中心极限定理(central limit theorem)的涵义的涵义从均数为从均数为、标准差为、标准差为的的正态总体中抽样,当正态总体中抽样,当n固定固定,样本均数的分布趋于均数为,样本均数的分布趋于均数为、标准差为标准差为 的正态的正态分布。分布。即:即:Xx(,)X(,)15第十五页,讲稿共四十五页哦理论标准误:理论标准误:估计标准误:估计标准误:nssXnX16第十六页,讲稿共
7、四十五页哦 从非正态总体抽样,抽样实验从非正态总体抽样,抽样实验 X X偏态分布偏态分布 xx17第十七页,讲稿共四十五页哦样本均数的标准误样本均数的标准误(standard error,SE)概念:概念:符号:符号:计算:计算:意义:意义:影响因素:影响因素:18第十八页,讲稿共四十五页哦1、样本频率的抽样分布、样本频率的抽样分布电脑摸球实验:电脑摸球实验:设一口袋中有黑白两色球,黑球占设一口袋中有黑白两色球,黑球占20,从袋中有放回,从袋中有放回地重复摸球地重复摸球35次,计算摸到黑球的百分比。次,计算摸到黑球的百分比。将上述实验重复将上述实验重复100次,得到次,得到100个样本频率。个
8、样本频率。二、样本频率的抽样分布与抽样误差二、样本频率的抽样分布与抽样误差19第十九页,讲稿共四十五页哦 114.4%p 219.8%p 10022.8%p0.2实验6-3电脑摸球实验随机抽样示意图(n35,k100)20第二十页,讲稿共四十五页哦表6-3 从总体(20)中随机抽样得到100个样本频率的分布(n35)组段()频数频率(%)5.033.08.077.011.055.014.088.017.01616.020.02222.022.01515.025.077.028.077.031.055.034.033.037.040.022.0合计100100.021第二十一页,讲稿共四十五页哦
9、2、样本频率抽样分布的特点、样本频率抽样分布的特点22第二十二页,讲稿共四十五页哦样本频率抽样分布的特点:样本频率抽样分布的特点:(1)各样本频率未必等于总体概率)各样本频率未必等于总体概率 (2)各样本频率之间存在差异)各样本频率之间存在差异 (3)样本频率围绕总体概率呈对称分布)样本频率围绕总体概率呈对称分布23第二十三页,讲稿共四十五页哦3、样本频率的抽样误差、样本频率的抽样误差(1)概念)概念(2)表现形式)表现形式(3)产生条件)产生条件(4)特点)特点24第二十四页,讲稿共四十五页哦4、样本率的标准误、样本率的标准误概念概念符号符号计算计算统计学意义统计学意义影响因素影响因素(1)
10、pn(1)pPPSn25第二十五页,讲稿共四十五页哦1 1、什么是抽样误差?决定抽样误差大小的因素有、什么是抽样误差?决定抽样误差大小的因素有哪些?如何控制抽样误差?哪些?如何控制抽样误差?2 2、抽样误差能避免么?为什么?、抽样误差能避免么?为什么?3 3、抽样误差有规律么?、抽样误差有规律么?4 4、标准差与标准误有何区别与联系?、标准差与标准误有何区别与联系?思考题26第二十六页,讲稿共四十五页哦第二节第二节分布分布一、一、值与值与分布分布二、二、分布的图形分布的图形三、三、界值表界值表27第二十七页,讲稿共四十五页哦一、一、值与值与分布分布XZXN(m,s2)ZN(0,1)XtSntt
11、(n1)ZN(0,1)XZn2(,)XXN 28第二十八页,讲稿共四十五页哦29第二十九页,讲稿共四十五页哦 f(t)=(标准正态曲线)=5=10.10.2-4-3-2-1012340.3自由度分别为1、5、时的t分布 t 值30第三十页,讲稿共四十五页哦二、二、分布的图形分布的图形一簇曲线一簇曲线单峰分布单峰分布以以t0为对称轴为对称轴 曲线形态取决于曲线形态取决于其极限形式为标准正态分布曲线其极限形式为标准正态分布曲线31第三十一页,讲稿共四十五页哦三、三、界值表界值表(t critical value)1、t界值表的结构界值表的结构横标目:横标目:-1-1 纵标目:概率纵标目:概率,即曲
12、线下尾部阴影部分面积即曲线下尾部阴影部分面积表中的数字:表中的数字:t t界值界值(t t0)0)单侧概率(单侧概率(one-tailed probability)t t界值记为界值记为,双侧概率(双侧概率(two-tailed probability )t t界值记为界值记为/2,/2,32第三十二页,讲稿共四十五页哦-tt0第三十三页,讲稿共四十五页哦2 2、查表练习、查表练习 (1 1)t t0.05,160.05,16=1.746=1.746(单侧)(单侧)P P(t t1.746)=0.051.746)=0.05或或P P(t t-1.746)=0.05-1.746)=0.05 (2
13、 2)t t0.05/2,160.05/2,16=2.120=2.120(双侧)(双侧)P P(t t2.120)2.120)P P(t t-2.120)=0.05-2.120)=0.05或或P P(-2.120(-2.120t t 50),正态分布原理。,正态分布原理。计算公式:计算公式:951.96XXS 的 置 信 区 间 CI:992.58XXS 的 置 信 区 间 CI:39第三十九页,讲稿共四十五页哦例1:为了解某地1岁婴儿的血红蛋白浓度,从该地随机抽取了1岁婴儿35人,测得其血红蛋白均数为123.7g/L,标准差为11.9g/L。试估计该地1岁婴儿的血红蛋白平均浓度。40第四十页
14、,讲稿共四十五页哦例2:某地抽得正常成人200名,测得其血清胆固醇的均数为3.64mmol/L,标准差为1.20mmol/L,试估计该地正常成人血清胆固醇均数的95和99置信区间41第四十一页,讲稿共四十五页哦(二)总体概率的置信区间二)总体概率的置信区间1、查表法:适用条件、查表法:适用条件n50 直接查附表直接查附表6(百分率的可信区间)(百分率的可信区间)2、正态近似法:、正态近似法:适用条件:适用条件:n50且且 np、n(1-p)均均5 计算公式:计算公式:95的总体率的置信区间的总体率的置信区间 99的总体率的置信区间的总体率的置信区间1.96PPS2.58PPS42第四十二页,讲稿共四十五页哦例:在某地随机抽取329人,作血清登革热血凝抑制抗体反应检验,结果29人阳性,问(1)调查的329人的抗体阳性率是多少?(2)抗体阳性率的抽样误差是多少?(3)试估计该地人群血清登革热血凝抑制抗体阳性率?43第四十三页,讲稿共四十五页哦三、关于置信区间的两个问题三、关于置信区间的两个问题置信区间与置信限置信区间与置信限准确度与精度准确度与精度44第四十四页,讲稿共四十五页哦45第四十五页,讲稿共四十五页哦