《参数估计与假设检验讲稿.ppt》由会员分享,可在线阅读,更多相关《参数估计与假设检验讲稿.ppt(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、参数估计与假设检验第一页,讲稿共二十八页哦 统计的发展可追溯到几千年以前。最初它是情况的记录和描述,如一个国家有多少人、男女比例如何等。社会的进化,尤其是科技的进步,给统计提出了一系列新的问题。资本主义的商业竞争,要对市场的变化作出迅速的反映,抽样调查的理论和方法就有了很快的进展;农业品种的改良、工业技术的更新,需要试验、要探讨变量之间的关系,回归分析、实验设计等也就随之形成。1946年克拉美出版了统计学的数学方法一书,把勒贝格(Henry Lebesquel8751941)代数作为统计的工具,比较完整地给出了数理统计的全貌。数理统计的特点是应用面广,分支较多。数理统计是研究怎样收集资料、如何
2、分析、处理资料的学科。所谓资料,除了数据之外,还包括一些情况、图表、等原始材料。本书的内容只限于数据的分析,不论述如何收集资料。基本概念基本概念第二页,讲稿共二十八页哦 一般说来,要考察研究的对象,它们的指标可以分成以下几类:1.计量的。如身高、体重、温度、湿度等,它可以取到某一区间内各个实数的值。2.计数的。如一个班上优秀生的人数,一个月中下雨的天数、一批产品中不合件数等,它可以取整数值。3.有序的。如医生诊断眼睛结膜炎,常用“+”,“+”,“+”表示,不能计量,但可以表示出轻微、中等、严重等不同的程度,它是有序的。4.名义的。如不同的地区用不同的编码表示;此时码值大小已无意义,码仅仅代号。
3、一个统计问题总有它明确的研究对象,研究对象的全体就是总体,总体中的每成员就是个体。然而统计问题所关心的只是个体的某一特性或某些特性。要了解总体的情况,常用的一个方法就是抽样,从总体中随机地抽取一个个体,它就是样品。样品与个体不同,个体是确定的,样品是不确定的。若干个样品就构成一个样本。总体中个体的数量一般都较多,抽取的样品又很少,这样第一个样品抽取后不会改变总体的分布,第二个样品与第一个样品的分布相同,彼此可以认为是独立的。一个样品取到的值就是样品值,一个样本取到的值就是样本值。统计是从手中已有的资料样本值,去推断总体的情况总体分布F(x)的性质,样本是联系两者的桥梁,总体分布决定了样本取值的
4、概率规律,也就是样本取到样本值的规律而可以从样本值去推断总体。统计量:不含末知参数的样本函数。第三页,讲稿共二十八页哦nxxx,21设是从样本X中抽取的一个样本niixnx11niixxns122)(11样本均值样本方差常用统计量及分布常用统计量及分布第四页,讲稿共二十八页哦)1,0(/NnXUnXXX,21来自总体N(,2)的一个样本相互独立与YXnYNX),(),1,0(2)(/ntnYXt nxxx,21来自正态总体N(,2)1(/ntnsxtU、T统计量及分布第五页,讲稿共二十八页哦)(2n分布000)(21)(22212xxexxfxnnnnxxx,21来自正态分布N(0,1)(22
5、2221nxxxn),0(1nNx)()(22nxxQi相互独立与Qxnxxx,21来自正态分布N(,2),(2nNx)1(/)(/)1(2212222nxxsnnii相互独立与2sx卡方统计量及分布卡方统计量及分布第六页,讲稿共二十八页哦相互独立与YXnYnX),(),(2212),(/2121nnFnYnXF),(),(),(),(222212112121NYYYNXXXnn两个样本独立)2,1(/2122222121nnFSSF概率分布的上分位点简介F统计量及分布第七页,讲稿共二十八页哦,其中和例 设某种灯泡寿命),(2NX2未知,今随机抽取5只灯泡,测得寿命分别为(单位:小时):162
6、31527128714321591求和2的估计值。1492)15911432128715271623(51x4.147621492)15911432128715271623(512222222),(2NXniixnx12221,矩估计矩估计第八页,讲稿共二十八页哦步骤:(1)由总体分布导出样本的联合概率函数(或联合密度);(2)把样本联合密度中自变量看成常数,而把参数看成自变量得到似然函数;(3)求似然函数的最大值点;(4)在最大值点的表达式中用样本值代入就得参数的估计值。最大似然估计最大似然估计第九页,讲稿共二十八页哦 例 设 来自正态总体 ,求和2的最大似然估计。nxxx,21),(2N)
7、,(2N解的密度函数为 222)(21)(xexfniiixnxnineexxxL12222)(212)(1221)21(21),;,(联合密度为 第十页,讲稿共二十八页哦2122)(21ln22ln2lnniixnnL便于求导0)1)(22112inixL0)(21221422niixnLxxnnii11niixxn122)(1第十一页,讲稿共二十八页哦如果参数的估计值),(21nxxx满足)(E则称 为参数的无偏估计。有效性若1,2 都是的无偏估计,而且D(1)D(2),则称1比2 有效。无偏估计无偏估计第十二页,讲稿共二十八页哦步骤:明确问题,参数相应的点估计量,由它导出与参数有关的分布
8、,利用这个分布给出区间估计。1),(),(2121nnxxxxxxP1为置信度,),(),(2121nnxxxxxx置信区间为区间估计区间估计第十三页,讲稿共二十八页哦),(2NX,2/12/1nuxnux2已知2未知)1(,)1(2/2/nsntxnsntx)1()1(,)1()1(22/1222/2nsnnsn第十四页,讲稿共二十八页哦从正态分布N(,1)中抽取容量为4的样本,样本均值为13.2,求的置信度为0.95的置信区间。解 ,2/12/1nuxnux4196.12.13,4196.12.1318.14,22.12例例196.12/1u第十五页,讲稿共二十八页哦用某仪器测量温度,重复
9、5次,测得1250,1265,1245,1260,1275,设测得数据服从正态分布,试求温度真值所在得范围(=0.005)。解5.142)(151,125951512251iiiixxsxx8.1273,2.1244)4(,)4(2/2/nstxnstx例例2776.2)4(2/t第十六页,讲稿共二十八页哦 (1)将实际问题用统计的术语叙述成一个假设检验的问题;明确原假设H0和对立假设H1的内容和它们的实际意义,要注意正确选用H0;(2)寻找与命题H0有关的统计量;通常用t(x1,x2,xn)表示,说明它是由样本x1,x2,xn确定的函数 (3)求得在H0成立时,t(x1,x2,xn)的分布
10、假设检验步骤假设检验步骤第十七页,讲稿共二十八页哦 (4)确定显著性水平,对给定的,去查统计量t 相应的分位点的值,这个值就是判断H0是否成立的临界值。(5)由样本值去计算统计量t 的数值、将它与临界值比较,从而作出判断。这五个步骤中,(2)与(3)是数理统计学者们研究解决的,它涉及较多的数学推导和理论分析,实际工作者只需注意(1)、(4)、(5)这三步,把问题提清楚,在书上找到有关的统计量及相应的表,查表后对给定的显著性水平确定临界值,再计算统计量的值来判断H0是否成立。第十八页,讲稿共二十八页哦判别 满足)1()1()1(|22/222/1nnntTuU则接受H0,拒绝H1第十九页,讲稿共
11、二十八页哦例 已知某钢铁厂的铁水含碳量在正常情况下服从N(4.55,0.1102),现测得9炉铁水,其含碳量分别为:4.27 4.32 4.52 4.44 4.51 4.55 4.35 4.28 4.45,如果标准差没有改变,总体均值是否有显著变化?解(1)建立零假设H0和对立假设H155.4:;55.4:10HH(2)选择统计量U检验法检验法第二十页,讲稿共二十八页哦82.39/110.055.441.4/00nxU(3)选择显著性水平,查临界值1-/296.1975.02/1uu(4)判断得出结论96.182.3|U含碳量与原来相比有显著差异。第二十一页,讲稿共二十八页哦例 由于工业排水引
12、起附近水质污染,测得鱼的蛋白质中含汞的浓度(p.p.m)为:0.37 0.266 0.135 0.095 0.101 0.213 0.228 0.167 0.766 0.054,从过去大量的资料判断,鱼的蛋白质中含汞的浓度服从正态分布,并且从工艺过程分析可以推算出理论上含汞的浓度为0.10,问从这组数据来看,实测值与理论值是否符合?T检验法检验法第二十二页,讲稿共二十八页哦解 1.0:;1.0:10HH375.110/0594.01.0206.0/0nsxT,0594.0)(110110122iixxs262.205.0t262.2375.1|05.0tT实测值与理论值是相等的。第二十三页,讲
13、稿共二十八页哦例 某车间生产铜丝,生产一向比较稳定,今从产品中任意抽取10根检查折断力,得数据如下(单位:kg):578 572 570 568 572 570 572 596 584 570,问:是否可相信该车间生产的铜丝的折断力的方差为64?2检验检验第二十四页,讲稿共二十八页哦解64:;64:2120HH2.575x65.1064/6.681/)(2010122iixx0.19)9(,70.2)9(2025.02975.07.2)9(65.102975.02可相信该车间生产的铜丝的折断力的方差为64第二十五页,讲稿共二十八页哦否定域临界值统计量问题010001000100202:HHHH
14、HH;已知)1,0(00NUxnUuuu12/1uUuUuU12/1|0100010001002:HHHHHH;未知)1(10nttsxnt)1()1()1(12/ntntnt)1()1()1(|12/nttnttntt010001000100:HHHHHH;未知)1(222022nns)1()1()1()1(222212/2/1nnnn)1()1()1()1(222222222/112/nnnn第二十六页,讲稿共二十八页哦说明:(1)假设检验的依据是小概率原理(在一次试验中可以认为基本上不可能发生),如果在一次试验中,小概率事件没有发生,则接受零假设H0;否则,就拒绝零假设H0(2)检验要检验假设H0 是否正确,是根据一次试验得到的样本作出的判断,因此无论拒绝H0还是接受H1,都要承担风险。第二十七页,讲稿共二十八页哦(3)假如H0本来是真的,因为一次抽样,发生小概率事件,而拒绝H0,这就犯了所谓的“弃真错误”(又称第一类错误)。假如H0本来是假的,因为一次抽样没有发生小概率事件,而接受H0,这就犯了所谓的“存伪错误”(或称第二类错误)。第二十八页,讲稿共二十八页哦