《参数估计与假设检验.ppt》由会员分享,可在线阅读,更多相关《参数估计与假设检验.ppt(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、参数估计与假设检验现在学习的是第1页,共28页 统计的发展可追溯到几千年以前。最初它是情况的记录和描述,如一个国家有多少人、男女比例如何等。社会的进化,尤其是科技的进步,给统计提出了一系列新的问题。资本主义的商业竞争,要对市场的变化作出迅速的反映,抽样调查的理论和方法就有了很快的进展;农业品种的改良、工业技术的更新,需要试验、要探讨变量之间的关系,回归分析、实验设计等也就随之形成。1946年克拉美出版了统 计 学 的 数 学 方 法一书,把勒贝格(Henry Lebesquel8751941)代数作为统计的工具,比较完整地给出了数理统计的全貌。数理统计的特点是应用面广,分支较多。数理统计是研究
2、怎样收集资料、如何分析、处理资料的学科。所谓资料,除了数据之外,还包括一些情况、图表、等原始材料。本书的内容只限于数据的分析,不论述如何收集资料。基本概念基本概念现在学习的是第2页,共28页 一般说来,要考察研究的对象,它们的指标可以分成以下几类:1.计量的。如身高、体重、温度、湿度等,它可以取到某一区间内各个实数的值。2.计数的。如一个班上优秀生的人数,一个月中下雨的天数、一批产品中不合件数等,它可以取整数值。3.有序的。如医生诊断眼睛结膜炎,常用“+”,“+”,“+”表示,不能计量,但可以表示出轻微、中等、严重等不同的程度,它是有序的。4.名义的。如不同的地区用不同的编码表示;此时码值大小
3、已无意义,码仅仅代号。一个统计问题总有它明确的研究对象,研究对象的全体就是总体,总体中的每成员就是个体。然而统计问题所关心的只是个体的某一特性或某些特性。要了解总体的情况,常用的一个方法就是抽样,从总体中随机地抽取一个个体,它就是样品。样品与个体不同,个体是确定的,样品是不确定的。若干个样品就构成一个样本。总体中个体的数量一般都较多,抽取的样品又很少,这样第一个样品抽取后不会改变总体的分布,第二个样品与第一个样品的分布相同,彼此可以认为是独立的。一个样品取到的值就是样品值,一个样本取到的值就是样本值。统计是从手中已有的资料样本值,去推断总体的情况总体分布F(x)的性质,样本是联系两者的桥梁,总
4、体分布决定了样本取值的概率规律,也就是样本取到样本值的规律而可以从样本值去推断总体。统计量:不含末知参数的样本函数。现在学习的是第3页,共28页nxxx,21设是从样本X中抽取的一个样本niixnx11niixxns122)(11样本均值样本方差常用统计量及分布常用统计量及分布现在学习的是第4页,共28页)1,0(/NnXUnXXX,21来自总体N(,2)的一个样本相互独立与YXnYNX),(),1,0(2)(/ntnYXt nxxx,21来自正态总体N(,2)1(/ntnsxtU、T统计量及分布现在学习的是第5页,共28页)(2n分布000)(21)(22212xxexxfxnnnnxxx,
5、21来自正态分布N(0,1)(222221nxxxn),0(1nNx)()(22nxxQi相互独立与Qxnxxx,21来自正态分布N(,2),(2nNx)1(/)(/)1(2212222nxxsnnii相互独立与2sx卡方统计量及分布卡方统计量及分布现在学习的是第6页,共28页相互独立与YXnYnX),(),(2212),(/2121nnFnYnXF),(),(),(),(222212112121NYYYNXXXnn两个样本独立)2,1(/2122222121nnFSSF概率分布的上分位点简介F统计量及分布现在学习的是第7页,共28页,其中和例 设某种灯泡寿命),(2NX2未知,今随机抽取5只
6、灯泡,测得寿命分别为(单位:小时):16231527128714321591求和2的估计值。1492)15911432128715271623(51x4.147621492)15911432128715271623(512222222),(2NXniixnx12221,矩估计矩估计现在学习的是第8页,共28页步骤:(1)由总体分布导出样本的联合概率函数(或联合密度);(2)把样本联合密度中自变量看成常数,而把参数看成自变量得到似然函数;(3)求似然函数的最大值点;(4)在最大值点的表达式中用样本值代入就得参数的估计值。最大似然估计最大似然估计现在学习的是第9页,共28页 例 设 来自正态总体
7、,求和2的最大似然估计。nxxx,21),(2N),(2N解的密度函数为 222)(21)(xexfniiixnxnineexxxL12222)(212)(1221)21(21),;,(联合密度为 现在学习的是第10页,共28页2122)(21ln22ln2lnniixnnL便于求导0)1)(22112inixL0)(21221422niixnLxxnnii11niixxn122)(1现在学习的是第11页,共28页如果参数的估计值),(21nxxx满足)(E则称 为参数的无偏估计。有效性若1,2 都是的无偏估计,而且D(1)D(2),则称1比2 有效。无偏估计无偏估计现在学习的是第12页,共2
8、8页步骤:明确问题,参数相应的点估计量,由它导出与参数有关的分布,利用这个分布给出区间估计。1),(),(2121nnxxxxxxP1为置信度,),(),(2121nnxxxxxx置信区间为区间估计区间估计现在学习的是第13页,共28页),(2NX,2/12/1nuxnux2已知2未知)1(,)1(2/2/nsntxnsntx)1()1(,)1()1(22/1222/2nsnnsn现在学习的是第14页,共28页从正态分布N(,1)中抽取容量为4的样本,样本均值为13.2,求的置信度为0.95的置信区间。解 ,2/12/1nuxnux4196.12.13,4196.12.1318.14,22.1
9、2例例196.12/1u现在学习的是第15页,共28页用某仪器测量温度,重复5次,测得1250,1265,1245,1260,1275,设测得数据服从正态分布,试求温度真值所在得范围(=0.005)。解5.142)(151,125951512251iiiixxsxx8.1273,2.1244)4(,)4(2/2/nstxnstx例例2776.2)4(2/t现在学习的是第16页,共28页 (1)将实际问题用统计的术语叙述成一个假设检验的问题;明确原假设H0和对立假设H1的内容和它们的实际意义,要注意正确选用H0;(2)寻找与命题H0有关的统计量;通常用t(x1,x2,xn)表示,说明它是由样本x
10、1,x2,xn确定的函数 (3)求得在H0成立时,t(x1,x2,xn)的分布 假设检验步骤假设检验步骤现在学习的是第17页,共28页 (4)确定显著性水平,对给定的,去查统计量t 相应的分位点的值,这个值就是判断H0是否成立的临界值。(5)由样本值去计算统计量t 的数值、将它与临界值比较,从而作出判断。这五个步骤中,(2)与(3)是数理统计学者们研究解决的,它涉及较多的数学推导和理论分析,实际工作者只需注意(1)、(4)、(5)这三步,把问题提清楚,在书上找到有关的统计量及相应的表,查表后对给定的显著性水平确定临界值,再计算统计量的值来判断H0是否成立。现在学习的是第18页,共28页判别 满
11、足)1()1()1(|22/222/1nnntTuU则接受H0,拒绝H1现在学习的是第19页,共28页例 已知某钢铁厂的铁水含碳量在正常情况下服从N(4.55,0.1102),现测得9炉铁水,其含碳量分别为:4.27 4.32 4.52 4.44 4.51 4.55 4.35 4.28 4.45,如果标准差没有改变,总体均值是否有显著变化?解(1)建立零假设H0和对立假设H155.4:;55.4:10HH(2)选择统计量U检验法检验法现在学习的是第20页,共28页82.39/110.055.441.4/00nxU(3)选择显著性水平,查临界值1-/296.1975.02/1uu(4)判断得出结
12、论96.182.3|U含碳量与原来相比有显著差异。现在学习的是第21页,共28页例 由于工业排水引起附近水质污染,测得鱼的蛋白质中含汞的浓度(p.p.m)为:0.37 0.266 0.135 0.095 0.101 0.213 0.228 0.167 0.766 0.054,从过去大量的资料判断,鱼的蛋白质中含汞的浓度服从正态分布,并且从工艺过程分析可以推算出理论上含汞的浓度为0.10,问从这组数据来看,实测值与理论值是否符合?T检验法检验法现在学习的是第22页,共28页解 1.0:;1.0:10HH375.110/0594.01.0206.0/0nsxT,0594.0)(110110122i
13、ixxs262.205.0t262.2375.1|05.0tT实测值与理论值是相等的。现在学习的是第23页,共28页例 某车间生产铜丝,生产一向比较稳定,今从产品中任意抽取10根检查折断力,得数据如下(单位:kg):578 572 570 568 572 570 572 596 584 570,问:是否可相信该车间生产的铜丝的折断力的方差为64?2检验检验现在学习的是第24页,共28页解64:;64:2120HH2.575x65.1064/6.681/)(2010122iixx0.19)9(,70.2)9(2025.02975.07.2)9(65.102975.02可相信该车间生产的铜丝的折断
14、力的方差为64现在学习的是第25页,共28页否定域临界值统计量问题010001000100202:HHHHHH;已知)1,0(00NUxnUuuu12/1uUuUuU12/1|0100010001002:HHHHHH;未知)1(10nttsxnt)1()1()1(12/ntntnt)1()1()1(|12/nttnttntt010001000100:HHHHHH;未知)1(222022nns)1()1()1()1(222212/2/1nnnn)1()1()1()1(222222222/112/nnnn现在学习的是第26页,共28页说明:(1)假设检验的依据是小概率原理(在一次试验中可以认为基本上不可能发生),如果在一次试验中,小概率事件没有发生,则接受零假设H0;否则,就拒绝零假设H0(2)检验要检验假设H0 是否正确,是根据一次试验得到的样本作出的判断,因此无论拒绝H0还是接受H1,都要承担风险。现在学习的是第27页,共28页(3)假如H0本来是真的,因为一次抽样,发生小概率事件,而拒绝H0,这就犯了所谓的“弃真错误”(又称第一类错误)。假如H0本来是假的,因为一次抽样没有发生小概率事件,而接受H0,这就犯了所谓的“存伪错误”(或称第二类错误)。现在学习的是第28页,共28页