《《概率论与统计原理》第5章.ppt》由会员分享,可在线阅读,更多相关《《概率论与统计原理》第5章.ppt(42页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五章第五章 统计原理统计原理 5.1 数理统计的基本概念数理统计的基本概念5.1.1 总体和样本总体和样本 在实际中,我们把研究对象的全体组成的集合称在实际中,我们把研究对象的全体组成的集合称为总体;组成总体的每一个元素称为个体;总体的为总体;组成总体的每一个元素称为个体;总体的一个子集称为样本。一个子集称为样本。在数学上,我们把随机变量在数学上,我们把随机变量X称为总体,称为总体,并把随机并把随机变量变量X的概率分布称为总体分布的概率分布称为总体分布;把相互独立且与把相互独立且与总体总体X 同分布的随机变量(同分布的随机变量(X1,X2,Xn)称为)称为来自总体来自总体X的一个简单随机样本
2、;的一个简单随机样本;n称为样本容量;称为样本容量;把样本(把样本(X1,X2,Xn)的每一个具体值)的每一个具体值(x1,x2,xn)称为样本()称为样本(X1,X2,Xn)的)的一组样本观测值或样本实现。一组样本观测值或样本实现。5.1.2 统计量统计量 设(设(X1,X2,Xn)是来自总体)是来自总体X的一个简单随的一个简单随机样本,称样本的函数机样本,称样本的函数T=g(X1,X2,Xn)为)为统计量,如果它不依赖于任何未知参数。统计量的统计量,如果它不依赖于任何未知参数。统计量的具体值亦称做统计量的实现具体值亦称做统计量的实现。几个常用的统计量:几个常用的统计量:1、样本均值、样本均
3、值2、样本方差、样本方差 3、样本标准差、样本标准差4、样本、样本k 阶原点矩阶原点矩 5、样本、样本k 阶中心矩阶中心矩6、顺序统计量顺序统计量 最小统计量最小统计量 最大统计量最大统计量 极差极差例例1 设假设总体设假设总体X服从参数为服从参数为p(0p1)的)的0-1分布,分布,p未知。(未知。(X1,X2,X5)是来自)是来自X的简单随机的简单随机样本。样本。(1)指出指出X1+X3,min(X1,X2,X5),X5+2p(X5-X2),X2-EX4,(X3-X5)2,中哪些是统计,中哪些是统计量,哪些不是统计量量,哪些不是统计量?(2)如果()如果(0,1,0,1,1)是一个样本值,
4、求样本)是一个样本值,求样本均值和样本方差均值和样本方差。例例2 设一个样本由六个设一个样本由六个6,七个,七个7,八个,八个8,九个,九个9和和十个十个10组成求样本容量,样本均值、样本方差组成求样本容量,样本均值、样本方差和样本极差。和样本极差。例例3 设设某地区抽样调查某地区抽样调查200个居民家庭,得到月支出个居民家庭,得到月支出的统计资料如下:的统计资料如下:月支出(千元)月支出(千元)12 23 34 45 56 67 78家庭数家庭数 18 35 76 24 19 14 14求样本均值和样本方差近似值。求样本均值和样本方差近似值。5.1.3 经验分布函数经验分布函数 对于任意实数
5、对于任意实数x,设n表示样本表示样本(X1,X2,Xn)的的n个观察值个观察值中中不大于不大于x的观察值的个数的观察值的个数,则,则n表表示在对总体示在对总体X的的n次独立重复观测中,事件次独立重复观测中,事件Xx出现的次数。因此在对总体出现的次数。因此在对总体X的的n次独立重复观测次独立重复观测中,事件中,事件Xx出现的频率出现的频率 称为总体称为总体X的经验分布函数或样本分布函数的经验分布函数或样本分布函数。对于给定的样本值(对于给定的样本值(x1,x2,xn),经验分布函),经验分布函数数具有分布函数的一切性质,经验分布函数也是一具有分布函数的一切性质,经验分布函数也是一个阶梯型的函数;
6、经验分布函数依概率收敛于总体个阶梯型的函数;经验分布函数依概率收敛于总体的分布函数。的分布函数。经验分布函数依概率收敛于总体的分布函数这个结经验分布函数依概率收敛于总体的分布函数这个结论,为进行统计推断提供了依据。论,为进行统计推断提供了依据。例例4 根据根据例例1(2)和例)和例2中的数据,分别求其经验分布中的数据,分别求其经验分布函数。函数。5.2 抽样分布抽样分布5.2.1 2分布分布设设(X1,X2,Xn)是来自正态总体)是来自正态总体N(0,1)的样)的样本,称统计量本,称统计量 2=X12+X22+Xn2服从自由度为服从自由度为n的的2分布,记为分布,记为2 2(n)。)。2分布上
7、分布上分位点:对于给定的分位点:对于给定的(01),称满足条),称满足条件件为2(n)分布的上)分布的上分位点。分位点。5.2.2 t分布分布 随机变量随机变量XN(0,1),),Y2(n),且),且X和和Y相互独立,相互独立,则称随机变量则称随机变量服从自由度为服从自由度为n的的t分布,记为分布,记为Tt(n)。)。t分布上分布上分位点:对于给定的分位点:对于给定的(01),称满足条),称满足条件件为t(n)分布的上)分布的上分位点。分位点。5.2.3 正态总体的抽样分布正态总体的抽样分布 设(设(X1,X2,Xn)是来自正态总体)是来自正态总体N(,2)的)的一个样本,则一个样本,则(1)
8、样本均值样本均值(2)随机变量)随机变量(3)样本均值和样本方差相互独立)样本均值和样本方差相互独立(4)随机变量)随机变量例例5 设总体设总体X服从服从N(0,0.32),(),(X1,X2,X10)是来自是来自X的一个容量为的一个容量为10的样本,求概率的样本,求概率例例6 假设一种电子元件的使用寿命假设一种电子元件的使用寿命X(小时)服从正态(小时)服从正态分布分布N(3000,8002)。一名顾客购买了)。一名顾客购买了50个元件,个元件,试求这试求这50个元件的平均使用寿命超过个元件的平均使用寿命超过3250的概率的概率。5.3 参数估计参数估计5.3.1 统计估计的概念统计估计的概
9、念 在统计中,估计既表示由样本特征求总体特征的过在统计中,估计既表示由样本特征求总体特征的过程,也表示由样本求得的总体特征的估计值。程,也表示由样本求得的总体特征的估计值。一、参数估计和非参数估计一、参数估计和非参数估计 可以用有限个参数表示的估计问题,统称为参数估可以用有限个参数表示的估计问题,统称为参数估计,否则称为非参数估计。计,否则称为非参数估计。二、参数估计的方法二、参数估计的方法 参数估计有两种基本类型:点估计和区间估计。参数估计有两种基本类型:点估计和区间估计。点估计,也称点估计,也称“定值估计定值估计”,既可以指用统计量的值做,既可以指用统计量的值做为未知参数的估计值,也可以指
10、用来估计未知参数的为未知参数的估计值,也可以指用来估计未知参数的统计量。统计量。区间估计是指根据估计可靠程度的要求,由样本确定区间估计是指根据估计可靠程度的要求,由样本确定总体参数的一个区间范围。总体参数的一个区间范围。5.3.2 参数的点估计参数的点估计 最常用的点估计方法:矩估计法和极大似然估计法。最常用的点估计方法:矩估计法和极大似然估计法。一、矩估计法一、矩估计法 矩估计法是用样本矩来估计总体矩,用样本矩的函数矩估计法是用样本矩来估计总体矩,用样本矩的函数来估计总体矩的相应函数的一种估计方法。来估计总体矩的相应函数的一种估计方法。例例7 设总体设总体X服从参数为服从参数为的指数分布,其
11、中的指数分布,其中未知。未知。(X1,X2,Xn)是来自)是来自X的简单随机样本,求的简单随机样本,求的矩估计量的矩估计量。例例8 设设X为任意总体,为任意总体,EX=,DX=20存在,但未知。存在,但未知。(X1,X2,Xn)是来自总体)是来自总体X的简单随机样本,的简单随机样本,求求和和2的矩估计量。的矩估计量。二、二、极大似然估计法极大似然估计法 设总体设总体X的概率密度为的概率密度为f(x,)(当(当X为离散型时,为离散型时,f(x,)=PX=x,即为概率分布),其中即为概率分布),其中为待估为待估参数。设参数。设(x1,x2,xn)为样本()为样本(X1,X2,Xn)的一组观测值,称
12、)的一组观测值,称 为似然函数为似然函数。对于给定的样本观测值(对于给定的样本观测值(x1,x2,xn),使似然),使似然函数函数L()达到最大值的参数值)达到最大值的参数值 ,称为未知参,称为未知参数数的极大似然估计值,相应的统计量称为未知参的极大似然估计值,相应的统计量称为未知参数数的极大似然估计量。的极大似然估计量。极大似然估计量,可以用微积分中求函数的极大值极大似然估计量,可以用微积分中求函数的极大值的方法来求不过,这里求的不是函数的极大值,的方法来求不过,这里求的不是函数的极大值,而求是函数的极大值点。而求是函数的极大值点。由于由于lnx是是x的严格单增函数的严格单增函数,因此,因此
13、 L()和和ln L()在同在同一处取极大值,因此我们也称一处取极大值,因此我们也称ln L()为似然函数。为似然函数。求极大似然的一般步骤:求极大似然的一般步骤:(1)由总体分布写出似然函数)由总体分布写出似然函数L()和和ln L();(2)求似然函数关于)求似然函数关于的导数:的导数:如果分布含有多个未知参数(如果分布含有多个未知参数(1,2,r),这时),这时似然函数就是这些未知参数的函数,由方程组似然函数就是这些未知参数的函数,由方程组 (3)解上述方程可以得到参数)解上述方程可以得到参数的极大似然估计。的极大似然估计。例例9 设总体设总体X服从参数为(服从参数为(1/)的指数分布,
14、求参数)的指数分布,求参数的极大似然估计量。若有一组样本值的极大似然估计量。若有一组样本值340,410,450,520,620,190,210,800,270,500,求,求的极大似然估计值。的极大似然估计值。例例10 设总体设总体X服从参数为服从参数为p的的0-1分布,求参数分布,求参数p的极的极大似然估计量。大似然估计量。若从一大批产品中,用还原方法抽取了若从一大批产品中,用还原方法抽取了50件产品,件产品,发现其中有发现其中有2件是次品,求件是次品,求p的极大似然估计值。的极大似然估计值。例例11 假设总体假设总体XN(,2),),与与2都未知试根都未知试根据来自据来自X的简单随机样本
15、(的简单随机样本(X1,X2,Xn),求),求与与2的极大似然估计量。的极大似然估计量。三、评价估计量的标准三、评价估计量的标准1、无偏性、无偏性 设设 是未知参数是未知参数的估计量,如果的估计量,如果E =,则称,则称 是是的无偏估计量。的无偏估计量。例例12 设设X为任意总体,为任意总体,EX=,DX=2存在。(存在。(X1,X2,Xn)是来自总体)是来自总体X的简单随机样本,证明的简单随机样本,证明(1)样本均值是)样本均值是的无偏估计量;(的无偏估计量;(2)样本方差)样本方差是是2的无偏估计量。的无偏估计量。2、有效性、有效性 设设 与与 为未知参数为未知参数的两个无偏估计量,如果的
16、两个无偏估计量,如果D D则称则称 是比是比 有效的估计量。有效的估计量。在未知参数的任意两个无偏估计中,显然应该选更有在未知参数的任意两个无偏估计中,显然应该选更有效的,即方差较小的。效的,即方差较小的。3、一致性、一致性设设 为未知参数为未知参数的估计量,如果的估计量,如果 依概率收敛于依概率收敛于,则称则称 是是的一致估计量。的一致估计量。例例13 设设X为任意总体,其为任意总体,其k阶原点矩阶原点矩ak=EXk(k0)存在。设(存在。设(X1,X2,Xn)是来自总体)是来自总体X的简单的简单随机样本,证明样本随机样本,证明样本k阶原点矩阶原点矩 是总是总体体k阶原点矩阶原点矩ak的无偏
17、与一致估计量。的无偏与一致估计量。5.3.3 正态总体参数的区间估计正态总体参数的区间估计一、区间估计的概念一、区间估计的概念 未知参数未知参数的区间估计,也称置信区间,是以统计量的区间估计,也称置信区间,是以统计量为端点,以充分大的概率包含未知参数为端点,以充分大的概率包含未知参数值的随机值的随机区间。区间。设设是总体是总体X的未知参数,(的未知参数,(X1,X2,Xn)是)是来自总体来自总体X的简单随机样本。对给定的数的简单随机样本。对给定的数(01),如果存在两个统计量),如果存在两个统计量 和和 ,满足,满足 则称(随机)区间则称(随机)区间 称为参数称为参数的区间估计的区间估计或置信
18、区间,称概率或置信区间,称概率1-为置信区间的置信度(水为置信区间的置信度(水平)。平)。二、一个正态均值二、一个正态均值的置信区间的置信区间1、总体方差总体方差2已知已知 均值的均值的1-为置信区间为为置信区间为其中其中u/2为标准正态分布双侧分位数。为标准正态分布双侧分位数。例例14 某企业生产的滚珠直径某企业生产的滚珠直径X服从服从N(,0.0006)。)。现从产品中随机抽取现从产品中随机抽取6颗进行检测,得到它们的平颗进行检测,得到它们的平均值为均值为1.495cm,标准差为,标准差为0.0226cm。试求滚珠平。试求滚珠平均直径的置信水平为均直径的置信水平为0.95的置信区间。的置信
19、区间。置信区间的长度置信区间的长度l为为2、总体方差、总体方差2未知未知 均值的均值的1-为置信区间为为置信区间为其中其中t/2(n-1)为为t(n-1)分布双侧分位数。分布双侧分位数。例例15 在例在例14中若总体方差未知,试求滚珠平均直径中若总体方差未知,试求滚珠平均直径的置信水平为的置信水平为0.95的置信区间。的置信区间。三、一个总体方差三、一个总体方差2的置信区间的置信区间 总体方差总体方差2的的1-置信区间为置信区间为其中其中 是是自由度为是是自由度为的的2分布水平分布水平p的上侧分位数。的上侧分位数。标准差的标准差的1-置信区间为置信区间为 例例16 从自动车床加工的一批零件中随
20、机抽取了从自动车床加工的一批零件中随机抽取了16件,件,测得零件长度的平均值为测得零件长度的平均值为2.125cm,标准差为,标准差为0.017cm。假设零件的长度服从正态分布,求零件。假设零件的长度服从正态分布,求零件长度标准差的长度标准差的0.95置信区间。置信区间。5.4 假设检验假设检验一、一、假设检验的基本概念假设检验的基本概念 1、统计假设的概念、统计假设的概念 统计假设是关于总体参数或数字特征、总体的分布统计假设是关于总体参数或数字特征、总体的分布以及两个或两个以上总体之间的关系的一切论断以及两个或两个以上总体之间的关系的一切论断或命题,简称假设。通常用字母或命题,简称假设。通常
21、用字母“H”表示假设。表示假设。2、统计假设的基本类型、统计假设的基本类型(1)参数假设与非参数假设)参数假设与非参数假设 可以用有限个参数表示的统计假设称为参数假设,可以用有限个参数表示的统计假设称为参数假设,否则称为非参数假设否则称为非参数假设。(2)原假设与备择假设)原假设与备择假设 两个二者必居其一的假设,其中一个称做原假设,两个二者必居其一的假设,其中一个称做原假设,习惯上记为习惯上记为H0;而另一个称做备择假设,习惯上;而另一个称做备择假设,习惯上记为记为H1。原假设也称为零假设;备择假设也称为原假设也称为零假设;备择假设也称为对立假设。对立假设。3、统计假设的检验、统计假设的检验
22、 统计假设的检验,简称假设检验,是指按照一定统计假设的检验,简称假设检验,是指按照一定规则即检验准则,根据样本来判断所作假设的真规则即检验准则,根据样本来判断所作假设的真伪,以决定接受还是否定假设。伪,以决定接受还是否定假设。(1)检验准则)检验准则 检验准则,简称为检验,指接受还是否定假设所检验准则,简称为检验,指接受还是否定假设所依据的规则。依据的规则。检验准则通常用原假设的否定域来检验准则通常用原假设的否定域来表示。表示。否定域亦称拒绝域或临界域,假设否定域亦称拒绝域或临界域,假设H0的否定域是的否定域是样本空间的一个区域样本空间的一个区域V,当样本值落入区域,当样本值落入区域V时,时,
23、否定假设否定假设H0。(2)假设检验的理论依据)假设检验的理论依据 小概率原则。所谓小概率原则,就是根据具体问小概率原则。所谓小概率原则,就是根据具体问题的要求,指定一个可以认为题的要求,指定一个可以认为“充分小充分小”的数的数(01),并且把概率不大于),并且把概率不大于的事件认为是的事件认为是“实际不可能事件实际不可能事件”,即认为这样的事件在一次,即认为这样的事件在一次试验或观测中实际上不会出现。试验或观测中实际上不会出现。4、假设检验的基本步骤、假设检验的基本步骤(1)根据实际问题的要求提出原假设)根据实际问题的要求提出原假设H0和备择假设和备择假设H1,并且在作出最后的判断之前,将始
24、终在假设,并且在作出最后的判断之前,将始终在假设H0成立的假定下进行分析;成立的假定下进行分析;(2)构造适当的检验统计量)构造适当的检验统计量J,在假设,在假设H H0 0成立下,其成立下,其分布已知;分布已知;(3 3)对给定的水平)对给定的水平(0 0 1 1),确定否定域),确定否定域V;(4 4)根据检验统计量)根据检验统计量J的观察值,作出统计决策。的观察值,作出统计决策。5 5、假设检验的两类错误、假设检验的两类错误 否定了本来真实的假设,称为第一类(弃真)错否定了本来真实的假设,称为第一类(弃真)错误,犯这类错误的概率记为误,犯这类错误的概率记为 ;接受了本来错误的假设,称为第
25、二类(存伪)错接受了本来错误的假设,称为第二类(存伪)错误,犯这类错误的概率记为误,犯这类错误的概率记为。二、一个总体参数的假设检验二、一个总体参数的假设检验 1、一个总体均值的假设检验、一个总体均值的假设检验(1)正态总体,方差)正态总体,方差2已知已知双双侧检验侧检验上上侧检验侧检验下下侧检验侧检验假假设设 H0:=0 H1:0H0:0H1:0H0:0H1:0检验统检验统计计量量拒拒绝绝域域uuu-u 例例17 味精厂用一台包装机自动包装味精,包得的味精厂用一台包装机自动包装味精,包得的袋装味精重量服从袋装味精重量服从N(,0.0152)。当机器正常时,)。当机器正常时,其均值为其均值为0
26、.5kg。某日开工后随机地抽取。某日开工后随机地抽取9袋味精,袋味精,称得平均重量为称得平均重量为0.511kg,问在显著性水平,问在显著性水平0.05下,下,这台包装机是否正常?这台包装机是否正常?(2)正态总体,方差)正态总体,方差2未知未知双双侧检验侧检验上上侧检验侧检验下下侧检验侧检验假假设设 H0:=0 H1:0H0:0H1:0H0:0H1:0检验统检验统计计量量拒拒绝绝域域tt(n-1)t-t(n-1)例例18 某厂生产的螺杆直径服从正态分布某厂生产的螺杆直径服从正态分布N(,2)。)。现从中抽取现从中抽取5件,测得平均直径为件,测得平均直径为21.8mm,标准差,标准差为为0.3
27、67mm。若。若2未知,在显著性水平未知,在显著性水平0.05下,检下,检验假设验假设H0:=21是否成立。是否成立。例例19 用某种农药施入农田种防治病虫害,经过三个月用某种农药施入农田种防治病虫害,经过三个月后,如果土壤中的浓度不低于后,如果土壤中的浓度不低于5ppm,认为仍有残效。,认为仍有残效。在一块已施药的农田中随机抽取在一块已施药的农田中随机抽取10个土样进行分析,个土样进行分析,其浓度的平均值为其浓度的平均值为4.08ppm,标准差为,标准差为1.80ppm。假。假设土壤残余农药的浓度服从正态分布,在显著性水设土壤残余农药的浓度服从正态分布,在显著性水平平0.05下,问该农药经过
28、三个月后是否仍有残效?下,问该农药经过三个月后是否仍有残效?(3)总体分布未知,但大样本情形)总体分布未知,但大样本情形双双侧检验侧检验上上侧检验侧检验下下侧检验侧检验假假设设 H0:=0 H1:0H0:0H1:0H0:0H1:0检验统检验统计计量量拒拒绝绝域域tut-u例例20 某厂生产的一种型号的电阻元件其平均电阻一某厂生产的一种型号的电阻元件其平均电阻一直保持在直保持在2.64欧姆。改变生产工艺后,测得所生产欧姆。改变生产工艺后,测得所生产的的100个元件的平均电阻为个元件的平均电阻为2.62欧姆,标准差为欧姆,标准差为0.06欧姆,在显著性水平欧姆,在显著性水平0.01下,问新工艺对该
29、电下,问新工艺对该电阻元件的生产有无显著影响?阻元件的生产有无显著影响?2、一个正态总体方差、一个正态总体方差2的假设检验(自由度为的假设检验(自由度为n-1)双双侧检验侧检验上上侧检验侧检验下下侧检验侧检验假假设设 H0:=0 H1:0H0:0H1:0H0:0H1:0检验统检验统计计量量拒拒绝绝域域2022)1(scSn-=例例21 设某厂生产的产品服从设某厂生产的产品服从N(,0.0482)。今任)。今任取取5件进行检测,得到其平均值为件进行检测,得到其平均值为1.414,方差为,方差为0.00778。问在显著性水平。问在显著性水平0.1下,能否认为总体的下,能否认为总体的方差没有显著变化?方差没有显著变化?3、一个总体比率的假设检验(大样本)、一个总体比率的假设检验(大样本)双双侧检验侧检验上上侧检验侧检验下下侧检验侧检验假假设设 H0:p=p0 H1:pp0H0:pp0H1:pp0H0:pp0H1:pp0检验统检验统计计量量拒拒绝绝域域uuu-u例例22 某厂生产了一批产品,按规定次品率不超过某厂生产了一批产品,按规定次品率不超过0.05才能出厂,否则不能出厂。现从产品中随机才能出厂,否则不能出厂。现从产品中随机抽取抽取50件进行检查,发现有件进行检查,发现有4件次品,问在显著性件次品,问在显著性水平水平0.05下,该批产品能否出厂?下,该批产品能否出厂?