5-6第六章 参数估计.ppt

上传人:hwp****526 文档编号:84152876 上传时间:2023-04-03 格式:PPT 页数:91 大小:934KB
返回 下载 相关 举报
5-6第六章 参数估计.ppt_第1页
第1页 / 共91页
5-6第六章 参数估计.ppt_第2页
第2页 / 共91页
点击查看更多>>
资源描述

《5-6第六章 参数估计.ppt》由会员分享,可在线阅读,更多相关《5-6第六章 参数估计.ppt(91页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第六章第六章 参数估计参数估计n第一节第一节 概率与概率分布概率与概率分布n第二节第二节 样本及其分布样本及其分布n第三节第三节 点估计点估计n第四节第四节 参参数的区间估计数的区间估计n第五节第五节 样本容量的确定样本容量的确定n第六节第六节 几种基本抽样方式几种基本抽样方式1第一节第一节 概率与概率分布概率与概率分布一、随机事件与概率一、随机事件与概率(一一)随机试验与事件随机试验与事件 随机现象是一种可能发生随机现象是一种可能发生,也可能不发生也可能不发生;可能这样发生可能这样发生,也可能那样发生也可能那样发生的不确定现象的不确定现象.随机现象的特点是随机现象的特点是:在条件不变的情况下

2、在条件不变的情况下,一系列的试验或观测会得到不一系列的试验或观测会得到不同的结果同的结果,并且在试验或观测前不能预见何种结果将出现并且在试验或观测前不能预见何种结果将出现.对随机现象的试验或观测称为对随机现象的试验或观测称为随机试验随机试验,它必须满足以下的性质它必须满足以下的性质:n(1)试验可在相同条件下重复进行;试验可在相同条件下重复进行;n(2)试验的结果不止一个试验的结果不止一个,而且所有可能的结果都是明确可知的;而且所有可能的结果都是明确可知的;n(3)每次试验总是恰好出现这些结果中的一个每次试验总是恰好出现这些结果中的一个,但在试验之前却不但在试验之前却不 能肯定究竟是出现哪一个

3、结果。能肯定究竟是出现哪一个结果。2n在随机试验中在随机试验中,可能出现也可能不出现的结果可能出现也可能不出现的结果,称之称之为为随机事件随机事件,简称事件简称事件.试验的结果可能是一个简单事件试验的结果可能是一个简单事件,也可能是一个复杂也可能是一个复杂事件事件.简单事件就是不可以再分解的事件简单事件就是不可以再分解的事件,又称为基又称为基本事件本事件.复杂事件是由简单事件组合而成的事件复杂事件是由简单事件组合而成的事件.基基本事件还可称为样本点本事件还可称为样本点,设试验有设试验有n个基本事件个基本事件,分分别记为别记为w wi(i=1,2,n).集合集合W W=w w1,w w2,w w

4、n称称为样本空间为样本空间,W W中的元素就是样本点。中的元素就是样本点。3n例例:投掷一粒均匀的六面体骰子投掷一粒均匀的六面体骰子,出现的点数有可能出现的点数有可能是是1、2、3、4、5、6共六种共六种.这六种结果是基本结果这六种结果是基本结果,不可以再分解成更简单的结果了不可以再分解成更简单的结果了,所以所以=1,2,3,4,5,6为该试验的样本空间为该试验的样本空间.“出现点数是奇数出现点数是奇数”这一这一事件就不是简单事件事件就不是简单事件,它是由基本事件它是由基本事件1,3和和5组合而成的组合而成的.通常用大写字母通常用大写字母A,B,C,来表示来表示随机事件随机事件,如如,设设A表

5、示表示“出现点数是奇数出现点数是奇数”,则则A=1,3,5;设设B表示表示“出现点数是偶数出现点数是偶数”,则则B=2,4,6.4(二)概率(二)概率n1.概率的定义概率的定义 概率概率是指随机事件发生的可能性是指随机事件发生的可能性,或称为机率或称为机率,是对随机事件是对随机事件发生可能性的度量发生可能性的度量.进行进行n次重复试验次重复试验,随机事件随机事件A发生的次数发生的次数是是m次次,发生的频率是发生的频率是m/n,当试验的次数当试验的次数n很大时很大时,如果频率在如果频率在某一数值某一数值p附近摆动附近摆动,而且随着试验次数而且随着试验次数n的不断增加的不断增加,频率的频率的摆动幅

6、度越来越小摆动幅度越来越小,则称则称p为事件为事件A发生的概率发生的概率,记为记为:P(A)=p.在古典概型场合在古典概型场合,即基本事件发生的概率都一样的场合即基本事件发生的概率都一样的场合:5n例例:设一个袋子中装有白球设一个袋子中装有白球2个个,黑球黑球3个个.(1)从中从中随机摸出随机摸出1只球只球,问刚好是白球的概率有多大问刚好是白球的概率有多大?(2)从中随机摸出从中随机摸出2只球只球,一问一问2只球都是白球的概率有只球都是白球的概率有多大多大?二问二问2只球一白一黑的概率有多大只球一白一黑的概率有多大?三问三问2只球只球都是黑球的概率有多大都是黑球的概率有多大?n解解:(1)由于

7、摸出的任何由于摸出的任何1只球都形成一个基本事件只球都形成一个基本事件,所以样本点总数为所以样本点总数为n=5.用用A表示摸出的是白球事件表示摸出的是白球事件,则则A由两个基本点组成由两个基本点组成,即即A=白球白球,白球白球,有利场合有利场合数数m=2.因此因此,刚好摸出白球的概率为刚好摸出白球的概率为 P(A)=m/n=2/5=0.46n(2)由于摸出由于摸出2只球才成一个基本事件只球才成一个基本事件,所以样本点所以样本点总数为总数为 ,故故nP(A)=P(2只球都是白球只球都是白球)=1/=1/10nP(B)=P(2只球一白一黑只球一白一黑)=23/10=6/10nP(C)=P(2只球都

8、是黑球只球都是黑球)=3/10nNOTE:P(A+B+C)=17n2.概率的基本性质概率的基本性质n性质性质1 1P(A)0。n性质性质2 P()=1。n性质性质3 若事件若事件A与事件与事件B互不相容互不相容,即即AB=,则则P(AB)=P(A)+P(B)。n推论推论1 不可能事件的概率为不可能事件的概率为0,即即:P()=0。n推论推论2 P()=1-P(A),表示表示A的对立事件的对立事件,即它即它们二者必有一事件发生但又不能同时发生。们二者必有一事件发生但又不能同时发生。8n例例:袋中装有袋中装有4只黑球和只黑球和1只白球只白球,每次从袋中随机地摸出每次从袋中随机地摸出1只只球球,并换

9、入并换入1只黑球只黑球.连续进行连续进行,问第三次摸到黑球的概率是多问第三次摸到黑球的概率是多少少?n 解解:记记A为为“第三次摸到黑球第三次摸到黑球”,则则 为为“第三次摸到白球第三次摸到白球”.先计算先计算P()。n由于袋中只有由于袋中只有1只白球只白球,若某一次摸到了白球若某一次摸到了白球,换入了黑球换入了黑球,则则袋中只有黑球了袋中只有黑球了.所以相当于第一、第二次都是摸到黑球所以相当于第一、第二次都是摸到黑球,第第三次摸到白球三次摸到白球.注意这是一种有放回的摸球注意这是一种有放回的摸球,样本点总数为样本点总数为53,有利场合数是有利场合数是421。故:。故:P()=所以所以 9 3

10、.事件的独立性事件的独立性n定义定义:对事件对事件A与与B,若若p(AB)=p(B)p(A),则称它们是统计独则称它们是统计独立的立的,简称相互独立。简称相互独立。n一个事件的发生与否并不影响另一个事件发生的概率一个事件的发生与否并不影响另一个事件发生的概率,则称则称两个事件独立。两个事件独立。n若事件若事件A与与B独立独立,则则P(B|A)=P(B),P(A|B)=P(A)此时概率的乘法公式可简化为此时概率的乘法公式可简化为 P(AB)=P(B)P(B)推广到推广到n个独立事件个独立事件,有有 P(A1 A2 An)=P(A1)P(A2)P(An)10【例例】某某工工人人同同时时看看管管三三

11、台台机机床床,每每单单位位时时间间(如如30分分钟钟)内内机机床床不不需需要要看看管管的的概概率率:甲甲机机床床为为0.9,乙乙机机床床为为0.8,丙丙机机床床为为0.85。若机床是自动且独立地工作。若机床是自动且独立地工作,求求 (1)在在30分钟内三台机床都不需要看管的概率分钟内三台机床都不需要看管的概率 (2)在在30分分钟钟内内甲甲、乙乙机机床床不不需需要要看看管管,且且丙丙机机床床需需要要看看管管的的概率概率 解解:设设 A1,A2,A3为为甲甲、乙乙、丙丙三三台台机机床床不不需需要要看看管管的的事事件件,A3 为丙机床需要看管的事件为丙机床需要看管的事件,依题意有依题意有 (1)P

12、(A1A2A3)=P(A1)P(A2)P(A3)=0.9 0.8 0.85=0.612 (2)P(A1A2 A3)=P(A1)P(A2)P(A3)=0.9 0.8(1-0.85)=0.10811二、随机变量二、随机变量n随机变量随机变量X是定义在样本空间是定义在样本空间=1,2,n上的一个函上的一个函数数,这个函数的取值随试验的结果不同而变化这个函数的取值随试验的结果不同而变化.这个函数还要这个函数还要求满足条件求满足条件:对任意的实数对任意的实数x,Xx是随机事件是随机事件.如果随机变量如果随机变量所有可能的取值是有限的所有可能的取值是有限的,或可排成一列的或可排成一列的,这种随机变量称这种

13、随机变量称为为离散型随机变量离散型随机变量;另一种情况是随机变量的取值范围是一个另一种情况是随机变量的取值范围是一个区间或整个数轴区间或整个数轴,这种随机变量称为这种随机变量称为连续型随机变量连续型随机变量.n1.离散型随机变量的概率分布离散型随机变量的概率分布 n设离散型随机变量设离散型随机变量X的所有可能取值为的所有可能取值为x1,x2,xn,相应相应的概率为的概率为p(x1),p(x2),p(xn),.用表格统一表示出来是:用表格统一表示出来是:12 X x1 x2 xn P p(x1)p(x2)p(xn)这称为这称为离散型随机变量离散型随机变量X的概率分布的概率分布。性质:性质:(1)

14、0p(xi)1 (i=1,2,);(2)n定义定义:离散型随机变量离散型随机变量X的的期望期望值为值为 n性质性质:n其中其中X1,X2都是随机变量都是随机变量,a,ba,b是任意常数。是任意常数。131、一次试验的结果的数值性描述、一次试验的结果的数值性描述2、一般用、一般用 X、Y、Z 来表示来表示3、例如、例如:投掷两枚硬币出现正面的数量投掷两枚硬币出现正面的数量4、根据取值情况的不同分为离散型随机变量和连续型随机变量、根据取值情况的不同分为离散型随机变量和连续型随机变量二、随机变量二、随机变量14离散型随机变量离散型随机变量1.随随机机变变量量X取取有有限限个个值值或或所所有有取取值值

15、都都可可以以逐逐个个列列举举出来出来 x1,x2,2.以确定的概率取这些不同的值以确定的概率取这些不同的值3.离散型随机变量的一些例子离散型随机变量的一些例子试验试验随机变量随机变量可能的取值可能的取值抽查抽查100个产品个产品一家餐馆营业一天一家餐馆营业一天电脑公司一个月的销售电脑公司一个月的销售销售一辆汽车销售一辆汽车取到次品的个数取到次品的个数顾客数顾客数销售量销售量顾客性别顾客性别0,1,2,1000,1,2,0,1,2,男性为男性为0,女性为女性为115连续型随机变量连续型随机变量1.随机变量随机变量 X 取无限个值取无限个值2.所所有有可可能能取取值值不不可可以以逐逐个个列列举举出

16、出来来,而而是是取取数数轴轴上上某一区间内的任意点某一区间内的任意点3.连续型随机变量的一些例子连续型随机变量的一些例子试验试验随机变量随机变量可能的取值可能的取值抽查一批电子元件抽查一批电子元件新建一座住宅楼新建一座住宅楼测量一个产品的长度测量一个产品的长度使用寿命使用寿命(小时小时)半年后工程完成的百分比半年后工程完成的百分比测量误差测量误差(cm)X 00 X 100X 016三、离散型随机变量的概率分布三、离散型随机变量的概率分布1.列出离散型随机变量列出离散型随机变量X的所有可能取值的所有可能取值2.列出随机变量取这些值的概率列出随机变量取这些值的概率3.通常用下面的表格来表示通常用

17、下面的表格来表示X=xix1,x2,xnP(X=xi)=pip1,p2,pn4.P(X=xi)=pi称为离散型随机变量的概率函数称为离散型随机变量的概率函数pi 017【例例】如如规规定定打打靶靶中中域域得得3分分,中中域域得得2分分,中中域域得得1分分,中中域域外外得得0分分。今今某某射射手手每每100次次射射击击,平平均均有有30次次中中域域I,55次次中中域域II,10次次中中III,5次次中中域域外外。则则考考察察每每次次射射击击得得分分为为0,1,2,3这这一一离离散散型型随随机机变变量量,其其概率分布为概率分布为X=xi0 1 2 3P(X=xi)pi0.05 0.10 0.55

18、0.3018离散型随机变量的数学期望离散型随机变量的数学期望1.在在离离散散型型随随机机变变量量X的的一一切切可可能能取取值值的的完完备备组组中中,各各可能取值可能取值xi与其取相对应的概率与其取相对应的概率pi乘积之和乘积之和2.描述离散型随机变量取值的集中程度描述离散型随机变量取值的集中程度3.计算公式为计算公式为19n定义定义:离散型随机变量离散型随机变量X的的方差方差为为 方差的平方根方差的平方根称为称为标准差标准差.方差方差2或标准差或标准差反映随机变量反映随机变量X相对其期望值的相对其期望值的 离散程度离散程度,2或或越小越小,说明期望值的代表性越好说明期望值的代表性越好;2或或越

19、大越大,说明期望值的代表性越差说明期望值的代表性越差.n性质性质:对于任意的对于任意的,D(X)=2 D(X)成立成立.离散型随机变量的方差离散型随机变量的方差20 xf(x)CAB 21【例例】投投掷掷一一枚枚骰骰子子,出出现现的的点点数数是是个个离离散散型型随随机机变变量量,其概率分布为如下其概率分布为如下.计算数学期望和方差计算数学期望和方差X=xi1 2 3 4 5 6P(X=xi)=pi1/6 1/6 1/6 1/6 1/6 1/6解解:数学期望为数学期望为:方差为:方差为:22常见的离散型概率分布常见的离散型概率分布超几何分布超几何分布离散型随机变离散型随机变量的概率分布量的概率分

20、布泊松分布泊松分布二项分布二项分布23二项分布二项分布1.进进行行n次次重重复复试试验验,出出现现“成成功功”的的次次数数的的概概率率分分布称为二项分布布称为二项分布2.设设X为为n次次重重复复试试验验中中事事件件A出出现现的的次次数数,X 取取x的的概概率为率为24显然显然,对于对于PX=x 0,x=1,2,n,有有同样有同样有当当 n=1 时时,二项分布化简为二项分布化简为25二项分布的数学期望和方差二项分布的数学期望和方差二项分布的数学期望为二项分布的数学期望为 E(X)=np方差为方差为 D(X)npq26【例例】已已知知100件件产产品品中中有有5件件次次品品,现现从从中中任任取取一

21、一件件,有有放放回回地地抽抽取取3次次.求求在在所所抽抽取取的的3件件产产品品中中恰恰好好有有2件件次品的概率次品的概率解解:设设X为为所所抽抽取取的的3件件产产品品中中的的次次品品数数,则则XB(3,0.05),根据二项分布公式有根据二项分布公式有 27泊松分布泊松分布 1.用用于于描描述述在在一一指指定定时时间间范范围围内内或或在在一一定定的的长长度度、面面积、体积之内每一事件出现次数的分布积、体积之内每一事件出现次数的分布 2.泊松分布的例子泊松分布的例子n一个城市在一个月内发生的交通事故次数一个城市在一个月内发生的交通事故次数n消费者协会一个星期内收到的消费者投诉次数消费者协会一个星期

22、内收到的消费者投诉次数n人寿保险公司每天收到的死亡声明的人数人寿保险公司每天收到的死亡声明的人数28泊松概率分布函数泊松概率分布函数 给定的时间间隔、长度、面积、体积内给定的时间间隔、长度、面积、体积内“成成功功”的平均数的平均数e=2.71828 x给定的时间间隔、长度、面积、体积内给定的时间间隔、长度、面积、体积内“成成功功”的次数的次数29泊松概率分布的期望和方差泊松概率分布的期望和方差泊松分布的数学期望为泊松分布的数学期望为 E(X)=方差为方差为 D(X)=30【例例】假假定定某某企企业业的的职职工工中中在在周周一一请请假假的的人人数数X服服从从泊泊松松分分布布,且且设设周周一一请请

23、事事假假的的平平均均人人数数为为2.5人人.求求 (1)X 的均值及标准差的均值及标准差 (2)在给定的某周一正好请事假是在给定的某周一正好请事假是5人的概率人的概率 解解:(1)E(X)=2.5;D(X)=2.5=1.581 (2)31连续型随机变量连续型随机变量指数分布指数分布连续型随机变连续型随机变量的概率分布量的概率分布正态分布正态分布均匀分布均匀分布其他分布其他分布32连续型随机变量的概率分布连续型随机变量的概率分布1.连连续续型型随随机机变变量量可可以以取取某某一一区区间间或或整整个个实实数数轴轴上上的的任意一个值任意一个值2.它取任何一个特定的值的概率都等于它取任何一个特定的值的

24、概率都等于03.不能列出每一个值及其相应的概率不能列出每一个值及其相应的概率4.通常研究它取某一区间值的概率通常研究它取某一区间值的概率5.用数学函数的形式和分布函数的形式来描述用数学函数的形式和分布函数的形式来描述33概率密度函数概率密度函数设设X为为一一连连续续型型随随机机变变量量,x为为任任意意实实数数,X的的概概率率密密度度函数记为函数记为f(x),它满足条件它满足条件2.f(x)不是概率不是概率34n 密度函数密度函数 f(x)表示表示X的所有取值的所有取值x及其频数及其频数f(x)值值(值值,频数频数)频数频数f f(x x)a ab bx x35n在在平平面面直直角角坐坐标标系系

25、中中画画出出f(x)的的图图形形,则则对对于于任任何何实实数数x1x2,P(x1X x2)是是该该曲曲线线下下从从x1 到到 x2的的面面积积f(x)xab概率是曲线下的面积概率是曲线下的面积36分布函数分布函数1.连连续续型型随随机机变变量量的的概概率率也也可可以以用用分分布布函函数数F(x)来来表示表示2.分布函数定义为分布函数定义为3.根据分布函数,根据分布函数,P(aXb)可以写为可以写为37分布函数与密度函数的图示分布函数与密度函数的图示1.密度函数曲线下的面积等于密度函数曲线下的面积等于12.分布函数是曲线下小于分布函数是曲线下小于 x0 的面积的面积f(x)xx0F(x0)38n

26、定义定义:连续型随机变量连续型随机变量X的期望值为的期望值为 n 方差为方差为 n 性质性质:D(X)=2 D(X)连续型随机变量的期望和方差连续型随机变量的期望和方差39均匀分布均匀分布1、若随机变量、若随机变量X的概率密的概率密度函数为度函数为 称称X在区间在区间a,b上上均匀均匀分布分布2、数学期望和方差分别为、数学期望和方差分别为 xf(x)ba40正态分布正态分布n1.描述连续型随机变量的最重要的分布描述连续型随机变量的最重要的分布n2.可用于近似离散型随机变量的分布可用于近似离散型随机变量的分布n例如例如:二项分布二项分布n3.经典统计推断的基础经典统计推断的基础x xf f(x

27、x)41正态分布正态分布概率密度函数概率密度函数nf(x)=随机变量随机变量X的频数的频数 n =方差方差 n =3.14159;e=2.71828nx=随机变量的取值随机变量的取值(-x 02.正态曲线的最高点在均值正态曲线的最高点在均值,它也是分布的中位数和众数它也是分布的中位数和众数3.正正态态分分布布是是一一个个分分布布族族,每每一一特特定定正正态态分分布布通通过过均均值值 的的标标准准差差 来来区区分分.决决定定曲曲线线的的高高度度,决决定定曲曲线线的的平平缓缓程程度度,即宽度即宽度4.曲曲线线f(x)相相对对于于均均值值 对对称称,尾尾端端向向两两个个方方向向无无限限延延伸伸,且且

28、理论上永远不会与横轴相交理论上永远不会与横轴相交5.正态曲线下的总面积等于正态曲线下的总面积等于16.随机变量的概率由曲线下的面积给出随机变量的概率由曲线下的面积给出43 和和 对对正态曲线的影响正态曲线的影响xf(x)CAB 1 244正态分布正态分布的概率的概率概率是曲线下的概率是曲线下的面积面积!a ab bx xf f(x x)45标准标准正态分布正态分布的重要性的重要性1、一般的正态分布取决于均值、一般的正态分布取决于均值 和标准差和标准差 2、计计算算概概率率时时,每每一一个个正正态态分分布布都都需需要要有有自自己己的的正正态概率分布表态概率分布表,这种表格是无穷多的这种表格是无穷

29、多的3、若若能能将将一一般般的的正正态态分分布布转转化化为为标标准准正正态态分分布布,计计算概率时只需要查一张表算概率时只需要查一张表46标准标准正态分布正态分布函数函数2.标准正态分布的概率密度函数标准正态分布的概率密度函数1.任任何何一一个个一一般般的的正正态态分分布布,可可通通过过下下面面的的线线性性变变换转化为标准正态分布换转化为标准正态分布3.标准正态分布的分布函数标准正态分布的分布函数47标准正态分布标准正态分布x 一般正态分布一般正态分布一般正态分布一般正态分布 Z标准正态分布标准正态分布标准正态分布标准正态分布 f(xf(x)48标准正态分布表的使用标准正态分布表的使用1.将一

30、个一般的转换为标准正态分布将一个一般的转换为标准正态分布2.计算概率时计算概率时,查标准正态概率分布表查标准正态概率分布表3.对于负的对于负的 x,可由可由 (-x)x 得到得到4.对于标准正态分布对于标准正态分布,即即XN(0,1),有有nP(a X b)b a nP(|X|a)2 a 15.对于一般正态分布,即对于一般正态分布,即XN(,),有有49标准化的例子标准化的例子 P(5 X 6.2)x =5 一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布6.2 Z标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布 00.12.0478.04785

31、0标准化的例子标准化的例子P(2.9 X 7.1)一般正态分布一般正态分布一般正态分布一般正态分布.1664.1664.1664.0832.0832.08320832标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布51正态分布(实例)正态分布(实例)【例例】设设XN(0,1),求以下概率求以下概率:(1)P(X 2);(3)P(-1X 3);(4)P(|X|2)解解:(1)P(X 2)=1-P(2 X)=1-0.9973=0.0227 (3)P(-1X 3)=P(X 3)-P(X-1)=(3)-(-1)=(3)1-(1)=0.9987-(1-0.8413)=0.8354

32、 (4)P(|X|2)=P(-2 X|2)=(2)-(-2)=(2)-1-(2)=2 (2)-1=0.954552n例例:某大学英语考试成绩服从正态分布某大学英语考试成绩服从正态分布,已知平均成已知平均成绩为绩为70分分,标准差为标准差为10分分.求该大学英语成绩在求该大学英语成绩在60-75分的概率。分的概率。53第二节第二节 样本及其分布样本及其分布n统计学研究的基本问题之一是根据样本所提供的信统计学研究的基本问题之一是根据样本所提供的信息息,对总体的分布及分布的数字特征作出统计推断对总体的分布及分布的数字特征作出统计推断.统计推断的基本内容包括两大部分统计推断的基本内容包括两大部分:一是

33、参数估计一是参数估计;二是假设检验及非参数统计二是假设检验及非参数统计.n参数估计的主要内容是研究如何通过样本提供的信参数估计的主要内容是研究如何通过样本提供的信息估计总体的数字特征息估计总体的数字特征,在统计推断中往往称总体分在统计推断中往往称总体分布的数字特征为总体参数布的数字特征为总体参数.54统计推断的过程统计推断的过程样样本本总体总体样本统计量样本统计量样本统计量样本统计量例如例如例如例如:样本均值、样本均值、样本均值、样本均值、比例、方差比例、方差比例、方差比例、方差总体均值、总体均值、比例、方差比例、方差55一、总体和样本一、总体和样本n总体总体(Population):调查研究

34、的事物或现象的全体调查研究的事物或现象的全体n个体个体(Item unit):组成总体的每个元素组成总体的每个元素n样本样本(Sample):从总体中所抽取的部分个体从总体中所抽取的部分个体n样本容量样本容量(Sample size):样本中所含个体的数量样本中所含个体的数量56二、总体参数和样本统计量二、总体参数和样本统计量n总体参数总体参数:反映总体数量特征的指标反映总体数量特征的指标.其数值是唯一的、确定的其数值是唯一的、确定的.n样本统计量:根据样本分布计算的指标样本统计量:根据样本分布计算的指标.是随机变量是随机变量.平均数平均数标准差、方差标准差、方差参数参数 、2统计量统计量S、

35、S 2 总体总体 样本样本根据样本信息估根据样本信息估计总体数字特征计总体数字特征就称为参数估计就称为参数估计57n样本统计量是随着样本不同而变化的量样本统计量是随着样本不同而变化的量,由于样本由于样本是随机样本是随机样本,所以所以,样本统计量也是一个随机变量样本统计量也是一个随机变量.例如例如:5个学生的统计学成绩分别是个学生的统计学成绩分别是80,85,90,96,98.从中任取两个学生的成绩为一样本从中任取两个学生的成绩为一样本,并据此计算并据此计算样本均值样本均值,显然显然,样本均值样本均值 随着抽取的样本不同而随着抽取的样本不同而变化变化,是一个随机变量是一个随机变量.既然是随机变量

36、就有一定的既然是随机变量就有一定的概率分布概率分布,称样本统计量的分布为抽样分布称样本统计量的分布为抽样分布.58n1、切比雪夫大数定理、切比雪夫大数定理当样本容量当样本容量n 充分大时充分大时,可以用可以用样本平均估计总体平均。样本平均估计总体平均。当试验次数当试验次数n充分大时充分大时,可以用可以用频率代替概率。频率代替概率。大数定理的意义大数定理的意义:个别现象受偶然因素影响个别现象受偶然因素影响,但对总体的大量观但对总体的大量观察后进行平均察后进行平均,就能使偶然因素的影响相互抵消就能使偶然因素的影响相互抵消,从而使总体平从而使总体平均数稳定下来均数稳定下来,反映出事物变化的一般规律反

37、映出事物变化的一般规律,这就是大数定理的这就是大数定理的意义意义.2、贝努里大数定理、贝努里大数定理三、抽样分布相关定理三、抽样分布相关定理593.样本均值的抽样分布与中心极限定理样本均值的抽样分布与中心极限定理 =50=50=50 =10=10=10X X X总体分布总体分布总体分布总体分布n n=4=4抽样分布抽样分布抽样分布抽样分布Xn n=16=16当当总总体体服服从从正正态态分分布布N(,2)时时,来来自自该该总总体体的的所所有有容容量量为为n的的样样本本的的均均值值 X也也服服从从正正态态分分布布,X的的数数学学期望为期望为,方差为方差为2/n.即即 XN(,2/n)60中心极限定

38、理中心极限定理(图示图示)当当样本容量足够样本容量足够大时大时(n 30),样样本均值的抽样分本均值的抽样分布逐渐趋于正态布逐渐趋于正态分布分布中中心心极极限限定定理理:设设从从均均值值为为,方方差差为为 2的的一一个个任任意意总总体体中中抽抽取取容容量量为为n的的样样本本,当当n充充分分大大时时,样样本本均均值值的的抽样分布近似服从均值为抽样分布近似服从均值为,方差为方差为2/n的正态分布的正态分布一个任意分一个任意分布的总体布的总体X X61第三节第三节 点估计点估计n参数估计是在未知总体分布参数的情况下参数估计是在未知总体分布参数的情况下,利用样本利用样本估计总体的参数估计总体的参数,在

39、估计过程中在估计过程中,用来推估总体参数用来推估总体参数的样本统计量称为估计量的样本统计量称为估计量.n根据估计方法的不同根据估计方法的不同,参数估计可以分为点估计和区参数估计可以分为点估计和区间估计间估计.n点估计的目的是根据样本资料求出非常接近总体参点估计的目的是根据样本资料求出非常接近总体参数的估计值数的估计值,并以此推知总体参数并以此推知总体参数.62参数估计的方法参数估计的方法极大似然估计法极大似然估计法 最小二乘法最小二乘法 顺序统计量法顺序统计量法 矩法估计矩法估计估估 计计 方方 法法点点 估估 计计区间估计区间估计 从总体中抽取一个样本从总体中抽取一个样本,根据该样本的统计量

40、对总体的未根据该样本的统计量对总体的未知参数作出一个数值点的估计称为知参数作出一个数值点的估计称为点估计点估计.如如:用样本均值作为总体未知均值估计值就是一个点估计用样本均值作为总体未知均值估计值就是一个点估计631、无偏性、无偏性n无偏性无偏性:估计量的数学期望等于被估计的总体参数估计量的数学期望等于被估计的总体参数P(X)X XC CA A 无偏无偏无偏无偏有偏有偏有偏有偏一、点估计量的评价准则一、点估计量的评价准则642、有效性有效性AB 中位数的抽样分布中位数的抽样分布均值的抽样分布均值的抽样分布X XP P(X X)有有效效性性:一一个个方方差差较较小小的的无无偏偏估估计计量量称称为

41、为一一个个更更有有效效的的估估计计量量.如如,与与其其他他估估计计量量相相比比,样样本本均均值值是是一一个个更更有效的估计量有效的估计量653、一致性、一致性n一一致致性性:随随着着样样本本容容量量的的增增大大,估估计计量量越越来来越越接接近被估计的总体参数近被估计的总体参数AB较小的样本容量较小的样本容量较大的样本容量较大的样本容量 P(X)X66第四节第四节 参参数的区间估计数的区间估计点估计给出总体参数的具体估计数值,并且有相应的点估计给出总体参数的具体估计数值,并且有相应的评价准则,即无偏性、有效性和一致性。但这个估计评价准则,即无偏性、有效性和一致性。但这个估计值误差有多大?可靠性如

42、何?这些问题点估计都不能值误差有多大?可靠性如何?这些问题点估计都不能回答。区间估计则弥补了点估计这方面的不足。回答。区间估计则弥补了点估计这方面的不足。67n1、定义、定义 所谓区间估计,就是估计总体参数的区间范围,并所谓区间估计,就是估计总体参数的区间范围,并要求给出区间估计成立的概率值。要求给出区间估计成立的概率值。一、区间估计的含义一、区间估计的含义68n【例例】麦当劳餐馆在麦当劳餐馆在7星期内抽查星期内抽查49位顾客的消费额位顾客的消费额(元元)如下如下,求在概率求在概率90%的保证下的保证下,顾客平均消费额的顾客平均消费额的估计区间。估计区间。n15,24 38,26,30,42,

43、18,30,25,26,34,44,20,35,24,26,34,48,18,28,46,19,30,36,42,24,32,45,36,21,47,26,28,31,42,45,36,24,28,27,32,36,47,53,22,24,32,46,2669n点估计点估计:麦当劳餐馆总体顾客平均消费额为麦当劳餐馆总体顾客平均消费额为32元。元。n区间估计区间估计:以以90%的概率保证的概率保证,麦当劳餐馆顾客消费麦当劳餐馆顾客消费额在额在29.8-34.2元之间。元之间。702、区间估计的具体方法、区间估计的具体方法(1)根据一个样本的观察值给出总体参数的估计范围根据一个样本的观察值给出总体

44、参数的估计范围(2)给出总体参数落在这一区间的概率给出总体参数落在这一区间的概率例如例如:总体均值落在总体均值落在5070之间,置信度为之间,置信度为 95%样本统计量样本统计量样本统计量样本统计量 (点估计点估计点估计点估计)置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限71置信区间估计置信区间估计(内容内容)已知已知 未知未知 均均 值值方方 差差比比 例例置置 信信 区区 间间72落在总体均值某一区间内的样本落在总体均值某一区间内的样本 x_XX=b b x95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1

45、.96 x x99%的样本的样本 -2.58-2.58 x x +2.58+2.58x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x731、总体未知参数落在区间内的概率、总体未知参数落在区间内的概率2、表示为、表示为(1-n 为显著性水平为显著性水平,是总体参数未在区间内的概率是总体参数未在区间内的概率 3、常用的置性水平值有、常用的置性水平值有 99%,95%,90%n相应的相应的 为为.,.5.5,.置信水平置信水平 74区间与置信水平区间与置信水平 均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布(1-)%区间包含了区间包含了

46、%的区间未包含的区间未包含 1-1-/2 2 /2 2753、区间估计的基本步骤、区间估计的基本步骤Step 1Step 2Step 376二、总体均值的置信区间二、总体均值的置信区间1.假定条件假定条件n总体服从正态分布总体服从正态分布,且总体方差(且总体方差()已知已知n如果不是正态分布,可以由正态分布来近似如果不是正态分布,可以由正态分布来近似(n 30)2.使用正态分布统计量使用正态分布统计量3.总体均值总体均值 在在1-置信水平下的置信水平下的置信区间为置信区间为(已知已知已知已知)77解解:已已知知N(,0.152),X2.14,n=9,1-=0.95,/2=1.96 总体均值总体

47、均值 的置信区间为的置信区间为我我们们可可以以95的的概概率率保保证证该该种种零零件件的的平平均长度在均长度在21.30221.498 mm之间之间【例例】某某种种零零件件长长度度服服从从正正态态分分布布,从从该该批批产产品品中中随随机机抽抽取取件件,测测得得其其平平均均长长度度为为21.4mm.已已知知总总体体标标准准差差=0.15mm,试试建建立立该该种种零零件件平平均均长长度度的的置置信信区区间间,给给定定置置信信水平为水平为0.95.78解解:已已知知 X26,=6,n=100,1-=0.95,/2=1.96我我们们可可以以95的的概概率率保保证证平平均均每每天天参参加加锻炼的时间在锻

48、炼的时间在24.82427.176 分钟之间分钟之间【例例】某某大大学学从从该该校校学学生生中中随随机机抽抽取取100人人,调调查查到到他他们们平平均均每每天天参参加加体体育育锻锻炼炼的的时时间间为为26分分钟钟。试试以以95的的置置信信水水平平估估计计该该大大学学全全体体学学生生平平均均每每天天参参加加体体育育锻锻炼炼的的时时间间(已已知知总总体体方方差差为为36分钟分钟)。79(未知未知)1.假定条件假定条件n总体方差(总体方差()未知未知n总体必须服从总体必须服从正态分布正态分布2.使用使用 t 分布统计量分布统计量3.3.总体均值总体均值总体均值总体均值 在在在在1-1-置信水平下的置

49、信水平下的置信水平下的置信水平下的置信区间为置信区间为置信区间为置信区间为80解解:已已知知N(,2),X=50,s=8,n=25,1-=0.95,t/2=2.0639。我我们们可可以以95的的概概率率保保证证总总体体均均值值在在46.6953.30 之间之间【例例】从从一一个个正正态态总总体体中中抽抽取取一一个个随随机机样样本本,n=25,其其均均值值 X=50,标标准准差差S=8.建建立立总总体体均均值值 的的95%的置信区间的置信区间.81两个样本均值之差的抽样分布两个样本均值之差的抽样分布 1 1 1 1总体总体1 2 2 2 2总体总体2抽取简单随机样抽取简单随机样样本容量样本容量

50、n1计算计算X1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算X2计算每一对样本计算每一对样本的的X1-X2所有可能样本所有可能样本的的X1-X2 抽样分布抽样分布82(、已知已知)1.假定条件假定条件两个样本是独立的随机样本两个样本是独立的随机样本两个两个总体都服从正态分布总体都服从正态分布若不是正态分布若不是正态分布,可以用正态分布来近似可以用正态分布来近似(n1 30和和n2 30)2.两两个个独独立立样样本本均均值值之之差差的的抽抽样样分分布布服服从从正正态态分分布布,其其期期望望值值为为其标准误差为其标准误差为834.4.两个总体均值之差两个总体均值之差两个总体均值之差两

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁