《第6数理统计学中的基本概念.ppt》由会员分享,可在线阅读,更多相关《第6数理统计学中的基本概念.ppt(56页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第6数理统计学中的基本概念 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望品质数据的分类整理:数量数据分组:组距分组:单变量分组:条形图、饼图直方图、折线图I.组数:II.组距:排序计数6.0 频率与直方图分组的原则:穷尽原则,互斥原则例:某商店连续40天的商品销售额(单位:万元)如下:根据上面的数据进行适当分组,编制频数分布表,并画出直方图。41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 4
2、2 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35按按销销售售额额分分组组(万元)(万元)频频数数频频率率%25-3025-3030-3530-3535-4035-4040-4540-4545-5045-504 46 615159 96 610.010.015.015.037.537.522.522.515.015.0合合计计4040100.0100.0数据分布特征的测度1、分布的集中趋势:1)众数:出现频率最高的值,用记之。算法(1)例 1,2,4,4,5,6则1,2,3,3,4,5,6,6,7 则算法(2)其中 L为众数组的
3、下限值,d为众数组的组距,f为众数组的频数,分别为众数前,后一组的频数2)中位数:中间位置的数,用记之。算法(1)例 1,2,3,4,5,6,7则1,2,3,4,5,6则算法(2)其中 L为中位数所在组的下限值;d为中位数所在组的组距。为中位数所在组以前各组的累计频数;为中位数所在组的频数;3)均值:1)简单平均2)加权平均3)调和平均4)加权调和平均5)几何平均其中例考分506060707080809090100人数 4 7 11 12 8求解:众数、中位数、均值的比较对称分布左偏分布右偏分布2、分布的离散程度:(1)(2)平均离差样本方差(3)样本标准差(4)极差例:求1,2,3,4,5的
4、均值,方差。解:数理统计学的任务数理统计学的任务 观察现象,收集资料,创建方法,分析推断。统计推断统计推断 伴随着一定概率的推测。其特点是:由“部分”推断“整体”。总体总体研究对象的全体(整体)X。个体个体每一个研究对象。有限总体有限总体无限总体无限总体1.基本概念基本概念 样本样本 由部分个体构成的集合。第第6.16.1节节 数理统计学中的基本概念数理统计学中的基本概念(X1,X2,Xn样本容量样本容量 样本中所含个体的数目n.)注注样本观测值(x1,x2,xn)。简单随机样本:简单随机样本:独立、同分布性。注意注意:样本是一组独立同总体分布的随机变量样本是一组独立同总体分布的随机变量.例如
5、例如 检验一批灯泡的质量,从中选择100只,则总体总体 这批灯泡(有限总体)个体个体 这批灯泡中的每一只 样本样本 抽取的100只灯泡(简单随机样本)样本容量样本容量 100样本值样本值 x1,x2,x100显然,可以选择“样本的函数”:作为灯泡质量的一个衡量指标.总体总体选择个体选择个体样本样本观测样本观测样本样本观察值样本观察值(数据数据)数据处理数据处理样本有关结论样本有关结论推断总体性质推断总体性质统计量统计量这样的“不含未知未知参数的样本的函数”称为统计量统计量。统计量的分布成为抽样分布抽样分布.统计的一般步骤统计的一般步骤(2)样本均值(4)修正样本方差(5)修正样本标准差(3)样
6、本k阶中心矩(1)样本k阶原点矩注注常用统计量常用统计量 未知,则(2456)不是统计量。是来自总体 例例1.1.设的s.r.s,其中统计量统计量标准一标准一:无偏性 设 为的一个点估计,若 则称 为的一个无偏估计无偏估计.注意注意 无偏估计若存在,则可能不唯一.衡量估计量好坏的标准衡量估计量好坏的标准:标准三标准三:相合性(一致性)设统计量 是未知参数 的点估计量,样本容量为n,若对任意 则称 为 的相合估计相合估计,又称一致估计一致估计.标准二标准二:有效性 设 和 是 的两个无偏估计,若 称 比 更有效有效例:例:设X1,X2,X3为来自总体X的简单随机样本,EX=,DX=2,验证下列的
7、估计量哪个更有效.解解=EX=DX/2=2/2同理所以为无偏估计量,更有效.例例:验证:是总体X方差的一个无偏估计;不是方差的无偏估计.解解=DX所以,S2为DX的无偏估计量.ES2=DX,故 所以,不是DX的无偏估计量.1.矩估计法矩估计法 将总体的各阶原点矩用相应阶的样本原点矩替代,布列方程或方程组,所得到的解,作为总体未知参数的点估计的方法.例例设总体 ,为取自该总体的样本,求未知参数 的矩估计量.解解所以参数 的矩估计量为点估计法点估计法无偏估计例例 设总体的概率密度函数为 为取自该总体的样本.求(1)未知参数 的矩估计量 ;(2)解解(1)所以参数 的矩估计量为例例:设总体XU(a,
8、b),X1,X2,Xn为取自该总体的样本,求a,b的矩估计量.解解 因为所以令得方程组解得(1)似然函数似然函数(样本的联合密度函样本的联合密度函数数)设总体X为连续型,Xf(x;1,2,m),i为待估参数(i=1,2,m),X1,X2,Xn为来自该总体的样本,则Xif(xi;1,2,m),(i=1,2,m)(X1,X2,Xn)的联合密度函数为(似然函数似然函数)2 2 最大似然估计法最大似然估计法例例 XE(),即则 设总体X为离散型离散型,P(X=x)=P(x;1,2,m),i为待估参数(i=1,2,m),X1,X2,Xn为来自该总体的s.r.s,则P(Xi=xi)=P(xi;1,2,m)
9、,(i=1,2,m)(X1,X2,Xn)的联合概率函数为(似然函数似然函数)例例 XP(),即(2)基本思想基本思想:最大似然估计就是通过样本值 来求得总体的分布参数,使得 取值为 的概率最大.若似然函数 在 取到最大值,则称 分别为 的 最大似然估计.最大似然估计最大似然估计:(3)(3)方法与步骤方法与步骤:设总体的分布密度(或概率密度)其中 是待估参数.写出似然函数(即样本的联合密度函数)写出对数似然函数(对似然函数取对数)写出似然方程 求解似然方程并写出估计量(只有一个待估参数时求只有一个待估参数时求)例例:XN(,2),求参数,2的最大似然估计.解解注意:不是无偏估计.例例:设X服从
10、0,区间上的均匀分布,参数0,求的最大似然估计.解解由题意得:无解.基本方法失效.要使L取值最大,应最小,而取此时,L取值最大,所以,最大似然估计为应用最大似然估计基本思想:L越大越大,样本观察值越可能出现样本观察值越可能出现.例例求参数求参数为p的0-1分布的最大似然估计.解解P(X=0)=1-pP(X=1)=pP(X=m)=pm(1-p)1-m(m=0,1)P(X=x)=px(1-p)1-x解得最大似然估计为注意:为p的无偏估计量.例例设总体X解解由题意得:当 时,所求最大似然估计为其中 是未知参数.是来自总体的一个容量为 n 的s.r.s,求 的最大似然估计所以另一方面故设总体XN(,2
11、),X1,X2,Xn为取自该总体X的样本.(1)四大分布及其分位数四大分布及其分位数标准正态分布及其下侧分位数标准正态分布及其下侧分位数若P(Zz1-)=1-,则称z1-为标准正态分布的下侧侧1-分位数分位数.Z1-X(x)其中定义定义设XN(,2),则 N(0,1),对任意01,正态总体下的常用统计量及其分布正态总体下的常用统计量及其分布例例:在总体XN(12,4)中抽取容量为5的样本X1,X2,X5,求下列概率:(1)因为=2(1.118)-1=0.7364解解即:n 个相互独立同标准正态分布的随机变量的平方和X的分布为自由度为 n 的 分布.性质性质X1,X2,Xn独立,XiN(0,1)
12、,(i=1,2,n),则定义定义 分布具有可加性可加性,即X,Y独立,X (m),Y (n),则分布的下侧分位数分布的下侧分位数分布的下侧分位数分布的下侧分位数Xf(x)(1)若P(X)=1-,则(1)若P(X1)=0.025,P(X2)=0.05,求1,2.解解 定义定义设 ,对于给定的(0 )=,则称 为自由度为n的 分布的下侧侧1-分位数分位数.例例 设 是取自总体N(0,4)的简单随机样本 时,解解由题意得 设随机变量 ,随机变量 Y ,且它们互相独立,则称随机变量 的分布为自由度是 n 的t 分布,记作定义定义t t分布的密度曲线分布的密度曲线:Xf(x)特点特点 关于y轴对称;随着
13、自由度的逐渐增大,密度曲线逐渐接近于标准正态密度曲线.t t分布及其下侧分位数分布及其下侧分位数服从()分布,参数为().例例:设随机变量X 和Y 相互独立且都服从正态分布 ,而 和分别是来自总体 X 和 Y 的 s.r.s,则统计量 t t9 9解解故 与 独立,所以 t分布的下侧分位数分布的下侧分位数例例:设t1-(n)为t(n)的下侧1-分位数则P(T t1-(n)=,P(T t1-(n)=.Xf(x)1-2设Xt(n),对于给定(01),若P(t(n)=1-,则称 为t(n)分布的下侧侧1-分位数分位数.(4)设随机变量 随机变量 且它们相互独立,则称随机变量 的分布为自由度是 的 F
14、 分布。(1)若P(F)=1-,则P(1/F1/)=1-F F分布的分位数分布的分位数Xf(x)设 是来自总体 的 s.r.s,分别是样本均值和修正样本方差,则 抽样分布基本定理抽样分布基本定理1)2)3)与 相互独立.4)设XN(1,12),Y N(2,22),从中分别抽取容量为n1,n2的样本,且两组样本独立,则5)当 时,记这样的“不含未知未知参数的样本的函数”称为统计量统计量。统计量的分布成为抽样分布抽样分布.小结:(2)样本均值(4)修正样本方差(5)修正样本标准差(3)样本k阶中心矩(1)样本k阶原点矩注注常用统计量常用统计量标准一标准一:无偏性 设 为的一个点估计,若 则称 为的
15、一个无偏估计无偏估计.注意注意 无偏估计若存在,则可能不唯一.衡量估计量好坏的标准衡量估计量好坏的标准:标准三标准三:相合性(一致性)设统计量 是未知参数 的点估计量,样本容量为n,若对任意 则称 为 的相合估计相合估计,又称一致估计一致估计.标准二标准二:有效性 设 和 是 的两个无偏估计,若 称 比 更有效有效1.矩估计法矩估计法 将总体的各阶原点矩用相应阶的样本原点矩替代,布列方程或方程组,所得到的解,作为总体未知参数的点估计的方法.(1)似然函数似然函数(样本的联合密度函样本的联合密度函数数)设总体X为连续型,Xf(x;1,2,m),i为待估参数(i=1,2,m),X1,X2,Xn为来
16、自该总体的样本,则Xif(xi;1,2,m),(i=1,2,m)(X1,X2,Xn)的联合密度函数为(似然函数似然函数)2 2 最大似然估计法最大似然估计法方法与步骤方法与步骤:设总体的分布密度(或概率密度)其中 是待估参数.写出似然函数(即样本的联合密度函数)写出对数似然函数(对似然函数取对数)写出似然方程 求解似然方程并写出估计量(只有一个待估参数时求只有一个待估参数时求)设 是来自总体 的 s.r.s,分别是样本均值和修正样本方差,则 抽样分布基本定理抽样分布基本定理1)2)3)与 相互独立.4)设XN(1,12),Y N(2,22),从中分别抽取容量为n1,n2的样本,且两组样本独立,则5)当 时,记