《第7章数理统计基础知识课件.ppt》由会员分享,可在线阅读,更多相关《第7章数理统计基础知识课件.ppt(53页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第七章第七章 数理统计的基础知识数理统计的基础知识7.1 总体与样本总体与样本1/4/20231 在数理统计中在数理统计中,把所研究的对象的全体把所研究的对象的全体称为称为总体总体.通常指研究对象的某项数量指通常指研究对象的某项数量指标标.因此总体可以用一个随机变量来表示因此总体可以用一个随机变量来表示.把总体的每一个基本单位称为把总体的每一个基本单位称为个体个体.总体总体例如:某工厂生产的电视机的寿命是一个例如:某工厂生产的电视机的寿命是一个总体,每一台电视机的寿命是一个个体;总体,每一台电视机的寿命是一个个体;某学校男生的身高的全体一个总体,每个某学校男生的身高的全体一个总体,每个男生的身
2、高是一个个体男生的身高是一个个体.1/4/20232样本样本 从总体从总体X中中抽出抽出若干个个体称为若干个个体称为样本样本,一般记为一般记为X1,X2,Xn,n称为称为样本容量样本容量.而对这而对这n个个体的一次具体的观察结果个个体的一次具体的观察结果x1,x2,xn是完全确定的一组数值是完全确定的一组数值,但它又随着每次抽样观察而改变但它又随着每次抽样观察而改变.x1,x2,xn称为称为样本观察值样本观察值.抽取的方法:随机抽样(独立,等可能地抽取),有限总体常做有放回抽样,无限总体则可做无放回抽样1/4/20233样本样本 则称则称X1,Xn为容量为为容量为n的的简单随机样简单随机样本本
3、,简称为简称为样本样本,X1,Xn的取值的取值 x1,xn 叫叫样本观测值样本观测值.如果满足:如果满足:(1)随机性:随机性:X1,Xn与总体与总体X同分布同分布,(2)独立性:独立性:X1,Xn 相互独立相互独立,1/4/20234样本的分布样本的分布当总体当总体X是离散型随机变量是离散型随机变量,且有分布律且有分布律P(X=x)=p(x),则样本则样本(X1,X2,Xn)有有分布分布当总体当总体X是连续型随机变量是连续型随机变量,有密度函数有密度函数f(x),则样本则样本(X1,X2,Xn)有密度有密度1/4/20235例例 某商场每天客流量某商场每天客流量X服从参数为服从参数为 的的
4、泊松分布泊松分布,求其样本求其样本(X1,X2,Xn)的联合分的联合分布律布律.解解1/4/20236总体总体、样本、样本观测值的关系样本、样本观测值的关系总体总体 样本样本 样本观测值样本观测值 理论分布理论分布 统计是从手中已有的资料统计是从手中已有的资料样本观测值样本观测值,去去推断总体的情况推断总体的情况总体分布总体分布.样本是联系两样本是联系两者的桥梁者的桥梁.总体分布决定了样本取值的概率总体分布决定了样本取值的概率规律规律,也就是样本取到样本观测值的规律也就是样本取到样本观测值的规律,因而可以用样本观测值去推断总体因而可以用样本观测值去推断总体.1/4/202377.2.1 2分布
5、分布定理定理7.1分布也为分布也为即即有密度函数有密度函数 定义定义7.2 样本样本 X1,X2,Xn来自标准正来自标准正态态总体总体N(0,1),称随机变量称随机变量 所服从所服从的分布为自由度为的分布为自由度为n的的 2 分布分布,记为,记为 1/4/20238 2 分布的密度曲线分布的密度曲线1/4/20239 2分布可加性分布可加性定理定理7.2 设设且且相互独立相互独立,则则证证:因为:因为分布可加性,有分布可加性,有相互独立相互独立,由由且且1/4/202310若若 2 2(n),则则 E(2)=n,D(2)=2n期望与方差期望与方差X1,X2,X3为为X的一个样本,求的一个样本,
6、求 例例:的分布的分布.1/4/2023117.2.2 t分布分布定义定义7.3 设随机变量设随机变量且且X与与Y相互独立,称随机变量相互独立,称随机变量所服从的分布为自由度为所服从的分布为自由度为n的的t分布分布,记为记为t分布的密度曲线关于纵坐标对称分布的密度曲线关于纵坐标对称,可以证明可以证明当当n充分大时充分大时,t分布具有渐近正态性分布具有渐近正态性.1/4/202312t分布的密度曲线分布的密度曲线1/4/202313基本性质基本性质(1)t(x,n)关于关于x=0(纵轴纵轴)对称对称(2)t(n)的极限为的极限为N(0,1)的密度函数,即的密度函数,即1/4/202314例例 X
7、1,X2,X3为为X的一个样本的一个样本,求求的分布的分布.解:解:1/4/2023151/4/2023167.2.3 F分布分布定义定义7.4 设随机变量设随机变量且且X与与Y相互独立,称随机变量相互独立,称随机变量所服从的分布为自由度为所服从的分布为自由度为(n,m)的的F分布分布,其中其中n称为第一自由度称为第一自由度,m称为第二自由度称为第二自由度.由由F分布的定义,易见当分布的定义,易见当1/4/202317例例7.4设设X1,X2,Xn为来自正态总体为来自正态总体的样本,证明:的样本,证明:证:证:1)1/4/202318由由t分布定义即得分布定义即得1/4/2023197.2.4
8、 分布的分位点分布的分位点定义定义7.5 设设X是随机变量是随机变量,0p45时时,可以可以用近似公式计算用近似公式计算P176,(7.2.12)1/4/202322例例总体总体XN(1,4),抽取样本抽取样本X1,Xn,n最大可以取多少最大可以取多少?解解:Y/4要要1/4/202323即即查查 2 分布表,有分布表,有所以使得所以使得的最大的最大n=15.1/4/202324t(n)分布的分位点分布的分位点tp(n)n45时时,用极限分用极限分布布(正态正态)近似计近似计算算即即 tp(n)up表中未列出的值用表中未列出的值用此关系来此关系来计算计算,比如比如t0.25(n)=t0.75(
9、n)1/4/202325F(n,m)分布的分位点分布的分位点Fp(n,m)P(F Fp(n,m)=p 利用它来计算利用它来计算p1/2时的值,如时的值,如1/4/2023267.3.1 统计量统计量 样本是我们进行分析和推断的起点样本是我们进行分析和推断的起点,但实际上我们并不直接用样本进行推断但实际上我们并不直接用样本进行推断,而需对样本进行而需对样本进行“加工加工”和和“提炼提炼”,将分散于样本中的信息集中起来将分散于样本中的信息集中起来,为此为此引入统计量的概念引入统计量的概念.1/4/202327定义定义7.6 若若g(X1,X2,Xn)不含任何未知参数,不含任何未知参数,则称则称g(
10、X1,X2,Xn)为一个为一个统计量统计量,而而代入样本观测值后代入样本观测值后 g(x1,x2,xn)叫叫统计量的观测值统计量的观测值.样本样本X1,X2,Xn的一个连续函数的一个连续函数g(X1,X2,Xn)称为一个称为一个样本函数样本函数,构造统计量的目的是用它来推断总体构造统计量的目的是用它来推断总体.统计量是随机变量统计量是随机变量.1/4/202328例例未知,未知,X1,X2,Xn为为X的一个样本的一个样本,均为统计量,均为统计量,不是统计量不是统计量1/4/202329常见统计量常见统计量3.样本标准差样本标准差1.样本均值样本均值2.样本方差样本方差1/4/2023304.样
11、本样本k阶原点矩阶原点矩5.样本样本k阶中心矩阶中心矩1/4/2023317.3.2 抽样分布定理抽样分布定理 定理定理7.3 样本样本X1,X2,Xn来自正态总体来自正态总体则则1/4/202332n取不同值时取不同值时样本均值样本均值 的分布的分布 的分布以总体均值的分布以总体均值 为对称中心为对称中心,但但分散程度是总体的分散程度是总体的 ,即即:以以 作作 的估计的估计,其估计精度要比用单个的其估计精度要比用单个的Xi作估计要高作估计要高n倍倍1/4/202333例例X1,X2,X10为取自正态总体为取自正态总体XN(,2)的样本的样本,如果有如果有2%的样本均值与总体均值的样本均值与
12、总体均值之差的绝对值大于之差的绝对值大于4,求求X的标准差的标准差(即即).解解:令令(样本均值样本均值),总体均值总体均值由已知,由已知,1/4/2023341/4/202335思考思考记记则则 Y?样本样本X1,X2,Xn来自正态总体来自正态总体1/4/202336抽样分布定理抽样分布定理定理定理7.4 样本样本来自正态总体来自正态总体则则自由度为自由度为n-1,因为因为 的定义中蕴涵的条件的定义中蕴涵的条件 也就是说只有也就是说只有n-1个独立的个独立的随机变量随机变量2)与与S2独立独立1/4/202337n取不同值时取不同值时 的分布的分布1/4/202338抽样分布定理抽样分布定理
13、定理定理7.5 样本样本来自正态总体来自正态总体则则证:证:1/4/202339推广推广定理定理7.6 对任何总体对任何总体X,1/4/202340例例在设计导弹发射装置时在设计导弹发射装置时,重要事情之一是重要事情之一是研究弹着点偏离目标中心的距离的方差研究弹着点偏离目标中心的距离的方差.对于一类导弹发射装置对于一类导弹发射装置,弹着点偏离目标弹着点偏离目标中心的距离服从正态分布中心的距离服从正态分布N(,2),这里这里 2=100米米2.现在进行了现在进行了25次发射试验次发射试验,用用S2记这记这25次试验中弹着点偏离目标中心的距离次试验中弹着点偏离目标中心的距离的样本方差的样本方差.求
14、求:S2超过超过50米米2的概率的概率.1/4/202341解解:查表得到查表得到:1/4/202342例例设设(X1,X2,X25)是抽取自正态总体是抽取自正态总体N(,2)的样本,如果的样本,如果(1)=12,=2;或或(2)=12,未知,但已知未知,但已知样样本方差本方差S2=2.13时时,求求样样本均本均值值小于小于12.5的概率的概率.解解(1)1/4/202343 (2)未知,而未知,而S已知,则统计量已知,则统计量1/4/202344两个正态总体的情形两个正态总体的情形定理定理7.7 若两个独立总体若两个独立总体则统计量则统计量从而从而1/4/202345两个正态总体方差相等情形
15、两个正态总体方差相等情形定理定理7.8 若两个独立总体若两个独立总体则统计量则统计量两个总体两个总体样本均值样本均值差差的分布的分布1/4/202346两个正态总体两个正态总体 定理定理7.9 若两个独立总体若两个独立总体则统计量则统计量1/4/202347例例7.7两个总体两个总体从两总体中分别抽取容量为从两总体中分别抽取容量为16,25的样本的样本(1)求两样本均值差在求两样本均值差在(8,12)内的概率;内的概率;(2)求两样本方差比不大于求两样本方差比不大于1.4的概率;的概率;解解:(1)由定理由定理7.7知知于是只须计算于是只须计算1/4/202348解解:(2)由定理由定理7.9知知从而从而例例7.71/4/202349 例例 设设 是取自正态总体是取自正态总体的样本的样本,是取自正态总体是取自正态总体的样本的样本,得到如下数据得到如下数据:求求1/4/202350解解:方差未知,故利用:方差未知,故利用t分布分布由已知数据得由已知数据得1/4/2023511/4/202352查表,查表,tp(13)=2.1604时时,p=0.9751/4/202353