《应用统计第一章数理统计基本概念.ppt》由会员分享,可在线阅读,更多相关《应用统计第一章数理统计基本概念.ppt(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Ch 1 数理统计基本概念数理统计基本概念 数数理理统统计计是是如如何何有有效效地地收收集集、整整理理、分分析析带带随随机机影影响响的的数数据据,从从而而对对所所观观察察的的现现象象做做出出推推断断或或预预测测,为为决决策策提提供供依依据的一门学科。据的一门学科。在在近近一一个个世世纪纪的的发发展展中中,数数理理统统计计不不同同程程度度地地渗渗透透到到人人类类活活动动的的许许多多领领域域。人人口口调调查查、税税收收预预算算、测测量量误误差差、出出生生与与死死亡亡统统计计、保保险险业业中中赔赔款款额额和和保保险险金金的的确确定定等等,这这些些数数理理统统计计早早期期主主要要研研究究的的问问题题,
2、直直到到现现在在仍仍然然值值得得认认真真研研究究。在在近近半半个个世世纪纪以以来来,数数理理统统计计在在理理论论、方方法法、应应用用上上都都有有较较大大的的发发展展。抽抽样样调调查查、试试验验设设计计、回回归归分分析析与与回回归归诊诊断断、多多元元分分析析、时时间间序序列列分分析析、非非参参数数统统计计、统统计计决决策策函函数数、统统计计计计算算、随随机机模模拟拟、探探索索性性数数据据分分析析等等统统计计方方法法相相继继产产生生并并在在实实践践中中普普遍遍使使用用,把把以以描描述述为为主主的的统统计计发发展展到到以以推推断断为为主主的的统统计计。数数理理统统计计的的内内容容已已异异常常丰丰富富
3、,应应用用面广量大,成为当前最活跃的学科之一。面广量大,成为当前最活跃的学科之一。11.1 总体与样本总体与样本一、一、总体与个体总体与个体总总体体指指研研究究对对象象的的某某项项数数量量指指标标值值的的全全体体。组组成成总总体体的的每每个个元元素素称称为为个个体体。由由于于每每个个个个体体的的出出现现带带有有随随机机性性,即即相相应应的的数数量量指指标标值值的的出出现现带带有有随随机机性性。从从而而可可把把此此种种数数量量指指标标看看作作随随机机变变量量,我我们们用用一一个个随随机机变变量量及及其其分分布布来来描描述述总总体体。为为此此常常用用随随机机变变量量的的符符号号或或分分布的符号布的
4、符号X,Y,Z来表示总体。来表示总体。例例1.1研究某灯泡的使用寿命时研究某灯泡的使用寿命时,总体可用随机变量总体可用随机变量X来表示来表示,或用其分布函数或用其分布函数F(x)表示。表示。2二、样本二、样本为为了了推推断断总总体体分分布布及及其其各各种种特特征征,就就必必须须从从总总体体中中按按一一定定法法则则抽抽取取若若干干个个体体进进行行观观测测或或试试验验,以以获获得得有有关关总总体体的的信信息息.这这一一抽抽取取过过程程称称为为抽抽样样.所所抽抽取取的的部部分分个个体体称称为为样样本本,样样本本中中个个体体的的个个数数称称为为样样本本容容量量.例例 如如 容容 量量 为为 n的的 样
5、样 本本 可可 以以 看看 作作 是是 n维维 随随 机机 变变 量量(),其观察值为其观察值为().例例1.2研究某地区学龄前儿童发育情况研究某地区学龄前儿童发育情况,人们关心的人们关心的是其体重是其体重X和身长和身长Y这两个数量指标这两个数量指标,则此总体就可则此总体就可用二维随机变量用二维随机变量(X,Y)或其联合分布函数或其联合分布函数F(x,y)表示表示.3简单随机抽样简单随机抽样:它要求满足两点它要求满足两点:(1)代代表表性性.样样本本中中每每个个个个体体与与所所考考虑虑的的总总体体有有相相同同的分布的分布.即样本中每个个体与总体即样本中每个个体与总体X具有相同的分布具有相同的分
6、布.(2)独独立立性性.样样本本中中每每个个个个体体取取什什么么值值并并不不影影响响其其它它个体取什么值个体取什么值.即必须是相互独立的随机变量即必须是相互独立的随机变量.由由简简单单随随机机抽抽样样所所得得到到的的样样本本称称为为简简单单随随机机样样本本.假假如如总总体体的的分分布布函函数数为为F(x),则则其其简简单单随随机机样样本本的的联联合分布函数为合分布函数为4三、三、分布族分布族在概率论研究中,随机变量的分布总是假设给定在概率论研究中,随机变量的分布总是假设给定的,但在数理统计的研究中,总体的分布是未知的,但在数理统计的研究中,总体的分布是未知的,但总可以假定总体的分布是某一个分布
7、族的的,但总可以假定总体的分布是某一个分布族的成员成员.例例1.3 在在研研究究某某批批灯灯泡泡的的质质量量时时,若若关关心心的的是是其其质质量量是是否否合合格格,若若合合格格记记为为0,不不合合格格记记为为1,因因此此该该总总体体就就可可用用仅仅取取0和和1的的随随机机变变量量X来来表表示示.显显然然,这这个个总总体体的的分分布布就就是是一一个个参参数数为为p的的二二点点分分布布b(1,p),由由于于p未未知知,故故这这个个总总体体分分布布也也是是未未知知的的,但但可可以以假假定定该该总体分布是二点分布族总体分布是二点分布族 F=b(1,p);0p0.6四、从样本去认识总体四、从样本去认识总
8、体 频数频率分布表及其图示频数频率分布表及其图示例例1.4 我我们们通通常常饮饮用用的的矿矿泉泉水水有有19个个指指标标.某某市市技技术术监监督督局局一一次次抽抽查查了了58批批矿矿泉泉水水,记记录录每每一一批批矿矿泉泉水水的的每每个个指指标标是是否否合合格格,从从中中可可统统计计出出每每批批矿矿泉泉水水不不合合格格指指标标的的个个数数X.这这里里X是是一一个个离离散散型型随随机机变变量量,其其一一切切可可能能取取值值为为0,1,19.58批批矿矿泉泉水水的的指指标标不不合合格格数数构构成成了了一一个个容容量量为为58的的样样本本的的观观察察值值,每每个个可可取取0,1,19中中某某个个值值,
9、将将它它们们整整理后列成表理后列成表7表表1.1.1 58批矿泉水不合格指标数的频率、批矿泉水不合格指标数的频率、频数分布表频数分布表89(2)经验分布函数经验分布函数样样本本直直方方图图可可以以形形象象地地去去描描述述总总体体概概率率密密度度函函数数大大致致形形状状,经经验验分分布布函函数数将将可可以以用用来来描描述述总总体体分分布布函函数数的的大致形状大致形状.定义定义1.1.1 设总体设总体X的分布函数为的分布函数为F(x),从中获得从中获得的样本观察值为的样本观察值为 ,将它们从小到大排将它们从小到大排列成列成 ,令令 称称为该样本的经验分布函数为该样本的经验分布函数.10定义定义1.
10、1.1.1.2 2 经验分布函数经验分布函数用用S(x)表示样本表示样本X1,Xn中不大于中不大于x的随机变量个数。定义经的随机变量个数。定义经验分布函数验分布函数Fn(x)为为11例例1.5 写出经验分布函数写出经验分布函数某食品厂用自动装罐机生产净重量为某食品厂用自动装罐机生产净重量为345克的午餐肉克的午餐肉罐头罐头,由于随机性由于随机性,每个罐头的净重有差别每个罐头的净重有差别,现从中随现从中随机取机取10个罐头个罐头,其净重如下其净重如下:344,336,345,342,340,338,344,343,344,343,求经验分布函数求经验分布函数.121.2 统计量及其分布统计量及其
11、分布1.定定义义1.2.1 设设是是取取自自某某总总体体的的一一个个容量为容量为n的样本的样本,假如样本函数假如样本函数 中中不不含含任任何何未未知知参参数数,则则称称T为为统统计计量量.统统计计量量的的分布称为抽样分布分布称为抽样分布.2.2.常用的几个统计量常用的几个统计量设设是来自总体是来自总体X的样本的样本样本均值样本均值 样样本本均均值值是是反反映映总总体体数数学学期期望望所所在在位位置置信信息息的的一一个统计量个统计量,是总体数学期望的一个很好的估计是总体数学期望的一个很好的估计.13样本方差样本方差 样本标准差样本标准差 样样本本方方差差与与样样本本标标准准差差反反映映了了数数据
12、据取取值值分分散散与与集中的程度集中的程度,即反映了总体方差与标准差的信息即反映了总体方差与标准差的信息.样本样本k阶原点矩阶原点矩样本样本k阶中心矩阶中心矩 它它们们分分别别反反映映了了总总体体k阶阶(原原点点)矩矩与与k阶阶中中心心矩矩的的信息信息.14样本偏度样本偏度 SK反反映映了了总总体体分分布布密密度度曲曲线线的的对对称称性性信信息息.当当SK0时时,分分布布的的形形状状是是右右尾尾长长,称称为为正正偏偏的的;当当SK0时时,分布密度曲线在其峰比正态分分布密度曲线在其峰比正态分布来得陡布来得陡;当当KU0是形是形状参数状参数,0是尺度参数是尺度参数.而而(,);0,0就就是是分布族
13、分布族当当=1时的时的分布为指数分布其密度曲线如下分布为指数分布其密度曲线如下:2627分布族分布族性质性质28(5)分布族分布族定义定义1.2.6:定义在(定义在(0,1)上)上,且密度函数且密度函数表示的概率分布称为表示的概率分布称为分布记为分布记为(a,b)(a,b)或或Be(a,b),Be(a,b),其中其中a0,b0.a0,b0.而而(a,b):a0,b0(a,b):a0,b0 为为分布族分布族.分布有几个重要的特分布有几个重要的特例例.当当a=1,b=1时时,分布就是分布就是U(0,1)294、随机变量的分布的分位点、随机变量的分布的分位点1、设随机变量、设随机变量XF(x),给定
14、常数给定常数:0 1,若存在若存在 ,满足满足 ,则称则称 为分布为分布F(x)的上的上(侧侧)分位点分位点.2、设随机变量、设随机变量XN(0,1),给定常数给定常数:0 1,若存在若存在 ,满足满足 ,则称则称 为标准正态分布为标准正态分布的上侧的上侧 分位点分位点.30标准正态分布的分位点标准正态分布的分位点0.001 0.005 0.01 0.025 0.05 0.10 3.090 2.576 2.327 1.96 1.645 1.28231设设X 2(n),若对于,若对于:0 1,若存在,若存在 满满足足则称则称为为分布的上分布的上 分位点。分位点。2分布分布分位点分位点32设设T
15、Tt(n)t(n),若对,若对:0:0 1,tPTt(n)=(n)=,则称则称t t(n)(n)为为t(n)t(n)的上侧的上侧 分位点分位点.t分布分位点分布分位点33设设F F F(n1F(n1,n2)n2)对于对于 :00 1FPFF(n(n1 1,n n2 2)=)=,则称则称F F(n(n1 1,n n2 2)为为F(nF(n1 1,n n2 2)的上侧的上侧 分位点分位点F分布的分位点分布的分位点341.3 正态总体的抽样分布定理正态总体的抽样分布定理3536第一章第一章 练习题练习题习题习题1、设总体、设总体XU(0,20),取容量为取容量为10的样本,的样本,求求37 设设X1,Xn是取自是取自N(,2)的样的样本本,求样本方差求样本方差S2的期望与方差。的期望与方差。练习题练习题2解:由抽样分布定理解:由抽样分布定理再利用再利用 2分布的性质分布的性质于是,得于是,得38 设设X1,X10是取自是取自N(0,0.32)的样本的样本,求求练习题练习题3解:由解:由 2分布的定义,得分布的定义,得于是于是其中其中39