4-1统计量和抽样分布.ppt

上传人:s****8 文档编号:93085521 上传时间:2023-06-28 格式:PPT 页数:35 大小:1.82MB
返回 下载 相关 举报
4-1统计量和抽样分布.ppt_第1页
第1页 / 共35页
4-1统计量和抽样分布.ppt_第2页
第2页 / 共35页
点击查看更多>>
资源描述

《4-1统计量和抽样分布.ppt》由会员分享,可在线阅读,更多相关《4-1统计量和抽样分布.ppt(35页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、从本章起转入课程的第二部分数理统计 数理统计的特点是应用面广,分支较多.社会的发展不断向统计提出新的问题.第四章、抽样分布引言从本章节开始,我们将讲述数理统计的基本内容.理统计作为一门学科诞生于19世纪末20世纪初,有广泛应用的一个数学分支,它以概率论为基础,据试验划观察得到的数据,来研究随机现象,研究对象的客观规律性作出合理的估计和判断.大量随机现象必然呈现出它们的规律性,故理论上只要对随机现象进行足够多次观察,则研究对象的规律数是具根以便对由于必就一定能清楚地呈现出来,但实际上人们常常无法对所研究的对象的全体(或总体)进行观察,而只能抽取其中的部分(或样本)数据.数理统计的任务包括:限的数

2、据资料;究,从而对研究对象的性质、特点,作出合理的推断,此即所谓的统计推断问题,本课程主要讲述统计推断的基本内容.进行观察或试验以获得有限的怎样有效地收集、整理有怎样对所得的数据资料进行分析、研 由于学时有限,课程的的这部分内容我们只介绍理论部分,即抽样分布。至于具体的方法,学生可以自己推导并学会处理问题。4.1 统计量一、总体与样本 一个统计问题总有它明确的研究对象.1.总体研究某批灯泡的质量研究对象的全体称为总体(母体),总体中每个成员称为个体.总体 然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.这时,每个个体具有的数量指标的全体

3、就是总体.某批灯泡的寿命该批灯泡寿命的全体就是总体国产轿车每公里的耗油量国产轿车每公里耗油量的全体就是总体 由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性.从而可以把这种数量指标看作一个随机变量,因此随机变量的分布就是该数量指标在总体中的分布.这样,总体就可以用一个随机变量及其分布来描述.例如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X 表示,或用其分布函数F(x)表示.某批灯泡的寿命总体寿命X 可用一概率分布来刻划鉴于此,常用随机变量的记号或用其分布函数表示总体.如说总体X 或总体F(x).F(x)类似地,在研究某地区中学生的营养状况时,若

4、关心的数量指标是身高和体重,我们用X 和Y 分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数F(x,y)来表示.统计中,总体这个概念 的要旨是:总体就是一个 概率分布.为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本.样本中所包含的个体数目称为样本容量.2.样本的数学描述从国产轿车中抽5辆进行耗油量试验样本容量为5 样本是随机变量.抽到哪5辆是随机的容量为n 的样本可以看作n 维随机向量.样本的双重含义:泛指一次抽样结果是一个n 维向量,称为样本的一个观测值。n 维随机向量;

5、指某次具体抽样结果 但是,一旦取定一组样本,得到的是n 个具体的数,称为样本的一次观察值,简称样本观测值.2.独立性:X1,X2,Xn是相互独立的随机变量.最常用的一种抽样方法叫作“简单随机抽样”,它要求抽取的样本满足下面两点:1.代表性:X1,X2,Xn中每一个与所考察的总 2.体有相同的分布.独立,且每一个 与X 有相同的分布,则称定义1 设总体X 具有分布函数是来自总体X 的样本,若 相互为简单的随机样本,简称样本。事实上我们抽样后得到的资料都是具体的、确定的值.如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本.我们只能观察到随机变量取的值而见不到随机变

6、量.3.总体、样本、样本值的关系 简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.总体(理论分布)?样本 样本值 统计是从手中已有的资料-样本值,去推断总体的情况-总体分布F(x)的性质.总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.样本是联系二者的桥梁分组数据统计表和频率直方图通过观察或试验得到的样本值,一般是杂乱无章的,需要进行整理才能从总体上呈现其统计规律性,组数据统计表或频率直方图是两种常用的整理方法.1.分组数据表:若样本值较多时,组,分组的组数应与样本容量相适应.分组

7、太少,难以反映出分布的特征,分组太多,则由于样本取值的随机性而使分布显得杂乱.因此,分可将其分成若干则分组时,确定分组数(或组距)应以突出分布的特征并冲淡样本的随机波动性为原则.区间所含的样本值个数称为该区间的组频数.组频数与总的样本容量之比称为组(略小于)和(略大于),选取常数2.频率直方图:频率直方图能直观地表示出组频率的分布.其步骤如下:(1)频率.设 是样本 个观察值.的中求出和最的最小者大者将区间 等分成个小区间 使(一般取(2)并在左右,且小区间不包含右端点):(3)组频率及求组频数(4)在上以为高,为宽作小矩形,其面积恰为 所有小矩形合在一起就构成了频率直方图.例1 从某厂生产的

8、某种零件中随机抽取120个,测得其质量(单位:g)如下表所示,列出分组表,并作频率直方图.解 先从这120个样本值中找出最小值190,取将区间等分成11 个小区间,最大值 222,组距例1 从某厂生产的某种零件中随机抽取120个,测得其质量(单位:g)如下表所示,列出分组表,并作频率直方图.解 得到分组表及频从直方图的形状,可以粗略地认为该种零件的质量率直方图.服从正态分布,其数学期望在209附近.经验分布函数定义2 设总体的一个容量为 的样本的样本值可按大小次序排列成若则不大于的样本值的频率为因而函数与事件 在 独立重复试验中的频率相同的,称 为经验分布函数.注:样本的频率直方图可以形象地描

9、述总体的概率分布的大致形态,而经验分布函数则可以用来描述总体分布函数的大致形状.有下列结论(格里汶科,1933):对于上述经验分布函数由此结果,对于任一实数 当 充分大时,经验分布函数的任一个观察值与总体分布从而在实际中可当作来使用.这就是由样本推断总体其可行性的最基本的理论依据.只有微小的差别,函数 由 样 本 值 去 推 断 总 体 情 况,需 要 对 样 本 值进 行“加 工”,这 就 要 构 造 一 些 样 本 的 函 数,它 把 样 本 中 所 含 的(某 一 方 面)的 信 息 集 中起来.二、统计量和抽样分布1.统计量定义2 设是来自总体X 的一个样 本,是一个连续函数,如果 中

10、不包含任何未知参数,则称 是 的一个统计量。例如,设总体 服从正态分布,未知.为总体的一个样令 本,则 与均为该样本的统计量,但不是该样本的统计量,因其含有总体分布中的未知参数注:样本是维随机向量,这个随机向量的函数,用大写字母,如:等;但是,体取定一组观察值时,统计量就是一个具统计量是当样本具体的实数值,用小写字母,如:等.2.几个常见统计量样本均值样本方差它反映了总体均值的信息它反映了总体方差的信息样本标准差:修正样本方差:样本k阶原点矩样本k阶中心矩 k=1,2,它反映了总体k阶矩的信息它反映了总体k阶中心矩的信息补充说明在样本方差中中,为样本的偏差平方和,可将其变形如下:称从而例2 某

11、厂实行计件工资制,为及时了解情况,随机抽取30名工人,调查各自在一周内加工的零件数,然后按规定算出每名工人的周工资如下:(单位:元)其样本均值它反映了该厂工人周工资的一般水平.为:这便是一个容量为 30 的样本观察值,所以样本方差为进一步我们计算样本方差 及样本标准差 由于样本标准差为例3 设我们获得了如下三个样本:样本 样本 样本如果将它们画在数轴上(如图),明显可见它们的“分散”程度是不同的:样本 在这三个样本中比较密集,而样本 比较分散.这一直觉可以用样本方差来表示.这三个样本的均值都是 5,即 而样本容量易得例3 设我们获得了如下三个样本:样本 样本 样本易得同理易得由此可见 这与直觉

12、是一致的.由于样本方差的量纲与样本的量纲不一致,故常用样本标准差表示分散程度,易求出易求出同样有由于样本方差(或样本标准差)很好地反映了总体方差(或标准差)的信息,因此,当方差 未知时,常用去估计,而总体标准差 常用样本标准差 去估计.例3 设我们获得了如下三个样本:样本 样本 样本分位数设随机变量的分布函数为 对给定的实数若实数满足不等式(1)则称 为随机变量 的分布的上侧分位数.若实数满足不等式(2)则称为随机变量 的分布的双侧分位数.例如,标准正态分布的上侧分位数和双侧分位数分位数例如,标准正态分布的上侧分位数和双侧分位数分别如下图:分位数的性质:通常,直接求解分位数是很困难的,对常用的统计分布,可利用附录中给出的分布函数值表来得到分位数的值.例4 设 求标准正态分布的水平 0.05 的上侧分位数和双侧分位数.解 由于查标准正态分布函数值表可得而水平 0.05 的双侧分位数为 它满足:查标准正态分布函数值表可得今后,分别记 与 为标准正态分布的上侧 注:分位数与双侧分位数.则且 标准正态分布 的上侧分位数记为 由于标准正态概率密度为偶函数,所以若

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁