概率第七章样本分布优秀PPT.ppt

上传人:石*** 文档编号:51805345 上传时间:2022-10-20 格式:PPT 页数:51 大小:4.99MB
返回 下载 相关 举报
概率第七章样本分布优秀PPT.ppt_第1页
第1页 / 共51页
概率第七章样本分布优秀PPT.ppt_第2页
第2页 / 共51页
点击查看更多>>
资源描述

《概率第七章样本分布优秀PPT.ppt》由会员分享,可在线阅读,更多相关《概率第七章样本分布优秀PPT.ppt(51页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、概率第七章样本分布你现在浏览的是第一页,共51页本章转入课程的第二部分本章转入课程的第二部分数理统计数理统计你现在浏览的是第二页,共51页 从历史的典籍中,人们不难发现许多关从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作明人们很早就开始了统计的工作.但是当时但是当时的统计,只是对有关事实的简单记录和整理,的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些而没有在一定理论的指导下,作出超越这些数据范围之外的推断数据范围之外的推断.你现在浏览的是第三页,共51页 到了十九世纪末二

2、十世纪初,随着到了十九世纪末二十世纪初,随着近代数学近代数学和和概率论概率论的发展,才真正诞生的发展,才真正诞生了数理统计学这门学科了数理统计学这门学科.你现在浏览的是第四页,共51页 学习数理统计无须把过多时间化在学习数理统计无须把过多时间化在计计算算上,可以更有效地把时间用在上,可以更有效地把时间用在基本概基本概念、方法原理念、方法原理的正确理解上的正确理解上.国内外著名的统计软件包:国内外著名的统计软件包:SAS,SPSS,STAT等,等,都可以让你快速、简便地进行数据处理和分析都可以让你快速、简便地进行数据处理和分析,常用常用的表格处理文件的表格处理文件excel文件也有很多数据处理的

3、功能文件也有很多数据处理的功能.计算机的诞生与发展,为数据处理提供了计算机的诞生与发展,为数据处理提供了强有力的技术支持,强有力的技术支持,数理统计与计算机的结数理统计与计算机的结合合是必然的发展趋势是必然的发展趋势.你现在浏览的是第五页,共51页 第一个问题是怎样进行抽样,使抽得的第一个问题是怎样进行抽样,使抽得的样本更合理样本更合理,并有更好的代表性?这是抽样方并有更好的代表性?这是抽样方法和试验设计问题:最简单易行的是进行随法和试验设计问题:最简单易行的是进行随机抽样机抽样.第二个问题是怎样从取得的样本去推断总第二个问题是怎样从取得的样本去推断总体?这种推断具有多大的可靠性?体?这种推断

4、具有多大的可靠性?统计推断统计推断(核心核心)问题问题.你现在浏览的是第十一页,共51页统计推断统计推断统计估计统计估计统计检验统计检验参数估计参数估计非参数估计非参数估计点估计点估计区间估计区间估计参数假设检验参数假设检验非参数假设检验非参数假设检验你现在浏览的是第十二页,共51页统计方法具有统计方法具有“部分推断整体部分推断整体”的特征的特征.因为我们是从一小部分样本观察值去推断因为我们是从一小部分样本观察值去推断该全体对象(总体)情况,即由部分推断全体该全体对象(总体)情况,即由部分推断全体.这里使用的推理方法是这里使用的推理方法是“归纳推理归纳推理”:它在作:它在作出结论时,是根据所观

5、察到的大量个别情况,出结论时,是根据所观察到的大量个别情况,“归纳归纳”起来所得。起来所得。你现在浏览的是第十四页,共51页 组成总体的每一个元素即总体的每个数量指标,可以看作随机变量 X 的某个取值。研究对象全体元素组成的集合所研究的对象的某个(或某些)数量指标的全体,X 的分布函数和数字特征称为总体的分布函数和数字特征一一.总体和样本总体和样本总体总体个体个体例如:一批灯泡,全体灯泡的使用寿命就是总体,每个灯泡的使用寿命是个体.它是一个随机变量(或多维随机变量)记为X 你现在浏览的是第十六页,共51页样本 从总体中抽取的部分个体称 为总体 X 的一个容量为n 的样本观测值,或称样本的一个实

6、现用 表示样本,n 称为样本容量样本空间 样本所有可能取值的集合 你现在浏览的是第十七页,共51页 在进行抽样时,样本的选取是随机的,即总体中每个 实际中,如总体样数很大,而抽取的样本容量相对小,简单随机样本简单随机样本:进行重复抽样所得的随机样本.个体都有同等机会被选入样本。抽样通常有两种方式:一种是不重复抽样,另一种是重复抽样。如果总体单位数是无限的,抽取有限个不影响总体的分布(此时重复抽取与不重复抽取没有多大区别)。即可认为总体为无限的.(现在我们只研究简单随机样本)你现在浏览的是第十八页,共51页 简单随机样本具有以下两个性质:简单随机样本具有以下两个性质:(2)代表性代表性:即:即

7、中的每一个都与中的每一个都与(1)独立性独立性:即:即 中,各个随机变量中,各个随机变量的取值互不影响,这时,我们称的取值互不影响,这时,我们称 是相互是相互独立的随机变量独立的随机变量 总体总体 有相同的概率分布有相同的概率分布 相同分布的随机变量离散型的具有相同的概率分布律相同分布的随机变量离散型的具有相同的概率分布律连续型的具有相同的概率密度,所以期望与方差全相同连续型的具有相同的概率密度,所以期望与方差全相同你现在浏览的是第十九页,共51页样本容量为n的样本是n个相互独立且与总体有相同分布记为 的随机变量(n为样本容量),是n元随机变量 的一个样本观测值,记为 构成的一个构成的一个n元

8、随机元随机变量变量,一个容量为一个容量为n的样本的样本-(1)指一个)指一个n元随机变量。元随机变量。从这个角度来说,从这个角度来说,(2)指某一次抽样的具体数值。)指某一次抽样的具体数值。从这个角度来说,从这个角度来说,你现在浏览的是第二十页,共51页统计量定义统计量定义:为统计量,其中 不含未知参数都是统计量 3统计量统计量的函数 样本 统计统计量量一般是样本 的连续函数,由于样本 是随机变量,因而它的函数也是随机变量随机变量。如:你现在浏览的是第二十一页,共51页二样本分布函数二样本分布函数在实际统计工作中,数据的处理形式为表和图。统计表有简单表和分组表;统计图有频数(率)图,频率直方图

9、和累计频率直方图。1.分组数据的统计表和频数直方图分组数据的统计表和频数直方图简单表就是依出现的先后次序或按其数值大小列成表格,一般用处不大。如果数据较多,可分成若干组,按各组数值大小列成表格或制图例1.观察新生女婴儿的体重 (它是一个连续型随机变量)取取170号按顺序测得体重如表号按顺序测得体重如表7-1.你现在浏览的是第二十二页,共51页此表是体重此表是体重按出生顺序按出生顺序排序排序.单位为克单位为克(g)你现在浏览的是第二十三页,共51页分组数据的频数分布表分组数据的频数分布表分组时一般采取等区间分组分组时一般采取等区间分组,区间长度称为组距区间长度称为组距.制作分组数据表的步骤制作分

10、组数据表的步骤:(1)从数据找出最大值从数据找出最大值M与最小值与最小值L,并求出它们的差并求出它们的差.这里:这里:L=1800,M=4280,M-L=2480(2)决定分组的界限。一般采用包含区域()决定分组的界限。一般采用包含区域(L,M)的稍宽区域的稍宽区域(a,b)为分组的界限。为分组的界限。这里取:这里取:a=1700,b=4300,L,M a,b(3)决定组距决定组距(用用D表示表示)和组数和组数(用用k表示表示),它们之间的关系它们之间的关系为为D=(b-a)/k,取组数时常常按照一定的经验法则,取组数时常常按照一定的经验法则,一般一般来说来说,决定组数应使每组至少有个决定组数

11、应使每组至少有个4、5个数据,当数据很个数据,当数据很多时,只要可以反映分布的趋势,也可以每组很多数据。多时,只要可以反映分布的趋势,也可以每组很多数据。这里:取这里:取k=13,D=(b-a)/k=(4300-1700)/13=200你现在浏览的是第二十四页,共51页其中落到各组的数据个数称为组频数。其中落到各组的数据个数称为组频数。你现在浏览的是第二十五页,共51页例例2 将例将例1中前中前20个新生婴儿体重按大小顺序列成一简单个新生婴儿体重按大小顺序列成一简单统计表,如下表所示。统计表,如下表所示。25832组频数37503450315028502550组中值3600-39003300-

12、36003000-33002700-30002400-2700组限54321分组编号若进一步把若进一步把20个数据分成个数据分成5组(每组不包括上限)。试组(每组不包括上限)。试给出分组数据的频数分布表。给出分组数据的频数分布表。解:解:这里取:这里取:a=2400,b=3900要分要分5个组,个组,组距组距=(b-a)/5=(3900-2400)/5=300你现在浏览的是第二十六页,共51页画频率分布直方图的步骤:1.求b-a3.将数据分组5.画频率分布直方图4.列频率分布表图中小长方体的面积等于对应的频率各小长方体的面积之和等于1频率直方图和累计频率直方图频率直方图和累计频率直方图组频率:

13、是指组频数与样本容量的比值。累积频率:相应一些组频率累加起来的和。2.决定组距与组数你现在浏览的是第二十七页,共51页25832组频数37503450315028502550组中值3600-39003300-36003000-33002700-30002400-2700组限54321分组编号10090652510累积频率1025401510组频率你现在浏览的是第二十八页,共51页累积频率直方图25832组频数37503450315028502550组中值3600-39003300-36003000-33002700-30002400-2700组限54321分组编号10090652510累积频率

14、1025401510组频率你现在浏览的是第二十九页,共51页其上某区间上的长方形面积约等于同底的曲顶梯形面积其上某区间上的长方形面积约等于同底的曲顶梯形面积.(只适用于连续型随机变量只适用于连续型随机变量)故各长方形的顶点连成的曲线可近似模拟概率密度故各长方形的顶点连成的曲线可近似模拟概率密度.你现在浏览的是第三十页,共51页经验分布函数经验分布函数根据观察结果来确定根据观察结果来确定总体分布函数总体分布函数是数理统计的重要是数理统计的重要问题之一问题之一,为此我们引进为此我们引进经验分布函数经验分布函数的概念的概念.设设来自于总体来自于总体X的样本的样本的一的一组观察值组观察值,即对即对X进

15、行进行n次独立重复观察次独立重复观察,测得一组观察值测得一组观察值.对任一实数对任一实数x,用用vn(x)表示事件表示事件X x出现的频数出现的频数,即小于等于即小于等于x的观测值的观测值xi 的个数的个数.设函数设函数(i=1,2,.,n)显然显然 是随机变量是随机变量将对总体将对总体X的一次观察作为一次试验的一次观察作为一次试验,记记A=X x,则则:X的分布函数的分布函数F(x)=P(X x)=P(A)=p.你现在浏览的是第三十一页,共51页将对总体将对总体X的一次观察作为一次试验的一次观察作为一次试验,记记A=X x,则则:于是于是,对总体对总体X的的n次观察相当于次观察相当于n重贝努

16、里试验重贝努里试验,vn(x)表示事件表示事件Xx出现的频数出现的频数,即即n重贝努里试验中事件重贝努里试验中事件X x发生的次数发生的次数,故有故有vn(x)B(n,F(x)根据贝努里大数定律根据贝努里大数定律(定理5.2 在n重贝努里试验中,事件A的频率是 ,是n次试验中A发生的次数),依概率收敛于事件A发生的概率p,即对p=P(A)=F(x)vn(x)表示事件表示事件X x出现的频数出现的频数X的分布函数的分布函数F(x)=P(X x)=P(A)=p.你现在浏览的是第三十二页,共51页这表明这表明,当样本容量当样本容量n充分大时充分大时,可用总体可用总体X的函数的函数来近似表示来近似表示

17、X的分布函数的分布函数,所以称所以称 为为X的经验分布函数的经验分布函数.你现在浏览的是第三十三页,共51页设 是总体 的一个样本观察值,按大小则的图形就是累积频率的曲线,它是跳跃式上升顺序排列:的一条阶梯曲线。对任一实数对任一实数x,vn(x)表示事表示事件件X x出现的频数出现的频数,则:则:你现在浏览的是第三十四页,共51页若观察值不重复,则每一跃度为 若有重复,则按的倍数跳跃上升。你现在浏览的是第三十五页,共51页例.随机地观察总体,得到10个数据如下:3.2,2.5,-4,2.5,0,3,2,2.5,4,2将它们从小到大排列为:-402=22.5=2.5=2.533.24其样本分布函

18、数为:1 2 3 4 5 6 7 8 9 10你现在浏览的是第三十六页,共51页三样本分布的数字特征样本分布的数字特征即样本分布的某些特征的数字,经常用它估计总体的1.样本平均数样本平均数定义定义:对于样本 称 为样本平均数对某些具体的样本值 其样本平均数是 数字特征。(1)不考虑分组时不考虑分组时:你现在浏览的是第三十七页,共51页若样本的观察值已整理成分组数据(设分成 组,(加权平均值)(2)考虑分组时考虑分组时你现在浏览的是第三十八页,共51页例:例7.2中20个新生女婴儿的平均体重是?2样本方差样本方差 定定义义:对于样本称 及分别为样本方差和样本标准差由定义有,解解:25832组频数

19、37503450315028502550组中值3600-39003300-36003000-33002700-30002400-2700组限54321分组编号你现在浏览的是第三十九页,共51页在具体计算样本方差时常用此式 若数据已分成k组,和分别为第 组的组频数和组中值或 证:证:使用以下公式使用以下公式:你现在浏览的是第四十页,共51页例2中的=?=112736.84例例:解解:25832组频数37503450315028502550组中值3600-39003300-36003000-33002700-30002400-2700组限54321分组编号你现在浏览的是第四十一页,共51页3.样本

20、方差和样本平均数的简算公式样本方差和样本平均数的简算公式.设 为样本的 个观察值(1)对任意常数,记为,则(2)对任意常数 及非零常数,记,则 适当地选取常数 使变换后的 尽量简单(对分组数据也适用对分组数据也适用,可令可令你现在浏览的是第四十二页,共51页例.在例2中的分组数据,计算 及 解解:令 a=3150,c=30085038450-3-441014210-1-225832组频数组频数 37503450315028502550组中值组中值 54321分组编号分组编号 你现在浏览的是第四十三页,共51页由上表得 的计算比直接计算样本平均数和方差要简便的多 则 85038450-3-441

21、014210-1-225832组频数组频数 37503450315028502550组中值组中值 54321分组编号分组编号 你现在浏览的是第四十四页,共51页4.几个常用统计量的分布几个常用统计量的分布定理定理7.1.设 相互独立,服从正态分布,则它们的线性函数 也服从正态分布,且(1)推论推论:设 是取自正态总体 的样本,则 (2)你现在浏览的是第四十五页,共51页证明证明:(1)因 则取 由Th7.1知 的期望 方差 从而 (2)对 进行标准化,得到:这里只给出推论的证明这里只给出推论的证明:你现在浏览的是第四十六页,共51页若,它是数理统计中最重要的几个常用的统计量的分布之一.则称 服

22、从具有 个自由度的-分布,简记 回顾定理回顾定理4.4定理定理7.2.设 相互独立,均服从标准正态分布,则:分布的定义分布的定义,则 若 你现在浏览的是第四十八页,共51页定理定理7.3.设 相互独立,且 令 则 相互独立,且 推论推论:设 是取自正态总体分布 的样本,(1)(2)相互独立定理定理7.4.设 相互独立,且,则,服从 个自由度的 分布则:你现在浏览的是第四十九页,共51页注意注意:为 分布:推论推论1.设 是取自正态总体分布 的样本,分别是样本平均数和标准差则 推论推论2:设 和 是分别取自两个相互独立的正态总体及 的样本,则 分别是两个样本各自的平均数与方差.其中其中你现在浏览的是第五十页,共51页定理定理7.5.设 相互独立,且,则 其中 为第一个自由度为,第二个自由度为 的F分布.推论:推论:设 和 是分别取自两个相互其中分别是两个样本方差.及 的样本,则 独立的正态总体 你现在浏览的是第五十一页,共51页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 资格考试

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁