《概率第七章样本分布下优秀课件.ppt》由会员分享,可在线阅读,更多相关《概率第七章样本分布下优秀课件.ppt(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、概率第七章样本分布下第1页,本讲稿共37页 组成总体的每一个元素即总体的每个数量指标,可以看作随机变量 X 的某个取值。研究对象全体元素组成的集合所研究的对象的某个(或某些)数量指标的全体,X 的分布函数和数字特征称为总体的分布函数和数字特征一一.总体和样本总体和样本总体总体个体个体例如:一批灯泡,全体灯泡的使用寿命就是总体,每个灯泡的使用寿命是个体.它是一个随机变量(或多维随机变量)记为X 第2页,本讲稿共37页样本 从总体中抽取的部分个体称 为总体 X 的一个容量为n 的样本观测值,或称样本的一个实现用 表示样本,n 称为样本容量样本空间 样本所有可能取值的集合 第3页,本讲稿共37页 在
2、进行抽样时,样本的选取是随机的,即总体中每个 实际中,如总体样数很大,而抽取的样本容量相对小,简单随机样本简单随机样本:进行重复抽样所得的随机样本.个体都有同等机会被选入样本。抽样通常有两种方式:一种是不重复抽样,另一种是重复抽样。如果总体单位数是无限的,抽取有限个不影响总体的分布(此时重复抽取与不重复抽取没有多大区别)。即可认为总体为无限的.(现在我们只研究简单随机样本)第4页,本讲稿共37页 简单随机样本具有以下两个性质:简单随机样本具有以下两个性质:(2)代表性代表性:即:即 中的每一个都与中的每一个都与(1)独立性独立性:即:即 中,各个随机变量中,各个随机变量的取值互不影响,这时,我
3、们称的取值互不影响,这时,我们称 是相互是相互独立的随机变量独立的随机变量 总体总体 有相同的概率分布有相同的概率分布 相同分布的随机变量离散型的具有相同的概率分布律相同分布的随机变量离散型的具有相同的概率分布律连续型的具有相同的概率密度,所以期望与方差全相同连续型的具有相同的概率密度,所以期望与方差全相同第5页,本讲稿共37页样本容量为n的样本是n个相互独立且与总体有相同分布记为 的随机变量(n为样本容量),是n元随机变量 的一个样本观测值,记为 构成的一个构成的一个n元随机元随机变量变量,一个容量为一个容量为n的样本的样本-(1)指一个)指一个n元随机变量。元随机变量。从这个角度来说,从这
4、个角度来说,(2)指某一次抽样的具体数值。)指某一次抽样的具体数值。从这个角度来说,从这个角度来说,第6页,本讲稿共37页统计量定义统计量定义:为统计量,其中 不含未知参数都是统计量 3统计量统计量的函数 样本 统计统计量量一般是样本 的连续函数,由于样本 是随机变量,因而它的函数也是随机变量随机变量。如:第7页,本讲稿共37页二样本分布函数二样本分布函数在实际统计工作中,数据的处理形式为表和图。统计表有简单表和分组表;统计图有频数(率)图,频率直方图和累计频率直方图。1.分组数据的统计表和频数直方图分组数据的统计表和频数直方图简单表就是依出现的先后次序或按其数值大小列成表格,一般用处不大。如
5、果数据较多,可分成若干组,按各组数值大小列成表格或制图例1.观察新生女婴儿的体重 (它是一个连续型随机变量)取取170号按顺序测得体重如表号按顺序测得体重如表7-1.第8页,本讲稿共37页此表是体重此表是体重按出生顺序按出生顺序排序排序.单位为克单位为克(g)第9页,本讲稿共37页分组数据的频数分布表分组数据的频数分布表分组时一般采取等区间分组分组时一般采取等区间分组,区间长度称为组距区间长度称为组距.制作分组数据表的步骤制作分组数据表的步骤:(1)从数据找出最大值从数据找出最大值M与最小值与最小值L,并求出它们的差并求出它们的差.这里:这里:L=1800,M=4280,M-L=2480(2)
6、决定分组的界限。一般采用包含区域()决定分组的界限。一般采用包含区域(L,M)的稍宽区域的稍宽区域(a,b)为分组的界限。为分组的界限。这里取:这里取:a=1700,b=4300,L,M a,b(3)决定组距决定组距(用用D表示表示)和组数和组数(用用k表示表示),它们之间的关系它们之间的关系为为D=(b-a)/k,取组数时常常按照一定的经验法则,取组数时常常按照一定的经验法则,一般一般来说来说,决定组数应使每组至少有个决定组数应使每组至少有个4、5个数据,当数据很个数据,当数据很多时,只要可以反映分布的趋势,也可以每组很多数据。多时,只要可以反映分布的趋势,也可以每组很多数据。这里:取这里:
7、取k=13,D=(b-a)/k=(4300-1700)/13=200第10页,本讲稿共37页其中落到各组的数据个数称为组频数。其中落到各组的数据个数称为组频数。第11页,本讲稿共37页例例2 将例将例1中前中前20个新生婴儿体重按大小顺序列成一简单个新生婴儿体重按大小顺序列成一简单统计表,如下表所示。统计表,如下表所示。25832组频数37503450315028502550组中值3600-39003300-36003000-33002700-30002400-2700组限54321分组编号若进一步把若进一步把20个数据分成个数据分成5组(每组不包括上限)。试组(每组不包括上限)。试给出分组数
8、据的频数分布表。给出分组数据的频数分布表。解:解:这里取:这里取:a=2400,b=3900要分要分5个组,个组,组距组距=(b-a)/5=(3900-2400)/5=300第12页,本讲稿共37页画频率分布直方图的步骤:1.求b-a3.将数据分组5.画频率分布直方图4.列频率分布表图中小长方体的面积等于对应的频率各小长方体的面积之和等于1频率直方图和累计频率直方图组频率:是指组频数与样本容量的比值。累积频率:相应一些组频率累加起来的和。2.决定组距与组数第13页,本讲稿共37页25832组频数37503450315028502550组中值3600-39003300-36003000-3300
9、2700-30002400-2700组限54321分组编号10090652510累积频率1025401510组频率第14页,本讲稿共37页累积频率直方图25832组频数37503450315028502550组中值3600-39003300-36003000-33002700-30002400-2700组限54321分组编号10090652510累积频率1025401510组频率第15页,本讲稿共37页其上某区间上的长方形面积约等于同底的曲顶梯形面积其上某区间上的长方形面积约等于同底的曲顶梯形面积.(只适用于连续型随机变量只适用于连续型随机变量)故各长方形的顶点连成的曲线可近似模拟概率密度故各
10、长方形的顶点连成的曲线可近似模拟概率密度.第16页,本讲稿共37页经验分布函数经验分布函数根据观察结果来确定根据观察结果来确定总体分布函数总体分布函数是数理统计的重要是数理统计的重要问题之一问题之一,为此我们引进为此我们引进经验分布函数经验分布函数的概念的概念.设设来自于总体来自于总体X的样本的样本的一的一组观察值组观察值,即对即对X进行进行n次独立重复观察次独立重复观察,测得一组观察值测得一组观察值.对任一实数对任一实数x,用用vn(x)表示事件表示事件X x出现的频数出现的频数,即小于等于即小于等于x的观测值的观测值xi 的个数的个数.设函数设函数(i=1,2,.,n)显然显然 是随机变量
11、是随机变量将对总体将对总体X的一次观察作为一次试验的一次观察作为一次试验,记记A=X x,则则:X的分布函数的分布函数F(x)=P(X x)=P(A)=p.第17页,本讲稿共37页将对总体将对总体X的一次观察作为一次试验的一次观察作为一次试验,记记A=X x,则则:于是于是,对总体对总体X的的n次观察相当于次观察相当于n重贝努里试验重贝努里试验,vn(x)表示事件表示事件Xx出现的频数出现的频数,即即n重贝努里试验中事件重贝努里试验中事件X x发生的次数发生的次数,故有故有vn(x)B(n,F(x)根据贝努里大数定律根据贝努里大数定律(定理5.2 在n重贝努里试验中,事件A的频率是 ,是n次试
12、验中A发生的次数),依概率收敛于事件A发生的概率p,即对p=P(A)=F(x)vn(x)表示事件表示事件X x出现的频数出现的频数X的分布函数的分布函数F(x)=P(X x)=P(A)=p.第18页,本讲稿共37页这表明这表明,当样本容量当样本容量n充分大时充分大时,可用总体可用总体X的函数的函数来近似表示来近似表示X的分布函数的分布函数,所以称所以称 为为X的经验分布函数的经验分布函数.第19页,本讲稿共37页设 是总体 的一个样本观察值,按大小则的图形就是累积频率的曲线,它是跳跃式上升顺序排列:的一条阶梯曲线。对任一实数对任一实数x,vn(x)表示事表示事件件X x出现的频数出现的频数,则
13、:则:第20页,本讲稿共37页若观察值不重复,则每一跃度为 若有重复,则按的倍数跳跃上升。第21页,本讲稿共37页例.随机地观察总体,得到10个数据如下:3.2,2.5,-4,2.5,0,3,2,2.5,4,2将它们从小到大排列为:-402=22.5=2.5=2.533.24其样本分布函数为:1 2 3 4 5 6 7 8 9 10第22页,本讲稿共37页三样本分布的数字特征样本分布的数字特征即样本分布的某些特征的数字,经常用它估计总体的1.样本平均数样本平均数定义定义:对于样本 称 为样本平均数对某些具体的样本值 其样本平均数是 数字特征。(1)不考虑分组时不考虑分组时:第23页,本讲稿共3
14、7页若样本的观察值已整理成分组数据(设分成 组,(加权平均值)(2)考虑分组时考虑分组时第24页,本讲稿共37页例:例7.2中20个新生女婴儿的平均体重是?2样本方差样本方差 定定义义:对于样本称 及分别为样本方差和样本标准差由定义有,解解:25832组频数37503450315028502550组中值3600-39003300-36003000-33002700-30002400-2700组限54321分组编号第25页,本讲稿共37页在具体计算样本方差时常用此式 若数据已分成k组,和分别为第 组的组频数和组中值或 证:证:使用以下公式使用以下公式:第26页,本讲稿共37页例2中的=?=112
15、736.84例例:解解:25832组频数37503450315028502550组中值3600-39003300-36003000-33002700-30002400-2700组限54321分组编号第27页,本讲稿共37页3.样本方差和样本平均数的简算公式样本方差和样本平均数的简算公式.设 为样本的 个观察值(1)对任意常数,记为,则(2)对任意常数 及非零常数,记,则 适当地选取常数 使变换后的 尽量简单(对分组数据也适用对分组数据也适用,可令可令第28页,本讲稿共37页例.在例2中的分组数据,计算 及 解解:令 a=3150,c=30085038450-3-441014210-1-2258
16、32组频数组频数 37503450315028502550组中值组中值 54321分组编号分组编号 第29页,本讲稿共37页由上表得 的计算比直接计算样本平均数和方差要简便的多 则 85038450-3-441014210-1-225832组频数组频数 37503450315028502550组中值组中值 54321分组编号分组编号 第30页,本讲稿共37页4.几个常用统计量的分布几个常用统计量的分布定理定理7.1.设 相互独立,服从正态分布,则它们的线性函数 也服从正态分布,且(1)推论推论:设 是取自正态总体 的样本,则 (2)第31页,本讲稿共37页证明证明:(1)因 则取 由Th7.1
17、知 的期望 方差 从而 (2)对 进行标准化,得到:这里只给出推论的证明这里只给出推论的证明:第32页,本讲稿共37页若,它是数理统计中最重要的几个常用的统计量的分布之一.则称 服从具有 个自由度的-分布,简记 回顾定理回顾定理4.4定理定理7.2.设 相互独立,均服从标准正态分布,则:分布的定义分布的定义,则 若 第34页,本讲稿共37页定理定理7.3.设 相互独立,且 令 则 相互独立,且 推论推论:设 是取自正态总体分布 的样本,(1)(2)相互独立定理定理7.4.设 相互独立,且,则,服从 个自由度的 分布则:第35页,本讲稿共37页注意注意:为 分布:推论推论1.设 是取自正态总体分布 的样本,分别是样本平均数和标准差则 推论推论2:设 和 是分别取自两个相互独立的正态总体及 的样本,则 分别是两个样本各自的平均数与方差.其中其中第36页,本讲稿共37页定理定理7.5.设 相互独立,且,则 其中 为第一个自由度为,第二个自由度为 的F分布.推论:推论:设 和 是分别取自两个相互其中分别是两个样本方差.及 的样本,则 独立的正态总体 第37页,本讲稿共37页