《数理统计的基本概念.docx》由会员分享,可在线阅读,更多相关《数理统计的基本概念.docx(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数理统计的基本概念数理统计的基本概念 本文关键词:数理,基本概念,统计数理统计的基本概念 本文简介:第六章数理统计学的基本概念引例:某公司要选购一批产品,每件产品不是合格品就是不合格品,但该批产品总有一个不合格品率p,由此,若从该产品中随机抽取一件,用X表示这一件产品的不合格数,不难看出X听从一个二点分布b(1,p),但分布中的参数p却是不知道的。明显,p的大小确定了该批产品的质量,它干脆影响选购数理统计的基本概念 本文内容:第六章数理统计学的基本概念引例:某公司要选购一批产品,每件产品不是合格品就是不合格品,但该批产品总有一个不合格品率p,由此,若从该产品中随机抽取一件,用X表示这一件产品的
2、不合格数,不难看出X听从一个二点分布b(1,p),但分布中的参数p却是不知道的。明显,p的大小确定了该批产品的质量,它干脆影响选购行为的经济效益。因此,人们会对p提出一些问题,比如:(1)p的大小如何;(2)p也许落在什么范围内;(3)能否认为p满意设定的要求(如p0.05)。引例中探讨的问题属于统计学的范畴。统计学是一门应用性特别强的学科,它的历史已有三一百零一多年,即使从皮尔逊(K.Pearson,1857-1936)和费舍尔(R.A.Fisher,1890-1962)的工作算起,统计学的发展也已有一一百零一零一多年的历史,并且取得了良好的社会和经济效益。一般认为,统计学是一门探讨如何运用
3、有效的方法去收集、整理和分析带有随机性影响的数据的学科。也就是说,统计学是干脆从随机现象的视察值去探讨它的客观规律。经过多年的探讨和发展,统计学已深化到了多个学科中,可以说,凡是一个实际问题涉及一批数据,我们都应当利用统计学方法去分析它、解决它。统计学是唯一的对数据进行整理和分析的学科。随着统计学的发展和完善,其探讨内容也特别丰富,且形成了多个学科分支,如抽样调查、试验设计、回来分析、多元统计分析、时间序列分析、非参数统计、贝叶斯(Bayes)方法,等等。6.1总体与样本6.1.1总体与个体总体(母体):探讨对象的全体所构成的一个集合;个体:构成总体的每一个成员;对多数实际问题,总体中的个体是
4、一些实在的人或物。比如,我们要探讨本校学生的身高状况,则本校的全体学生构成问题的总体,而每一个学生即是一个个体。事实上,每个学生有很多特征:性别、年龄、身高、体重、民族、籍贯,等等,而在该问题中,我们关切的只是本校学生的身高如何,对其他的特征暂不予考虑。这样,每个学生(个体)所具有的数量指标值身高就是个体,而将全部身高全体看成总体。这样一来,若抛开实际背景,总体就是一堆数,这堆数有大有小,有的出现的机会多,有的出现机会小,因此用一个概率分布去描述和归纳总体是恰当的,从这个意义看,总体就是一个分布,而其数量指标就是听从这个分布的随机变量。例6.1.1磁带的一个质量指标是一卷磁带(20m)上的伤痕
5、数。每卷磁带都有一个伤痕数,全部磁带的伤痕数构成一个总体。这个总体中相当一部分是0(无伤痕,合格品),但也有1,2,3等,但多于8个的伤痕数特别少见。探讨表明,一卷磁带上的伤痕数X听从泊松分布P(),但分布中的参数却是不知道的。明显,的大小确定了一批产品的质量,它干脆影响生产方的经济效益。本例中总体分布的类型是明确的,是泊松分布,但总体中还含有未知参数,故总体还不是一个特定的泊松分布。要确定最终的总体分布,就是要确定,这是统计的任务。在有些问题中,我们对每一探讨对象可能要观测两个甚至更多个指标,此时可用多维随机变量及其联合分布来描述总体,这种总体称为多维总体。依据总体中所包含个体的个数,将总体
6、分为有限总体和无限总体。6.1.2样本为了了解总体的分布,我们从总体X中随机地抽取n个个体,记为X1,X2,Xn,并记其指标值为x1,x2,xn,或称为样本值,则X1,X2,Xn称为总体的一个样本,n称为样本容量,或简称为样本量,样本中的个体称为样品。我们首先指出,样本具有所谓的二重性:一方面,由于样本是从总体中随机抽取的,抽取前无法预知它们的数值,因此,样本是一个随机变量,用大写字母X1,X2,Xn表示;另一方面,样本在抽取以后经观测就有确定的观测值,因此,样本又是一组数值。此时,用小写字母x1,x2,xn表示也是恰当的。但由于抽样是随机的,所以样本值x1,x2,xn也是随机的。例6.1.2
7、啤酒厂生产的瓶装啤酒规定净含量为500g,由于随机性,事实上不行能使得全部的啤酒净含量均为500g。现从某厂生产的啤酒中随机抽取10瓶测定其净含量,得到如下结果(单位:g):502410149349250150041014964944101这是一个容量为10的样本的观测值,对应的总体为该厂生产的瓶装啤酒的净含量。从总体中抽取样本可以有不同的抽法,为了能由样本对总体作出较牢靠的推断,就希望样本能很好地代表总体。这就须要对抽样方法提出一些要求,最常用的“简洁随机抽样”有如下两个要求:(1)样本具有随机性,即要求总体中每一个个体都有同等机会被选入样本,这便意味着每个样品Xi与总体X有相同的分布。(2
8、)样本要有独立性,即要求样品中每一样品的取值不影响其他样品的取值,这便意味着X1,X2,Xn相互独立。用简洁随机抽样方法得到的样本称为简洁随机样本,也简称样本。于是,样本X1,X2,Xn可以看成是相互独立的具有同一分布的随机变量,又称为i.i.d样本,其共同分布即为总体分布。易知,对有限总体而言,采纳放回抽样就能得到简洁随机样本,不放回抽样不能保证X1,X2,Xn的独立性,但放回抽样运用起来不便利,当个体的总数N要比得到的样本容量n大得多时,在实际中可将不放回抽样近似地当作放回抽样来处理;但对无限总体而言,因抽取一个个体不影响它的分布,所以不放回抽样也得到简洁随机样本。除非特殊说明,我们所说的
9、样本一般皆为简洁随机样本。6.1.3样本的概率分布设总体X具有分布函数F(x),X1,X2,Xn为取自该总体的容量为n的样本,则样本联合分布函数为F(x1,x2,xn)=i=1nF(xi).特殊地,若总体是连续型随机变量,其概率密度函数为f(x),则样本(X1,X2,Xn)的联合概率密度函数为f(x1,x2,xn)=i=1nf(xi).若总体是离散型随机变量,其分布律为PX=xi=pi,i=1,2,3,,则(X1,X2,Xn)的分布律为PX1=x1,X2=x2,Xn=xn=i=1nPXi=xi.6.2统计量第7页 共7页第 7 页 共 7 页第 7 页 共 7 页第 7 页 共 7 页第 7 页 共 7 页第 7 页 共 7 页第 7 页 共 7 页第 7 页 共 7 页第 7 页 共 7 页第 7 页 共 7 页第 7 页 共 7 页