《概率论与数理统计学的产生和发展.docx》由会员分享,可在线阅读,更多相关《概率论与数理统计学的产生和发展.docx(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、概率论与数理统计学的产生和发展概率论与数理统计学的产生和发展我们先从数理统计学开场,数理统计学是研究采集数据、分析数据并据以对所研究的问题作出一定的结论的科学和艺术。数理统计学所考察的数据都带有随机性偶尔性的误差。这给根据这种数据所作出的结论带来了一种不确定性,其量化要借助于概率论的概念和方法。数理统计学与概率论这两个学科的密切联络,正是基于这一点。统计学起源于采集数据的活动,小至个人的事情,大至治理一个国家,都有必要采集种种有关的数据,如在我国古代典籍中,就有不少关于户口、钱粮、兵役、地震、水灾和旱灾等等的记载。现今各国都设有统计局或相当的机构。当然,单是采集、记录数据这种活动本身并不能等同
2、于统计学这门科学的建立,需要对采集来的数据进行排比、整理,用精炼和夺目的形式表达,在这个基础上对所研究的事物进行定量或定性估计、描绘和解释,并预测其在将来可能的发展状况。例如根据人口普查或抽样调查的资料对我国人口状况进行描绘,根据适当的抽样调查结果,对受教育年限与收入的关系,对某种生活习惯与癖好如吸烟与健康的关系作定量的评估。根据以往一般时间某项或某些经济指标的变化情况,预测其在将来一般时间的走向等,做这些事情的理论与方法,才能构成一门学问数理统计学的内容。这样的统计学始于何时?恐怕难于找到一个明显的、大家公认的起点。一种遭到某些著名学者支持的观点以为,英国学者葛朗特在1662年发表的著作(关
3、于死亡公报的自然和政治观察),标志着这门学科的诞生。中世纪欧洲流行黑死病,死亡的人不少。自1604年起,伦敦教会每周发表一次“死亡公报,记录该周内死亡的人的姓名、年龄、性别、死因。以后还包括该周的出生情况根据受洗的人的名单,这基本上能够反映出生的情况。几十年来,积累了很多资料,葛朗特是第一个对这一庞大的资料加以整理和利用的人,他原是一个小店主的儿子,后来子承父业,靠自学成才。他因这一部著作被选入当年成立的英国皇家学会,反映学术界对他这一著作的成认和重视。这是一本篇幅很小的著作,主要内容为8个表,从今天的观点看,这只是一种例行的数据整理工作,但在当时则是有原创性的科研成果,其中所提出的一些概念,
4、在某种程度上能够讲沿用至今,如数据简约大量的、杂乱无章的数据,须注过整理、约化,才能突出其中所包含的信息、频率稳定性一定的事件,如“生男、“生女,在较长时期中有一个基本稳定的比率,这是进行统计性推断的基础、数据纠错、生命表反映人群中寿命分布的情况,至今还是保险与精算的基础概念等。葛朗特的方法被他同时代的政治经济学家佩蒂引进到社会经济问题的研究中,他提倡在这类问题的研究中不能尚空谈,要让实际数据讲话,他的工作总结在他逝世后于1690年出版的(政治算术)一书中。当然,也应当指出,他们的工作还停留在描绘性的阶段,不是当代意义下的数理统计学,那时,概率论尚处在萌芽的阶段,缺乏以给数理统计学的发展提供充
5、分的理论支持,但不能由此否认他们工作的重大意义,作为当代数理统计学发展的几个源头之一,他们以及后续学者在人口、社会、经济等领域的工作,十分是比利时天文学家兼统计学家凯特勒19世纪的工作,对促成当代数理统计学的诞生起了很大的作用。数理统计学的另一个重要源头来自天文和测地学中的误差分析问题。早期,测量工具的精度不高,人们希望通太多次量测获取更多的数据,以便得到对量测对象的精度更高的估计值。量测误差有随机性,合适于用概率论即统计的方法处理,远至伽利略就做过这方面的工作,他对测量误差的性态作了一般性的描绘,法国大数学家拉普拉斯曾对这个问题进行了长时间的研究,现今概率论中著名的“拉普拉斯分布,即是他在这
6、研究中的一个产物,这方面最著名且影响深远的研究成果有二:一是法国数学家兼天文家勒让德19世纪初1805在研究慧星轨道计算时发明的“最小二乘法,他在估计过巴黎的子午线长这一工作中,曾使用这个方法。现今著作中把这一方法的发明归功于高斯,但高斯使用这一方法最早见诸文字是1809年,比勒让德晚。一种如今逐步获得公认这项发明系由二人独立做出,看来使比拟妥当的。另外一个重要成果是德国大学者高斯1809年在研究行星绕日运动时提出用正态分布刻画测量误差的分布。正态分布也常称为高斯分布,其曲线是钟形,极象颐和园中玉带桥那样的形状,故有时又称为“钟形曲线,它反映了这样一种极普通的情况:天下形形色色的事物中,“两头
7、小,中间大的居多,如人的身高,太高太矮的都不多,而居于中间者占多数当然,这只是一个极粗略的描绘,要作出准确的描绘,须动用高等数学的知识。正是其数学上的特性成为其广泛应用的根据。正态分布在数理统计学中占有极重要的地位,现今仍在常用的很多统计方法,就是建立在“所研究的量具有或近似地具有正态分布这个假定的基础上,而经历和理论概率论中所谓“中心极限定理都表明这个假定的现实性,现实世界很多现象看来是杂乱无章的,如不同的人有不同的身高、体重。大批生产的产品,其质量指标各有差异。看来毫无规则,但它们在总体上服从正态分布。这一点,显示在纷乱中有一种秩序存在,提出正态分布的高斯,一生在多个领域里面有不少重大的奉
8、献,但在德国10马克的有高斯图像的钞票上,单只画出了正态曲线,以此能够看出人们对他这一奉献评价之高。20世纪以前数理统计学发展的一个重要成果,是19世纪后期由英国遗传学家兼统计学家高尔顿发起,并经当代统计学的奠基人之一K皮尔逊和其他一些英国学者所发展的统计相关与回归理论。所谓统计相关,是指一种非决定性的关系如人的身高X与体重Y,存在一种大致的关系,表如今X大小时,Y也倾向于大小,但非决定性的:由X并不能决定Y。现实生活中和各种科技领域中,这种例子很多,如受教育年限与收入的关系,经济发展水平与人口增长速度的关系等,都是属于这种性质,统计相关的理论把这种关系的程度加以量化,而统计回归则是把有统计相
9、关的变量,如上文的身高X和体重Y的关系的形式作近似的估计,称为回归方程,现实世界中的现象往往涉及诸多变量,它们之间有扑朔迷离的关系,且很多属于非决定性质,相关回归理论的发明,提供了一种通过实际观察去对这种关系进行定量研究的工具,有着重大的认识和实用意义。到20世纪初年,由于上述几个方面的发展,数理统计学已积累了很丰富的成果在此因篇幅关系,我们不能详尽无遗地逐一列举有关的重要成果,如抽样调查的理论和方法方面的进展,但是直到这时为止,我们还不能讲当代意义下的数理统计学已经建立起来,其主要标志之一就是这门学问还缺乏一个统一的理论框架,这个任务在20世纪上半叶得以完成,狭义一点讲可界定在1921193
10、8年,起主要作用的是几位大师级的人物,十分是英国的费歇尔K皮尔逊,发展统计假设检验理论的奈曼与E皮尔逊和提出统计决策函数理论的瓦尔德等。我国已故著名统计学家许宝19101970在这项工作中也卓有建树。自二战结束迄今,数理统计学有了迅猛的发展,主要有下面三方面的原因:一是数理统计学理论框架的建立以及概率论和数学工具的进展,为统计理论在面上和向纵深的发展打开了门径和提供了手段,很多在早期比拟粗略的理论和方法,在理论上得到了完善与深化,并不断提出新的研究课题;二是实用上的需要,不断提出了复杂的问题与模型,吸引了学者们的研究兴趣;三是电子计算机的发明与普及应用,一方面提供了必要的计算工具统计方法的施行往往涉及大量数据的处理与运算,用人力无法在合理的时间内完成,所以在早年,一些统计方法人们固然知道,但很少付诸实用,就由于是人力所难及。计算机的出现解决了这个问题。而赋予统计方法以现实的生命力。同时,计算机对促进统计理论研究也有助益,统计模拟是其表现之一,在成认上述成就的同时,不少统计学家也指出这一时期发展中出现的一些问题或偏向,其中主要的一点是,数理统计学理论研究中的“数学化气味