《统计学与概率论的产生与结合.doc》由会员分享,可在线阅读,更多相关《统计学与概率论的产生与结合.doc(5页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学与概率论的产生与结合 统计与概率问题的历史可以追溯到遥远的过去,从科学史的角度看,它们一开始完全是独立发展的。统计学的发展经历了计数统计统计学的阶段。而概率论却是在数学家解答赌博中出现的大量问题后产生的。18世纪中后期,统计学由于吸收了概率论的观念与方法,才使统计的水平真正提到了科学的、相对成熟和完善的程度,而概率论,由于和统计学的结合,走出了纯数学的圈子,获得了广泛的应用。一. 统计学的产生 人类的统计实践是随着计数活动而产生的,因此统计史可以追溯到远古的原始社会,距今足有4000多年的漫长岁月,但是,能使人类的统计实践上升到从理论上予以概括总结的程度,即开始成为一门系统的科学统计学,
2、却是近代的事情,距今只有三百多年的历史。例如,人们很早就注意到收集农业,战争等各种人类活动中具体的数据材料的必要性。如居民的支付能力,他们的生育能力与战争潜力。“统计”一词最通常的含义就是指收集有关某一问题的数据资料。在古印度,古埃及,古希腊都已有了各种数据资料的记载,而在中国,从公元前21世纪夏禹立国开始就已有了关于土地收入额及人口等统计数字的记录。不过,人们对记述社会生活各方面数据的兴趣在很长时期纯粹只是实践上的,对统计资料的科学兴趣大概是在17世纪才开始的.17世纪末,“统计学”这个术语在科学的某些领域开始采用,当时德国和其他欧洲国家的一些大学已开始设置统计学这门课。他们将统计学称为st
3、aatenkunde,原意是对各个国家的情况的比较叙述。日本人将之称为“国势学”,可见当时统计的研究对象主要是“国家的形势”,这时的统计学只具有记述性这个特征,与研究有实践意义的个别问题有关,所以可把此时的统计学称为“记述性统计学”,它以各国社会政治情况的文字叙述为主,具有浓厚的哲学、历史学、地理学、政治学和社会学色彩,它不重视,甚至轻视数量的分析。 国势学派为这门新兴的学科起了一个至今仍未世界公认的名词“统计学”Statistics,并提出了一些至今仍为统计学者采用的术语。如“统计数字资料”,“数字对比”,“显著事项”等,还使用对比,图标加以文字说明较清晰地反映出统计内容的一般特征,促使政府
4、逐步建立起独立的统计部门。 统计学发展的另一个支系的代表人物是英国的J.格龙特(J.Graunt,1620-1674)和W.配弟(W.Petty,1623-1687)。1662年格龙特出版了一本书分析了60年来伦敦居民死亡的原因及人口变动的关系。书中说对伦敦居民来说,男女性别比例存在着稳定的关系,大约14个男孩对13个女孩。每个婚姻平均生育4个男孩,体弱的和不幸偶然死亡的人数也具有稳定的比例,其中男人比女人死得多一点,儿童在死亡人数中占的比例最大等等。格龙特的很多崭新观点和有说服力的数字使人们目瞪口呆,他的研究和结论甚至接近发现统计学中最重要的大数定律。他首先注意到,充分大量的观察可使事物的发
5、展中非本质的偶然因素的影响互相抵消或削弱,从而显示出整个现象稳定的、一般的特征。格龙特的工作又由于他的朋友英国经济学家,数学家配弟的工作而大大发展了。他的特点是,在解决经济和国内外事物的各种问题中广泛使用数字材料。他将自己的学说称为“政治算术”,在他看来,不仅仅自然界的书是用数学语言写成的,而且社会现象最重要的方面也具有数量的特征。他开创了用数学方法研究社会现象的先河。人们称这个学派为“政治算术学派”。显然,统计学在漫长的历史时期内处于记述事物的阶段,直到政治算术学派的出现,人们才有意识地对事物数量进行分析,并摸索出了如何表述与发现事物数量的各种关系的方法。故把政治算术学派的出现作为现代统计学
6、的开端是合理的。马克思曾指出“威廉.配弟政治经济学之父,在某种程度上也是统计学的创始人”。然后,当时政治算术学派的统计核算,在很大程度上只是简单的,粗略的算术方法,对事物规律的认识,除部分是靠统计实证归纳外,大部分仍是依靠经验和常识来凑合。这一切表明,统计学发展到这个阶段迫切需要新的数学手段,才能使其获得真正的突破,而这一新的数学手段概率论正在另一个领域独立地酝酿着,发展着。 二. 概率论的产生 概率论的历史同样可以追溯到遥远的过去,当民间运用抽签来解决人们彼此间的争端,便是最早的概率论应用。人们还在实践活动中发现了许多今天被称为“概率”的经济规律。如人们记录下在某一航线上船舶的失事,发现可以
7、用一些稳定的数字加以表达。这类事实的实践意义得到了古希腊人的充分评估并反映在他们整理出的有关海洋保险系统的材料中,因而在包括不确定性因素的情境中,努力寻找行为的理性规则,使理性服从于机遇的愿望是古希腊学者醉心研究的课题之一。 不过,作为研究随机现象的概率论却是出现在15世纪后,当时欧洲进入了封建制度瓦解和资本原始积累的时期,投机商业和保险事业的赔款问题是这一时期商品发展必然产生的问题。例如当时的商业,特别是最刺激人的航海商业就是极其冒风险的. 中国清朝门户刚开放时,妄图捷足先登的英国商人运来了大批睡帽和饭叉,结果连运费都捞不回去,在商业活动中最令人担心的是,靠发行股票筹集资金是否有利可图、有多
8、大保障、怎样估计出现海难或遇到海盗等不幸事件的可能性问题,都迫切需要作出某些判断。另一方面,由于物价变化多端,商人买空卖空的投机活动越来越多,突然致富或顷刻破产则成为家常便饭,这就使商业活动形同赌博。又比如,人寿保险最初发生于中世纪的修道院,但是一个人一次付出一笔钱后就可以终生在修道院享受膳宿。不过保险者和被保险者双方都为“寿命”的长短担有一定风险。因此,保险业当时只是一种完全靠估计形势而出现的赌博性事业。随着保险业的发展,老板们发现,参加保险的人数越多自己获得的利润也就越有保障,保险业的发展渴望能有“保险”的计算工具的出现。这一切“渴望”戏剧性地表现在15世纪末赌博现象的大量出现,其最普遍的
9、形式是玩纸牌与转铜币。中国的印刷术早在14世纪就传入欧洲,还未正式印书前,印纸牌的工厂已经在利用印刷术进行生产了,到15世纪后半叶才开始印刷书籍,参加赌博的人,特别是那些专门从事以赢利为生的职业赌徒,鏖战赌场,天长地久逐渐悟出了一些道理:在少数几次赌博中无法预料到输赢的结果,若反复赌下去,就可能有所预料,这并不完全是碰巧,这无意中向学者们提供了一个比较简单而又非常典型的具有等可能性与有限性的随机模型古典模型。 从中不难看出,如果没有社会的需要,概率论恐怕至今仍然是只能在牌桌上显神通;反之,没有一系列赌博“实验”,要概率论直接产生于社会经济领域也只能是一句空话。为此英国统计学家肯德尔指出:“赌博
10、工具的存在已有几千年的历史,但概率论作为总结机遇原理的一个抽象概念乃是到16世纪才形成的”。 据资料记载,1654年巴黎一个名叫梅雷的赌徒要求当时著名的数学家帕斯卡(B.Pascal 1623-1662)解决一个赌博中产生的实际问题,即所谓“得分问题”:两个赌技相当的赌徒预先约定,每赢一局得一分,谁先赢得三分就是胜者,胜者获得全部赌资(事先由两赌徒对半出),如果当两人都没赢得三分而中断赌博时,问赌资应当如何分配才算公平?帕斯卡和当时另外两位著名数学家费玛(P.Fermae 1601-1665)和惠更斯(C.Huygens 1629-1695)多次以通信形式讨论此类问题。1657年惠更斯发表了论
11、赌博中的计算一书,该书尽管以数学语言讲述玩纸牌,掷骰子输赢的计算问题。但作者指出:“在任何场合,我认为如果读者仔细考虑这些研究对象,就会注意到,所处理的决不仅仅是赌博问题而已,其中实际包含了很有趣,很深刻的理论基础”。 .正如不少概率史学家指出得分问题和上述著名数学家的解题方法本身并不重要,重要的是他们的研究(用不同的方法得出相同的结果)把这类问题提高到了一般化的高度和总结为一种原则。同时他们的研究还吸引了更多的学者投入研究,由此把赌博的数理讨论推向了新的境地:逐步严格地建立起概率,数学模型等重要概念及运算法则,从而使这类研究从对机遇性游戏的分析发展上升为一门新的数学学科。 17世纪末,著名瑞
12、士数学家J.伯努利(J.Bernoulli 1654-1705)写出了巨著推测术,把赌博中的现象从数学上予以理论化,书中他提出了在概率论发展史上极为重要的伯努利定理,它是在概率论与数理统计学上起重要作用的“大数定律”的最初形式。伯努利定理第一次用数学公式的形式描述了事物必然性和偶然性之间的辨证关系。 1733年法国著名数学家棣莫弗(Abraham de Moivre 1667-1754)提出了中心极限定理,它的重要性不仅表现在概率统计理论上,而且还在自然科学与社会科学实践中对观察误差的处理也充分表现出来,就在同一时期,英国学者贝叶斯(Thomas Bayes 1702-1761)提出了独特的贝
13、氏统计理论。贝叶斯运用概率来解决从特殊推断一般的问题,由此开辟了概率论发展的一个新领域。他提出的“贝叶斯公式”被认为是使用主观概率的第一个公式。在传统上,统计学界所用的概率是根据反复多次实验研究而得到的,而贝叶斯则给出了根据新的信息对关于某个参数(或某个命题)的信念度进行修改或更新的方法,即已知先验概率P(Bi)和近似概率P(A|Bi),反过来求在A条件下Bi的后验概率。美国学者S.詹姆士.普雷斯在他的贝叶斯统计学中称赞贝叶斯公式,指出:“这是一个将经验知识或随机过程的理论上的理解与观察数据加以综合的过程。所以它是一个向经验学习的规范性理论”。 在应用贝叶斯定理时,困难之点在于如何得到先验概率
14、,这就免不了根据主观推断,在科学和哲学上,只要涉及到“主观推断”似乎就染上了唯心的色彩,因此贝叶斯定理在概率论史上始终成为争论的焦点。这就如当代美国哲学家乔治.桑塔耶纳在其美感一书中所说:“人对自己抱有一种成见:凡是他心灵的产物,他总认为不真实或比较不重要。只有当我们想到自己周围不以人性为转移的客观事物和规律时,我们才心满意足”。问题在于,实践中对许多事物由于所考虑的过程还没进行,因而往往无法得到概率,但实际上,如果人们根据以往的经验数据,甚至根据主观或客观上的某一要求而对得到的数据予以分析,估计出一个最优值,作为研究总体的假设概率,最后在得到新的信息的基础上对假设概率重新予以修正,这样做是无
15、可非议的。在现代的各种经济活动中情况愈来愈复杂,如果因为贝叶斯定理具有主观色彩而拒绝将它作为决策工具,那就大错特错了。可以说关于贝叶斯定理的争论给我们如何看待人类行为中的主观因素的作用提供了一个新的视角。 我们看到,当对赌徒难题的解答发展成独立的研究专题后,它就具有了高度的数理特点,对数学家来说,这一点充满了魅力。1812年法国著名数学家拉普拉斯发表了概率的分析基础,这是对概率论发展到这个时期的经典总结,他本人则被看成是经典概率论的集大成者。 三. 概率论与统计学的结合 概率论原来只是数学家们为宫廷赌徒们解决赌博难题时形成的数学专题。由于在起因与发展上,概率论与统计学完全不同,因此它们之间长期
16、毫不相干。直到18世纪之前,尽管当时经典概率论发展很快,也受到社会上的重视,当它仍以如何分析输赢作为研究中心。虽然当时的许多学者试图用概率论解决统计学上的问题,但效果不大,二者之间,从相识到结合进展缓慢,其原因之一在于概率论本身还不太成熟。 随着牛顿,莱布尼兹确立数学分析之后,经过18世纪伯努利家族、拉普拉斯、高斯等学者的不懈努力,数学分析成为一门应用相当广泛的数学分支。拉普拉斯的概率的分析基础就是概率论与数学分析相结合的典范。由于赋予了概率论的严密的数学基础,使概率论发生了质的飞跃,开始具备了与统计学有效结合的条件。 原先经典概率论只能处理诸如赌博中有限事物的组合,引入数学分析后,概率论就可
17、以处理无限多个事件发生的情况。社会生产中的问题要比赌博问题复杂得多,而且很多是连续型而不是离散型的,所以概率论能推开赌桌去解决实际的统计问题,这不能不归功于数学分析的功劳。至于概率论本身理论的发展,也只有运用成熟的数学分析理论才能建立比较严格的大数定律、中心极限定理、正态分布理论、数学期望、样本误差等法则与概念,从而逐步解决统计研究中数据资料的合理推算问题。另一方面,概率论的产生从一开始就注重如何从经验上计算取胜的范围,因此它的问世是以方法论的面貌出现的,这也是日后它能被统计学吸收的重要原因。 统计学发展史上,最初卓有成效地把经典概率论引进统计学领域的当推拉普拉斯。由于他本人是概率论学者,又受
18、到当时拿破仑皇帝的器重,做了当时法国的内政部长。这种国家管理者、数学家、概率统计学者的多重身份给拉普拉斯在概率论与统计学相结合方面创造了良好的条件。他多次将概率方法应用到各种不同的科学与实践问题上,如人口统计、观测误差、归纳问题、天文学、数据的可靠性评价及社会生活的各种场合。他指出“概率的数理公式可以当作以大量观察而又易有错误为基础的各种科学所需要的辅助科学”。由于他一生不懈的努力,为统计学的科学化作出了许多开创性的研究,并加以运用。当代美国学者斯廷莱称赞拉普拉斯在统计模型、方法和技术上有“爆炸性”的发展。 另一位在概率论与统计学的结合上作出杰出贡献的是德国大数学家高斯。他的主要成就是对误差理
19、论的研究. 直到19世纪初,人们才普遍认识到,观察结果正确与否,既与观察对象有关,又与观察者本人有关。如何从一大堆各不相同的测量结果中把一个最可靠的量确定下来呢?误差问题实际上成为高斯那个时代统计学继续发展面临的最大难题之一。例如,政治算术学派企图从数量的分析上获得对社会经济关系的认识。但若不能确定所获得数据的误差程度,所得的认识就不能认为是科学的。人们在长期测量实践中发现,某一区间的数据所占比重特别大,而有些区间所占的比重比较小,久而久之,发现误差取值有一定规律,高斯以他丰富的天文观察和在18211825年间大地观测的经验发现观察均值X与真正值u的误差变异,大量地服从现代人们所熟悉的正态分布
20、。 高斯发现测量得到的均值X毕竟不一定就等于真正值u,这仍是个随机变量,会随着不同的测量情况而异。于是他指出,只要找到测量误差(I=1,2,n)的合适的概率分布,使X=u,的可能性为最大,高斯利用最大似然估计法及其他数学知识,将误差问题与概率分布理论结合起来,提出了“误差分布曲线”,后人为了纪念他,称此分布曲线为“高斯分布曲线”。使用最小二乘法和高斯分布,高斯最终建立了误差理论,这成为概率论与统计学结合的重要一步。 19世纪初,由于生产迅猛发展,科学技术获得巨大进步,统计事业开始走向昌盛。比利时学者凯特勒(A.Quetlee 1796-1874)是这一时期统计学发展中的英雄。科学史上将凯特勒的
21、工作看作是现代统计学的起点,正是由于他的努力,才可以说概率论与统计学的结合初步完成了。从此,一个新的时代开始了,这是一个“统计狂热时代”也是“凯特勒的时代”。 凯特勒具有很高的数学造诣,特别是在概率论领域,他作为拉普拉斯的学生,泊松(S.Poisson 1781-1840)的朋友,立志将自然科学的方法移植到社会科学领域. 这位在法国唯物主义哲学传统中受过良好教育的学者毫不怀疑,人是自然界的创造物,应当遵从自然界的规律。如果人出生、生长、死亡都依据一定的规律,为何迄今没有得到很好的研究呢?凯特勒认为,规律躲避着我们的理智,因为我们观察到的只是单个人的行为,大量偶然性、个体特征使我们无法研究下去。
22、如果人总是从一滴水中观察光线的反射,那么就很难理解美丽的彩虹现象。为了了解那些一般的规律,应当收集大量的观察材料,以便有可能排除那些纯粹偶然的东西。凯特勒仔细研究了当时法国、英国和比利时的司法刑事机关报告汇编,并在1829年和1831年分别发表了两篇研究报告,引起了当时社会的轰动. 他在报告中指出,每年犯罪的次数大体不变,各种类型的犯罪也有惊人的重复性。监狱、铁链和断头台的命运对人来说就像国家收入一样,可以以某种概率被预先决定。我们甚至可以预先就计算出来,下一年会有多少人将用和自己一样的血弄脏自己的手、有多少人将是伪造者、多少人是投毒者,这一切就像能够确定出生与死亡数量一样。 凯特勒还分析了人
23、的“自由意志”的其他表现,如结婚、自杀等,也得到了同样的结果。他在人与他的能力发展一书中写道:“想想看,有什么能比结婚更个体化的行动呢?多少寻觅、多少思考、多少巨大的偶然性发生在结婚之前,结果怎样呢?你的行为不是任意的,在它们的背后隐藏着必然性构成这一行为完全确定的原因。” 能否像物理学中建立严格的规律一样,在社会科学领域也建立起同样的规律呢?凯特勒认为这在原则上是可能的,但他本人并没有奢望去发现它,他给自己提出的任务就是构造一个内容广泛的理论草图,他的社会物理学一书就体现了他对这一理论草图的设想。 凯特勒认为控制人们行为的规律可以分为两类:有自然界所制约的自然原因和人类所固有的“扰动”的原因
24、。这些规律只能通过人的大量行为才能表现出来. 也就是说,社会领域中的规律制约着的是“取中值”的人,为此社会统计学者应当找到反映各种社会属性的相应平均值,研究在现实中偏离这些平均值的规律。尽管凯特勒在各个科学领域引进和发展概率统计的思想和方法的同时,也将一切染上了机械论的色彩。但卡尔.马克思仍高度评价了凯特勒的工作,认为“在过去的那个时代,他有很大的贡献”。凯特勒在科学的发展中起着正面的作用,他开创了对各类社会现象和它们之间的因果关系进行系统的实验研究,同时他积极地组织了统计学方面的首次国际会议,促使科学和实践在统计科学中能和谐地发展,相互促进。我国的统计活动尽管有悠久的历史,但正如我国学者杨坚
25、白在统计理论基本问题一书中指出:“我国有统计之实,却无统计之名,直到清朝末年才开始学习资产阶级统计学进行统计。”1906年清政府建立了统计局,从方法上讲,长期以来,甚至新中国成立很长一段时间,使用的还是一些“古已有之”的统计方法。统计工作现代化是伴随改革开放的事业才开始进行的。 自凯特勒之后,统计学发展开始变得复杂而丰富起来,由于社会领域与自然领域统计学应用的对象不同,统计学的发展也呈现出不同的方法和特色。前者称为社会统计学派,后者则为数理统计学派。由于现代统计学的核心不外乎以概率论为技术手段,研究如何合理地对实际数字资料加以描述和推断,所以如何使概率论日趋完善和不断发展始终是吸引当代数学家和统计学家的重要课题。