《概率论和数理统计起源(共12页).doc》由会员分享,可在线阅读,更多相关《概率论和数理统计起源(共12页).doc(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上概率论和数理统计起源(1)从随机现象谈起在自然界和现实生活中,一切事物都是相互联系和不断发展的。在它们彼此间的联系和发展中,根据它们是否有必然的因果关系,可以分成截然不同的两大类:一类是确定性的现象。这类现象是在一定条件下,必定会导致某种确定的结果。举例来说,在标准大气压下,水加热到100度,就必然会沸腾。又如,把铁加热到1530度的时候,必然会熔化成液态。事物间这种联系是属于必然性的。通常的自然科学各学科就是专门研究和认识这种必然性,寻求这类必然现象的因果关系,把握它们之间的数量规律,以达到认识世界和改造世界的目的。另一类是不确定性的现象。这类现象是在一定条件下,它
2、的结果是不确定的。举例来说,同一工人在同一车床上加工同一种零件若干个,它们的尺寸总会有些差异。又如,在同样条件下,进行小麦品种的人工催芽试验,各颗种子的发芽情况也不尽相同,有强弱和早晚之别等等。为什么在相同的一定条件下,会出现这种种不确定的结果呢?这是因为,我们说的“相同条件”是指一些主要条件来说的,除了这些主要条件外,还会有许多次要条件和偶然性因素影响着结果。而这些次要的、偶然起作用的因素又是人们无法事先一一能够掌握的。正因为这样,我们在这一类现象中,就无法用必然性的因果关系,对个别现象的结果事先作出确定的答案。事物间这种关系是属于偶然性的,这种现象叫做偶然现象,或者叫做随机现象。在自然界,
3、在生产、生活中,随机现象十分普遍,也就是说随机现象是大量存在着的。比如:拿北京地区来说,测量每年七月份的天气平均气温,每年都各有差异,不完全相同,而且也不能准确地预测来年七月份的平均气温。这样,“北京七月份平均气温”就是随机现象。又如,同一名工人,用同一台车床在同一条件下(同材料、同一操作规程)加工一种标准长度150毫米的零件等现象,也是随机现象。因此,我们说随机现象就是:在同样条件下,多次进行同一试验或调查同一现象,所得结果不完全一样,而且无法准确地预测下次所得结果的现象。随机现象这种结果的不确定性,是由于一些次要的、偶然因素影响所造成的。随机现象表面上看来,似乎是杂乱无章的、没有什么规律的
4、现象。但实践证明,如果同类的随机现象大量重复出现,它的总体就呈现出一定的规律性。举例采说,掷一枚均匀的五分硬币,有两种可能性,一种是“国徽面”朝上,一种是“伍分面”朝上。每掷一次,很难断定是哪种结果。但是如果多次重复地掷这枚硬币,就会越来越清楚地发现“国徽面”朝上的次数和“伍分面”朝上的次数大体相同这样的规律性。在同样条件下,同一名工人加工同一种零件,每一件的长和标准长150毫米都有差异,但是如果检验他所加工的许多同一零件的时候,就会发现这些零件中比标准长150毫米大的件数和比标准长150毫米小的件数大体相同,而且和标准长相比,相差过大的占少数,相差不多的占多数。大量同类随机现象所呈现的这种规
5、律性,随着我们观察次数增多而愈加明显。我们把这种由大量同类随机现象所呈现出来的集体规律性,叫做统计规律性。概率论和数理统计就是研究大量同类随机现象的统计规律性的数学学科。(2)概率论的产生和发展概率论产生于十七世纪,本来是由保险事业的发展而产生的,但是来自赌博者的请求,却是数学家们思考概率论的一些特殊问题的源泉。早在1654年,有一个赌徒梅累向当时的数学家帕斯卡提出一个使他苦恼了很久的问题:“两个赌徒相约赌若干局,谁先赢局就算获胜,全部赌本就归胜者。但是,当其中一个人赢了局,另一个人赢了局的时候,赌博中止。问赌本应当如何分法才合理?”三年后,也就是1657年,荷兰著名的天文、物理兼数学家惠更斯
6、企图自己解决这一问题,结果写成了论机会游戏的计算一书,这就是最早的概率论著作。近几十年来,随着科技的蓬勃发展,概率论大量应用到国民经济、农业生产及各学科领域。许多兴起的应用数学,如信息论、对策论、排队论、控制论等,都是以概率论作为基础的。概率论和数理统计可以算作一门随机数学分支,它们是联系密切的同类学科,我们现在就是把它们合起来作为一门分支进行介绍的。但是,应该指出,概率论、数理统计、统计方法又各有它们自己所包含的不同内容。概率论 是根据大量同类随机现象的统计规律,对随机现象出现某一结果的可能性作出一种客观的科学定义,对这种出现的可能性大小作出数量上的描述;比较这些可能性的大小,研究它们之间的
7、联系,从而形成一整套数学理论和方法。数理统计 是应用概率的理论来研究大量随机现象的规律性,对通过科学安排的一定数量的试验所得到的统计方法给出严格的理论论证,并判定各种方法应用的条件以及方法、公式、结论的可靠程度和局限性。使我们能从一组样本来判定是否能以相当大的概率保证某一判断是正确的,并可以控制发生错误的概率。统计方法 是以上提供的方法在各种具体问题中的具体应用,它不去注意这些方法的理论根据、数学论证。因而就有象森林统计学、纺织工业统计、教育统计、生物统计、天气预报的统计方法等等。由于随机现象在人类的实际活动中大量存在,概率统计随着现代工农业、近代科技的发展而不断发展,因而形成了许多重要分支。
8、如:随机过程(其中重要的有“马尔可夫过程”和“平衡过程”)、信息论、极限理论、试验设计、多元分析等。概率统计的应用,在国民经济、自然科学各具体领域中又是非常广泛的。如现代物理对微观世界的研究、无线电通讯和导航、生产过程的质量控制、气象水文地震的预报、企业事业的管理、教育质量的统计、地理、物理、化学、生物的研究都离不了这个方法。应当指出,概率统计在研究方法上也有它的特殊性,和其他学科不同的主要特点有下列几点:第一,由于随机现象的统计规律是一种集体规律,必须在大量同类随机现象中才能呈现出来,所以,进行观察、试验、调查就是概率统计这门学科研究方法的基石。但是,要注意它作为数学学科的一个分支,也是具有
9、本学科的定义、公理、定理的。而这些定义、公理、定理也是确定的,不存在任何随机性。只不过这些定义、公理、定理是来源于自然界的随机现象罢了。第二,在研究概率统计中,使用的是“由部分推断全体”的统计推断方法。这是因为它研究的对象随机现象的范围是很大的,在进行试验、观测和调查的时候,不可能也不必要全部进行,只能取其一部分(就是样本)进行试验、观测。但是由这一部分资料所得出的一些结论,要去推断在全体范围(就是总体)内这些结论的可靠性。第三,要特别指出,随机现象的随机性,是指试验、调查之前来说的。就是说,随机观象是对于某一试验、调查之前,我们说它可能出现不确定的结果。而真正做了试验之后,那么对于每一次试验
10、来说,它只能得到这些不确定的结果中的某一个确定结果。我们研究这一现象的时候,应当注意在试验以前能不能对这一现象找出它本身的内在规律。(3)概率论的内容 概率论作为一门数学分支,它所研究的内容一般包括随机事件的概率、统计独立性和条件概率、随机变量、概率分布、正态分布和方差等等。至于概率论的一些分支,这里就不介绍了。现在我们先介绍概率论最基本的一些概念和符号。随机事件一般用大写字母、等来表示,叫做事件、事件等。必然发生的事件,叫做必然事件,用符号表示。不可能发生的事件,叫做不可能事件,用符号表示。事件之间的相互关系,一般也用符号表示。比如,“+”表示事件和事件至少发生其中一件的事件。“”表示事件和
11、事件同时发生的事件。事件和事件不能同时发生,叫做互斥事件。如果事件是必然事件,而且和互斥,就把(或)叫做(或)的对立事件,并用符号表示成或如果个事件能够满足这样的条件:彼此互斥,是必然事件,就是,那么,就把这个事件叫做完全事件系。概率是随机事件发生的可能性的数量指标。什么叫做概率呢?这里还要介绍其他几个概念。如果随机事件在次独立重复的随机试验中出现了次,那么,叫做事件在次试验中的频数,叫做频率。人们通过长期试验,发现如果试验次数很大,频率虽然仍有微小的波动,但是比较明显地稳定在某一个固定的常数附近。这样就得到结论:事件发生的频率将稳定在一个常数附近。我们就把常数叫做事件的概率。一般用符号表示成
12、很明显,必然事件的概率是不可能事件的概率是也可以断定,对于任何一件事件的概率一定介于0与1之间,也就是在实际中,有一类随机现象,具有两个特点:第一,只有有限个可能的结果(比如个);第二,各个结果发生的可能性是相等的。具有这两个特点的随机现象,叫做“古典概型”。对于古典概型,用不着做大量试验,只要确定事件包含了多少个可能的结果,比如是个,那么就可以得出下面的公式:如果事件和事件不可能同时出现,它们就叫互斥事件,互斥事件的概率有以下的公式:在计算基一事件的概率比较复杂的时候,可以间接地通过先计算它的对立事件的概率而求出事件的概率。这是因为相互对立的事件和事件显然是互斥的,并且()是必然事件。因此,
13、那么,又可以得到如果事件的发生或不发生并不影响事件的发生,反过来,事件的发生或不发生也不影响事件的发生,就把事件和事件叫做相互独立事件。独立事件的概率有下公式:在实际工作中,往往有一些更为复杂的问题,比如,在某一事件已经发生的条件下,要求事件发生的概率。这种概率就叫做条件概率。一般用符号记成。要求这条件概率,只要知道和就可以了。因为根据这个公式,显然有另一条件概率公式一般地,就有公式在某些情况下,给出了条件概率要求计算无条件概率,这时候就要用到全概率公式。比如,有个基本事件组成一个完全事件系,那么,对于任何事件,都有这就是全概率公式。如果把全概率公式代入条件概率公式:再把其中的用代换,就可得这
14、个公式叫做贝叶斯公式。它应用广泛,在解决一些复杂问题的时候,常常要用到它。还有一类问题的特点和其他问题不同,它在每一次试验中不受其他各次试验的影响,它的结果也不依赖其他各次试验的结果,也就是各次试验是独立的,另外,事件和对立事件在同一次试验中,总要出现而且只能出现其中一件。遇到这类问题,如果知道事件在一次试验中发生的概率是,一般就用贝努利公式可以求得在次试验中事件出现次的概率。贝努利公式是在客观世界中,存在大量随机现象,随机现象产生的结果构成了随机事件,这些前面已经叙述了。那么,随机现象的各个结果能不能用变量来描述呢?实践证明,能够用变量来描述,这就产生了新的概念,叫做随机变量。随机变量有“有
15、限”和“无限”的区分,一般又根据变量的取值情况分成离散型随机变量和非离散型随机变量等。一切可能的取值能够按一定次序一一列举,这样的随机变量叫做离散型随机变量。如果可能的取值充满了一个区间,无法按次序一一列举,这种随机变量就叫做非离散型随机变量。怎样全面描述离散型随机变量的统计规律呢?这就要研究概率的分布。如果有随机变量,它可能取的值是,而且取每一个值的概率分别是,列成表就是 概率 其中,这就是概率分布。在离散型随机变量的概率分布中,比较简单而应用广泛的是二项式分布。二项式分布只适用于是一个确定的试验次数,如果重复试验次数,而且(一个常数)的时候,就不能用二项式分布了,在概率论中有一种分布,叫做
16、泊松分布,泊松分布的公式还附有数值表可以在计算时参考使用。如果随机变量是连续的,那么对于每一个连续随机变量,都有一个分布曲线,实践和理论都已证明:有一种特殊而常用的分布,它的分布曲线是有规律的,这就是正态分布。如下图所示,正态分布曲线的特征是:可以表示成一条钟,曲线 图95有一个最高点,在这点两边对称地下降。分布曲线取决于这个随机变量的一些表征数,其中最重要的是平均值和差异度。平均值也叫做数学期望,差异度也就是标准方差。一般地,如果用表示随机变量,它的概率分布是它的平均值就是那么,就是偏离的平方的总和,这个“偏离的平方总和的平均值”就叫做方差,记成这个式子的平方根就叫做标准方差。方差或者标准方
17、差都刻画了随机变量取值和平均值的接近程度,所以也叫做离散度。方差越小,说明随机变量取值的差异越小,它的平均值代表性越强。(4)数理统计的内容数理统计包括抽样、适线问题、假设检验、方差分析、相关分析等方面的内容。我们对一个研究对象进行调查或者试验的时候,虽然全面调查是最完善的,但是有很多研究对象不允许这样做,有时候这样做也是不必要的,特别是有许多调查和试验是带有破坏性的,全面调查和试验就更不可能了。比如,工业上要检查灯泡的耐用时间,就要把灯泡烧掉,如果全面试验就要把所生产的灯泡都烧掉。又比如,农业上要在小麦没有成熟前估计产量,就要把小麦收来对它的株数、穗数、粒数、粒重进行计算,如果全面调查,就要
18、把小麦全收割下来。这些都是不允许的。因此,调查只能用“抽查一部分”进行试验的方法。在数理统计中这种方法就叫做抽样,抽出的部分叫做子样或者叫做样本。被检查对象的全体相对于子样来说就叫做母体,也叫做总体。抽样检查是要通过对子样的调查,来推断总体的全面情况。究竟抽多少合适,这是十分重要的。抽多了会浪费物资、人力和时间,抽少了代表性又不大。因此,在抽样检查中就生产了“小子样”理论,这是一种在子样很小的情况下,进行分析判断的理论。适线问题也叫做曲线拟合。在实际中,有些问题需要根据积累的一些经验数据来求出理论分布曲线,从而对整个问题得到了解。这样就要遇到:根据什么原则求出理论分布曲线?有时候同一问题中可以
19、求出几种不同的曲线,如何比较各种曲线的优劣?如果选配好曲线以后,又怎样判断它和理论分布的真值相差多少呢?这些问题,就属于数理统计中的适线问题。假设检验是指在用数理统计方法检验产品的时候,先作出一种假设,这个假设是我们初步希望了解的数值,叫做原假设。再根据抽样观察的结果在一定可靠程度上对原假设来作出判断,是接受或者拒绝原假设。这种方法就叫做假设检验。方差分析也叫做离差分析。在工农业生产中,会遇到生产过程不稳定,但是找不出原因的情况,这样就需要进行试验来判断哪些因素在起作用。或者改变生产条件的时候,判断对产量质量影响比较大的是哪些因素。方差分析就是用方差的概念去分析由少数试验就可以作出的判断。根据
20、观察某些现象所得的一组资料,运用数学方法,确定现象的某些量之间相关程度的大小以及用怎样的函数关系相联系,叫做相关分析。我们知道方差分析可以指出哪些因素有比较大的影响,哪些因素没有影响,但是不能指出某一因素的影响程度。相关分析的理论解决了这个问题,它不仅可以定性地指出哪些因素有密切的关系,而且可以定量地指出这些因素之间量的变化关系。十二、现代数学的某些特点现代数学,指的是本世纪40年代以后发展起来的数学。在这里只举出一些比较明显的特点,不作全面的论述。这些特点简单地说是:计算机科学的形成,应用数学出现众多的新分支,纯粹数学有若干重大的突破。纯粹数学或基础理论和应用数学从来就没有严格的界限,大体上
21、说,纯粹数学是数学的这一部分,它暂时不考虑对其他知识领域或生产实践上的直接应用当然这并不意味着它没有用。它象一棵树的根,在长期的生长中发挥着巨大的作用。它间接地推动有关学科的发展或者在若干年后才发现其直接应用,这在历史上是屡见不鲜的。而应用数学,可以说是纯粹数学与科学技术之间的桥梁。40年代以后,涌现出大量新的应用数学科目,内容的丰富,应用的广泛,名目的繁多,都是史无前例的,这是现代数学一个很显著的特点。下面举一些例子。对策论 由于战争与军事的需要,形成了对策论。对策论是关于斗争的数学,它主要是用数学方法研究在竞争(包括战争、竞技、比赛,也包括人与自然的斗争)中是否存在制胜对方的最优策略以及如
22、何找到这些策略等问题。对策论的始祖可以说是我国战国时代的逊膑。但真正形成一门独立的学科,应以1944年冯诺伊曼、摩根斯特恩合著的对策论与经济行为的奠基性工作为标志。冯诺伊曼是原籍匈牙利的美国人,在点集论、算子理论、连续群论以及第一台电子计算机的设计与核武器的研制等方面都有重要贡献。规划论 由于物资运输的需要,产生了规划论。它主要研究计划管理工作中有关安排和估值的问题。包括线性规划、非线性规划、动态规划等分支,1939年苏联康特洛维奇的生产组织与计划中的数学方法是这方面的早期著作。西方最早的系统著作有查恩斯、库伯、汉特逊的线性规划概论。排队论 排队论也叫随机服务系统理论或公用事业理论中的数学方法
23、。公用事业经常出现排队的现象,如等公共汽车、等买东西、等打电话等。服务机构太多会造成浪费,太少不能满足要求。在满足要求的条件下使服务机构花费最少,这是排队论研究的目的。最早起源于爱尔朗对电话系统的研究。以后有波拉切克、辛欣、巴姆等人的工作。最优化方法 最优化问题大量出现在工程技术、国防科学、社会科学以及工商业贸易等部门中。怎样在给定的条件下,充分利用现有的人力物力,使得完成某一项工作最快最省或质量最好,这都是最优化问题。它的产生,以约翰1948年的文章以不等式作附加条件的极值问题为起点。优选法和统筹法是最优化方法的一部分,近年来在华罗庚教授的倡导下曾在国内推广统筹法的推广。从1964年开始,优
24、选法从1970年开始,取得很大的成绩。优选法中的0618法是美国的基弗在1953年提出的。统筹法原来叫做“关键路线法”,又叫做“计划评审法”。后来我国统称统筹法。运筹学 二次大战期间,英、美都发明了一些新武器如雷达等,但武器的使用却落后于武器的制造,特别在反法西斯潜艇和空战中,当时集中了许多科学家研究了这些问题,取得一定的成果,以后定名为运筹学。它包括前面提到的对策论、规划论、排队论、最优化方法,还有质量控制、抽样检查等分支。它现在还在不断地发展,所以很难划定它的范围。1957年,在英国牛津成立了国际运筹学会,会员已有好几万。我国“运筹学”的名称,是1964年才确定的,“运筹”一词,出自“运筹
25、策帷幄之中,决胜于千里之外。信息论 所谓“信息”,是指对接受者来说是预先不知道的报道或情报,利用数学方法研究信息的计量、传送、变换和储存等,就是信息论。谢农是信息论的先驱者。他在贝尔电话研究所工作,1948年开始提出相当完善的信息论,以后得到迅速的发展。控制论 二次大战开始时,维纳和当时哈佛大学的医学家罗森勃吕特以及生物学家、工程技术人员合作,试图把现代各学科中的通讯及自动控制等基本问题综合成一门新的学科,终于在1947年定为控制论。控制论对于现代计算、自动化技术、通讯以及生物、医学等方面都有很大的影响。1955年以前,苏联对于控制论采取全盘否定的态度。例如,罗森塔尔、尤金在简明哲学辞典中说这
26、是一种“反动的伪科学”。汉译本根据著者的原意译为“大脑机械论”。到1955年才纠正过来。此外还有系统分析、可靠性理论等新的科目出。所谓“系统”是指由若干部件有机地组合起来可以完成某一种功能的综合体,例如铁路系统是由轨道、车辆、车站、通讯设备和工作人员等组成的一个具有运输功能的一个机构。而可靠性是指一个系统在规定的条件下和预定的时间内完成规定功能的概率。上述这些,只是40年代以后出现的应用数学新分支的一部分,这些分支所研究的范围和互相间的关系(是平行的、是从属的或是一部分重叠)很难划清。也有的因为用了很多概率统计的工具,又可以把它看作概率统计的新应用或新分支。还有的可以归入计算机科学之中。结语数
27、学的发展依赖于数学问题的提出和解答,它是一门特殊的科学。数学进一步发展,主要产生于解答前人遗留下来的未能解决的问题及当前在数学、其他学科、科学技术方面提出的问题。在数学的发展史上,有很多的例子可以说明,数学问题是数学发展的主要源泉。数学工作者为了解答这些问题,要花费较大的力 量和时间,尽管对一些问题已经能够解决,还有一些日题仍然没有得到解答,然而在这个过程中,他们创立了新概念、新理论和新方法,往往比问题本身的成果更有价值。社会进步与科技发展都需要数学工具,这是因为数学的抽象,使外表完全不同的问题之间有了深刻的联系,扩大了数学的用场。近半个世纪以来,数学的成果在数量上有了极为可观的增长,历史成果的积累代代相传,使得数学更加简化和统一,使数学尽可能多地解释世界和自然规律的纷纭繁杂、千变万化的客观特征。数学科学更趋繁荣。专心-专注-专业