《第二章 水文统计基本原理与方法优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第二章 水文统计基本原理与方法优秀PPT.ppt(135页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章 水文统计基本原理与方法第一页,本课件共有135页 第一节第一节 水文统计的意义及基本概念水文统计的意义及基本概念一、水文统计的意义一、水文统计的意义水文现象水文现象必然性必然性随机性随机性成因分析法成因分析法数理统计法数理统计法分析方法分析方法分析方法分析方法第二页,本课件共有135页水文统计的任务:水文统计的任务:1 1、对对于于水水文文要要素素的的大大量量观观测测资资料料进进行行统统计计分分析析,寻求其变化的规律;寻求其变化的规律;2 2、在在此此基基础础上上,进进一一步步预预估估出出河河流流未未来来长长时时期期内内可可能能发发生生的的水水文文情情势势,以以满满足足工工程程规规划划
2、、设设计计、施工以及运营期间的需要。施工以及运营期间的需要。第三页,本课件共有135页 设设计计时时,对对给给定定的的概概率率P(即即设设计计标标准准,也称为频率),选择满足关系也称为频率),选择满足关系P(Xxp)PF(xp)xp作作为为设设计计依依据据。F(x)为为水水文文变变量量的的累累积积概概率率函函数数(即即统统计计规规律律),P称称为为设设计计频频率率,xp称为设计值。称为设计值。第四页,本课件共有135页 二、事件二、事件 在在概概率率论论中中,对对随随机机现现象象的的观观测测叫叫作作随随机机试试验验,随随机机试试验验的的结结果果称称为为事事件件,在在水水文文统计中是表示水文现象
3、。统计中是表示水文现象。事件有两种属性:事件有两种属性:(1 1)数数量量性性质质:直直接接测测量量的的量量或或计计算算的的量量。例例如如年年降降雨雨量量、年年径径流流量量、河河流流某某断断面处最大洪峰流量等。面处最大洪峰流量等。(2 2)属属性性性性质质:直直接接观观测测到到的的现现象象。例如风、雨、晴等。例如风、雨、晴等。第五页,本课件共有135页 分类分类(1 1)必必然然事事件件:在在每每次次试试验验中中一一定定会会出出现现的的事事件件称称为为必必然然事事件件。例例如如,流流域域上上降降雨雨且且产流的条件下,河中水位上升是必然事件。产流的条件下,河中水位上升是必然事件。(2 2)不不可
4、可能能事事件件:在在任任何何一一次次试试验验中中都都不不会会出出现现的的事事件件称称为为不不可可能能事事件件。例例如如天天然然河河流流在在洪洪水水期间,发生断流是不可能事件。期间,发生断流是不可能事件。(3 3)随随机机事事件件:在在一一次次随随机机试试验验中中可可能能出出现现也也可可能能不不出出现现的的事事件件称称为为随随机机事事件件。例例如如河河流流某某断断面面处处出出现现的的年年最最大大洪洪峰峰流流量量可可能能大大于于某某一一数数值值,也也可可能能小小于于或或等等于于某某一一数数值值,事事先先不不能能确确定,属于随机事件。定,属于随机事件。第六页,本课件共有135页三、总体、样本、样本容
5、量三、总体、样本、样本容量1、随机变量、随机变量 用用以以表表示示随随机机试试验验结结果果的的一一个个数数量量(事事先先是是未未知知的的),由由于于它它事事先先不不能能确确定定,是是随随机机的的,称称为为随随机机变变量量。比比如如在在工工地地上上检检验验一一批批钢钢筋筋,可可以以随随机机抽抽查查几几组组试试件件,每每一一组组试试件件检检验验不不合合格格的的根根数数就就是是随随机机变变量量。水水文文现现象象中中的的随随机机变变量量,一一般般指指某某个个水水文特征值文特征值(如年径流量、年降雨量、洪峰流量等如年径流量、年降雨量、洪峰流量等)。第七页,本课件共有135页随机变量的分类随机变量的分类:
6、离散型随机变量离散型随机变量 随随机机变变量量仅仅取取得得区区间间内内某某些些间间断断的的离离散散值值,则则称称为为离离散散型型随随机机变变量量。如如洪洪峰峰次次数数,只只能能取取0、1、2 ,不不能能取取相相邻邻两两数数值值之之间的任何值。间的任何值。连续型随机变量连续型随机变量 随随机机变变量量可可以以取取得得一一个个有有限限区区间间内内的的任任何何数数值值,则则称称为为连连续续型型随随机机变变量量。如如某某河河流流断断面面的流量可以取的流量可以取0极限值之间的任何实数值极限值之间的任何实数值。第八页,本课件共有135页2 2、总体、样本和样本容量、总体、样本和样本容量总体总体 在在统统计
7、计数数学学中中,把把某某种种随随机机变变量量所所取取数数值值的全体,称为总体。的全体,称为总体。如年径流量的总体数是无穷的。如年径流量的总体数是无穷的。样本样本 从从总总体体中中不不带带主主观观成成分分任任意意抽抽取取的的一一部部分分,称为样本。样本所包含的项数,称为样本容量。称为样本。样本所包含的项数,称为样本容量。如实测的水文资料是有限的,是一样本。如实测的水文资料是有限的,是一样本。第九页,本课件共有135页四、数理统计法对水文资料的要求四、数理统计法对水文资料的要求1、可靠性、可靠性2、一致性、一致性3、代表性、代表性4、随机性、随机性5、独立性、独立性第十页,本课件共有135页第二节
8、第二节 频率和概率频率和概率 一、概率和频率一、概率和频率 1 1、概率、概率 随随机机事事件件在在试试验验中中可可能能出出现现,也也可可能能不不出出现现,但但其其出出现现(或或不不出出现现)的的可可能能性性大大小小有有所所不不同同,为为了了比比较较这这种种可可能能性性的的大大小小,必必须须赋赋予予一种数量标准,这个标准就是事件的概率。一种数量标准,这个标准就是事件的概率。第十一页,本课件共有135页简单简单(古典古典)的随机事件的概率定义用下式表示:的随机事件的概率定义用下式表示:式中,式中,P(A):一定条件下随机事件:一定条件下随机事件A的概率;的概率;n:试验中所有可能的出现的结果数;
9、:试验中所有可能的出现的结果数;m:出现随机事件:出现随机事件A的结果数。的结果数。古古典典的的随随机机试试验验是是指指所所有有试试验验的的可可能能结结果果都都是是等等可可能能的的,而而且且试试验验的的可可能能结结果果的的总总数数是是有有限限的的。但但水水文文事事件件不不一一定定符符合合这这种种性性质质,也也就就不不能能用用上上述述计计算算概概率率的的公公式式。为为此此,水水文文学学中中通通常常用用频频率率估估算事件的概率。算事件的概率。第十二页,本课件共有135页 2、频率、频率 对对于于不不是是古古典典概概型型事事件件,只只能能通通过过多多次次重重复试验来估计事件的概率。复试验来估计事件的
10、概率。设设事事件件A在在n次次随随机机试试验验中中出出现现了了m 次次,则称:则称:为事件为事件A在在n次试验中出现的频率。次试验中出现的频率。注注意意:n不不是是所所有有可可能能的的结结果果总总数数,仅仅是是随随机机试试验的次数。验的次数。第十三页,本课件共有135页3、概率和频率的关系:、概率和频率的关系:频率是经验值,概率是理论值;频率是经验值,概率是理论值;可可以以通通过过实实测测样样本本的的频频率率分分析析来来推推论论事事件件总总体概率特性;体概率特性;样本容量越大,结果越准确;样本容量越大,结果越准确;对对于于水水文文现现象象,只只能能采采用用有有限限的的多多年年实实测测水水文文资
11、资料料组组成成样样本本系系列列,推推求求频频率率作作为为概概率率的的近近似似值。值。第十四页,本课件共有135页二、随机变量的概率分布二、随机变量的概率分布1 1、对于离散型随机变量对于离散型随机变量 随随机机变变量量的的取取某某一一可可能能值值的的机机会会有有的的大大有有的的小小,即即随随机机变变量量取取值值都都有有一一定定的的概概率率与与之之相相对应,可表示为:对应,可表示为:上上式式中中P1、P2、Pn 表表示示随随机机变变量量X取值取值x1、x2、xn 所对应的概率。所对应的概率。第十五页,本课件共有135页 一一般般将将这这种种对对应应关关系系称称作作随随机机变变量量的的概概率率分分
12、布布规规律律,简简称称为为分分布布律律。可可以以用用以以下下的的分分布布图形表示:图形表示:x1 x2 x3 x4 xnXP 离散型随机变量概率分布图离散型随机变量概率分布图第十六页,本课件共有135页2 2、对于连续型随机变量对于连续型随机变量 由由于于它它的的所所有有可可能能取取值值有有无无限限个个,而而取取个个别别值值的的概概率率为为零零,故故无无法法研研究究个个别别值值的的概概率率。水水文文学学上上习习惯惯研研究究随随机机变变量量的的取取值值等等于于或或大大于于某某个个值值的概率,表示为:的概率,表示为:P(Xx)。它它是是x的的函函数数,称称作作随随机机变变量量X的的分分布布函函数数
13、,记作记作F(x),),即即 F(x)=P(Xx)表表示示随随机机变变量量X大大于于或或等等于于值值x的的概概率率,其其几几何何曲曲线线称称作作随随机机变变量量的的概概率率分分布布曲曲线线(水水文学上通常称文学上通常称累计频率曲线,简称频率曲线累计频率曲线,简称频率曲线)。)。第十七页,本课件共有135页0 0.2 0.4 0.6 0.8 1.0500900年降雨量年降雨量(mm)某站年雨量概率分布曲线某站年雨量概率分布曲线 P(X x)由由图图中中可可知知,x=900,相相应应的的P(X x)=0.15,说说明明大大于于900mm降降雨雨的的可可能能性性为为15%;同同理理,大大于于500m
14、m降降雨雨的的可可能能性性为为60%。第十八页,本课件共有135页由概率的加法定理:由概率的加法定理:随随机机变变量量X落落在在(x,x+x)的的概概率率可可用用下下式表示式表示:x x+x PXP(X x)P(Xx+x)P(X x)=P(X x+x)+P(x+x X x)P(x+x X x)=P(X x)-P(X x+x)=F(x)-F(x+x)则,降雨量落在则,降雨量落在900和和500mm的可能性为的可能性为:60%-15%=45%第十九页,本课件共有135页三、累积频率和重现期三、累积频率和重现期1、累积频率、累积频率 等等量量或或超超量量值值的的累累积积频频数数m与与总总观观测测次次
15、数数S之之比,以比,以P(xxi)表示。)表示。例例:某某桥桥位位处处测测得得40年年最最高高水水位位资资料料,如如表表,求水位求水位H25m的累积频率。的累积频率。第二十页,本课件共有135页解:当水位解:当水位H25m时,时,W=25%P=25+5=30%表表明明:若若水水位位为为25m时时对对桥桥梁梁会会有有威威胁胁,则则高高于于25m的的水水位位对对桥桥梁梁都都会会有有威威胁胁,其其发发生生的的可可能能性性应为应为P=30。工程上习惯把累积频率简称为频率。工程上习惯把累积频率简称为频率。第二十一页,本课件共有135页2 2、重现期、重现期 所所谓谓的的重重现现期期是是指指某某一一随随机
16、机事事件件在在很很长长时时期期内内平平均均多多长长时时间间出出现现一一次次(水水文文学学中中常常称称为为“多多少少年年一一遇遇”)。即即在在许许多多试试验验中中,某某一一随随机机事事件件重重复复出出现现的的时时间间间间隔隔的的平平均均数数,即即平平均均的的重重现现间间隔隔期期。在在水水文文分分析析中中,重重现现期期可可以以等等效的替代频率。效的替代频率。第二十二页,本课件共有135页频率频率P与重现期与重现期T关系的两种表示法:关系的两种表示法:式中,式中,T:重现期,以年计;:重现期,以年计;P:大于某水文变量:大于某水文变量xP事件的频率。事件的频率。例例如如,当当设设计计洪洪水水的的频频
17、率率为为P1%时时,代代入入上上式式得得T100年年,称称为为百百年年一一遇遇洪洪水水,表表示示大大于于等于这样的洪水平均一百年会遇到一次。等于这样的洪水平均一百年会遇到一次。(1 1)当研究洪水或暴雨问题时当研究洪水或暴雨问题时 水水文文上上关关心心的的是是大大于于某某洪洪水水或或某某暴暴雨雨量量发发生生的的频频率率,因因此此,重重现现期期指指在在很很长长时时期期N年年内内,出出现现大大于于某某水水文文变变量量xP 事事件件的的平平均均重重现现的的间间隔隔期期T:第二十三页,本课件共有135页(2 2)当研究枯水问题当研究枯水问题 水水文文上上关关心心的的是是小小于于xP的的事事件件出出现现
18、的的频频率率及及相相应的重现期。应的重现期。重重现现期期指指在在很很长长的的时时期期内内(N年年)出出现现小小于于某某水水文文变变量量xP事事件件的的平平均均重重现现间间隔隔期期。若若水水文文变变量量大大于于xP的的频频率率为为P,则则小小于于xP事事件件的的频频率率应应为为1P,在在N年年内内小小于于xP事事件件出出现现的的次次数数应应为为N(1P),因此其重现期为:,因此其重现期为:第二十四页,本课件共有135页 例例如如,当当设设计计枯枯水水流流量量的的频频率率P80时时,代代入入上上式式得得T5年年,称称此此为为五五年年一一遇遇的的枯枯水水流流量量,表表示示小小于于等等于于这这样样的的
19、流流量量平平均均五五年年遇遇到到一一次。次。第二十五页,本课件共有135页例例:已已知知某某水水厂厂取取水水口口流流量量Q800m3/s的的频频率率为为96%,求,求Q800m3/s设计枯水流量的重现期。设计枯水流量的重现期。由由P(Q800)=96%,得,得P(Q800)=196%=4%由重现期的定义,由重现期的定义,T(Q800)=25即重现期为即重现期为25年一遇。年一遇。第二十六页,本课件共有135页思考:重现期和物理学中的周期有何区别?思考:重现期和物理学中的周期有何区别?重重现现期期T是是指指水水文文现现象象在在长长时时期期内内平平均均T年年出出现现一一次次,而而不不是是每每隔隔T
20、年年必必然然发发生生一一次次,它它是是对对于于类类似似于于洪洪水水这这样样的的随随机机事事件件发发生生的的可可能能性性的的一一种种定定量量描描述述。例例如如百百年年一一遇遇的的洪洪水水,是是指指大大于于或或等等于于这这样样的的洪洪水水在在长长时时期期内内平平均均100年年发发生生一一次次,而而不不能能理理解解为为百百年年一一遇遇的的洪洪水水每每隔隔100年年一一定定出出现现一一次次。实实际际上上,百百年年一一遇遇洪洪水水可可能能间间隔隔100年年以以上上时时间间发发生生,也也可可能能连连续续两两年年接接连连发发生生。周周期期是是固固定定多多少少时时间间出出现现一一次次,即即为为固定概念。而重现
21、期为平均概念。固定概念。而重现期为平均概念。第二十七页,本课件共有135页四、设计标准四、设计标准 指指国国家家根根据据工工程程的的重重要要性性及及建建筑筑物物的的等等级级制制定定的的允允许许破破坏坏率率及及要要求求的的安安全全率率,以以符符号号P表表示。示。第二十八页,本课件共有135页第三节第三节 经验频率曲线经验频率曲线 一、经验频率公式一、经验频率公式 例例:已已知知某某地地年年降降雨雨量量的的观观测测资资料料(n=12),并由大到小排列,按),并由大到小排列,按 计算频率。计算频率。式式中中,P:大大于于或或等等于于某某一一变变量量值值x的的经经验累积频率;验累积频率;m:x由由大大
22、到到小小排排列列的的序序号号,即即在在n次次观观测测资料中出现大于或等于某一数值资料中出现大于或等于某一数值x的次数。的次数。第二十九页,本课件共有135页经验累积频率计算表:经验累积频率计算表:第三十页,本课件共有135页 如如果果n项项实实测测资资料料是是总总体体,则则上上述述计计算算经经验验频频率率公公式式是是合合理理的的;但但水水文文实实测测资资料料是是样样本本资资料料,则则计计算算的的经经验验频频率率就就不不太太合合理理,比比如如当当in时时,其其频频率率P100,即即是是说说样样本本的的末末项项就就是是总总体体中中的的最最小小值值,显显然然不不符符合合实实际际情情况况,因因为为随随
23、着着观观测测项项数数的增加,总会有更小的数值出现。的增加,总会有更小的数值出现。第三十一页,本课件共有135页 为为了了修修正正由由样样本本推推算算总总体体出出现现的的不不合合理理估算,有如下几个经验频率公式可供选择:估算,有如下几个经验频率公式可供选择:数学期望公式数学期望公式 切哥达也夫公式切哥达也夫公式 海森公式海森公式 第三十二页,本课件共有135页 目目前前我我国国水水文文计计算算上上广广泛泛采采用用的的是是数数学学期期望望公公式式,公公式式形形式式简简单单,计计算算结结果果也也比比较较符符合合实际,且偏于安全。这样,当实际,且偏于安全。这样,当m=n=12 时,时,第三十三页,本课
24、件共有135页 二、经验频率曲线的绘制和应用二、经验频率曲线的绘制和应用 将将水水文文变变量量,按按由由大大到到小小的的次次序序排排列列xi,排排列列的的序序号号不不仅仅表表示示大大小小的的次次序序,而而且且表表示示大大于等于该水文变量的累积次数;于等于该水文变量的累积次数;用用数数学学期期望望公公式式计计算算各各项项的的经经验验频频率率Pi;以以水水文文变变量量为为纵纵坐坐标标,以以其其对对应应的的经经验验频率为横坐标,点绘出经验频率点据。频率为横坐标,点绘出经验频率点据。第三十四页,本课件共有135页 根根据据与与点点群群配配合合最最好好的的原原则则绘绘出出一一条条平平滑滑曲曲线线,即即为
25、为水水文文变变量量的的经经验验频频率率曲曲线线。在在频频率率格格纸纸上上绘绘制制频频率率曲曲线线,如如为为正正态态曲曲线线则则成成直直线线,如如为为偏偏态态曲曲线线则则两两端端的的曲曲度度也也会会大大大大变变小小,有有利利于于特特小小频频率率或特大频率的点绘与查取。或特大频率的点绘与查取。有有了了经经验验频频率率曲曲线线,即即可可在在曲曲线线上上求求得得指指定定频率的水文变量值。频率的水文变量值。第三十五页,本课件共有135页第三十六页,本课件共有135页 因因频频率率曲曲线线的的两两端端特特别别陡陡峭峭,又又因因图图幅幅的的限限制制,对对于于特特小小频频率率或或特特大大频频率率,尤尤其其是是
26、特特大大频频率率的的点点子子很很难难点点在在图图上上。为为此此,设设计计一一种种“频频率率格格纸纸”,其其横横坐坐标标的的分分划划就就是是按按把把标标准准正正态态分分布布频频率率曲曲线线拉拉成成一一条条直直线线的的原原理理计计算算出出来来的的。这这种种频频率率格格纸纸的的纵纵坐坐标标仍仍是是普普通通分分格格,但但横横坐坐标标的的分分格格是是不不相相等等的的,中中间间分分格格较较密密,越越往往两两端端分分格格越越稀稀,其其间间距距在在P=50%的的两两端端是是对对称的。称的。第三十七页,本课件共有135页 经验频率曲线的特点经验频率曲线的特点 当当n时时,经经验验频频率率曲曲线线将将越越来来越越
27、光光滑滑,且且接接近近于于理理论论频频率率曲曲线线,对对于于水水文文变变量量分分布布线线型型的选择具有借鉴作用;的选择具有借鉴作用;经经验验频频率率曲曲线线计计算算工工作作量量小小,绘绘制制简简单单,查用方便;查用方便;经经验验频频率率曲曲线线外外延延比比较较盲盲目目,误误差差较较大大,往往往往难难以以满满足足设设计计上上的的需需要要。因因为为在在水水文文计计算算中中,常需推求常需推求P=1、0.1%、0.01%相应的水文变量值。相应的水文变量值。不不能能求求出出统统计计参参数数,难难以以进进行行参参数数的的地地区区综综合合,无无法法解解决决无无实实测测水水文文资资料料的的小小流流域域的的水水
28、文文计计算算问问题。题。第三十八页,本课件共有135页三、经验频率曲线的外延三、经验频率曲线的外延1、目估延长、目估延长局局限限性性:(1)没没有有实实测测点点的的控控制制,目目估估使使曲曲线外延带有相当大的主观成分。线外延带有相当大的主观成分。(2)由由于于水水文文现现象象的的随随机机性性,有有时时点点绘绘的的经经验验频频率率点点分分布布比比较较散散乱乱,使使得得经经验验累累积积频频率率曲曲线线的定线比较困难。的定线比较困难。第三十九页,本课件共有135页2、选配合适的数学模型延长经验频率曲线、选配合适的数学模型延长经验频率曲线 对对水水文文资资料料的的经经验验频频率率曲曲线线选选配配合合适
29、适的的数数学学模模型型,利利用用数数学学方方法法来来推推求求理理论论频频率率曲曲线线方方程程式式,据据此此绘绘制制理理论论频频率率曲曲线线,减减小小目目估估徒徒手手定定线线的的主主观观因因素影响。素影响。第四十页,本课件共有135页第第四节四节 随机变量的统计参数随机变量的统计参数 随随机机变变量量的的概概率率分分布布曲曲线线或或分分布布函函数数,比比较较完完整整地地描描述述了了随随机机现现象象的的分分布布规规律律。但但是是,在在许许多多实实际际问问题题中中,随随机机变变量量的的分分布布函函数数不不易易确确定定,有有时时不不一一定定都都需需要要用用完完整整的的形形式式来来说说明明随随机机变变量
30、量,而而只只要要用用个个别别代代表表性性的的数值说明随机变量的主要特征即可。数值说明随机变量的主要特征即可。例例如如,某某地地的的年年降降水水量量是是一一个个随随机机变变量量,各各年年的的降降水水量量不不同同,具具有有一一定定的的概概率率分分布布函函数数,若若要要了了解解该该地地年年降降水水量量概概括括情情况况,可可用用多多年年平平均降水量这个数量指标来反映。均降水量这个数量指标来反映。这这种种能能说说明明随随机机变变量量统统计计规规律律的的数数字字特特征征值值,称为称为随机变量的统计参数随机变量的统计参数。第四十一页,本课件共有135页 统统计计参参数数有有总总体体统统计计参参数数与与样样本
31、本统统计计参参数数之分。之分。水水文文现现象象的的总总体体是是无无限限的的,它它是是指指自自古古迄迄今今以以至至未未来来长长远远岁岁月月所所有有的的水水文文系系列列。显显然然,水水文文随随机机变变量量的的总总体体是是不不知知道道的的,只只能能靠靠有有限限的的样样本本观观测测资资料料去去估估计计总总体体的的统统计计参参数数或或总总体体的分布规律。的分布规律。水水文文计计算算中中常常用用的的样样本本统统计计参参数数有有位位置置特征参数特征参数和和离散特征参数离散特征参数。第四十二页,本课件共有135页一、位置特征参数一、位置特征参数 位位置置特特征征参参数数就就是是描描述述随随机机变变量量在在数数
32、轴轴上上位位置置的的特特征征值值。主主要要有有:均均值值、中中位位数数、众数。众数。1、均值均值 设设某某水水文文变变量量的的观观测测系系列列(样样本本)为为x1、x2、xn,则其均值为则其均值为 第四十三页,本课件共有135页 均均值值也也称称算算术术平平均均值值,表表示示系系列列的的平平均情况,可以均情况,可以说明这一系列总水平的高低说明这一系列总水平的高低。例例如如,按按19561979年年统统计计,黄黄河河流流域域多多年年平平均均降降水水量量为为475.9mm,长长江江流流域域多多年年平平均均降降水水量量为为1070.5mm,说说明明长长江江流流域域的水量比黄河流域丰沛。的水量比黄河流
33、域丰沛。均均值值不不仅仅是是频频率率计计算算中中的的一一个个重重要要参参数数,而且还是水文现象的一个重要特征值。而且还是水文现象的一个重要特征值。第四十四页,本课件共有135页 令令 k为模比系数,为模比系数,则则 上上式式说说明明,当当我我们们把把变变量量X的的系系列列用用其其相相对对值值即即用用模模比比系系数数k的的系系列列表表示示时时,则则其其均均值值等等于于1 1。这这是是水水文文统统计计中中的的一一个个重重要要特特征征,即即对对于于以以模模比比系系数数k所所表表示示的的随随机机变变量量,在在其其频频率曲线的方程中,可以减少均值这样一个参数。率曲线的方程中,可以减少均值这样一个参数。第
34、四十五页,本课件共有135页 2 2、中位数、中位数 中中位位数数是是把把概概率率密密度度曲曲线线分分为为两两个个相相等部分的数,记为等部分的数,记为Me(x)。)。对于离散型的随机变量:对于离散型的随机变量:将将所所有有变变量量的的可可能能取取值值按按大大小小次次序序排排列,位置居中的数字。列,位置居中的数字。第四十六页,本课件共有135页对于连续的随机变量:对于连续的随机变量:中位数满足:中位数满足:式式中中,a、b分分别别为为随随机机变变量量X取取值值的上下限。的上下限。Me(x)xf(x)1/21/2ab第四十七页,本课件共有135页3 3、众数、众数 表表示示概概率率密密度度分分布布
35、峰峰点点所所对对应应的的数数,记为记为M0(x)。)。对于离散型随机变量:对于离散型随机变量:M0(x)是使概率是使概率 P(=xi)等于等于 最大时所相应的最大时所相应的 xi值。值。M0(x)=xiPi-1 Pi Pi+1 Px离散型随机变量的众数离散型随机变量的众数第四十八页,本课件共有135页对于连续型随机变量:对于连续型随机变量:M0(x)是概率密度函数是概率密度函数f(x)等于等于最大时所对应的最大时所对应的xi值。值。M0(x)f(x)x 连续的随机变量的众数连续的随机变量的众数第四十九页,本课件共有135页 二、离散特征参数二、离散特征参数 离离散散特特征征参参数数是是刻刻划划
36、随随机机变变量量分分布布离离散散程程度度的的指指标标,这这种种类类型型的的参参数数有有:标标准准差差、离势系数、偏态系数。离势系数、偏态系数。1 1、标准差(均方差)、标准差(均方差)1 2 2 1f(x)x标准差对密度标准差对密度函数的影响函数的影响 值愈大,分布愈分散;值愈大,分布愈分散;值愈小,分布愈集中。值愈小,分布愈集中。第五十页,本课件共有135页例题:两系列:甲例题:两系列:甲5,10,15;乙乙1,10,19。比较其离散程度。比较其离散程度。表明:乙系列的离散程度大于甲系列。表明:乙系列的离散程度大于甲系列。第五十一页,本课件共有135页 2 2、变差系数(离差系数、离势系数)
37、、变差系数(离差系数、离势系数)对对于于均均值值不不同同的的二二个个系系列列,用用均均方方差差来来比比较较其其离离散散程程度度就就不不合合适适,则则要要采采用用均均方方差差和和均均值值的的比比来来表表示示系系列列的的相相对对离离散程度:散程度:CV值愈大,分布愈分散;值愈大,分布愈分散;CV值愈小,分布愈集中。值愈小,分布愈集中。CV1CV2CV2 CV1f(x)x变差系数对密变差系数对密度函数的影响度函数的影响第五十二页,本课件共有135页例题:比较两系列的离散程度:例题:比较两系列的离散程度:甲甲5,10,15;乙乙995,1000,1005。表明:甲系列的离散程度大于乙系列。表明:甲系列
38、的离散程度大于乙系列。第五十三页,本课件共有135页 3 3、偏态系数、偏态系数 在在数数理理统统计计中中主主要要采采用用偏偏态态系系数数作作为为衡衡量系列不对称程度的参数。量系列不对称程度的参数。上式右端的分子、分母同除以上式右端的分子、分母同除以 ,则得,则得第五十四页,本课件共有135页 当当系系列列对对称称时时,CS0,此此时时随随机机变变量大于均值与小于均值的出现机会相等。量大于均值与小于均值的出现机会相等。当当系系列列不不对对称称时时,CS0,其其中中CS0,称称为为正正偏偏,随随机机变变量量大大于于均均值值比比小小于于均均值值出出现现的的机机会会小小;CS0,称称为为负负偏偏,随
39、随机机变变量量大于均值比小于均值出现的机会多。大于均值比小于均值出现的机会多。f(x)x偏态系数对密度函数的影响偏态系数对密度函数的影响Cs=0Cs0第五十五页,本课件共有135页三、随机变量系列统计参数的估计三、随机变量系列统计参数的估计 水水文文随随机机变变量量的的总总体体是是无无限限的的,这这就就需需要要在在总总体体不不知知道道的的情情况况下下,靠靠抽抽出出的的样样本本(观观测测的系列的系列)去估计总体参数。去估计总体参数。估算方法有:估算方法有:矩法;矩法;适线法;适线法;极大似然法;极大似然法;权函数法;权函数法;第五十六页,本课件共有135页 矩法矩法 1 1、计算公式、计算公式
40、已已知知样样本本的的随随机机系系列列:x1、x2、x3、xn,分分别别求求样样本本的的三三个个统统计计参参数数:均均值值、CV、CS。样本均值样本均值 样本标准差样本标准差 样本离势系数样本离势系数第五十七页,本课件共有135页 样本偏态系数样本偏态系数 2、无偏估计量、无偏估计量 显显然然,样样本本的的统统计计参参数数与与相相应应的的总总体体同同名名参参数数不不一一定定相相等等。但但是是,我我们们希希望望由由样样本本系系列列计计算算出出来来的的统统计计参参数数与与总总体体更更接接近近些些,因因此此,需需要要将将上上述述样样本本参参数数的的计计算算公式加以修正。公式加以修正。第五十八页,本课件
41、共有135页定定义义:令令为为未未知知参参数数的的估估计计量量,如如果果 E()=,则则称称为为参参数数的的无无偏偏估估计计量量。换换句句话话说说,无无偏偏估估计计是是设设想想有有很很多多个个同同样样容容量量的的样样本本资资料料,使使其其计计算算出出来来的的统统计计参参数数的的均均值值,可可望望等于总体的同名参数。等于总体的同名参数。可可以以证证明明,样样本本均均值值是是总总体体均均值值的的无无偏偏估估计计量量。然然而而CV、CS则则不不是是总总体体相相应应参参数数的的无无偏偏估估计计量量,称称为为有有偏偏估估计计量量。故故需需要要对对参参数数CV、CS进行修正,使其变成无偏估计量。进行修正,
42、使其变成无偏估计量。第五十九页,本课件共有135页 求求Cv、Cs的无偏估计量的修正计算式:的无偏估计量的修正计算式:(当当n较大时较大时)第六十页,本课件共有135页第五节第五节 几种常用的概率分布曲线几种常用的概率分布曲线 目目的的:在在水水文文分分析析计计算算中中,常常常常需需要要知知道道大大于于或或等等于于某某一一特特征征值值的的频频率率是是多多少少,也也就就是是要要提提供一定频率的水文数值,这就需要绘制频率曲线。供一定频率的水文数值,这就需要绘制频率曲线。分分类类:国国内内外外水水文文分分析析计计算算中中使使用用的的概概率率分分布布曲曲线线俗俗称称水水文文频频率率曲曲线线,习习惯惯上
43、上把把由由实实测测资资料料(样样本本)绘绘制制的的频频率率曲曲线线称称为为经经验验频频率率曲曲线线,而而把把由由数数学学方方程程式式所所表表示示的的频频率率曲曲线线称称为为理理论论频频率率曲线曲线。第六十一页,本课件共有135页 频频率率计计算算的的内内容容:分分布布线线型型的的选选择择与与统统计参数的估算。计参数的估算。水水文文频频率率分分布布线线型型:指指所所采采用用的的理理论论频频率率曲曲线线(频频率率函函数数)的的型型式式(水水文文中中常常用用线线型型为为正正态态分分布布型型、极极值值分分布布型型、皮皮尔尔逊逊分分布布型型等等),它它的的选选择择主主要要取取决决于于与与大大多多数数水文
44、资料的经验频率点据的配合情况。水文资料的经验频率点据的配合情况。第六十二页,本课件共有135页 探探求求频频率率曲曲线线的的数数学学方方程程,即即寻寻求求水水文文频频率率分分布布线线型型,一一直直是是水水文文分分析析计计算算中中争争论论性很强的课题。性很强的课题。水水文文随随机机变变量量究究竟竟服服从从何何种种分分布布,目目前前还还没没有有充充足足的的论论证证,因因为为水水文文现现象象非非常常复复杂杂,我我们们所所掌掌握握的的资资料料又又非非常常短短,难难以以从从理理论论上上推推断断究究竟竟服服从从何何种种分分布布线线型型,因因此此只只能能以以某某种理论线型近似代替。种理论线型近似代替。这这些
45、些理理论论线线型型并并不不是是从从水水文文现现象象的的物物理理性性质质方方面面推推导导出出来来的的,而而是是根根据据经经验验资资料从统计数学的已知频率函数中选出来的。料从统计数学的已知频率函数中选出来的。第六十三页,本课件共有135页 迄今为止,国内外采用的理论线型已有迄今为止,国内外采用的理论线型已有10余种。余种。如如:正正态态分分布布(N)、皮皮尔尔逊逊型型分分布布(P)、对对数数皮皮尔尔逊逊型型分分布布(LP-)、克克里里茨茨基基一一闵闵凯凯里里分分布布(KM)、指指数数伽伽玛玛分分布布()、两两参参数数对对数数正正态态分分布布(LN2)、三三参参数数对对数数正正态态分分布布(LN3)
46、、I 型型极极值值分分布布(EVI)、通通 用用 极极 值值 分分 布布(GEV)、韦韦 布布 尔尔 分分 布布(Weibull)、指指数数分分布布(Exp)、P V分分布布、耿贝尔分布(耿贝尔分布(Gamble)。第六十四页,本课件共有135页 不不过过,从从现现有有资资料料看看,P型型曲曲线线和和LP型型曲曲线线比比较较符符合合水水文文随随机机变变量量的的分分布布。因此,这两种曲线用得最多。因此,这两种曲线用得最多。我我国国在在水水文文频频率率计计算算中中都都是是采采用用P型型频频率率曲曲线线,并并在在1993年年国国家家发发布布的的水水利利水水电电工工程程设设计计洪洪水水计计算算规规范范
47、规规定定“频频率率曲曲线线的的线线型型一一般般应应采采用用皮皮尔尔逊逊型型。特特殊殊情情况况,经经分分析析论论证证后后也也可可采采用用其其它它线线型型”。为为此此,下下面面介介绍正态分布和绍正态分布和P型分布。型分布。第六十五页,本课件共有135页 一、正态分布一、正态分布 1 1、定定义义:如如果果随随机机变变量量X的的概概率率密密度度函函数数为为 则称随机变量则称随机变量X具有正态概率分布。具有正态概率分布。正正态态分分布布具具有有两两个个参参数数:均均值值 和和均均方差方差。e e为自然对数的底。为自然对数的底。第六十六页,本课件共有135页2 2、特点、特点a.单峰,只有一个众数;单峰
48、,只有一个众数;b.对于平均数对称对于平均数对称,Cs=0;c.曲线两端趋于曲线两端趋于,并以,并以x轴为渐近线轴为渐近线。第六十七页,本课件共有135页 4、应用、应用 (1)误误差差分分析析:正正态态分分布布的的密密度度曲曲线线与与x轴轴所所围围成成的的面面积积应应等等于于1。均均值值两两边边、2、3范范围内的面积分别为围内的面积分别为 显显然然,均均方方差差越越小小,由由均均值值估估计计x值值的的误误差差越越小小。正正态态分分布布的的这这种种特特性性在在误误差差估估算算时时得得到了应用。到了应用。第六十八页,本课件共有135页 (2 2)频率格纸:)频率格纸:正正态态分分布布频频率率曲曲
49、线线在在普普通通方方格格纸纸上上是是一一条条规规则则的的S形形曲曲线线,因因频频率率曲曲线线的的两两端端特特别别陡陡峭峭,又又因因图图幅幅的的限限制制,对对于于特特小小频频率率或或特特大大频频率率,尤尤其其是是特特大大频频率率的的点点子子很很难难点点在在图图上上。为为此此,设设计计一一种种“频频率率格格纸纸”,其其横横坐坐标标的的分分划划就就是是按按把把标标准准正正态态分分布布频频率率曲曲线线拉拉成成一一条条直直线线的的原原理理计计算算出出来来的的。这这种种频频率率格格纸纸的的纵纵坐坐标标仍仍是是普普通通分分格格,但但横横坐坐标标的的分分格格是是不不相相等等的的,中中间间分分格格较较密密,越越
50、往往两两端端分分格格越越稀稀,其其间间距距在在P=50%的两端是对称的。的两端是对称的。第六十九页,本课件共有135页第七十页,本课件共有135页 二、皮尔逊二、皮尔逊型分布型分布 1、定义、定义 英英国国生生物物学学家家Person研研制制的的13种种分分布布曲曲线线中中的的第第3种种(简简称称P型型),其其密密度度函函数数为为 式中式中,():):的伽玛函数的伽玛函数,、a0:三个参数,它们与三个统计参数:三个参数,它们与三个统计参数有一定的关系。有一定的关系。第七十一页,本课件共有135页 2 2、特点、特点(1 1)P-III型型曲曲线线是是一一条条一一端端有有限限另另一一端端无无限限