《四章水文统计.ppt》由会员分享,可在线阅读,更多相关《四章水文统计.ppt(44页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、四章水文统计 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望4.1 概述 水文现象水文现象是自然现象的一种,在其发生和演变是自然现象的一种,在其发生和演变过程中,包含着必然性的一面,也包着偶然性的一过程中,包含着必然性的一面,也包着偶然性的一面。面。随机现象所遵循的规律叫做随机现象所遵循的规律叫做统计规律统计规律。研究随机现象统计规律的学科称为研究随机现象统计规律的学科称为概率论概率论,而,而由随机现象的一部分试验资料去研究全体现象的数由随机现象的一部分试验资料去
2、研究全体现象的数量特征和规律的学科称为量特征和规律的学科称为数理统计学数理统计学。由于水文现象具有一定的随机性,用数理统计由于水文现象具有一定的随机性,用数理统计方法来分析研究这些现象称为方法来分析研究这些现象称为水文统计学水文统计学。4.2 概率的基本概念与定理一、事件一、事件 事件事件是指随机试验的结果。是指随机试验的结果。必然事件必然事件:如果可以断定某一事件在:如果可以断定某一事件在试验中必然发生,称此事件必然事件。试验中必然发生,称此事件必然事件。不可能事件不可能事件:可以断定试验中不会发:可以断定试验中不会发生的事件称为不可能事件。生的事件称为不可能事件。随机事件随机事件:某种事件
3、在试验结果中可:某种事件在试验结果中可以发生也可以不发生,这样的事件就称为以发生也可以不发生,这样的事件就称为随机事件。随机事件。二、概率二、概率 随机事件在试验结果中可能出现也可随机事件在试验结果中可能出现也可能不出现,但其出现(或不出现)可能性能不出现,但其出现(或不出现)可能性的大小则有所不同。为了比较这种可能性的大小则有所不同。为了比较这种可能性的大小,必须赋于一种数量标准,这个数的大小,必须赋于一种数量标准,这个数量标准就是事件的量标准就是事件的概率概率。三、频率三、频率 水文事件不属古典概型事件,只能通过水文事件不属古典概型事件,只能通过试验来估算概率。设事件在试验来估算概率。设事
4、件在次试验中出次试验中出现了现了次,则称为事件次,则称为事件A A 的的频率频率。在试验。在试验次数足够大的情况下,事件的频率和概率次数足够大的情况下,事件的频率和概率是十分接近的。是十分接近的。四概率加法定理和乘法定理四概率加法定理和乘法定理 概率加法定理概率加法定理 ()()()()()()()()式中,式中,()事件与之和的概()事件与之和的概率;率;()事件的概率;()事件的概率;()事件的概率。()事件的概率。()事件和共同发生的()事件和共同发生的概率。概率。2 2、概率乘法定理、概率乘法定理 ()()()()()()()()()式中,式中,()事件在事件已发生情()事件在事件已发
5、生情况下的概率,简称为的条件概率况下的概率,简称为的条件概率 ()事件在事件已发生情()事件在事件已发生情况下的概率,简称为的条件概率况下的概率,简称为的条件概率 对于两个独立事件:对于两个独立事件:()()()()()()事件关系分析事件关系分析互斥互斥 P P(ABAB)0 0 P P(A AB B)P P(A A)P P(B B)相容相容 P P(A A)P P(B B)1 1 P P(A A)1 1P P(B B)对立对立 P P(B B)1 1P P(A A)P P(ABAB)P P(A A)P P(B B)P P(A/BA/B)P P(A A)独立独立 P P(B/AB/A)P P
6、(B B)P P(ABAB)P P(A A)P P(B/AB/A)P P(B B)P P(A/BA/B)4.3 随机变量及其概率分布一、随机变量一、随机变量 随机变量是表示随机试验结果的数量随机变量是表示随机试验结果的数量表示,随机变量可分为两大类型:离散型表示,随机变量可分为两大类型:离散型随机变量,连续型随机变量。随机变量,连续型随机变量。二、随机变量的概率分布二、随机变量的概率分布 即随机变量的取值与其概率有一定的对即随机变量的取值与其概率有一定的对应关系,称为随机变量的概率分布,数理统应关系,称为随机变量的概率分布,数理统计学上记为计学上记为F F(x x)P P(X xX x),称为
7、),称为随机随机变量的概率分布函数变量的概率分布函数。水文统计中通常研究随机变量的取值大水文统计中通常研究随机变量的取值大于某一个值的概率,于某一个值的概率,F F(x x)P P(X Xx x)在水)在水文统计学上也称此为随机变量的文统计学上也称此为随机变量的概率分布函概率分布函数数(或概率分布曲线)。(或概率分布曲线)。函数函数f f(x x)-F F(x x)为概率密度函数,概率密度函数,简称称为密度函数或密度曲密度函数或密度曲线。三、随机变量的分布参数三、随机变量的分布参数 概率分布曲线完整地刻划了随机变量的统计规律。但在一些实际问题中,有时只要知道概率分布某些特征数值。这种以简便的形
8、式显示出随机变量分布规律的某些特征数字称为随机变量的分布参数。(一)位置特征参数 平均数反映密度分布的重心,计算公式 亦可写成数学期望 连续型随机变量的数学期望 (二)离散特征参数 离散特征参数是刻划随机变量分布离散程度的离散特征参数是刻划随机变量分布离散程度的指标。指标。1 1标准差(均方差)标准差(均方差)分布愈内分散,标准差愈大;分布愈集中,分布愈内分散,标准差愈大;分布愈集中,标准愈小。标准愈小。标准差的平方标准差的平方2 2称为方差。称为方差。2 2离势系数(离差系数,变差系数)离势系数(离差系数,变差系数)甲地区的年雨量分布,甲地区的年雨量分布,EXEX1 11200mm1200m
9、m,标准差,标准差1 1360mm360mm;乙地区的年雨量分布,;乙地区的年雨量分布,EXEX2 2800mm800mm,标准差,标准差2 2320mm320mm。尽管。尽管1 12 2,但是,但是 EXEX2 2 EXEX1 1,应从相对观点来比较这两个分布的离散,应从相对观点来比较这两个分布的离散程度。程度。采用一个无因次的数字来衡量分布的相对离采用一个无因次的数字来衡量分布的相对离散程度,称为离势系数散程度,称为离势系数 算得两个地区年雨量的离势系数,算得两个地区年雨量的离势系数,CVCV1 10.300.30,CVCV2 20.400.40。说明甲地区的年雨量离散程度较乙。说明甲地区
10、的年雨量离散程度较乙地区的为小。地区的为小。3 3偏态系数(偏差系数)偏态系数(偏差系数)反映分布是否对称的特征反映分布是否对称的特征CSCS参数,记为参数,记为 用来表征分布不对称的情况。当密度曲线对用来表征分布不对称的情况。当密度曲线对EXEX对称,对称,CSCS0 0;若不对称,当正离差的立方占优;若不对称,当正离差的立方占优时,时,CSCS 0 0,称为正偏;当负离差的立方占优势,称为正偏;当负离差的立方占优势时,时,CSCS 0 0,称为负偏。,称为负偏。四、几种常用的概率分布曲线四、几种常用的概率分布曲线(一)正态分布(一)正态分布 概率密度函数形式:概率密度函数形式:式中,式中,
11、平均数平均数 标准差标准差 正态分布在误差估算时将会应用。正态分布在误差估算时将会应用。(二)皮尔逊(二)皮尔逊型分布型分布 皮尔逊皮尔逊IIIIII型曲线为一端有限一端无限型曲线为一端有限一端无限的不对称单峰曲线,概率密度函数的不对称单峰曲线,概率密度函数式中,式中,a a0 0参数,且有:参数,且有:如果已知设计值如果已知设计值x xP P,推求:,推求:x xp p 取决于取决于p p、和和O O四个数,并且当四个数,并且当、O O 三个参数为已知时,则三个参数为已知时,则x xp p只取决于只取决于p p了。了。、O O与分布曲线的与分布曲线的EXEX,C CV V和和C CS S有关
12、,因此只要确定有关,因此只要确定EXEX、C CV V和和C CS S,x xp p仅与仅与p p有关,可以由有关,可以由p p唯一地来计算唯一地来计算x xp p。P P3 3型分布的型分布的积分无解析解,分无解析解,实用中制表用中制表查用。用。取取标准化准化变量量(离均系数)(离均系数)将之代入式(将之代入式(3 32222)得)得 被被积函数只含一个参数函数只含一个参数CS。只要。只要给定定CS就可以算就可以算出出P P和和P P的的对应值,最,最终制定出制定出P PCsCsp p 的的对应数数值表(表表(表3 32 2)。)。4.4 4.4 统计参数估算统计参数估算 在概率分布函数中包
13、含有在概率分布函数中包含有 ,CV,CS三个参数。三个参数。为了唯一确定概率分布函数,就得估算了唯一确定概率分布函数,就得估算这些参数。些参数。一、一、样本估本估计总体体 随机随机变量所取数量所取数值的全体称的全体称为总体,从体,从总体中体中任意抽取的一部分称任意抽取的一部分称为样本,本,样本中所包括的本中所包括的项数称数称为样本容量。水文本容量。水文变量的量的总体是指自古迄今以至未来体是指自古迄今以至未来长远岁月所有的水文系列,是不知道的,需要靠月所有的水文系列,是不知道的,需要靠观测到的到的样本去估本去估计总体参数。体参数。现有的水文有的水文观测的系列可的系列可以当作以当作总体的一个随机体
14、的一个随机样本来本来处理。理。某地降雨量某地降雨量频率率计算表算表 由表由表资料可料可绘出如出如图所示的折所示的折线图,该图表示年降表示年降水量水量P(Xx x)的)的频率率W W(X Xx x)和)和x x的关系的关系 x 1200 1000 800 0 20 40 60 80 100 W(%)某地年降雨量某地年降雨量经验分布曲分布曲线 随着样本容量的增即随着观测次数的增随着样本容量的增即随着观测次数的增加,频率加,频率w w就非常接近于概率就非常接近于概率p p,经验分布曲,经验分布曲线就非常接近于总体分布曲线。在某种程度线就非常接近于总体分布曲线。在某种程度上由样本的经验分布来推测总体分
15、布,总体上由样本的经验分布来推测总体分布,总体的参数就可以通过抽出的样本(观测的系列)的参数就可以通过抽出的样本(观测的系列)来加以估算。来加以估算。(1 1)样本的均值)样本的均值X X,它与总体均值相对应,即,它与总体均值相对应,即(2 2)样本标准)样本标准S S 与总体标准差与总体标准差相对应,即相对应,即 (3 3)样本离势系数)样本离势系数CvCv与总体离势系数相结应,即与总体离势系数相结应,即 (4 4)样本偏态系数)样本偏态系数C CS S,与总体参数偏态系数相对应,即与总体参数偏态系数相对应,即 只要掌握了样本,借助上列公式估计出参数;就可推出只要掌握了样本,借助上列公式估计
16、出参数;就可推出概率分布曲线,这种方法叫做矩法。概率分布曲线,这种方法叫做矩法。原矩法公式得出的原矩法公式得出的S S,C CV V ,和和C CS S 并不是无偏估计并不是无偏估计量,目前水文上采用的是经修正后的矩法公式量,目前水文上采用的是经修正后的矩法公式:三、抽样误差三、抽样误差 由样本参数估计总体参数总会出现误差,称为抽由样本参数估计总体参数总会出现误差,称为抽样误差。样误差。例如,就样本平均值而言,各个样本平均值的抽例如,就样本平均值而言,各个样本平均值的抽样误差当然是不同的,有的大,有的小。由于样误差当然是不同的,有的大,有的小。由于EXEX是未是未知的,对某一样本平均值的抽样误
17、差无法求得。知的,对某一样本平均值的抽样误差无法求得。样本平均数的抽样误差与其样本平均数抽样分布样本平均数的抽样误差与其样本平均数抽样分布有关,其大小可以用表征抽样分布离散程度的均方差有关,其大小可以用表征抽样分布离散程度的均方差 x x来度量,称样本平均值的均方差。来度量,称样本平均值的均方差。以上以上对样本平均数抽本平均数抽样误差的差的讨论,其基本原,其基本原则完全完全适用于其他适用于其他样本参数。据本参数。据统计理理论,可推,可推导出各参数均方出各参数均方误的公式,它与的公式,它与总体分布有关。体分布有关。样本参数的均方误差(相对误差,%)由表中可见,由表中可见,C CS S的误差很大。
18、当的误差很大。当n n100100时,时,C CS S的误差的误差在在40%40%126%126%之间。之间。n n1010时,则在时,则在126%126%以上,超出了以上,超出了C CS S本身的数值。水文资料一般都很短(本身的数值。水文资料一般都很短(n n100100)可见直接)可见直接由资料按矩法公式算得的由资料按矩法公式算得的C CS S值,抽样误差太大。值,抽样误差太大。x 1200 1000 800 0 20 40 60 80 100 W(%)图3-9 某地年降雨量经验分布曲线W(Xxi)i/n4.5 4.5 水文频率的计算方法水文频率的计算方法 一一、经验频率曲线经验频率曲线
19、二、经验频率二、经验频率 如果用如果用W(X xi)i/n 的经验分布曲线估计总的经验分布曲线估计总体分布曲线,存在不合理现象。当体分布曲线,存在不合理现象。当m mn n时,最末项的时,最末项的频率为频率为100%100%,样本末项值为总体中的最小值,不符合,样本末项值为总体中的最小值,不符合事实,因为比样本最小值更小的数值今后仍可能出现。事实,因为比样本最小值更小的数值今后仍可能出现。水文上用期望值公式估计频率水文上用期望值公式估计频率 频率这个词比较抽象,为便于理解,有时采用频率这个词比较抽象,为便于理解,有时采用重现期这个词。所谓重现期是指在许多试验中,某重现期这个词。所谓重现期是指在
20、许多试验中,某一事件重复出现的时间间隔的平均数。一事件重复出现的时间间隔的平均数。在工程水文中,重现期用字母在工程水文中,重现期用字母 T T 表示,一般以表示,一般以年为单位。年为单位。当研究暴雨洪水当研究暴雨洪水问题时 例如,当暴雨或洪水的例如,当暴雨或洪水的频率采用率采用p p1%1%时,T T100100年,称此暴雨年,称此暴雨为百年一遇的暴雨或洪水。百年一遇的暴雨或洪水。当研究枯水当研究枯水问题时 例如,例如,对于于p p80%80%枯水流量,枯水流量,T T5 5年,称此年,称此为五五年一遇的枯水流量。或称年一遇的枯水流量。或称为保保证率率为8080的的设计流量。流量。所谓百年一遇
21、的暴雨或洪水,是指大于或等所谓百年一遇的暴雨或洪水,是指大于或等于这样的暴雨或洪水在长时期内平均于这样的暴雨或洪水在长时期内平均100100年发年发生一次,而不能认为每隔生一次,而不能认为每隔100100年必然遇上一次。年必然遇上一次。计算步骤:(1 1)点绘经验点据点绘经验点据 纵坐标为变量值,横坐标为经纵坐标为变量值,横坐标为经验频率,采用期望值公式估计。验频率,采用期望值公式估计。(2 2)初定一组参数初定一组参数 用矩法公式的估算用矩法公式的估算EXEX和和CVCV,并,并假定假定CSCS与与CVCV的比值的比值K K估算估算CSCS 。(3 3)根据初定的)根据初定的EXEX、CVC
22、V和和CSCS,计算频率曲线计算频率曲线,并绘,并绘在点有经验点据的图上。若与经验点据配合不理想,在点有经验点据的图上。若与经验点据配合不理想,则修改参数再次则修改参数再次配线配线,主要调整,主要调整CVCV以及以及CS CS。(4 4)选选择一条与经验点据配合最佳曲择一条与经验点据配合最佳曲线线作为采用曲作为采用曲线。该曲线的参数看作总体参数的估计值。线。该曲线的参数看作总体参数的估计值。为了避免修改参数的盲目性,需要了解参数对频为了避免修改参数的盲目性,需要了解参数对频率曲线的影响。率曲线的影响。由由频率曲线图频率曲线图可明显看出,可明显看出,CVCV值愈大,曲线愈陡;值愈大,曲线愈陡;当
23、当CSCS增大时,曲线上段变陡而下段趋于平缓。增大时,曲线上段变陡而下段趋于平缓。配线法采用了概率格纸,以正态分布曲线成直线配线法采用了概率格纸,以正态分布曲线成直线来划分概率坐标的。当来划分概率坐标的。当CSCS0 0,频率曲线在概率纸上,频率曲线在概率纸上为一直线。其特点是横坐标的两端分格较稀而中间较为一直线。其特点是横坐标的两端分格较稀而中间较密,纵坐标为均匀分格或对数分格。这样,曲线两端密,纵坐标为均匀分格或对数分格。这样,曲线两端的坡度变缓,使用起来比较方便。的坡度变缓,使用起来比较方便。某站年降水量某站年降水量频率率计算表算表 某站共有实测降雨某站共有实测降雨量资料量资料2424年
24、,求频年,求频率为率为20%20%和和90%90%的年的年降水量。降水量。(3 3)用矩法)用矩法计算系列的多年平均降水量和离算系列的多年平均降水量和离差系数。差系数。(4 4)选定)选定CVCV0.300.30,并假定,并假定CSCS2 2CVCV0.600.60查表查表3-23-2得得PP,求得,求得 xPxP (PCVPCV1 1),如表),如表(3 3)栏。根据表中()栏。根据表中(1 1)、()、(3 3)两栏的对应数值)两栏的对应数值点绘曲线点绘曲线,发现曲线头部和尾部都偏于经验频率,发现曲线头部和尾部都偏于经验频率点据之下。点据之下。(5 5)改变参数,重新配线。因为曲线头尾部偏
25、低,)改变参数,重新配线。因为曲线头尾部偏低,故需增大故需增大CSCS,CVCV0.300.30不变,不变,CSCS3 3CVCV0.900.90,查,查算出各算出各xPxP值,列入表(值,列入表(4 4)、()、(5 5)栏,点绘后曲)栏,点绘后曲线的头部和尾部反而有些偏离,配线仍不理想。线的头部和尾部反而有些偏离,配线仍不理想。(6 6)再次改变参数,第三次配线。把)再次改变参数,第三次配线。把CSCS稍微调稍微调小一些。选定小一些。选定CVCV0.300.30,CSCS2.5 2.5,CVCV0.750.75,查表计算出各,查表计算出各xPxP值,列入表(值,列入表(6 6)、()、(7
26、 7)栏中。)栏中。绘制频率曲线,该线与经验点据配合较好,取为绘制频率曲线,该线与经验点据配合较好,取为最后采用的频率曲线。最后采用的频率曲线。(7 7)求得)求得p p10%10%的年降水量为的年降水量为933mm933mm,p p90%90%的年降水量为的年降水量为433mm433mm。频率曲线选配计算表频率曲线选配计算表4.6 相关分析 自然界中有许多现象之间是有一定联系的。自然界中有许多现象之间是有一定联系的。按数理统计法建立上述两个或多个随机变量之间按数理统计法建立上述两个或多个随机变量之间的联系,称之为近似关系或的联系,称之为近似关系或相关关系相关关系。把对这种。把对这种关系的分析
27、和建立称为关系的分析和建立称为相关分析相关分析。相关分析可以。相关分析可以用来延长和插补短系列。用来延长和插补短系列。根据变量之间相互关系的密切程度,变量之根据变量之间相互关系的密切程度,变量之间的关系有三种情况:即间的关系有三种情况:即完全相关、零相关、统完全相关、零相关、统计相关计相关。若两个变量之间的关系界于完全相关和零相关若两个变量之间的关系界于完全相关和零相关之间,则称为之间,则称为相关关系相关关系或统计相关。当只研究两个或统计相关。当只研究两个变量的相关关系时,称为变量的相关关系时,称为简相关简相关;当研究;当研究3 3个或个或3 3个个以上变量的相关关系时,则称为以上变量的相关关
28、系时,则称为复相关复相关。在相关的。在相关的形式上,又可分为直线相关和非直线相关形式上,又可分为直线相关和非直线相关.相关分析(或回归分析)的内容一般包括三个相关分析(或回归分析)的内容一般包括三个方面:方面:(1 1)判定变量间是否存在相关关系,若存)判定变量间是否存在相关关系,若存在,计算其相关系数,以判断相关的密切程度;在,计算其相关系数,以判断相关的密切程度;(2 2)确定变量间的数量关系)确定变量间的数量关系回归方程回归方程或相关线;或相关线;(3 3)根据自变量的值,预报或延长、插补)根据自变量的值,预报或延长、插补倚变量的值,并对该估值进行误差分析。倚变量的值,并对该估值进行误差
29、分析。一、简直线相关1 1相关图解法相关图解法 设设xi xi 和和yi yi 代表两系列的观测代表两系列的观测值,共有值,共有n n 对,把对应值点绘于方格对,把对应值点绘于方格纸上,得到很多相关点。如果相关点纸上,得到很多相关点。如果相关点的平均趋势近似直线,即可通过点群的平均趋势近似直线,即可通过点群中间点绘出相关直线中间点绘出相关直线.2 2相关计算法相关计算法 为避免相关图解法在定线上的任意性,常采用为避免相关图解法在定线上的任意性,常采用相关计算法来确定相关线的方程,即回归方程。相关计算法来确定相关线的方程,即回归方程。简直线相关方程的形式为简直线相关方程的形式为:y=a+bx y
30、=a+bx 式中式中 x x 自变量;自变量;y y 倚变量;倚变量;a a、b b 待定常数。待定常数。待定常数待定常数a a、b b 由观测点与直线拟合最佳,通过最由观测点与直线拟合最佳,通过最小二乘进行估计。小二乘进行估计。本章小结:明确以下概念:事件、概率、频率、随机明确以下概念:事件、概率、频率、随机变量等,掌握水文中频率计算方法变量等,掌握水文中频率计算方法适适线法,学会使用线法,学会使用值表或值表或KpKp值表,掌握直值表,掌握直线简相关的方法。线简相关的方法。随机变量的频率分布为重点理解。明确理随机变量的频率分布为重点理解。明确理解适线的目的、步骤、统计参数对曲线位解适线的目的、步骤、统计参数对曲线位置、形状的影响。理解相关分析的意义作置、形状的影响。理解相关分析的意义作用。用。掌握理论频率曲线绘制的技巧。掌握理论频率曲线绘制的技巧。重点难点:缺测资料的插补延长。重点难点:缺测资料的插补延长。