《第三章 (2)水文统计基本知识.ppt》由会员分享,可在线阅读,更多相关《第三章 (2)水文统计基本知识.ppt(45页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 水文与水资源水文与水资源学学WaterHydrology授课教师:高鹏授课教师:高鹏 刘霞刘霞山东农业大学山东农业大学林学院水土保持系林学院水土保持系 第三章第三章(2)水文统计基本知)水文统计基本知识识第一节第一节概述概述第二节第二节机率与频率机率与频率第三节第三节统计参数统计参数第四节第四节经验频率曲线经验频率曲线第五节第五节理论频率曲线理论频率曲线第六节第六节适线法适线法第七节第七节相关分析相关分析 第一节第一节 概述概述水文现象和自然界中其他现象一样,水文现象和自然界中其他现象一样,其发生、发展和演变过程中,包含其发生、发展和演变过程中,包含必必然性和偶然性(随机性)然性和偶然性(随
2、机性)两面。两面。河流上任一断面的年径流量值,由河流上任一断面的年径流量值,由于每年有降水发生,则必有径流量产于每年有降水发生,则必有径流量产生,这是生,这是必然性,必然性,然而,年径流量,然而,年径流量,因受流域许多因素影响,即使年降水因受流域许多因素影响,即使年降水量相同,年径流量也不完全相同,这量相同,年径流量也不完全相同,这就是水文现象偶然性就是水文现象偶然性(随机性)。(随机性)。因此可把水文现象中的一些特征值因此可把水文现象中的一些特征值(如如瞬时流量、日,月、瞬时流量、日,月、年平均流量等年平均流量等)作为偶然量作为偶然量(随机变量随机变量)看待,应用数理统计的看待,应用数理统计
3、的原理和方法研究它的变化规律。原理和方法研究它的变化规律。例如,流域开发例如,流域开发河流未来的径河流未来的径流量;流量;设计拦河坝设计拦河坝未来河流洪水未来河流洪水的大小。的大小。但由于影响径流的因素众多,但由于影响径流的因素众多,难于应用成因分析法作出长期的时序难于应用成因分析法作出长期的时序定量预报。基于水文现象的统计规律定量预报。基于水文现象的统计规律性,可进行概率预估以满足规划设计性,可进行概率预估以满足规划设计的需要的需要水文统计法。水文统计法。水文统计法水文统计法:应用数理统计的原理和方法研究大:应用数理统计的原理和方法研究大量观测的水文偶然数列的规律,凭借短期的观测量观测的水文
4、偶然数列的规律,凭借短期的观测数列,推论某一水文现象未来的变化可能性。数列,推论某一水文现象未来的变化可能性。重力拦砂坝工程重力拦砂坝工程一、基本概念一、基本概念1.机率与事件机率与事件(1)机率机率指偶然事件在客观上可能出现的程度。指偶然事件在客观上可能出现的程度。(2)事件事件是机率和数理统计中最基本的概念,也是是机率和数理统计中最基本的概念,也是水文统计中常见的名词,它是指在一定的条件组合下,在试水文统计中常见的名词,它是指在一定的条件组合下,在试验的结果中所有可能出现或可能不出现的事情。验的结果中所有可能出现或可能不出现的事情。第二节第二节 机率与频率机率与频率自然界中的一切现象,可以
5、分成三种类型:自然界中的一切现象,可以分成三种类型:必然事件:必然事件:是指在一定条件下必然会发生的事情是指在一定条件下必然会发生的事情不可能事件:不可能事件:是指在条件实现之下永远不会发生的事情是指在条件实现之下永远不会发生的事情偶然事件偶然事件(也称随机事件、或然事件也称随机事件、或然事件):是指一定条件下,是指一定条件下,可能发生也可能不发生的事情可能发生也可能不发生的事情 第二节第二节 机率与频数机率与频数(3)机率计算公式)机率计算公式按照机率的古典定义,机率可以用按照机率的古典定义,机率可以用式中式中:P(A)一定条件组合下,随机事件出现的机率一定条件组合下,随机事件出现的机率m有
6、利于有利于A事件的可能总数;事件的可能总数;n可能的结果总数。可能的结果总数。(4 4)机率分类(举例:)机率分类(举例:白球和黑球白球和黑球)事先机率:事件出现的可能性与不可能性事先都非常清楚。事先机率:事件出现的可能性与不可能性事先都非常清楚。经验机率:经验机率:对于某些复杂事件,很难预知它出现与不出现的对于某些复杂事件,很难预知它出现与不出现的可能性,只能通过大量试验来估计它的机率,可能性,只能通过大量试验来估计它的机率,经验机率又称经验机率又称之为频率之为频率。2 2、频率、频率频率:指在具体重复试验中事件出现的次数与总次数之比频率:指在具体重复试验中事件出现的次数与总次数之比设事件设
7、事件A在在n次重复试验中,实际出现了次重复试验中,实际出现了m次,则事件的频次,则事件的频率为:率为:第二节第二节 机率与频率机率与频率实验证明,对于次数不多的试验,事件的频率有明显的随实验证明,对于次数不多的试验,事件的频率有明显的随机性,但试验的次数越多,事件的频率就渐趋稳定,频率就接机性,但试验的次数越多,事件的频率就渐趋稳定,频率就接近于机率。机率是个理论值,频率则为经验值。近于机率。机率是个理论值,频率则为经验值。实用意义:水文现象可以通过逐年积累资料,用事件出现的实用意义:水文现象可以通过逐年积累资料,用事件出现的频率作为事件的机率的近似值。水文研究和计算的目的,就是频率作为事件的
8、机率的近似值。水文研究和计算的目的,就是运用足够大的对总体具有代表性的样本,通过数理统计方法,运用足够大的对总体具有代表性的样本,通过数理统计方法,推估总体的近似值,以满足实际应用的需要。推估总体的近似值,以满足实际应用的需要。对于水文现象而言,其事先机率很难求得,所以通常只能对于水文现象而言,其事先机率很难求得,所以通常只能 借助于观测资料去求经验机率(即频率),但观测数据常常借助于观测资料去求经验机率(即频率),但观测数据常常是散乱的,因此,首先必须对观测数据进行适当整理以显示是散乱的,因此,首先必须对观测数据进行适当整理以显示其规律性。如何进行数据的初步整理?其规律性。如何进行数据的初步
9、整理?第二节第二节 机率与频率机率与频率 将样本的各项数据按由大而小的次序排列成表(如将样本的各项数据按由大而小的次序排列成表(如果数据较多,也可以分组统计);果数据较多,也可以分组统计);统计各个数据出现的次数(频数),计算其相应的统计各个数据出现的次数(频数),计算其相应的频率,并根据表绘图;频率,并根据表绘图;根据图表观察数据的大致分配情况,进而计算一些根据图表观察数据的大致分配情况,进而计算一些统计特征值,以概括了解数据的分配规律。统计特征值,以概括了解数据的分配规律。二、二、频率密度曲线和频率分布曲线频率密度曲线和频率分布曲线 1.1.频率密度图与累积频率图频率密度图与累积频率图频率
10、密度分布图频率密度分布图表示各种水文特征值与发生频率的关系表示各种水文特征值与发生频率的关系累积频率图累积频率图表示水文特征值和发生累积频率的关系表示水文特征值和发生累积频率的关系例:以某水文站例:以某水文站1947-1976年的实测洪水位资料为例,计年的实测洪水位资料为例,计算各组值的频率及累积频率。算各组值的频率及累积频率。表表1某站实测水位频率统计(某站实测水位频率统计(p33)水位组距水位组距(m)频数频数(a)累积频数累积频数(a)频率频率W(Hi)%累积频累积频P(HHi)%6260226.676.6760587923.3229.995856112036.6766.66565452
11、516.6783.33545232810.0093.3352502306.67100.00据上表,以水位为纵坐标,频率为横坐标,将实测数据据上表,以水位为纵坐标,频率为横坐标,将实测数据点绘于图中,得到频率密度图和累积频率图(下图)。点绘于图中,得到频率密度图和累积频率图(下图)。第二节第二节 机率与频率机率与频率2.频率密度曲线与频率分布曲线频率密度曲线与频率分布曲线 很多统计资料的出现次数(频数)或频率密度关系都与上很多统计资料的出现次数(频数)或频率密度关系都与上图中的(图中的(a)类同,即中间高而两侧低,离中间最远的地方出)类同,即中间高而两侧低,离中间最远的地方出现的次数最少。因此,
12、在资料项数趋于无穷且每组的间隔取成现的次数最少。因此,在资料项数趋于无穷且每组的间隔取成无穷小时,则频率密度图可以设想为一种钟形曲线,称这种光无穷小时,则频率密度图可以设想为一种钟形曲线,称这种光滑的钟形曲线为滑的钟形曲线为频率密度曲线,方程以频率密度曲线,方程以y=f(x),称为频率密度称为频率密度函数。累积后的函数。累积后的S形曲线称为频率分布曲线,其相应方程式:形曲线称为频率分布曲线,其相应方程式:P称为频率分布函数。称为频率分布函数。频率密度曲线和频率分布曲线如下图所示:频率密度曲线和频率分布曲线如下图所示:注意:累积频率具有两个特性:注意:累积频率具有两个特性:当当X=Xmin时,时
13、,P=1;当;当X=Xmax时,时,P=0。频率频率P P是水文计算和水利水保工程设计中的重要指标,但概是水文计算和水利水保工程设计中的重要指标,但概念抽象,因此,在水文学中常用重现期来代替念抽象,因此,在水文学中常用重现期来代替。重现期(重现期(T T)是指等量或超量的水文特征值平均多少年是指等量或超量的水文特征值平均多少年一遇或多少年出现一次。一遇或多少年出现一次。第二节第二节 机率与频率机率与频率频率频率P(%)与重现期)与重现期(T)的关系如下:的关系如下:1.研究对象为暴雨或洪水时,一般的研究对象为暴雨或洪水时,一般的2.设计频率设计频率P50%,则,则三、重现期三、重现期频率与重现
14、期的关系及其意义见下表频率与重现期的关系及其意义见下表频率频率P(%)重现期重现期(T)意意义义1100平均百年一遇的多水年平均百年一遇的多水年1010平均十年一遇的多水年平均十年一遇的多水年502平均二年一遇的中水年平均二年一遇的中水年.(平水年)(平水年)9010平均十年一遇的少水年平均十年一遇的少水年99100平均百年一遇的少水年平均百年一遇的少水年水文上常用的统计参数有以下几种:水文上常用的统计参数有以下几种:第三节第三节 统计参数统计参数一、算术平均值、中值和众值一、算术平均值、中值和众值(一)(一)算术平均值(均值)算术平均值(均值)设设实实测测系系列列的的随随机机变变量量为为x1
15、,x2,x3,xn,其其相相应应出出现现的的次次数数为为f1,f2,f3,fn。由由于于fi的的大大小小对对平平均均值值有有影影响响,必必须须权权衡衡其其轻轻重重,并并以以fi为为权权数数,且且f1+f2+f3+fn=n,则则加加权算术平均值为:权算术平均值为:若为等权随机变量,即若为等权随机变量,即f1=f2=f3=fn,则算术平均值按,则算术平均值按下式计算:下式计算:意义:意义:(1)均值集中反映系列在数值上的大小情况。例如实测)均值集中反映系列在数值上的大小情况。例如实测系列为降水资料,则平均值大的表示该地降水充沛,若为洪系列为降水资料,则平均值大的表示该地降水充沛,若为洪水流量资料,
16、则平均值大的表示该地洪水流量较大。水流量资料,则平均值大的表示该地洪水流量较大。(2)均值还可绘成等值线图,用来表示水文特征值的空)均值还可绘成等值线图,用来表示水文特征值的空间分布情况。如平均径流量与平均降水量的等值线图。间分布情况。如平均径流量与平均降水量的等值线图。第三节第三节 统计参数统计参数将将n项观测系列依大小次序排列后,位置居中的那个项观测系列依大小次序排列后,位置居中的那个数值便称为中值数值便称为中值(中位数中位数)。当。当n为偶数时,则取这系列正为偶数时,则取这系列正中的那两数的平均值为中值。中的那两数的平均值为中值。例如,系列例如,系列10,11,13,15,17,19的中
17、值,即第三的中值,即第三项和第四项的平均值等于项和第四项的平均值等于(13+15)/2=14。(二)中值(二)中值(三)众值(三)众值 在某一频率分配中出现次数最多的那一个数称为在某一频率分配中出现次数最多的那一个数称为这一系列分配的众数,在众数处频率密度函数这一系列分配的众数,在众数处频率密度函数 f(xf(x)取取得极大值,因而得极大值,因而 平均值不能充分说明变量分布在平均值左右的疏密程度,平均值不能充分说明变量分布在平均值左右的疏密程度,即离散程度的大小。为了研究系列变量的变化幅度,数理统计即离散程度的大小。为了研究系列变量的变化幅度,数理统计学中采用离差系数学中采用离差系数C CV
18、V来表示系列的离散情况。(均方差来表示系列的离散情况。(均方差)第三节第三节 统计参数统计参数对样本:对样本:令令 则上述公式可变为:则上述公式可变为:对总体:对总体:式中式中k ki i称为变率或模比系数。称为变率或模比系数。对总体:对总体:对样本:对样本:二、离差系数二、离差系数 C CV V三、偏差系数三、偏差系数cs 说说明明系系列列中中各各值值在在平平均均值值左左右右的的分分布布情情况况,也也就就是是说说,是是大大于于平平均均值值的的特特征征值值多多还还是是小小于于平平均均值值的的特特征征值值多,采用偏差系数多,采用偏差系数CsCs表示,其计算公式如下:表示,其计算公式如下:第三节第
19、三节 统计参数统计参数对总体:对总体:对样本:对样本:因为因为 所以所以 当当n较大时,较大时,则,则,当当时,时,称为正偏分布,表示实测系称为正偏分布,表示实测系列中正离差占优势列中正离差占优势 当当时,时,称为负偏分布,表示实测系称为负偏分布,表示实测系列中负离差占优势列中负离差占优势 当当时,时,称为对称分布,表示比平均称为对称分布,表示比平均值大的或小的离差各占其半,值大的或小的离差各占其半,即正、负离差均等即正、负离差均等资料的项数不多时,计算出来的误差很大,一般认资料的项数不多时,计算出来的误差很大,一般认为不足百年资料,即在为不足百年资料,即在100项以下时,项以下时,cs计算结
20、果是不计算结果是不可靠的,所以实用上一般都是采用经验性方法,比如可靠的,所以实用上一般都是采用经验性方法,比如取取等于若干倍等于若干倍,如年径流与年降雨量在研,如年径流与年降雨量在研究不足的地区,常采用究不足的地区,常采用,计算设计暴雨时,计算设计暴雨时,采用采用 第三节第三节 统计参数统计参数 第四节第四节 经验频率曲线经验频率曲线一、经验频率的计算一、经验频率的计算经验频率经验频率是指根据实测资料,按递减次序排列,然后依次是指根据实测资料,按递减次序排列,然后依次计算其频率。常见的计算经验频率的公式有以下四种:计算其频率。常见的计算经验频率的公式有以下四种:海森公式海森公式均值公式或维泊尔
21、公式均值公式或维泊尔公式(常用)(常用)中值公式或切哥达也夫公式中值公式或切哥达也夫公式式中:式中:n按由大到小次序排列的系列按由大到小次序排列的系列x1,x2,x3,xn,的总项数,的总项数;m等量或超量的项数,或某项等量或超量的项数,或某项在递减系列中的位次在递减系列中的位次;P经验频率经验频率二、经验频率曲线的绘制与使用二、经验频率曲线的绘制与使用 用经验频率公式求出系列用经验频率公式求出系列 x x1 1,x x2 2,x x3 3,x xn n,的各项相应的经验频率,的各项相应的经验频率PiPi,以以X Xi i为纵坐标,为纵坐标,P Pi i为横为横坐标,即可在机率格纸上通过各经验
22、频率点联绘成坐标,即可在机率格纸上通过各经验频率点联绘成一条光滑曲线,称为经验频率曲线。一条光滑曲线,称为经验频率曲线。实例说明绘制步骤:实例说明绘制步骤:例:某站有例:某站有19491970年期间年最大洪峰流量(年期间年最大洪峰流量(P38-39页),见下表(页),见下表(3)栏,试绘该站年最大洪峰流量经验频)栏,试绘该站年最大洪峰流量经验频率曲线。率曲线。步骤:步骤:1、整理实测资料,将实测、整理实测资料,将实测年最大洪峰流量由大到小排年最大洪峰流量由大到小排列,编上序号,表第列,编上序号,表第4栏。栏。2、按均值公式计算各项所、按均值公式计算各项所对应的经验频率对应的经验频率(或查附表(
23、或查附表一)一)记入表中第七栏。记入表中第七栏。3、按表中第四和第七栏的对应值在机率格纸(也叫海森机、按表中第四和第七栏的对应值在机率格纸(也叫海森机率格纸)上点绘出各经验点。率格纸)上点绘出各经验点。4、根据经验频率点据的分布趋势,目估连绘出一条光滑曲、根据经验频率点据的分布趋势,目估连绘出一条光滑曲线,即为该站年最大洪峰流量的经验频率曲线。线,即为该站年最大洪峰流量的经验频率曲线。如下图:如下图:第四节第四节 经验频率曲线经验频率曲线 从经验频率曲线图上,看出:从经验频率曲线图上,看出:据据20余年的实测资料,在经验频率余年的实测资料,在经验频率曲线上仅能读出相应于曲线上仅能读出相应于P=
24、4%至至P=95%所对应的年最大洪峰流量值。所对应的年最大洪峰流量值。为推求更小频率,如为推求更小频率,如P=2(50年一年一遇遇)或或P=1(百年一遇百年一遇)的设计洪水,的设计洪水,则需将曲线向左上方外延,这种外则需将曲线向左上方外延,这种外延具有任意性,如图虚线,无法断延具有任意性,如图虚线,无法断定哪个正确,为此,只能利用具有定哪个正确,为此,只能利用具有数学形式的理论频率曲线。数学形式的理论频率曲线。第四节第四节 经验频率曲线经验频率曲线 第五节第五节 理论频率曲线理论频率曲线理论频率曲线是水文现象总体情况的一种假想模型。理论频率曲线是水文现象总体情况的一种假想模型。适合于水文现象频
25、率特征的数学模型较多,常用有适合于水文现象频率特征的数学模型较多,常用有皮皮尔逊尔逊III型型和克里茨基和克里茨基闵凯里曲线两种。闵凯里曲线两种。一、皮尔逊一、皮尔逊IIIIII型曲线型曲线 1895年,英国生物学家皮尔逊年,英国生物学家皮尔逊首先提出。根据经验资料的统计首先提出。根据经验资料的统计结果发现,频率密度曲线存在着结果发现,频率密度曲线存在着一个类似的特点一个类似的特点有一个众值有一个众值(出现次数最多的变量),数值(出现次数最多的变量),数值愈大或愈小的变量出现的次数较愈大或愈小的变量出现的次数较少,曲线近似呈钟形,右图。少,曲线近似呈钟形,右图。根据这一特点,皮尔逊建立了根据这
26、一特点,皮尔逊建立了机率密度微分方程式:机率密度微分方程式:解此方程可得解此方程可得13种类型的曲线,当种类型的曲线,当b2=0时,皮尔逊时,皮尔逊III型曲线的微分形式如下:型曲线的微分形式如下:积分后可得皮尔逊积分后可得皮尔逊IIIIII型曲线型曲线方程式的一般形式:方程式的一般形式:式中:式中:Ym曲线最大纵坐标,为众值出现的机率;曲线最大纵坐标,为众值出现的机率;a曲线起点与众值的距离;曲线起点与众值的距离;d均值与众值之间的距离;均值与众值之间的距离;e自然对数底;自然对数底;其中其中a、d、Ym均为待定参数,可根据统计参数均为待定参数,可根据统计参数、Cv、Cs求得。求得。第五节第
27、五节 理论频率线理论频率线二、统计参数对皮尔逊二、统计参数对皮尔逊IIIIII型曲线形状的影响型曲线形状的影响 1.Cs变化对曲线形状的影响变化对曲线形状的影响 第五节第五节 理论频率曲线理论频率曲线(1)cs=0时,均值与众值重合,系列呈对称分布时,均值与众值重合,系列呈对称分布(2)cs0时,则时,则d0,系列呈正偏分布。,系列呈正偏分布。(3)cs0时,则时,则d0的情况下,当的情况下,当Cs增大时,曲线上端逐渐增大时,曲线上端逐渐变陡,下端逐渐变平;当变陡,下端逐渐变平;当Cs2Cv时,在时,在P=100%处出现负值,处出现负值,图图c所示。所示。理解统计参数对频率曲线的影响,有助于理
28、解统计参数对频率曲线的影响,有助于在应用适线法绘制频率曲线时更确切的选择参在应用适线法绘制频率曲线时更确切的选择参数。数。另外,应用皮尔逊另外,应用皮尔逊III型曲线计算时,必须型曲线计算时,必须联系水文现象的物理性质来确定曲线的应用范联系水文现象的物理性质来确定曲线的应用范围。围。当当Cs2Cv时,时,k值将出现负值,如分析年值将出现负值,如分析年降雨量或径流量等,都不可能出现负值,出现降雨量或径流量等,都不可能出现负值,出现Cs 4 4ErEr成立,可以认为相关关系成立,可以认为相关关系是密切的,由这类资料所得的回归线即可用来插补或展延资料。是密切的,由这类资料所得的回归线即可用来插补或展
29、延资料。其中:其中:1 1、频率;经验频率;、频率;经验频率;、频率;经验频率;、频率;经验频率;2 2、何谓重现期?重现期的意义、何谓重现期?重现期的意义、何谓重现期?重现期的意义、何谓重现期?重现期的意义?3 3、统计参数、统计参数、统计参数、统计参数C Cv v和和和和C Cs对频率曲线(皮尔逊对频率曲线(皮尔逊对频率曲线(皮尔逊对频率曲线(皮尔逊型曲线型曲线型曲线型曲线形状的影响形状的影响形状的影响形状的影响?4 4、适线法及其依据,主要做法?、适线法及其依据,主要做法?、适线法及其依据,主要做法?、适线法及其依据,主要做法?5 5、设有、设有、设有、设有A A、B B两站的洪峰流量(两站的洪峰流量(两站的洪峰流量(两站的洪峰流量(mm2 2/s/s)资料如下,)资料如下,)资料如下,)资料如下,试利用试利用试利用试利用A A站资料展延站资料展延站资料展延站资料展延B B站资料。教材站资料。教材站资料。教材站资料。教材P54P54 第四章第四章 思思 考考 题题