《工程水文学第三章水文统计讲稿.ppt》由会员分享,可在线阅读,更多相关《工程水文学第三章水文统计讲稿.ppt(65页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、工程水文学第三章水工程水文学第三章水文统计文统计第一页,讲稿共六十五页哦内内 容:容:3.1 3.1 水文统计的意义及基本概念水文统计的意义及基本概念3.2 3.2 频率和概率频率和概率3.3 3.3 经验频率曲线经验频率曲线3.4 3.4 随机变量的统计参数随机变量的统计参数 3.5 3.5 理论频率曲线理论频率曲线3.6 3.6 抽样误差抽样误差3.7 3.7 水文频率分析方法水文频率分析方法3.8 3.8 相关分析相关分析重重 点:点:水文频率及水文相关分析等水文统计基本知识;水文频率及水文相关分析等水文统计基本知识;水文频率及水文相关分析等水文统计计算。水文频率及水文相关分析等水文统计
2、计算。难难 点:点:水文频率及水文相关分析等水文统计计算水文频率及水文相关分析等水文统计计算第二页,讲稿共六十五页哦3.1水文统计的意义及基本概念水文统计的意义及基本概念3.1.1水文统计的意义水文统计的意义水文现象具有必然性、偶然性(随机性);水文现象具有必然性、偶然性(随机性);利用概率论和数理统计的理论和方法,研究和分析水文的利用概率论和数理统计的理论和方法,研究和分析水文的随机现象(已经观测到的水文现象),找出水文现象的统随机现象(已经观测到的水文现象),找出水文现象的统计规律性;计规律性;以此为基础,对水文现象未来可能的长期变化做出概率意以此为基础,对水文现象未来可能的长期变化做出概
3、率意义下的定量预估,以满足工程规划、设计、施工以及运营义下的定量预估,以满足工程规划、设计、施工以及运营期间的需要。期间的需要。第三页,讲稿共六十五页哦3.1.2事件事件随机试验:对随机现象的观测随机试验:对随机现象的观测事件:随机试验的结果。包括:事件:随机试验的结果。包括:1)1)必然事件:在一定能够的条件组合下,必然会发生的必然事件:在一定能够的条件组合下,必然会发生的事情。事情。2)2)不可能是件:在一定的条件组合下,一定不可能发生不可能是件:在一定的条件组合下,一定不可能发生的事情。的事情。3)3)随机事件:在一定的条件组合下,可能发生也可能不随机事件:在一定的条件组合下,可能发生也
4、可能不发生的事件。发生的事件。第四页,讲稿共六十五页哦3.1.3总体、样本、样本容量总体、样本、样本容量随机变量:受随机因素影响,遵循统计规律的变量。通俗随机变量:受随机因素影响,遵循统计规律的变量。通俗地讲,地讲,指在随机试验中测量到的数量。指在随机试验中测量到的数量。对于水文现象而言,对于水文现象而言,指某种水文特征值,如某地区流域出口的年径流量和洪峰指某种水文特征值,如某地区流域出口的年径流量和洪峰流量等。分:流量等。分:连续性随机变量,如水位、流量;连续性随机变量,如水位、流量;离散性随机变量,如投掷硬币的正反面。离散性随机变量,如投掷硬币的正反面。总体:随机变量所能取值的全体,分有限
5、和无限总体。总体:随机变量所能取值的全体,分有限和无限总体。样本:从总体中随机抽取出的一组观测值。样本:从总体中随机抽取出的一组观测值。样本容量:样本中所含随机变量的项数。样本容量:样本中所含随机变量的项数。第五页,讲稿共六十五页哦有的现象无法得到总体,例如水文现象。有的现象无法得到总体,例如水文现象。水文统计:各种水文现象的调查和实测过程当作水文统计:各种水文现象的调查和实测过程当作随机试验随机试验,把已观测到的水文资料当作总体的一个把已观测到的水文资料当作总体的一个随机样本随机样本(样本应足够大,才能比较好的反应总体的近似情况),(样本应足够大,才能比较好的反应总体的近似情况),利用利用数
6、理统计数理统计的方法分析样本的统计规律,的方法分析样本的统计规律,考虑考虑抽样误差抽样误差作为总体的规律,应用到工程中作为总体的规律,应用到工程中去解决实际问题。去解决实际问题。第六页,讲稿共六十五页哦3.1.4数理统计法对水文资料的要求数理统计法对水文资料的要求检查资料的可靠性;检查资料的可靠性;检查资料的一致性;检查资料的一致性;要求所使用的资料系列必须是要求所使用的资料系列必须是同一类型或者在同一条件同一类型或者在同一条件下下产生的。如:暴雨洪水和雨雪洪水;瞬时水位和日平均水产生的。如:暴雨洪水和雨雪洪水;瞬时水位和日平均水位。位。检查资料的代表性;检查资料的代表性;一般认为资料系列越长
7、,平丰枯水段齐全,其代表性越高。一般认为资料系列越长,平丰枯水段齐全,其代表性越高。检查资料的随机性;检查资料的随机性;检查资料的独立性。检查资料的独立性。第七页,讲稿共六十五页哦3.2频率和概率频率和概率3.2.1概率和频率概率和频率(1)频率)频率指在具体重复的实验中,某随机事件指在具体重复的实验中,某随机事件A出现的次数(频出现的次数(频数)数)m与试验总次数与试验总次数n的比值,即:的比值,即:第八页,讲稿共六十五页哦(2)概率)概率概率是指随即事件在客观上出现的可能性,即该事件概率是指随即事件在客观上出现的可能性,即该事件的发生率,亦称为机率。根据事件出现的可能性是能够预的发生率,亦
8、称为机率。根据事件出现的可能性是能够预先估计出来,可分为事先概率和事后概率:先估计出来,可分为事先概率和事后概率:事先概率:试验之前某随机事件出现的可能性可以预事先概率:试验之前某随机事件出现的可能性可以预先估计出来,如先估计出来,如投硬币出现正面和反面的机率;投硬币出现正面和反面的机率;事后概率:随机事件出现的可能性不能在试验之前预事后概率:随机事件出现的可能性不能在试验之前预先估计出来,必须通过大量的重复试验之后才能估计先估计出来,必须通过大量的重复试验之后才能估计出它出现的可能性。出它出现的可能性。第九页,讲稿共六十五页哦(3)频率与概率的关系(表)频率与概率的关系(表3.1)频率是经验
9、值,概率是经验值;频率是经验值,概率是经验值;可以通过实测样本的频率分析来推论事件总体概率特性;可以通过实测样本的频率分析来推论事件总体概率特性;样本容量越大,结果越准确;样本容量越大,结果越准确;对于水文现象,只能采用有限的多年实测水文资料组成样本系对于水文现象,只能采用有限的多年实测水文资料组成样本系列,推求频率作为概率的近似值。列,推求频率作为概率的近似值。第十页,讲稿共六十五页哦3.2.2概率运算定律概率运算定律(1)(1)概率相加定理概率相加定理互斥事件:在一次试验中,只有一个事件发生,其余事件互斥事件:在一次试验中,只有一个事件发生,其余事件均不能发生,这类事件称为互斥事件;均不能
10、发生,这类事件称为互斥事件;概率相加定理:互斥的各事件中,至少有一个发生的概率概率相加定理:互斥的各事件中,至少有一个发生的概率等于各个事件发生的概率总和。等于各个事件发生的概率总和。(2 2)概率相乘定理)概率相乘定理独立事件:多个事件中,某一事件的出现并不影响其他事独立事件:多个事件中,某一事件的出现并不影响其他事件的出现。件的出现。概率相乘定理概率相乘定理:几个独立事件一并出现的概率等于各事件几个独立事件一并出现的概率等于各事件出现概率之积。出现概率之积。(3)条件概率)条件概率第十一页,讲稿共六十五页哦【例】某测站有某测站有40年的实测枯水位记录,各种水位出现的频率如表年的实测枯水位记
11、录,各种水位出现的频率如表3.2所示,试确定水所示,试确定水位位H2.0m和和H2.7m的概率?的概率?某站水位频率计算 表3.2序号序号水位水位H(m)频数频数f(a)频率频率W(%)累积频率累积频率P(%)123454.03.52.72.01.921016935254022.57.55307092.510040100第十二页,讲稿共六十五页哦3.2.3随机变量的概率分布随机变量的概率分布随机变量与其概率一一对应,这种随机变量与概率一一对应的关系称为随机变量与其概率一一对应,这种随机变量与概率一一对应的关系称为随机变量的概率分布规律简称随机变量的概率分布规律简称概率分布概率分布随机变量可分为
12、两类:离散型随机变量和连续型随机变量随机变量可分为两类:离散型随机变量和连续型随机变量水文学关心随机变量取值大于等于某一定值的概率,即水文学关心随机变量取值大于等于某一定值的概率,即P(Xxi),而该概率是),而该概率是x的函数的函数【例例3.6】离散型随机变量及其概率分布离散型随机变量及其概率分布Xx1x2xiP(X=xi)p1p2pi第十三页,讲稿共六十五页哦第十四页,讲稿共六十五页哦F(X)=P(Xx)代表代表X大于某一取值大于某一取值x的概率,其几何曲线的概率,其几何曲线称为概率分布曲线;如果用实测资料点绘的,水文上称为称为概率分布曲线;如果用实测资料点绘的,水文上称为累积频率曲线。累
13、积频率曲线。第十五页,讲稿共六十五页哦3.2.4累积频率和重现期累积频率和重现期(1)累积频率和随机变量的关系)累积频率和随机变量的关系水文特征值属于连续性随机变量水文特征值属于连续性随机变量在分析水文系列的概率分布时,不用单个的随机变量(在分析水文系列的概率分布时,不用单个的随机变量(x=xi)的概率,而是用的概率,而是用xxi(或者(或者xxi)的)的概率概率P(xxi)(或者)(或者P(xxi)。)。累计频率指等于或大于(等于或小于)某水文要素出现可能累计频率指等于或大于(等于或小于)某水文要素出现可能性的量度。性的量度。一般在实际应用中,用样本的频率分析曲线代替总体系列的一般在实际应用
14、中,用样本的频率分析曲线代替总体系列的概率分布。概率分布。累积频率累积频率第十六页,讲稿共六十五页哦样本足够大时,可以绘出累积频样本足够大时,可以绘出累积频率曲线。率曲线。在一个确定的随机变量系列内,在一个确定的随机变量系列内,各个随机变量对应着一个累积频各个随机变量对应着一个累积频率值,随机变量的大小于累积频率值,随机变量的大小于累积频率成反比。率成反比。工程上一般把累积频率为频率。工程上一般把累积频率为频率。根据选用样本的不同,频率分为根据选用样本的不同,频率分为年频率年频率和和次频率次频率。第十七页,讲稿共六十五页哦(2)重现期)重现期重现期:指等于及大于(或等于及小于)一定数量级的水重
15、现期:指等于及大于(或等于及小于)一定数量级的水文要素出现一次的平均间隔年数,以该量级频率的倒数。文要素出现一次的平均间隔年数,以该量级频率的倒数。当洪峰流量、洪水位、暴雨时,使用的设计频率当洪峰流量、洪水位、暴雨时,使用的设计频率P 50%,则则T=1/P当研究枯水流量、枯水位时,设计频率当研究枯水流量、枯水位时,设计频率P常采用大于常采用大于50%的值,则的值,则T=1/(1-P)(设计保证率)(设计保证率)水文现象无固定的周期性。水文现象无固定的周期性。注意:注意:累积频率是指多年平均出现的机会;重现期则是平均累积频率是指多年平均出现的机会;重现期则是平均若干年出现一次,而不是固定的周期
16、。若干年出现一次,而不是固定的周期。*年一遇年一遇第十八页,讲稿共六十五页哦3.2.5设计标准设计标准水文现象具有明显的地区性和随机性,因而无法用水文特水文现象具有明显的地区性和随机性,因而无法用水文特征值出现的量值为工程设计的标准。征值出现的量值为工程设计的标准。主管部门根据工程的规模、工程在国民经济中的地位以及主管部门根据工程的规模、工程在国民经济中的地位以及工程失事后果等因素,工程失事后果等因素,在各种工程设计规范中规定在各种工程设计规范中规定各种水各种水文特征值的设计频率文特征值的设计频率(或重现期或重现期)作为工程设计标准。作为工程设计标准。各地各地工程业务部门,根据当地实测的水文资
17、料,通过水文分析工程业务部门,根据当地实测的水文资料,通过水文分析计算,求出对应于设计频率的水文特征值,作为工程设计计算,求出对应于设计频率的水文特征值,作为工程设计的依据。的依据。第十九页,讲稿共六十五页哦3.3经验频率曲线经验频率曲线3.3.1经验频率公式经验频率公式我国目前采用的数学期望公式为:我国目前采用的数学期望公式为:当当m=1时,时,P=1/(n+1)当当T=100a,则则T=1/P=n+1=100mxm在在n项观测资料中按递减顺序排列的序号,即在项观测资料中按递减顺序排列的序号,即在n次观测次观测试验中大于或等于试验中大于或等于xm的次数的次数第二十页,讲稿共六十五页哦3.3.
18、2经验频率曲线的绘制和应用经验频率曲线的绘制和应用如果有如果有n年的水文资料。年的水文资料。1)将按时间顺序排列的实测资料按其数值大小进行递减顺序)将按时间顺序排列的实测资料按其数值大小进行递减顺序的排列。成的排列。成x1,x2,xn,对应序号,对应序号m为为1,2,n2)利用公式分别计算对应各个变量的经验频率。)利用公式分别计算对应各个变量的经验频率。3)以实测资料为变量)以实测资料为变量x x作为纵坐标,以频率作为纵坐标,以频率P为横坐标,在为横坐标,在坐标纸上点绘经验频率点距(坐标纸上点绘经验频率点距(Pi,xi),通过点群中心,目),通过点群中心,目估绘制一条光滑的曲线,该曲线为经验频
19、率曲线。估绘制一条光滑的曲线,该曲线为经验频率曲线。4)根据工程设计指定的频率,在该曲线上查出设计所需的相)根据工程设计指定的频率,在该曲线上查出设计所需的相应设计频率的水文数据。应设计频率的水文数据。将某水文变量将某水文变量f按递减顺序排列,排列中的序号不仅表示排列大小的次按递减顺序排列,排列中的序号不仅表示排列大小的次序,而且也表示变量自大到小序,而且也表示变量自大到小(大于或等于大于或等于)的累积次数。的累积次数。3.3.3经验频率曲线的外延经验频率曲线的外延第二十一页,讲稿共六十五页哦概率格纸概率格纸水平:正态曲线的概率分水平:正态曲线的概率分布制成分格制成的。布制成分格制成的。非正态
20、曲线:两端曲线坡度变非正态曲线:两端曲线坡度变缓,有利于曲线外延缓,有利于曲线外延第二十二页,讲稿共六十五页哦3.4随机变量的统计参数随机变量的统计参数统计参数统计参数是反映随机变量系列数值大小、变化幅度、对称程度是反映随机变量系列数值大小、变化幅度、对称程度等情况的数量特征值,等情况的数量特征值,因而能反映水文现象基本的统计规律,概因而能反映水文现象基本的统计规律,概括水文现象的基本特征和分布特点,也是进行理论频率曲线估计的括水文现象的基本特征和分布特点,也是进行理论频率曲线估计的基础。基础。统计参数有总体统计参数和样本统计参数。在水文学中主要应用样本统统计参数有总体统计参数和样本统计参数。
21、在水文学中主要应用样本统计参数,来估计总体统计参数。计参数,来估计总体统计参数。水文频率分析主要使用的统计参数包括水文频率分析主要使用的统计参数包括均值均值变差系数变差系数偏态系数偏态系数矩矩第二十三页,讲稿共六十五页哦3.4.1均值均值均值是反映随机变量系列平均情况的数。均值是反映随机变量系列平均情况的数。加权平均法加权平均法算术平均法算术平均法若实测系列内各随机变量很少重复出现,可以不考虑出现次数的影若实测系列内各随机变量很少重复出现,可以不考虑出现次数的影响,用算术平均法求均值。响,用算术平均法求均值。对于对于水文系列水文系列,一年内只选一个样或者几个样,水文特,一年内只选一个样或者几个
22、样,水文特征值重复出现的机会很少,一般使用征值重复出现的机会很少,一般使用算术平均值算术平均值,若系列内出现了相同的水文特征值,将相同值排在一起,若系列内出现了相同的水文特征值,将相同值排在一起,各占一个序号。各占一个序号。推求的是累推求的是累积频率积频率第二十四页,讲稿共六十五页哦l均值特性均值特性平均数反映了随机变量的平均水平,代表整个随机变量系列的水平高低,平均数反映了随机变量的平均水平,代表整个随机变量系列的水平高低,故又称数学期望。故又称数学期望。利用均值可以推求设计频率的水文特征值。利用均值可以推求设计频率的水文特征值。利用均值表示各种水文特征值的空间分布情况,绘制成各种等值线利用
23、均值表示各种水文特征值的空间分布情况,绘制成各种等值线图。图。l模比系数模比系数第二十五页,讲稿共六十五页哦3.4.2均方差和变差系数均方差和变差系数要反映整个系列的变化幅度,或者系列在均值两侧分布的离散要反映整个系列的变化幅度,或者系列在均值两侧分布的离散程度,需要使用程度,需要使用均方差和变差系数。均方差和变差系数。(1)均方差)均方差为了避免一阶离差代数和为为了避免一阶离差代数和为0,一般取,一般取的平均值的开方作的平均值的开方作为离散程度的计量标准,称为均方差。即:为离散程度的计量标准,称为均方差。即:对于样本系列有下列修正公式:对于样本系列有下列修正公式:第二十六页,讲稿共六十五页哦
24、均方差表征的意义:表示分布函数的绝对离散程度。均方差表征的意义:表示分布函数的绝对离散程度。均均方差越大,系列在均值两旁分布越分散,其值变化幅度方差越大,系列在均值两旁分布越分散,其值变化幅度越大;反之,依然。越大;反之,依然。【例例】甲系列:甲系列:48,49,50,51,52其均值其均值=50;56均值均值51乙系列:乙系列:10,30,50,70,90其均值其均值=50;80均值均值55经计算后甲系列的均方差经计算后甲系列的均方差s甲甲=1.58,s乙乙=31.4。甲系列离散程度小,乙系列离散程度大。甲系列离散程度小,乙系列离散程度大。例:平均值相同,例:平均值相同,均方差不同进行比较。
25、均方差不同进行比较。均方差小的均值代表性好,均方差均方差小的均值代表性好,均方差大的系列均值代表性差大的系列均值代表性差第二十七页,讲稿共六十五页哦(2)变差系数)变差系数均方差不仅受到系列分布的影响,也与系列的水平有关。均方差不仅受到系列分布的影响,也与系列的水平有关。变差系数变差系数又称离差系数或者离势系数,是一个又称离差系数或者离势系数,是一个系列的均方差系列的均方差与其与其均均值值的的比值比值用模比系数带入上式有:用模比系数带入上式有:【例例】同上一例,同上一例,计算得计算得Cv甲甲=0.005,Cv乙乙=0.33,甲系列在均值两旁要集中,离散程甲系列在均值两旁要集中,离散程度小度小【
26、例例】见教材见教材p50例例3.8【思考思考】一条河流上、下游断面的年平均流量的一条河流上、下游断面的年平均流量的Cv值哪个大?为什么?值哪个大?为什么?第二十八页,讲稿共六十五页哦3.4.3偏态系数偏态系数偏态系数:对系列在均值两旁的对称情况的反映。偏态系数:对系列在均值两旁的对称情况的反映。表达式表达式(对于样本系列):(对于样本系列):当当Cs=0时,系列在均值两旁对称分布;时,系列在均值两旁对称分布;当当Cs0属正偏分布;属正偏分布;当当Cs0属负偏分布;属负偏分布;第二十九页,讲稿共六十五页哦一般认为没有上百年的资料,无法获得比较合理的一般认为没有上百年的资料,无法获得比较合理的Cs
27、值。因此一般在实际计算中往往按照值。因此一般在实际计算中往往按照Cs和和Cv的经验关系确的经验关系确定。定。设计暴雨量:设计暴雨量:Cs=3.5Cv设计最大流量:设计最大流量:Cv0.5Cs=(23)Cv年径流及年降水:年径流及年降水:Cs=2Cv第三十页,讲稿共六十五页哦3.5理论频率曲线理论频率曲线经验频率曲线的缺点:经验频率曲线的缺点:由于实测系列的项数较小,所绘经验频率曲线往往不能由于实测系列的项数较小,所绘经验频率曲线往往不能满足推求稀遇频率特征值的要求满足推求稀遇频率特征值的要求目估定线或外延会产生较大的误差。目估定线或外延会产生较大的误差。需要借助某些数字形式的频率曲线作为定线和
28、外延需要借助某些数字形式的频率曲线作为定线和外延的依据。通常在实测资料中选取或者算的的依据。通常在实测资料中选取或者算的23个有代表性个有代表性的特征值作参数,并据此选配一些数学方程作为总体系的特征值作参数,并据此选配一些数学方程作为总体系列频率密度曲线的列频率密度曲线的假想数学模型假想数学模型,在按一定的方法确定,在按一定的方法确定累积频率曲线。这种用数学形式确定的、符合经验点据累积频率曲线。这种用数学形式确定的、符合经验点据分布规律的的曲线称为分布规律的的曲线称为理论频率曲线【外延和内插的工理论频率曲线【外延和内插的工具】具】我国水文分析常用到的理论频率曲线有:皮尔逊我国水文分析常用到的理
29、论频率曲线有:皮尔逊型曲型曲线;特殊情况下也可以用指数线;特殊情况下也可以用指数分布曲线,对数分布曲线,对数分布分布曲线,极值分布曲线,对数正态分布和威布尔分布曲线。曲线,极值分布曲线,对数正态分布和威布尔分布曲线。第三十一页,讲稿共六十五页哦理论频率曲线理论频率曲线皮尔逊皮尔逊型曲线型曲线英国生物学家皮尔逊研究各种非正态的分布函数曲线形式,英国生物学家皮尔逊研究各种非正态的分布函数曲线形式,提出了提出了13种分布曲线类型,其中第种分布曲线类型,其中第III型被引入水文学中,型被引入水文学中,并被我国采纳。并被我国采纳。(1 1)皮尔逊)皮尔逊型曲线是型曲线是 一条一端有限、一条一端有限、一端
30、无限的不对称一端无限的不对称 单峰正偏曲线,单峰正偏曲线,数学上常称数学上常称 伽玛分布。伽玛分布。第三十二页,讲稿共六十五页哦曲线特点:曲线特点:只有一个众数只有一个众数曲线的两端或一端以曲线的两端或一端以横轴为渐近线横轴为渐近线由此建立微分方程式求解得:由此建立微分方程式求解得:()的伽玛函数的伽玛函数、a0分别为形状参数、尺度参数分别为形状参数、尺度参数和位置参数。和位置参数。0,0。第三十三页,讲稿共六十五页哦、a0一经确定,一经确定,PIII型密度函数随之确定。可以证明,三参型密度函数随之确定。可以证明,三参数与均值、数与均值、Cv、Cs有如下关系:有如下关系:皮尔逊皮尔逊型频率曲线
31、的密度函数可表示为以型频率曲线的密度函数可表示为以、Cv、Cs为参数的函为参数的函数数y=f(,Cv,Cs,x)第三十四页,讲稿共六十五页哦(2)皮尔逊皮尔逊型频率曲线及其绘制型频率曲线及其绘制水文计算中,一般需要求出指定频率水文计算中,一般需要求出指定频率P所相应的随机所相应的随机变量取值变量取值xp,也就是通过对密度曲线进行积分,即,也就是通过对密度曲线进行积分,即:求出等于及大于求出等于及大于xp的累积频率的累积频率P值。直接由上式计算值。直接由上式计算P值非值非常麻烦,实际做法是通过变量转换,变换成下面的积分形常麻烦,实际做法是通过变量转换,变换成下面的积分形式式离均系数离均系数第三十
32、五页,讲稿共六十五页哦被积函数只含一个参数被积函数只含一个参数Cs。只要给定。只要给定Cs就可以算出就可以算出P和和p的对应值,最终制定出的对应值,最终制定出PCsp的对应数值表。的对应数值表。(教材附教材附录录3)如何来绘制如何来绘制在频率计算中,现由已知的在频率计算中,现由已知的Cs查查值表得出不同频率下值表得出不同频率下P的离均系数的离均系数P,然后将,然后将P及已知的及已知的x,Cv带入下式,即可带入下式,即可求得对应于频率求得对应于频率P的水文特征值的水文特征值xp。由不同的由不同的P及相应的及相应的xp,可绘制出一条与参数相应的理论,可绘制出一条与参数相应的理论频率曲线频率曲线第三
33、十六页,讲稿共六十五页哦理论频率曲线绘制的步骤如下:理论频率曲线绘制的步骤如下:1)由实测的资料,统计并计算)由实测的资料,统计并计算x,Cv2)确定)确定Cs3)由)由Cs查表,得不同的查表,得不同的P的离均系数的离均系数P值。值。4)求出)求出Kp5)由)由xp=Kpx,求不同,求不同P的的xp,在海森概率格纸上,以,在海森概率格纸上,以P为横为横坐标,坐标,xp为纵坐标,点绘理论点据(为纵坐标,点绘理论点据(P,xp),根据理论),根据理论点据分布趋势,目估并绘制一条光滑曲线点据分布趋势,目估并绘制一条光滑曲线【例例3.9】见教材见教材p56。第三十七页,讲稿共六十五页哦均值对频率曲线的
34、影响均值对频率曲线的影响当皮尔逊当皮尔逊型频率曲的两个参型频率曲的两个参数数Cv和和Cs不变时,由于均值不变时,由于均值的不同,可以使频率曲线的不同,可以使频率曲线发生很大的变化。发生很大的变化。(4 4)统计参数对频率曲线的影响)统计参数对频率曲线的影响a.Cv、Cs相同时,均值大的曲线位相同时,均值大的曲线位于均值小的曲线之上;于均值小的曲线之上;(与均值成与均值成正比关系正比关系)b.均值大的曲线较均值小的曲线均值大的曲线较均值小的曲线陡。陡。c.均值不同的理论频率曲线无交点均值不同的理论频率曲线无交点第三十八页,讲稿共六十五页哦为了消除均值为了消除均值的影响,以模的影响,以模比系数比系
35、数K为变量绘制频率曲为变量绘制频率曲线,如图所示。图中线,如图所示。图中cs=1.0,cv=0时,随机变量的取值时,随机变量的取值都等于均值,此时频率曲线都等于均值,此时频率曲线即为即为k=1的一条水平线,的一条水平线,随随着着cv的增大,频率曲线的偏的增大,频率曲线的偏离程度也随之增大,曲线显离程度也随之增大,曲线显得越来越陡。得越来越陡。不同不同Cv的曲线在的曲线在Kp=1的位置的位置处有交点处有交点变差系数对频率曲线的影响变差系数对频率曲线的影响第三十九页,讲稿共六十五页哦偏态系数对频率曲线的影响偏态系数对频率曲线的影响正偏情况下,正偏情况下,Cv相同时相同时,Cs愈大,均值愈大,均值(
36、即图中(即图中k=1)对应的频率愈对应的频率愈小,频率曲线小,频率曲线的中部愈向左的中部愈向左偏,且上段愈偏,且上段愈陡,下段愈平陡,下段愈平缓。缓。第四十页,讲稿共六十五页哦3.6抽样误差抽样误差用一个样本的统计参数来代替总体的统计参数是存在一定用一个样本的统计参数来代替总体的统计参数是存在一定误差的,这种误差是由于从总体中随机抽取的样本与总体误差的,这种误差是由于从总体中随机抽取的样本与总体有差异而引起的,与计算误差不同,称为抽样误差。有差异而引起的,与计算误差不同,称为抽样误差。抽样误差的大小由均方误差来衡量。计算均方误差的公式抽样误差的大小由均方误差来衡量。计算均方误差的公式与总体分布
37、有关。与总体分布有关。公式见教材公式见教材p61公式公式3.31抽样误差的大小,随样本项数抽样误差的大小,随样本项数n、Cv和和Cs的大小而变化。的大小而变化。样本容量大,对总体的代表性就好,其抽样误差就小,这样本容量大,对总体的代表性就好,其抽样误差就小,这就是为什么在水文计算中总是想方设法取得较长的水文系就是为什么在水文计算中总是想方设法取得较长的水文系列的原因。列的原因。第四十一页,讲稿共六十五页哦3.7水文频率分析方法水文频率分析方法水文频率计算的目的水文频率计算的目的是选配一条与经验点配合较好的理论频率曲线是选配一条与经验点配合较好的理论频率曲线是选配一条与经验点配合较好的理论频率曲
38、线是选配一条与经验点配合较好的理论频率曲线,确定合确定合确定合确定合适的参数作为总体参数的估计值适的参数作为总体参数的估计值适的参数作为总体参数的估计值适的参数作为总体参数的估计值,以推求设计频率的水文特征值以推求设计频率的水文特征值以推求设计频率的水文特征值以推求设计频率的水文特征值,作为工程,作为工程规划设计的依据。规划设计的依据。适线法适线法适线法适线法先在机率格纸上按经验频率公式点绘出水文系列的经验频率点,先在机率格纸上按经验频率公式点绘出水文系列的经验频率点,选定频率曲线线型,选定频率曲线线型,取与经验点据拟合最佳的那条曲线和相应的参数,作为最终的计算取与经验点据拟合最佳的那条曲线和
39、相应的参数,作为最终的计算结果。结果。确定最佳拟合频率曲线,可使用不同的准则,因而有不同的方法和结确定最佳拟合频率曲线,可使用不同的准则,因而有不同的方法和结果。目前常用到的适线法有两种,包括果。目前常用到的适线法有两种,包括经验适线法经验适线法和优化适线法。和优化适线法。第四十二页,讲稿共六十五页哦(1)经验适线法(目估适线法)经验适线法(目估适线法)根据实测资料和经验频率数学期望公式可以绘出一条经验根据实测资料和经验频率数学期望公式可以绘出一条经验频率曲线,由皮尔逊频率曲线,由皮尔逊型频率密度曲线积分,可以绘出一型频率密度曲线积分,可以绘出一条理论频率曲线条理论频率曲线。由于统计参数有误差
40、,两者不一定配合。由于统计参数有误差,两者不一定配合得好,得好,必须通过试算来确定合适的统计参数必须通过试算来确定合适的统计参数这种方法也这种方法也叫叫试错适线法。试错适线法。试错适线法。试错适线法。本法是以经验频率点据为基础,给它们选配一条符合较好本法是以经验频率点据为基础,给它们选配一条符合较好的理论频率曲线,并以此来估计水文要素总体的统计规律。的理论频率曲线,并以此来估计水文要素总体的统计规律。第四十三页,讲稿共六十五页哦具体步骤如下:具体步骤如下:(1)将审核过的实测资料由大到小排列,计算各项的经验频率,在频率格纸上点)将审核过的实测资料由大到小排列,计算各项的经验频率,在频率格纸上点
41、绘经验点据(纵坐标为变量的取值,横坐标为对应的经验频率);绘经验点据(纵坐标为变量的取值,横坐标为对应的经验频率);(2)计算均值、变差系数,假定偏态系数;)计算均值、变差系数,假定偏态系数;(3)确定线型(一般选用皮尔逊)确定线型(一般选用皮尔逊型型););(4)根据拟定的统计参数查表计算理论频率曲线纵坐标,绘理论频率曲)根据拟定的统计参数查表计算理论频率曲线纵坐标,绘理论频率曲线;线;(5)将此线画在绘有经验点据的图上,看与经验点据配合的情况)将此线画在绘有经验点据的图上,看与经验点据配合的情况。若不理想,可。若不理想,可通过调整通过调整统计参数重新点绘频率曲线。统计参数重新点绘频率曲线。
42、(6)最后根据频率曲线与经验点据的配合情况,从中选出一条与经验点据)最后根据频率曲线与经验点据的配合情况,从中选出一条与经验点据配合较好的曲线作为采用曲线,相应于该曲线的参数便看作是总体参数配合较好的曲线作为采用曲线,相应于该曲线的参数便看作是总体参数的估值的估值。第四十四页,讲稿共六十五页哦【例】某站共有实测降水量资料【例】某站共有实测降水量资料24年,求频率为年,求频率为10%和和90%的年降水量。的年降水量。计算步骤为:计算步骤为:1.将原始资按大小次序排列,列入表(将原始资按大小次序排列,列入表(4)栏。)栏。2.计算经验频率计算经验频率Pm=m/(n+1)列入表(列入表(5)栏)栏,
43、并与并与xm对对应点绘于概率格纸上。幻灯片应点绘于概率格纸上。幻灯片463.计算出多年的平均值为计算出多年的平均值为666.4mm,Cv=0.234.选定选定CV0.25,假定,假定CS0.50。查表得查表得P,求得,求得xPx(PCV1)幻灯片)幻灯片46根据表中(根据表中(1)、()、(3)两栏的对应数值点绘曲线,发)两栏的对应数值点绘曲线,发现曲线头部和尾部都偏于经验频率点据之下。现曲线头部和尾部都偏于经验频率点据之下。第四十五页,讲稿共六十五页哦第四十六页,讲稿共六十五页哦第四十七页,讲稿共六十五页哦5.改变参数,选定改变参数,选定CV0.30,CS0.75,查表计算出各,查表计算出各
44、xP值。值。绘制频率曲线,该线与经验点据配合较好,取为最后绘制频率曲线,该线与经验点据配合较好,取为最后采用的频率曲线。采用的频率曲线。第四十八页,讲稿共六十五页哦第四十九页,讲稿共六十五页哦3.8相关分析相关分析3.8.1概述概述(1)相关分析的意义和应用)相关分析的意义和应用自然界中有许多现象之间是有一定联系的。自然界中有许多现象之间是有一定联系的。按数理统计法建立上述两个或多个随机变量之间的联按数理统计法建立上述两个或多个随机变量之间的联系,称之为近似关系或相关关系。把对这种关系的分系,称之为近似关系或相关关系。把对这种关系的分析和建立称为析和建立称为相关分析相关分析相关分析相关分析。相
45、关分析可以用来延长和插补短系列。相关分析可以用来延长和插补短系列。相关分析可以用来延长和插补短系列。相关分析可以用来延长和插补短系列。第五十页,讲稿共六十五页哦(2)相关的种类)相关的种类根据变量之间相互关系的密切程度,变量之间的关系有三种根据变量之间相互关系的密切程度,变量之间的关系有三种情况:即完全相关、零相关、统计相关。情况:即完全相关、零相关、统计相关。两变量两变量x与与y之间,如果每给之间,如果每给定一个定一个x值,就有一个完全确值,就有一个完全确定的定的y值与之对应,则这两个值与之对应,则这两个变量之间的关系就是变量之间的关系就是完全相关完全相关。两变量之间毫无联系,或某一现象(变
46、量)两变量之间毫无联系,或某一现象(变量)的变化不影响另一现象(变量)的变化,的变化不影响另一现象(变量)的变化,这种关系则称为这种关系则称为 零相关零相关 。第五十一页,讲稿共六十五页哦若两个变量之间的关系界于完全相关和零相关之间,则称为若两个变量之间的关系界于完全相关和零相关之间,则称为统计相关统计相关。当只研究两个变量的相关关系时,称为。当只研究两个变量的相关关系时,称为简单相关简单相关;当研究当研究3 3个或个或3 3个以上变量的相关关系时,则称为个以上变量的相关关系时,则称为复相关复相关。在。在相关的形式上,又可分为相关的形式上,又可分为直线相关直线相关和和非直线相关非直线相关。第五
47、十二页,讲稿共六十五页哦(3)相关分析的内容)相关分析的内容相关分析(或回归分析)的内容一般包括三个方面:相关分析(或回归分析)的内容一般包括三个方面:判定变量间是否存在相关关系,若存在,计算其相关系数,判定变量间是否存在相关关系,若存在,计算其相关系数,以判断相关的密切程度;以判断相关的密切程度;确定变量间的数量关系确定变量间的数量关系回归方程或相关线;回归方程或相关线;根据自变量的值,预报或延长、插补倚变量的值,并对该根据自变量的值,预报或延长、插补倚变量的值,并对该估值进行误差分析估值进行误差分析。第五十三页,讲稿共六十五页哦3.8.2简单直线相关简单直线相关(1)相关图解法)相关图解法
48、设设xi和和yi代表两系列的观代表两系列的观测值,共有测值,共有n对,把对应值对,把对应值点绘于方格纸上,得到很多点绘于方格纸上,得到很多相关点。如果相关点的平均相关点。如果相关点的平均趋势近似直线,即可通过点趋势近似直线,即可通过点群中间及群中间及、点绘出相关直点绘出相关直线,线,第五十四页,讲稿共六十五页哦(2)相关分析法)相关分析法直线回归方程直线回归方程为避免相关图解法在定线上的任意性,常采用相关计算法为避免相关图解法在定线上的任意性,常采用相关计算法来确定相关线的方程,即回归方程。简直线相关方程的形来确定相关线的方程,即回归方程。简直线相关方程的形式为式为:y=a+bxy=a+bx式
49、中式中x自变量;自变量;y倚变量;倚变量;a、b待定常数待定常数。第五十五页,讲稿共六十五页哦待定常数待定常数a、b由观测点与直线拟合最佳,通过最小二乘由观测点与直线拟合最佳,通过最小二乘进行估计。最后得到如下形式的回归方程进行估计。最后得到如下形式的回归方程:此式称为此式称为y倚倚x的回归方程,它的图形称为的回归方程,它的图形称为y倚倚x的回归线,如的回归线,如前图前图(a)线)线所示。若以所示。若以y求求x,则要应用,则要应用x倚倚y的回归方程,如的回归方程,如前图(前图(b)线)线所示,方程为将上式中所示,方程为将上式中x,y对调。对调。一般一般y倚倚x与与x倚倚y的两回归线并不重合,但
50、有一个公共交点的两回归线并不重合,但有一个公共交点。第五十六页,讲稿共六十五页哦相关系数与回归系数相关系数与回归系数1)相关系数:反映两个变量之间关系的密切程度。)相关系数:反映两个变量之间关系的密切程度。相关系数越接近于相关系数越接近于1 1,两变量间关系越密切。,两变量间关系越密切。第五十七页,讲稿共六十五页哦2)回归系数:回归直线的斜率在回归方程中称为回归系数。)回归系数:回归直线的斜率在回归方程中称为回归系数。两个系列的均方差为两个系列的均方差为经整理有:经整理有:直线回归方程可以写成:直线回归方程可以写成:第五十八页,讲稿共六十五页哦相关分析的误差相关分析的误差1)回归线的误差)回归