《资料质量控制和分析方法.pdf》由会员分享,可在线阅读,更多相关《资料质量控制和分析方法.pdf(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章第二章 资料、质量控制和分析方法资料、质量控制和分析方法2 2。1 1 研究区域和资料研究区域和资料本文研究范围为石家庄市所辖全部区县。区域边界及其所用的 17 个气象观测站点位置分布见图 2。1。区域经度范围为 114。13115。21,纬度范围为 37。5938。45,海拔高度在 35.9m255.5m 之间。各气象站基本信息见表 1。(表1 应增加观测记录年份和迁站时间等信息)图 2.1 石家庄地区 17 个气象站点分布表 1 石家庄地区 17 个观测站基本信息站点石家庄市区新乐辛集赞皇平山井陉正定行唐灵寿藁城晋州无极深泽栾城赵县元氏高邑经度114。42114。68115.2111
2、4。36114.2114.13114。56114。55114.38114.81115.06114。96115.18114.63114。73114。53114。61纬度海拔高度(m)38.038138。3570。837。9135。937.65137.438.2513138.03255。538。157138。4596.238。3108。938.0153。538。0142.438。245。438.1838.137.8852.937。7638.537。7566.437。5948。9本文后面气温和降水两章所用资料为石家庄市气象局业务科提供的石家庄地区 17 个观测站的逐日平均气温、最低、最高气温和降水资
3、料。由于各站资料的时间序列长度不同,为了对比分析,因此在温度、降水变化特征中统一采用 1972-2008 年 37 年的资料。周期分析中所用资料为石家庄市区站建站以来即 1955 年至 2008 年的逐日平均气温、降水资料。城市气候一章城市化对气温和降水量的影响分析所用资料为石家庄市区站和 16 个郊区站 1972-2008 年逐日平均气温和降水资料。其中 5。1 和 5。2 小节所用资料为石家庄市区站以及藁城、元氏、平山和新乐四个距离市区站较近的郊区站 19622009 年近 48 年的逐日平均气温、最低气温和最高气温。四个郊区站分布在市区站东、南、西、北四个方向,海拔高度与市区站接近,因此
4、不必做高度订正,减少了分析误差;且探测环境受城市化影响较小.分析日变化时采用 2009 年 3 月至 2010 年 2 月加密的逐时气温资料.所用资料均由石家庄气象局相关业务单位进行了初步的质量控制,订正了由于各种人为因素造成的错误值.2.22.2 资料均一化订正资料均一化订正本文借鉴李庆祥等65检验和订正国家基本、基准站气温数据时所采用的E-P 方法,对所用气温资料进行了均一性检验和订正。周雅清等32也曾采用这种方法检验和订正华北地区的气温资料。降水资料的时间序列对于台站位置变动等影响没有温度那么敏感,所以本文对降水资料没有进行严格的均一性检验和订正。首先对所有台站建立气温变化序列dT/dt
5、,计算待检台站 dT/dt序列和它附近台站的dT/dt序列的相关系数,选取 5 个与之正相关最大的台站作为参考台站.利用参考台站序列和待检序列相关系数的平方作为权重建立参考 dT/dt序列,再反算得到参考序列。然后采用滑动t检验法检测待检序列和参考序列的差异序列的不连续点,并通过台站历史沿革资料确定其合理性。如果不连续点附近存在站址迁移,则认为该不连续点是合理的,并进一步进行订正;否则保留原始记录。对于那些被确认的有合理不连续点的待检序列,计算其与参考序列的差异序列在不连续点前后 5 年的差值,以此作为补偿值来订正不连续点。为了与以后的资料合并使用,订正是以最近的资料为基础从后向前进行的。由于
6、上述方法要求序列子段必须多于5年,因此,如果不连续点是在开始年后或结束年前的 5 年内,检验的结果也只能出现在开始后或结束前的第 5 年.这就需要参考台站的沿革资料进行鉴别,确定其真实不连续点的位置和补偿值。通过订正,使得包括台站迁移、仪器更换、观测方法改变等对资料均一性的影响尽可能减少到最小.在对各站年平均气温进行均一性检验过程中(图 2.2),发现 17 个站均在 1993 年出现断点,排除了迁站和仪器更换的原因,因此各站的年平均气温在 1993 年是一次正常的突变.各站年平均最低气温(图略)与年平均气温类似,断点出现在 1987 年和 1993 年,同样排除了迁站和仪器更换的原因。各站年
7、平均最高气温则比较均一,没有出现一致的断点现象。图 2。2 石家庄地区各站年平均气温均一性检验(黑实线为=0。05 的显著性水平)通过对各站年平均气温、年平均最高、最低气温进行检验,发现有1 个站(5.9)的平均气温资料存在非均一性引起的偏差,有 1 个站(5。9)的平均最高气温资料存在非均一性引起的偏差,有 3 个站(17。6%)的平均最低气温资料存在非均一性引起的偏差,检验表明石家庄地区近四十年气温资料中的非均一性现象并不严重,资料质量较好。这些偏差主要是由台站迁移造成的,订正后主要由于台站迁移引起的温度资料非均一性问题获得了比较好的解决。2 2。3 3 分析方法分析方法6666(1不能把
8、文献引用序号放标题上,要在后边具体位置引用;2。下文公式应简化,所保留公式要有出处,要统一编号)(1)滑动平均滑动平均是用确定时间序列的平滑值来显示要素的低频变化特点,经过滑动平均后,序列中短于滑动长度的波动或周期大大削弱。对样本容量为 n 的序列 x,其滑动平均序列表示为:j=1,2,n-k+1式中 k 为滑动长度,本文 k 值取 5。(2)距平一组数据的某一个数与均值之间的差就是距平,即,气候变量的一组数据与其均值的差异就构成了距平序列 2.1在气候诊断分析中,常用距平序列2。1 来代替气候变量本身的观测数据。任何气候变量序列,经过距平化处理,都可以化为平均值为 0 的序列.这样处理可以给
9、分析带来很多便利,计算结果也更直观。(3)线性趋势用表示样本量为的某一气候变量,用表示所对应的时间,建立与之间的一元线性回归:,i=1,2,,2.2方程(2.2)可以看作一种特殊的、最简单的线性回归形式.它的含义是用一条合理的直线表示与其时间之间的关系。上式中为回归常数,为回归系数(即倾向值)。和可以用最小二乘法进行估汁.,其中,利用回归系数与相关系数之间的关系,求出时间与变量之间的相关系数:回归系数的符号表示气候变量的趋势倾向。0时,说明随时间的增加呈上升趋势;0时,说明随时间的增加呈下降趋势。值的大小反映了上升或下降的速率,即表示上升或下降的倾向程度。相关系数表示与时间之间线性相关的密切程
10、度。要判断变化趋势的程度是否显著,就要对相关系数进行显著性检验。确定显著性水平,若,表明随的变化趋势是显著的,否则表明变化趋势是不显著的.本文选取=0。05,=0。01和=0。001三个显著性水平进行检验,值越小,值越大,表明变化趋势越显著。(4)滑动检验滑动检验是通过考察两组样本平均值的差异是否显著来检验突变.其基本思想是把一气候序列中两段子序列均值有无显著差异的问题来检验。如果两段子序列的均值差异超过了一定的显著性水平,可以认为均值发生了质变,有突变发生。对于具有个样本量的时间序列,人为设置某一时刻为基准点,基准点前后两段子序列和的样本分别为和,两段子序列平均值分别为和,方差分别为和。定义
11、统计量:2。3其中方程2。3遵从自由度的分布。给定显著性水平,查分布表得到临界值,若,则认为基准点前后的两字序列均值无显著差异,否则认为基准点时刻出现了突变。本文给定显著性水平=0.05。(5)皮尔逊相关系数皮尔逊相关系数是描述两个随机变量线形相关的统计量,一般简称为相关系数或点相关系数,用来表示。设有两个变量和相关系数计算公式为相关系数的取值在1.0+1.0之间,当0时,表明两变量呈正相关,越接近于1.0,正相关越显著;当0时,表明两变量呈负相关,越接近于1.0,负相关越显著;当0,则表示两变量相互独立。计算出的相关系数是否显著,需要经过显著性检验。(6)功率谱功率谱分析是以傅立叶变换为基础
12、的频域分析方法,其意义为将时间序列的总能量分解到不同频率上的分量,根据不同频率波的方差贡献诊断出序列的主要周期,从而确定周期的主要频率,既序列隐含的显著周期.功率谱是应用极为广泛的一种分析周期的方法。根据谱密度与自相关函数互为傅立叶变换的重要性质,通过自相关函数间接做出连续功率谱估计。对一时间序列,最大滞后时间长度为的自相关系数(=0,1,2,)为由下列得到不同波数的粗谱估计值:=0,1,2,式中表示第个时间间隔上的相关函数。在实际计算中考虑端点特性,常用下列形式:最大滞后长度的选取十分重要,一般取为为宜。这种方法得到的谱估计与真实谱存在一定误差。因而对粗谱估计需要作平滑处理,以便得到连续性的
13、谱值。常用汉宁平滑系数来进行平滑.(7)MannKendall 方法Mann-Kendall 法是一种非参数统计检验方法,非参数统计检验方法亦称无分布检验,其优点是不需要样本遵从一定的分布,也不受少数异常值的干扰,更适用于类型变量和顺序变量,计算也比较简便.对于具有 n 个样本量的时间序列 x,构造一秩序列:Sk=,k=2,3,n,其中 ri=j=1,2,i可见,秩序列 Sk是第 i 时刻数值大于 j 时刻数值个数的累计数。在时间序列随机独立的假定下,定义统计量UFK=,k=1,2,n,式中 UF1=0,E(Sk),Var(Sk)是累计数 Sk的均值和方差,在 x1,x2,xn相互独立,且有相
14、同连续分布时,它们可由下式算出:UFi为标准正态分布,它是按时间系列 x 顺序 x1,x2,xn计算出的统计量序列,给定显著性水平 a,查正态分布表,若UFiUa,则表明序列存在明显的趋势变化。按时间序列 x 逆序 xn,xn-1,,x1,再重复上述过程,同时使UBK=-UFK(k=n,n1,1),UB1=0。这一方法的优点在于不仅计算简便,而且可以明确突变开始的时间,并指出突变区域,因此,是一种常用的突变检验方法。城市气候一章分析城市热岛强度时,以城市站和郊区站平均气温差表示,即:在分析城市热岛效应因素对地面气温变化的影响时,定义城市站平均温度变化速率与郊区站平均温度变化速率之差为城市热岛增温率,热岛增温率在其总增温率中所占的百分比为热岛增温贡献率。本文季节划分采用以下方法:春季(35 月)、夏季(6-8 月)、秋季(911 月)、冬季(12月至次年 2 月)。年平均值是一年 12 个月的平均.计算各要素距平选用 19712000 年作为气候基准期.