2.2 降雨数据

因为分布式模型描述降雨和地表以及地表以下土壤水和地下水之间的交换关系,所以降雨数据是驱动水文模型重要的基础数据。在降雨数据应用于分布式水文模型时,观测的点降雨(气象)数据需要转换为空间分布型数据,因为在模型计算的目标流域每个单元上都需要输入气象数据,如同地形数据、土壤类型数据以及植被数据等。分布式水文模型运行时,需要计算期间内空间分布式的降雨数据。观测的降雨数据用于模型计算时,需要按一定的格式或要求处理,以满足模型计算或模型验证的需要。降雨数据的处理一般包括以下步骤:①数据集的质量评估;②校正/增补观测的点尺度数据库中的数据以获取完整的模拟时间内的时间序列降雨数据;③雨量计校正;④从点尺度雨量数据到每一个时间步长上空间分布式雨量数据的插值。

2.2.1 数据集评估

如果数据集中的降雨数据存在缺失或错误,模型将无法正常工作或给出无效的模拟结果,因此,输入模型之前,首先应该对数据集的数据,尤其是在Internet网上免费下载的数据进行质量评估,即使数据集是近似于完整的“数据集”,以下方面的评估也是必要的。

(1)排查每个雨量测站在观测序列上是否存在数据缺失现象,特别注意存在缺失现象数据点在时间序列上的具体日期和时间点。

(2)排除在整个时段上包含主要错误代码的不可用的雨量测站。基于测站数据有效数据百分比的主观判断和依靠附近测站的数据对所要排除雨量站点数据中进行有效插值的可能性,作为判断和排除不可用测站的决策依据。

(3)检查雨量数据集是否被内插/填充完整以及填充后的数据集是否可以满足模型使用。如果数据集已经填充完整,检查时间序列上所有数据集的数据是否合理和满足模型需要。利用0插值或常量插值方法对两个已知数据之间缺失部分进行插值,很难达到令人满意的填充结果。利用0插值法得到的结果是最差的,因为很难区分0插值的时间点是错误代码所致还是因为干旱条件下的无雨状态所致;低劣的插值通常被认为是连续3个或以上的时间点无降雨数据(0值),或者是在雨季降雨发生的时段内有较长时段的0值(在雨季同一时段内相邻雨量站的观测值不为0)。插值的是否合理还表现在对降雨数据空间分布的处理上,当采用了不恰当的插值方法,则插值后的数据集表现在降雨的空间分布格局上很不自然,所以,应该对降雨的空间分布图进行检查。

(4)排除由于低劣插值而导致数据不可用的雨量站数据,由于低劣插值法造成了这些雨量测站数据的不可靠性,应当在插值时间段移除这些雨量测站,因为不可能找到或不可能用更合适的值来替换这些数据。

(5)检查数据集中是否存在输入格式上的错误,通过绘制时间序列的雨量图或在时间序列上通过对数据的仔细检查可以较容易地发现异常的数据,然而,那些不正确的、较小的值却很难被发现。一般情况下,查找数值较小不正确的数据以及通过内插法得到数据集中数值较小的不正确数据,最好的方法是和相邻雨量站同一时段降雨数据进行逐次对比。

2.2.2 数据校正

对降雨数据序列中的缺失或错误进行校正时,常用的内插方法是利用同一测站前后两个时间点的数据对缺失的数据进行插值;另一种常见的技术是利用相邻测站的数据对同一时段内缺失或错误数据进行空间插值。

对原始数据库插值以及所做的其他改变如插值日期、原始数据以及采用何种方法确定了新值等进行注解是很重要的,并建议保存原始的未作任何改变的数据集。

2.2.3 雨量计校正

所有雨量站观测的降雨数据都会受到降雨观测过程中系统误差的影响。众所周知的是,雨量计对实际降雨量的计测会不时出现偏低的情况,其主要原因是风速影响、蒸散发损失、降雨对雨量计入口内壁的润湿以及降雨溅入或溅出雨量计,这些误差的大小随时间和空间上而改变,其对降雨观测值影响的范围在2%~20%之间,即观测值低于实际降雨量的2%~20%。而利用这样的降雨数据进行模型计算的结果将导致河道径流量偏低(低于实际值)。对于利用任何一种雨量计的用户,应注意以下4点:①降雨观测中的系统误差是时间和空间的变量,对一些降雨数据集的影响可以被忽略而对另一些降雨数据集的影响可能是显著的;②最重要的系统误差是由风振所导致的,风振导致结果偏低是降雨观测中一个特别的问题,尤其是对于固相降水形式(如降雪),而且影响的程度会随着风速的增大而增加;③大部分历史积累的降雨数据都是雨量计测量值(未被修正值),与历史同期实际降雨相比,现在这些观测数据被认为低于实际值;④由于被公认的对雨量计校正的方法不存在,所以当前的雨量站降雨数据集也未经过校正。

由于对数据校正存在主观性,所以在此并不推荐利用任何一种单一的方法对降雨数据集进行校正。建议参与者利用文献查询(包括互联网资源),探寻适宜的对降雨数据集校正的方法。

2.2.4 空间分布式降雨数据

分布式水文模型要求流域尺度上不同的位置输入对应的降雨量,所以,如何将观测的数据在流域空间各计算单元上进行合理分布十分重要。两种被广泛应用的将观测的点雨量转换成空间分布式的面雨量的方法是泰森多边形法(Thiessen method)和角距离加权法(Angular Distance-Weighted method,ADW)。

2.2.4.1 泰森多边形法

利用泰森多边形法实现点雨量向空间分布式雨量转换的基本步骤如下:①将流域内的雨量站点连线,则各雨量站的连线生成了(多个)三角形[图2.1(a)、(b)];②做三角形各边的垂直平分线,移除垂直平分线不必要的部分[图2.1(c)、(d)];③移除连接各雨量站的连线,剩余部分构成了泰森多边形[图2.1(e)],即实现了由各观测点的点雨量向分布式面雨量转化。

img

图2.1 泰森(Thiessen)多边形法示意图

2.2.4.2 角距离加权法

分布式水文模型在山区流域应用时,应该考虑利用角距离加权法处理降雨数据,因为这种方法在确定雨量观测网时兼顾了标高的不同和横向距离的改变。由于高程对降雨的影响,在山区流域,兼顾高程和横向距离的改变对降雨的影响是十分必要的。除了考虑高程和横向距离改变对降雨的影响,角距离加权法在应用程序上和泰森多边形法类似,如果分布式水文模型的应用对象是山区流域,角距离加权法建议对降水数据进行插值,该方法基于降雨的观测位置和网格中心的水平距离利用加权平均的数据实现对空间分布的雨量数据的插值。海拔高度的影响和包含的高程信息对降雨空间分布插值十分重要,但是,由于ADW对高程信息的处理不明确,该方法在高纬度地区对降雨的处理可能仍旧存在较实测值偏低的问题,尤其是对在高纬度地区雨量计观测数据不可用的情况下。

2.2.5 在线数据库

利用Internet查询雨量数据库,通过在目标流域内部和周边增加雨量观测站的方式,可以使网上空间分布的降雨数据质量得到提升。以下列出的是常用的网上雨量数据库,这些数据库提供不同地点和不同时期的降雨数据:①国际试验和网络数据库的亚洲太平洋洋流型数据集(Asia Pacific Flow Regimes from International Experimental and Network Data Sets,APFRIEND);②全球每日地表摘要(Global Surface Summary of Day,GSD);③全球每日气象网络(Global Daily Climatology Network,GDCN);④中国气象数据网(data.cma.cn)。