分佈型類神經網路降雨逕流模式之研究

周乃昉 鄭子璉

摘  要

  類神經網路 (ANN) 具有快速計算、學習及容錯的能力,並可在資訊不完整的狀態下進行分析。此外配合電子計算機計算能力之提昇,ANN 已成為應用廣泛的人工智慧方法。本研究使用倒傳遞網路檢討及發展了模擬型及預測型之降雨逕流模式,並討論 (1) 集塊型及分佈型ANN降雨逕流模式之適用性;(2) 觀測學習及模擬學習對ANN降雨逕流模式分析成果之影響;(3) 利用單元值擾動敏感度做網路修剪。研究中取曾文水庫進水量為實例研究對象,在經過學習訓練後,分佈型模式較集塊型模式更能分離出完整的降雨逕流過程。

 

一、前  言

  類神經網路 (Artificial Neural Network, ANN) 中之倒傳遞網路 (Back-Propagation Neural Network, BPN) 為一種監督式學習網路,此種網路具有一輸入層,一輸出層及0到無限多的隱藏層。學習過程中必須給定期望輸出值,藉以調整網路內的連結鍵值,及隱藏層中各處理單元的輸出值,適合應用在分類、決策及預測等分析。本研究即選擇BPN發展分佈型降雨逕流模式,期能保留水文專家對模式合理架構的經驗推測,且能濾除人為的判斷誤差。

  目前已應用ANN 在降雨逕流模式的應用研究有 French (1992) [1] 等人將 BPN 運用於空間與時間之降雨強度預測,預測一小時後的降雨。Hjelmfelt 等人 (1993) 以 ANN 模擬單位歷線,並闡述經訓練後所得之網路連結鍵值矩陣即為單位歷線;Halff 等人 (1993) 以 ANN 模擬降雨-逕流關係;M. Lorrai 等人 (1995) 使用二層隱藏層的 BPN 架構降雨-逕流模式,分析月雨量與月流量間的關係;Hsu (1995) 等人則使用標準的 BPN 探討降雨-逕流之關係。類似的方法中,張斐章 (1992) 採用自組性演算法 (GMDH) 推算出高階非線性的降雨逕流關係多項式;孫建平等人 (1995) 亦利用標準的 BPN 架構於時雨量預測,並與 GMDH 所得之結果相比較。上述研究都屬集塊型的降雨逕流模式。

 

二、分析模式

  根據降雨逕流模式實用上的需求,本研究假定集水區特性可由 ANN 模仿,並可由 BPN 的隱藏層擬合集水區系統降雨逕流過程之非線性特質。由此決定之BPN 降雨逕流模式的基礎架構及網路中各層的處理原則如下:

  1. 輸入層:輸入值為集水區的雨量或平均雨量,而非有效降雨量;輸入單元採取數個相對應於集水區流出量的前數小時雨量,另外再加入過去數個小時的流出量。對於輸入端的集水區降雨量與流出量,兩者數值可能相差一個值級以上,所以輸入資料先做正規化處理。
  2. 隱藏層:分別考慮採用一層或兩層。
  3. 輸出層:輸出值為集水區的總流出量,而非直接逕流量;僅考慮一個集水區流出量。

  經以不同型式輸入降雨量觀測值下,分別建立三種模式:

1. 集水區平均降雨逕流模式 (ARM)

  平均降雨對集水區流出量。對集水區內的雨量站做徐昇網分析,計算各單位時間的全集水區平均降雨。選用連續數個集水區的平均降雨量做為輸入向量。

2. 雨量站直接降雨逕流模式 (RSM)

  各雨量站之直接降雨對集水區流出量。直接選用各雨量站的降雨量,及集水區數個前期流出量做為輸入向量。若碰上雨量站故障,則本模式將無法立即應用。

3. 地理分區分佈降雨逕流模式 (GDM)

  GIS 地理分區的平均降雨對集水區流出量。將集水區劃分為幾個地形特性相近的子集水區,計算各子集水區的平均降雨量及前期數個流出量做為輸入向量。

  本研究分別考慮觀測及模擬兩種學習方式,研究類神經網路模式 (ANNM)。在觀測記錄中挑選數場暴雨做為學習樣本,剩下的暴雨則用作驗證。此外,對前期流出量輸入觀測值與否之影響亦作一探討。

 

三、曾文水庫集水區系統應用

  採用曾文水庫集水區之降雨逕流過程為實例分析,該集水區內有六個電傳雨量站:表湖、水山、樂野、里佳、馬頭山及曾文新村,其位置參見圖1。為方便比較,各模式均採用相同之學習案例及相同時段的輸入向量。以各場暴雨的總雨量作為比較選擇的依據,選出彼此差異較大的三場暴雨進行學習。

3.1 集水區平均降雨逕流模式 (ARM)

  集水區之徐昇多邊形網繪於圖 1,各雨量站之徐昇加權因子見表 1 [2]。研究中採用連續 8 小時之平均降雨,及前 7 小時之集水區流出量為輸入單元。根據前置計算結果,第一隱藏層含 4 個處理單元,第二隱藏層含 2 個處理單元。

3.2 雨量站直接降雨逕流模式 (RSM)

  根據前置計算發現過多的輸入資料會干擾學習精度,因此依據各雨量站位置的遠近,從不同的流出稽延時間起,採用連續 5 小時之各雨量站直接降雨,及 3 小時之集水區前期流出量,做為輸入單元。

3.3 地理分區分佈降雨逕流模式 (GDM)

  將水庫集水區按支流集水區邊界、地理位置及坡度,分成六個地理特性相近的子集水區,見圖 1 。各子集水區雨量站之徐昇加權因子見表 2 ,並計算各區在各單位時間的平均降雨。依據各雨量站位置,從不同的流出稽延時間起,採用連續5小時之各個雨量站直接降雨,及 3 小時之集水區前期流出量,做為輸入單元。

3.4 學習評鑑指標

  本研究運用兩種評鑑指標討論學習結果之速度及精度,分列如下:

1. 均方根誤差 (RMSE):

(1)

  式中,n = 推算樣本組數;Y = 推算輸出值;T = 觀測值。

2. 正規化誤差變異數 (NEV):

(2)

  式中, = 平均觀測值;Y = 推算輸出值;T = 觀測值。

3.5 網路權值學習型式

  兩種學習方式如下:「觀測學習」在各時段下每一組資料在學習時,均使用觀測值做輸入;而「模擬學習」在輸入單元的集水區流出量均為過去數個時段的推論值。

 

四、實例分析與討論

4.1 收斂與誤差

  圖 2 是 GDM 的案例學習成果圖。三種模式學習收斂速度及誤差均不同,在相同的學習次數下,RSM 有最快的收斂性,GDM 次之,ARM 收斂最慢。原則上應讓模式收斂到接近極小值後再做學習結果比較,但各模式的極小值很難確認,學習比較時,不易認定模式是否已接近收斂的程度。ARM 由於系統較簡單,因此收斂較快,但學習精度較差。又由驗證計算結果得知,GDM 推算之集水區流出量與觀測流量的均方根誤差最小,RSM 次之,ARM 最大。

4.2 輸入單元值影響分析

  在輸入層各單元均已正規化處理下,將各單元輸入值先設定為0.5 ,再對欲檢討之輸入單元值加上一微小擾動量 0.1 進行分析,可將擾動對輸出值的影響繪成單元值擾動圖。因輸入單元值之正值與負值擾動的影響僅有微小差異,且基本趨勢與量的大小都相當接近,因此僅就單元值正擾動圖探討。

  圖 3 所示為 GDM 的單元值正擾動圖。在 ARM 單元值正擾動圖中, t-2 時段的平均降雨量對目標時段集水區流出量的推算影響最大。在 RSM 的單元值擾動圖中,前期流出量為影響集水區流出量的最主要輸入單元,而各雨量站之降雨僅小幅調整目標流出量,可能因各上下游雨量站對流出均有部份影響,所以各站的影響互有抵消,但特性仍保存在 ANNM 中。若去除前期集水區流出量之輸入單元後,位於集水區下游靠近水庫的二個雨量站在 t 及 t-1 時段的降雨量對集水區流出量的影響較大,其餘各雨量站皆可就其位置說明其在降雨逕流過程中對逕流的影響。

  GDM 分析中,前期集水區流出量為影響集水區流出量的主要輸入單元。基本上可按地理位置及特性擬合降雨對逕流之影響,位於水庫週邊的第六區 (twgis1-6) 在 t 及 t-1 時段之降雨對逕流影響最大;第一區 (twgis1-1) 在 t-4 時段的降雨對逕流影響最大,而 t-7 時段的降雨對流出量影響甚小。第五區 (twgis1-5) 的降雨對整體流出之影響不顯著,相較於 RSM 的表湖雨量站 (410p038) 來說有相同特性,由圖 2 可知第五地理分區便包含表湖雨量站,或許是因學習案例中無降雨集中在中游的暴雨,故無法學習該區降雨對逕流的影響。

4.3 連結鍵值平方和與網路修剪

  將輸入層各單元對隱藏層每一單元的網路連結鍵值平方加總,繪成權值平方和圖。在 RSM 及 GDM 來說,即使降雨落在上游的河渠內,也無法在短時間內流入水庫,提供 t 至 t-3 時段降雨量可能會誤導模式學習,而在集水區內的下游地區提供過多的早期降雨量亦會使上游的降雨影響被抵銷,如圖 4 所示。因此應對系統網路做合理的人工修剪,以免因過多不合物理意義的資訊輸入,誤導了ANN 的學習。

4.4 單元值擾動敏感度及網路修剪

  在討論觀測學習與模擬學習中,檢討了降雨輸入單元值對流出量推估的影響:對欲檢討之目標單元值加上擾動量 -0.45 ~ 0.45 ,並將其對輸出單元值的影響量,繪成單元值擾動敏感度圖,按各輸入單元分別繪圖之成果見圖 6圖 7 。比較各單元值擾動敏感度,ARM 的擾動量產生之影響多為非線性,可能因輸入資訊簡單,平均降雨量的影響為非線性,因此單元值擾動敏感度為曲線,而在 RSM 及 GDM 中,單元值擾動之敏感度多接近線性變化,可假定已將相互之影響分離出來。

  另外,根據單元值擾動敏感度分析可以發現,部份輸入單元對整體輸出之影響皆近於零,可能係學習案例無法提供該處理單元之特性供學習,亦有可能該節點在模式中並不重要,故可利用此圖將不重要的處理單元進行刪剪。

4.5 隱藏層及其處理單元數量

  在前置研究中,三種模式之隱藏層與處理單元的個數在相同的學習次數下有不同的收斂速度,由表 3 可發現 ARM 在第一隱藏層為 4 個處理單元,第二隱藏層為 2 個處理單元時,其 NEV 最小;另兩模式之 NEV 最小均發生在第一與第二層隱藏層均為 4 個處理單元時。按照表 4 的比較結果,各模式均採用 NEV 最小的隱藏層結構進行分析。

  在 ARM 中,利用人工簡化各雨量站的輸入單元個數,因平均降雨的輸入資訊較少,若隱藏層處理單元過多反會失真﹔而 RSM 與 GDM 因提供較多的輸入資訊,過少的隱藏層處理單元,反會因鍵結數不足﹐而不足以擬合其複雜性。但若隱藏層處理單元過多,雖經較多次的學習能將案例的誤差縮小,但驗證誤差則有可能增加,其原因可能為過度擬合 (over fitting)。

4.6 模擬驗證

  模擬驗證的輸入層採用非觀測值,對暴雨發生前之基流流況,先假定初始連續7小時的流量為 20 CMS 輸入,其後再將推算所得的集水區流出量逐一放入輸入層,進行下一時段的集水區流出量推算,直至時段終了。

  就推算結果而言,模擬學習模式較原觀測學習模式應用於模擬驗證為佳。原因為模擬學習以學習連續時段集水區流出量的變動為主要目標;而觀測學習是利用觀測降雨量進行前期集水區流出量的修正。兩種方法之學習目標不同,因此在學習方法上,宜由應用方向決定,若應用在現場操作上,則宜採用觀測學習;若欲應用在設計上,則採用模擬學習較佳。

  以觀測驗證而言,模擬學習模式與觀測學習模式之間較難判定孰優孰劣。模擬學習的網路參數記憶集水區流出量的整體變動,因此,對集水區流出量的可能變動趨勢掌握極佳;觀測學習的網路參數記憶集水區流出量的修正變化,因此,對集水區流出量的局部修正較正確。

  另外對九三水災進行分析,各種模式均無法做較佳的擬合,原因可能是此暴雨發生的前兩日下了一場颱風雨,土壤含水量近於飽合,而訓練中的各模式均無臨前降雨的輸入條件可資學習。

 

五、結論與建議

5.1 結論

  1. ANN 對具非線性特質的降雨逕流過程有極佳的擬合能力,對大面積與不均勻降雨下的降雨逕流過程仍能提供良好的擬合。
  2. 由分析單元值擾動之特性可知,ANN 可模仿集水區的物理特性,並以網路連結鍵值與偏權值的型式記憶在網路中。
  3. 宜由應用的方向選擇 ANN 的學習方式。若模式欲應用在即時操作上,可採用觀測學習;若欲應用在設計上,則以模擬學習較佳。
  4. 可利用單元值擾動敏感度及連結鍵值平方和,做為修剪網路的參考。
  5. 增加輸入節點有助於提高學習精度,但亦須增加學習案例及隱藏層的節點數。
  6. 以人工方式先簡化降雨逕流過程,對學習速度及精度皆會有相當幅度的改善,也可減少學習案例的需求量。

5.2 建議

  1. 可考慮將溫度、溼度、蒸發量、降雨前逕流•••、等臨前降雨條件適當的選擇輸入,以提高模式的完整性與精度。此外,入滲量、土壤含水量或降雨延時等即時資訊,亦可提供修正 ANNM。
  2. 宜蒐集降雨分別集中下在集水區上、中、下游的案例供 ANNM 學習。
  3. 可增加不修正的輸入、輸出處理單元,以傳遞前一時段的系統狀態輔助推算。

 

六、參考文獻

  1. 鄭子璉,「分佈型類神經網路降雨逕流模式之研究」,碩士論文,國立成功大學水利及海洋工程研究所,1996。
  2. 周乃昉、鄭子璉,「徐昇多邊形網的自動化計算」,八十四年電子計算機於土木水利工程應用論文研討會論文集,中壢,第 465-476 頁,1995。

 

Study of Distributed Artificial Neural Network Rainfall-Runoff Model

Frederick N.F. Chou and Tze-Lien Tseng

Department of Hydraulics and Ocean Engineering

National Cheng-Kung University, Tainan, Taiwan 70101,ROC

ABSTRACT

Three artificial neural network (ANN) rainfall-runoff models differing in input rainfall information were developed and discussed in this study. One model uses average rainfall of whole catchment (ARM), the other two use rainfall of every rain gages (RSM ) directly and average rainfall of several geographical sub-catchments in the catchment (GDM). Hourly rainfall collected from 6 telemetry rain gauges over Tsengwen reservoir catchment were used for case study. The GDM was the best out of three studied models after training. Considering the purpose of application, one should adopt “observation learning” for real-time operation and “simulation learning” for design. As to the model simplification, sensitivity analysis of input nodes can provide valuable information and indicated significant nodes in ANN.

 

表 1 曾文水庫集水區之電傳雨量站位置及徐昇加權因子表

雨量站名 雨量站號 東經 北緯 徐昇加權因子
表 湖 410p038 120 40 00 23 15 00 0.1437
水 山 410p046 120 48 45 23 28 28 0.1083
樂 野 410p047 120 43 00 23 28 17 0.1064
里 佳 410p048 120 43 32 23 28 17 0.2322
馬頭山 410p049 120 35 23 23 20 19 0.2922
曾文新村 410p050 120 30 00 23 13 20 0.0632

表 2 曾文水庫各子集水區之電傳雨量站徐昇加權因子

雨量站名 雨量站號 twgis1-1 twgis1-2 twgis1-3 twgis1-4 twgis1-5 twgis1-6
表 湖 410p038 - - 0.3750 - 0.4937 0.0694
水 山 410p046 0.5176 - - - - -
樂 野 410p047 0.3482 0.3397 - - - -
里 佳 410p048 0.1342 0.6603 0.4653 - - -
馬頭山 410p049 - - 0.1597 1.0000 0.5063 0.6041
曾文新村 410p050 - - - - - 0.3265

表 3 不同隱藏層處理單元個數下,模式之參數數量與正規化誤差變異數 (nev)

處理
單元
第一隱藏層 12 10 8 6 4 4
第二隱藏層 4 4 4 4 4 2
ARM 網路連結鍵 232 194 156 118 80 70
偏 權 值 17 15 13 11 9 7
NEV 0.164 0.160 0.137 0.172 0.144 0.128
RSM 網路連結鍵 448 374 300 226 152 142
偏 權 值 17 15 13 11 9 7
NEV 0.076 0.069 0.060 0.075 0.049 0.059
GDM 網路連結鍵 448 374 300 226 152 142
偏 權 值 17 15 13 11 9 7
NEV 0.055 0.071 0.054 0.054 0.053 0.060

圖 1 曾文水庫集水區之電傳雨量站位置、地理特性分區與徐昇多邊形網圖

 

圖 2 GDM模式之學習案例圖

圖 3 GDM模式之輸入單元值正擾動圖

圖 4 GDM模式之權值平方和圖

圖 5 模擬學習之GDM模式輸入單元值正擾動圖

圖6 ARM模式觀測學習之敏感度分析圖

圖7 RSM模式模擬學習中樂野站之敏感度分析圖