J. Korean Soc. Hazard Mitig Search

CLOSE


J. Korean Soc. Hazard Mitig. > Volume 17(2); 2017 > Article
호우 위험도 평가를 이용한 피해예측: (2) 호우피해예측함수 개발

Abstract

This study developed heavy rain damage prediction function according to the risk class of heavy rain damage. Gyeonggi-do province was selected as the study area because the damage frequency by heavy rainfall was the highest in Korea. We used data such as total rainfall, disaster days, precedent rainfall of 1~5 days, and maximum rainfalls for the durations of 1~24 hours as explanatory or independent variables for the prediction function development. The problem of multicollinearity among the variables was solved by the principal component analysis and the variables were simplified. We developed the heavy rain damage prediction function using the data or variables obtained from disaster statistics of 1994 to 2011 and used the data from 2012 to 2015 for evaluating the predictability of the function using NRMSE. The NRMSE of the developed function was 12 ~ 18% and so the function predicted properly the heavy rain damage. In this study, we developed a function for heavy rain damage prediction according to heavy rain risk class and so the function can be used for preparing to the disaster quickly by predicting heavy rain damage in the region. The results of this study can be also used as the basic data for the establishment of disaster prevention system and disaster management in each local government and related ministries.

요지

본 연구에서는 호우피해 위험도 등급별로 호우피해 예측함수를 개발하였다. 이를 위해 호우피해 발생빈도가 가장 많은 경기도 지역을 대상지역으로 선정하였고, 재해기간별 총강우량, 재해일수, 선행강우량(1~5일), 지속시간별 최대강우량(1~24시간) 등의 자료를 설명변수로 사용하였다. 여러 개의 설명변수를 이용하여 모형을 구축할 때 다중공선성의 문제가 발생하는데, 이 문제를 해결하기 위해 주성분분석을 이용하여 설명변수를 간소화 하였다. 1994년부터 2011년까지의 재해통계 자료를 이용하여 호우피해예측함수 모형을 구축하고, 2012년부터 2015년까지의 자료를 활용하여 함수의 예측력을 평가하였다. 평가결과, NRMSE가 12~18%로 호우피해를 적절하게 예측하는 것으로 평가되었다. 본 연구에서 개발한 호우피해예측함수를 이용하면 해당 지역에 대한 신속한 피해 예측으로 사전 대비에 활용할 수 있을 것으로 판단된다. 또한 본 연구의 결과는 각 지자체 및 관련 부처에서 효율적인 방재체계 수립 및 재난관리에 있어 기초자료로 활용될 수 있을 것으로 판단된다.

1. 서론

최근 자연재난의 규모와 발생빈도는 점점 더 증가하고 있는 추세이며, 급격한 도시화 등으로 인하여 재산피해가 증가하고 있는 실정이다. 우리나라에서 최근 10년(2006~ 2015)간 자연재난으로 인해 연 평균 약 5천억원의 피해액과, 약 1조 1천억원의 복구비가 지출되고 있으며, 그중에서 호우발생으로 인한 피해는 65%로 나타났다(MPSS, 2016). 하지만 국내에서는 주로 재해 발생이후 사후복구차원의 연구가 진행되어 왔으며, 사전대비 차원의 재해통계기반의 연구는 미흡한 실정이다. 따라서 사전대비 차원의 재난관리가 가능하다면 보다 더 효율적인 방재체계를 수립할 수 있고, 그 결과 자연재난으로 인한 국민들의 안전이 보장될 것으로 판단된다. 또한 과거의 피해사례를 기반으로 강우량에 따른 피해 예측함수가 개발된다면 재해 발생 전 피해의 규모와 범위에 대한 신속한 예측이 가능할 것이다.
재난 피해 발생 전에 피해 지역 및 범위를 예측하는 국외 연구를 살펴보면, Davis and Skaggs (1992)는 미육군공병단(U.S. Army Corps of Engineers, USACE)에서 조사한 지역별 홍수 피해정보를 수집하여, 주거지 구조물과 내용물에 대한 침수심별 홍수피해 함수를 제안하였다. Dorland et al. (1999)은 네덜란드를 대상으로 1987~1992년 동안 폭풍우 피해액을 종속변수로 보고, 시간당 최대 풍속 등의 기후변수와 주택 및 사업체 수 등과 같은 사회경제적 변수를 설명변수로 선정하여 회귀모형을 제안하였다. 분석 결과, 시간당 최대 풍속이 폭풍우 피해액에 가장 큰 영향을 미치는 것으로 나타났다. Murname and Elsner (2012)는 미국을 대상으로 1900년대부터 2000년대까지의 허리케인 피해와 풍속 자료를 바탕으로 분위회귀분석(quantile regression analysis)을 실시하였다. 그 결과, 풍속 1 m/sec 마다 5%의 피해가 증가하는 것으로 나타났으며, 이러한 풍속과 피해의 관계는 2011년에 있었던 허리케인 Irene 때 발생한 피해를 비교적 정확히 예측할 수 있었다.
국내 연구의 경우 재해통계자료를 이용하여 자연재난 피해액을 추정한 선행된 연구로 국토교통부(Ministry Of Land, Infrastructure and Transport; MOLIT)(2001)에서는 침수면적과 재해연보상의 홍수피해액과의 관계를 회귀분석하여 피해손실함수를 제안하였다. Jang et al. (2009)는 지역별 회귀분석을 통해 홍수피해를 추정하고 이를 통해 지역별 홍수위험도를 평가하는 방법을 제안하였다. 특히, 이 연구에서는 홍수 피해와 시강우량 자료를 바탕으로 비선형회귀분석을 실시하고, 회귀식의 계수를 인문⋅사회⋅경제적 인자들로 나타냈다. Lee et al. (2016)의 연구에서는 재해가 발생하기 전에 재해의 규모와 피해액을 추정하기 위하여 비선형 회귀식을 이용해 강우로 인한 호우피해 예측함수를 제시하였다. 수원시, 양평군, 이천시와 같은 경기도 3개 지역을 대상유역으로 선정하고, 해당 종관기상관측소(ASOS) 자료를 활용하여 모형을 구축한 결과, 각각 피해액이–14%, -15%, 37% 가량 과소 또는 과대 추정되었다.
국내⋅외 연구를 살펴보면 대부분 위험도 및 취약성을 평가하는 연구와 피해를 예측하는 연구가 별개로 진행되어왔으며, 두 가지의 연구를 병행하여 위험도 및 취약성 결과를 이용한 피해예측에 관한 연구는 미비한 실정이다. 따라서 본 연구에서는 ‘호우 위험도 평가를 이용한 피해예측: (1) 호우피해위험지수산정’의 결과를 인용하여 지역적 특성과 재해의 노출 정도 및 저감특성을 반영한 위험 등급에 따른 호우피해 예측함수를 개발하고자 한다.

2. 주성분 분석 및 다중회귀분석

본 연구에서는 지역별 호우 위험등급에 따른 피해 예측 함수를 개발하기 위하여 재해통계자료와 수문기상자료를 이용하여 다중회귀분석을 실시하였다. 또한 사용하는 설명변수들의 다중공선성 문제들로 인하여 모형구축에 어려움이 있어 대표적인 다변량 분석기법인 주성분 분석을 고려하였다. 따라서 본 절에서는 아래와 같이 주성분 분석과 다중회귀분석에 대한 방법론을 설명하고자 한다.

2.1 주성분 분석

회귀분석 과정에서 독립변수들 사이에 상관관계로 인하여 다중공선성을 나타내는 경우, 일반적으로 독립변수의 일부를 제거하거나 새로운 관측치를 도입하기도 한다. 하지만 일부 독립변수의 제거는 정보손실 측면에서 위험 부담이 크기 때문에 대안으로 주성분분석(Principal Component Analysis, PCA)을 이용한 변수의 차원축소 방법을 고려할 수 있다(Gujarati, 2002). 주성분 분석은 서로 상관관계가 높은 여러 개의 변수들을 조합하여 그 변수들의 정보를 함축하고 있는 새로운 인위적 변수를 만들어내기 위한 다변량 통계 분석 기법이다(Jang, 2004). 즉 변수들의 전체분산에서 대부분을 포함하는 소수의 성분을 결정하고, 결정된 성분 개수에 따른 점수 추정치를 계산하여 새로운 독립변수로 활용한다. 주성분분석의 적용성을 판단하기 위하여 신뢰도 검정을 실행하는데, Kaiser-Meyer-Olkin (KMO)테스트, Bartlett 테스트, 편상관계수 값의 부호를 반전시킨 역상관계수(Anti-image correlation)의 값, 개별 변수에 대한 표본적합성 측도(Measure of Sampling Adequacy, MSA)등의 방법이 있다. 여기서, KMO테스트는 표본적합도가 0.6이상일 때 적용이 가능하며, Bartlett테스트에서는 유의수준을 나타내는 p값이 0.05 이하면 적용이 가능하다고 판단하는 것이 일반적이다(Kim, 2013). 성분의 개수를 정하는 방법으로 스크리도표(Scree plot)를 활용하여 고유치(Value)가 1보다 큰 경우 해당 성분개수를 선정하는 방법, 설명된 총 분산의 누적 고유값을 기준으로 하는 방법 및 연구자가 사전에 결정하는 방법이 있다. 주성분점수를 추정하는 방법으로는 회귀기법, 최소자승기법, Bartlett기법, Anderson-Rubin기법 등이 있으며, 이 과정을 거쳐 도출된 주성분 점수를 활용하여 새로운 독립변수로 활용된다. 본 연구에서는 여러 독립변수들의 상관관계가 높아 다중공선성 문제가 있을 것으로 판단하여, 주성분분석을 통해 도출된 주성분 점수를 활용하여 모형 구축을 진행하였다.

2.2 다중회귀 분석

다중회귀분석은 독립변수가 하나인 단순회귀분석을 독립변수가 2개 이상으로 확장시킨 형태를 말하며, 여러 개의 독립변수의 값을 이용하여 종속변수의 값을 예측하는 통계적 기법을 말한다. 보통 예측하고 싶은 변수를 종속변수(목적변수)라 부르고, 예측에 활용되는 변수를 독립변수(설명변수)라 부른다.
다중회귀분석은 종속변수 Y에 대한N개의 독립변수x1, x2, x3xn 의 관계를 선형 함수라고 가정하여 Eq. (1)와 같이 나타낸다.
(1)
yi=β0+β1xi1+β2x2+...+βixi+εi(i=1,2,...,n),εi~N(0,σ2)
여기서, β0은 상수항, βi … βi은 독립변수의 회귀계수, ϵi는 종속변수를 추정할 때 발생되는 오차를 말한다. 회귀계수를 추정하는 방식 중 가장 대표적인 것이 동시입력방식(Enter)과 단계입력방식(Stepwise)이다. 동시입력방식(Enter)은 모든 독립변수을 한꺼번에 포함하여 분석하는 방법이며, 단계입력방식(Stepwise)은 다른 독립변수가 회귀식에 존재할 때 종속변수에 영향력이 있는 변수들만을 회귀식에 포함시키는 방법이다(Lee, 2005). 주로 다중공선성의 문제가 있을 때 해당 변수를 제거하고 모형의 유의성을 높이기 위하여 단계입력방식을 사용하는데 본 연구에서는 주성분 분석을 사용하기 때문에 다중공선성과 모형의 유의성에 문제가 없다고 판단하여 동시입력방식(Enter)을 이용하였다.

3. 대상지역 자료 구축 및 위험도 평가

3.1 대상지역

본 연구에서는 Kim et al. (2017)에서 대상지역을 선정한 방법과 동일하게 지역별 피해횟수와 총 피해액을 확인하여 가장 심각한 지역을 대상지역으로 선정하였다. Table 1은 국민안전처에서 발간한 재해연보자료(1994∼2015년)중 지역별 호우 피해 현황을 나타내었으며, Fig. 1은 대상지역의 위치를 나타냈다. 피해횟수가 668회로 전국에서 가장 빈번한 피해를 입었으며, 총 피해액은 1조 8천억 원으로 전국에서 2번째로 심각한 피해를 입은 것으로 나타난 경기도 지역을 본 연구의 대상지역으로 선정하였다.
Table 1
Heavy Rain Damages in Adminstrative Districts
Districts  Number of heavy rain damages   Total damage (1,000 won) 
Gyeonggi-do 668 1,844,041,207
Jeollanam-do 407 329,692,167
Gyeongsangbuk-do 323 758,529,024
 Chungcheongnam-do  265 395,667,473
Gyeongsangnam-do 261 1,105,296,861
Gangwon-do 259 2,910,359,204
Jeollabuk-do 250 587,927,342
Seoul 248 193,521,559
Chungcheongbuk-do 210 799,908,939
Busan 134 166,712,928
Incheon 128 65,465,720
Daejeon 64 40,803,977
Gwangju 54 9,161,688
Jeju 34 19,632,232
Ulsan 33 41,165,165
Daegu 20 6,155,471
Sejong 16 9,915,741
Total 3,374 9,283,956,698
Fig. 1
Target Area
KOSHAM_17_02_371_fig_1.gif

3.2 재해통계자료 구축

경기도 지역에 해당하는 호우피해 예측함수를 구성하기 위하여 호우에 따른 피해액으로 재해연보자료를 활용하였다. 현재 국민안전처에서 매년 발간하는 재해연보는 1970년대부터 작성되었으나, 체계화된 자료는 1994년부터 제공하고 있다(NMDI, 2013). 또한 정확도 높은 함수를 개발하기 위해 22년간의 화폐가치를 환산하여야하는데, 본 연구에서는 재해연보에서 사용한 방법과 동일하게 생산자 물가지수를 이용하여 1994년부터 2015년까지의 22년의 호우에 따른 피해액을 환산하였다. 앞에서 산정한 호우피해 위험지수를 활용하여 경기도 전체 31개 지역에 대한 3개의 그룹으로 구분하였다. 1994년부터 2011년까지의 자료를 이용하여 함수를 구성하고, 2012년부터 2015년까지의 자료를 예측력 평가용 자료로 활용하였다.

3.3 수문기상자료 구축

우리나라 수문기상자료 관측은 기상청, 국토교통부, 한국수자원공사, 한국수력원자력 등에서 관측소를 설치하여 관리하고 있다. 이중 가장 신뢰도 있고, 관측 자료의 검증 및 관리가 꾸준히 이루어지고 있는 기관은 기상청이다. 기상청은 종관기상관측장비(ASOS)와 무인으로 운영되는 자동기상관측장비(AWS)를 이용하여 지상기상관측업무를 수행하고 있는데, 본 연구에서는 종관기상관측장비(ASOS)를 활용하여 자료를 구축하였다. 대상지역인 경기도 지역에 영향을 미치는 종관기상관측장비는 총 10 개소로 Thiessen 면적법을 활용하여 행정구역 단위별 면적 강우량을 산정하였으며, Fig. 2에서 경기도 지역의 Thiessen망과 영향을 미치는 관측소를 나타냈다. 본 연구에서는 기존의 연구사례(Lee et al., 2016)를 기반으로 피해 발생 전 선행강우량 (1일~5일), 피해발생으로부터 피해종료까지를 피해사상으로 하여 계산된 총 강우량, 그리고 피해 발생기간의 시 강우량으로부터 계산된 지속시간별 최대강우량(1시간~24시간)을 독립변수로 선정하였다.
Fig. 2
The ASOS and Thiessen in Gyeonggi-do
KOSHAM_17_02_371_fig_2.gif

3.4 호우 위험도 평가

호우 위험도 평가는 Kim et al. (2017)의 결과를 인용하였으며 그 내용은 Tables 2 ~ 4와 같다. 위험도는 1등급부터 3등급으로 구분하였으며, 위험등급이 높을수록 해당지역이 더 위험하다는 것을 뜻한다. 분석 결과, 경기도 31개 지자체 중에서 가장 안전한 1등급인 지자체는 15개의 지자체로 나타났으며, Table 2에 정리하였다. 2등급인 지자체는 7개로 나타났으며, Table 3에 정리하였다. 가장 불안한 3등급인 지자체는 9개로 분류되었으며, Table 4에 정리하였다.
Table 2
Risk Evaluation of Heavy Rain Damage in Class 1
Region PI Class SI Class RI Class HDRI Class
Gapyeong-gun  -0.92273  1  0.565013  3  1.113439  3  -0.77647  1
Gwangju-si -0.71669 1 1.013915 3 -0.38015 2 -0.54428 1
Gimpo-si -0.10972 2 -0.68068 1 0.583848 3 -0.93127 1
Seongnam-si 0.125825 2 -0.63032 1 -0.26521 2 -0.77647 1
Suwon-si 1.326409 3 -0.81992 1 0.109336 2 -0.54428 1
Siheung-si -0.53913 1 -0.6962 1 -0.74011 1 -0.77647 1
Anseong-si -0.85194 1 -0.43956 2 0.449443 2 -0.77647 1
 Yangpyeong-gun  -0.24408 2 -0.51226 1 0.993396 3 -0.93127 1
Yeoju-si -0.57689 1 -0.43685 2 0.254445 2 -0.77647 1
Yeoncheon-gun -0.90132 1 0.624635 3 -0.03881 2 -0.54428 1
Yongin-si -0.64755 1 0.38795 2 0.730394 3 -0.93127 1
Paju-si -0.17223 2 0.147188 2 1.057655 3 -0.62168 1
Pyeongtaek-si -0.96129 1 -0.23809 2 0.076697 2 -0.77647 1
Pocheon-si -0.5661 1 0.433854 2 1.290596 3 -0.93127 1
Hwaseong-si 0.077229 2 -0.08113 2 0.903874 3 -0.62168 1
Table 3
Risk Evaluation of Heavy Rain Damage in Class 2
Region PI Rank SI Rank RI Rank HDRI Rank
Goyang-si 0.49923 3 0.406102 2 0.783901 3 -0.31209 2
 Gwacheon-si   0.05792  2  -0.82944  1  -0.83249  1  -0.31209  2
Namyangju-si -0.27738 2 -0.24145 2 0.075052 2 -0.31209 2
Bucheon-si 1.133381 3 -0.37958 2 0.427975 2 0.152298 2
Yangju-si 0.09262 2 0.142589 2 0.338106 2 -0.31209 2
Uiwang-si 0.135444 2 -0.70265 1 -0.84715 1 -0.31209 2
Icheon-si -0.27322 2 2.049199 3 0.321755 2 0.152298 2
Table 4
Risk Evaluation of Heavy Rain Damage in Class 3
Region PI Rank SI Rank RI Rank HDRI Rank
Gwangmyeong-si 0.607731 3 0.258689 2 -0.67437 1 1.545454 3
Guri-si 0.676844 3 0.048753 2 -0.58831 1 1.545454 3
Gunpo-si 0.322389 2 -0.44161 2 -0.8768 1 0.616683 3
 Dongducheon-si   0.222554  2  0.979828  3  -0.48569  1 1.545454 3
Ansan-si -0.28647 2 -0.17786 2 -0.61576 1  0.616683  3
Anyang-si 0.41654 2 -0.20432 2 -0.60714 1 0.616683 3
Osan-si 0.581579 3 0.24726 2 -0.78582 1 1.545454 3
Uijeongbu-si 1.249415 3 0.526524 3 -0.901 1 2.938609 3
Hanam-si 0.521609 3 -0.31959 2 -0.8711 1 1.545454 3

4. 호우피해예측함수 개발

4.1 주성분 분석을 통한 독립변수들의 차원 축소

본 연구에서 선정한 독립변수들 중 지속시간별 최대강우량(1~24시간, 선행강우량(1일~5일)은 개별적인 상관관계가 강하게 나타나기 때문에 다중공선성의 문제를 발생할 수 있다. 따라서 본 연구에서는 앞에서 설명한 주성분분석을 통해 독립변수의 차원을 축소하고, 소수의 주성분 점수를 다중회귀분석에 적용하였다. 신뢰도 검정을 통해 적용 가능성을 판단하였고, 회전방법은 앞에서 기술한 바와 동일하게 Varimax 방법을 사용하여 주성분 점수를 도출하였다. 성분의 개수 선정 방법은 누적기여율이 80% 이상인 것으로 정하였다. 신뢰도 검정 결과는 KMO가 0.945이며, 유의확률이 0.000으로 나타났으며, Table 5에 정리하였다. 선정한 성분 개수는 총 2개로 총 분산의 87% 가량을 설명하는 것으로 나타났으며, 모든 변수에서 성분적재량이 0.5 이상으로 도출되었다. Tables 67에서 설명된 총 분산과 회전된 성분행렬을 통한 성분적재량을 나타내었다.
Table 5
KMO and Bartlett’s Test Result of Independent Variables
Test Result
Kaiser-Meyer-Olkin Measure of Sampling 0.945
 Bartlett’s test of Sphericity   Approx. Chi-Square   90375.171 
Degree of freedom 406
P-Value 0.000
Table 6
Total Variance Explained of Independent Variables
Component Total Variance(%) Cumulative(%) Component Total Variance(%) Cumulative(%)
1 22.315 76.949 76.949 16 0.003 0.011 99.968
2 3.020 10.414 87.363 17 0.003 0.009 99.977
3 1.218 4.200 91.563 18 0.002 0.007 99.984
4 1.032 3.560 95.123 19 0.001 0.005 99.989
5 0.642 2.213 97.336 20 0.001 0.003 99.992
6 0.300 1.033 98.369 21 0.001 0.002 99.994
7 0.159 0.548 98.917 22 0.000 0.001 99.995
8 0.106 0.364 99.281 23 0.000 0.001 99.996
9 0.096 0.333 99.613 24 0.000 0.001 99.998
10 0.039 0.136 99.749 25 0.000 0.001 99.998
11 0.026 0.090 99.839 26 0.000 0.001 99.999
12 0.015 0.052 99.891 27 0.000 0.000 99.999
13 0.010 0.033 99.924 28 0.000 0.000 100.000
14 0.005 0.018 99.942 29 0.000 0.000 100.000
15 0.004 0.015 99.957
Table 7
Rotated Component Matrix of Independent Variables
Variable Component Variable Component Variable Component
1 2 1 2 1 2
D1 -.051 .851 X6 .969 .025 X16 .985 .022
D2 -.087 .915 X7 .975 .040 X17 .982 .017
D3 .051 .947 X8 .978 .044 X18 .978 .014
D4 .123 .722 X9 .983 .049 X19 .974 .013
D5 .006 .886 X10 .986 .049 X20 .972 .010
X1 .830 -.019 X11 .988 .043 X21 .968 .003
X2 .895 -.007 X12 .988 .041 X22 .965 -.001
X3 .913 -.006 X13 .988 .037 X23 .961 -.003
X4 .941 .005 X14 .987 .033 X24 .957 -.009
X5 .956 .014 X15 .987 .027
여기서 D1~D5는 선행강우량 1일~5일을 나타내며, X1~ X24는 지속시간별 최대강우량 1시간부터 24시간을 의미한다. 본 연구에서는 주성분 분석을 통해 도출된 주성분 점수를 PC.1과 PC.2로 표현하였고, 이 값을 독립변수로 활용하였다.

4.2 다중회귀분석을 이용한 호우피해예측함수 개발

본 연구에서는 호우피해위험도평가 결과에 따른 호우피해 예측함수를 개발하기 위하여 위험 등급에 따른 3개의 그룹에 대한 다중회귀분석을 동시입력방식(Enter)으로 구축하였다. Table 8과 같이 안전성 확보를 위해 자연로그로 변환하여 총 5개의 독립변수와 1개의 종속변수를 사용하였고, 1994년부터 2011년까지의 자료를 학습용 자료로 활용하였다.
Table 8
Components of Multiple Linear Regression Model
Index Components
Dependent variable  ln(Total Heavy Rain damages) 
 Independent variables  ln(Area)
ln(Number of Date)
ln(Total Precipitation)
PC.1
PC.2
여기서 Total Heavy Rain damages는 호우피해액, Area는 행정구역별 면적(km2), Number of Date는 재해기간의 일수, Total Precipitation은 재해기간의 총 강우량, PC.1과 PC.2는 선행강우량(1일~5일)과 지속시간별 최대강우량(1시간~24시간)의 주성분 점수를 나타낸다. 다중공선성은 분산팽창요인(Variance Inflation Factors, VIF)과 공차한계(Tolerance, Tol.)를 통해 평가할 수 있는데, 일반적인 기준으로 VIF가 10이상인 경우와 Tol.이 0.1 이하인 경우 모형의 다중공선성이 높다고 판단할 수 있다. 모형의 유의확률은 모형이 유의성을 판단하는 기준으로, F분포 유의확률이 0.05 이하일 경우 모형이 유의하다고 볼 수 있다. 본 연구에서는 선행강우량(1일~5일)과 지속시간별 최대강우량(1시간~24시간)의 주성분 분석을 통해 다중공선성의 문제를 해결하였으므로, 3개의 모형 모두 다중공선성이 발생하지 않았으며, Table 9에서 모형별 Tol.과 VIF를 제시하였다.
Table 9
Result of Multi-collinearity
Model ① Tol. VIF Model ② Tol. VIF Model ③ Tol. VIF
ln(Area) 0.988 1.012 ln(Area) 0.970 1.031 ln(Area) 0.953 1.049
ln(Number of Date) 0.419 2.387 ln(Number of Date) 0.345 2.900 ln(Number of Date) 0.593 1.685
ln(Total Precipitation) 0.245 4.087 ln(Total Precipitation) 0.226 4.418 ln(Total Precipitation) 0.417 2.397
PC.1 0.453 2.205 PC.1 0.483 2.071 PC.1 0.619 1.615
PC.2 0.995 1.005 PC.2 0.945 1.059 PC.2 0.939 1.065
여기서 Model ①은 호우피해위험등급이 1등급인 그룹, Model ②는 2등급인 지역, Model ③은 3등급인 지역을 의미한다. Table 10과 같이 3개의 그룹에 대한 호우피해 예측 함수식을 개발하였으며, F분포 유의확률은 모두 0.05 이하로 함수식이 통계적으로 유의미한 것으로 나타났다. 또한 실제호우피해액과 비교결과 모의된 피해액과의 오차분석결과 NRMSE가 Model ①에서 16%, Model ②에서 15%, Model ③에서 14%로 도출되었다. 여기서 NRMSE는 0에 가까울수록 계산된 값이 참값과 유사하다는 것을 의미한다.
Table 10
Heavy Rain Damage Prediction Functions Derived From Multiple Linear Regression Analysis
Regression equation P-value NRMSE
Model ① Y= 2.873+1.182X1−0.001X2+0.409X3+1.464X4−0.179X5 0.000 16%
Model ② Y= −1.539+1.290X1+0.203X2+1.074X3+0.942X4−0.027X5 0.000 15%
Model ③ Y= 10.994+0.628X1+1.001X2−0.782X3+1.790X4+0.072X5 0.000 14%
여기서X1은 ln(Area), X2은 ln(Number of Date), X3은 ln(Total Precipitation), X4은 PC.1, X5은 PC.2를 말한다.

4.3 호우피해함수의 예측력 평가

본 연구에서 개발한 호우피해 예측 함수의 성능을 검증하기 위하여 2012년부터 2015년의 실제 피해액과 모의된 피해액을 비교 및 평가하였다. 예측력 평가 방법으로는 평균제곱근오차(Root Mean Square Error, RMSE), RMSE를 표준화한 NRMSE(Normalized Root Mean Squared Error, NRMSE), 평균오차(Mean Error, ME), 절대평균오차(Mean Absolute Error, MAE)를 사용하였으며, Eqs. 2-5로 표현된다. 4가지의 평가방법 모두 오차를 평가하는 방법으로 0에 가까울수록 계산된 값이 참값과 유사하다는 것을 의미한다. Table 11에서 모형별 예측력 평가 결과를 나타냈으며, Figs. 3부터 5에서 실제 호우피해액과 예측된 호우피해액의 분포를 나타내었다.
Table 11
Result of Models in Validation Set
 RMSE (1,000Won)   NRMSE (%)   ME (1,000Won)   MAE (1,000Won) 
Model ① 2,935,613 13% 295,590 838,204
Model ② 282,845 18% 50,229 131,333
Model ④ 2,788,458 12% 244,841 427,691
Fig. 3
Estimation and Occurrence Heavy Rainfall Damages (Model ①)
KOSHAM_17_02_371_fig_3.gif
Fig. 4
Estimation and Occurrence Heavy Rainfall Damages (Model ②)
KOSHAM_17_02_371_fig_4.gif
Fig. 5
Estimation and Occurrence Heavy Rainfall Damages (Model ③)
KOSHAM_17_02_371_fig_5.gif
(2)
RMSE=1ni=1n(yiy^)2
(3)
NRMSE=RMSE(Max(yi)min(yi))
(4)
MAE=1n(yiy^i)n
(5)
MAE=1n|yiy^i|n
여기서yi는 i번째 실제호우피해액을 의미하며 y^i는 i번째 모의된 호우피해액을 의미한다.
일반적으로 모형의 설명력을 나타내기 위해 결정계수(R2)와 수정된 결정계수(Adj. R2)를 제시한다. 하지만 본 연구에서는 호우피해액을 예측하는 것이 목적이기 때문에, 결정계수와 수정된 결정계수가 예측력을 판단하기에 어려움이 있다고 판단하여 참값과 예측값의 오차를 분석하여 예측력을 평가하였다. 호우피해위험도의 등급별 호우피해 예측함수의 모의된 피해액과 실제피해액의 통계오차분석 결과를 통해 본 연구에서 제시된 모형의 NRMSE는 12~18%로 3가지 타입의 모형이 모두 20%이하로 나타났다. 또한 RMSE와 ME, MAE의 결과는 Model ②에서 가장 예측력이 높게 나타났으나, 실제피해액의 범위를 고려한 NRMSE에서는 세 가지 모형 중 예측력이 18%로 가장 낮게 나타났다. 이는 Model ②의 실제 호우피해액의 범위가 다른 모형들에 비해 현저하게 적기 때문이며, 오히려 예측력은 Model ③이 가장 높은 것으로 나타났다. 따라서 RMSE, ME, MAE의 결과 모두 오차통계분석이나 3가지 방법 모두 범위를 고려하지 않았기 때문에 이 결과만으로는 예측력을 판단하기 어렵다는 것을 알 수 있었다.

5. 결론

자연재난으로 인한 피해의 65% 이상을 차지하는 호우피해를 대상으로 사전대비 차원의 개략적인 예측이 가능하다면 대비대책을 수립하는데 방향성을 제시해줄 수 있고, 지역별 재난관리에 있어 활용성이 높을 것으로 판단된다. 따라서 본 연구에서는 호우피해가 가장 빈번하게 발생하는 경기도 지역을 대상으로 Kim et al. (2017)의 호우 위험도 평가 결과를 인용하여, 지자체별 위험등급에 따른 호우피해 예측함수를 개발하였다. 종관기상관측소의 시강우 자료를 수집하여 재해기간별 선행강우(1∼5일), 지속시간별(1∼24시간) 최대강우, 총강우량 자료를 독립변수로 활용하였다. 언급된 독립변수들은 상관관계가 높아 다중공선성의 문제가 있을 것이라 판단하여 해결책으로 주성분 분석을 이용하여 독립변수들의 차원을 축소하였다. 호우피해 예측함수 개발을 위해 통계적 방법론으로 다중회귀모형을 사용하였다. 1994년부터 2011년까지의 자료를 학습시켜 모형을 구축하였고, 2012년부터 2015년까지의 자료를 이용하여 예측력을 평가하였다. 주요 결과를 요약하면 다음과 같다.
  • 1) 호우피해 위험도 등급별로 호우피해 예측함수를 구축하였는데, 참값인 실제 피해액과 오차통계 분석결과 NRMSE가 모두 20% 미만으로 도출되어 모형의 예측력이 우수하다고 판단하였다.

  • 2) 예측력평가 결과를 살펴보면 RMSE와 ME, MAE의 경우 Model ②에서 가장 높은 예측력을 나타냈으나, 실제피해액의 범위를 고려한 NRMSE의 결과는 가장 예측력이 낮게 나타났다. 따라서 실제 피해액 범위를 고려하지 않은 평가 방법만으로는 예측력을 평가했다고 보기 어렵다는 사실을 알 수 있었다.

  • 3) 기존의 재해통계기반 피해액 예측함수 개발에서는 표본의 개수가 부족하여 개발된 함수의 예측력이 떨어지는 문제가 있었다. 본 연구에서와 같이 재난피해위험도 등급별로 군집화를 실시하여 표본개수를 증대하는 방안을 도입한다면, 표본 개수 부족이라는 고질적인 문제점을 해결 할 수 있을 것으로 판단된다.

본 연구에서 호우피해 예측함수에 활용된 독립변수는 지속시간별 최대강우량(1시간~24시간), 선행강우량(1일~5일), 재해기간 총 강우량, 행정구역 면적, 재해기간 일수이다. 물론 기상자료에 대하여 호우피해액이 가장 민감하게 반응할 것으로 예상되지만, 향후 연구에서 방재예산, 사회⋅경제적 변수 등을 추가하여 모형을 구축한다면 모형의 예측력을 높일 수 있는 방법이라 사료된다. 본 연구결과를 바탕으로 사전대비 차원의 개략적인 피해예측이 가능할 것으로 판단되며, 각 지자체 및 관련 부처에서 효율적인 방재체계 수립하는데 있어 기초자료로 활용될 것으로 사료된다.

감사의 글

본 연구는 정부(국민안전처)의 재원으로 재난안전기술개발사업단의 지원을 받아 수행된 연구임 [MPSS-자연-2015-79].

References

Baeck, S.H, Choi, S.J, Hong, S.J, and Kim, D.P (2011) A Study on Comparison of Normalization and Weighting Method for Constructing Index about Flood. Journal of Korean Wetlands Society, Vol. 13, No. 3, pp. 441-426.

Chae, M.O, and Oh, Y.J (2003) A study on Land Suitability Factors and Their Weights. Journal of Korean Geographical Society KGS, Vol. 38, No. 5, pp. 725-740.

Davis, S.A, and Skaggs, L.L (1992) Catalog of residential depth-damage functions used by the army corps of engineers in flood damage estimation. Army Engineer Institute For Water Resources Alexandria Va.

Dorland, C, Tol, R.S, and Palutikof, J.P (1999) Vulnerability of the Netherlands and Northwest Europe to storm damage under climate change. Climatic change, Vol. 43, No. 3, pp. 513-535. 10.1023/A:1005492126814.
crossref
Gujarati, Damoar (2002). Multicollinearity: what happen if the regressors ar correlated?. Basic Econometrics. 4th ed. McGraw-Hill, p 363-363.

Jang, M.W (2004) Development of regional vulnerability assessment methodology for agricultural drought using GIS. Ph.D. Dissertation, Seoul National University. Seoul.

Jang, O.J, and Kim, Y.O (2009) Flood Risk Estimation Using Regional Regression Analysis. Journal of the Korean Society of Hazard Mitigation, Vol. 9, No. 4, pp. 71-80.

Kim, J.S, Choi, C.H, Lee, J.S, and Kim, H.S (2017) Damage Prediction Using Heavy Rain Risk Assessment:(. 1) Estimation of Heavy Rain Damage Risk Index. Journal of the Korean Society of Hazard Mitigation, Vol. 17, No. 2, pp. 361-370. 10.9798/KOSHAM.2017.17.2.361.

Kim, K.H (2013) A Study on Estimation of Flood Damage and Development of Flood Damage Index on Public Facilities. Ph.D. Dissertation, Inha University.

Kim, Y.S (2016) Development of Resilience Indicator Based on Big Data Analysis Under Climate Change. Ph.D. Dissertation, Inha University.

Lee, H.S, and Lim, J.H (2005). SPSS 12.0 manual. Bobmunsa.

Lee, J.S, Eo, G, Choi, C.H, Jung, J.W, and Kim, H.S (2016) Development of Rainfall-Flood Damage Estimation Function using Nonlinear Regression Equation. Journal of the Korean Society of Disaster Information, Vol. 12, No. 1, pp. 74-88. 10.15683/kosdi.2016.3.31.74.
crossref
Lee, M.W, Kim, T.W, and Moon, G.W (2013) Assessment of Flood Damage Vulnerability Considering Regional Flood Damage Characteristics in South Korea. Journal of Korean Society of Hazard Mitigation, Vol. 13, No. 4, pp. 245-256. 10.9798/KOSHAM.2013.13.4.245.
crossref
Lim, K.S, Choi, S.J, Lee, D.R, and Moon, J.W (2010) Development of Flood Risk Index using causal relationships of Flood Indicators. Journal of The Korean Society of Civil Engineers, Vol. 30, No. 1, pp. 61-70.

Ministry of Public Safety and Security(MPSS) (2016). The 2015 Annual Natural Disaster report. Ministry of Public Safety and Security.

Ministry of Land Infrastructure and Transport(MOLIT) (2001). Study on improvement plan of economical efficiency of flood defense business.

Murnane, R.J, and Elsner, J.B (2012) Maximum wind speeds and US hurricane losses. Geophysical Research Letters, Vol. 39, No. 16, 10.1029/2012gl052740.
crossref
Nam, Y.G (2015) Study on Identification of Flood Risk Areas by Flood risk Assessment. Doctor’s Dissertation, Yeungnam University.

National Disaster Management Institute(NDMI) (2013). Development of Regional Loss Function Based on Scenario. National Disaster Management Institute.

OECD(Organization for Economic Cooperation and Development) (1991). Environmental indicators. A preliminary set. Paris, France.



ABOUT
ARTICLE CATEGORY

Browse all articles >

BROWSE ARTICLES
AUTHOR INFORMATION
Editorial Office
307 Main Bldg., The Korea Science Technology Center, 22 Teheran-ro 7-gil(635-4 Yeoksam-dong), Gangnam-gu, Seoul 06130, Korea
Tel: +82-2-567-6311    Fax: +82-2-567-6313    E-mail: master@kosham.or.kr                

Copyright © 2019 by The Korean Society of Hazard Mitigation. All rights reserved.

Developed in M2community

Close layer
prev next