J. Korean Soc. Hazard Mitig Search

CLOSE


J. Korean Soc. Hazard Mitig. > Volume 17(2); 2017 > Article
태풍 피해유형 분석과 태풍피해예측함수 개발

Abstract

In recent years, natural disaster frequently occurs due to the pattern changes of extreme meteorological appearance with climate change. It could be very helpful to establish comprehensive countermeasures for natural disaster, if an occurrence probability and damage can be predicted in a certain area. In this study, we analyzed the trend of damage occurrences and amounts of property caused by typhoon presented in Statistical yearbook of natural disaster conducted based on each county in South Korea. Through the analyses, we found that the seaside districts show larger damage than other inland districts and has been affected by all of disasters due to heavy rain, strong wind, tide level rise, and wind wave. Furthermore, we constructed typhoon damage datasets for Gangseo-Gu, Busan City, since 1993 and developed damage forecasting functions. The functions were developed by two statistical methodologies, regression model with stepwise variable selection and generalized linear model with improved variable selection. The predictive abilities of the latter were better than those of the former.

요지

기후변화로 극한기상의 발생 패턴이 변화하여 자연재해가 빈발하고 있어, 재해발생 가능성을 분석하고 피해정도를 미리 예측할 수 있다면 재해대책을 수립하는데 도움을 줄 수 있을 것이다. 본 연구에서는 재해연보에 나타나 있는 시군구별 태풍피해횟수와 피해액을 분석하여 피해 양상을 파악하였으며, 태풍으로 인한 임해시군구 피해가 내륙시군구에 비하여 크고, 호우, 강풍, 해수면 상승과 풍랑으로 인한 재해특성을 모두 나타내는 것으로 파악되었다. 또한 부산광역시 강서구를 대상으로 1994년 이후의 태풍피해자료를 구축하여 태풍피해예측함수를 개발하였다. 태풍피해예측함수는 단계적 변수선택법을 적용한 회귀모형과 개선된 변수선택법을 적용한 일반화선형모형의 2가지 통계적 방법론들을 이용하여 개발되었고, 후자의 경우가 더 우수한 예측력을 보임을 확인하였다.

1. 서론

기후변화에 관한 정부 간 협의체(Intergovernmental Panel on Climate Change, IPCC)의 제 5차 평가 보고서(AR5, 2013)에 따르면, 기후변화로 극한 기상의 발생 패턴이 변화되어 홍수, 폭염, 혹한 등의 기상이변이 더욱 심각해질 것이라고 하고, 그 영향으로 대규모 인명피해 및 재산피해를 유발하는 자연재난이 지속적으로 증가하고 규모 역시 커지고 있다.
우리나라의 자연재해 피해발생 원인으로는 호우와 태풍이 대부분을 차지하므로(Ahn et al., 2015), 국토개발과정에서 풍수해에 의한 재난을 줄이기 위한 다양한 방안을 모색하고 있고, 재해영향평가 및 사전재해영향성검토(자연재해대책법), 도시계획수립지침 등에 따라 자연재해에 대비한 위험성을 평가하고, 재해에 대비하도록 하고 있다.
태풍으로 인한 재해는 호우, 강풍, 해수면상승과 파랑으로 인한 피해가 짧은 기간에 동시에 발생하는 특징을 가진다. Park et al. (2013)Yang and Yi (2013)는 태풍에 동반된 강풍에 의한 피해에 대하여, Ko et al. (2006)는 태풍에 따른 파랑으로 인한 항만 시설물의 피해에 대하여 분석하였다. Kim et al. (2014a)는 해수면 상승으로 인한 재해취약성 개선에 대하여 연구하였다. 태풍으로 인한 재해 위험도와 관련하여, Lee and Chang (2009)은 GIS를 이용한 태풍 위험도 추정과 피해대상 자료의 구축에 대한 연구를 수행하였고. Lee and Choi (2016)는 시군구별 사회적, 지형적, 경제적 홍수피해특성을 반영할 수 있는 홍수피해지표를 개발하였다.
국립방재연구소(2001)는 사전방재 노력이 피해절감효과와 상관관계가 있는지 여부를 연구하였는데, 이는 재해 예방과 대비의 중요성을 강조한 것으로, 자연재해 피해여부와 피해액을 산정하여 예방과 대비에 이용하고자 하는 연구가 최근에 활발히 진행되고 있다. Jang et al. (2016)은 국외 풍수해 피해예측시스템을 조사하고 국내 실정에 맞는 시스템이 개발될 수 있도록 그 전략을 제시하였다. 풍수해 피해예측을 위한 연구는 손실손상함수를 구하여 피해를 예측하는 방법(Kim et al., 2014b)과 재해통계를 이용하여 수문기상현상과 지역특성과의 관계를 도출하는 방법으로 구분되어진다. 국토연구원(KRIHS, 2005)는 시군구별 홍수피해 자료를 토대로 홍수발생빈도와 피해액과의 관계를 빈도분석하여 홍수피해의 발생특성을 확률적 개념에서 분석하고, 홍수피해에 영향을 주는 인자들을 도출하여 그 영향 정도를 수치화하는 홍수피해지표를 제시한 바 있다. Jun et al. (2008)은 호우⋅태풍 피해를 재해연보를 이용하여, 지역특성과 발생횟수 및 피해액에 따라 구분하고 지역별 특성에 따른 피해정도를 분석하였고, Lee et al. (2016)은 태풍 내습 시 강풍, 호우 등에 따른 지역별 피해액의 지역적 특성과의 관계를 연구하였다.
본 연구에서는 수문기상자료와 해수면 상승에 따른 조위자료를 이용하여 태풍에 의한 피해를 예측할 수 있는 모형을 개발하여, 피해가 예상되는 지역의 재해 대비에 도움을 줄 수 있는 방법을 제시하고자 한다. 먼저 재해연보에 기초하여 태풍피해횟수와 피해액을 분석하여 태풍피해유형을 분석하고, 피해유형분석에 따른 자연재해원인을 파악한 후, 이를 반영할 수 있는 수문기상자료 및 조위자료를 이용하여 태풍피해예측함수를 개발한다. 이 과정에서 실질적인 예측력을 높일 수 있는 통계학적 방법론들이 적용되었다.

2. 태풍 피해

2.1 피해발생 태풍 조사

본 연구에서는 태풍피해를 조사하고 분석하기 위한 기초자료로 국민안전처에서 발행하는 재해연보를 이용하였고, 기간은 1994년부터 2013년까지 총 20년간의 자료를 채택하였다. 이 기간 동안 피해를 유발한 태풍 목록이 Table 1에 나타나 있다. 여기서 태풍시작과 종료는 우리나라에 영향을 주기 시작한 날과 영향이 끝난 날이며, 태풍의 생성, 소멸과는 무관하다.
Table 1
Typhoon List
No. typhoon affecting start affecting end Central pressure No. typhoon affecting start affecting end Central pressure
1 BRENDAN 1994-07-31 1994-08-02 992hPa 16 MEGI 2004-08-17 2004-08-19 970hPa
2 DOUG 1994-08-09 1994-08-12 925hPa 17 NABI 2005-09-06 2005-09-18 925hPa
3 ELLIE 1994-08-14 1994-08-16 965hPa 18 WUKONG 2006-08-17 2006-08-21 980hPa
4 SETH 1994-10-10 1994-10-12 910hPa 19 SHANSHAN 2006-09-16 2006-09-18 919hPa
5 FAYE 1995-07-23 1995-07-24 950hPa 20 MAN-YI 2007-07-13 2007-07-16 930hPa
6 TINA 1997-08-07 1997-08-09 955hPa 21 NARI 2007-09-13 2007-09-18 935hPa
7 OLIWA 1997-09-15 1997-09-17 915hPa 22 KALMAEGI 2008-07-19 2008-07-21 970hPa
8 YANNI 1998-09-29 1998-10-01 965hPa 23 DIANMU 2010-08-09 2010-08-12 980hPa
9 ANN 1999-09-17 1999-09-24 985hPa 24 KOMPASU 2010-09-01 2010-09-03 960hPa
10 PRAPIROON 2000-08-30 2000-09-01 965hPa 25 MALOU 2010-09-05 2010-09-07 992hPa
11 SAOMAI 2000-09-12 2000-09-16 925hPa 26 MUIFA 2011-08-06 2011-08-10 930hPa
12 RAMMASUN 2002-07-05 2002-07-06 945hPa 27 KAHNUN 2012-07-17 2012-07-19 985hPa
13 RUSA 2002-08-30 2002-09-01 950hPa 28 BOLAVEN 2012-08-25 2012-08-30 910hPa
14 SOUDELOR 2003-06-18 2003-06-19 955hPa 29 SANBA 2012-09-14 2012-09-17 900hPa
15 MAEMI 2003-09-11 2003-09-13 910hPa
재해연보에는 기초자치단체인 시군구별로 하천, 도로, 철도 등 14가지 공공시설과 건물, 농지 등 11가지 사유재산 피해액을 복구비 기준으로 나타내고 있으며, 태풍이 영향을 미치기 시작한 날과 종료한 날이 모두 기재되어 있다. 재해연보에 나타난 태풍피해 자료의 정확성을 확인하기 위하여 국가태풍센터의 태풍자료와 비교하였고, 오류가 있는 태풍은 제외하였는데, 제외된 원인으로는 국가태풍센터에 태풍발생이 없는 기간에 피해가 발생한 사례(2004년 7월 2일부터 7월 17일 피해 등 총 6개 피해사례), 태풍이 소멸한 후에 우리나라에 피해를 발생시킨 사례(1997년 OLIWA등 총 8개 피해사례) 등이 있고, Table 1에 나타나 있는 태풍 중 2000년에 내습한 프라피룬(Prapiroon)은 발생기간에 오류가 있어 수정하였다. 태풍피해액은 피해발생년도의 생산자 물가지수를 고려하여 2014년 기준으로 산정하였으며, 생산자 물가지수는 한국은행(http://ecos.bok.or.kr/)의 자료를 이용하였다.

2.2 시군구별 태풍피해 분석

20년간의 재해연보를 이용하여 시군구별 태풍피해 횟수와 피해액을 조사하였으며 Figs. 12에 나타나 있다.
Fig. 1
Numbers of Typhoon Damage
KOSHAM_17_02_339_fig_1.gif
Fig. 2
Amount of Typhoon Damage
KOSHAM_17_02_339_fig_2.gif
Fig. 1 (a)에서 공공시설물 피해횟수가 많은 지역은 전라남도 전지역, 경상남도 전지역, 경상북도, 강원도 지역의 바닷가에 위치한 임해시군구 지역임을 알 수 있는데, 전라남도와 경상남도 내륙에 위치한 시군구중 지리산 인근의 산청, 함양, 남원, 하동 등의 지역이 피해가 빈발한다. 공공시설피해횟수는 지리산을 중심으로 한 내륙지역과 남해안 및 동해안의 임해시군구지역의 피해횟수가 많은 것을 알 수 있다. Fig. 1 (b)의 사유재산 피해횟수도 공공시설과 비슷한 경향을 보이나, 전라남도 및 경상남도 내륙 시군구의 피해횟수도 많음을 알 수 있는데, 사유재산 피해발생횟수가 내륙지역에 많은 이유는 조사항목의 대부분이 농경지, 비닐하우스, 축사 등 농림축산업과 관련 있는 것들이기 때문으로 판단된다. 한편 강원도 영서지역, 경기도, 서울특별시, 충청남북도 북부지역으로 이루어진 한강 유역권은 태풍피해횟수가 비교적 적은 것으로 나타났고, 이는 남부지방에 상륙한 태풍의 세력이 급격히 약화되면서 생기는 결과로 추정된다.
시군구별 피해액에서는 공공시설과 사유재산 모두 전라남도 동쪽에 위치한 광양, 순천, 여수와 경상남북도 대부분의 시군구와 강원도 동해안이 피해가 큰 것으로 나타났다. 지역적으로 피해가 많이 발생하는 지역에 위치한 부산광역시, 울산광역시는 피해발생횟수(Fig. 1)도 인근 시군구보다 작을 뿐 아니라, 피해금액에서도 작은 것을 알 수 있다. 이와 같은 결과는 부산광역시, 울산광역시 등 대도시 공공시설의 방재능력을 결정짓는 설계빈도가 시군에 비하여 상대적으로 높게 설계되어 재해에 비교적 잘 대응하는데 반하여, 시군의 설계빈도는 상향조정된 설계조건을 반영하지 못한 결과로 풀이된다. 더불어 부산광역시, 울산광역시의 사유재산 피해가 작은 이유도 피해발생횟수에서 설명한 바와 같이 대부분의 조사항목이 농림축산업과 관련된 항목들이며, 도시와 관련된 피해항목으로는 건물 정도이기 때문으로 추정할 수 있다.
Fig. 3에는 임해시군구와 내륙시군구의 시설물별 평균피해액이 나타나 있다. Fig. 2의 태풍피해액에서 언급한 바와 같이 바다를 접하고 있는 임해시군구의 피해액이 내륙시군구의 피해액보다 크게 나타나므로, Fig. 3의 시설물별 평균피해액도 내륙시군구가 임해시군구에 비하여 상대적으로 작은 것을 알 수 있다.
Fig. 3
Average Typhoon Damage Amount of District
KOSHAM_17_02_339_fig_3.gif
태풍으로 인한 피해중 공공시설과 사유재산 피해액의 구성비는 공공시설의 경우 시설물 항목이 지정되어 있지 않은 공공시설(기타), 도로 및 교량, 하천, 소하천, 소규모시설, 어항, 항만 순으로 피해액이 많이 발생하고, 사유재산은 재해연보에서 조사항목이 지정되어 있지 않은 피해(기타)가 가장 많고, 농경지, 비닐하우스, 수산증양식 등으로 나타났다.
한편 태풍피해는 호우, 강풍, 파랑에 의한 피해가 동시에 발생할 수 있으며, 피해시설물에서 도로 및 교량, 소하천을 포함한 하천, 농경지 등은 호우피해의 전형적인 형태이고, 비닐하우스는 강풍, 어항 및 항만과 수산증양식 시설은 조위 상승과 풍랑에 의한 피해로 볼 수 있다.

3. 태풍피해예측함수 개발

자연재해에 대한 재해 가능성 및 발생 시 사전 피해예상지역별 피해 규모와 영향을 신속하게 추정할 수 있다면 사전대비 차원의 재난관리가 가능할 것이며, 의사결정권자 들의 정책결정에 도움을 줄 수 있다. 미국 FEMA에서 개발하여 홍수, 지진, 태풍에 따른 사전피해예측에 이용되고 있는 HAZUS- MH는 좋은 예이다.

3.1 태풍피해자료 구축

앞에서 살펴본 바와 같이, 태풍은 호우, 강풍, 해수면 상승 및 풍랑에 의한 피해가 동시에 발생하는 자연재해로, 임해시군구의 경우는 태풍피해예측함수에 이들 3가지 형태의 변수를 모두 포함하여야 한다. 공공시설 피해액과 사유재산 피해액을 반응변수로 하고, 이에 영향을 미치는 수문기상학적 요소와 해수면 상승 및 파랑과 관련된 요소를 설명변수로 하는 태풍피해예측함수를 개발하고자 한다.

3.1.1 대상지역

태풍피해예측함수를 만들기 위한 대상지역으로 태풍피해가 비교적 자주 발생하고, 수문기상자료 및 파랑에 의한 조위의 상승을 관측할 수 있는 부산광역시 강서구를 선택하였다. 이는 부산의 서쪽에 위치하며 경상남도와 경계를 이루는 지역으로 낙동강 하구가 위치하며, 도시적인 특성과 함께 낙동강 하구의 농업지역을 포함하고 있어 다양한 형태의 태풍피해가 발생할 수 있다.

3.1.2 설명변수와 반응변수

태풍피해에 영향을 줄 것으로 판단되는 호우관련 변수로는 강우지속기간 1~24시간 최대강우량 및 총강우량, 1~5일 선행강우량 등 총 30개 변수를 채택하였고, 강풍관련 변수로는 평균풍속, 최대풍속, 최대순간풍속 등 3개 변수를 채택하였고, 해수면 상승 및 풍랑 관련 변수로는 태풍 내습 시 최대조위를 선정하였다. 총 34개 설명변수를 반응변수인 공공시설 피해액과 사유재산 피해액에 대응시켜 피해예측모형을 개발하고자 한다.
호우 및 강풍 관련 수문기상자료를 수집하기 위하여 부산지역에 위치한 종관기상관측소(ASOS) 1개소와 14개의 방재기상관측소(AWS) 중에서, 29개 태풍사상에 대한 자료를 모두 가지고 있는 종관기상관측소인 부산기상청 수문기상자료를 수집하였다. 조위변동자료는 국립해양조사원의 부산조위관측소 자료를 이용하였다. Table 2는 최종적으로 수집된 부산광역시 강서구의 태풍피해자료이며, 지면 관계상 여기서는 피해함수 추정과정에서 실질적으로 사용된 설명변수들의 값만 제시하였다. 총 16번의 태풍피해에 대한 자료이며, 번호(No.)는 Table 1의 태풍번호와 같다.
Table 2
Data Sets of Typhoon and Typhoon Damage Amount
No. Public infla-structure (1,000KWN) Privite facilities (1,000KWN) Maxi. rainfall(mm) Anticipated rainfall(mm) Max.wind vel. (m/s) tide level (EL. m)
5hr 6hr 17hr 24hr 2day 3day 5day
4 248,197 3,759,954 12.6 16.2 27.8 30 0 0 0 21.7 1.46
5 109,678 2,992,971 11.8 11.8 21.4 21.5 67.0 67.4 68.6 22.5 1.56
8 159,492 - 71 85.5 141.6 168.2 2.1.0 2.4 4.4 10.7 1.72
9 33,930 - 34.1 40.2 70.3 72.6 0 0 0 14 1.91
10 146,278 - 5.9 6.6 10.2 12.5 0 0 183.2 15.6 1.88
11 325,834 898,832 47.4 48 55 57.8 1.5 4.4 4.4 18.7 2.01
12 227,783 26,798 39 42 80 83.5 0 28 34 15.1 1.43
13 1,250,223 772,337 66 71.5 109.5 114.2 0 0 0 17.5 1.89
14 - 16,031 85.5 95.5 137.5 144 0 0 2.5 13 1.66
15 70,520,931 98,959,528 39.5 41.5 61 73.5 2.0 2 4 22.6 2.6
16 383,253 404,658 59.5 61 75.5 78 1.5 16.5 16.5 14.5 1.86
17 102,893 314,893 60.5 68 157.5 161.5 2 2 2 14.3 1.9
19 37,188 24,077 22.5 25.5 45 50.5 37.5 38 41 16.7 1.53
23 21,034 310 36.5 40.5 70.5 80.5 0 0.3 0.3 15.6 2.14
28 - 12,614 9 9.5 9.5 9.5 59.5 111 112 14.4 1.74
29 489,075 127,330 29.5 34 66.5 91 35.0 35 128.5 14.9 2.24

3.1.3 설명변수 사이의 상관성

태풍피해자료의 일부 설명변수 사이의 강한 상관관계가 감지된다. 지속기간 별 최대강우량(1시간~24시간) 변수들 사이에는 대단히 높은 상관관계가 존재하며, 선행 강우량(1일~5일) 변수 역시 높은 상관관계를 가진다. 이는 다중공선성(Multi-collinearity)을 유발할 위험이 있다.

3.2 통계적 방법론

3.2.1 다중회귀모형

다중회귀모형(multiple regression model, MR)은 반응변수y에 유의한 영향을 미칠 것으로 기대되는 설명변수들인x1,…, xk을 고려하여, 반응변수가 여러 개의 설명변수들로 설명되는 아래와 같은 구조를 갖는다.
(1)
yi=β0+β1xi1+...+βkxik+εi=β0+j=1kβjxij+εi fori=1,...,n
Eq. (1)에서의 아래 첨자ii번째 자료의 값을 의미한다. 자료의 총 개수는n개를 가정한다. Eq. (1)에서 설명변수 앞에 붙은β1,…,βk를 회귀계수(regression coefficient)라고 하며, βjj번째 설명변수xj를 제외한 나머지 설명변수들의 효과가 통제되고 있을 때, xj의 값이 한 단위 증가할 때, y의 기댓값, μ(= E(y))의 변화량을 의미한다. β0는 절편(intercept)이라고 불린다. ε는 오차(Error)로써, 반응변수y가 설명변수x1,…, xk에 의해 설명되지 않는 나머지 부분을 나타낸다. 회귀모형에서 오차항에 대한 가정으로는 정규분포(normal distribution)를 따르면서 평균이 0이고 동일한 분산을 가지고, 동시에 서로 다른 오차들이 서로 통계적으로 독립임이 가정된다. 회귀모형 추정치는 잔차제곱합(Eq. (2))를 최소화하는 값이다.
(2)
i=1n(yiβ0j=1kβjxij)2

3.2.2 일반화선형모형

일반화선형모형(generalized linear model, GLM)은 다중회귀모형에서 확장된 모형으로 반응변수에 대한 분포 가정을 다양화 할 수 있는 모형이다(Nelder and Wedderburn, 1972). 일반화선형모형은 아래와 같이 표현된다.
(3)
g(μi)=β0+β1xi1+...+βkxik=β0+j=1kβjxij
Eq. (3)에서μ는 반응변수의 평균E(y)을 의미하며, g(·)는 반응변수의 평균과 설명변수의 선형결합을 연결하는 역할을 수행하며 연결함수(link function)라고 한다. 다음은 본 연구에서 사용된 일반화선형모형을 표현한 것이다.
(4)
E(yi)=μi,(Var(yi)=ϕμi,g(μi)=log(μi)
(5)
E(yi)=μi,(Var(yi)=ϕμi2,g(μi)=log(μi)
Eq. (4)는 반응변수의 분산이 산포모수(dispersion parameter)인ϕ에 의해 반응변수의 평균의 1차함수로 표현된다고 가정하고, 로그 연결함수를 사용한다. Eq. (5)는 반응변수의 분산이 산포모수ϕ에 의해 반응변수의 평균의 2차함수로 표현된다고 가정하고, 로그 연결함수를 사용한다.
일반화선형모형에서의 회귀계수는 회귀모형에서 잔차제곱합을 최소화시키는 기준으로 구하는 것 대신에, 가능도(likelihood)를 최대화하는 방법을 통해 회귀계수의 추정치를 얻어내며, 구체적으로는 피셔-점수화(fisher-scoring) 알고리즘을 통한 반복재가중최소제곱(iteratively reweighted least squares)으로부터 계산된다(P. J. Green, 1984).

3.2.3 개선된 변수선택법 제안

전술한 바와 같이, 설명변수 사이의 강한 상관관계가 다중공선성(multi-collinearity)를 유발하여 예측함수의 추정치를 불안정하게 할 수 있으므로 설명변수 중 일부만을 선택하여 사용하고자 한다. 전통적인 변수선택 알고리즘으로는 전진선택법(forward selection), 후진제거법(backward elimination), 단계적 선택법(stepwise selection)이 있다. 설명변수의 최적 부분집합을 선택하기 위한 대표적인 지표로 AIC(akaike information criterion)를 들 수 있으며, 대표본(Large sample)에서는 AIC의 값이 leave-one-out 교차 검증(leave-one-out cross-validation)된 RMSE(root mean squared error), 즉, LOOCV-RMSE와 거의 같은 결과를 준다는 사실이 알려져 있다(Stone, 1977).
하지만 태풍피해예측함수 개발에 사용되는 부산광역시 강서구 자료의 경우, 공공시설 피해액의 경우에는 14개, 사유재산 피해액에는 13개로 소표본(small sample)에 해당하므로 AIC를 이용한 변수 선택이 실질적인 예측력을 극대화하는 방향의 변수선택을 해준다고 보기 어렵다. 따라서 직접 모든 설명변수 조합에 대해 모형을 구축하고, 이로부터 LOOCV-RMSE을 최소화하는 최적의 설명변수 집합을 찾는 것이 더 바람직하다고 판단된다. 이를 전모형탐색법(All possible search)이라고 한다. 그러나 이 방법은 변수의 개수가 많아질수록 많은 시간이 걸리는 단점이 있다. 만일 변수가 본 연구에서와 같이 34개이면, 모든 설명변수 조합에 대한 모형의 개수는 234 = 1,048,575이다.
따라서 이러한 방법으로는 최적의 설명변수 조합을 찾는 것이 현실적으로 불가능하므로 LOOCV-RMSE 값을 비교하되 전모형탐색법이 아닌 전진선택법을 이용하여 계산시간을 단축하였다. 이는 LOOCV-RMSE 값을 최소화하는 변수 1개를 먼저 찾은 다음, 변수를 하나씩 추가하면서 LOOCV- RMSE 값을 더 작게 만드는 변수가 있으면 모형에 추가하고, 반대의 경우 변수선택을 종료한다. 본 연구에서 사용된 이러한 변수선택법을 LOOCV-전진선택법이라 하고, 이 방법을 사용하여 피해예측함수 추정 과정에서 예측력을 극대화할 것으로 기대되는 변수선택을 달성하고자 한다.

3.2.4 피해예측함수 추정 및 적합도 비교

부산광역시 강서구의 공공시설 피해액과 사유재산 피해액을 반응변수로 보고, 다수의 설명변수들을 이용하여 일반화선형모형과 다중회귀모형을 통해 피해예측함수를 추정한다. 이 때 일반화선형모형에는 LOOCV-전진선택법을, 다중선형회귀모형에는 전통적인 변수선택법 중 단계별 선택법을 활용하여 변수선택을 시도하였고, 추정된 일반화선형모형과 다중회귀모형모형 간 비교를 위해 아래의 적합도(Goodness-Of-Fit) 지표를 참고하였다.
(6)
RMSE=1ni=1n(yiy^i)2NRMSE=RMSE(max(yi)min(yi))
Eq. (6)에서 RMSE는 실제값과 예측값 사이의 평균 차이를 의미하며, NRMSE(Normalized RMSE)는 RMSE를 실제값의 범위로 표준화한 값으로 단위는 백분율(%)이다.
피해예측함수의 추정된 회귀계수와 적합도 결과가 Table 3에 나타나 있다. 다중선형회귀모형과 일반화선형모형의 추정된 회귀계수들은 로그 변환된 반응변수, y^i에 대한 각 설명변수들의 영향력을 의미한다. 즉, 다음의 관계식을 가진다.
Table 3
Typhoon Damage Forecasting Function
Forecasting function β̂ RMSE (1,000 KRW) NRMSE (%)
intercept Maxi. Rainfall (mm) Anticipated rainfall (mm) Max. wind vel. (m/s) tide level (EL. m)
5hr 6hr 17hr 24hr 2day 3day 5day
GLM Public 0.551 - - -0.058 0.066 -0.092 0.069 - 0.385 2.955 245,784 0.35
Private 1.281 - 0.009 - 0.008 -0.009 - - 0.619 - 125,528 0.13
M.R Public -0.968 0.096 - - - - - 0.022 0.525 - 14,400,490 20.43
Private 1.105 - - - - - - - 0.639 - 12,708,310 12.84
log(y^i)=β^0+β^1xi1+...+β^kxik
일반화선형모형의 경우 공공시설 피해액에 대해서는 Eq. (5)를, 사유재산 피해액에 대해서는 Eq. (4)가 고려되었고, LOOCV-전진선택법을 통해 변수선택 후 피해함수를 추정하였다. 다중회귀모형의 경우, 단계별 선택법을 통해 변수선택 후 피해함수를 추정하였다. 추정된 회귀계수와 설명변수의 선형결합으로부터 로그 단위의 예측 피해액이 계산되므로, 실제 피해액과 차이를 보기 위해서는 지수변환을 통하여 원래의 단위로 환원할 필요가 있다.
Table 3에서 보듯, 높은 상관관계를 갖는 일부 변수들이 같이 선택되었다. 공공시설 피해액에 대한 예측함수의 경우 강우지속기간 17시간과 24시간의 상관계수가 0.983, 2일 선행강우량과 3일 선행강우량의 상관계수는 0.923이고, 사유재산 피해액에 대한 예측함수의 경우, 강우지속기간 6시간과 24시간의 상관계수는 0.910이다. 일반적인 모형에서는 이들 변수들은 다중공선성 문제로 인하여 일부 변수를 제거하는 것이 권장되나, 앞에서 언급한 바와 같이, LOOCV-전진선택법을 통해 예측력을 극대화하는 기준으로 설명변수를 선택하였으므로, 선택된 변수들을 그대로 모형 적합에 사용하였다. Table 3에서 전통적 변수선택법을 활용한 다중회귀모형에서의 RMSE와 NRMSE의 값이 LOOCV-전진선택법을 활용한 일반화선형모형에 비해 훨씬 크게 나타남을 확인할 수 있다. 이는 일반화선형모형에 의한 예측 피해액이 실제 피해액에 더 가깝게 추정되었음을 의미한다.
전술한 바와 같이 다중회귀모형에서 사용된 전통적 변수선택법은 AIC값을 기준으로 예측력을 극대화하는 설명변수 조합을 찾는 방법이다. 하지만 본 연구에서는 피해함수 추정에 사용된 자료가 소표본이므로 AIC값을 통한 전통적 변수선택방법이 실제 예측력을 극대화하는 방향으로 변수선택을 하는 과정에서 한계가 있는 것으로 보이며, 따라서 상대적으로 큰 RMSE와 NRMSE값이 나타낸 것으로 여겨진다. 반면 본 연구에서 제시한 LOOCV-전진선택법을 적용한 일반화선형모형의 경우, 예측력을 극대화할 것으로 기대되는 설명변수들 만을 선택함으로써, 소표본의 한계를 어느 정도 극복하고, 그 결과 상대적으로 더 낮은 RMSE와 NRMSE값을 제시하였다고 생각된다.
LOOCV-전진선택법을 적용한 일반화회귀모형이 전통적 변수선택법을 통한 회귀모형보다 더 나은 예측 피해액을 제시하는 것에 대해서 그림을 통한 직관적 확인이 가능하다. Fig. 4는 공공시설과 사유재산에 대한 실제 태풍 피해액 (observed; 점)과 각 예측모형으로부터 계산된 예측 피해액을 비교한 것이다. MR(다중회귀모형; 실선)은 전통적인 변수선택법인 단계적 선택법을 적용한 다중회귀모형에 의한 예측 피해액을 의미하며, 일반화선형모형(GLM; 점선)은 LOOCV-전진선택법을 적용한 일반화선형모형에 의한 예측 피해액을 나타낸다. 여기서 No. 15는 태풍 ‘매미’로 인한 사상 유래 없는 대규모 피해가 난 사례인데, 다중회귀분석의 예측 피해액은 매미의 실제 피해액을 잘 따라가지 못하는 반면, 일반화선형모형의 예측 피해액은 상대적으로 잘 따라가는 것을 확인할 수 있다. 따라서 매미와 같은 매우 큰 피해액에 대해 LOOCV-전진변수선택을 통한 일반화선형모형이 전통적인 변수선택법을 통한 다중회귀모형에 비해 더 나은 예측값을 제시함으로써 상대적으로 작은 RMSE와 NRMSE를 나타낸 것으로 판단된다.
Fig. 4
Verification of Average Typhoon Damage Amount
KOSHAM_17_02_339_fig_4.gif

4. 결론

기후변화로 인한 자연재해가 빈발하며, 피해액도 증가하는 추세에 있어, 자연재해발생시 피해를 예측하고 대비할 수 있는 시스템을 국토건설부, 국민안전처 등을 중심으로 개발 중에 있다. 본 연구에서는 재해연보에 나타나 있는 1993년부터 총 20년간의 태풍피해자료를 이용하여 시군구별 태풍피해유형을 분석하였고 바다를 접하고 있는 임해시군구의 피해가 내륙에 위치한 시군구(내륙시군구)보다 크게 나타나며, 그 원인으로는 호우, 강풍, 해수면 상승과 풍랑으로 인한 조위 상승 등 3가지 유형의 자연재해가 모두 나타나기 때문임을 확인하였다.
태풍으로 인한 피해를 예측하고 재난에 대비할 목적으로, 부산시 강서구를 대상으로 태풍 피해예측함수를 개발하였으며, 피해예측모형으로는 다중회귀모형과 일반화선형모형을 고려하였다. 기존의 전통적인 변수선택법을 적용한 다중회귀모형의 경우는 소표본의 한계로 인하여 예측력 높은 피해함수를 제시하지 못함을 확인하였다. 반면, 본 연구에서 새롭게 제안한 LOOCV-전진변수선택 방법을 일반화선형모형과 함께 사용함으로써 소표본의 한계점을 어느 정도 극복하고 예측력을 높일 수 있는 피해함수를 개발할 수 있었다.
본 연구에 이용된 통계적 방법론들은 실질적인 예측력을 높이기 위한 모형화의 측면에서 합리적인 방법이다. 이는 기존의 태풍피해예측함수 개발에 긍정적인 영향을 미칠 것으로 예상되므로 본 논문의 방법론들을 적용하는 것을 제안해보고자 한다.

감사의 글

본 연구는 정부(국민안전처)의 재원으로 재난안전기술개발사업단의 지원을 받아 수행된 연구임 [MPSS-자연-2015-79].

References

Ahn, S.H, Park, K.J, Kim, J.Y, and Kim, B.J (2015) The Characteristics of the Frequency and Damage for Meteorological Disasters in Korea. Journal of Korean Society of Hazard Mitigation, Vol. 15, No. 2, pp. 133-144. 10.9798/KOSHAM.2015.15.2.133.
crossref
Green, P.J (1984) Iteratively Reweighted Least Squares for Maximum Likelihood Estimation, and some Robust and Resistant Alternatives. Journal of the Royal Statistical Society. Series B (Methodological), Vol. 46, No. 2, pp. 149-192.
crossref
Jang, H.S, Oh, K.R, Kim, W.H, and Sim, O.B (2016) A Study on Establishment of Strategy for Development of Storm and Flood Damage Prediction System. Journal of Korean Society of Hazard Mitigation, Vol. 16, No. 3, pp. 117-124. 10.9798/KOSHAM.2016.16.3.117.
crossref
Jun, H.D, Park, M.J, Kim, G.Y, and Kim, J.W (2008) Damage Analysis of Meteorological Disasters for Each District Considering the Characteristics of a District. Journal of Korean Society of Hazard Mitigation, Vol. 8, No. 2, pp. 75-82.
crossref
Kim, J.S, Kim, H.Y, and Lee, S.H (2014a) A Review on Improvements of Climate Change Vulnerability Analysis Methods: Focusing on Sea Level Rise Disasters. Journal of the Korean Association of Geographic Information Studies, Vol. 17, No. 1, pp. 50-60. 10.11108/kagis.2014.17.1.050.
crossref
Kim, S.H, Kim, B.S, Lee, C.H, and Chung, J.H (2014b) Development of Depth-Damage Function by Inves- tigating Flooded Area with Focusing on Building Damage. Journal of Korea Water Resources Association, Vol. 47, No. 8, pp. 717-728. 10.3741/JKWRA.2014.47.8.717.
crossref
Ko, J.S, Choi, S.C, and Yum, H.M (2006) Anaylysis of Ulsan Harbor Coastal Structure by Typhoon Nabi. Magazine of Korean Society of Hazard Mitigation, Vol. 6, No. 4, pp. 103-112.
crossref
KRIHS(Korea research institute for human settlements) (2005) Analysis of Flood Damage Characteristics and Development of Flood Damage Index.
crossref
Lee, J.S, and Choi, H.I (2016) Flood Vulnerability Index Estimated by Comparing Analysis Methods of Flood Damage Data. Journal of Korean Society of Hazard Mitigation, Vol. 16, No. 2, pp. 427-435. 10.9798/KOSHAM.2016.16.2.427.
crossref
Lee, S.S, and Chang, E.M (2009) Application of GIS to Typhoon Risk Assessment. The Journal of GIS Association of Korea, Vol. 17, No. 2, pp. 243-249.
crossref
Lee, S.W, Ahn, S.H, Lim, B.H, and Choi, G.Y (2016) Relationships between Intensity of Extreme Climate Events and Magnitude of Damages for Different Typhoon Tracks in the Republic of Korea. Journal of The Korean Association of Regional Geographers, Vol. 22, No. 2, pp. 450-465.
crossref
Nation Disaster Management Research Institute (2001) Study of mitigation efforts for the repetitive flooded area.
crossref
Nelder, J.A, and Wedderburn, R.W.M (1972) Generalized Linear Models. Journal of the Royal Statistical Society. Series A (General), Vol. 135, No. 3, pp. 370-384. 10.2307/2344614.
crossref
Park, J.K, Jung, W.S, Kim, E.B, and Kim, J.S (2013) Characteristics of the State and Distribution of Damage by Typhoon. 2013 Proceedings of Korean Society of Hazard Mitigation, pp. 40.
crossref
Stone, M (1977) An Asymptotic Equivalence of Choice of Model by Cross-validation and Akaike’s Criterion. Journal of the Royal Statistical Society, Series B (Methodological), Vol. 39, No. 1, pp. 44-47.
crossref
Yang, W, and Yi, W.H (2013) Damage Pattern Analysis of Buildings by Wind Storm and Typhoon. 2013 Proceedings of Korean Society of Hazard Mitigation, pp. 198.
crossref


ABOUT
ARTICLE CATEGORY

Browse all articles >

BROWSE ARTICLES
AUTHOR INFORMATION
Editorial Office
1010 New Bldg., The Korea Science Technology Center, 22 Teheran-ro 7-gil(635-4 Yeoksam-dong), Gangnam-gu, Seoul 06130, Korea
Tel: +82-2-567-6311    Fax: +82-2-567-6313    E-mail: master@kosham.or.kr                

Copyright © 2024 by The Korean Society of Hazard Mitigation.

Developed in M2PI

Close layer
prev next