베이지안 네트워크를 이용한 통합 홍수위험평가지수(InFRA) 개발

Integrated Index for Flood Risk Assessment Development Using Bayesian Network

Article information

J. Korean Soc. Hazard Mitig. 2018;18(6):269-281
Publication date (electronic) : 2018 October 31
doi : https://doi.org/10.9798/KOSHAM.2018.18.6.269
*Member, Ph.D Candidate, Department of Civil Engineering, Inha University
**Member, Principle Research Engineer, Department of Hydro Science and Engineering Research Institute, KICT
***Member, Research Fellow, Department of Hydro Science and Engineering Research Institute, KICT
****Member, Assistant Professor, Department of Civil Engineering, Inha University
*****Member, Professor, Department of Civil Engineering, Inha University
주홍준*, 홍승진**, 김경탁***, 김수전****, 김형수*****
*정회원, 인하대학교 사회인프라공학과 박사과정
**정회원, 한국건설기술연구원 수자원하천연구소 수석연구원
***정회원, 한국건설기술연구원 수자원하천연구소 연구위원
****정회원, 인하대학교 사회인프라공학과 조교수
*****정회원, 인하대학교 사회인프라공학과 교수
교신저자: 김수전, 정회원, 인하대학교 사회인프라공학과 조교수(Tel: +82-32-860-7563, Fax: +82-32-876-9787, E-mail: sk325@inha.ac.kr)
Received 2018 September 15; Revised 2018 September 18; Accepted 2018 October 4.

Abstract

본 연구에서는 과학적이고 신뢰성을 검증할 수 있는 홍수 취약성 지수를 개발하였다. 기존의 홍수 취약성 평가 방법은 지표간의 가중치 산정에서 흔히 이용하는 방법을 적용하고 있고, 비슷한 산정 방식으로 인해 평가 방법이 차별화되지 못하며 그에 대한 검증도 부족한 실정이다. 따라서, 기존 연구와의 차별화를 통해 이를 개선할 수 있으며 홍수 피해 위험 지역을 잘 반영하고 예측하는 홍수 취약성 평가가 이루어질 필요가 있다. 이를 실현하기 위해 선행적으로 기존의 가중치 방법을 고려한 후 합리적이고 통합적인 의사결정을 내려줄 수 있는 베이지안 네트워크를 이용하여 최적 가중치를 도출하였으며 그에 의거한 산정식의 제시를 통해 통합 홍수위험평가지수(Integrated index for Flood Risk Assessment, InFRA)를 개발하였다. 기존 평가 방법과의 정성적, 정량적 비교를 통해 평가 방법별 특징을 고찰한 결과, InFRA는 기존 방법보다 개선된 결과가 나타났으며 그 적용성을 증명할 수 있었다.

Trans Abstract

The purpose of this study is to develop a reliable flood vulnerability index that can be used to verify scientific data. Existing flood vulnerability assessment uses methods commonly used in calculating the weight between indicators. However, because they contain similarities in their estimation measurement, such methods cannot be differentiated, and their verification is not reliable. Therefore, it is necessary to improve flood vulnerability assessment by differentiating its method from that used in existing research and to use the new method to reliably predict and evaluate the flood damage risk. In order to realize this, optimal weighting is derived by using a Bayesian network, which can make reasonable and integrated decisions after considering the existing weighting method. As a result, the integrated index for Flood Risk Assessment (InFRA) was developed through presentation of the formula. Qualitative and quantitative comparison with existing evaluation methods revealed that InFRA showed better results than previous methods and thus proved its applicability.

1. 서 론

최근의 대형 재난은 전 세계적으로 재난대비의 중요성을 인식시키고 있으며 여러 지역사회의 재해 취약성에 대한 개념이 강조되고 있다. 특히, 극한 호우의 증가는 홍수 재해를 가중 시키고 있으며 이를 극복하기 위해 여러 가지 치수 대책을 강구하고 있다. 이러한 노력에도 불구하고 아직까지 복구 중심의 수립 대책에 머물러 있기 때문에 지역에 따른 홍수피해 특성을 간과하고 있는 실정이다. 따라서, 효과적이고 정확한 홍수 취약성 평가를 통하여 사전에 치수 대책을 마련할 사회적 요구가 있다.

홍수는 대표적인 자연재해이며 세계적인 관심과 함께 많은 연구가 진행되어 왔다. 미국에서는 홍수 취약성을 위험도 측면으로 주시하고 있으며, 1990년에 지역평가시스템(Community Rating System, CRS)을 시작으로 재난저감계획(Disaster Mitigation and Preparedness, DMP) 수행시에 자연재해 유형별로 위험도를 산정하고 있다. 또한, FEMA (2003)NOAA (2007)에서는 위험도 평가 프로그램을 개발하여 재해에 대한 피해 규모를 추정하여 활용하고 있다. 독일의 Munich Re group (2004)에서는 자연적인 요인, 기술적인 요인, 사회 정치적인 요인, 경제적인 요인 등의 4가지 요인에 대한 재난발생 시나리오와 직간접적 피해결과를 산정기준으로 평가한 후 재난별로 4단계로 분류하였다. 영국의 Tyndall Centre (Brooks, 2003)에서는 홍수 취약성에 따라 사회적 및 생물학적 취약성을 구분하고 취약성별 적응력 향상을 위한 기본 프레임을 제시한 바 있다.

국내에서의 홍수 위험도 평가 연구는 2000년대 이후 활발하게 진행되어 오고 있다(MLTMA, 2001, 2010; KRIHS, 2005; SI, 2006; KEI, 2008; MOIS, 2008; KICT, 2009; Jthink, 2010; NDMI, 2011). 이들의 목표는 홍수 취약성 평가를 통한 홍수 위험관리 측면으로 귀결된다. Choi and Kim (2006)은 인명, 재산, 침수면적에 대한 피해밀도의 자료를 이용하여 홍수위험도를 제시하였고, Park et al. (2009)은 과거 홍수피해자료를 이용하여 홍수피해 발생빈도와 홍수피해액의 무차원 상관관계 해석을 통하여 전국의 홍수피해특성을 분석하였다. Jung et al. (2008)은 기후변화에 따른 홍수와 가뭄에 대한 취약성 평가 기법을 제안하고 A2 시나리오, ECHO-G 및 상세화 과정을 거쳐 도출된 시나리오를 PRMS에 적용하여 평가한 바 있다. 또한, Jang and Kim (2009)은 홍수피해위험 저감 및 예측을 위해 한강유역을 대상으로 다수의 강우특성 변수들과 홍수피해액에 대한 상관성을 분석하였다.

홍수 취약성 평가를 하기 위해서는 홍수에 영향을 미치는 요소 및 지표 간의 합리적인 가중치가 정의되어야 한다. 왜냐하면 가중치 산정 방법에 따라 홍수 취약성 평가 결과는 큰 차이를 나타내기 때문이다. 따라서, 가중치 산정 방법별로 상이하게 나타나는 홍수 취약성 평가 결과는 홍수관리에 큰 혼란을 야기하기도 한다. 또한, 홍수 취약성 평가의 유사한 산정 방식으로 인해 평가 방법이 차별화되지 못하는 경우가 대부분이며 평가 결과에 대한 적용성 측면에서의 검증도 미미한 실정이다.

본 연구는 기존 연구의 문제점을 개선할 수 있는 홍수 취약성 평가 방법을 개발하고자 하였다. 이에 선행 연구 결과로 도출된 홍수 취약성 대표 지표를 적용한 후 기존 가중치 방법 중 자주 활용되는 방법을 선정하였으며 방향성 그래프 모형이자 통합 의사 결정 모형인 베이지안 네트워크를 이용하여 지표 및 요소간의 통합 가중치를 도출하였다. 또한, 각 가중치에 의거하여 홍수 취약성 평가 산정식을 제안하고 홍수 취약성 결과를 산정하였다. 본 연구에서 개발한 평가 방법은 통합 홍수위험평가지수(Integrated index for Flood Risk Index, InFRA)로 명칭하였으며, 기존 평가 방법과의 비교를 통해 특징을 고찰하고 적용성을 검토하였다.

2. 연구 적용을 위한 이론적 배경

2.1 가중치 부여 기법

홍수 취약성을 평가하기 위해서는 홍수에 영향을 미치는 지표별 중요도에 따라 가중치가 부여되어야 하며 가중치 산정 방법에는 많은 이론들이 존재한다. 이러한 가중치 부여 기법들은 실제로 어떤 우열이나 설명력의 차이를 가진다고 보기 어려우며, 연구자의 연구 목적이나 주관적인 중요도에 따라 분류 방법이 다를 뿐이다. 가중치 부여 기법들은 사람들의 가치나 선호를 이끌어 내는 가정의 차이에서 출발하며(Fischhoff, 1991), 크게 설문조사를 비롯한 직간접 방식으로 분류된다(Keeny et al., 1990).

본 연구에서는 홍수 취약성 지수를 개발하기 위해 구성된 지표간의 가중치를 부여하는 방법에 대하여 검토하였다. 그 중, 홍수 취약성 평가 분야에서 자주 활용되고 있는 3가지 가중치 부여 기법을 선정하였다. 전문적인 방법이자 의사결정에서 자주 활용되고 있고 계층분석기법과 지표의 개수를 고려한 총합고정척도법, 직접적 방법의 대표 기법인 엔트로피 가중치 방법을 선정하였으며 그 이론적 내용은 다음과 같다.

계층분석법(Analysis Hierarchy Process, AHP)은 다기준 의사결정(Multi-Criteria Decision Making, MCDM)의 대표적인 방법으로써 평가항목별 계층구조를 형성한 후 쌍대비교를 통하여 대안을 평가하는 방식이다. AHP는 계층구조를 단계적인 분석을 통해 해결함으로써 합리적인 의사결정에 이를 수 있도록 지원해 주는 방법으로 현존하는 의사결정방법 중 가장 과학적인 방법이라 할 수 있다. 또한, 정량적 자료와 정성적 자료들을 비율척도(ratio scale)의 형태로 가공이 가능하기 때문에 자료의 2차 가공의 과정을 통해서 객관성 여부를 검증하는데 유용하다(Joo et al., 2017).

총합고정척도법(Constant Sum Scale, CSS) 응답자들에게 일정하게 고정된 총점을 제시해 주고, 총점내에서 속성들이 지니고 있는 상대적인 중요성에 따라 점수를 분할하여 제시하도록 하는 방법이다. 점수의 고정할당 방식이라는 점에서 델파이 기법(Delphi method)과 비슷하다고 할 수 있으나, 델파이 기법은 전문가로부터 가능한 많은 자료를 수집한 후 설문 항목을 구성하는 개방형 설문으로부터 시작하기 때문에 항목이 정해져 있는 폐쇄형 설문인 총합고정척도법과는 차이가 있다. 총합고정척도에 이용되는 점수는 보통 10점과 100점이 자주 이용되고 있으며, 속성의 수가 많을 경우(5개 이상) 응답자가 점수를 나누어 응답하는데 어려움이 뒤따른다. 하지만 본 연구에서는 비교하고자 하는 요소 및 지표가 설문당 최대 4개이므로 본 연구에 적용하기에 적절한 평가 기법이라고 판단되어 채택하였다.

엔트로피 가중치 기법(Entropy weight)은 불확실성의 감소정도로 신호에 대한 정보를 간접적으로 측정할 수 있다는 것에 이론을 두고 있다. 이러한 의미에서 정보와 불확실성은 이원적인 용어이며 서로 바뀌어서 사용되기도 하며(Ozkul et al., 2000), 엔트로피의 이러한 특성을 이용하여 해당 지표간의 가중치를 결정 할 수 있다. 산정 절차는 (1) 항목별 행렬을 구성 (2) 구성된 지표별 속성정보 정규화 (3) 각 속성별 엔트로피를 산정 (4) 지표간의 다양성 정도를 고려 (5) 최종적인 가중치를 결정으로 이어지는 일련의 과정을 거치게 된다(Eqs. 1~5).

(1) 행렬 구성

(1) D=[x11x1jx1nxi1xijx1nxm1xmjxmn]

(2) 평가 항목별 정규화

(2) pij=xiji=1mxij(i=1,2,,m;j=1,2,,n)

(3) 속성별 엔트로피 산정

(3) Ej=-ki=1mpijlogpij(Here,k=1logm;j=1,2,,n)

(4) & (5) 평가간 가중치 산정

(4) *dj=1-Ej
(5) *wj=djj=1ndj(j=1,2,....,n)

2.2 베이지안 네트워크

베이지안 네트워크(Bayesian Network, BN)는 변수 간의 불확실성이 존재하는 경우에도 그 관계를 나타낼 수 있는 확률론적인 그래프 모형이다. 또한, 노드(node)와 링크(link)의 방향성 비순환 그래프(Directed acyclic graph, DAG) 모형으로 구성되며 다양한 소스 및 유형의 변수를 단일 구조로 통합할 수 있는 장점이 있다. 노드간의 관계는 변수 사이의 의존 관계를 고려하는 조건부 확률 분포(Conditional Probability Distribution, CPD)로 설명이 된다(Jensen, 1996; Pearl, 2014; Kim et al., 2018).

예를 들어, Fig. 1과 같이 조건부 확률 분포를 따르는 노드(x1, x2, x3)을 가지는 그래프가 존재한다면 자식 노드(x1, x2)는 부모 노드(x2, x3)의 조건부 확률에 따라 결정이 되며, 전체 결합 확률 분포는 다음과 같이 나타낼 수 있다(Eq. 6).

Fig. 1

Example for Bayesian Network

(6) p(x1,x2,x3)=p(x3x1,x2)p(x2x1)p(x1)

Fig. 1에서와는 다르게 연결이 되지 않은 노드는 고려할 필요는 없다. 결과적으로 n개의 변수를 가지는 결합 확률분포가 p (x1, x2, ..., xn)로 주어졌을 때 Eq. 7과 같이 나타낼 수 있다.

(7) p(x1,x2,,xn)=i=1np(xiαi)

여기서, αixi의 부모 노드의 집합을 의미하며, p (x1, x2, ..., xn)는 정규화된 사전 분포로 인하여 항상 정규화를 유지한다. 베이지안 네트워크의 핵심은 하나의 노드가 하나의 변수에 매칭되고 있으므로 어떤 변수들의 연관 집합과 그래프의 노드로 표현되는 벡터화된 변수들을 동일하게 취급하며, 이러한 일련의 과정을 그래프 모형으로 구현할 수 있다는 것이다(Bishop, 2006). 즉, 앞서 기술한 기존 가중치 방법을 하나의 그래프로 구현할 수 있으며, 단일 모형의 구성으로 최적화되고 통합된 가중치에 대하여 의사결정을 내릴 수 있을 것이다.

3. InFRA(Integrated index for Flood Risk Assessment) 개발 과정

3.1 InFRA 개발을 위한 시범 지역 및 지표 선정

본 연구에서는 InFRA의 개발을 위해 Joo et al. (2018)에서 제시한 시범 지역 및 홍수 취약성 지표(R)을 적용하였다. 해당 연구에서는 홍수 취약성 평가를 위한 대표 지표를 선정하기 위해 6개의 기존 평가 방법(FRI, PFD, FDRRI, FVA, FDI, RSA)에서 제시하는 총 28개의 지표를 구성하였으며 특징에 맞게 수문-지형, 사회-경제, 홍수 방어, 기상 요소로 구분하였다. 시범 지역으로는 대전광역시, 세종특별자치시를 포함하는 충청도 28개 시군을 대상으로 하였으며(Fig. 2), 통계 기법인 요인 분석(factor analysis) 및 주성분 분석(principal component analyzsis, PCA)을 수행하여 대표 지표를 선정하고 다중회귀분석을 통해 설명력을 검증하였다. 선정된 지표는 Table 1과 같으며 4개의 상위 요소와 11개의 세부 지표로 구성하였다.

Fig. 2

Map of Demonstration Area

Selected Representative Indicators

3.2 DB 구축 및 정규화

각 지표의 DB 구축에 대하여 필요한 자료 출처 및 수행 기법은 Joo et al. (2018)에서 제시하고 있다. 아래 기술된 내용은 해당 연구를 일부 참고하여 요약하였으며 지표 DB는 현재 최신 자료인 2016년을 대상으로 하였다.

먼저, 수문 지형학적 요소의 홍수 피해액은 재해연보상의 11개의 재해유형 중에 홍수와 관련된 태풍, 호우, 호우태풍, 태풍호우 4개 유형의 피해액을 고려하였다. 다만, 2016년 1개년도만 적용할 경우 피해가 없는 지역은 과거 이력과 상관없이 취약성이 매우 낮아질 우려가 있기 때문에 최근 10개년(2007~2016)의 피해액 자료를 합산하여 이용하였다. 도시화율은 KOSIS에서 제공하는 지자체 통계 연보를 통해 구축할 수 있었으며, 저지대 면적(10 m 이하 면적) 비율은 통계지리정보 서비스에서 제공하는 DEM자료를 이용하여 GIS 분석을 동반한 후 도출하였다. 도시화율은 높을수록 불투수 면적의 증가로 인해 강우로 인한 유출이 더 많이 발생하여 홍수 피해가 증가할 것이며, 저지대 면적은 내수 위험성을 강조한 지표라고 볼 수 있다.

사회경제적 요소의 각 지표들은 KOSIS 및 지자체 통계연보를 통해 구축할 수 있다. 재정 자립도, 총 주택수(단독, 아파트, 연립, 다세대, 영업용 건물 내 주택 포함)는 홍수 발생시 홍수 피해 규모 측면에서 좀 더 취약하다는 전제로 구성된 지표이며, 의존 인구 비율(재난 취약자)은 15세 미만 65세 이상 인구 비율을 지칭하고 있으며 이들이 주 피해 대상이 된다는 내용을 담고 있다.

홍수 방어 요소들도 마찬가지로 지자체 통계 자료를 이용하여 구축할 수 있으며, 해당 지표들의 수치적인 증가는 해당 지역의 홍수 취약성을 감소시키는 결과로 이어질 것이다. 또한, 기상학적 요소는 홍수 취약과 연관이 있는 강우 사상인 시간당 50 mm 강우 빈도 횟수 및 연강수량으로 구성하였다. 기상 자료는 강우 티센망 및 기상청 자료를 고려하여 지역별 강우 관련 지표를 구축하으며, 모든 강우 사상의 증가는 홍수 취약성이 증가하는 방향으로 유도된다.

지표에 대한 각 DB는 평균과 표준편차에 의거하여 0~1사이의 일련된 정규 분포값으로 표현하였으며 어느 한 지역에 대한 지표의 값이 클수록 1에 가까워지는 결과를 보일 것이다. 다만, 최대나 최소값이 이상치에 가까울 경우, 자료가 왜곡될 가능성이 있기 때문에 주의가 필요하다(Moon et al., 2014).

3.3 최적 가중치 도출

3.3.1 기법별 가중치 산정

본 연구에서는 베이지안 네트워크의 적용을 통한 최적 가중치를 도출하기 위해 AHP, CSS, 엔트로피 가중치를 각각 산정하였으며 각 요소 및 지표의 가중치의 합은 1이 되도록 구성하였다.

AHP 설문은 학·연에 종사하고 있는 30명의 대상자들로 이루어졌으며 각 지표에 따른 중요도의 쌍대비교가 가능하도록 설문지를 작성하였다. 설문 대상자의 접근성을 높이기 위해 각 해당 지표의 용어를 정의하여 제시하였으며 홍수 취약성 지표(R)의 수문 지형, 사회-경제적, 홍수 방어, 기상학적의 상위 평가항목인 4개의 요소(1계층)와 각각의 하위 평가항목인 11개의 지표(2계층)로 구성하였다.

CSS에 의한 설문은 풍수해 관련 업무를 담당한 바 있는 전문가 21명을 선별하여 진행되었으며 AHP 설문 대상자와 중복이 되지 않도록 하였다. 앞서 제시한 4개의 요소와 각 요소에 따른 각각의 지표의 총합이 10이 되도록 구성하였으며, 설문 방식의 충분한 설명으로 설문지를 보완하여 응답 대상자의 혼동을 방지하였다. 또한, 엔트로피에 의한 가중치를 결정하기 위해서 수집된 지표의 자료를 바탕으로 앞서 제시한 과정을 거친 후 산정하였으며 각 항목별 가중치는 Table 2Fig. 3과 같다.

Calculated Each Weight by Indicator

Fig. 3

Distribution of Each Weight

가중치별 결과를 요약하면 각 4가지 요소에 대한 설문 기법에 의한 가중치는 사회-경제적 요소에서 낮은 가중치를 보였으나, 엔트로피 기법은 높게 산정이 되었다. 특히, 사회-경제적을 제외한 나머지 요소에서는 가중치가 고르게 분배가 되면서 중요도 측면에서 비교적 동일한 위치로 부여되는 것으로 나타났다.

요소내의 각 지표들은 설문 및 엔트로피 기법과는 다른 양상을 보였으며, 비교적 동일하게 부여된 설문 기법의 가중치에 비해 엔트로피 기법은 어느 특정 지표의 가중치가 높게 산정되는 결과를 보였다. 이는, 엔트로피의 고유 특성에 따라 각 대안별 편차가 작으면 엔트로피가 증가하는 것에 기인하며, 각 지표간의 정규값의 편차가 작은 것에 따른 결과라 판단된다. 다만, 홍수 방어 요소의 주민당 공무원수 및 기상학적 요소의 연 강수량 지표는 모두 낮게 도출됨에 따라 응답자가 생각하는 중요도는 낮은 것으로 나타났고 각 지역별 지표의 편차도 커서 엔트로피 가중치가 낮게 도출된 것으로 판단된다.

3.3.2 베이지안 네트워크를 이용한 통합 가중치 산정

어느 지역에 대한 홍수 취약성 지표간의 가중치를 각각의 기법별로 추정함에 있어서 지표별로 동일한 가중치가 산정된다면 결정을 내리기가 용이하지만, 총 주택수 지표처럼 엔트로피의 가중치가 다른 가중치에 비해 편차가 큰 경우는 결정하기가 쉽지 않을 것이다.

따라서, 본 연구에서는 AHP, CSS, 엔트로피 기법에 의한 가중치간의 인과 관계를 고려한 후, 20개의 노드와 19개의 링크를 이용하여 베이지안 네트워크를 구성하였다(AgenaRisk 10 이용). 각 상위 노드에서 부여된 사전 확률은 조건부 확률에 의거하여 직접 추론할 수 있으며, 확률의 편차에 따라 하위 노드의 사후 확률(가중치)이 결정된다. 즉, 각 요소(수문 지형, 사회 경제, 홍수 방어, 기상) 및 하위 지표는 기존 가중치라는 사전 확률과 그에 따른 조건부 확률에 따라 가중치라는 사후 확률이 도출될 것이다. 각 요소의 가중치는 별개로 진행되었기 때문에 하위 지표에 대하여 영향을 미치지는 않을 것이며, 이는 간접적으로 영향을 주는 점선 링크로 표기할 수 있다. 노드간의 일부 조건부 확률은 Table 3과 같으며 이러한 구성을 통해 각 요소 및 지표에 대한 모든 확률(가중치)은 Fig. 4, 통합 가중치(사후 확률)는 Table 4와 같다.

Derivation of Conditional Probability (ex. Hydro-geology)

Fig. 4

Bayesian Networks for Integrated Weighting

Deriving Integrated Weight using Bayesian Network

베이지안 네트워크를 이용한 통합 가중치를 살펴보면, 각 요소의 가중치는 0.2대로 비교적 균일한 가중치가 도출되었다. 설문 기법에 의한 사회-경제적 요소의 가중치가 낮음에도 불구하고 엔트로피 기법의 가중치에 의해 많이 증가한 형태로 도출되었으며, 이는 엔트로피 가중치가 사전 확률로써 조건부 확률에 기여했음을 보여준다.

각 요소내의 지표들도 마찬가지로 사전 확률 및 조건부 확률에 의해 적절하게 결정되었다. 예를 들어, 홍수 방어 요소의 하수도 용량 지표는 설문 기법의 가중치에서 각각 0.50, 0.45로 산정이 되었으나, 엔트로피 기법에 의한 가중치는 0.35가 산정됨으로써 통합 가중치는 약 0.36이 도출된 것으로 나타났다. 또한, 기상학적 요소의 연 강수량 지표는 엔트로피 지표에서 0.01의 매우 낮은 가중치를 보였으나, 설문 기법의 가중치에서 각각 0.23, 0.28로 산정되었기 때문에 통합 가중치는 약 0.16이 도출되었다.

이러한 베이지안 네트워크의 특성은 서로 다른 지식 및 데이터를 통합하는데 매우 유용하고 최적의 의사결정을 내려주는 기법이므로(Castelletti and Soncini-Sessa, 2007; Henriksen and Barlebo, 2008), 본 연구의 도출 과정은 지표간의 가중치 선정 측면에서 새로운 대안이 될 것으로 판단된다. 다만, 통합 가중치 산정을 위한 기존 가중치의 표본의 수가 3개인 것을 고려하여 추후에는 다양한 가중치를 도입하여 베이지안 네트워크에 적용할 필요가 있을 것이다.

4. InFRA (Integrated index for Flood Risk Assessment) 산정 및 검증

4.1 InFRA 산정식 도출

InFRA를 구축하기 위한 산정식으로 각 요소의 가중치에 의거하여 다음과 같은 Eq. 8을 제안하였다.

(8) InFRA=Ha1×Sa2×Ca3×(1-P)a4

여기에서, H는 수문 지형, S는 사회 경제, C는 기상, P는 홍수 방어, αi는 요소별 가중치를 나타낸다. 홍수 방어는 InFRA와 반비례하는 관계로 홍수 방어 산정시 역배열(descending)하여 고려할 필요가 있다. 만약에 홍수 방어가 0이 되고 그 외의 요소가 1이 된다면 InFRA의 값은 1이 될 것이다. 즉, 1에 근접할수록 홍수 취약성은 높아진다는 것을 의미한다.

요소를 구성하는 주요 지표들은 가중치를 곱하여 산정한 후 각각 합산하여 결정할 수 있다(Eqs. 9~12).

(9) H=β1(1)+β2(2)+β3(3)
(10) S=β4(4)+β5(5)+β6(6)
(11) P=β7(7)+β8(8)+β9(9)
(12) C=β10(10)+β11(11)

여기서, (i)는 각 지표, βi는 지표별 가중치를 나타낸다.

4.2 InFRA 산정

본 연구에서는 선정된 지표를 대상으로 가중치를 도출한 후 산정식을 이용하여 충청도 일원 28개 시군을 대상으로 수문-지형(Hydro-geology), 사회-경제(Socio-economy), 홍수 방어(Flood protection), 기상(Climate)를 비롯한 최종 InFRA를 산정하였다(Fig. 5). 그 결과, InFRA에서는 일부 지역을 제외하고는 지역별로 큰 격차를 보이지 않았으며, 대부분 0.3~0.5 정도의 홍수 취약성을 나타내었다. 서산(17), 당진(20), 태안(27) 지역은 사회-경제적 요소가 비교적 낮음에도 불구하고 나머지 요소에서 높아지는 현상으로 인해 0.7에 근접하는 결과를 보였다. 일부 촌락지역(증평(8), 진천(9) 등)은 낮은 홍수 방어를 보였으나 나머지 요소도 낮은 취약성을 보임에 따라 InFRA에서도 낮은 취약성을 나타내었다.

Fig. 5

InFRA Calculation

수문-지형학적 요소에서는 촌락에서의 취약성이 높게 도출되었으며, 이는 도시화율 보다는 홍수피해액 및 저지대 면적의 영향을 많이 받은 것에 기인한다. 사회-경제적 요소에서는 총 주택수와 재정자립도가 높은 대도시가 높은 취약성을 나타냈으며, 의존 인구 비율이 높은 일부 촌락 지역이 그 뒤를 따르는 경향을 보였다.

홍수 방어 요소에서는 대도시 및 중소도시에서 높은 방어 효과를 나타냈으며 촌락 지역은 낮은 경향을 보였다. 이는 촌락지역의 열악한 홍수 방어 시스템에 따른 결과이며, Fig. 5에서 제시하는 홍수 방어는 (1-홍수방어)의 개념으로 표현하였기 때문에 이를 고려한 해석이 필요할 것이다. 기상학적 요소에서는 유역이 연속적인 형태로 군집하여 일정한 홍수 취약성을 나타냈으며, 특히 해안 지역에 높은 형태로 도출되었다. 이는 관측소에 따른 강우 티센망의 형태와 일치함에 따라 나타난 결과이며, 홍수 취약성이 높게 도출된 해안 지역은 극한강우사상 빈도가 높은 지역으로 연 강수량 보다 극한강우사상 빈도의 가중치가 매우 높음에 따라 나타난 결과인 것으로 판단된다.

4.3 기존 홍수 취약성 평가와의 비교를 통한 고찰

기존 홍수 취약성 평가와의 비교를 위한 기존 방법의 선정으로 지표, 지표간 가중치, 산정 공식 등이 비교적 명확히 기술되어 있는 방법을 고려하였으며, 그에 따라 홍수피해잠재능(Potential Flood Damage, PFD), 홍수 피해 지수(Flood Damage Index, FDI), 지역 안전도 평가(Regional Safety Assessment, RSA)를 선정하였다(MLTMA, 2001; KRIHS, 2005; SI, 2006). 기존 방법의 산정 방식에 대한 기본적인 정보는 Table 5와 같다.

Information on Existing Flood Vulnerability Assessments

다만, 기존 홍수 취약성 평가와 InFRA를 검토하기 위해서는 평가 방식이 동일해야한다는 문제점이 있으나 기존 방법은 홍수 취약성 평가 방식이 등급(1~5), 그룹(A~D) 등 다양하게 존재하기 때문에 본래의 기준으로 평가하기에는 무리가 있다. 따라서, 본 연구에서는 홍수 취약성 평가간의 일관된 비교를 위해 등급 및 그룹 방식이 아닌 취약성 본연의 자료인 0~1 사이의 값으로 비교하였다. 모든 취약성 평가 방법은 1에 근접할수록 홍수 취약성이 증가하며, 그에 따른 적절한 치수 대책이 마련되어야 함을 의미한다.

기존 평가 방법은 전반적으로 대도시 및 중소도시에서의 홍수 취약성은 높게 도출되고, 촌락에서는 낮은 취약성을 보였다. 특히, 대전을 비롯한 청주, 충주, 천안 등에서 홍수 취약성은 높았으며 영동, 진천, 괴산, 금산 등에서는 낮은 경향을 보였다. 기존 평가 방법은 대도시 및 중소도시와 촌락 이라는 2가지의 입지 유형의 취약성 부분에서 양극화가 뚜렷하게 도출되었으며 InFRA에 비하여 지역별로 큰 편차를 보임을 알 수 있었다(Fig. 6).

Fig. 6

Results for Existing Flood Vulnerability Assessment

이러한 결과는 지표 구성에 있어서 의미가 중복되는 경우가 많고 인구, 재정자립도, 사회기반 시설 등 도시 지역이 높아지는 지표가 다수 포진되어 있으나 홍수 방어가 그에 미치지 못하는 경우로 인해 발생하는 문제인 것으로 판단된다. 따라서, 기존의 취약성 평가 모형은 대도시가 높아질 수 밖에 없는 시스템이기 때문에 어느 정도 과대 추정되었다고 사료된다.

4.4 ROC 곡선을 이용한 비교 및 검증

앞서 선행된 InFRA와 기존 홍수 취약성 평가와의 비교는 정성적인 비교이므로 보다 더 정량적인 비교를 할 필요가 있다. 따라서, 기존 방법과 통합 홍수위험평가지수와의 유효성 검증을 위해 ROC (Receiver Operating Characteristic) 곡선의 아래 면적을 활용한 AUC (Area Under the Curve) 값을 분석하여 추가적으로 검증하였다. ROC 곡선은 예측값이 거짓일 확률을 의미하는 x축의 1-특이도(Specificity)와 예측값이 참일 확률을 의미하는 y축의 민감도(Sensitivity)를 동시에 나타내는 그래프이다. 즉, 취약성 평가가 참일 확률이 높을수록, 거짓 확률이 낮을수록 좋은 평가 방법이 되는 것이다. ROC 곡선 아래의 면적인 AUC 값의 높을수록 예측의 정확도가 높음을 의미하며 1에 가까울수록 결과의 정확성이 높다고 할 수 있다.

한편, 홍수 취약성을 평가함에 있어서 홍수 취약성을 가장 잘 대변하는 인자를 고려해야 하나, 평가 요소들이 이미 지표로 포함되어 있어 마땅한 기준이 없는 문제가 있다. 이에 대한 최선책으로 홍수 피해액을 활용하고자 하였다. 홍수 피해액은 선행 연구에서도 자주 쓰이고 있고 홍수 위험 또는 취약성 측면에서도 정량적으로 평가되고 있는 대표적인 지표라고 판단했기 때문이다. 다만, 기존의 재해연보에서 제공하고 있는 홍수피해액은 인명 피해를 비롯한 농경지, 도시 침수 등의 피해액이 제공되지 않기 때문에 정확하게 추정되지 않고 있다. 홍수 취약성을 평가하는 과정에서는 피해액 이외에 여러 가지 지표가 고려되어 크게 문제가 되지 않겠지만, 본 분석에서는 피해액은 종속 변수로 설정되고 취약성 지수는 독립 변수로 표현 할 수 있기 때문에 피해액을 보다 더 정확하게 산정할 필요가 있다.

이를 위해 본 연구에서는 자연재난조사 및 복구계획수립 지침(MOIS, 2017)을 참고하여 홍수 피해액을 보완하였다. 해당 문헌에서는 인명 피해를 비롯한 여러 항목을 대상으로 복구 차원에서의 금액을 제시하고 있으며(Table 6), 재해연보에서 추정하지 못한 항목의 금액을 따로 추정한 뒤 제시하고 있는 피해액과 합산하는 방식으로 진행하였다. 피해액은 취약성 평가를 수행한 연도를 기준으로 최근 10년(2007~ 2016)의 태풍, 호우, 태풍호우, 호우태풍의 총 피해액을 고려하였으며, 2016년 환산 기준에 근거하여 연도별로 합산하였다(Table 7). 합삽된 피해액은 정규화를 통하여 0.5 이상이 됐을 때 홍수 피해가 많은 지역으로 설정하여 ROC 분석을 수행하였다.

Estimation of Flood Damage (MOIS, 2017)

Estimation of Flood Damages by District

ROC 분석 결과, 전반적으로 그래프가 직선 형태로 도출되었으며 이는 한 지역에 대한 연속형 자료가 아닌 각 지역의 고유 지수를 바탕으로 한 범주형 성향의 데이터에 따른 결과라 판단된다.

평가 방법별에 따른 AUC는 통합 홍수위험평가지수 같은 경우 0.670로 약 67%의 정확도를 나타냈으며 PFD, FDI, RSA는 0.5이하인 각각 0.296, 0.417, 0.174의 정확도를 보임으로써 홍수 피해액에 기각되는 결과를 보였다(Fig. 7). 즉, 기존의 취약성 평가는 홍수 피해액에 맞지 않는 모형인 것으로 나타난 것이다. 따라서, 통합 홍수위험평가지수는 기존의 방법보다 홍수 피해액을 잘 반영하고 있으며 홍수 취약성 평가에서 그 적용성을 증명했다는 점에서 의미가 있다고 할 수 있다.

Fig. 7

Verification of Flood Vulnerability Assessment (ROC - AUC analysis)

5. 결 론

본 연구에서는 선행 연구에서 수행한 홍수 취약성 대표 지표를 이용하여 기존 가중치 방법을 통합하는 베이지안 네트워크를 구성한 후 최적 가중치를 도출하였으며 제안한 산정식을 이용하여 시범지역을 대상으로 InFRA를 산정하였다. 또한, 기존 홍수 취약성 평가와의 비교를 통해 특징 및 적용성을 고찰하였다. 본 연구 내용을 요약하면 다음과 같다.

(1) 선정된 홍수 취약성 대표 지표간의 가중치를 도출하기 위해 기존의 AHP, CSS, 엔트로피 가중치 방법을 고려하였다. 기존의 가중치 방법을 통합하기 위해 사전 확률과 조건부 확률에 기반하고 비순환 그래프 모형이자 단일 모형인 베이지안 네트워크를 구성하여 통합 가중치를 도출할 수 있었다.

(2) 요소 및 지표의 가중치에 의거하여 수문-지형, 사회-경제, 기상 요소는 양(+)으로, 홍수 방어는 음(-)으로 표현하는 InFRA 산정식을 제안하였다. InFRA는 1에 근접할수록 홍수 취약성이 높아짐을 의미한다.

(3) 충청도 일원 28개의 시군을 대상으로 InFRA를 산정한 결과 일부 촌락 지역(서산, 당진, 태안 등)을 제외하고 지역별로 큰 격차를 보이지 않았으며, 평균적으로 0.3~0.5 정도의 홍수 취약성을 나타냈다. 이는 대도시에서는 수문-지형, 사회-경제, 기상요소 등의 양(+)의 요소가 높았지만 홍수 방어인 음(-)의 요소 또한 높았기 때문이며, 촌락에서는 모든 요소가 낮은 경향을 보였기 때문인 것으로 판단된다.

(4) 기존 홍수 취약성 평가 산정 결과, InFRA와는 다르게 대도시와 촌락 지역에서의 양극화 현상이 뚜렷하게 나타났으며, 기존 방법은 대도시가 높아질 수밖에 없는 구조이기 때문에 어느 정도 과대 추정되었다고 사료된다. 또한, 정량적인 비교 및 검증을 위해 인구, 도시 침수 등의 피해액을 포함하는 홍수 피해액을 대상으로 ROC 곡선의 아래 면적을 활용한 AUC 값을 분석하였다. 그 결과, InFRA는 기존 평가 방법보다 높은 67%의 정확도를 보였기 때문에 그 적용성을 증명하였다고 판단된다.

Acknowledgements

본 연구는 정부(행정안전부)의 재원으로 재난안전기술개발사업단의 지원을 받아 수행된 연구임[MOIS-재난-2015-05].

References

Bishop CM. 2006. Pattern recognition and machine learning New York: Springer.
Brooks N. 2003;Vulnerability, risk and adaptation: A conceptual framework. Tyndall Centre Working Paper No 38
Castelletti A, Soncini-Sessa R. 2007;Bayesian networks and participatory modelling in water resource management. Environment Modelling & Software 22(8):1075–1088.
Choi CI, Kim W. 2006;Implications of the flood risk assessment in urban and regional planning. Journal of the Korea Planners Association 41(4):143–155.
FEMA (Federal Emergency Management Agency). 2003. Flood information tool user manual (Rev. 7).
Fischhoff B. 1991;Value elicitation: Is there anything in there. American Psychologist 46:835–847.
Henriksen HJ, Barlebo HC. 2008;Reflections on the use of Bayesian belief networks for adaptive management. Journal of Environmental Management 88(4):1025–1036.
Jang OJ, Kim YO. 2009;Flood risk estimation using regional regression analysis. J Korean Soc Hazard Mitig 9(4):71–80.
Jensen FV. 1996. An introduction to Bayesian networks New York: Springer.
Joo HJ, Kim SJ, Lee MJ, Kim HS. 2018;A study on determination of investment priority of flood control considering flood vulnerability. J Korean Soc Hazard Mitig 18(2):417–429.
Joo HJ, Lee MJ, Choi CH, Kim SJ, Kim HS. 2018;A study on the selection of representative indicators for flood vulnerability assessment. J Korean Soc Hazard Mitig 18(6):335–346.
Jthink (Jeonbuk Development Institute). 2010. Improving flood plans against climate change in Jeollabuk-do Jthink 2010-PR-10.
Jung IW, Lee BJ, Jun TH, Bae DH. 2008;Hydrological model response to climate change impact assessments on water resources. Journal of Korea Water Resource Association 41(9):907–917.
Keeny RL, von Winterfeldt D, Eppel T. 1990;Eliciting public values for complex policy decisions. Management Science 36(9):1011–1030.
Kim SJ, Parhi P, Jun HD, Lee JH. 2018;Evaluation of drought severity with a Bayesian network analysis of multiple drought indices. Journal of Water Resources Planning and Management 144(1)05017016.
KEI (Korea Environment Institute). 2008. Development and introduction of indicators to assess vulnerability of climate change
KICT (Korea Institute of Civil engineering and building Technology). 2009. Strengthen facility standards against excess climate
KRIHS (Korea Research Institute for Human Settlements). 2005. Analysis of flood damage characteristics and development of flood damage index
MLTMA (Ministry of Land, Transport and Maritime Affairs). 2001. National water resource plan
MLTMA. 2010. National water resource plan (2010–2020)
MOIS (Ministy of the Interior and Safety). 2017. Natural Disaster Investigation & Recovery planning guidelines
Munich Re Group. 2004. Annual report 2004: Advancing innovation
Moon SR, Yang SM, Choi SH. 2014;Development and the application of flood disaster risk reduction index. Journal of Korean Society of Safety 29(1):64–69.
NDMI (National Disaster Management Research Institute). 2011. Development of community-based flood disaster risk reduction index
NOAA (National Oceanic and Atmospheric Administration). 2007. Risk vulnerability assessment tool
Ozkul S, Harmancioglu NB, Singh VP. 2000;Entropy-based assessment of water quality monitoring networks. Journal of Hydrologic Engineering 5(1):90–100.
Park TS, Choi MH, Yeo CG, Lee SO. 2009;Analysis of regional flood damage characteristics using relationship between flood frequency and damages. J Korean Soc Hazard Mitig 9(5):87–92.
Pearl J. 2014. Probabilistic reasoning in intelligent systems: Networks of plausible inference San Francisco, CA: Morgan Kaufmann Publishers Inc.
SI (The Seoul Institute). 2006. Development of the Regional Safety Assessment Model in Seoul: Focusing on Flood

Article information Continued

Fig. 1

Example for Bayesian Network

Fig. 2

Map of Demonstration Area

Fig. 3

Distribution of Each Weight

Fig. 4

Bayesian Networks for Integrated Weighting

Fig. 5

InFRA Calculation

Fig. 6

Results for Existing Flood Vulnerability Assessment

Fig. 7

Verification of Flood Vulnerability Assessment (ROC - AUC analysis)

Table 1

Selected Representative Indicators

Components Indicator
A. Hydro-geological (1) Flood damage cost
(2) Urban rate
(3) Lowland area rate
B. Socio-economic (4) Financial independence rate
(5) Dependence population
(6) Total number of houses
C. Flood protection (7) Pump station (number)
(8) Drainage capacity
(9) Number of public servants per resident
D. Climate (10) Frequency of hourly rainfall (P>=50mm)
(11) Annual precipitation

Table 2

Calculated Each Weight by Indicator

Components Weight 1 (AHP) Weight 2 (CSS) Weight 3 (Entropy) Indicator Weight 1 (AHP) Weight 2 (CSS) Weight 3 (Entropy)
A. Hydro-geology 0.25 0.31 0.25 (1) Flood damage cost 0.31 0.37 0.19
(2) Urban rate 0.29 0.33 0.31
(3) Lowland area rate 0.40 0.30 0.50
B. Socio-economy 0.13 0.15 0.28 (4) Financial independence rate 0.30 0.36 0.28
(5) Dependence population 0.31 0.30 0.01
(6) Total number of houses 0.39 0.34 0.71
C. Flood protection 0.31 0.26 0.27 (7) Pump station (number) 0.37 0.38 0.56
(8) Drainage capacity 0.50 0.45 0.35
(9) Number of public servants per resident 0.13 0.17 0.08
D. Climate 0.31 0.28 0.20 (10) Frequency of hourly rainfall (P>=50mm) 0.77 0.72 0.99
(11) Annual precipitation 0.23 0.28 0.01

Table 3

Derivation of Conditional Probability (ex. Hydro-geology)

AHP A. Hydro-geology
CSS A. Hydro-geology ···
Entropy A. Hydro-geology B. Socio-economy C. Flood protection D. Climate ···
A. Hydro-geology 1.0 0.67 0.67 0.67 ···
B. Socio-economy 0.0 0.33 0.0 0.33 ···
C. Flood protection 0.0 0.0 0.0 0.0 ···
D. Climate 0.0 0.0 0.33 0.0 ···

Table 4

Deriving Integrated Weight using Bayesian Network

Components Weight using BN (AHP & CSS & Entropy) Indicator Weight using BN (AHP & CSS & Entropy)
A. Hydro-geology 0.26 (1) Flood damage cost 0.32
(2) Urban rate 0.28
(3) Lowland area rate 0.40
B. Socio-economy 0.20 (4) Financial independence rate 0.31
(5) Dependence population 0.21
(6) Total number of houses 0.48
C. Flood protection 0.26 (7) Pump station (number) 0.51
(8) Drainage capacity 0.36
(9) Number of public servants per resident 0.13
D. Climate 0.28 (10) Frequency of hourly rainfall (P>=50mm) 0.84
(11) Annual precipitation 0.16

Table 5

Information on Existing Flood Vulnerability Assessments

Existing flood vulnerability assessment Indicator selection method Weight calculation method Calculation formula
PFD Selected by judgment of researcher’s Definition by judgment of researcher’s PFD=Potentiala1×Riska2
FDI Selected by judgment of researcher’s Constant Sum Scale (CSS) FDI=j=1n(Wj×Zij)
RSA Selected by judgment of researcher’s Constant Sum Scale (CSS) RSA=α×Risk-β×Reduction

Table 6

Estimation of Flood Damage (MOIS, 2017)

Classification Unit Unit cost (won) Remarks
Death & Missing Person 10,000,000
Injury Person 5,000,000
Victims Relief Person/day 8,000
Livelihood support (One household) Household 428,000
Agricultural lost m2 2,651
Agricultural burial m2 902

Table 7

Estimation of Flood Damages by District

District Period: 2007~2016 (Unit: thousand won) District Period: 2007~2016 (Unit: thousand won)
Total flood damage cost (existed) Total flood damage cost (recalculated) Total flood damage cost (existed) Total flood damage cost (recalculated)
Daejeon 28,904,388 47,212,788 Boryeong 32,401,710 83,801,710
Cheongju 91,359,488 92,472,688 Asan 48,656,598 73,920,798
Chungju 104,137,429 131,245,429 Seosan 114,830,315 190,237,515
Jecheon 186,090,075 246,660,075 Nonsan 47,680,083 96,512,883
Boeun 71,415,564 91,802,764 Gyeryong 51,490,991 61,412,991
Okcheon 52,452,809 76,211,609 Dangjin 90,928,932 102,690,132
Yeongdong 538,481,881 559,584,281 Geumsan 116,518,336 248,099,536
Jeungpyeong 47,680,083 68,518,883 Buyeo 84,734,079 103,852,079
Jincheon 110,242,303 135,001,103 Seocheon 27,608,991 88,375,991
Goesan 93,072,362 130,146,762 Cheongyang 34,453,315 90,744,515
Eumseong 80,755,775 85,305,375 Hongseong 46,091,101 59,817,901
Danyang 310,987,567 332,961,167 Yesan 39,018,182 51,444,182
Cheonan 47,680,083 55,908,083 Taean 106,713,297 140,302,897
Gongju 90,773,723 128,253,723 Sejong 18,198,894 34,950,094