격자기반 홍수모의의 순차적 시공간 보정을 위한 2-Phase PIML 개발
Development of a Two-phase Physics-informed Machine Learning Model for Sequential Spatiotemporal Correction of Grid-based Flood Simulations
Article information
Abstract
기후변화로 인한 극한 강우 증가는 돌발 홍수 위험을 높여 정확한 모의 기술이 필수적이다. 전통적 격자기반 물리 모형은 매개변수 추정, 구조적 단순화로 시공간적 불확실성을 가진다. 본 연구는 이를 극복하고자 물리 모형과 머신러닝을 순차 결합하는 2-Phase PIML (Physics-Informed Machine Learning) 하이브리드 홍수 모형을 개발했다. 방법론은 Phase 1 시간적 보정과 Phase 2 공간적 보정으로 구성된다. Phase 1은 집중형 물리 모형 유출 모의와 강우 시차 등을 입력으로, 관측 유량을 정답으로 PIML 모형을 학습해 ‘시간 보정 비율’을 산정한다. Phase 2는 빈도별 홍수위험지도를 정답으로, 분포형 물리 모형의 침수심과 지형 특징(DEM 등)을 입력으로 AI 모형을 학습한다. 하이브리드 모의 시, 분포형 물리 모형의 격자별 유량에 1단계 시간 보정 비율을 적용해 유량을 1차 보정한다. 이 보정 유량 기반 침수심은 2단계 공간 AI 모형에 입력되어 순차 보정된 최종 침수심을 도출한다. 경안천 상류 유역 적용 결과, 1단계 시간 보정은 물리 모형 대비 수문 곡선 정확도를 크게 향상시켰다. 2단계 공간 보정을 포함한 빈도별 시나리오 분석에서는 물리 모형의 침수 범위 과소⋅과대 추정 경향이 보정되어 공간 정확도가 개선되었고, 모의 결과가 빈도별 홍수위험지도와 유사함을 확인했다. 제안된 2-Phase PIML은 물리 모형의 해석력과 AI의 비선형 패턴 학습력을 결합하여, 격자기반 홍수 모의의 실효성을 높이는 대안을 제시한다.
Trans Abstract
Accurate flood simulation is essential because climate change increases the risk of flash floods resulting from extreme rainfall. Traditional grid-based physical models exhibit spatiotemporal uncertainties due to parameter estimation difficulties and structural simplifications. This study developed a two-phase Physics-Informed Machine Learning (PIML) hybrid grid-based flood model by sequentially combining a physical model with machine learning to overcome these limitations. The methodology consisted of temporal (Phase 1) and spatial (Phase 2) corrections. In Phase 1, a PIML model, trained on flow observations (target) using discharges and lagged rainfall from a lumped model (inputs), estimated a temporal correction ratio to correct temporal errors. In Phase 2, a spatial machine learning (ML) model was trained on flood risk maps (target) using flood depth and topographical features (e.g., digital elevation model and slope data) of a distributed model as inputs. In the hybrid simulation, the temporal correction ratio (Phase 1) was applied to the grid cell flow of the distributed model. The resulting flood depth was then fed into the spatial ML model (Phase 2) to produce the final, sequentially corrected flood depth, thus reducing spatiotemporal uncertainty. When applied to the Gyeongan stream basin, Phase 1 significantly enhanced hydrograph accuracy compared with the physical model. The full hybrid model, including Phase 2, corrected the inundation estimation errors of the physical model in scenario analysis, improving spatial accuracy and aligning results with official frequency-based Flood Risk Maps. The proposed two-phase PIML integrates the interpretive strengths of physical models with the nonlinear pattern recognition of ML, thereby offering an alternative for enhancing the practical utility of grid-based flood simulations.
1. 서 론
기후변화로 인한 전 지구적 이상기후 현상은 극한 강우 사상의 빈도와 강도를 동시에 심화시키고 있다(IPCC, 2021; Shin et al., 2023; K.H. Kim et al., 2024). 한국은 지형적 특성과 높은 도시화율로 인해 하천 범람 및 돌발 홍수에 취약한 구조를 가지며, 최근 이러한 극한 강우로 인한 피해 규모가 지속적으로 증가하는 추세이다(Kim and Park, 2021; S.J. Kim et al., 2024; Eo and Kim, 2025). 예측 불확실성이 높은 홍수에 효과적으로 대비하고 선제적인 대응 체계를 구축하기 위해서는 강우가 유역의 유출 및 하천 범람으로 이어지는 복잡한 수문-수리학적 과정을 정확하게 모의하고, 미래의 침수 위험을 시공간적으로 예측하는 고해상도 홍수 모의 기술이 필수적이다.
홍수 모의를 위한 접근법은 크게 물리 기반 모형(Physics-based models)과 자료 기반 모형(Data-driven models)으로 구분된다. 전통적인 격자기반 물리 모형은 유역을 상세 격자(Grid)로 구분하여 NRCS-CN 방법, 흐름 추적, Manning 공식 등 수문⋅수리학적 지배방정식을 기반으로 강우-유출 및 범람 과정을 재현하고 해석한다. 이러한 모형은 현상의 인과관계를 명확히 설명할 수 있다는 장점이 있으나 지형, 토양, 토지이용 등 방대한 입력 자료를 요구하며, 매개변수 추정 과정에 내재된 불확실성(parameter uncertainty)과 모형 구조의 단순화(structural uncertainty)로 인해 실제 현상을 완벽히 재현하는 데 한계가 있다(Beven, 2012; Teng et al., 2017).
반면 인공신경망(ANN)이나 랜덤 포레스트(Random Forest)와 같은 자료 기반 모형은 방대한 관측 데이터로부터 입력(강우)과 출력(유량, 침수심) 간의 복잡한 비선형 관계를 직접 학습한다(Mosavi et al., 2018). 이 모형들은 물리적 과정에 대한 복잡한 가정 없이도 높은 모의 정확도를 보일 잠재력이 있으나, 두 가지 주요 한계를 가진다. 첫째, 학습에 사용된 데이터 범위를 벗어나는 극한 사상에 대한 외삽(extrapolation) 성능이 취약하다. 둘째, 모형의 모의 결과가 물리적 일관성(physical consistency)을 벗어날 수 있다는 문제가 존재한다(Bergen et al., 2019).
최근 물리 기반 모형의 해석 능력과 자료 기반 모형의 학습 능력을 결합하려는 시도로 PIML (Physics-Informed Machine Learning)이 새로운 대안으로 연구되고 있다(Willard et al., 2022). PIML은 물리적 지배방정식을 머신러닝 모형의 손실 함수(loss function)에 결합하여 물리 법칙을 만족하는 해를 찾도록 제약하거나, 물리 모형의 중간 산출물을 AI의 입력 특징(feature)으로 활용하는 이론 기반(theory-guided) 접근법을 활용한다(Karpatne et al., 2017).
그러나 격자기반 홍수 모형에 PIML을 적용한 기존 연구들은 주로 유역 출구 지점의 시간적 유량 변화(temporal dynamics)를 보정하는 데 집중하거나, 특정 빈도에 대한 정적(static)인 공간적 침수 범위(spatial distribution)를 보정하는 데 국한되는 경향이 있었다. 시계열 유량 보정은 격자 단위의 공간적 오차를 직접 해결하지 못하며, 정적인 공간 보정은 강우 사상의 시간적 전개 과정을 반영하기 어렵다. 즉, 물리 모형이 동시에 내포하고 있는 시간적 오차(Temporal Error)와 공간적 오차(Spatial Error)를 명확히 분리하고, 이를 순차적으로 보정하려는 시도는 미흡했다.
본 연구는 이러한 한계를 극복하기 위해, 격자기반 홍수 모형의 시공간적 불확실성을 체계적으로 보정하는 2-Phase PIML 하이브리드 홍수 모형을 개발하였다. 본 모형의 핵심은 보정 과정을 시간과 공간으로 명확히 분리하여 순차적으로 적용하는 데 있다.
Phase 1에서는 수위관측소에서 관계곡선식을 통해 추정되는 유량을 활용하여 PIML로 물리 모형의 시간적 오차를 보정하는 시간 보정 비율(Temporal Correction Ratio)을 산출한다. Phase 2에서는 빈도별 홍수위험지도를 정답으로 하여, 1단계에서 보정된 유량으로 계산된 침수심과 지형 특징을 입력으로 하는 공간 AI 모형을 학습한다. 이 방식은 시간적 보정이 완료된 유량이 공간적 보정의 입력으로 활용되는 순차적(sequential) 구조를 가짐으로써, 각 단계의 불확실성을 체계적으로 줄여나가는 새로운 하이브리드 모형을 구현한다. 최종적으로 본 연구에서는 2-Phase PIML 하이브리드 격자기반 홍수 모형을 개발하고, 실제 유역에 적용하여 기존 물리 기반 모형 대비 시공간적 모의 성능의 개선 효과를 정량적으로 검증하였다.
2. 연구 방법
본 연구에서 개발한 2-Phase PIML 하이브리드 홍수 모형의 목적은 전통적인 물리 기반 격자 모형이 가진 시공간적(spatial-temporal) 불확실성을 순차적으로 보정하는 것이다. 이 과정은 물리 모형의 해석력을 유지하면서 머신러닝의 비선형 패턴 학습 능력을 결합하는 이론 기반(theory-guided) PIML 접근법을 따른다(Karpatne et al., 2017).
Phase 1은 시간적 보정 과정으로써 유역 출구에 위치한 수위관측 지점의 수문 곡선에 초점을 맞춘다. 관측된 수위에 수위-유량 관계곡선식(rating curve)을 적용하여 추정한 유량을 정답으로 하여 집중형 물리 모형의 모의 유량과 강우 패턴 등 추가 수문 특징을 입력받는 PIML 모형을 학습시킨다. 이 단계의 핵심 산출물은 AI가 모의한 유량 값이 아니라, 물리 모형의 시간적 오차를 보정하기 위한 시간 보정 비율(Temporal Correction Ratio)이다.
Phase 2는 공간적 보정 과정으로, 격자 단위의 침수 분포에 초점을 맞춘다. 정부가 제공하는 빈도별 홍수위험지도를 정답 래스터로 활용한다. 분포형 물리 모형이 모의한 침수심과 DEM, 경사, 흐름 방향 등 고해상도 지형 특징을 입력으로 하는 공간 차원의 AI 모형을 학습시킨다.
최종적인 하이브리드 모형은 이 두 단계를 순차 적용한다. 새로운 강우 사상에 대해 매시간 분포형 물리 모형이 유량을 계산하면, Phase 1에서 도출된 시간 보정 비율을 격자별 유량에 적용하여 유량의 크기와 발생 시간을 1차 보정한다. 이후 보정된 유량으로 침수심을 계산하고, 이 침수심을 Phase 2의 공간 보정 AI 모형에 입력하여 지형적 특성을 고려한 최종 침수심을 도출한다. 이 순차적 구조는 시간적 오차가 공간적 오차에 미치는 영향을 최소화하며 불확실성을 체계적으로 보정한다.
2.1 격자 기반 물리 홍수모형
본 연구의 기반이 되는 물리 모형은 유역의 지형 및 수문 특성을 격자 단위로 반영하는 분포형 모형의 개념을 따르며, 유효 강우 산정, 유출 추적, 침수심 변환의 3단계로 구성된다.
2.1.1 NRCS-CN 방법을 활용한 유효 강우 산정
격자별 총강우량 P로부터 직접 유출량, 즉 유효 강우량(Pe)을 산정하기 위해 미국 농무성 토양보전국(USDA-SCS)에서 개발한 NRCS-CN 방법을 적용하였다(USDA-SCS, 1986; Woodward et al., 2003). CN (Curve Number)은 토지이용, 토양 수문학적 조건, 선행 함수 조건(Antecedent Moisture Condition, AMC)에 따라 결정되는 경험적 매개변수이다. 본 연구에서는 격자별 토지피복(LandCover)과 토양형(SoilType) 데이터를 기반으로 격자단위 CN 값을 계산하였다.
각 격자의 잠재 보유수량 S (mm)는 Eq. (1)과 같이 계산되며, 초기손실 Ia는 0.2 S 로 가정하였다. 총강우량이 Ia 보다 클 경우, 유효 강우량 Pe는 Eq. (2)를 통해 산정된다.
2.1.2 D8 위상 정렬 기반 유출 추적
각 격자에서 유효 강우에 따라 발생한 유량은 유출구까지 흐름을 추적하여 격자단위로 누적된다. 흐름 방향을 결정하기 위해 D8 (Deterministic 8) 알고리즘을 사용하였다(O’Callaghan and Mark, 1984). D8은 각 격자의 물이 8방향(동, 서, 남, 북, 대각선) 중 가장 경사가 가파른 인접 격자 한 곳으로만 흐른다고 가정한다.
본 연구 과정에서는 단순한 D8 흐름 누적이 아닌, 위상 정렬(Topological Sort)에 기반한 효율적인 유량 누적 방식을 구현하였다. 먼저, 각 격자로 물이 유입되는 상류 격자의 수(in-degree)를 계산한다. 이후, 유입 격자가 0개인 최상류 격자(Source)부터 시작하여 하류로 이동하며 계산을 수행한다. 이 방식은 특정 격자의 유량이 계산되기 전에 모든 상류 격자의 유량이 먼저 계산되는 것을 보장하여, 유출 누적 과정의 정확성과 효율성을 높인다.
2.1.3 Manning 공식을 활용한 침수심 변환
최종적으로 누적된 격자별 유출량 Q (m3/s)는 하도 및 범람원에서의 수리학적 특성을 반영하여 침수심 H(m)로 변환된다. 본 연구에서는 계산의 효율성을 위해 1차원 흐름을 가정한 Manning 공식을 적용하였다(Chow, 1959). 각 격자의 폭 W를 격자 크기만큼의 폭을 가지는 사각형 수로로 가정하고, Manning 공식을 수심 H에 대해 정리하면 Eq. (3)과 같다.
여기서 n은 조도 계수, A는 통수 단면적, R은 경심, S는 격자단위로 구성된 수로의 경사이다. 광폭 사각형 수로에서는 R ≈ H로 근사할 수 있으므로, Eq. (3)은 Eq. (4)와 같이 단순화할 수 있다. 이를 H에 대해 정리하면 Eq. (5)를 얻는다.
본 연구에서는 하천 구역과 그 외 구역에 대해 서로 다른 조도계수를 적용하여 공간적 특성을 일부 반영하였다.
2.2 Phase 1: PIML 기반 시간적 보정
Phase 1의 목적은 집중형 물리 모형이 가진 시간적 오차, 즉 관측된 수문 곡선과의 편차를 보정하는 것이다. 이는 물리 모형의 모의 결과를 AI의 입력 특징 중 하나로 사용하는 이론 기반 PIML 접근법을 활용한다(Karpatne et al., 2017).
2.2.1 시간적 특징 생성
물리 모형의 모의 결과는 강우와 같은 입력에 따른 유역의 반응을 나타내지만, 단기적 강우 강도나 장기적 누적 강우와 같은 복잡한 패턴을 완벽히 반영하지 못할 수 있다. AI 모형이 이러한 비선형적 관계와 시간적 지연(Time-lag)을 학습할 수 있도록 원시 강우 데이터로부터 추가적인 시간적 특징(Temporal Features)을 생성하였다.
본 연구에서는 시간적 보정에 Random Forest 모형을 활용하였다(Breiman, 2001). 입력 변수로는 물리 모형의 모의 유량, 과거 강우 정보를 반영하는 시차 강우(Lagged Precipitation), 강우의 추세를 반영하는 이동 평균 강우(Rolling Mean Precipitation), 계절성을 반영하는 월 정보를 사용하였다. 이러한 특징들은 AI가 물리 모형의 오차가 발생하는 특정 강우 패턴을 식별하고 학습하는 데 기여한다.
2.2.2 PIML 모형 학습 및 보정 비율 산정
Phase 1의 PIML 모형은 생성된 특징들을 입력 변수(X)로, 유역 출구 지점의 관측 유량을 목표 변수(Y)로 설정하여 학습된다(Eq. (6)). 모형은 Standard Scaler를 이용한 표준화와 Random Forest Regressor를 결합하는 형태로 구성되어, 데이터 전처리와 학습을 통합적으로 수행한다.
학습된 PIML 모형의 모의값 Y(Q)는 물리 모형의 오차가 보정된 유량 추정치이다. 그러나 본 연구에서는 이 모의값을 직접 사용하는 대신, 물리 모형의 출력을 보정하는 개념을 적용하였다. Eq. (7)과 같이 물리 모형의 모의치 대비 PIML 모의치의 비율인 시간 보정 비율(Temporal Correction Ratio)을 매시간 산정한다.
이 보정 비율은 물리 모형의 계산 결과를 신뢰하되, AI의 판단에 따라 그 값을 시간대별로 증폭하거나(Ratio > 1) 감소시키는(Ratio < 1) 스케일링 인자(scaling factor)로 활용된다. 이는 0.1~10배 범위로 제한하여 수치적 불안정성을 방지하였으며, 모형의 시간적 보정 단계에서 핵심적인 역할을 수행한다.
2.3 Phase 2: AI 기반 공간적 보정
Phase 1이 유출지점의 시간적 유량 오차를 보정하는 단계였다면, Phase 2는 격자 단위의 공간적 침수 분포 오차를 보정하는 데 중점을 둔다. 이는 물리 모형의 침수심 모의 결과와 지형 특징을 AI에 입력하고, 공식적인 홍수위험지도를 정답(Target)으로 사용하여 공간적 편향(spatial bias)을 학습하고 보정하는 과정이다.
2.3.1 대상 자료 및 공간 특징 구축
Phase 2 공간 보정 목적 AI 모형의 학습을 위한 목표 자료로 환경부에서 제공하는 홍수위험지도를 활용하였다. 환경부에서는 홍수위험지도를 하천범람지도와 도시침수지도로 구분하여 제공한다. 본 연구에서는 국가 및 지방 하천의 빈도별(50년, 80년, 100년, 200년) 하천범람지도를 격자화하여 활용하였다. 격자화된 홍수위험지도는 침수 심도에 따라 0에서 4까지의 범주 값으로 구성되어 있다. AI 모형의 정량적 학습을 위해, 홍수위험지도의 각 순서형 범주별로 범위의 중앙값으로 대표 침수심을 설정하였다. 이 변환된 침수심 격자가 공간 AI 모형이 모의해야 할 목표 변수가 된다.
입력 변수는 물리 모형의 모의치와 지형 특징을 복합적으로 사용한다. 본 연구에서는 빈도별 강우 시나리오를 물리 모형에 적용하여 계산된 시간적 보정이 적용된 침수심을 핵심 입력으로 사용한다. 여기에 표고(DEM), 경사, 로그 변환된 누적 흐름(cumulative flow accumulation), 유출 곡선 지수(Curve Number, CN) 등 4가지 지형 및 수문 특징을 추가하여 공간적 특징 벡터를 구축한다. 누적 흐름은 방향을 바탕으로 유량이 집중되는 경로를, CN은 토양 및 토지피복에 따른 침투 특성을 반영하여 공간적 침수 편차를 설명하는 주요 특징으로 활용된다.
2.3.2 공간 보정 AI 모형
학습은 유역 내 격자들을 대상으로 수행된다. 구축된 공간 특징 벡터를 입력으로, 홍수위험지도의 대표 침수심을 목표로 설정하여 Random Forest 모형을 학습시킨다. 이 과정을 통해 학습된 공간 보정 AI 모형은, 물리 모형의 결과와 실제 침수위험지역이 다른 패턴에서 발생하는 오차를 학습한다. 예를 들어, 물리 모형이 제방 등으로 인해 침수되지 않는다고 판단한 지역이라도, 주변 지형과 상류 유량을 고려할 때 홍수위험지도상 침수 지역이라면 AI 모형은 해당 지역의 침수심을 0 이상으로 보정하도록 학습된다.
2.4 하이브리드 모형의 2-Phase 순차 적용
최종적인 하이브리드 격자 기반 홍수 모형은 실시간 호우 사상에 대해 Phase 1과 Phase 2에서 학습된 결과물을 순차적으로 적용하여 시공간적 보정을 수행한다. 새로운 강우 P(t)가 발생할 때 모형은 시간단위로 다음의 4개 절차를 수행한다.
① 물리 모형 기반 유출 추적: 유효 강우Pe를 산정하고 D8 위상 정렬에 따라 유출을 추적하여 격자 단위 유량 계산
② Phase 1. 시간적 보정: 계산된 시간 보정 비율 중 연산중인 시간에 해당하는 비율을 적용. 이 비율은 모든 유역에서 격자 단위 물리 유량에 일괄적으로 곱하여 시간적 오차가 보정된 유량 계산
③ 침수심 계산: 보정된 유량에 Manning 공식을 활용하여 시간적 보정이 완료된 침수심을 격자 단위로 계산. 이는 공간적 보정 단계에서 입력으로 활용
④ Phase 2. 공간적 보정: 학습된 공간 보정 AI 모형 적용. 표고, 경사, 로그 변환된 누적 흐름, CN 등 정적 지형 특징들과 결합하여 공간 특징(feature) 벡터를 구성. 이 벡터를 학습된 AI 모형에 입력하여 시공간적 보정이 모두 완료된 최종 침수심 계산
이러한 과정으로 수행되는 순차적 보정 구조는 유량의 시간적 오차를 먼저 보정한 뒤, 보정된 유량을 기반으로 공간적 분포의 오차를 다시 보정함으로써 두 오차가 복합적으로 작용하며 발생하는 불확실성을 체계적으로 분리하고, 최소화한다.
3. 적용 및 결과
3.1 연구 대상지역 및 입력자료
본 연구는 경기도 용인시에 위치한 경안천 상류 유역을 대상 지역으로 선정하였다. 경안천 유역은 한강 수계의 제1지류이며, 대상 유역은 경기도 용인시 처인구, 기흥구, 수지구를 포함한다. 해당 지역은 급격한 도시화가 진행되어 불투수 면적이 증가하고 있으며, 지형적으로 하천변 저지대가 발달하여 집중 호우 시 침수 피해 위험이 있는 지역이다. 본 연구에서는 수문-수리학적 모형의 구동 및 검증을 위해 수위관측지점인 용인시(월촌교) 지점을 유역 출구로 설정하였다. 본 연구에서 활용한 입력자료는 Table 1과 같이 요약하였다.
물리 기반 격자 단위 홍수모형을 위한 핵심 지형 자료는 Fig. 1과 같다. 모든 래스터 자료는 50 × 50 (m) 해상도를 가지며, 흐름 방향(Flow Direction)은 D8 알고리즘에 따라 8개 방향으로 구성된다.
Phase 1. 시간적 보정의 목표 자료인 유량 데이터는 용인시(월촌교) 지점의 수위 관측 자료와 수위-유량 관계곡선식을 결합하여 1시간 단위의 관측 유량으로 변환하였다.
Phase 2. 공간적 보정의 목표 자료인 홍수위험지도는 용인시 처인구, 기흥구, 수지구의 국가하천 및 지방하천 범람도를 50년, 80년, 100년, 200년 빈도별로 수집하였다. 이 자료들은 격자 단위로 변환하여 Phase 2의 목표 변수로 설정되었다.
3.2 Phase 1: 시간적 보정 결과
Phase 1의 PIML 모형은 전체 시계열 자료 중 70%를 보정에, 30%를 검증에 사용하여 학습 및 평가하였다. 격자 기반 물리 홍수모형과 PIML 보정 홍수모형의 성능을 평가하기 위하여 KGE (Kling-Gupta Efficiency), NSE (Nash-Sutcliffe Efficiency), RMSE (Root Mean Square Error)를 활용하였다. 격자 기반 물리 홍수모형과 PIML 보정 모형(PIML, Corrected)의 성능을 비교한 결과를 Table 2와 같이 나타내었다.
분석 결과를 살펴보면, 격자 기반 물리 홍수모형에서 학습 구간의 평가 결과가 검증 구간의 평가 결과보다 낮은 것을 확인할 수 있었다. 해당 모형은 구간에 따라 별도의 보정이나 최적화를 수행하지 않았기 때문에, 해당 현상은 70%, 30%의 표본 개수 차이로 인해 나타난 것으로 확인된다.
격자 기반 물리 홍수모형은 보정 및 검증 구간 모두에서 NSE가 음수 값이 나타났다. 이는 단순화된 집중형 물리 모형이 대상 유역의 복잡한 유출 특성을 재현하는 것에 한계가 있음을 의미한다. 이를 보정한 PIML 모형은 보정 기간에서 KGE가 0.75, NSE가 0.78로 상당히 높은 성능을 보인다. 학습에 사용되지 않은 검증 기간에서도 물리 모형에서 나타난 음수 값을 KGE 0.36, NSE 0.22로 양수 값을 확보하였다. 이는 PIML 모형이 물리 모형의 모의값과 추가 강우 특징을 결합하여 물리 모형의 구조적 오차를 효과적으로 학습하고 보정했음을 의미한다.
Fig. 2는 모형에서 Phase 1의 시간적 보정 결과를 나타낸 수문 곡선이다. 물리 모형은 관측치 대비 유출량을 거의 모의하지 못하여 정확도가 상당히 떨어지는 것을 확인할 수 있다. 그러나 PIML 모형은 유량의 크기를 관측치와 유사한 수준으로 모의하며, 특히 유량의 첨두값과 발생 시간을 적절히 계산하여 적용한 보정 과정이 유의미하다는 것을 확인하였다.
Table 3은 PIML 모형 학습에 기여한 입력 특징의 중요도를 분석한 결과이다.
특징 중요도 분석 결과 24시간 이동 평균 강우(Proll24h)가 0.4224로 가장 큰 영향을 미쳤으며, 그 다음으로 6시간 이동 평균 강우((Proll26h)) 및 계절성이 중요한 것으로 나타났다. 물리 모형의 모의 유량은 중요도가 0.04로 상당히 낮게 나타났는데, 이는 물리 모형 자체의 성능이 상당히 낮아 AI가 물리 모형의 결과보다는 강우의 누적 패턴을 직접 학습하여 오차를 보정하는 경향이 강했음을 나타낸다. 본 연구의 사례에서 물리 모형은 강우-유출에 따른 자연적인 흐름만을 모의하도록 설계되어, 홍수위험지도 제작 시 가정된 제방 파제(Levee Breach)와 같은 극한의 외수 범람 시나리오를 구조적으로 반영하지 못하는 한계를 보였다. 이에 따라 AI 모델은 물리 모형의 예측값보다 강우 및 지형 인자에 가중치를 두어, 물리 모형이 모의하지 못한 파제 시나리오의 침수 패턴을 데이터 기반으로 학습하고 보완하는 양상을 보였다.
3.3 Phase 3: 공간적 보정 결과
Phase 2 공간 AI 모형에서는 물리 모형이 모의한 침수심과 DEM, 경사 등 지형 특징을 입력 특징으로 활용하고, 빈도별 홍수위험지도의 대표 침수심을 목표 변수로 설정 후 학습하여 공간적 오차를 보정하는 형태로 구성되었다. Phase 2 공간적 보정 결과를 Table 4와 같이 나타내었다.
공간 AI 모형에서는 결정계수(R2)가 0.76으로 홍수위험지도의 침수심 분포를 76% 수준으로 설명할 수 있는 것으로 나타났다. RMSE는 0.23으로, 격자 단위 침수심 모의에 있어 준수한 정확도를 확보하였다.
공간 AI 모형에서의 특징 중요도 분석 결과를 Table 5와 같이 나타내었다. 특징 중요도 분석 결과 DEM, 경사도, 물리 모형 기반 침수심이 중요한 특징으로 활용되었으며, 다른 특징들도 보조적인 역할을 적절히 수행하여 지형적 특성을 반영하고 있음이 나타났다.
분석 결과를 살펴봤을 때, 물리 모형은 제방이 월류되지 않는 조건에서 하천 주변 저지대를 비침수 구역으로 나타내었다. 그러나 AI 모델은 제방 파제 시나리오가 반영된 홍수위험지도를 학습함으로써, 물리 모형상으로는 침수가 발생하지 않더라도 표고가 낮고 하천에 인접한 구역을 잠재적인 파제 시 시뮬레이션 침수 위험 구역으로 인식하여 침수심을 높게 보정하였다. 이는 AI가 물리 모형의 구조적 결함(Low Accuracy)을 수정했다기보다, 자연적인 지표흐름과 극한 시나리오와 같이 서로 다른 시나리오 간의 간극을 효과적으로 반영했음을 시사한다.
3.4 시나리오 및 사상에 대한 하이브리드 모형 적용 결과
최종적으로 2-Phase PIML 보정을 모두 적용한 하이브리드 모형의 성능을 검증하였다. 50년, 80년, 100년, 200년 빈도별 강우 시나리오에 따라 물리 모형과 하이브리드 모형의 모의 결과를 목표 변수인 홍수위험지도와 비교하여 공간적 정확도를 산정하였다.
공간적 정확도 평가에는 CSI (Critical Sucess Index), POD (Probability Of Detection)를 사용하였다. CSI는 예보 분야에서 널리 사용되는 지표로, 실제 침수되었고 모형도 침수되었다고 모의한 격자의 수를 전체 침수 영역으로 나눈 값이다. 1에 가까울수록 모형이 실제 침수 범위를 정확하게 모의했음을 의미한다. POD는 실제 침수된 지역 중 모형이 침수로 올바르게 탐지한 비율을 나타내며, 1에 가까울수록 누락된 침수 지역이 적음을 의미한다.
Table 6을 통해 물리 모형의 결과와 2-Phase PIML 보정을 모두 적용한 하이브리드 모형의 성능을 평가하였다. 물리 모형에서 모든 빈도의 CSI 및 POD가 0.06~0.09 범위로 상당히 낮은 정확도를 보인다. 물리 모형에서 2-Phase PIML 보정을 적용한 하이브리드 모형은 CSI가 0.27~0.39 범위로 정확도가 유의미하게 개선되었으며, 침수 여부를 판단하는 POD에서 0.89 이상의 높은 정확도를 확보하였다.
Fig. 3을 통해 100년 빈도 시나리오에 대한 침수심 분포를 시각적으로 비교하였다. 물리 모형의 경우 유역 전반적으로 침수심을 과소추정하여 모의 정확도가 상당히 떨어진다. 이러한 물리모형을 바탕으로 2-Phase PIML 보정을 적용했을 때 빈도별 홍수위험지도와 상당히 유사한 수준의 침수심 모의 결과를 얻을 수 있다. 이러한 결과는 모의 정확도가 상당히 떨어지는 단순 분포형 물리모형을 통해 홍수의 공간적 분포를 구현하고, AI를 활용하여 2-Phase PIML 기법을 통해 오차를 보정하는 과정이 실제로 유의미하다는 것을 의미한다. 본 연구에서는 1개 시나리오에 대해 시각화 및 논의하였으나, 실제로 해당 결과물은 기상청 등에서 예측되는 총 강수량 수치만을 입력으로 활용하여 격자단위로 첨두유출이 발생하는 시점의 침수심을 격자단위로 모의할 수 있다는 부분에서 큰 의미를 가진다.
4. 결 론
본 연구는 격자 기반 물리 모형이 가진 고유의 시공간적 불확실성을 보정하기 위해, 2-Phase PIML 하이브리드 홍수 모형을 개발하고 그 적용성을 검증하였다. 전통적인 물리 모형은 단순화된 가정으로 인해 실제 유출 현상을 정확히 재현하기 어렵다는 한계점이 있다.
본 연구에서 제안한 2-Phase PIML은 이러한 문제를 Phase 1 시간적 보정과 Phase 2 공간적 보정으로 분리하여 순차적으로 적용하였다.
Phase 1 시간적 보정 단계에서는 PIML 모형이 물리 모형의 구조적 오차를 효과적으로 학습하여, 학습 구간과 검증 구간 모두에서 물리 모형의 값 대비 유의미한 성능 향상을 보였다. 특히 물리 모형 자체의 모의 결과보다 이동 평균 강우가 유량 보정에 더 큰 영향을 미친 것은, AI가 물리 모형의 한계를 인지하고 강우 패턴에 직접 의존하여 오차를 보정했음을 의미한다.
Phase 2 공간적 보정 단계에서는 하이브리드 모형의 적용 가능성을 확인하였다. 물리 모형은 실제 침수 지역의 약 90% 이상을 누락하는 등 유량을 과소추정하는 결과가 나타났다. 이러한 결과는 본 연구에서 재현한 물리모형이 제방 파제와 같은 극한 시나리오가 반영되지 않아 대부분의 하천 인근 구역을 침수 미발생 구역으로 모의하기 때문이다. 그러나 PIML 보정을 순차 적용한 하이브리드 모형은 강우-유출 기반의 기초 물리모형 결과를 입력으로 받아 홍수위험지도의 제방 파제와 같은 극한 시나리오의 침수 양상을 AI가 학습하여 추론함으로써 첨두홍수위의 공간적 분포를 효과적으로 모의하였다. 이를 통해 물리 모형 대비 평가지표가 크게 향상되었으며, 100년 빈도 기준 실제 위험 지역의 약 93%를 성공적으로 탐지해냈다. 이는 간단한 물리 모형을 기반으로 하더라도 2-Phase PIML 보정을 통해 빈도별 홍수위험지도와 상당히 유사한 수준의 공간적 분포를 재현할 수 있음을 입증한다.
본 연구에서는 모형의 시간적 오차와 공간적 오차를 분리하여 순차적으로 보정하는 새로운 2-Phase PIML 보정 방법을 개발하고, 그 실효성을 정량적으로 검증하였다. 특히 빈도별 시나리오 강우량만으로도 격자단위의 첨두 침수심을 모의할 수 있는 가능성을 제시하였다. 그러나 본 연구에서 제시하는 공간적 보정에 대한 목표 변수로 시나리오별 강우에 대한 첨두 침수심만을 활용했기 때문에, 실제로 시간단위로 변화하는 유출의 양상을 올바르게 나타내는 것은 한계가 있었다. 이러한 한계점은 추후 연구에 중요 주제로 다뤄야할 부분으로, 공간적 보정을 위한 자료로 레이더 강우량 등과 같이 시간 단위로 적용 가능한 공간 자료를 확보하여 보정하는 과정을 필요로 하는 것으로 판단된다. 또한, 추후 연구에서는 본 연구에서 적용한 단일 표준유역에 국한하지 않고 더 넓거나 다양한 지역에 적용하여 범용성에 대한 검증이 필요하다.
감사의 글
이 논문은 한국전자통신연구원 연구운영비지원사업(기본사업) 도시 극한호우 대응 플랫폼 기술개발과제(25ZR1300)의 논문입니다.