J. Korean Soc. Hazard Mitig Search

CLOSE


J. Korean Soc. Hazard Mitig. > Volume 25(5); 2025 > Article
생성형 적대 신경망(GAN)을 활용한 대청댐 유입량 시계열 데이터 증강의 적용성 검토

Abstract

This study examined the effectiveness of time-series data augmentation using a Generateve Adversarial Network (GAN) in predicting inflow to the Daecheong Dam. A total of 3,287 observation records from 2013 to 2021, including dam inflow and meteorological, hydrological, and hydraulic variables, were used as the training data. In addition, 1,096 synthetic samples were generated using the GAN, resulting in 4,383 training samples. A multilayer perceptron (MLP) was applied to predict the 2022 inflow, and model performance was evaluated using the mean squared error (MSE). The results showed that the MSE decreased significantly from 6,975.97 (m3/s)2 when usign only observation data to 3,440.20 (m3/s)2 when GAN-augmented data were included. These findings indicate that GAN-based time-series data augmentation can enhance the prediction stability during data-scarce flood periods and suggest its potential applicability in the field of water resource management.

요지

본 연구는 생성형 적대 신경망(Generative Adversarial Network, GAN)을 활용한 시계열 데이터 증강 기법을 대청댐 유입량 예측에 적용하여 효과를 검토하였다. 2013년부터 2021년까지의 대청댐 유입량 및 관련 기상, 유량 및 수위 자료 총 3,287건을 학습 데이터로 사용하고, GAN을 통해 추가로 1,096건의 합성 데이터를 생성함으로써 최종 4,383건의 학습 데이터를 확보하였다. 이후 2022년 대청댐 유입량 예측을 위해 Multi-Layer Perceptron (MLP)을 적용하였으며, 학습 및 예측 성능은 평균제곱오차(MSE)로 평가하였다. 그 결과, GAN으로 증강한 데이터를 포함했을 때의 예측 MSE는 3440.20 (m3/s)2로, 원본 데이터만 사용했을 때의 MSE인 6975.97 (m3/s)2에 비해 크게 향상되었다. 본 연구를 통해 GAN을 활용한 시계열 데이터 증강이 데이터가 부족한 홍수기에 대한 예측 안정성을 높이고, 이를 바탕으로 수자원 분야에서의 활용 가능성을 검토할 수 있을 것으로 기대된다.

1. 서 론

최근 기후변화로 인해 전 세계적으로 국지성 집중호우 및 극한 강우의 빈도와 강도 증가는 추세이며, 이에 따라 수자원 시스템의 예측 및 관리에 있어 점점 더 높은 정밀도를 요구하고 있다. 특히, 홍수기에는 댐 유입량이 급격히 변동하므로 이를 정확히 예측하는 기술은 방재 전략 수립과 댐 운영의 핵심 요소로 작용한다(Hakim et al., 2024). 그러나 홍수기에는 극단적인 수문 현상이 자주 발생함에도 불구하고, 해당 시기의 관측자료는 한정적이어서 예측 모델 학습에 필요한 충분한 데이터를 확보하기 어렵다. 이러한 데이터 부족 문제는 딥러닝 기반 예측 모델의 일반화 능력을 저해하고 예측 정확도에 큰 영향을 미친다(Wen et al., 2020).
이러한 한계를 보완하기 위해 데이터 증강 기술이 주목받고 있다. 데이터 증강 기법은 크게 단순 변형 기반 기법, 통계 및 모형 기반 기법 그리고 딥러닝 기반 기법으로 분류할 수 있다(Wen et al., 2020). 단순 변형 기반 증강 기법은 노이즈 추가, 스케일 변경, 구간 자르기 등과 같이 원본 데이터를 단순하게 변형하는 기법이다. 단순 변형 기반 증강 기법은 구현이 간단하고 계산 비용이 낮으며, 데이터를 손쉽게 증강할 수 있다(Forestier et al., 2017; Um et al., 2019). 하지만 수문자료는 비선형적이며 시간 종속성을 갖기 때문에 단순 변형으로는 홍수기와 같은 극한 상황을 효과적으로 재현하기 어렵고, 따라서 예측 성능 향상 효과가 제한적이다(Wen et al., 2020).
통계 및 모형 기반 기법은 물리 모형이나 통계적 분포를 활용하여 현실성 있는 확률적 특성과 극단치 분포를 반영할 수 있다는 장점이 있다(Wilks, 1999; Bárdossy and Pegram, 2009; Esteban et al., 2017). 그러나 모형의 단순화로 인해 실제 현상의 복잡성을 충분히 재현하기 어렵고, 관측자료가 부족한 경우 매개변수 보정의 한계로 인해 오차가 누적될 수 있다(Smith and Smith, 2020).
이에 따라 딥러닝 기반 기법이 시계열 예측 분야에서도 점차 활용되고 있다(Wen et al., 2020; Wu et al., 2020; Yang et al., 2022). 딥러닝 기반 기법은 비선형적 상관관계와 시계열의 시간 종속성을 학습하여 복잡한 수문 특성을 효과적으로 재현할 수 있다. 그러나 극한 이벤트의 재현력이 제한적이거나 학습 안정성 측면에서 한계를 보이기도 한다(Wen et al., 2020).
최근 들어 학습 기반 생성 기법의 하나인 생성형 적대 신경망(Generative Adversarial Network, GAN)이 다양한 분야에서 특히 주목받고 있다(Goodfellow et al., 2014; Arjovsky et al., 2017). GAN은 생성기(Generator)와 판별기(Discriminator)의 경쟁 구조를 통해 실제와 유사한 고차원 분포의 데이터를 생성할 수 있으며, 시계열의 시간적 종속성과 비선형적 특성까지 효과적으로 반영할 수 있다는 점에서 단순 변형 기반의 증강 기법보다 뛰어난 확장성과 예측 안정성을 제공한다(Tanaka and Aranha, 2019; Smith and Smith, 2020).
본 연구에서는 홍수기와 같이 시계열 데이터가 부족한 시기에 발생하는 예측 불확실성을 해소하고자, 생성형 적대 신경망(GAN)을 활용하여 대청댐 유입량 예측을 위한 시계열 학습 데이터를 증강하고, 딥러닝 예측 모델의 성능 향상을 실증적으로 검토하였다. 기존의 댐 유입량 예측 연구들은 댐 운영을 목적으로 다양한 Lead time 설정을 전제로 진행되어 왔다(Wu et al., 2020; Hakim et al., 2024). 그러나 본 연구에서는 GAN 기반 데이터 증강 기법이 예측 모델의 성능에 미치는 영향을 평가하는데 초점을 두기 때문에 Lead time보다는 증강 기법의 효과 자체를 검증하는데 연구범위를 한정하였다.
MLP 학습을 위해 2013년부터 2021년까지의 관측자료 총 3,287건을 기반으로 GAN을 통해 1,096건의 증강 데이터(Augmented Data)를 생성하였다. 이를 포함하여 총 4,383건의 학습 데이터를 구성하여 다층 퍼셉트론(Multi Layer Perceptron, MLP) 모델을 학습시켰으며, 예측 대상은 2022년 유입량으로 설정하였다. 예측 성능은 평균제곱오차(Mean Squared Error, MSE), 평균제곱근오차(Root Mean Squared Error, RMSE), Nash-Sutcliffe Efficiency (NSE)를 활용하여 정량적으로 평가하였다.

2. 연구 방법

2.1 GAN의 구조

본 연구에서는 관측 자료가 부족한 홍수기의 데이터를 보완하기 위해 생성형 적대 신경망(Generative Adversarial Network, GAN)을 활용한 데이터 증강 기법을 적용하였다. GAN은 두 개의 신경망, 즉 생성기와 판별기로 구성되며, 이들이 상호 경쟁적으로 학습함으로써 실제 데이터와 유사한 고차원 분포의 데이터를 생성하는 비지도 학습 모델이다(Goodfellow et al., 2014).
생성기는 무작위 노이즈 벡터를 입력으로 받아 실제 관측 자료와 유사한 시계열 데이터를 생성하고, 판별기는 주어진 데이터가 실제인지 혹은 생성된 것인지를 판별한다. 이 두 네트워크는 반복 학습을 통해 서로의 성능을 향상시키며, 결과적으로 판별기가 실제와 구분하기 어려운 수준의 합성 데이터를 생성하도록 유도된다.
Fig. 1은 GAN의 데이터 증강 구조를 시각적으로 나타낸 개념도로, 생성기에서 생성된 데이터와 실제 데이터를 비교하여 판별기가 학습하고, 이를 통해 최종적으로 증강 데이터가 구축되는 과정을 도식화한 것이다.
Fig. 1
Conceptual Diagram of Generative Adversarial Network (GAN) for Data Augmentation
kosham-2025-25-5-241-g001.jpg

2.2 데이터 구성

본 연구에서는 2013년부터 2021년까지의 대청댐 유입량 및 관련 기상⋅수문 자료를 수집하였다. 모형의 입력 변수는 대청댐 유역 평균 강우량, 남대천 여의교, 초강천 심천교, 보청천 산계교, 금강 양강교의 수위 그리고 용담댐 방류량으로 구성되었으며, 출력 변수는 대청댐 유입량으로 설정하였다. 총 3,287건의 일 단위 자료가 학습자료로 활용되었다. 유역 평균 강우량은 Thiessen 다각형 기법을 활용하여 산정하였으며, Fig. 2는 대정댐 유역의 각 관측소 위치와 Thiessen 구역을 시각적으로 제시한 것이다.
Fig. 2
Study Basin Maps and Observation Station Layouts (Lee, 2024)
kosham-2025-25-5-241-g002.jpg

2.3 GAN을 활용한 데이터 증강

MLP 학습 모델의 입력자료를 확장하기 위해, 본 연구에서는 2020년 관측 데이터를 기반으로 생성형 적대 신경망(GAN)을 활용한 시계열 데이터 증강을 수행하였다.
GAN의 주요 하이퍼파라미터로는 Latent Space, Epoch, Batch Size가 있다. Latent Space는 생성기의 입력으로 사용되는 무작위 노이즈 벡터의 차원을 의미하며, 생성 데이터의 다양성에 직접적인 영향을 미치는 핵심 요소이다. Batch Size는 한 번의 학습 반복에서 처리되는 데이터 샘플의 수를 의미하고, Epoch는 학습 반복 횟수를 나타낸다.
일반적으로 Latent Space는 최대 512까지 설정하는 것이 보통이며, pytorch GAN 튜토리얼에서는 100을 권장하고 있다. 하지만 본 연구에서는 7개의 수문학적 입력 변수를 동시에 학습해야 하므로 생성 데이터의 다양성을 극대화하기 위해 Latent Space를 100에서 1,000까지 변화시키며 민감도 분석을 수행하였다. 민감도 분석은 Latent Space 값에 따라 대청댐 유입량 예측의 MSE 값으로 비교하였다. 민감도 분석 결과는 Table 1로 정리하였다.
Table 1
Sensitivity Analysis Results for Latent Space Size
Latent Space Value MSE
100 4,987.38
200 3,849.64
300 4,047.72
400 4,917.02
500 4,402.42
600 6,455.86
700 3,440.20
800 4,492.26
900 5,413.13
1,000 12,033.51
민감도 분석 결과, Latent Space를 700으로 설정했을 때 MSE가 가장 낮게 나타났으므로 최종적으로 Latent Space를 700으로 확정하였다 Batch Size의 경우 한 달을 기준으로 학습할 수 있도록 30으로 설정하였다. Epoch는 pytorch GAN 튜토리얼에서 제안한 10으로 설정하였다.
생성기(G)와 판별기(D)의 활성화 함수로는 ReLU (Rectified Linear Unit)를 적용하였으며, 판별기 및 전체 GAN의 손실함수는 Binary Crossentropy로 정의하였다. 옵티마이저로는 Adam을 사용하였다. GAN 구성에 사용된 주요 매개변수는 Table 2에 정리하였다.
Table 2
GAN Parameter
Parameters Value
Latent Space 700
Epochs 10
Batch Sizes 30
G Hidden Layers 3
Number of G Hidden Layer Nodes 20
D Hidden Layer 1
Number of D Hidden Layer Nodes 20

2.4 예측 모델 구성

대청댐 유입량 예측을 위해 본 연구에서는 MLP를 적용하였다. MLP는 활성화 함수로 tanh를 적용하였으며, 옵티마이저로는 Adam, 손실함수로는 MSE를 설정하였다.
Epoch 수는 민감도 분석을 통해 결정하였고, 최종적으로 10,000회로 설정하였다. 모델 구조는 은닉층(hidden layer) 2개로 구성되었으며, 각 은닉층의 노드는 10개로 구성하여, 모델 복잡도를 제한하면서도 시계열 예측에 필요한 비선형성을 확보하였다. MLP 구성에 사용된 주요 하이퍼파라미터는 Table 3에 정리하였다.
Table 3
MLP Parameter
Parameters Value
Epochs 10,000
Hidden Layers 2
Number of Hidden Layer Nodes 10
GAN을 통한 데이터 증강이 딥러닝 예측 성능에 미치는 영향을 평가하기 위해, 본 연구에서는 GAN 생성 데이터를 포함한 학습자료를 활용한 경우와 관측자료만을 활용한 경우의 예측 결과를 비교 분석하였다. Fig. 3은 GAN으로 생성된 증강 데이터를 활용한 MLP 학습자료 구축 과정을 그림으로 나타낸 것이다.
Fig. 3
Concept of Consturcted Training Data for MLP
kosham-2025-25-5-241-g003.jpg
Fig. 3에 따르면, 본 연구에서는 MLP를 위한 학습자료는 2가지로 나뉘며, 관측자료만을 사용한 Basic Model과 관측자료에 생성 데이터(Generated data)를 추가한 Augmented Model이다. 생성 데이터는 GAN을 통해 생성된 증강 데이터 중 일부를 선택하여 구축한다.
본 연구에서는 GAN을 통해 생성된 증강 데이터 1,800건 중 1,096건을 선택하여 생성 데이터를 구축하였다. GAN을 통해 생성된 1,800건의 증강 데이터를 모두 사용하면 관측자료의 약 55%에 해당하며, 이 경우 학습 과정에서 증강 데이터의 비중이 과도하게 높아져 실제 수문 환경을 왜곡할 가능성이 있다. 따라서 실제 수문 환경 왜곡을 저감하기 위해서 관측자료의 약 33%에 해당하는 1,096건을 선별하여 MLP의 학습자료를 구축하였다.
이를 통해 GAN 기반 시계열 데이터 증강이 MLP 예측 모델의 성능에 미치는 영향을 검토하고, 해당 기법의 수문 예측 모델링 적용 가능성을 평가하였다. 일반적인 예측 모델에서는 Lead time에 대한 고려가 필요하나 데이터 증강 기법의 효과는 동시 시점 예측만으로도 충분이 평가할 수 있다(Wen et al., 2020). 이에 따라 본 연구에서는 Lead time을 설정하지 않았다.

3. 연구 결과

3.1 GAN 생성 데이터

GAN을 활용하여 2020년 대청댐 유역의 유입량 및 수문 자료를 기반으로 시계열 데이터를 증강한 결과, 변수별로 1,800개의 합성 시계열 데이터가 생성되었다. Fig. 4는 데이터 증강 대상인 2020년 관측값과 GAN으로 생성된 데이터 간의 비교 결과를 변수별로 시각화한 것이다.
Fig. 4
GAN Augmented Data Results
kosham-2025-25-5-241-g004.jpg
Fig. 4를 살펴보면 변수별 시계열 패턴을 확인한 결과, 생성된 데이터는 실제 관측값과 유사한 추세 및 첨두 시점의 특성을 반영한 것으로 나타났다. 특히 대청댐 유입량(Fig. 4(a)), 대청댐 평균 강우량(Fig. 4(b)), 여의교(Fig. 4(c)), 심천교(Fig. 4(d)), 산계교(Fig. 4(e)), 양강교(Fig. 4(f))의 수위, 용담댐 방류량(Fig. 4(g)) 등 모든 변수에서 관측 데이터와 유사한 첨두 형상과 변동성을 재현하였다. 이는 GAN 학습 과정에서 각 관측자료의 분포특성을 학습하였기 때문이다. GAN은 노이즈 벡터를 통해 입력된 자료의 분포특성을 학습하게 된다. GAN 수문 데이터를 입력하여 수문 데이터의 시계열 특성을 학습할 수 있었으며, 이를 통해 관측 데이터와 유사한 첨두 형상과 변동성을 재현할 수 있었다.
또한, GAN을 통해 생성된 생성 데이터는 기존 관측 데이터 대비 약 5배 이상의 데이터양을 제공하였으며, 이는 학습에 활용 가능한 시계열 샘플의 다양성을 크게 확대하였다. 시계열 구조를 유지하면서도 새로운 패턴을 포함하는 데이터가 생성됨에 따라, 이후 예측 모델 학습 시 과적합을 방지하고 일반화 성능을 향상에 기여할 수 있을 것으로 판단된다.
이러한 결과는 GAN이 대청댐 유입량 예측을 위한 시계열 데이터의 분포적 특성과 시간적 상관관계를 효과적으로 학습하여, 해당 목적에 적합한 합성 데이터를 생성할 수 있는 것으로 볼 수 있다.

3.2 대청댐 유입량 예측 결과

관측자료만 사용하여 학습한 경우(Basic Model)와 GAN 생성 데이터를 포함하여 학습한 경우(Augmented Model)의 예측 결과를 Table 4로 제시하였고, Fig. 5는 Basic Model과 Augmented Model의 전기간 및 홍수기의 결과를 그래프로 나타내었다. Table 4는 두 경우의 MSE, RMSE, NSE와 함께, 전체 예측 기간 동안의 관측 첨두값과 각각의 예측 첨두값 간 차이를 비교한 결과를 나타낸다. Fig. 5(a)는 전체 예측 기간에 대한 시계열 예측 결과를, Fig. 5(b)는 홍수기(6월~9월) 기간에 해당하는 예측 결과를 시각화한 것이다.
Table 4
Results of Daecheong Dame Inflow Prediction
Error Basic Model Augmented Model
MSE ((m3/s)2) 6,975.97 3,440.20
RMSE (m3/s) 83.522 58.653
NSE 0.518 0.762
Diffence from Peak Oberved Value (m3/s) 803.951 -41.565
Fig. 5
Results of Daecheong Dame Inflow Prediction
kosham-2025-25-5-241-g005.jpg
Table 4를 통해 살펴보면, Basic Model의 MSE는 6,975.97 (m3/s)2으로 나타났으며, Augmented Model의 MSE는 3,440.20 (m3/s)2로 Basic Model보다 50% 더 낮은 값을 보였다. 이는 첨두값의 예측에서 GAN 기반 데이터 증강이 효과적임을 보여준다.
RMSE를 통해 첨두값을 포함한 전반적인 오차를 살펴보면, Basic Model에서는 RMSE가 83.522 m3/s로 나타났으며, Augmented Model에서는 RMSE가 58.653 m3/s로 나타났다. 따라서 GAN 기반 데이터 증강을 통해 대청댐 유입량 예측의 전반적인 정확도가 향상된 것으로 분석된다.
NSE 분석에서도 Basic Model은 0.518, Augmented Model은 0.762로 나타나, GAN 기반 데이터 증강이 MLP의 전체 유량 패턴 재현 성능을 개선한 것으로 확인되었다. 이러한 결과는 GAN 기반 데이터 증강이 예측 성능 향상에 긍정적인 영향을 줄 가능성이 있음을 보여준다.
마지막으로 첨두 유입량의 추정값을 비교한 결과, Basic Model은 관측값 대비 803.951 m3/s의 차이를 보였으나, Augmented Model은 -41.565 m3/s의 차이를 보여, GAN 기반 데이터 증강이 첨두 오차를 현저히 저감할 수 있는 것으로 나타났다.
Fig. 5(a)를 보면, 유입량이 증가하는 구간에서 Augmented Model은 일부 과대 추정 경향을 보였으나, 대부분 구간에서 Basic Model보다 더 정확한 예측 결과를 나타냈다. Fig. 5(b)에서는 첨두 유입량이 발생한 8월~9월 기간 동안 Basic Model은 NSE가 0.518 정도로 나타나 관측값에 비해 전반적으로 작게 추정하였으며, 첨두구간에서 MSE 및 RMSE가 6,975.97 (m3/s)2 및 83.522 m3/s로 나타나 첨두에서 관측값과의 차이가 803.951 m3/s로 나타났다. 반면, Augmented Model은 NSE가 0.762 정도로 나타나 관측값에 근사하게 추정하였으며, 첨두구간에서 MSE 및 RMSE가 3,440.20 (m3/s)2 및 58.653 m3/s로 나타나 첨두에서 관측값과의 차이가 -41.565 m3/s로 나타나 예측 정확도가 더 우수한 것으로 확인되었다.
Basic Model은 전체적인 유입량의 흐름을 반영하는 데에는 일정 수준의 성능을 보였으나, 첨두 유입량에 대해서는 과소 추정 경향이 뚜렷하였다. 이는 관측 자료의 부족과 첨두 사례의 희소성이 학습 과정에 영향을 미친 결과로 해석된다. 반면, Augmented Model은 GAN이 생성한 다양한 시계열 패턴을 학습에 포함함으로써 첨두 구간에서도 비교적 안정된 예측 성능을 나타낸 것으로 판단된다.
특히, Fig. 5에서 확인되는 바와 같이, Augmented Model은 유입량이 급격하게 변동하는 지점에서 예측 정확도가 높은 것으로 나타났으며, 이는 시계열 데이터 내 비선형적 특성이나 극단값 분포를 보다 풍부하게 학습한 결과로 해석될 수 있다. 이러한 점은 데이터 증강이 예측의 정확도 향상에도 기여할 수 있음을 나타낸다.
또한, 본 연구에서는 Lead time을 고려하지 않은 동시 예측을 수행하였음에도 불구하고, GAN 기반 증강 데이터가 MLP의 예측 성능을 향상시켰음을 평가지표를 통해 확인되었다.

4. 결 론

본 연구에서는 GAN을 활용하여 대청댐 유입량 예측을 위한 시계열 데이터를 증강하고, 이를 MLP 예측 모델에 적용하여 예측 성능 향상을 검토하였다. 2013년부터 2021년까지 수집된 유입량 및 기상⋅수문 데이터를 기반으로, 3,287건의 관측자료와 GAN을 통해 생성된 1,096건의 합성 데이터를 포함하여 총 4,383건의 학습자료를 구성하였으며, 이를 바탕으로 2022년 홍수기 유입량을 예측하였다.
예측 결과, 관측자료만을 사용한 Basic Model의 경우 MSE는 6,975.970 (m3/s)2으로 나타났으며, GAN 합성 데이터를 포함한 Augmented Model의 경우 MSE가 3,440.201 (m3/s)2으로 나타났다. 이를 통해 첨두값에서 Augmented Model이 Basic Model보다 약 50% 수준의 오차 개선 효과를 확인할 수 있었다. 또한 RMSE와 NSE로 두 모델의 차이를 확인해본 결과 Basic Mdoel의 RMSE와 NSE가 각각 83.522 m3/s, 0.518이며, Augmented Model의 RMSE와 NSE가 각각 58.653 m3/s, 0.762로 확인되어 전반적으로 Augmented Mdoel이 오차가 작게 나타났다.
첨두 유입량에서 관측값과의 오차가 Augmented Model이 -45.565 m3/s로 나타났고 Basic Model은 803.951 m3/s로 나타나, Augmented Model이 Basic Model보다 첨두 유입량을 정확하게 재현하였으며, 전체 예측 구간에서 실제 관측값과의 오차를 감소시켰다. 이러한 결과는 GAN 기반 시계열 데이터 증강이 학습 데이터가 부족하거나 변동성이 큰 홍수기에서도 예측 모델의 안정성과 일반화 성능을 향상시키는데 유효한 것을 확인할 수 있었다.
또한, Lead time을 고려하지 않은 GAN 기반 데이터 증강의 효과를 검증하여, 증강 기법 자체가 예측 성능을 유의하게 향상시킬 수 있음을 확인하였다. 다만, 실제 댐 운영 및 홍수 예보에 적용하기 위해서는 다양한 Lead time 조건을 고려할 필요가 있으므로, 이에 따른 효과 검토가 필요하다.
본 연구의 결과는 홍수기 댐 유입량의 첨두 예측을 개선함으로써 방류 계획 및 수위 조절 전략 수립에 기여할 수 있으며, 관측 자료가 부족한 유역이나 신규 댐 운영에서도 데이터 보완 수단으로 활용될 수 있다. 또한, 합성 데이터를 활용한 다양한 학습 시나리오 구성은 예측 모델의 민감도 분석과 불확실성 평가를 지원하여, 모델 설계와 성능 검증을 보완하는 데 유용하다.
본 연구에서는 Batch Size를 수문 자료의 해석 기간에 맞추어 30으로 설정하였다. 그러나 Batch Size가 64, 128 등으로 설정하는 경우 다른 결과가 나타날 수 있으므로 Batch Size를 각각 64, 128로 설정하는 경우에 대한 결과를 산출하여 Table 5에 정리하였다. 모의 결과 기존 Batch Size를 30으로 설정한 경우가 가장 오차가 작게 나타났다. 해당 결과를 통해 30일 Batch Size가 본 연구의 조건에서는 가장 적합한 것으로 판단된다. 다만, 분석 대상이나 자료 특성에 따라 다른 Batch Size 값이 더 유리할 수 있으므로, 향후 다양한 조건에 대한 검토가 필요하다.
Table 5
Results of Daecheong Dame Inflow Prediction
Error Batch Size
30 64 128
MSE ((m3/s)2) 3,440.20 5,036.15 4,386.311
RMSE (m3/s) 58.653 70.966 66.229
NSE 0.762 0.652 0.697
Diffence from Peak Oberved Value (m3/s) -41.565 516.273 300.252
향후에는 다양한 수문 변수 및 공간⋅시간 범위를 고려한 GAN 기반 데이터 증강 기법의 확장성과 적용 가능성에 대한 추가 연구를 통해, 수자원 관리 및 홍수 예측의 정밀도 향상에 실질적인 기여를 할 수 있을 것으로 기대된다. 아울러, 생성 데이터의 학습 반영 비율에 따른 예측 성능의 민감도 분석과 같은 정량적 기준을 마련하는 연구도 병행될 필요가 있다. 더 나아가, 다양한 GAN 변형 기법을 수문 자료 증강에 적용하여 비교⋅평가함으로써, 보다 적합한 증강 기법을 선정하는 연구도 수행할 수 있을 것이다.

감사의 글

이 논문은 환경부의 재원으로 한국환경산업기술원의 도시홍수시설의 계획, 운영, 유지관리 최적화 기술개발사업의 지원을 받아 수행되었음(No. RS-2024-00398012).

References

1. Arjovsky, M, Chintala, S, and Bottou, L (2017) Wasserstein GAN. Proceedings of the 34th International Conference on Machine Learning (ICML), Vol. 70, pp. 214-223.

2. Bárdossy, A, and Pegram, G.G.S (2009) Copula based multisite model for daily precipitation simulation. Hydrology and Earth System Sciences, Vol. 13, No. 12, pp. 2299-2314.
crossref
3. Esteban, C, Hyland, S.L, and Rätsch, G (2017) Real-valued (medical) time series generation with recurrent conditional GANs. arXiv preprint arXiv, Vol. 1706, pp. 02633.

4. Forestier, G, Petitjean, F, Dau, H.A, Webb, G.I, and Keogh, E (2017) Generating synthetic time series to augment sparse datasets. Proceedings of the IEEE International Conference on Data Mining (ICDM), pp. 865-870.
crossref
5. Goodfellow, I, Pouget-Abadie, J, Mirza, B, Xu, B, Warde-Farley, D, and Ozair, S (2014) Generative adversarial nets. Advances in Neural Information Processing Systems (NeurIPS), pp. 27.

6. Hakim, D.K, Gernowo, R, and Nirwansyah, A.W (2024) Flood prediction with time series data mining:Systematic review. Natural Hazards Research, Vol. 4, No. 2, pp. 194-220.
crossref
7. Lee, W.J (2024). Improvement of multi layer perceptron using adaptive moment and harmony search:Focused on daechung dam inflow prediction. Master's thesis. Chungju, Korea: Chungbuk National University.

8. Smith, K.E, and Smith, A.O (2020) Conditional GAN for time series generation. arXiv preprint arXiv, 2006) pp. 16477.

9. Tanaka, F.H.K.D.S, and Aranha, C (2019) Data augmentation using generative adversarial networks for time series classification. Proceedings of the International Conference on Artificial Neural Networks (ICANN), pp. 653-664.

10. Um, T.T, Pfister, F.M.J, Pichler, D, Endo, S, Lang, M, Hirche, S, and Fietzek, U (2019) Data augmentation of wearable sensor data for Parkinson's disease monitoring using convolutional neural networks. Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies (IMWUT), Vol. 3, No. 3, pp. 1-23.
crossref
11. Wen, Q, Sun, L, Yang, F, Song, X, Gao, J, Wang, X, and Xu, H (2020) Time series data augmentation for deep learning:A survey. arXiv preprint arXiv, Vol. 2002, pp. 12478.
crossref
12. Wilks, D.S (1999) Multisite downscaling of daily precipitation with a stochastic weather generator. Climate Research, Vol. 11, No. 2, pp. 125-136.
crossref
13. Wu, C, Chen, L, Wang, G, Chai, S, Jiang, H, Peng, J, and Hong, Z (2020) Spatiotemporal scenario generation of traffic flow based on LSTM-GAN. IEEE Access, Vol. 8, pp. 186191-186198.
crossref
14. Yang, Z, Nai, W, Li, D, and Xing, Y (2022) Water quality classification for inland lakes and ponds with few color image samples based on Triple-GAN and CSNN. Mathematical Problems in Engineering, Vol. 2022, No. 1, pp. 2713386.
crossref pdf
TOOLS
Share :
Facebook Twitter Linked In Google+ Line it
METRICS Graph View
  • 0 Crossref
  •    
  • 451 View
  • 7 Download


ABOUT
ARTICLE CATEGORY

Browse all articles >

BROWSE ARTICLES
AUTHOR INFORMATION
Editorial Office
1014 New Bldg., The Korea Science Technology Center, 22 Teheran-ro 7-gil(635-4 Yeoksam-dong), Gangnam-gu, Seoul 06130, Korea
Tel: +82-2-567-6311    Fax: +82-2-567-6313    E-mail: master@kosham.or.kr                

Copyright © 2026 by The Korean Society of Hazard Mitigation.

Developed in M2PI

Close layer
prev next