1. Introduction
복잡한 하천 수계에서의 수자원 안보 관리는 유해 조류 대발생(harmful algal blooms)의 예측 불가한 발생으로 인해 지속적인 한계를 보이고
있다(Feng et al., 2024). 이러한 문제는 대전광역시 도심부를 관통하여 금강 본류로 유입되는 갑천 유역에서 특히 두드러지게 나타난다(Kim et al., 2021). 갑천 유역은 고도로 도시화된 지역과 광범위한 농업 지대가 혼재하는 전이 경관으로 특징을 가지며, 다양한 점오염원 및 비점오염원이 지속적으로 유입되는
구조이다(Shiferaw et al., 2025). 이러한 지리적 특성으로 인해 갑천에서는 부영양화와 고농도 Chl-a 현상이 반복적으로 나타나는 것으로 보고되어 왔다(Kim et al., 2019). 조류 대발생은 수체 내 용존산소 고갈 및 남세균 독소 방출을 유발하여 지역 수질을 심각하게 저해한다(Zhang et al., 2022). Chl-a 농도는 하천의 부영양화 및 조류 발생 정도를 나타내는 정량적 지표로서, 조기 경보 시스템 구축을 위한 고정밀 시계열 예측이 요구되는
핵심 변수이다(Qian et al., 2024).
수질 모의를 위해 전통적으로 물리 기반의 과정 모형이 활용되어 왔다(Gao and Li, 2014; Özdoğan-Sarıkoç and Dadaser-Celik, 2024). 이러한 접근법은 매개변수의 불확실성 및 높은 계산 비용으로 인해 생물학적⋅물리화학적 인자 간의 비선형적 상호작용을 포착하는 데 근본적인 한계가
있다(Khorashadi Zadeh et al., 2022). 기존 연구들에서는 수질에 영향을 미치는 다양한 생물학적⋅물리적⋅지구화학적 요인을 충분히 반영하기 어렵다는 한계가 지적되어 왔다(Chidiac et al., 2023). 대안으로 recurrent neural network (RNN) 계열의 딥러닝 아키텍처가 복잡한 수질 동태 모델링에 적극 도입되고 있다(Aslan et al., 2022). 특히 long short-term memory (LSTM) 및 gated recurrent unit (GRU)는 연속적인 수문학적 시계열 자료
내의 복잡한 시간 의존성 포착에 우수한 적합성을 나타내며 조류 발생 예측 연구에 폭넓게 활용되고 있다(Waqas and Humphries, 2024; Yussof et al., 2021). 그러나 기존 AI 기반 조류 예측 연구는 평균적 조건의 재현에 주로 초점을 두는 경향이 있어, 관리적으로 중요한 고농도 구간의 예측 정확도 향상에는
여전히 한계를 보인다(Lee et al., 2026). 특히 기존 연구들은 전체 오차의 최소화에 초점을 두는 경우가 많아, 실제 관리 현장에서 중요한 급격한 상승 구간과 고농도 피크의 재현성은 상대적으로
충분히 검토되지 않은 경우가 많다(Park, 2022). 우수한 예측 성능에도 불구하고, 데이터 기반 모형의 실질적 효용성은 현장 취득 원시 자료의 구조적 완전성 및 분포 특성에 의해 근본적으로 제약된다(Liu et al., 2025).
현장 취득 수문학적 자료에는 확률론적 노이즈, 센서 오작동, 동절기 결측 등 불연속적인 모니터링 구간이 불가피하게 포함된다(Houénafa et al., 2025). 장기 결측 구간의 단순 보간은 심각한 시간적 왜곡을 유발하여 시계열 모형의 학습 과정을 왜곡할 수 있다(Che et al., 2024). 환경 모델링 분야에서는 불균형 회귀 문제(imbalanced regression problem)가 고질적으로 문제시된다(Zhi et al., 2024). 수질 자료는 일반적으로 저농도 배경 조건이 지배적인 롱테일 분포를 나타내는 반면, 관리 측면에서 핵심 대상인 고농도 Chl-a 사례를 구성한다(Lin et al., 2023). 표준 회귀 알고리즘은 root mean squared error (RMSE)와 같은 전역 오차 지표의 최소화에 최적화되어, 극단 사례의 크기를
체계적으로 과소 추정하는 조건부 왜곡이 발생하는 것으로 알려져 있다(Wang et al., 2025).
이러한 한계를 완화하면서도 수문 시계열의 물리적 연속성을 훼손하지 않기 위해서는 적절한 전처리와 학습 전략의 도입이 필요하다(Kermorvant et al., 2021). Local outlier factor (LOF) 알고리즘은 밀도 기반 국소 이상 탐지 기법으로, 전역 이상치 탐지 방식과 달리 각 데이터 포인트의
국소 이웃 밀도를 기준으로 이상치를 식별한다(Yang et al., 2020). 유효한 계절적 생지화학적 극값을 보존하면서 불량 센서 이상치를 정밀하게 제거하는 데 적합한 것으로 알려져 있다(Kermorvant et al., 2021). 한편, 시계열 예측에서의 불균형 회귀 문제 완화를 위해서는 엄격한 시간적 연속성을 유지하는 접근법이 요구된다(Zheng et al., 2025). 선행 연구에서는 synthetic minority over-sampling technique for regression with gaussian
noise (SMOGN) 과 같은 합성 데이터 생성 기법이 목표 변수의 분포 균형화에 시도된 바 있다(Branco et al., 2019). 이러한 보간 방법은 순차적 자료의 물리적 연속성을 의도치 않게 변질시킬 우려가 있다(Fotias and Gaganis, 2023). 이에 본 연구에서는 시그모이드 가중 함수(sigmoid weighting function) 를 적용하는 비용 민감 학습(cost-sensitive
learning) 프레임워크를 도입하여, 고농도 구간에서 발생하는 예측 오차에 더 큰 페널티 가중치를 부여하는 방식을 설계하였다. 이러한 가중치 조정은
역전파 단계에서 신경망이 심각한 고농도 Chl-a 사례를 명시적으로 우선 학습하도록 유도하여, 인공적 관측값 합성 없이도 극단 사례 탐지 능력을 향상시킬
수 있을 것으로 기대된다(Martín-Suazo et al., 2024).
본 연구에서는 갑천 유역의 Chl-a 농도 정밀 예측을 위한 강인하고 연속적인 딥러닝 프레임워크를 개발하였다: (1) LOF 알고리즘 기반 전처리를
통한 데이터 무결성 확보, (2) 직전 7일간의 연속 관측자료를 입력으로 사용하여 다음 시점의 Chl-a 농도를 예측하는 결측 인식 3차원 텐서 구성,
(3) 비용 민감 학습 프레임워크를 결합한 LSTM 및 GRU 아키텍처의 예측 성능 비교 분석의 세 단계를 체계적으로 수행하였다. 본 연구의 핵심적
기여는 목표 지향적 가중치 전략이 고농도 구간의 예측 성능 향상에 기여할 수 있는지를 평\데 있다. 또한 예측 모형의 물리적 해석 가능성 확보를 위해
순열 특성 중요도(permutation feature importance) 분석을 통해 급성 부영양화 동태를 지배하는 생지화학적 주요 인자를 비교하였다.
2. Materials and Methods
2.1 연구대상 지역 및 데이터 구축
본 연구의 대상 지역으로는 금강의 주요 지류인 갑천 유역을 선정하였다. 갑천은 대전광역시를 포함한 고도로 도시화된 지역과 광범위한 농업 지대가 혼재하는
복합적인 경관을 관통하며 흐르는 하천이다(Shiferaw et al., 2025). 해당 구역은 대전광역시 대덕구에 위치한 불무교(S03002) 지점으로, 갑천 하류에 해당하며 갑천과 금강의 합류지점으로부터 약 4 km 상류,
대전 공공하수처리시설 하류 약 9 km 지점에 위치한다. 지리적 특성으로 인해 하수처리장 방류수 등 점오염원 및 강수 시 농경지로부터 유출되는 비점오염원
등 다양한 영양염 부하가 지속적으로 유입되고 있다(Lee and Seo, 2015). 부영양화 및 조류 대발생이 빈번하게 발생하고 있어, 강인한 수질 모니터링 및 예측적 관리의 필요성이 대두되고 있다(Ly et al., 2021).
본 연구에서는 국립환경과학원이 운영하는 물환경정보시스템으로부터 수질 자료를 수집하였으며, 유량 자료는 국가수자원관리종합정보시스템(WAMIS)의 대전시(원촌교)
관측소 자료를 연계하여 활용하였다. 자료 수집 기간은 2015년 1월부터 2025년 12월까지 총 11년이며, 모든 자료는 일별 해상도로 정렬하여
분석에 사용하였다(National Institute of Environmental Research, 2026). 조류 바이오매스 정량화를 위한 목표 변수는 Chl-a 농도로 설정하였으며, 모형의 입력변수는 수온(°C), pH, 전기전도도(EC, µS/cm),
용존산소(DO, mg/L), 탁도(turbidity, NTU), 총유기탄소(TOC, mg/L), 과거 Chl-a(µg/L), 유량(m³/s)으로 구성하였다.
총질소(TN)와 총인(TP)과 같은 영양염류 항목은 조류 발생에 중요한 인자이지만, 본 연구에서는 동일한 기간과 시간 해상도에서 안정적으로 확보 가능한
연속 관측자료를 중심으로 입력변수를 구성하였다. 이에 따라 본 연구는 영양염류의 직접적 영향보다, 연속적으로 측정 가능한 수질 변수와 과거 Chl-a를
활용한 고농도 Chl-a 예측에 초점을 두었다.
구축된 데이터셋의 특성 중 하나는 매년 동절기에 자료가 결측되는 반복적인 공백 구간이다. 결측 구간은 대체로 11월 하순부터 3월 초순에 걸쳐 약
100∼120일간 지속되었으며, 이는 주로 센서 정기 유지보수 일정 및 결빙 조건에서의 측정 불능에 기인하는 것으로 파악되었다(Yang et al., 2025). 과학적 완전성 유지 및 인위적 왜곡의 도입 방지를 위해 선형 보간 또는 스플라인 보간 등의 단순 보간법은 이 장기 결측 구간에 적용하지 않았다(Che et al., 2024). 반면, 단기 결측에 대해서는 변수 특성을 고려한 제한적 선형 보간을 적용하였고, 보간 이후에도 결측이 남아 있는 행은 분석 대상에서 제외하였다.
이후 시계열 텐서 구성 단계에서는 결측 또는 비연속 구간을 포함하는 입력 윈도우를 제외함으로써, 딥러닝 모형이 물리적으로 연속적인 실측 시퀀스를 중심으로
학습되도록 하였다(Zhang and Thorburn, 2022).
2.2 밀도 기반 이상치 제거
센서 오류 및 확률론적 노이즈에 대한 머신러닝 모형의 강건성 확보를 위해 엄격한 이상치 탐지 절차를 적용하였다. 선행 연구에서는 흔히 트리 기반의
isolation forest (IForest) 알고리즘이 활용되었다(Shi et al., 2021). IForest 방법은 전체 데이터셋으로부터 크게 벗어나는 전역 이상치 탐지에는 효과적이나, 특정 데이터 포인트가 그 직접적인 시간적 이웃에 대해서만
비정상적인 국소 이상치 탐지에는 한계를 보인다(Ma et al., 2025). 본 연구에서 채택한 LOF 알고리즘은 특정 데이터 포인트의 국소 밀도 편차를 주변 이웃에 대해 상대적으로 산출한다. 이는 복잡한 수문 시계열 내의
국소 이상치 탐지에 높은 적합성을 지닌 밀도 기반 기법이다. 단순 전역 임계값 방식으로는 포착하기 어려운 계절적 맥락 의존적 이상치를 효과적으로 식별할
수 있다(Chen et al., 2024).
LOF 알고리즘은 Scikit-learn 라이브러리를 활용하여 구현하였다. 국소 이웃 범위(n_neighbors) 는 20으로, 오염 비율(contamination)
매개변수는 0.03으로 설정하였다. 이 밀도 기반 정제 과정을 통해 후속 딥러닝 모형이 센서 오작동 또는 유지보수 오류에서 비롯된 허위 패턴을 학습하지
않도록 물리적으로 유효한 시퀀스만으로 학습 기반을 구성하였다(Mokua et al., 2021).
2.3 시계열 텐서 구성
시간적 의존성을 포착할 수 있는 딥러닝 알고리즘의 적용을 위해, 전처리된 데이터셋을 RNN 입력에 적합한 텐서로 변환하였다. 각 관측치를 독립적으로
처리하는 비시계열 회귀 모형과 달리, LSTM 및 GRU 아키텍처는 표본 수, 시간 단계, 변수 수로 구성된 3차원 입력 구조를 요구한다(Xu et al., 2025). 직전 7일간의 연속 관측 시퀀스를 입력으로 사용하고 그 다음 시점의 Chl-a 농도를 예측하도록 구성하였다. 각 입력 시퀀스는 수온, pH, 전기전도도,
용존산소, 탁도, 총유기탄소, 과거 Chl-a, 유량의 8개 변수로 구성하였다. 시퀀스 내부에 결측 구간이 포함될 경우 해당 윈도우는 제외하여, 물리적으로
연속적인 자료만 학습에 사용되도록 하였다. 동절기 결측 구간을 가로지르는 슬라이딩 윈도우 시퀀스는 무의미한 학습 신호를 생성한다는 문제가 있다(Zhao et al., 2024). 이를 방지하기 위해 각 윈도우의 시작과 끝 날짜 차이를 검사하는 결측 인식 시퀀싱 알고리즘을 직접 구현하였으며, 표준 일 단위 샘플링 간격을 초과하는
시퀀스는 자동으로 탐지⋅폐기하도록 설계하였다(Ren et al., 2022). 이를 통해 딥러닝 모형이 연속적이고 물리적으로 유효한 수문 시퀀스만을 대상으로 학습되도록 보장하였다.
텐서 구성 이후, 데이터셋은 80:20 비율의 시간순 분할 방식을 통해 학습 세트와 검증 세트로 분리하였으며, 순차적 분할은 미래 정보가 활용 불가능한
실제 예측 시나리오를 재현한다.
2.4 비용 민감 학습 프레임워크
수문 예측에서 표준 회귀 모형의 주요 한계는 고농도 사례를 저하시키면서 전역 오차를 최소화하려는 경향이다(Guniganti et al., 2026). SMOGN과 같은 합성 데이터 생성 방법에 의존하지 않고 불균형 회귀 문제를 해결하기 위해 비용 민감 학습 프레임워크를 도입하였다(Chen, Kontar et al., 2025). 학습 데이터의 분포를 변경하는 대신, 모형의 손실 함수를 수정하여 임계 고농도 범위 내에서 발생하는 오차에 시간적으로 높은 페널티를 부여하는 방식을
채택한다(Serafin and Weron, 2025). 이 프레임워크의 핵심은 각 관측치 $y_i$에 대해 Chl-a 농도에 기반한 표본별 가중치 $\omega_i$를 산출하는 시그모이드 가중 함수이다.
가중치 산출 공식은 다음과 같이 정의된다:
이 식에서 $\omega_i$는 해당 표본에 부여되는 가중치를 나타내며, $\alpha$는 최대 가중치 진폭을 제어하는 척도 인자로서 가중치 범위가
1∼5가 되도록 4.0으로 설정하였다. 매개변수 $\beta$는 시그모이드 전환의 가파름 정도를 결정하며, 수학적 집중도를 높이기 위해 15로 설정하였다.
Threshold 변수는 부여 가중치가 유의미하게 증가하는 특정 농도 값을 나타낸다. 비용 민감 가중치는 학습 세트의 각 표본에 대해 부여되었으며,
직전 7일 입력 시퀀스로부터 예측되는 다음 시점 Chl-a 값의 오차에 대해 차등적으로 적용되었다.
효용성 평가를 위해 세 가지 실험 시나리오가 설계되었다. 첫 번째 시나리오는 $\omega_i = 1.0$의 기준 모형(Baseline)로, 모든
표본이 손실에 동등하게 기여하는 표준 비가중 모형을 적용한 대조군이다. 두 번째 시나리오인 Thresh_0.75는 Chl-a 농도가 75%를 초과하는
경우 페널티가 증가하는 중간 수준의 가중치 방식을 적용하여, 모형의 초점을 상위 25%의 고농도 Chl-a 사례에 집중시킨다. Thresh_0.90
시나리오는 상위 10%의 극단적 사례에 대해서만 페널티가 급격히 증가하는 강한 페널티를 부여하여, 고농도 Chl-a 사례를 모형이 우선적으로 학습하도록
유도한다.
2.5 딥러닝 모형 아키텍처
비용 민감 학습이 예측 성능에 미치는 영향을 체계적으로 평가하기 위해 LSTM과 GRU의 두 가지 RNN 아키텍처를 비교하였다. 두 아키텍처 모두
순차적 자료의 시간적 의존성 포착을 목적으로 설계되었으나, 내부 메커니즘에서 근본적인 차이가 존재한다(Man et al., 2025). LSTM 네트워크는 입력 게이트, 망각 게이트, 출력 게이트의 세 가지 게이트로 구성된 복잡한 시스템을 활용하여 정보 흐름을 관리하며, 높은 계산
복잡도를 수반하는 대신 강인한 장기 기억 능력을 제공한다(García Cabello and Carbó-García, 2025). GRU 네트워크는 업데이트 게이트와 리셋 게이트의 두 가지 게이트만으로 구성된 보다 간결한 아키텍처를 채택하여 소규모 데이터셋에서 과적합 위험을
줄이면서도 높은 효율로 유사한 성능을 달성할 수 있다(Wehrhahn and Teufel, 2010).
비교를 위해 두 아키텍처에는 동일한 네트워크 구조를 적용하였다. 모형은 7개의 시간 단계와 8개의 입력변수로 구성된 3차원 입력 텐서를 사용하였으며,
각 입력 시퀀스로부터 다음 시점의 연속형 Chl-a 농도 1개를 예측하도록 설계하였다. 입력변수는 수온, pH, 전기전도도, 용존산소, 탁도, 총유기탄소,
과거 Chl-a, 유량으로 구성하였다. 이를 입력받는 입력 레이어를 시작으로 양방향 RNN 레이어를 순차적으로 적층하였다. 첫 번째 레이어는 시간적
해상도 보존을 위해 64개의 유닛으로 전체 시퀀스를 반환한다. 두 번째 레이어는 32개의 유닛으로 최종 은닉 상태 벡터만을 반환한다. 과적합 방지를
위해 각 RNN 블록 이후에 드롭아웃 비율 0.3의 정규화 레이어를 삽입하였으며, 연속 Chl-a 농도 예측을 위해 단일 뉴런과 선형 활성화 함수를
갖는 완전연결층(dense layer) 최종 출력을 생성한다(Table 1).
학습 과정 최적화 및 과적합 방지를 위해 두 가지 콜백 함수를 적용하였다(Ghimire et al., 2025). ReduceLROnPlateau 콜백은 검증 손실이 5 epoch 동안 정체될 경우 학습률을 0.5 배율로 감소시키며, EarlyStopping
콜백은 15 epoch 연속으로 개선이 없을 경우 학습을 조기 종료한다. 이러한 구성은 기준 모형과 비용 민감 모형 간에 관찰되는 성능 차이가 가중치
전략에만 기인하는 것임을 보장한다(Lee, 2025). 제안된 비용 민감 프레임워크의 전체 개략도는 Fig. 1에 제시되어 있다.
Table 1. Hyperparameters of the LSTM and GRU models.
|
Hyperparameter
|
Value
|
|
Lookback window
|
7 days
|
|
Bidirectional layers
|
64 units/ 32 units
|
|
Dropout rate
|
0.3
|
|
Optimizer
|
Adam
|
|
Initial learning rate
|
0.001
|
|
Early stopping patience
|
15 epochs
|
|
Loss function
|
Weighted MSE
|
|
Random seed
|
42
|
Fig. 1. Schematic of the proposed cost-sensitive deep learning framework
2.6 모델 평가 방법
개발된 딥러닝 모형의 예측 성능을 정량적으로 평가하기 위해 root mean squared error(RMSE), mean absolute error(MAE),
결정계수(R²) 의 세 가지 표준 통계 지표를 활용하였다(Long et al., 2025). RMSE는 예측값과 관측값 간 차이의 제곱 평균의 제곱근으로, 큰 오차에 높은 페널티를 부여하는 특성으로 인해 극단 사례에서의 모형 성능 평가에
특히 유용한 전체 오차 크기 지표이다. MAE는 예측값과 관측값 간 절댓값 차이의 평균으로, 오차에 대한 선형적 해석을 제공한다. R²는 종속 변수의
분산 중 독립 변수에 의해 예측 가능한 비율을 나타낸다. 각 지표의 산출식은 다음과 같다:
위 식에서 $n$은 전체 관측치 수, $y_i$는 Chl-a 관측 농도, $\hat{y}_i$는 Chl-a 예측 농도, $\bar{y}$는 관측값의
평균을 나타낸다.
전체 성능 평가 외에도, 고농도 조류 대발생의 조기 경보에 대한 모형 적용 가능성을 검증하기 위해 구간별 평가를 추가적으로 수행하였다. 전체 검증
세트에 대한 성능 평가와 더불어, 검증 세트 내 Chl-a 분포의 75th percentile 이상에 해당하는 상위 25% 고농도 구간을 별도로 정의하여
구간별 성능을 평가하였다. 목표 지향적 평가는 비용 민감 학습 전략이 기준 모형 대비 극단 사례의 예측 정확도를 실질적으로 향상시켰는지 여부를 판단하는
데 있어 핵심적 중요성을 갖는다.
3. Results and Discussion
3.1 입력 자료 특성 및 이상치 탐지 결과
갑천 수질 모니터링 네트워크의 초기 데이터셋은 2015년 1월부터 2025년 12월까지 수집된 3,595개의 일별 관측 자료로 구성되었다. 목표 변수인
Chl-a는 평균 농도 15.14 µg/L, 표준편차 13.55 µg/L를 나타내어 비교적 큰 변동성을 보였다. 원시 데이터셋에는 최대 유량 1,276.81
m³/s, 최대 탁도 131.5 NTU에 달하는 극단적인 수문⋅물리적 변동 특성이 포함되어 있었다. 실제 조류 변동과 관련된 관측 패턴을 유지하면서
통계적 이상치를 제거하기 위해, 수온, pH, 전기전도도, 용존산소, 탁도, 총유기탄소, Chl-a, 유량으로 구성된 다변량 특성 공간에 LOF 알고리즘을
적용하였다. LOF 알고리즘은 총 108개(3.0%)의 이상치 관측치를 식별⋅제거하였으며, 유효한 3,487개의 관측치가 학습 기준 자료로 유지되었다(Fig. 2). 이를 통해 일반적인 조류 대발생의 시간적 계절성은 크게 훼손하지 않으면서, 비정상적인 관측치를 선별적으로 제거할 수 있었다.
이상치 그룹과 정제 그룹 간의 통계적 비교는 해당 필터링 단계의 타당성을 뒷받침하는 핵심 근거를 제공한다(Kim et al., 2018). LOF 알고리즘에 의해 이상치로 표지된 데이터는 단순히 높은 Chl-a 값만이 아니라, 여러 변수에서 비교적 큰 편차를 함께 보이는 경향이 있었다.
정상 그룹과 비교할 때 이상치 그룹은 Chl-a 평균과 최대값이 더 높은 경향을 보였다. 이상치 그룹은 수질 매개변수에서도 심각한 편차를 보였는데,
정상 그룹의 평균 유량 16.24 m³/s 대비 이상치 그룹의 평균 유량은 116.84 m³/s로 619.4% 높았으며, 평균 탁도 역시 4.89
NTU 대비 14.58 NTU로 198.1% 증가한 수준이었다. 이는 제거된 관측치가 일부 이례적인 수문 조건과 관련되어 있을 가능성을 시사하며,
LOF의 다변량 밀도 기반 접근법이 단일 임계값 방식으로는 구분하기 어려운 관측치를 선별하는 데 활용될 수 있음을 보여준다(Long et al., 2025). 본 연구의 LOF는 Chl-a 값만이 아니라 8개 변수의 조합을 함께 고려한 다변량 이상치 탐지 방법이다. 따라서 제거된 관측치는 단순한 고농도
Chl-a 값이 아니라, 여러 변수 조합에서 국소적으로 비정상적인 패턴을 보인 사례로 해석하였다.
LOF로 식별된 이상치는 수온–Chl-a 관계에서만 구분된 것이 아니라, 용존산소, pH, 총유기탄소, 탁도, 유량, 전기전도도와의 관계에서도 서로
다른 분포 양상을 나타냈다(Fig. 3). 이는 LOF 알고리즘이 단일 변수 기준이 아니라 다변량 공간의 국소 밀도를 함께 고려하여 관측치를 식별한 결과로 해석될 수 있다. 따라서 본
전처리 과정은 단순히 고농도 Chl-a 값 자체를 제거하기보다, 여러 변수 조합에서 국소적으로 비정상적인 패턴을 보인 관측치를 선별하는 데 목적이
있었다고 볼 수 있다.
Fig. 2. Time series distribution of Chl-a concentrations with anomaly points identified
using the LOF detection method.
Fig. 3. Scatter plots of Chl-a concentration versus major input variables, showing
normal observations and outliers identified using the LOF method.
3.2 비용 민감 가중치 전략 분석
환경 이상치 제거 이후, 정제된 데이터셋은 직전 7일 입력 시퀀스로부터 다음 시점의 Chl-a 농도를 예측하는 3차원 텐서 구조로 변환하였다. RNN
계열 모형에 요구되는 엄격한 시간적 의존성을 보존하기 위해 결측 인식 연속성 프로토콜을 적용하였다. 동절기 결측 구간을 포함하는 501개의 윈도우를
제외한 결과 85.60%의 유효 시퀀스 유지율 하에 총 2,979개의 연속적이고 유효한 시퀀스가 생성되었다. 데이터 누출 방지를 위해 이들 시퀀스는
시간순으로 분할되었으며, 2015년 1월부터 2023년 11월까지의 2,383개 표본으로 구성된 학습 세트(80%)와 2023년 11월부터 2025년
12월까지의 596개 표본으로 구성된 검증 세트(20%)로 나뉘었다(Fig. 4).
수질 데이터셋은 일반적으로 저농도 배경 조건이 지배적인 롱테일 분포를 나타내는 반면, 관리 측면에서 핵심 대상인 고농도 Chl-a 사례를 구성하는
특성을 보인다(Liang et al., 2024). 원시 시퀀스 구조를 인위적으로 변형하지 않으면서 불균형 회귀 문제를 해결하기 위해, 연속적 비용 민감 학습 접근법을 구현하였다. 시그모이드 가중
함수를 활용하여 모형 학습 과정에서 Chl-a 분포 전반에 걸쳐 페널티 가중치를 차등적으로 부여하였다.
적용된 가중치 분포를 보면 시그모이드 함수가 Chl-a 분포의 상위 구간에 상대적으로 더 큰 페널티를 부여하도록 작동하였음을 확인할 수 있다(Fig. 5). Thresh_0.75 설정에서, 알고리즘은 하위 25%의 Chl-a 농도에 대해 평균 1.00의 기준 가중치를 부여하였으며, 중간 50% 구간에
대해서는 기준에 근접한 평균 1.10의 가중치를 유지하였다. 상위 25%의 고농도 사례에 대해서는 평균 가중치가 4.86으로 대폭 상승하였고, 전체
학습 데이터의 가중치 평균은 2.02로 산출되었다. Thresh_0.90 설정은 보다 제한적으로 작동하여, 하위 75% 전체에 균일한 가중치 1.00을
부여하고 극단 상위 10% 구간에 대해서만 가중치가 상승하는 방식으로 작동하였다. 그 결과 상위 25% 구간의 집계 평균 가중치는 2.62로 낮아졌으며,
전체 데이터셋의 평균 가중치는 1.41로 산출되었다.
비용 민감 가중치 전략은 Chl-a 분포의 롱테일 구간에 더 큰 가중치를 부여함으로써, 네트워크가 고농도 Chl-a 사례의 예측 오차에 상대적으로
더 민감하게 반응하도록 설계되었다. 이를 통해 SMOGN과 같은 합성 데이터 보간 방식 없이도 고농도 구간에 대한 학습 비중을 높일 수 있으며, 원시
시계열의 연속성을 비교적 유지할 수 있다.
Fig. 4. Chronological partitioning of the preprocessed Chl-a time series data into
the training set(80%) and testing set(20%).
Fig. 5. Application of the sigmoid weighting function across the Chl-a concentration
distribution. The curves illustrate the dynamic assignment of penalty weights for
the Thresh_0.75 and Thresh_0.90 configurations.
3.3 딥러닝 아키텍처 비교 평가
딥러닝 아키텍처 비교에 앞서, LOF 전처리의 영향을 추가로 검토하기 위해 전처리 적용 전후의 GRU 모형 성능을 비교하였다(Table 2). GRU Baseline과 GRU Thresh_0.75 모두에서 LOF 적용 후 전체 및 고농도 구간 성능이 일관되게 향상되었으며, 이는 LOF
기반 이상치 제거가 후속 딥러닝 학습에 보다 일관된 입력 자료를 제공했을 가능성을 시사한다.
딥러닝 아키텍처 비교 평가 결과, 5개의 random seed에 대한 반복 실험에서도 GRU와 LSTM 사이에 비교적 일관된 성능 차이가 관찰되었다(Table 3). 전체 구간에서 최고 평균 성능은 GRU Baseline이 나타냈으며, RMSE는 3.84 ± 0.14 µg/L, R²는 0.87 ± 0.01이었다.
반면 LSTM 계열에서는 LSTM Baseline이 상대적으로 가장 우수하였으나, RMSE 4.06 ± 0.09 µg/L, R² 0.86 ± 0.01로
GRU Baseline보다 낮은 성능을 보였다. 이러한 결과는 본 연구 조건에서 GRU 아키텍처가 전반적으로 더 안정적인 예측 성능을 나타냈음을 시사한다.
산점도 비교에서도 이러한 경향이 확인되었다(Fig. 6). GRU 설정들의 예측값은 전반적으로 1:1 기준선에 더 가깝게 분포하였으며, Chl-a 농도가 증가하는 구간에서도 비교적 안정적인 재현 양상을
보였다. 반면 LSTM은 고농도 구간으로 갈수록 잔차 분산이 확대되는 경향을 보여, 전체 구간과 고농도 구간 모두에서 GRU보다 불안정한 예측 양상을
나타냈다. 본 연구에서 관찰된 GRU의 상대적으로 우수한 성능은 간결한 게이팅 구조와 관련이 있을 가능성이 있다. GRU는 입력 및 망각 메커니즘을
보다 간결하게 구성함으로써 학습 매개변수를 줄일 수 있으며, 이러한 특성이 본 연구의 자료 조건에서 비교적 안정적인 학습 결과와 관련되었을 가능성이
있다.
전체 구간과 고농도 구간으로 구분하여 두 아키텍처의 MAE, R², RMSE를 비교하였다(Fig. 7, Table 3). GRU는 모든 가중치 설정에서 전반적으로 더 낮은 RMSE와 더 높은 R²를 나타냈다. 전체 구간에서 GRU Baseline의 평균 성능은 RMSE
3.84 ± 0.14 µg/L, MAE 2.35 ± 0.10 µg/L, R² 0.87 ± 0.01이었으며, GRU Thresh_0.75와 GRU Thresh_0.90은
각각 RMSE 4.01 ± 0.09 µg/L, MAE 2.56 ± 0.06 µg/L, R² 0.86 ± 0.01과 RMSE 4.02 ± 0.05 µg/L,
MAE 2.77 ± 0.05 µg/L, R² 0.86 ± 0.00을 보였다. 반면 LSTM 계열은 전체 구간에서 RMSE 4.06–4.32 µg/L,
MAE 2.58–2.98 µg/L, R² 0.84–0.86 범위의 성능을 나타내어, GRU에 비해 전반적으로 낮은 정확도를 보였다. 특히 가중치 변화에
따른 성능 변동 폭도 GRU가 LSTM보다 상대적으로 작아, 본 연구 조건에서는 GRU가 더 안정적인 구조로 작동한 것으로 판단된다.
고농도 구간에서는 아키텍처 간 격차가 더 컸다. GRU의 고농도 R²는 Baseline에서 0.51 ± 0.03이었으며, Thresh_0.75 적용
시 0.53 ± 0.03으로 가장 높은 평균 성능을 보였다. 반면 Thresh_0.90에서는 0.47 ± 0.01로 다시 낮아졌다. LSTM에서는
Baseline 0.45 ± 0.03, Thresh_0.75 0.49 ± 0.01, Thresh_0.90 0.40 ± 0.04를 보여, 고농도 구간에서도
GRU 계열이 전반적으로 더 우수한 성능을 나타냈다. 고농도 RMSE 역시 GRU Thresh_0.75가 6.37 ± 0.19 µg/L로 가장 낮았으며,
LSTM Thresh_0.90은 7.18 ± 0.21 µg/L로 가장 높은 값을 보였다. 고농도 MAE에서는 GRU Baseline(4.52 ± 0.12
µg/L)과 GRU Thresh_0.75(4.59 ± 0.11 µg/L)의 차이가 크지 않았으나, RMSE와 R²는 Thresh_0.75에서 더 나은
값을 보여, 해당 가중치 설정이 평균 절대오차 자체보다는 고농도 구간의 변동 재현에 더 유리하게 작용했을 가능성을 시사한다.
추가적으로, 직전 시점의 Chl-a 값을 그대로 다음 시점 예측값으로 사용하는 naive 지속 예측 모형과 비교한 결과, 전체 검증 세트에서 GRU
Baseline의 평균 성능은 RMSE 3.84 ± 0.14 µg/L, R² 0.87 ± 0.01로, naive 지속 예측 모형의 RMSE 4.22
± 0.00 µg/L, R² 0.85 ± 0.00보다 우수하였다. 고농도 구간에서도 GRU Thresh_0.75의 평균 성능은 RMSE 6.37 ±
0.19 µg/L, R² 0.53 ± 0.03으로, naive 지속 예측 모형의 RMSE 7.24 ± 0.00 µg/L, R² 0.39 ± 0.00보다
더 우수하였다. 이는 제안 모형이 단순한 직전값 유지 방식보다 더 많은 시계열 정보를 학습하고 있음을 시사한다. 또한 결과의 random seed
민감도를 확인하기 위해 5개의 random seed(42, 52, 62, 72, 82)에 대한 반복 실험을 수행하였으며, 각 성능 지표의 평균과 표준편차를
함께 산출하였다. 반복 실험 결과에서도 전체 구간에서는 GRU Baseline, 고농도 구간에서는 GRU Thresh_0.75가 각각 가장 우수한
평균 성능을 나타내어, 본 연구의 주요 결론이 특정 단일 seed에만 의존하지 않음을 확인하였다.
Table 2. Effect of LOF preprocessing on the performance of the GRU models (random
seed = 42).
|
Model
|
LOF preprocessing
|
Overall RMSE
|
Overall R²
|
High-conc. RMSE
|
High-conc. R²
|
|
GRU Baseline
|
No
|
4.23
|
0.86
|
7.18
|
0.44
|
|
Yes
|
3.70
|
0.88
|
6.30
|
0.54
|
|
GRU Thresh_0.75
|
No
|
4.39
|
0.85
|
7.22
|
0.43
|
|
Yes
|
3.85
|
0.87
|
6.10
|
0.57
|
Table 3. Comparative performance of LSTM and GRU models (mean ± SD, n = 5).
|
Model
|
Threshold
|
Overall RMSE
|
Overall MAE
|
Overall R²
|
High-conc. RMSE
|
High-conc. MAE
|
High-conc. R²
|
|
LSTM
|
Baseline
|
4.06 ± 0.09
|
2.58 ± 0.10
|
0.86 ± 0.01
|
6.86 ± 0.16
|
4.97 ± 0.15
|
0.45 ± 0.03
|
|
Thresh_0.75
|
4.28 ± 0.03
|
2.87 ± 0.06
|
0.84 ± 0.00
|
6.65 ± 0.08
|
4.89 ± 0.06
|
0.49 ± 0.01
|
|
Thresh_0.90
|
4.32 ± 0.09
|
2.98 ± 0.10
|
0.84 ± 0.01
|
7.18 ± 0.21
|
5.36 ± 0.17
|
0.40 ± 0.04
|
|
GRU
|
Baseline
|
3.84 ± 0.14
|
2.35 ± 0.10
|
0.87 ± 0.01
|
6.47 ± 0.18
|
4.52 ± 0.12
|
0.51 ± 0.03
|
|
Thresh_0.75
|
4.01 ± 0.09
|
2.56 ± 0.06
|
0.86 ± 0.01
|
6.37 ± 0.19
|
4.59 ± 0.11
|
0.53 ± 0.03
|
|
Thresh_0.90
|
4.02 ± 0.05
|
2.77 ± 0.05
|
0.86 ± 0.00
|
6.76 ± 0.06
|
4.94 ± 0.04
|
0.47 ± 0.01
|
Fig. 6. Predicted versus measured Chl-a concentrations for GRU (a–c) and LSTM (d–f)
under Baseline, Thresh_0.75, and Thresh_0.90 configurations. The dashed red line indicates
the 1:1 reference.
Fig. 7. MAE, R², and RMSE for GRU and LSTM across Baseline, Thresh_0.75, and Thresh_0.90
configurations, evaluated over the high-concentration subset (a–c) and the overall
validation dataset (d–f). The high-concentration subset was defined as validation
samples with Chl-a concentrations greater than or equal to the 75th percentile of
the validation set.
Fig. 8. Detailed time series comparison of observed and predicted Chl-a concentrations
during a representative high-concentration event selected from the validation period.
3.4 고농도 구간 예측 성능
전역 성능 지표는 일반적인 하천 조건 평가에 유용하나, 표준 회귀 알고리즘은 전역 오차를 최소화하는 방향으로 작동하여 고농도 Chl-a 사례를 체계적으로
과소 추정하는 조건부 편향을 초래한다(Fournier et al., 2024). 검증 세트에서 산정한 Chl-a의 75th percentile(15.90 µg/L) 이상에 해당하는 150개 표본을 고농도 구간으로 정의하여 구간별
평가를 수행하였다. 기준 모형은 평균 고농도 R²는 0.48 ± 0.03이었으며, Thresh_0.75 적용 시 아키텍처 평균 고농도 R²는 0.51
± 0.02로 높아졌다(Fig. 8). 이는 Thresh_0.75 설정이 고농도 사례 예측 편향을 일부 완화할 가능성을 시사한다. 반면 Thresh_0.90에서는 평균 고농도 R²가
0.43 ± 0.05로 다시 낮아졌으며, 이는 가중치 임계값이 지나치게 높을 경우 예측 성능이 오히려 불안정해질 수 있음을 시사한다.
기준 GRU는 일부 극단 피크를 상대적으로 낮게 예측하는 경향을 보였으며, 비용 민감 GRU는 상승 시기와 피크 크기를 보다 가깝게 추적하는 양상을
보였다. 전체 R²가 소폭 감소하더라도, 고농도 피크 구간의 추적 성능이 일부 개선된 점은 실무적으로 의미가 있을 수 있다. 이러한 결과는 본 방법론이
조기 경보 및 선제적 수질 관리를 위한 보조적 연속 해상도 도구로 활용될 가능성을 보여준다. 다만 Chl-a는 조류 바이오매스의 총량적 지표로서 유용하지만,
국내 조류경보제에서 직접 관리하는 남세균 세포수와 동일한 의미를 갖는 지표는 아니므로, 본 연구 결과는 남세균 경보를 직접 대체하기보다 보조적 조기
판단 정보로 활용되는 것이 적절하다.
3.5 특성 중요도 분석
딥러닝 모형이 예측에 활용하는 변수들의 상대적 기여를 비교하기 위해 기준 및 비용 민감 GRU에 대한 순열 특성 중요도 분석을 수행하였다(Chen, Huang et al., 2025). 각 변수의 중요도는 시험 자료에서 해당 변수의 시계열 정렬을 반복적으로 무작위 섞은 뒤, 예측 오차 증가량을 기준으로 평가하였다. 자기회귀 지배
현상을 방지하기 위해 과거 Chl-a 입력값은 최종 상대 중요도 정규화 단계에서 제외하였다. 두 모형 모두에서 수온이 가장 높은 상대 중요도를 나타냈으며,
Baseline GRU에서는 0.50 ± 0.09, cost-sensitive GRU에서는 0.46 ± 0.02로 나타났다(Fig. 9). Baseline GRU에서는 유량 0.11 ± 0.04, 탁도 0.10 ± 0.02, 전기전도도 0.09 ± 0.06, 용존산소 0.08 ±
0.03, 총유기탄소 0.08 ± 0.03, pH 0.04 ± 0.02 순으로 상대 중요도가 나타났다. 반면 cost-sensitive GRU에서는
용존산소가 0.17 ± 0.05, pH가 0.11 ± 0.03으로 증가한 반면, 유량은 0.04 ± 0.01, 탁도는 0.05 ± 0.04로 감소하였다.
전기전도도는 0.09 ± 0.04, 총유기탄소는 0.06 ± 0.01로 두 모형에서 비교적 유사한 수준을 유지하였다.
이러한 결과는 비용 민감 학습이 고농도 Chl-a 구간 예측에서 참조하는 변수의 상대적 분포를 일부 변화시켰음을 시사한다. 수온은 두 모형 모두에서
가장 높은 중요도를 유지하여, 조류 변동 예측의 기본적인 배경 변수로 작용하는 것으로 해석되었다(Mowe et al., 2015). 또한 비용 민감 GRU에서 용존산소와 pH의 중요도가 증가한 점은, 고농도 구간 예측 시 광합성 및 수질 반응과 관련된 변수의 정보를 보다 민감하게
활용했을 가능성을 보여준다(Kim and Ahn, 2022; Ly et al., 2021). 반면 유량과 탁도의 중요도가 감소한 점은, 비용 민감 학습이 일반적인 수문적 변동보다 고농도 구간에서 직접적으로 함께 변동하는 수질 신호에 상대적으로
더 큰 가중을 두었을 가능성을 시사한다(Kim et al., 2026; Warren et al., 2021). 전기전도도와 총유기탄소는 두 모형에서 모두 보조적인 중요도를 보였으며, 배경 수질 조건을 반영하는 변수로 해석할 수 있다(Dunalska, 2011; Kuo et al., 2025). 다만 순열 중요도는 변수의 상대적 기여도를 나타내는 지표일 뿐 각 변수와 Chl-a 사이의 작용 방향이나 인과관계를 직접 의미하지 않으므로, 해석에는
신중할 필요가 있다. 또한 본 연구는 TN, TP와 같은 영양염류 자료를 직접 포함하지 못하였으므로, DO, pH, TOC 등은 부영양화의 간접 신호로서
제한적으로 해석하는 것이 적절하다.
Fig. 9. Relative permutation feature importance scores for predicting Chl-a concentration
in the Baseline GRU and the cost-sensitive GRU utilizing the Thresh_0.75 configuration.
4. Conclusion
본 연구에서는 갑천의 Chl-a 농도 예측을 위한 강인하고 연속적인 딥러닝 프레임워크를 구축하였다. 확률론적 센서 노이즈 및 고농도 Chl-a 사례로
인해 발생하는 불균형 회귀 문제를 완화하기 위해, LOF 전처리와 결측 인식 텐서 구성을 결합한 체계적인 처리 파이프라인을 구현하였다. 밀도 기반
LOF 알고리즘은 데이터셋의 3.0%(108개)의 관측치에 해당하는 비대표적 다변량 이상치를 식별⋅제거하였다. 제거된 이상치는 수온, pH, 전기전도도,
용존산소, 탁도, 총유기탄소, Chl-a, 유량의 다변량 조합에서 식별된 비교적 큰 편차를 보이는 관측치를 나타냈다. 특히 유량과 탁도의 편차가 크게
나타나는 경향이 확인되었다. 이상치 제거를 통해 유효한 계절적 생지화학적 극값은 보존하면서 물리적으로 유효한 일관된 학습 기준 자료가 확보되었다.
비교 평가 결과, 5개의 random seed에 대한 반복 실험에서도 GRU 아키텍처는 다양한 가중치 설정에 걸쳐 LSTM 네트워크에 비해 상대적으로
우수한 성능을 나타냈다. 특히 Thresh_0.75 설정의 비용 민감 GRU 모형은 고농도 구간에서 가장 높은 평균 성능을 보였으며, 고농도 R²는
0.53 ± 0.03, 고농도 RMSE는 6.37 ± 0.19 µg/L였다. 이는 해당 설정이 고농도 구간 예측에 유리할 가능성을 시사한다.
또한 순열 특성 중요도 분석 결과, 비용 민감 가중치 전략은 극단 사례 예측에서 모형이 참조하는 변수들의 상대적 중요도 분포와 관련되어 있을 가능성을
보였다. 수온은 두 모형 모두에서 가장 높은 중요도를 유지하였으며, 비용 민감 GRU에서는 DO와 pH의 상대적 중요도가 증가하는 경향이 관찰되었다.
이는 비용 민감 학습이 고농도 구간 예측에서 유량과 같은 일반적 수문 조건뿐 아니라 수질 변수의 정보를 함께 반영하도록 작용했을 가능성을 시사한다.
본 연구의 결과는 하천 수계의 고농도 Chl-a 예측과 수질 관리 적용 가능성을 보여주었다.
본 연구는 갑천 유역의 단일 지점을 대상으로 수행되었으므로, 다른 수계에 대한 일반화에는 신중할 필요가 있다. 또한 입력변수는 장기간 연속적으로 확보
가능한 자동측정망 자료를 중심으로 구성되어 총질소와 총인 등 영양염류의 직접적 영향은 충분히 반영하지 못했을 가능성이 있다. 더불어 Chl-a는 유용한
연속 지표이지만, 국내 조류경보제에서 직접 관리하는 남세균 세포수나 독소 농도를 직접 대변하지는 않으므로, 향후에는 다지점 자료와 추가 수질 변수를
활용한 반복 검증 및 확장 연구가 필요하다.