BSM1을 활용한 시간적 해상도가 기계학습모델의 성능에 미치는 영향에 대한 연구open accessAssessing the Impact of Temporal Resolution Using BSM1 on the Performance of Machine Learning
- Other Titles
- Assessing the Impact of Temporal Resolution Using BSM1 on the Performance of Machine Learning
- Authors
- 오원기; 기서진; 박진미; 신승구
- Issue Date
- Dec-2023
- Publisher
- 대한환경공학회
- Keywords
- BSM1; LabVIEW; 기계학습; 데이터 재표본화; BSM1; Temporal Resolution; LabVIEW; Machine Learning; Data Resampling
- Citation
- 대한환경공학회지, v.45, no.12, pp 625 - 642
- Pages
- 18
- Indexed
- KCI
- Journal Title
- 대한환경공학회지
- Volume
- 45
- Number
- 12
- Start Page
- 625
- End Page
- 642
- URI
- https://scholarworks.gnu.ac.kr/handle/sw.gnu/69311
- ISSN
- 1225-5025
2383-7810
- Abstract
- 목적 : 데이터의 시간적 해상도의 변화에 따른 데이터의 특성 변화를 확인하고, 데이터의 시간적 해상도가 기계학습 모델의 성능에 미치는 영향을 확인한다.
방법 : 하수처리시설에 대하여 BSM1으로 시뮬레이션하여 활용해 15분 간격 한 유입수 및 유출수 수질데이터를 확보하였다. 데이터를 n개씩 묶는 down sampling으로 데이터 수를 줄이고, 보간법으로 데이터 늘리는 up sampling의 resampling으로 데이터의 특성 변화를 확인하고, down sampling된 데이터로 구축한 30개의 기계학습 모델들의 성능을 상호 비교하였다.
결과 및 토의 : down sampling을 진행할 수록 R2는 낮아지고, RMSE는 증가하였다. 평균값을 대푯값으로 할 때 데이터의 정확성과 오차의 손실이 적고, 최대값을 대푯값으로 할 때 데이터 특성을 유지하여 정보의 손실을 감소시킬 수 있었다. 시간적 해상도가 다른 모델의 성능을 비교하기 위해서는 같은 수준의 데이터를 적용하여 모델간 성능을 비교할 필요가 있었다.
결론 : 사고경보 등 정확성보다는 변화를 감지하는 능력이 필요한 모델은 일정기간에 대한 최대값을 대푯값으로 활용하는 것이 효과적이다. 데이터의 측정 간격은 기계학습 모델의 성능에 영향을 주요 인자로 측정 간격이 다른 상태로 개발된 기계학습 모델이 제시된 성능을 발휘하지 못하는 주요 원인이 된다. 본 연구에서는 데이터의 전처리, 분류, 학습 및 검증의 모든 과정을 LabVIEW로 구현하여 향후 제어, 계측 분야에 널리 활용되고 있는 LabVIEW에 데이터 분석 과정이 포함된 통합개발환경의 구현의 가능성을 확인하였다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - 융합기술공과대학 > Department of Energy Engineering > Journal Articles
- 건설환경공과대학 > 환경공학과 > Journal Articles
![qrcode](https://api.qrserver.com/v1/create-qr-code/?size=55x55&data=https://scholarworks.gnu.ac.kr/handle/sw.gnu/69311)
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.