Proximal Policy-Guided Hyperparameter Optimization for Mitigating Model Decay in Cryptocurrency Scam Detection

Choi, Su-Hwan; Choi, Sang-Min; Buu, Seok-Jun

doi:10.3390/electronics14061192

상세 보기

Proximal Policy-Guided Hyperparameter Optimization for Mitigating Model Decay in Cryptocurrency Scam Detection

Citations

WEB OF SCIENCE

1

Citations

SCOPUS

1

초록

As cryptocurrency transactions continue to grow, detecting scams within transaction records remains a critical challenge. These transactions can be represented as dynamic graphs, where Neural Network Convolution (NNConv) models are widely used for detection. However, NNConv models suffer from model decay due to evolving transaction patterns, the introduction of new users, and the emergence of adversarial techniques designed to evade detection. To address this issue, we propose an automated, periodic hyperparameter optimization method based on proximal policy optimization (PPO), a reinforcement learning algorithm designed for dynamic environments. By leveraging PPO's stable policy updates and efficient exploration strategies, our approach continuously refines hyperparameters to sustain model performance without frequent retraining. We evaluate the proposed method on a large-scale cryptocurrency transaction dataset containing 2,973,489 nodes and 13,551,303 edges. The results demonstrate that our method achieves an F1 score of 0.9478, outperforming existing graph-based approaches. These findings validate the effectiveness of PPO-based optimization in mitigating model decay and ensuring robust cryptocurrency scam detection.

키워드

model decay; hyperparameter optimization (HPO); reinforcement learning (RL); proximal policy optimization (PPO); cryptocurrency security; fraud detection

제목: Proximal Policy-Guided Hyperparameter Optimization for Mitigating Model Decay in Cryptocurrency Scam Detection

저자: Choi, Su-Hwan; Choi, Sang-Min; Buu, Seok-Jun

DOI: 10.3390/electronics14061192

발행일: 2025-03

유형: Article

저널명: Electronics (Basel)

권: 14

호: 6