KoBERT와 CNN-LSTM을 활용한 보이스피싱 탐지 시스템
Voice Phishing Detection using KoBERT and CNN-LSTM
  • 김지원
  • 구슬이
  • 김혜진
  • 강창구

초록

보이스피싱은 수법의 지능화와 정교화로 인해 심각한 사회적 문제를 야기하고 있으며, 이를 효과적으로 탐지하기 위해서는 통화 내용의 문맥적 위험도와 발화 음성의 위변조 여부를 종합적으로 판단하는 기술이 필수적이다. 기존의 키워드 기반 탐지 방식은 새로운 피싱 시나리오에 취약하고, 단일 모델만으로는 복합적인 공격을 방어하는 데 한계가 있다. 본 논문에서는 텍스트와 음성을 병렬적으로 분석하는 듀얼 파이프라인 구조의 보이스피싱 탐지 시스템을 제안한다. 텍스트 분석에는 KoBERT 기반을 통해 문맥적 위험도를 산출하며, 음성 분석에는 CNN-LSTM 하이브리드 모델을 활용하여 합성 음성 여부를 판별한다. 제안된 시스템은 금융감독원의 실제 피싱 사례 데이터와 so-vits-svc-fork 기반의 합성 음성을 포함한 학습 데이터를 바탕으로 훈련되었으며, 실제 피싱 샘플에 대해서는 94.9%의 높은 탐지율을 기록하였다.

키워드

voice phishingKoBERTvoice forgerydeep learningtext analysis.
제목
KoBERT와 CNN-LSTM을 활용한 보이스피싱 탐지 시스템
제목 (타언어)
Voice Phishing Detection using KoBERT and CNN-LSTM
저자
김지원구슬이김혜진강창구
발행일
2025-10
유형
Y
저널명
한국정보기술학회논문지
23
10
페이지
175 ~ 183