피싱 URL 분류를 위한 컨볼루션-순환 트리플렛 신경망 기반 웹주소 특징공간의 학습Learning Disentangled Representation of Web Addresses via Convolutional-Recurrent Triplet Network for Phishing URL Classification
- Other Titles
- Learning Disentangled Representation of Web Addresses via Convolutional-Recurrent Triplet Network for Phishing URL Classification
- Authors
- 부석준; 김혜정
- Issue Date
- Feb-2021
- Publisher
- 한국정보과학회
- Keywords
- 피싱URL 분류; 컨볼루션-순환 트리플렛 신경망; 심층 표현형학습; 사이버보안; phishing URL classification; convolutional-recurrent triplet network; deep metric learning; cyber-security
- Citation
- 정보과학회논문지, v.48, no.2, pp 147 - 153
- Pages
- 7
- Indexed
- KCI
- Journal Title
- 정보과학회논문지
- Volume
- 48
- Number
- 2
- Start Page
- 147
- End Page
- 153
- URI
- https://scholarworks.gnu.ac.kr/handle/sw.gnu/73661
- DOI
- 10.5626/JOK.2021.48.2.147
- ISSN
- 2383-630X
2383-6296
- Abstract
- 폭발적으로 성장하는 소셜 미디어 서비스 등으로 인해 개인간의 연결이 강화된 환경에서는 URL을 통해 전파되는 피싱 URL의 자동화된 분류가 필수적이다. URL을 구성하는 문자와 단어수준의 특징을 모델링하기 위한 컨볼루션-순환신경망 기반의 피싱 URL 분류용 딥러닝 모형은 정확도의 측면에서 최고의 성능을 달성하였으나, 피싱 URL 데이터의 클래스 불균형으로 인한 샘플링 단계에서의 문제와 특징공간 구축시의 문제가 알려졌다. 본 논문에서는 URL 도메인에서의 클래스 불균형 이슈를 딥러닝 기반의 URL 특징공간 생성 태스크의 측면에서 지적하고 URL간의 유사도를 직접 학습할 수 있는 개선된 트리플렛 신경망 구조를 제안하였다. 제안하는 방법은 실제 웹으로부터 수집된 60,000건의 URL 데이터셋에 대해 검증되었고 최신의 딥러닝 기반 방법 대비 최고의 성능을 달성하였다. 개선된 트리플렛 신경망은 시간해상도 별 10겹 교차검증으로 평가되었고, 기존 딥러닝 알고리즘 대비 재현율 측면 45%의 향상을 보임으로써 피싱 URL 분류 분야에서의 표현형 학습 접근의 타당성을 검증하였다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - ETC > Journal Articles

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.