엣지 임펄스를 이용한 음성 처리 기법의 성능 분석

구금서; 서영건

상세 보기

엣지 임펄스를 이용한 음성 처리 기법의 성능 분석

Performance Analysis of Speech Processing Techniques Using Edge Impulse

초록

엣지 컴퓨팅 환경에서 음성 신호의 분석은 실시간 환경에서 중요하다. 기존의 클라우드 기반 시스템에서 음성 처리는 데이터 전송 및 처리 지연 문제가 발생한다. 엣지 임펄스는 저전력 임베디드 환경에서 기계 학습 및 신호 처리를 위한 오픈 소스 플랫폼으로 음성을 로컬에서 처리하여 데이터 보안과 개인 정보 보호 측면에서 우수하다. 본 논문에서는 엣지 임펄스를 사용하여 음성 데이터를 수집하고 신호 처리 및 기계 학습을 적용 후 음성의 특성 추출과 분류를 수행하여 성능을 분석하였다. 데이터 세트에 차원 축소 기법을 각각 적용하고, 음성 처리는 MFE와 MFCC를 적용하여 각각의 파라미터 값과 특성 등을 확인하고 EON 튜너를 적용하여 최적의 모델을 선정하였다. 모델 테스팅에서 MFE의 정확도는 86.82%, MFCC의 지연시간은 26ms를 보였다. 이결과로 음성 특성 추출 단계에서 모델별 성능을 확인하여 개발 목적에 맞는 최적의 모델을 선택할 수 있다.

키워드

엣지 임펄스; 음성 처리 기법; MFE; MFCC; 임베디드 시스템; Edge Impulse; Speech Processing Techniques; MFE; MFCC; Embedded System

제목: 엣지 임펄스를 이용한 음성 처리 기법의 성능 분석

제목 (타언어): Performance Analysis of Speech Processing Techniques Using Edge Impulse

저자: 구금서; 서영건

발행일: 2023-06

저널명: 디지털컨텐츠학회논문지

권: 24

호: 6

페이지: 1327 ~ 1338