식품 개체명 인식을 위한 트랜스포머 기반 모델과 대규모 언어 모델의 앙상블 기법
Ensemble Approach of Transformer-based Models and Large Language Models for Food Named Entity Recognition
Citations

WEB OF SCIENCE

0
Citations

SCOPUS

0

초록

식품 도메인에서의 개체명 인식(NER)은 정확한 정보 추출을 위해 필수적이며, 희소 개체명의 낮은 출현 빈도는 학습에 어려움을 준다. 본 연구는 트랜스포머 기반 모델(BERT, ELECTRA)과 대규모 언어 모델(LLM, GPT-3.5-turbo, LLaMA 2 7B)의 성능을 비교하고 최적 조합을 탐색하였다. ELECTRA+CRF+bi-LSTM은 희소 개체명에서, LLaMA 2 7B는 문맥 보완 측면에서 강점을 보였다. ELECTRA+CRF는 희소 개체명에서 F1-score 0.89를 달성했으며, LLaMA 2 7B와의 가중치 결합(Weighted Voting)으로 0.91까지 향상되었다. 일반 개체명에서는 0.93의 F1-score를 기록했다. 실험 결과, 트랜스포머 모델과 LLM의 조합이 식품 도메인 개체명 인식 성능 향상에 효과적임을 입증하였다.

키워드

named entity recognitionNERtransformerlarge language modelLLMensemble.
제목
식품 개체명 인식을 위한 트랜스포머 기반 모델과 대규모 언어 모델의 앙상블 기법
제목 (타언어)
Ensemble Approach of Transformer-based Models and Large Language Models for Food Named Entity Recognition
저자
임소희김건우
발행일
2025-09
유형
Y
저널명
한국정보기술학회논문지
23
9
페이지
9 ~ 21