상세 보기
식품 개체명 인식을 위한 트랜스포머 기반 모델과 대규모 언어 모델의 앙상블 기법
Ensemble Approach of Transformer-based Models and Large Language Models for Food Named Entity Recognition
- 임소희;
- 김건우
Citations
WEB OF SCIENCE
0Citations
SCOPUS
0초록
식품 도메인에서의 개체명 인식(NER)은 정확한 정보 추출을 위해 필수적이며, 희소 개체명의 낮은 출현 빈도는 학습에 어려움을 준다. 본 연구는 트랜스포머 기반 모델(BERT, ELECTRA)과 대규모 언어 모델(LLM, GPT-3.5-turbo, LLaMA 2 7B)의 성능을 비교하고 최적 조합을 탐색하였다. ELECTRA+CRF+bi-LSTM은 희소 개체명에서, LLaMA 2 7B는 문맥 보완 측면에서 강점을 보였다. ELECTRA+CRF는 희소 개체명에서 F1-score 0.89를 달성했으며, LLaMA 2 7B와의 가중치 결합(Weighted Voting)으로 0.91까지 향상되었다. 일반 개체명에서는 0.93의 F1-score를 기록했다. 실험 결과, 트랜스포머 모델과 LLM의 조합이 식품 도메인 개체명 인식 성능 향상에 효과적임을 입증하였다.
키워드
named entity recognition; NER; transformer; large language model; LLM; ensemble; .
- 제목
- 식품 개체명 인식을 위한 트랜스포머 기반 모델과 대규모 언어 모델의 앙상블 기법
- 제목 (타언어)
- Ensemble Approach of Transformer-based Models and Large Language Models for Food Named Entity Recognition
- 저자
- 임소희; 김건우
- 발행일
- 2025-09
- 유형
- Y
- 저널명
- 한국정보기술학회논문지
- 권
- 23
- 호
- 9
- 페이지
- 9 ~ 21