Cited 0 time in
이커머스 도메인에서의 동일 태그 교체 데이터 증강 기법을 활용한 개체명 인식
| DC Field | Value | Language |
|---|---|---|
| dc.contributor.author | 장동호 | - |
| dc.contributor.author | 부석준 | - |
| dc.contributor.author | 서영건 | - |
| dc.date.accessioned | 2024-06-04T02:30:28Z | - |
| dc.date.available | 2024-06-04T02:30:28Z | - |
| dc.date.issued | 2024-05 | - |
| dc.identifier.issn | 1598-2009 | - |
| dc.identifier.issn | 2287-738X | - |
| dc.identifier.uri | https://scholarworks.gnu.ac.kr/handle/sw.gnu/70696 | - |
| dc.description.abstract | 데이터 증강은 한국어 NER 분야에서 도메인 특화 데이터 부족으로 발생하는 어려움을 해결하기 위한 중요한 전략이다. 본 연구에서는 이커머스 도메인에서 한국어 개체명 인식 모델을 향상시키기 위한 데이터 증강 방법으로 ‘음절 단위 문장 BIO 태깅 및 동일 태그 교체(Same-Tag Replacement)’ 알고리즘을 제안하고 실험하였다. 이 방법은 한국어 NER 데이터셋에서 문장을 음절 단위로 분리하고 BIO 태그를 부착한 뒤, 동일한 개체 유형에 속하는 단어를 무작위로 교체하여 데이터를 증강한다. 실험 결과, 작은 데이터셋(N=500)의 데이터를 증강했을 때 weighted-average f1-score가 최대 50%까지 개선된 것을 확인하였다. 이는 이커머스 도메인에서 자연어 처리 모델 성능 향상을 위한 실용적이고 효과적인 전략으로 주목받을 것으로 기대된다. | - |
| dc.format.extent | 8 | - |
| dc.language | 한국어 | - |
| dc.language.iso | KOR | - |
| dc.publisher | 한국디지털콘텐츠학회 | - |
| dc.title | 이커머스 도메인에서의 동일 태그 교체 데이터 증강 기법을 활용한 개체명 인식 | - |
| dc.title.alternative | Named Entity Recognition in E-commerce Domain using the Same-Tag Replacement Data Augmentation Technique | - |
| dc.type | Article | - |
| dc.publisher.location | 대한민국 | - |
| dc.identifier.doi | 10.9728/dcs.2024.25.5.1159 | - |
| dc.identifier.bibliographicCitation | 디지털콘텐츠학회논문지, v.25, no.5, pp 1159 - 1166 | - |
| dc.citation.title | 디지털콘텐츠학회논문지 | - |
| dc.citation.volume | 25 | - |
| dc.citation.number | 5 | - |
| dc.citation.startPage | 1159 | - |
| dc.citation.endPage | 1166 | - |
| dc.identifier.kciid | ART003082611 | - |
| dc.description.isOpenAccess | N | - |
| dc.description.journalRegisteredClass | kci | - |
| dc.subject.keywordAuthor | Data Augmentation | - |
| dc.subject.keywordAuthor | NER | - |
| dc.subject.keywordAuthor | Same-Tag Replacement | - |
| dc.subject.keywordAuthor | Random Word Replacement | - |
| dc.subject.keywordAuthor | Natural Language Processing | - |
| dc.subject.keywordAuthor | 데이터 증강 | - |
| dc.subject.keywordAuthor | NER | - |
| dc.subject.keywordAuthor | 동일테그교체 | - |
| dc.subject.keywordAuthor | 단어 무작위 교체 | - |
| dc.subject.keywordAuthor | 자연어 처리 | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
Gyeongsang National University Central Library, 501, Jinju-daero, Jinju-si, Gyeongsangnam-do, 52828, Republic of Korea+82-55-772-0534
COPYRIGHT 2022 GYEONGSANG NATIONAL UNIVERSITY LIBRARY. ALL RIGHTS RESERVED.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.
