Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

이커머스 도메인에서의 동일 태그 교체 데이터 증강 기법을 활용한 개체명 인식

Full metadata record
DC Field Value Language
dc.contributor.author장동호-
dc.contributor.author부석준-
dc.contributor.author서영건-
dc.date.accessioned2024-06-04T02:30:28Z-
dc.date.available2024-06-04T02:30:28Z-
dc.date.issued2024-05-
dc.identifier.issn1598-2009-
dc.identifier.issn2287-738X-
dc.identifier.urihttps://scholarworks.gnu.ac.kr/handle/sw.gnu/70696-
dc.description.abstract데이터 증강은 한국어 NER 분야에서 도메인 특화 데이터 부족으로 발생하는 어려움을 해결하기 위한 중요한 전략이다. 본 연구에서는 이커머스 도메인에서 한국어 개체명 인식 모델을 향상시키기 위한 데이터 증강 방법으로 ‘음절 단위 문장 BIO 태깅 및 동일 태그 교체(Same-Tag Replacement)’ 알고리즘을 제안하고 실험하였다. 이 방법은 한국어 NER 데이터셋에서 문장을 음절 단위로 분리하고 BIO 태그를 부착한 뒤, 동일한 개체 유형에 속하는 단어를 무작위로 교체하여 데이터를 증강한다. 실험 결과, 작은 데이터셋(N=500)의 데이터를 증강했을 때 weighted-average f1-score가 최대 50%까지 개선된 것을 확인하였다. 이는 이커머스 도메인에서 자연어 처리 모델 성능 향상을 위한 실용적이고 효과적인 전략으로 주목받을 것으로 기대된다.-
dc.format.extent8-
dc.language한국어-
dc.language.isoKOR-
dc.publisher한국디지털콘텐츠학회-
dc.title이커머스 도메인에서의 동일 태그 교체 데이터 증강 기법을 활용한 개체명 인식-
dc.title.alternativeNamed Entity Recognition in E-commerce Domain using the Same-Tag Replacement Data Augmentation Technique-
dc.typeArticle-
dc.publisher.location대한민국-
dc.identifier.doi10.9728/dcs.2024.25.5.1159-
dc.identifier.bibliographicCitation디지털콘텐츠학회논문지, v.25, no.5, pp 1159 - 1166-
dc.citation.title디지털콘텐츠학회논문지-
dc.citation.volume25-
dc.citation.number5-
dc.citation.startPage1159-
dc.citation.endPage1166-
dc.identifier.kciidART003082611-
dc.description.isOpenAccessN-
dc.description.journalRegisteredClasskci-
dc.subject.keywordAuthorData Augmentation-
dc.subject.keywordAuthorNER-
dc.subject.keywordAuthorSame-Tag Replacement-
dc.subject.keywordAuthorRandom Word Replacement-
dc.subject.keywordAuthorNatural Language Processing-
dc.subject.keywordAuthor데이터 증강-
dc.subject.keywordAuthorNER-
dc.subject.keywordAuthor동일테그교체-
dc.subject.keywordAuthor단어 무작위 교체-
dc.subject.keywordAuthor자연어 처리-
Files in This Item
There are no files associated with this item.
Appears in
Collections
ETC > Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Seok-Jun, Buu photo

Seok-Jun, Buu
IT공과대학 (컴퓨터공학부)
Read more

Altmetrics

Total Views & Downloads

BROWSE