Cited 0 time in
문서 군집화를 위한 워드 임베딩, PCA와 K-평균 군집의 새로운 결합
| DC Field | Value | Language |
|---|---|---|
| dc.contributor.author | 김동현 | - |
| dc.contributor.author | 이계민 | - |
| dc.date.accessioned | 2024-12-03T09:00:12Z | - |
| dc.date.available | 2024-12-03T09:00:12Z | - |
| dc.date.issued | 2024-11 | - |
| dc.identifier.issn | 2508-9080 | - |
| dc.identifier.uri | https://scholarworks.gnu.ac.kr/handle/sw.gnu/74916 | - |
| dc.description.abstract | 본 논문은 현대 웹 환경에서 다양한 주제의 문서가 폭발적으로 증가함에 따라 사용자가 원하는 정보를 찾기가 점점 어려워지는 문제를 다루고 있다. 문서 군집화는 비슷한 특징을 가진 문서들을 그룹화함으로써 정보의 접근성과 사용 편의성을 향상시킬 수 있는 강력한 도구로, 사용자가 필요한 정보를 빠르고 쉽게 찾을 수 있도록 도와준다. 본 논문에서는 문서 군집화를 위한 새로운 방법인 PCA-KM (Principal Component Analysis –K- means)을 제안하였다. PCA-KM은 워드 임베딩으로부터 얻은 문서의 고차원 벡터에 주성분 분석을 적용하여 차원을 축소한 후, 수정된 K-means을 반복적으로 적용하는 과정을 포함한다. 여러 군집화 성능지표를 사용해 워드 임베딩과 K-means를 단순 결합한 전통적인 방법과 제안된 방법을 비교하였다. 그 결과, 본 논문에서 제안한 방법이 여러 성능지표에서 비슷하거나 우수한 성능을 나타냈다. 따라서 제안한 방법이 더 효율적인 문서 검색 서비스의 발전에 기여할 것으로 기대된다. | - |
| dc.format.extent | 12 | - |
| dc.language | 한국어 | - |
| dc.language.iso | KOR | - |
| dc.publisher | 사단법인 인문사회과학기술융합학회 | - |
| dc.title | 문서 군집화를 위한 워드 임베딩, PCA와 K-평균 군집의 새로운 결합 | - |
| dc.title.alternative | Novel Association of Word Embeddings, PCA and K-means for Text Clustering | - |
| dc.type | Article | - |
| dc.publisher.location | 대한민국 | - |
| dc.identifier.doi | 10.47116/apjcri.2024.11.35 | - |
| dc.identifier.bibliographicCitation | 아시아태평양융합연구교류논문지, v.10, no.11, pp 475 - 486 | - |
| dc.citation.title | 아시아태평양융합연구교류논문지 | - |
| dc.citation.volume | 10 | - |
| dc.citation.number | 11 | - |
| dc.citation.startPage | 475 | - |
| dc.citation.endPage | 486 | - |
| dc.identifier.kciid | ART003140138 | - |
| dc.description.isOpenAccess | N | - |
| dc.description.journalRegisteredClass | kci | - |
| dc.subject.keywordAuthor | 워드 임베딩 | - |
| dc.subject.keywordAuthor | 문서 벡터 | - |
| dc.subject.keywordAuthor | 차원 축소 | - |
| dc.subject.keywordAuthor | K-평균 군집화 | - |
| dc.subject.keywordAuthor | 문서 분류 | - |
| dc.subject.keywordAuthor | Word Embedding | - |
| dc.subject.keywordAuthor | Document Vector | - |
| dc.subject.keywordAuthor | Dimensionality Reduction | - |
| dc.subject.keywordAuthor | K-means | - |
| dc.subject.keywordAuthor | Document Clustering | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
Gyeongsang National University Central Library, 501, Jinju-daero, Jinju-si, Gyeongsangnam-do, 52828, Republic of Korea+82-55-772-0534
COPYRIGHT 2022 GYEONGSANG NATIONAL UNIVERSITY LIBRARY. ALL RIGHTS RESERVED.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.
