Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

RHadoop을 이용한 빅데이터 분산처리 시스템open accessBig data distributed processing system using RHadoop

Other Titles
Big data distributed processing system using RHadoop
Authors
신지은정병호임동훈
Issue Date
2015
Publisher
한국데이터정보과학회
Keywords
Big data; Hadoop; parallel regression analysis; R; RHadoop; 병렬회귀분석; 빅데이터; 하둡; R; RHadoop
Citation
한국데이터정보과학회지, v.26, no.5, pp 1155 - 1166
Pages
12
Indexed
KCI
Journal Title
한국데이터정보과학회지
Volume
26
Number
5
Start Page
1155
End Page
1166
URI
https://scholarworks.gnu.ac.kr/handle/sw.gnu/17943
DOI
10.7465/jkdi.2015.26.5.1155
ISSN
1598-9402
Abstract
기하급수적으로 증가하는 대용량 데이터를 저장, 분석하는데 기존 방식으로는 거의 불가능하여 이를 가능케 해 주는 기술이 바로 하둡이다. 최근에 R은 하둡기술을 활용하여 분산처리에 기반한 빅데이터 분석 엔진으로 활용되고 있다. 본 논문에서는 R과 하둡의 통합환경인 RHadoop을 이용하여 실제 데이터와 모의실험 데이터에서 다양한 데이터 크기에 따라 병렬 다중 회귀분석을 구현하고자 한다. 또한, 제안된 RHadoop 플랫폼의 성능을 평가하기 위해 기본 R 패키지의 lm 함수, bigmemory 상에서 유용한 biglm 패키지와 처리 속도를 비교하였다. 실험결과 RHadoop은 데이터 노드가 많을수록병렬처리로 인해 빠른 처리속도를 보였고 또한 대용량의 데이터에 대해 다른 패키지들보다 빠른 처리속도를 보였다.
Files in This Item
There are no files associated with this item.
Appears in
Collections
자연과학대학 > Dept. of Information and Statistics > Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Altmetrics

Total Views & Downloads

BROWSE