Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

빅데이트 처리 및 분석을 위한 Rhipe 플랫폼Rhipe Platform for Big Data Processing and Analysis

Other Titles
Rhipe Platform for Big Data Processing and Analysis
Authors
정병호신지은임동훈
Issue Date
2014
Publisher
한국통계학회
Keywords
빅데이터; R; Hadoop; Rhipe; 다중회귀분석; Big data; R; Hadoop; Rhipe; multiple regression analysis.
Citation
응용통계연구, v.27, no.7, pp 1171 - 1185
Pages
15
Indexed
KCI
Journal Title
응용통계연구
Volume
27
Number
7
Start Page
1171
End Page
1185
URI
https://scholarworks.gnu.ac.kr/handle/sw.gnu/19518
ISSN
1225-066X
2383-5818
Abstract
R과 Hadoop의 통합환경인 Rhipe 개발로 인해 분산처리 환경 하에서 대용량 데이터 분석이 가능해졌다. 본 논문에서는 Rhipe을 이용하여 실제 데이터와 모의실험 데이터에서 다양한 데이터 크기에 따라 다중 회귀분석을 구현하였다. Hadoop의 가상분산 모드(pseudo-dstrivuted mode)와 완전분산 모드(fully-distrivuted mode) 구축 시스템 비교에서 완전분산 모드 시스템이 가상분산 모드 시스템보다 처리 속도가 빠르고 데이터 노드의 수가 많을수록 계산 시간이 점점 줄어드는 것을 알 수 있었다. 또한, 제안된 Rhipe 플랫폼의 성능을 평가하기 위해 기본 R 패키지인 stats와 bigmemory 상에서 유용한 biglm 패키지와 처리 속도를 비교하였다. 실험결과 Rhipe은 데이터의 크기가 클수록 map task 개수가 증가되고 동시에 병렬처리로 인해 다른 패키지들보다 빠른 처리속도를 보였다.
Files in This Item
There are no files associated with this item.
Appears in
Collections
자연과학대학 > Dept. of Information and Statistics > Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Altmetrics

Total Views & Downloads

BROWSE