요약: Memory or Time: Performance Evaluation for Iterative Operation on Hadoop and Spark 이 논문은 Hadoop과 Spark를 비교하여 반복 연산(iterative operations) 성능을 시간과 메모리 관점에서 분석한다. 특히 PageRank 알고리즘을 사용하여 두 시스템의 처리 속도, 메모리 소비, 확장성 등을 평가하며, 각 플랫폼이 특정 시나리오에서 가지는 장단점을 논의한다.주요 내용 1. 연구 배경: • 반복 연산은 데이터 과학, 기계 학습, 그래프 분석 등에서 자주 발생하며, 이 과정에서 효율적인 데이터 처리 요구가 높아짐. • Hadoop은 디스크 기반 데이터 접근으로 반복 작업에서 성능 저하를 겪는 반면, Spark는..