Lab 06 요약: Hadoop과 Spark를 활용한 빅데이터 처리 Lab 06에서는 Hadoop과 Spark를 사용해 대규모 데이터 처리와 분산 컴퓨팅 환경에서의 작업을 실습합니다. 실습은 두 부분으로 구성되며, 첫 번째는 Hadoop을 사용한 HDFS 설정과 MapReduce 작업, 두 번째는 Spark를 사용한 PySpark 프로그램 작성 및 비교 분석입니다.Part 1: Hadoop 설정 및 MapReduce 실습 1. Hadoop 클러스터 구성 • 인스턴스 구성: • 1개의 NameNode와 3개의 DataNode로 구성된 클러스터 설정. • 각 인스턴스는 Ubuntu Server 16.04 AMI를 사용. • 최소 사양: • 2 vCPU, 4GB RAM, 12GB 디..