강의 요약: EE542 Lecture 13 - Network with RDMA
이번 강의는 Remote Direct Memory Access (RDMA) 기술을 중심으로 클라우드 네트워크 환경에서의 고성능 데이터 전송과 네트워크 성능 최적화에 대해 다루었다. RDMA는 네트워크 병목 현상을 줄이고 CPU 사용률을 낮추는 데 중요한 기술로, 기존 TCP/IP 기반 네트워크와의 차이점 및 주요 응용 사례를 설명한다.
주요 내용
1. DMA(Direct Memory Access)와 RDMA의 차이점
• DMA:
• CPU의 개입 없이 메모리와 주변 장치 간 데이터를 전송.
• 주로 로컬 데이터 전송에 사용.
• RDMA:
• 네트워크 상에서 노드 간 직접 메모리 액세스.
• OS 커널의 개입 없이 데이터를 전송하며, 데이터 복사를 줄임(Zero-Copy).
• 가상 메모리 간 전송 가능.
2. RDMA의 주요 특징
• Remote: 네트워크 노드 간 데이터 전송.
• Direct: OS 커널 개입 없이 NIC(Network Interface Card)가 전송을 담당.
• Memory: 사용자 공간의 가상 메모리를 통해 전송.
• Access: 송신, 수신, 읽기, 쓰기, 원자적(Atomic) 연산 지원.
3. RDMA의 장점
• 높은 처리량(Throughput).
• 낮은 지연시간(Latency).
• 높은 메시징 속도(Messaging Rate).
• 낮은 CPU 사용률.
• 메시지 경계 보존(Message Boundaries Preserved).
• 비동기 처리(Asynchronous Operations).
4. RDMA의 주요 기술
• InfiniBand:
• 고성능 컴퓨팅(HPC)에 적합.
• 다양한 속도 지원 (SDR 8Gbps ~ FDR 54Gbps).
• iWARP (Internet Wide Area RDMA Protocol):
• TCP/IP 기반 RDMA 프로토콜.
• 기존 인터넷 인프라와 호환 가능.
• RoCE (RDMA over Converged Ethernet):
• Ethernet 기반 RDMA 프로토콜.
• 10Gbps ~ 40Gbps 속도 지원.
5. RDMA와 TCP/IP의 차이점
• Zero-Copy:
• 데이터가 가상 메모리에서 직접 전송되며, 중간 복사가 없음.
• Kernel Bypass:
• OS 커널의 개입 없이 NIC가 전송 작업 처리.
• 비동기 처리:
• I/O 작업 중 스레드가 차단되지 않음.
6. RDMA의 응용
• MPI(Message Passing Interface):
• 고성능 컴퓨팅(HPC)에서 주로 사용.
• 파일 시스템:
• Lustre, NFS_RDMA.
• 스토리지 프로토콜:
• iSER(iSCSI Extensions for RDMA), SRP(SCSI RDMA Protocol).
• 소켓 인터페이스:
• SDP(Sockets Direct Protocol), rsockets 등.
7. RDMA의 도전 과제
• 멀티테넌시를 위한 VLAN 통합 필요.
• CPU 및 메모리 버스 병목 현상 해결.
• 소프트웨어와 하드웨어 간 최적화 필요.
8. iWARP 프로토콜 스택
• RDMAP (RDMA Protocol).
• DDP (Direct Data Placement Protocol).
• MPA (Marker PDU Aligned Framing Layer).
요약
RDMA는 기존 TCP/IP 네트워크의 한계를 극복하고, 높은 처리량과 낮은 지연시간을 제공하는 혁신적인 기술이다. InfiniBand, iWARP, RoCE와 같은 RDMA 기술은 고성능 컴퓨팅(HPC) 및 클라우드 네트워크 환경에서 중요한 역할을 하며, 효율적인 데이터 전송을 가능하게 한다.
'Learn > '24_Fall_(EE542) Internet&Cloud Computin' 카테고리의 다른 글
(Lecture 16) Database in the Cloud (0) | 2025.01.09 |
---|---|
(Lecture 15) IIoT Real World Example (0) | 2025.01.09 |
(Lecture 12) Logic, Memory, and Reconfigurable Hardware Accelerators (0) | 2025.01.08 |
(Lecture 11) Hardware Acceleration in Cloud (0) | 2025.01.08 |
(Lecture 10) Uses of Cloud (0) | 2025.01.08 |