Learn/'24_Fall_(EE542) Internet&Cloud Computin

(Lecture 13) Network with RDMA

QBBong 2025. 1. 8. 13:54
728x90

강의 요약: EE542 Lecture 13 - Network with RDMA

 

이번 강의는 Remote Direct Memory Access (RDMA) 기술을 중심으로 클라우드 네트워크 환경에서의 고성능 데이터 전송과 네트워크 성능 최적화에 대해 다루었다. RDMA는 네트워크 병목 현상을 줄이고 CPU 사용률을 낮추는 데 중요한 기술로, 기존 TCP/IP 기반 네트워크와의 차이점 및 주요 응용 사례를 설명한다.


주요 내용

 

1. DMA(Direct Memory Access)와 RDMA의 차이점

  • DMA:

     CPU의 개입 없이 메모리와 주변 장치 간 데이터를 전송.

     주로 로컬 데이터 전송에 사용.

   RDMA:

     네트워크 상에서 노드 간 직접 메모리 액세스.

     OS 커널의 개입 없이 데이터를 전송하며, 데이터 복사를 줄임(Zero-Copy).

     가상 메모리 간 전송 가능.

 

2. RDMA의 주요 특징

   Remote: 네트워크 노드 간 데이터 전송.

   Direct: OS 커널 개입 없이 NIC(Network Interface Card)가 전송을 담당.

   Memory: 사용자 공간의 가상 메모리를 통해 전송.

   Access: 송신, 수신, 읽기, 쓰기, 원자적(Atomic) 연산 지원.

 

3. RDMA의 장점

   높은 처리량(Throughput).

   낮은 지연시간(Latency).

   높은 메시징 속도(Messaging Rate).

   낮은 CPU 사용률.

   메시지 경계 보존(Message Boundaries Preserved).

   비동기 처리(Asynchronous Operations).

 

4. RDMA의 주요 기술

   InfiniBand:

     고성능 컴퓨팅(HPC)에 적합.

     다양한 속도 지원 (SDR 8Gbps ~ FDR 54Gbps).

   iWARP (Internet Wide Area RDMA Protocol):

     TCP/IP 기반 RDMA 프로토콜.

     기존 인터넷 인프라와 호환 가능.

   RoCE (RDMA over Converged Ethernet):

     Ethernet 기반 RDMA 프로토콜.

   10Gbps ~ 40Gbps 속도 지원.

5. RDMA와 TCP/IP의 차이점

   Zero-Copy:

     데이터가 가상 메모리에서 직접 전송되며, 중간 복사가 없음.

   Kernel Bypass:

     OS 커널의 개입 없이 NIC가 전송 작업 처리.

   비동기 처리:

     I/O 작업 중 스레드가 차단되지 않음.

 

6. RDMA의 응용

   MPI(Message Passing Interface):

     고성능 컴퓨팅(HPC)에서 주로 사용.

   파일 시스템:

     Lustre, NFS_RDMA.

   스토리지 프로토콜:

     iSER(iSCSI Extensions for RDMA), SRP(SCSI RDMA Protocol).

   소켓 인터페이스:

     SDP(Sockets Direct Protocol), rsockets 등.

 

7. RDMA의 도전 과제

   멀티테넌시를 위한 VLAN 통합 필요.

   CPU 및 메모리 버스 병목 현상 해결.

   소프트웨어와 하드웨어 간 최적화 필요.

 

8. iWARP 프로토콜 스택

   RDMAP (RDMA Protocol).

   DDP (Direct Data Placement Protocol).

   MPA (Marker PDU Aligned Framing Layer).


요약

 

RDMA는 기존 TCP/IP 네트워크의 한계를 극복하고, 높은 처리량과 낮은 지연시간을 제공하는 혁신적인 기술이다. InfiniBand, iWARP, RoCE와 같은 RDMA 기술은 고성능 컴퓨팅(HPC) 및 클라우드 네트워크 환경에서 중요한 역할을 하며, 효율적인 데이터 전송을 가능하게 한다.

728x90
반응형