엔비디아, 차세대 AI 가속기 ‘베라 루빈’ 양산…에이전트 처리량 10배↑

1 week ago 8

[아이티비즈 김문구 기자] 엔비디아가 전 세계 에이전틱 AI 팩토리를 구동하기 위한 차세대 AI 가속기 '베라 루빈(Vera Rubin)' 플랫폼의 양산을 시작했다.

베라 루빈은 엔비디아의 가장 광범위한 POD 규모 플랫폼으로, 5개의 전용 랙이 하나의 대규모 AI 슈퍼컴퓨터처럼 작동해 에이전틱 워크로드를 처리한다. 이 플랫폼은 엔비디아 베라 루빈 NVL72 시스템, 엔비디아 베라 CPU, 엔비디아 그록 3(Groq 3 LPX), 엔비디아 베라 블루필드-4 STX(BlueField-4 STX) 스토리지, 엔비디아 스펙트럼-6 SPX 이더넷(Spectrum-6 SPX Ethernet) 랙을 완전 통합 시스템으로 결합한다.

베라 루빈은 대규모 환경에서 이전 세대 엔비디아 그레이스 블랙웰(Grace Blackwell) 플랫폼 대비 10배 높은 에이전트 처리량을 제공한다.

베라 루빈은 3세대 엔비디아 MGX 랙스케일 시스템이다. 검증된 오픈소스 MGX 설계를 기반으로, 수백 개의 엔비디아 공급망 생태계 파트너가 30개국 350개 이상의 공장에서 베라 루빈 생산을 확대하고 있다. 특히 대만에만 150개 파트너가 참여하고 있다.

스케일아웃(scale-out)과 스케일어크로스(scale-across) 기반의 AI 팩토리 배포를 지원하기 위해 베라 루빈 플랫폼은 현재 생산 중인 엔비디아 스펙트럼-X 이더넷 포토닉스(Photonics)를 도입한다. 이는 200Gb/s 서데스(SerDes)를 탑재한 세계 최초의 공동 패키징 광학(CPO) 기반 스위치다.

스펙트럼-X 이더넷 포토닉스는 CPO 기반의 차세대 스위칭 기술로, 기존 트랜시버를 사용하는 네트워크 대비 전력 효율을 5배 높이고, AI 가동 시간을 5배 늘리며, 배포 시간을 1.3배 단축한다.

엔비디아 CPO 네트워킹은 설계를 단순화하고 컴퓨팅 연산에 더 많은 전력을 할당할 수 있도록 돕는다. 이를 통해 100만 개 규모 GPU 가동 AI 팩토리를 위한 핵심 패브릭을 제공한다. 코어위브, 람다, 오라클 클라우드 인프라스트럭처가 초기 생태계 파트너와 도입 기업으로 참여한다.

또한 엔비디아 베라 루빈 플랫폼은 엔비디아 블루필드-4 DPU도 통합한다. 블루필드-4 DPU는 최대 800Gb/s 속도의 소프트웨어 정의 네트워킹과 내장형 멀티테넌트 격리 기능을 제공한다. 고객은 엔비디아 블루필드-4 고급 보안 신뢰 아키텍처(Advanced Secure Trusted Resource Architecture)를 통해 네트워크 운영을 간소화하고, 테넌트 격리 성능을 높이며, 100만 GPU AI 클러스터 전반에 걸쳐 더 높은 수준의 제어력을 확보할 수 있다.

엔비디아 창립자 겸 CEO 젠슨 황은 “에이전틱 AI는 새로운 유형의 워크로드다. 단 하나의 프롬프트만으로도 추론, 검색, 도구 활용, 응답 생성에 이르는 수천 단계의 여정이 시작될 수 있다"며 "베라 루빈은 이를 위해 설계됐다"고 말했다.

이어 젠슨 황 CEO는 "베라 루빈은 차세대 산업 혁명을 구동하는 데 필요한 성능, 효율, 보안을 바탕으로 대규모 인텔리전스를 제공하는 AI 팩토리 엔진이다”고 설명했다.

Read Entire Article