AMD의 AI 미래는 랙 스케일 ‘Helios’임

5 days ago 3

  • AMD Instinct MI355X GPU는 두 배의 AI 연산 성능, 더 많은 HBM 메모리, NVIDIA 대비 토큰/$ 효율 40% 향상
  • ROCm 7 소프트웨어는 성능 개선과 동시에 Day-0 지원을 강조하며 AI 생태계 확장에 집중
  • 랙 스케일 통합 솔루션은 AMD CPU+GPU+네트워크를 결합한 턴키형 AI 인프라 제공
  • 로드맵: 2026년 4배 성능, HBM4, 확장성 포함 차세대 아키텍처와 Helios 랙 공개 예고
  • 에너지 효율: 2030년까지 랙스케일 기준 20배 효율 개선 목표로, 하드웨어와 소프트웨어 동반 혁신 추진

전체 요약

랙 스케일 AI 성장 기반의 AMD 행보

  • AI 하드웨어 수요 급증에 따라 업계 주요 반도체 기업 모두 시장 점유와 성장 가속에 집중하는 흐름임
  • AMD는 Instinct MI300X로 AI 서버용 GPU 시장에 빠르게 진입하며, 최근 핵심 기능과 성능에 올인한 첫 아키텍처 출시 경험을 토대로 성공적인 고마진 매출을 기록함
  • 이에 힘입어 차세대 AI 서버 하드웨어로 입지를 지속적으로 확대하는 전략을 발표함

Instinct MI350 가속기 세부 혁신

AI 연산 성능의 비약적 강화

  • Instinct MI350 시리즈는 새로운 CDNA4 아키텍처 기반으로 MI300X 대비 매트릭스 연산(텐서 연산) 처리량을 클럭당 두 배 이상 높인 구조임
  • FP6, FP4 등 저정밀 실수 처리를 본격 지원해 추론 부담을 줄이면서 전체 연산량도 획기적으로 증대함
  • FP6 연산의 경우, 경쟁사 NVIDIA Blackwell 대비 두 배 속도로 처리하도록 설계되어 성능 우위를 추구함
  • 288GB HBM3E 메모리(8 스택)와 8TB/sec 대역폭 등 메모리 구성도 대폭 업그레이드함
  • TSMC N3P 공정 기반의 초대형 1850억 트랜지스터 칩, 효율적 다이 스태킹 구조로 구현됨

다양한 SKU, 고성능/고전력화 트렌드

  • 액체냉각 전용 MI355X(2.4GHz, 5PFLOPS) 및 공랭 MI350X(2.2GHz, 4.6PFLOPS)로 나뉨
  • 소비전력은 MI300X 대비 높아져, 공랭형이 1000W, 액체냉각형이 1400W임
  • 한 랙당 128개 MI355X 장착시 GPU만으로 180kW급 전력 소모 가능함
  • 가격 경쟁력도 강조되며, NVIDIA 대비 토큰/$ 기준 40% 이상 우위(30% 저렴) 예상임
  • 2024년 3분기부터 파트너사 공급 시작, 실제 공급 속도는 유동적임

ROCm 7 소프트웨어 전략

Day-0 지원과 성능 극대화

  • ROCm 7은 CDNA4, MI350 시리즈 가속기 대응 및 성능, 엔터프라이즈 관리 등 전방위 개선 추진함
  • Pytorch 등 주요 프레임워크의 Day-0 지원이 목표임
  • 2024년 3분기에는 Windows 네이티브 Pytorch, ONNX 런타임, RDNA 4/3 GPU 지원도 시작함
  • 소프트웨어 최적화만으로 MI300X 세대 성능이 ROCm 7에서 ROCm 6 대비 최대 3.8배 향상됨
  • ROCm Enterprise AI를 통해 대규모 AI 클러스터 운영, 모델 파인튜닝 등 엔터프라이즈 특화 툴 제공함

네트워크 생태계 완성: Pollara 400 AI NIC

  • Pensando 인수 이후 AMD 최초의 네트워크 카드인 Pollara 400 AI NIC(400G Ethernet, TSMC N4 공정) 출시
  • 확장성과 프로그래머블 P4 NIC 기능으로 AMD 기반 슈퍼컴퓨터 랙 구성 지원
  • Ultra Ethernet Consortium 호환 최초 AI NIC으로, 차세대 확장 네트워킹 기반 마련

MI400 기반 랙 스케일 미래 로드맵

  • MI400(2026년) : FP8 기준 AI 성능 두 배, HBM4 432GB/19.6TB/sec 대역폭을 목표로 신세대 아키텍처(CDNA Next) 적용
  • Ultra Accelerator Link로 8 GPU → 1024 GPU 스케일업 확장, 대규모 병렬처리 지원
  • Helios 랙시스템: MI400, EPYC Venice(6세대), Vulcano(800G NIC) 결합, 차세대 진영(NVIDIA Vera Rubin) 대비 메모리/네트워크 우위 강조
  • 오픈된 로드맵을 통해 매년 CPU, GPU, 랙 시스템 핵심 아키텍처 혁신 계획 제시
  • 2030년까지 랙 스케일 에너지 효율 20배, 전체 효율 100배 향상을 목표로 하드웨어·소프트웨어 최적화에 매진함

결론

  • AMD는 Instinct MI350~Helios 시리즈, CDNA 4~Next, 랙 스케일 턴키 솔루션 등으로 AI 인프라 시장의 차별화된 리더십 확보를 노림
  • 가까운 시기엔 새로운 MI350, CDNA4 아키텍처 및 ROCm 7 소프트웨어가 주축이 될 전망임
  • NVIDIA와의 AI 서버 시장 경쟁에서 성능, 비용, 확장성, 효율성 모두를 강화하려는 전략 전개

Read Entire Article