AMD의 칩렛 APU: Strix Halo 개요

5 hours ago 1

  • Strix Halo는 AMD가 선보인 최대 규모의 클라이언트용 칩렛 APU로, 고성능 CPU와 GPU 작업을 통합 처리하도록 설계됨
  • 16코어 Zen 5와 40개의 RDNA 3.5 iGPU 컴퓨트 유닛이 탑재되어 데스크톱급 CPU 및 미드레인지 외장 GPU에 근접한 성능을 제공함
  • LPDDR5X-8000 메모리 버스와 32MB Infinity Cache를 적용하여 높은 대역폭과 낮은 레이턴시 환경 구현
  • iGPU 성능은 기존 모바일 APU를 압도하고, 일부 환경에서는 중급 외장 GPU와도 경쟁 가능함
  • ML(머신러닝) 성능은 ROCm 지원 대기 중으로 향후 확장성 및 발전 가능성 기대

소개 및 제품 개요

  • Strix Halo는 AMD가 CES 2025에서 발표한 첫 소비자용 칩렛 APU
  • 모바일 프로세서임에도 데스크톱에 필적하는 고성능을 추구하며, 55W~120W TDP 범위 지원, 별도 외장 그래픽 없이도 고성능 구현
  • 16코어 Zen 5 아키텍처(듀얼 8코어 CCD)와 데스크톱 제품과 동일한 512b FPU를 활용함
  • 5.1GHz 최대 부스트 클럭(데스크톱 Ryzen 9 9950X보다는 600MHz 낮음) 지원
  • 메인 GPU 역할을 하는 RDNA 3.5 iGPU: 40컴퓨트 유닛, 32MB Infinity Cache, 2.9GHz 부스트 클럭 → RX 7600 XT~RX 7700 레벨의 계산 성능
  • 256b LPDDR5X-8000 메모리 버스(최대 256GB/s, 모든 부품 공유; RX 7600 XT의 288GB/s보다는 소폭 낮음, 기존 APU 대비 월등)** 적용**

테스트 환경 및 기기

  • Asus ROG Flow Z13 (2025)HP ZBook Ultra G1a 14” 를 활용해 실사용 성능 측정
  • ROG Flow Z13은 게이밍 중심 테스트, ZBook Ultra G1a는 마이크로벤치마킹에 사용

CPU 관점의 메모리 서브시스템

  • 메모리 레이턴시: Strix Point(~128ns) 대비 Strix Halo(~123ns)는 거의 차이 없음
  • CPU는 IO 다이 내 32MB Infinity Cache에 직접 접근 불가, 이는 인터뷰를 통해 공식 확인됨
  • 데스크톱 CPU(9950X) 는 75~80ns로 모바일 대비 훨씬 낮은 레이턴시
  • 메모리 대역폭: 16코어가 순수 읽기-수정-덧셈 연산에서 175GB/s 이상, 읽기는 124GB/s 달성 가능
    • 단일 CCD 대역폭은 64GB/s(읽기), 43GB/s(쓰기)로 실제 총 103GB/s 수준
    • 데스크톱과 동일하게 CCD-IO 다이 간 링크는 2000MHz, 사이클당 32바이트

CPU 성능

  • Strix Halo CPU는 지난 세대 데스크톱 플래그십(7950X) 과 동일한 정수 연산 성능을 확보, 클럭 스피드는 11.7% 감소 있음
  • 부동소수점 성능은 현 플래그십(9950X)과 근접, 일부 부부테스트에서 역전 현상
  • SPEC CPU 2017 Integer/FP 서브테스트에서 Strix Halo는 9950X와 근접하거나 일부 항목에서 초과, 다만 LPDDR5X 버스의 더 높은 레이턴시로 근소한 차이 발생

GPU 관점의 메모리 구조

  • Strix Halo GPU의 메모리 대역폭은 모든 모바일 SoC 중 압도적으로 높음
  • 단, RTX 5070 Mobile에 비해 메모리 대역폭은 50% 낮음
  • Infinity Cache(MALL) 성능은 5070M L2보다 40% 높고, 용량도 33% 큼. 4MB L2 캐시는 2.5TB/s 대역폭 제공
  • Strix Halo의 L2 캐시 레이턴시는 5070M L2보다 낮고, 32MB MALL 레이턴시는 5070M L2와 유사
  • 전체 메모리 레이턴시는 5070M 대비 35% 더 낮음

GPU 연산 처리량(Throughput)

  • 부동소수점 연산 처리량: Strix Point의 약 2.5배, 5070M과 유사 혹은 상회
    • FP16 결과에서 5070M만 기대치 미달(아마 벤치마크상의 특이 사항)
  • 정수 연산 처리량: 5070M이 Radeon 8060S보다 높음

GPU 성능 및 게이밍

  • iGPU로써 Strix Halo는 기존의 Intel/AMD iGPU 대비 압도적 성능, 외장 GPU와도 근접한 경쟁력
  • 델타가 큰 게임(Cyberpunk 2077) 테스트에서:
    • 배터리 환경: Radeon 8060S가 같은 조건의 5070M 대비 7.5% 뛰어난 1080p 성능
    • 벽전원 환경: 1080p에서는 Radeon 8060S가 2.5% 앞섬, 1440p에서는 5070M이 8.3% 앞섬
    • 세부 설정/전력 조건에 따라 양쪽 모두 경쟁력 확보, iGPU가 외장 GPU와 실질적 대등 성능 보임
  • Fluid X3D 및 연산형 워크로드에서는 Radeon 8060S가 인텔/AMD 기존 iGPU들을 완전히 초월함

결론

  • Strix Halo는 고성능 CPU-GPU 통합 SoC를 목표로 다양한 활용 환경에서 뛰어난 성능 발휘
  • 데스크톱 Zen 5 CPU 및 미드레인지 외장 GPU와도 경쟁, 모바일/데스크톱 모두 대응
  • 효율성과 통합성(iGPU의 장점) 을 유지하면서도, 고성능을 보유
  • 고사양 전용 외장 GPU보다 위에 올라서진 않지만, 소형 기기와 통합 환경에선 최고의 유연성과 성능 제공
  • ML 성능은 ROCm 지원 지연으로 차기 분석 필요. 향후 확장성과 대용량 메모리 버스 설계(Apple Max/Ultra처럼) 가능성 언급
  • Strix Halo의 성공적 설계 방식이 추후 AMD 고성능 APU 라인업 확장에 밑거름이 될 전망

Read Entire Article