클라우드 VM 벤치마크 2026: 성능 / 가격

2 weeks ago 9

  • 7개 클라우드(44종 VM) CPU 성능 및 가성비 벤치마크로, 단일·멀티 스레드·예약·스팟 인스턴스 등 포괄
  • AMD EPYC Turin이 거의 모든 벤치마크에서 1위를 기록하며 x86 진영의 새로운 최상위 CPU로 부상
  • 온디맨드 가격 대비 성능에서는 Hetzner와 Oracle Cloud가 상위를 독식하며, AWS는 Turin을 제외하면 전반적으로 가장 나쁜 가성비를 기록
  • Intel Granite Rapids는 전작 Emerald Rapids의 성능 불안정 문제를 해결하고 일관된 성능을 제공하지만, Turin과의 격차는 여전히 크게 벌어짐
  • 스팟 인스턴스를 활용하면 3년 예약 대비 약 2배의 달러당 성능을 확보할 수 있어, 클라우드 비용 최적화의 핵심 수단임

벤치마크 개요 및 방법론

  • 비교 대상: AWS, GCP, Azure, Oracle Cloud(OCI), Akamai(Linode), DigitalOcean, Hetzner 7개 제공업체, 44종 VM 타입
  • 비용 비교의 일관성을 위해 모든 인스턴스를 2vCPU, 2GB/vCPU RAM, 30GB SSD 기준으로 구성
  • AMD·Intel은 SMT(하이퍼스레딩) 적용으로 2vCPU = 1 물리 코어, ARM 및 일부 x86 예외(AWS C8a, C7a, GCP t2d)는 2vCPU = 2 물리 코어
  • 온디맨드 가격은 미국 내 최저가 리전 기준, 가격은 2026년 1월 시점 기준이며 현재 가격 별도 확인 필요
  • 사용 벤치마크 도구: DKbench(주 벤치마크, Perl·C/XS 기반 19종 서버 워크로드), Geekbench 5, 7zip, NGINX, FFmpeg/libx264, OpenSSL RSA4096(AVX512)
    • Geekbench 6는 멀티코어 측정 방식이 설계상 결함이 있다는 판단 하에 사용하지 않음
  • 성능 범위 파악을 위해 복수 리전에서 인스턴스를 반복 생성·측정하여 최솟값·최댓값 범위로 표시

CPU 세대별 성능 티어 개요

  • AMD: Rome → Milan → Genoa → Turin (세대 순, 하위→상위)
  • Intel: Broadwell → Skylake → Cascade Lake → Ice Lake → Sapphire Rapids → Emerald Rapids → Granite Rapids
  • ARM: Ampere Altra → AmpereOne → AmpereOne M / AWS Graviton2 → Graviton3 → Graviton4 / Google Axion / Azure Cobalt 100
  • 구세대 CPU 타입은 성능이 낮음에도 운영 비용 탓에 오히려 더 비싸게 청구되므로 가능한 한 최신 세대로 업그레이드 필요

단일 스레드 성능 결과

  • AMD EPYC Turin이 전체 1위, 이 정도의 독보적 우위는 시리즈 사상 처음
    • AWS C8a(Turin, SMT 비활성화)가 가장 빠른 Turin 구성
    • GCP c4d는 성능 편차가 크고, 더 저렴한 n4d가 일관성 면에서 우수
  • Intel Granite Rapids: Emerald Rapids의 boost 클럭 의존·노드 경합으로 인한 성능 불안정 문제를 해소, 더 높고 일관된 성능 제공
    • GCP Emerald Rapids는 부하 증가 시 성능 저하가 뚜렷하며, GCP는 이를 위한 "일관된 성능" 모드(boost 비활성화)를 별도 제공
  • ARM 진영에서는 Google Axion이 EPYC Genoa급 단일 스레드 성능으로 ARM 서버 성능 최상위
    • Azure Cobalt 100은 Graviton3~Graviton4 사이
    • Ampere AmpereOne M은 AWS Graviton3 수준으로 소폭 개선
  • 저가 제공업체 중 DigitalOcean은 성능 지표가 하락세, Akamai·Hetzner는 Milan 인스턴스 기준 양호하나 인스턴스 생성 시 성능 수준이 보장되지 않음

멀티 스레드 성능 및 확장성

  • 확장성(Scalability): ARM 및 공유 CPU 인스턴스는 ~100%에 근접, 즉 2vCPU로 단일 vCPU 대비 2배 성능 실현
    • SMT 적용 x86 인스턴스는 100% 미만이며, 50%에 가까울수록 성능 이점이 없음
    • AMD는 전통적으로 Intel보다 SMT 효율이 높으며, Intel은 Ice Lake 이후 개선 추세
    • Akamai Turin 인스턴스는 SMT 적용임에도 71.9%라는 이례적으로 높은 확장성 기록 (원인 불분명)
    • SMT 비활성화 인스턴스: AWS C7a(Genoa), C8a(Turin), GCP t2d(Milan)
  • 멀티 스레드 최강자: SMT 비활성화 Turin 기반 AWS C8a가 차트 압도
    • Google Axion은 이전 비교 1위였던 Genoa C7a와 동등 수준
    • Graviton4가 근접, Cobalt 100이 뒤를 이음
    • 하위권은 Intel Broadwell/Skylake/Ice Lake, AMD Rome
  • 7zip: Turin이 전반적 1위이나, Axion·Graviton4는 압축 해제 부분에서 Turin을 역전; Cobalt 100은 압축 해제 단독 최고 성능
  • NGINX (100 connections): AWS C8a가 2위 대비 거의 2배, Granite Rapids도 우수한 성적
  • FFmpeg H264: Turin 1위, Granite Rapids가 단일 스레드에서 근접; 2 전체 코어 사용 시 Axion이 SMT(단일 코어) 인스턴스 대부분을 Turin 제외하고 추월
  • OpenSSL RSA4096(AVX512): AMD가 자사 확장 기능에서 Intel을 역전, Turin·Genoa 모두 Intel 전 세대 대비 우위; Granite Rapids는 Ice Lake 대비 큰 개선 없음; ARM 및 구형 AMD는 AVX512 미지원으로 Intel Skylake 이하

온디맨드 성능/가격 비교

  • 단일 스레드: Hetzner(공유 코어 포함 시 독보적 1위)·Oracle이 상위, GCP n4d(Turin)·Linode가 후속
    • AWS는 온디맨드 기준 최악의 가성비; Turin이 AWS 내 최선이나 구세대는 최하위
  • 멀티 스레드: Oracle ARM 인스턴스(AmpereOne M)가 1위, Hetzner·Linode 공유 코어가 근접
    • Google Axion·Azure Cobalt 100·DigitalOcean 드롭릿이 2티어 구성
  • Hetzner 공유 코어(CPX22, CAX11)는 가용성 제약(EU·AP 리전 한정, 품절 빈번)에도 불구하고 단위 성능당 가격이 타 제공업체 대비 압도적

예약(Reserved) 성능/가격 비교

  • 1년 예약: GCP Turin(n4d·c4d)이 Oracle과 근접, Azure Cobalt 100·Genoa도 경쟁력 있는 가성비
    • AWS는 C8a 패밀리가 최선, DoIT Flexsave 등 서드파티를 통해 예약 없이도 1년 가격 적용 가능
  • 3년 예약 단일 스레드: GCP Turin이 Oracle·Hetzner 전용 VM을 소폭 앞섬; Azure도 Cobalt 100·Genoa로 경쟁력 확보
    • AWS는 3년 약정 시에도 Akamai·DigitalOcean보다 나은 가성비 제공
  • 3년 예약 멀티 스레드: Azure Cobalt 100이 예상 밖 1위; GCP·OCI ARM이 뒤를 이음; AWS·GCP Turin도 상위권 근접

스팟/선점형 인스턴스 성능/가격 비교

  • 스팟 인스턴스는 클라우드에서 자체 서버 운영 비용에 근접하는 유일한 방법으로 제시
    • 인스턴스 회수 전 경고: AWS·OCI 2분, Azure·GCP 30초
    • Oracle 할인율 고정 50%, 나머지 3사는 리전·시점별 변동 심함
  • 단일 스레드 스팟: Oracle Turin이 고정 할인율로 항상 최상위; GCP·Azure가 가장 깊은 할인 제공(Genoa, Cobalt 100)
    • 스팟 활용 시 3년 예약 대비 약 2배의 달러당 성능 확보 가능
  • 멀티 스레드 스팟: Azure Cobalt 100 1위, OCI AmpereOne M 2위; GCP는 t2d(Milan)이 리전에 따라 최고 가성비; AWS는 Turin으로 간신히 Top 10 진입

클라우드 제공업체별 총평

  • AWS: 전체 ARM 최고 성능은 Graviton5 비공개 베타로 Google Axion에 내줬으나, x86 최고 성능은 비SMT C8a(Turin)로 유지; 온디맨드는 타사 대비 고가이나 스팟·예약·Flexsave 활용 시 경쟁력 있음; 구세대 인스턴스 할인폭이 작아 C8a가 스팟에서도 최선
  • GCP: 4세대 ARM(Axion c4a)·AMD(Turin n4d·c4d) 인스턴스 권장; n4d가 c4d와 성능 거의 동일하면서 저렴; Granite Rapids는 로컬 SSD 추가 비용 없이는 접근 불가(현재 min_cpu_platform 미지원); 스팟은 리전별로 최적 인스턴스 타입이 다름
  • Azure: 자체 개발 ARM Cobalt 100이 Google Axion 대비 약간 낮은 성능이지만 경쟁력 있는 가격; Turin·Granite Rapids는 작성 시점 기준 비공개 프리뷰; 3년 예약 멀티 스레드에서 예상 밖 1위
  • Oracle: 소규모 프로젝트용 무료 4코어 ARM VM(A1) 강력 추천; 유료 인스턴스도 온디맨드 기준 Big 3의 1~3년 예약 가격에 필적하는 가성비; AmpereOne M(A4)·Turin E6가 각각 ARM·x86 최선 옵션; A4는 가용 리전 제한적
  • Akamai(Linode): 공유 코어 Linode는 온디맨드 기준 Hetzner·Oracle 다음 가성비; 생성 시 CPU를 선택할 수 없어 Milan 여부 직접 확인(/proc/cpuinfo) 필요; 전용 인스턴스는 세대 지정 가능(G8=Turin)이나 단일 스레드 성능이 이례적으로 낮음
  • DigitalOcean: 오랫동안 업그레이드 없어 성능 순위 하락, 과부하 현상도 존재; 간편한 인스턴스 업그레이드(원클릭 타입 변경) 등 편의성은 유지
  • Hetzner: 장기 사용자 평판 양호, 과도한 오버프로비저닝 없음(CX23 제외); 공유 코어 CPX22(Genoa)·CAX11(ARM Altra)가 가성비 최고이나 EU/AP 리전 한정 및 품절 빈발; 전용 코어 CCX13은 데이터센터별 성능 편차 존재

최종 권장 사항

  • 최저 예산: Oracle 무료 티어 → Hetzner(EU·AP 리전 허용 시) → 스팟 인스턴스(Azure ARM, Oracle·GCP ARM/AMD)
  • 비공유 CPU 최고 가성비(온디맨드): Oracle AmpereOne M A4 또는 Turin E6; 예약 시 Azure Dpls_v6, GCP c4a/n4d, AWS C8a도 경쟁력 있음
  • 최고 성능: AWS C8a(비SMT Turin)가 단일 인스턴스 최고 성능; Turin 탑재 모든 대형 제공업체 인스턴스가 차상위 티어 형성

Read Entire Article