'달 탐사 10배' 인류 최대 프로젝트…AI 인프라 투자 공식 바뀐다

3 hours ago 1

지난해 10월 아마존이 소유한 펜실베이니아주 데이터센터에서 기술자가 일하고 있다. /사진=로이터

지난해 10월 아마존이 소유한 펜실베이니아주 데이터센터에서 기술자가 일하고 있다. /사진=로이터

빅테크 기업들이 인공지능(AI) 주도권을 잡기 위해 인류 역사상 유례없는 규모의 자본 투자를 단행하고 있다. 마이크로소프트(MS), 알파벳(구글), 메타, 아마존 등 4대 기업의 올해 자본지출(CAPEX) 합계는 6000억 달러(약 850조 원)를 넘어설 전망이다. 연간 국내총생산(GDP) 비중으로는 미국 항공우주국(NASA)의 아폴로 프로젝트보다 10배 이상 많은 수치다.

GDP 대비 비중으로 달탐사 프로젝트의 10배에 달하는 빅테크의 AI 인프라 투자 /자료=월스트리트저널

GDP 대비 비중으로 달탐사 프로젝트의 10배에 달하는 빅테크의 AI 인프라 투자 /자료=월스트리트저널

이러한 막대한 자금의 흐름에 올라타려면 어떻게 해야 할까. 젠슨 황 엔비디아 최고경영자(CEO)는 AI 인프라를 에너지·반도체·데이터센터·AI 모델·애플리케이션으로 이뤄진 5단 케이크에 비유했다. 이 중 아래 3단인 에너지, 반도체, 데이터센터를 중심으로 최신 트렌드를 분석했다.

젠슨 황 엔비디아 CEO가 언급한 5단 케이크론. /=AI 생성이미지

젠슨 황 엔비디아 CEO가 언급한 5단 케이크론. /=AI 생성이미지

4~5년 기다릴 시간 없다 …부상하는 가교 전력

AI 경쟁의 최대 병목 구간은 '전력'이다. 로렌스버클리 국립연구소에 따르면 미국 내 전력망 연결 대기 시간은 평균 5년에 달한다. 특히 세계 최대 데이터센터 밀집지인 버지니아주에서는 대형 시설 가동까지 최장 7년을 기다려야 하는 것으로 알려졌다.

이에 빅테크들은 전력망을 거치지 않고 발전소와 직접 전력구매계약(PPA)을 맺는 '비하인드 더 미터(Behind-the-Meter)' 전략을 택하고 있다. 이는 계량기를 통하지 않고 직접 전력을 수급하는 전략을 말한다. 투자은행 제프리스는 2030년까지 데이터센터 전력 수요 증가분의 최대 33%가 이 비하인드 더 미터, 발전소와 데이터센터가 직접 연결되는 방식으로 충족될 것으로 내다봤다.

'달 탐사 10배' 인류 최대 프로젝트…AI 인프라 투자 공식 바뀐다

아마존이 2024년 펜실베이니아주 서스퀘하나 원자력발전소 인근 데이터센터 부지를 매입한 것이 대표적이다. 구글과 아마존, 메타(아템 에너지)는 이미 자체 에너지 자회사를 설립해 전력 시장의 주요 플레이어로 떠올랐다.

다만 원전 건설에도 적어도 수년이 걸린다. 미국은 1979년 쓰리마일 원전 사태 이후 30년 넘게 신규 원전을 짓지 않았기 때문에 신규 공급이 나오기 어려운 상황이다. 이에 항공기 가스 터빈을 발전기로 만들어 데이터센터에 연결하는 상황도 벌어지고 있다. 단기 전력 부족을 해결하기 위한 '브릿지 에너지(가교 전력원)'인 셈이다.

데이터센터 운영사 크루소는 최근 GE버노바로부터 항공기 가스 터빈 29기를 구매했다. 항공기 엔진 기술을 활용한 이 터빈은 컨테이너 형태로 즉시 설치가 가능해 전력망 확충 전까지의 공백을 메우는 수단으로 부상했다. 항공 스타트업 붐슈퍼소닉의 블레이크 숄 최고경영자(CEO)는 "비행기를 먼저 만들 줄 알았는데 샘 올트먼 오픈AI CEO가 전력 설비를 만들어 달라고 사정했다"고 전했다. AI 열풍으로 뜻밖의 수혜를 보고 있다는 것이다.

항공기 터빈. /사진=게티이미지뱅크

항공기 터빈. /사진=게티이미지뱅크

'데이터센터 속도전'을 펼치고 있는 일론 머스크 테슬라 CEO도 가교 전력원을 적극 활용하고있다. 머스크 CEO는 지난 11일 세계 최대 컴퓨팅 단지이자 xAI의 컴퓨팅 기지인 테네시주 멤피스의 슈퍼콜로서스 내부를 공개했다.

슈퍼콜로서스는 2024년 7월 완공된 콜로서스1, 지난달 운영을 시작한 콜로서스2, 그리고 작년 말 건물을 매입해 짓고 있는 콜로서스3로 구성된다. 콜로서스1의 경우 부지 선정부터 가동까지 122일이 걸렸다. 또 콜로서스2는 GPU 2만7000개를 연결한 데이터홀 하나를 가동하는데까지 6주가 걸렸다.

머스크는 실시간으로 건설되는 데이터센터가 전력망에 연결될 때까지 기다리는 대신 수십 대의 메탄가스 터빈을 설치했다. '1년 이내로 사용할 시 허가가 필요없다'는 지역 규제의 허점을 이용한 것이다. 다만 미국 환경보호청(EPA)이 지난달 "대기질 규제 허가를 받지 않고 운영돼 불법"이라고 지적하며 제동이 걸렸다.

일론 머스크 테슬라 CEO가 스페이스X 공장 내부에서 직원들과 사진을 찍고 있다. /사진=AP

일론 머스크 테슬라 CEO가 스페이스X 공장 내부에서 직원들과 사진을 찍고 있다. /사진=AP

지역 주민의 반대와 정부 규제에 부딪힌 머스크 CEO는 지구 밖 데이터센터 건설을 시도하고 있다. 우주기업 스페이스X를 이용하겠다는 구상이다. 머스크 CEO는 AI 칩과 태양광발전 패널을 실은 위성 100만 개를 띄우겠다는 계획을 추진하고 있다. 태양 복사 에너지를 흡수하는 위성 군집 '다이슨 스웜'을 구축하겠다는 것이다. 1T짜리 위성 100만 개를 쏘아 올려 100GW의 전력을 확보할 예정이다.

구글 역시 이런 프로젝트를 진행하고 있다. 바로 지난해 11월 발표한 '프로젝트 선캐처'다. 구글 텐서프로세싱유닛(TPU)을 장착한 태양광 위성 편대를 레이저 광통신으로 연결하는 프로젝트로, 내년 초까지 프로토타입 두 기를 쏘아 올릴 계획이다

학습서 추론으로…흔들리는 엔비디아 지배력

반도체 단에서는 '학습'에서 '추론'으로 시장 이동이 눈에 띈다. 학습은 AI를 훈련시키는 과정, 추론은 이를 실제로 활용하는 단계다. AI 모델의 훈련이 어느 정도 궤도에 오르면서, 실제 서비스 운영 시 발생하는 추론 비용과 효율성이 기업의 핵심 과제로 자리 잡았다.

이 과정에서 엔비디아의 범용 그래픽처리장치(GPGPU)가 가진 구조적 한계가 드러나고 있다. 추론 단계에서의 전력 효율과 지연 시간(latency) 문제다. GPGPU는 여러 형태의 데이터를 학습하는 범용적인 작업에 뛰어나지만, 단순 계산을 반복하는 추론에 있어서는 전력 대비 효율이 떨어진다는 한계를 갖고 있다. 이에 구글, 아마존, 마이크로소프트 같은 빅테크는 자체적인 주문형 반도체, ASIC를 내놓으며 추론 시장에 도전장을 내밀고 있다.

AI칩에서 추론·학습시장 비중의 변화. /자료=딜로이트 보고서 재구성

AI칩에서 추론·학습시장 비중의 변화. /자료=딜로이트 보고서 재구성

특히 실시간 응답이 중요한 AI 에이전트 서비스를 준비하는 오픈AI 등은 엔비디아의 대안을 적극 모색 중이다. 오픈AI는 지난달 반도체 스타트업 세레브라스(Cerebras)와 100억달러 규모의 컴퓨팅 계약을 맺었다. 세레브라스는 하나의 칩에 트랜지스터 4조 개가 들어가는 초거대 반도체를 만든다. 수백 개 분량의 메모리가 하나의 칩에 들어가다 보니 병목 현상에서 비교적 자유롭다.

오픈AI는 지난 12일 세레브라스 칩을 이용한 코딩도구 GPT-5.3 코덱스 스파크를 출시했다. GPT-5.3 코덱스를 경량화한 모델이다. 테크전문매체 벤처비트에 따르면 코덱스 스파크는 정확성이 58.4%로 코덱스(77.3%)보다 낮지만, 15~17분 걸릴 코딩을 2~3분 만에 완료해냈다.

데이터센터 케이블 구리유리로

데이터센터 내부 네트워크에서는 '구리에서 유리로' 세대교체가 가속화하고 있다. 메타는 지난달 코닝과 최대 60억 달러(약 8조5000억원) 규모의 광섬유 공급 계약을 체결했다. AI 데이터센터 역사상 최대 규모의 광섬유 거래다.

메타가 이러한 대규모 계약을 체결한 것은 AI 연산량이 급증하며 데이터 전송 속도가 물리적 한계인 '구리의 벽(Copper Cliff)'에 부딪혔기 때문이다. 고주파에서 전기 신호가 구리선 겉면으로만 흐르는 '표피 효과' 때문에 저항이 급격히 올라간다. 이를 막으려면 구리 두께를 키우고 길이를 짧게 해야 한다.

현재 엔비디아 블랙웰 GPU가 장착된 NV링크 랙의 데이터 전송 속도는 초당 800기가비트(Gbps)다. 올해 출시되는 차세대 칩 베라 루빈은 초당 1600기가비트, 기존의 2배다. 1600기가비트가 되면 구리 케이블 길이는 2m에서 1m로 줄여야 한다. 보드 사이의 연결도 어려워지는 것이다. 베라 루빈 다음 모델을 준비하기 위해 구리선에는 한계가 있다는 분석이 나오는 이유다. 반면 광섬유는 1600기가비트, 3200기가비트 등 초고속 전송 환경에서도 일정한 두께를 유지할 수 있고 유지 보수 비용이 싸다는 평가를 받는다.

MS 역시 진공 상태의 관을 통해 빛의 속도를 1.5배 높이는 '중공 광섬유' 개발에 착수하는 등 '유리 확보' 경쟁에 사활을 걸고 있다.

전문가들은 AI 패권의 향방이 알고리즘을 넘어 '물리법칙의 제약'을 누가 먼저 해결하느냐에 달려 있다는 분석을 내놓고 있다. 전력, 발열, 그리고 빛의 속도라는 물리적 한계를 극복하기 위한 빅테크들의 투자는 당분간 더욱 가팔라질 것으로 전망된다.

김인엽 기자

Read Entire Article