[기고] AI 강국의 조건, GPU 확보 이후에 있다

1 hour ago 2
강동석 전 행정안전부 국가정보자원관리원장강동석 전 행정안전부 국가정보자원관리원장

인공지능(AI) 주도권 경쟁이 갈수록 치열해지고 있다. 정부와 기업이 대규모 데이터센터를 확충하고 그래픽처리장치(GPU)와 신경망처리장치(NPU) 등 AI 가속기 확보에 속도를 내는 흐름은 반가운 일이다. 충분한 컴퓨팅 자원 없이는 거대언어모델(LLM)을 개발하기 어렵고 산업 현장의 AI 활용을 넓히기도 쉽지 않다.

다만 공공 디지털 인프라의 운영 현장을 가까이에서 지켜보며 확인한 점이 있다. 장비를 확보하는 것만으로 서비스 경쟁력이 완성되지는 않는다. 서비스마다 필요한 자원의 규모가 다르고, 같은 서비스도 시간대와 상황에 따라 수요가 달라진다. 장비를 추가로 들여와도 적시에 필요한 만큼의 연산 자원을 활용하지 못하면 충분한 효과를 거두기 어렵다.

이를 가능하게 하는 것이 AI 인프라 소프트웨어(SW)다. 분산된 연산 자원을 하나의 체계 안에서 통합 운영하고, 서비스 수요에 맞춰 활용할 수 있도록 한다. 서버 가상화와 클라우드 관리 플랫폼(CMP), AI 추론 운영 플랫폼 등이 대표적이다.

AI 인프라 SW는 여러 GPU를 하나의 자원 풀처럼 통합 관리하고, NPU를 비롯한 AI 가속기도 업무 특성에 맞게 배치할 수 있다. 대규모 연산이 필요한 업무에는 여러 장비를 집중 투입하고, 상대적으로 작은 업무에는 필요한 만큼 나누어 제공한다. 지원되는 GPU는 자원을 분할해 여러 업무에 할당하고, 남는 자원은 다른 업무에 유연하게 재배치할 수 있다. 여러 장비를 하나처럼 활용하고, 하나의 장비도 낭비 없이 나누어 쓰게 만드는 것이다. AI 인프라의 경쟁력은 장비의 숫자뿐 아니라 보유한 자원을 얼마나 정교하게 운영하느냐에서 갈린다.

국내에서도 공공과 산업 현장을 중심으로 국산 인프라 SW를 적용해 대규모 데이터센터와 핵심 업무 시스템을 안정적으로 운영한 사례가 쌓이고 있다. 외산 솔루션이 주도하던 영역에서도 국산 솔루션이 서버 가상화와 클라우드 관리 기술을 바탕으로 복잡한 자원을 통합 운영하고 있다. 이는 국산 인프라 SW가 단순한 대체재를 넘어 자원 활용 효율과 운영 안정성을 높일 수 있음을 보여준다.

이제는 이러한 기반을 바탕으로 기존 클라우드 관리 역량을 AI 환경에 맞게 확장하고, 자원 통합 관리와 운영 역량을 한 단계 더 고도화해야 한다. 대규모 연산 자원을 실시간으로 조정하고 다양한 서비스 수요에 맞춰 배분하며 고가의 AI 가속기를 최대한 효율적으로 활용해야 한다. 기술 개발만으로는 충분하지 않다. 실제 운영 환경에서 성능과 안정성을 검증하고 그 경험을 다시 기술 고도화로 연결해야 한다.

정부는 데이터센터 확충과 AI 가속기 확보, AI 서비스 육성을 적극적으로 추진하고 있다. 방향은 타당하다. 이제 AI 인프라 SW도 독립적인 투자 영역으로 바라봐야 한다. 자원 통합 관리에 대한 연구개발을 확대하고 국산 인프라 SW가 현장에서 충분히 검증될 수 있도록 실증 기회를 넓혀야 한다. 검증된 기술이 공공 조달과 산업 현장의 도입으로 이어지는 선순환 구조도 필요하다.

AI 인프라 SW는 데이터센터 준공식이나 AI 가속기 도입 발표처럼 당장 가시적인 성과로 드러나지 않는다. 그러나 확보한 연산 자원을 실제 경쟁력으로 바꾸는 힘은 이 보이지 않는 기반에서 나온다. AI 강국의 조건은 GPU와 NPU를 얼마나 많이 확보했느냐에 머물지 않는다. 필요한 순간에 필요한 만큼의 자원을 우리 기술로 유연하게 활용할 수 있어야 한다. AI 인프라 SW 투자는 부가적인 선택이 아니다. 대규모 AI 투자의 성과를 완성하는 필수 조건이다.

강동석 전 행정안전부 국가정보자원관리원장 kangds.smart@gmail.com

Read Entire Article