장세의 델 테크놀로지스 UDS 사업부 상무 인터뷰
"AI 스토리지, 성능보다 워크로드에 맞는 선택이 중요"
[아이뉴스24 윤소진 기자] '때와 장소, 상황에 맞게'라는 의미의 TPO(Time, Place, Occasion)가 인공지능(AI) 스토리지 선택에서도 중요해지고 있다. AI 학습에 필요한 이미지·영상 등 급증하는 비정형 데이터를 효율적으로 처리할 수 있는 스토리지 인프라 선택이 AI 프로젝트의 핵심 요소로 떠오르면서 델의 AI 워크로드별 맞춤형 스토리지 전략이 주목받고 있다.

"AI 스토리지, 비용 절감과 관리 효율성이 핵심"
장세의 델 테크놀로지스 UDS(비정형데이터솔루션)사업부 상무는 최근 아이뉴스24와 가진 인터뷰에서 "AI 워크로드에 따라 가장 효율적인 스토리지 방식이 다르다"며 "무조건 최고 성능에만 고집할 필요가 없다"고 말했다. 대형 AI 모델 개발과 달리 대부분의 기업들이 수행하는 AI 워크로드에서는 관리가 용이하고 확장성이 뛰어난 스토리지가 더 효율적이라는 설명이다.
장 상무는 "AI 워크로드 중 대규모 트레이닝 모델 개발은 5%에 불과하다"며 "대부분의 기업들은 이미 학습된 모델을 가져와 파인튜닝하거나 추론 작업을 수행하는데, 이런 작업에는 병렬파일시스템(PFS)과 같은 고성능 스토리지가 반드시 필요한 것은 아니다"고 언급했다.
집 앞 편의점을 가는데 F1 경주용 차가 필요하지 않은 것처럼 AI 개발에도 목적에 맞는 스토리지가 효율적이라는 의미다. 그는 "관리가 복잡하고 비용이 많이 드는 PFS보다 스케일아웃 NAS가 더 현실적인 선택이 될 수 있다"고 설명했다.
그러면서 델의 스케일아웃 NAS(Network Attached Storage·네트워크결합저장장치) 솔루션 '파워스케일'을 해답으로 제시했다. 파워스케일은 대규모 데이터를 단일 볼륨으로 확장 가능한 스토리지 플랫폼으로, 업계 최초로 이더넷 기반 NVIDIA DGX SuperPOD 인증을 받았다. 고가의 인피니밴드 네트워크 장비 대신 범용 이더넷을 사용해 구축 비용을 낮추면서도 충분한 성능을 제공하는 것이 특징이다.
장 상무는 "파워스케일은 엔비디아의 그래픽처리장치(GPU)와 직접 통신하는 GPUDirect Storage 기술을 지원해 데이터 처리 속도를 높였다"며 "엔비디아의 AI 성능 테스트인 MLPerf에서 PFS와 대등한 성능을 보였다"고 했다. 이어 "AI 워크로드에서 중요한 데이터 피딩(GPU에 학습 데이터 공급)과 체크포인트(학습 중간 백업) 성능에서 강점을 보인다"고 덧붙였다.
"정형·비정형 데이터 통합으로 AI 활용 극대화"
델은 지난해 정형·비정형 데이터를 통합 관리하는 '델 데이터 레이크하우스'도 출시했다. 이 플랫폼은 기존 데이터 웨어하우스와 데이터 레이크의 장점을 결합해 데이터 이동 없이 분석이 가능하다는 특징을 보인다.
장 상무는 "AI 개발 과정에서는 정형·비정형 데이터를 모두 활용해야 하는데, 기존에는 각각 다른 시스템으로 관리해야 했다"며 "데이터 레이크하우스는 이 두 가지를 통합 관리하면서도 필요한 형태로 즉시 분석·활용할 수 있게 해준다"고 설명했다.
S3(클라우드 기반 객체 스토리지), NFS(네트워크 파일시스템), SMB(서버 메시지 블록) 등 다양한 프로토콜로 들어오는 데이터를 변환 없이 저장하고 활용할 수 있어 시간과 비용을 절약할 수 있는 것이다. 델은 데이터 분석 전문기업 스타버스트와 협력해 이 플랫폼을 개발했는데 스타버스트의 데이터 가속화 기술인 '와프 스피드'는 델 데이터 레이크하우스에만 제공되는 독점 기능이다.
장 상무는 "이제는 단순히 GPU를 도입하는 것을 넘어 전체 AI 워크로드를 효율적으로 운영할 수 있는 인프라를 구축하는 것이 중요하다"며 "데이터 관리부터 AI 모델 개발, 추론까지 전체 AI 워크로드 전 과정의 포트폴리오를 제공하는 것이 델의 강점"이라고 역설했다.
/윤소진 기자(sojin@inews24.com)포토뉴스
