KAIST가 이미지 생성에 널리 쓰이는 인공지능(AI) 기술인 ‘확산(디퓨전) 모델’을 더 빠르고 효율적으로 작동시킬 수 있는 신기술을 개발했다. 스테이블 디퓨전 등 텍스트를 바탕으로 새로운 이미지를 생성하는 확산모델은 최근 생성형 AI의 핵심 기술로 주목받고 있지만, 생성 시간이 오래 걸리고 연산 자원을 늘려도 성능이 크게 개선되지 않는 한계가 있었다. 이번 성과는 모델의 성능과 효율을 높이면서도 실시간 추론이 가능해지는 길을 연 것으로 평가된다.
안성진 KAIST 전산학부 교수 연구팀은 세계 'AI 4대 석학' 중 한 명으로 꼽히는 요슈아 벤지오 몬트리올대 교수 연구팀과 함께 확산모델의 ‘추론-시간 확장성’을 향상시킨 기술을 개발했다고 20일 발표했다.
추론-시간 확장성은 AI가 연산 자원의 양에 따라 성능을 유연하게 조절할 수 있는 능력을 뜻한다. 기존 확산모델은 단순히 데이터 양을 늘리거나 모델을 키우는 방식만으로는 성능을 충분히 끌어올릴 수 없었다.
연구팀은 이러한 문제를 해결하기 위해 '몬테카를로 트리 탐색' 기법을 적용한 새로운 추론 방식을 제안했다. 다양한 생성 경로를 트리 구조로 탐색해 제한된 자원 안에서도 고품질의 결과물을 만들 수 있도록 하는 방식이다. 연구팀은 기존 모델이 전혀 풀지 못했던 초대형 미로찾기 과제에서 100%의 성공률을 기록하며 기술력을 입증했다고 밝혔다.
후속 연구에서는 확산모델의 속도까지 높이는데 성공했다. 트리 탐색 구조를 병렬 처리해 기존보다 최대 100배 빠른 속도로도 동일하거나 더 나은 품질의 결과를 얻었다는 설명이다.
이번 연구 성과는 최근 캐나다에서 열린 세계 최고 권위의 인공지능 학회인 ‘국제기계학습학회(ICML) 2025’에서 전체 논문 중 상위 2.6%에 해당하는 스포트라이트 논문으로 선정되며 기술력을 인정받았다.
안 교수는 "이번 연구는 고비용 계산이 요구되던 기존 확산 모델의 한계를 근본적으로 극복한 기술"이라며 "지능형 로봇, 생성형 AI 등 다양한 정보기술(IT) 분야에서 핵심 기술로 활용될 수 있을 것"이라고 말했다.
최영총 기자 youngchoi@hankyung.com