
한국지능정보사회진흥원(NIA)과 과학기술정보통신부는 인공지능(AI) 모델의 안전성과 신뢰성 평가 기반 구축을 위한 'LLM 안전성 및 신뢰성 평가 데이터셋 구축' 사업 착수보고회를 지난 7일 NIA 서울사무소에서 개최했다.
이 사업은 NIA와 과기정통부가 추진 중인 '독자 AI 파운데이션 모델 프로젝트'를 통해 구축되는 AI 모델 등에 대한 안전성과 신뢰성 성능을 평가하기 위한 기반을 마련하는 것이다. 특히 AI 모델의 위험 요소에 대한 체계적이고 정량적인 검증 체계를 구축하는데 중점을 두고 있다.
이번 사업을 통해 NIA는 AI 모델의 성능 평가를 넘어 안전성과 신뢰성까지 아우르는 종합 AI 평가 체계를 구축하며, 글로벌 AI 거버넌스 논의에서 한국의 위상을 높이는 역할을 담당한다.
특히 이번 과제에서는 사이버 보안, AI 자율성, 사실 기반 정확성, 사회적 가치 편향 등 AI 안전성과 신뢰성 핵심 항목을 아우르는 총 2만 건 이상 한국어 특화 벤치마크 데이터셋을 구축할 계획이다. 이를 글로벌 기준에 부합하는 AI 모델 평가 체계로 발전시킬 예정이다.
김지선 기자 river@etnews.com