크라우드웍스, KAIST AI 기술설명회서 데이터 전처리 기술 소개

2 hours ago 1
크라우드웍스 알피 날리지 컴파일러 화면 예시. 회사 제공크라우드웍스 알피 날리지 컴파일러 화면 예시. 회사 제공

크라우드웍스가 16일 서울 강남구 코엑스에서 열린 KAIST 김재철 AI 대학원 'AI 기술설명회'에서 최신 AI 기술 트렌드를 공유하고 자사 데이터 전처리 기술을 소개했다.

설명회는 KAIST가 연구 중인 핵심 원천 AI 기술을 산업계와 일반 대중에 소개하고 AI 기술 확산과 산학 협력 활성화를 목표로 마련됐다. 크라우드웍스는 KAIST 초청으로 강연에 참여했다.

양수열 크라우드웍스 최고기술책임자(CTO)는 '사장님이 잘 읽는 김대리의 보고서, AI는 왜 못 읽을까?'를 주제로 강연을 진행했다.

양 CTO는 “AI가 일반 문서 포맷을 읽는 것은 가능하지만 문서에 담긴 의미를 이해하고 메타데이터로 추출하는 일은 여전히 쉽지 않다”며 “차트나 다이어그램과 같은 시각 요소는 단순 설명을 넘어 주변 문장과 단락 문맥까지 고려, 의미 기반 메타데이터를 구성해야 AI가 관련 정보를 정확히 검색하고 응답 품질을 높일 수 있다”고 설명했다.

이어 “우리나라 문서는 고유한 스타일과 구조를 가지고 있어 외산 파서(Parser)를 그대로 사용할 경우 오류가 많이 발생한다”며 “이러한 국내 문서의 특성을 반영해 표나 시각 요소에 대한 정밀한 파싱과 처리를 통해 높은 정확도를 구현해야 한다”고 덧붙였다.

또 크라우드웍스 다양한 비정형 문서를 검색증강생성(RAG)에 적합한 형태로 전처리할 수 있는 자체 솔루션 '알피 날리지 컴파일러'를 소개했다.

박종진 기자 truth@etnews.com

Read Entire Article