인공지능(A)비전 모델을 적용해 광학문자인식(OCR)의 고질적인 문제로 여겨졌던 왜곡 현상을 크게 개선한 기술이 상용화됐다. 그간 제대로 인식하지 못했던 영수증이나 계약서 등 데이터도 인식이 가능해진 것이다.
인공지능(AI) 솔루션 기업 웨어비즈는 자사 제품 '아르고스(ARGOS OCR)' 솔루션에 독자 개발한 '웨어비즈 비전 모델(WVM)'을 적용해, 그동안 OCR의 고질적인 문제였던 이미지 왜곡 및 기울어짐 오류 개선 효과를 99% 이상 획기적으로 개선했다고 11일 밝혔다.
기존 AI OCR 솔루션의 주류를 이루던 CRNN(CNN-RNN) 방식은 순차적 특징 추출(RNN)의 구조적 한계로 인해, 스마트폰 촬영 등으로 발생하는 이미지의 심한 기울어짐이나 왜곡에 취약했다. 이는 인식 순서가 쉽게 흐트러져 인식률이 저하되는 구조적 한계를 드러냈다.
웨어비즈는 이 기술적 난제를 해결하기 위해 트랜스포머 기반의 비전 언어 모델(VLM) 핵심 구성 요소를 독자적으로 결합한 WVM을 개발했다.
웨어비즈 관계자는 “WVM은 이미지 전체의 글로벌 문맥을 이해하는 트랜스포머의 강력한 셀프 어텐션(self-attention) 메커니즘을 활용해 왜곡된 이미지에서도 텍스트의 전체적인 위치와 순서 관계를 정확히 파악해 인식률 저하를 원천적으로 방지한다”고 설명했다.
특히 “인식 속도 역시 기존 방식과 동등한 수준을 유지하는 동시에, 동시 접속 환경에서의 병렬 처리 성능까지 확보해 서비스 안정성과 효율성을 크게 높였다”고 덧붙였다.
박상길 웨어비즈 대표는 “WVM을 통해 기존 CRNN 기반 솔루션에서 빈번했던 왜곡 및 기울어짐으로 인한 인식 오류율을 극적으로 낮춰, 오류 발생률이 높았던 영역에서 99%에 가까운 안정적인 인식률을 달성한 것은 OCR의 혁신”이라고 밝혔다.
박 대표는 이어 “특히 여권 기계 판독 가능 영역(MRZ), 신분증, 차량 번호판 등 정형화된 데이터는 물론, 영수증, 계약서와 같은 비정형 데이터에서도 압도적인 성능을 나타냈다”면서 “이번 제품 출시가 서류 및 데이터 입력 자동화와 고객사의 업무 효율 증대에 크게 기여할 것으로 기대한다”고 강조했다.
웨어비즈의 '아르고스 OCR'이경민 기자 kmlee@etnews.com

2 hours ago
1


![[콘텐츠 핫&뉴] 그라비티, ‘지스타2025’ 현장 이벤트 공개](https://pimg.mk.co.kr/news/cms/202511/11/news-p.v1.20251111.90b7d8a9f9694c01a3b493b4ac47a418_R.jpg)


![[컨콜 종합] 내년 '글로벌 공략' 선언한 엔씨…"아이온2 성공 자신한다"](https://image.inews24.com/v1/dd303ecb10636a.jpg)











English (US) ·