한국딥러닝의 OCR 비즈니스는 B2B와 B2G 중심으로 전개된다. 지난해에는 누적 매출 100억원을 돌파했다. 수요가 많은 만큼 경쟁도 치열한 분야다. 김 대표는 차별점으로 가장 먼저 ‘빠르고 편리하고 쉬운 사용성’을 꼽았다. 이를 대표하는 것이 ‘쓰리 제로 OCR’이라는 슬로건이다. ▲제로 라벨링 ▲제로 디플로이 타임(모델 구축 시간) ▲제로 프리 트레이닝(사전 훈련) 등이 가능한 기술을 구현한 것이다. 라벨링과 구축 시간, 사전 훈련 없이 기업용 OCR 시스템 구축이 가능한 이유 중 하나로 대량의 데이터를 보유한 사실을 들었다. 지난 5년간 확보한 4억장 이상의 데이터로 VLM을 훈련했다. 나아가 문서에 최적화된 프론티어 모델까지 구축했다. 학습 데이터는 외부 기관 등과 계약, 단독으로 확보한 것이 대부분이다. 웹 크롤링 등으로 저작권을 무시한 데이터 확보 방안과는 확실히 차별화된다고 전했다. 그렇다면 한국딥러닝이 실제 OCR을 구축하는 데에는 어느 정도 기간이 소요될까. 답은 약 2주(10여일) 정도다. 출처 : AI타임스(https://www.aitimes.com/news/articleView.html?idxno=169977)