네이버클라우드가 세계적 문자인식 기술 경진대회에서 1위를 차지하며 광학문자인식(OCR) 분야 경쟁력을 입증한다.
네이버클라우드는 지난달 16일 중국에서 열린 국제패턴인식학회(IAPR) 주관 경진대회 ‘ICDAR 2025’에서 ‘역사 지도 텍스트 판독’ 부문 1위를 수상했다고 8일 밝혔다.
ICDAR은 1991년부터 이어져 온 세계 최고 권위의 문서 분석·인식 학술 콘퍼런스로, 이번 대회에서 우승하며 네이버는 2018년, 2019년, 2022년에 이어 통산 네 번째로 ICDAR 경진대회 1위를 기록했다.
이번 수상 부문은 과거 제작된 지도 이미지 속에서 복잡한 구조의 문자를 정확히 판독하는 고난도 과제다.
지도 내 지역명이 곡선 형태로 표기되거나 여러 줄로 나뉘고, 경계선과 단어가 중첩된 경우도 많다.
네이버클라우드는 문서 이미지 내 텍스트와 좌표를 동시에 추출하는 ‘엔드 투 엔드(end-to-end)’ 방식의 모델을 사용했다고 밝혔다.
OCR은 최근 멀티모달 거대언어모델(LLM)의 성능을 높이는 기술로 주목받고 있으며, OCR 단계의 정확도가 AI의 지문 해석과 문제 해결 능력에 큰 영향을 미친다.
실제로 별도 OCR 엔진을 결합한 모델이 오픈소스 LLM보다 높은 성능을 보인 것으로 나타났다.
글로벌 OCR 엔진 경쟁에서도 프랑스의 미스트랄 AI는 올해 초 손글씨와 타이핑 텍스트를 고정밀로 인식하는 ‘미스트랄 OCR’을 출시하는 등 각국 기업들이 경쟁력을 강화하고 있다.
네이버클라우드는 이번 대회 성과를 기반으로 내년부터 자사 클라우드 플랫폼 ‘클로바 OCR’의 도큐먼트 OCR 솔루션에 엔드 투 엔드 기술을 적용할 계획이다.
네이버 클라우드 관계자는 “비정형 문서나 자유 곡선 형태의 텍스트도 정확하게 판독할 수 있는 차별화된 OCR 기술을 선보이겠다”라고 말했다.
이어 “글로벌 수준의 비전 AI 기술로 발전시켜 나갈 것”이라고 밝혔다.






![[금융진단] 미 증시, 지정학 완화·빅테크 반등에 상승](https://images.jkn.co.kr/data/images/full/982892/image.jpg?w=288&h=168&l=50&t=40)

