Pulse · AI 뉴스

ABot-OCR: 이미지에서 Markdown 추출하는 비전-언어 모델

ABot-OCR · 2026-05-27

ABot-OCR은 페이지 이미지에서 바로 깨끗한 Markdown을 추출하는 새로운 비전-언어 모델입니다. 기존 방식의 복잡한 모듈 오케스트레이션 없이 단일 패스만으로 작동합니다.

구조적으로 일관된 데이터 엔진을 개발하여 파싱 정확도를 높였으며, Decoupled Heterogeneous Document Optimization 기술로 텍스트 정확도를 향상시켰습니다.

OmniDocBench 벤치마크에서 기존 시스템 대비 최고 성능을 기록하며, 다국어 텍스트 인식에서도 뛰어난 성능을 보였습니다.

##OCR##비전언어모델##Markdown##ABot-OCR
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기