Pulse · AI 뉴스

장문 스캔 금융 문서 처리를 위한 다단계 추출 파이프라인: 산업 KYC 워크플로우에서의 경험적 연구

MiniCPM2.6 · 2026-04-29

장문 스캔 금융 문서에서 정보를 추출하는 것은 산업 KYC 및 규정 준수 워크플로우의 핵심 요구 사항이에요.

연구진은 이미지 전처리, 다국어 OCR, 하이브리드 페이지 레벨 검색, VLM 기반 구조화 추출을 통합하는 다단계 추출 프레임워크를 제시했어요.

실험 결과, 제안된 파이프라인은 기존 방식보다 정확도를 최대 31.9% 향상시켰고, 특히 복잡한 금융 보고서와 비영어 문서에서 효과적이었어요.

##OCR##VLM##금융##KYC##문서처리
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기