TurboOCR이 자체 호스팅 가능한 고속 문서 OCR 서버 v3를 공개했어요. PP-OCRv6 모델을 적용하여 RTX 5090에서 초당 이미지 처리 속도가 520장으로 향상됐어요.
이번 업데이트의 핵심은 문서 레이아웃, 표, 수식 등을 HTML, LaTeX, Markdown으로 변환하는 구조화된 파싱 기능이에요.
C++, TensorRT FP16, gRPC/HTTP를 기반으로 PDF 엔드포인트를 직접 지원하며, 표와 수식 파싱은 필요시 옵트인 방식으로 비용을 절감할 수 있어요.