PaddlePaddle이 이미지-텍스트 이해 모델 PaddleOCR-VL 1.6을 공개했어요. 새로운 모델은 이미지 설명 생성, 시각적 질의응답 등 다양한 작업에서 성능을 개선했어요. 개발자들은 GitHub에서 코드를 다운로드하여 즉시 사용할 수 있어요.
PaddleOCR-VL 1.6은 이전 버전에 비해 이미지 캡셔닝 정확도가 향상되었으며, 복잡한 시각적 질의응답에도 더 효과적으로 대응합니다.
PaddleOCR-VL 1.6은 PaddlePaddle 생태계의 일환으로, 오픈소스 커뮤니티에 기여하고 AI 기술 발전에 이바지하는 것을 목표로 합니다.