Pulse · AI 뉴스

ViDR: 시각 자료 기반 연구 보고서 생성 프레임워크 공개

ViDR · 2026-05-13

ViDR은 시각 자료를 활용해 장문의 보고서를 생성하는 새로운 프레임워크입니다. 기존 시스템은 텍스트 증거에 의존하거나 시각 자료를 약하게 활용하는 반면, ViDR은 시각 자료를 핵심 증거로 활용합니다.

ViDR은 보고서의 각 주장을 텍스트 및 시각 증거와 연결하는 증거 색인 개요를 구축하고, 시각 자료의 노이즈를 제거하여 정확한 증거 객체로 만듭니다.

ViDR은 시각 자료 활용을 평가하는 새로운 벤치마크 MMR Bench+를 함께 소개하며, 기존 모델 대비 보고서 품질, 시각 자료 통합, 검증 가능성을 향상시켰습니다.

##연구##시각자료##LLM##ViDR##보고서
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기