연구진이 금융 차트 질문 답변의 투명성과 데이터 보안을 강화한 AgentFinVQA 파이프라인을 공개했어요.
AgentFinVQA는 질문 계획, OCR, 범례 연결, 시각적 검사, 검증 등 단계를 기록하며 감사 가능한 Model Evaluation Packet (MEP)을 생성해요.
FinMME 데이터셋에서 Gemini-3 Flash 기반 모델 대비 7.68%p, Qwen3.6-27B-FP8 모델의 경우 4.84%p 성능 향상을 보였고, 검증 단계는 답변 신뢰도 판단에 활용돼요.