Pulse · AI 뉴스

답변하지 않을 때를 아는 것: 다중 모드 추론 시스템에서 불참 평가

arXiv cs.CL · 2026-04-16

연구진은 다중 모드 시스템의 신뢰성을 높이기 위해 답변할 수 없는 경우 질문에 답하지 않는 '효과적인 불참(EA)'의 중요성을 강조합니다.

MM-AQA 벤치마크를 통해 시각 모드 의존성 및 증거 충분성 측면에서 불가능한 질문을 생성하고, 최첨단 VLM과 MAS 아키텍처를 평가한 결과, 기존 모델은 불참을 거의 하지 않는 것으로 나타났습니다.

연구 결과, 효과적인 다중 모드 불참을 위해서는 더 나은 프롬프트나 더 많은 에이전트가 아닌 불참 인지 훈련이 필요하며, 순차적 설계가 반복적 설계를 능가하는 경향을 보였습니다.

##불참##다중모드##벤치마크
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기