Pulse · AI 뉴스

UnAC: 복잡한 시각적 추론을 위한 적응형 시각 프롬프팅

arXiv cs.CV · 2026-05-06

UnAC는 GPT-4o, Gemini 1.5, GPT-4V와 같은 LMM의 복잡한 다중 모드 작업을 위한 추론을 강화하는 새로운 프롬프팅 방법입니다.

UnAC는 LMM이 중요한 영역에 집중할 수 있도록 적응형 시각 프롬프팅 전략을 제안하고, 이미지에서 핵심 정보를 추출하기 위한 이미지 추상 프롬프트를 설계했습니다.

또한, 분해된 하위 질문과 답변을 확인하는 점진적인 자체 검사 방식을 도입하여 추론을 개선했습니다.

##LMM##프롬프팅##시각추론##GPT-4o##Gemini
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기