Qwen-Image-Agent는 텍스트-이미지 모델의 맥락 격차 문제를 해결하기 위해 계획, 추론, 검색, 기억, 피드백을 통합한 에이전트 프레임워크입니다.
Context-Aware Planning은 누락된 맥락을 파악하고 획득 방법을 계획하며, Context Grounding은 추론, 검색, 기억, 피드백을 통해 맥락을 수집합니다.
Image Agent Bench (IA-Bench) 실험 결과, Qwen-Image-Agent는 기존 모델보다 뛰어난 성능을 보였습니다.