연구진은 이미지 생성 모델의 교차 생성 능력 부족 문제를 해결하기 위해 InterleaveThinker를 개발했어요.
InterleaveThinker는 계획 에이전트와 비평 에이전트를 활용하여 기존 이미지 생성 모델에 교차 생성 기능을 부여하는 멀티 에이전트 파이프라인이에요.
단일 교차 생성 트레일로비 25번 이상의 생성 호출이 필요하지만, 단계별 보상 시스템을 통해 전체 트레일로비 최적화 문제를 해결했어요.
InterleaveThinker는 Nano Banana 및 GPT-5와 견줄 만한 성능을 보이며, FLUX.2-klein과 같은 추론 기반 벤치마크에서도 상당한 성능 향상을 보여줬어요.