연구진이 이미지 생성 모델의 텍스트-이미지 순차 생성(interleaved generation) 능력을 향상시키는 InterleaveThinker 파이프라인을 공개했어요.
InterleaveThinker는 planner 에이전트와 critic 에이전트를 활용하여 이미지 생성 과정을 계획하고, 생성된 결과물을 평가 및 수정하는 방식으로 작동해요.
이 기술은 Nano Banana나 GPT-5와 유사한 성능을 보이며, FLUX.2-klein과 같은 추론 기반 벤치마크에서도 성능 향상을 이끌어냈어요.