연구진은 통합 멀티모달 모델의 '이해-생성 격차' 문제를 해결하기 위해 새로운 프레임워크를 제안했어요. 이 프레임워크는 모델이 지시의 복잡성과 모델 역량에 따라 생성 전략을 자율적으로 전환하도록 돕습니다.
연구진은 세 가지 적응 모드(직접 생성, 자기 성찰, 다단계 계획)를 활용하는 계층적 데이터 파이프라인을 구축하고, 5만 개 이상의 샘플로 구성된 고품질 데이터셋을 만들었어요.
실험 결과, 제안하는 방법은 기존 모델보다 X2I 작업에서 우수한 성능을 보였으며, 간단한 지시부터 복잡한 지시까지 생성 정확도를 향상시켰어요. 코드 및 데이터셋은 GitHub에서 공개되었습니다.