연구진은 이미지 생성 시 VAE 의존성 문제를 해결하기 위해 Representation Forcing (RF) 기법을 제안했어요. RF는 모델이 시각적 표현을 예측하도록 하여, 기존 VAE 기반 모델의 구조적 병목 현상을 제거하고 이미지 생성 품질 격차를 해소해요. 이미지 생성 및 이해 성능을 모두 향상시켜, 병목 현상 없는 통합형 다중 모드 모델 개발에 기여할 것으로 기대돼요.