연구팀이 3B 파라미터의 텍스트-이미지 확산 모델 i1을 공개했어요. i1은 공개 데이터셋만으로 학습되었으며, 기존 오픈소스 모델보다 성능이 향상됐어요.
i1은 GenEval, DPG, PRISM, CVTG-2K, LongText 등 5가지 벤치마크에서 경쟁력 있는 성능을 보여줘요.
연구팀은 300개 이상의 실험과 700K+ TPU v6e 시간을 투자하여 모델링 및 데이터 설계 요소를 체계적으로 조사했어요. i1의 체크포인트, 코드, 데이터 처리 파이프라인을 공개했어요.