연구진이 7B 파라미터 규모의 유니폼 디퓨전 언어 모델 Sumi를 공개했어요. Sumi는 1.5T 토큰으로 사전 훈련되었으며, 지식·추론·코딩 벤치마크에서 경쟁력 있는 성능을 보여요.
기존 디퓨전 모델과 달리 Sumi는 모든 토큰을 업데이트할 수 있는 유니폼 디퓨전 방식을 사용해 유연한 생성이 가능해요.
모델 가중치, 체크포인트, 데이터 혼합 레시피를 모두 공개하여 커뮤니티의 연구를 지원하고 유니폼 디퓨전의 잠재력을 탐구할 수 있도록 도울 계획이에요.