JetBrains이 코드 작업에 최적화된 120억 파라미터 Mixture-of-Experts 모델 'Mellum2'를 공개했어요. Mellum2는 토큰당 2.5억 개의 파라미터만 활성화하여 고처리량, 저지연 추론에 효율적이에요.
Mellum2는 라우팅, RAG, 요약, 서브 에이전트, 코드 기능, 프라이빗 배포 등 다양한 작업에 활용 가능하며, Apache 2.0 라이선스로 공개됐어요.
동일 크기 모델과 비교했을 때 Mellum2는 2배 빠른 추론 속도를 제공하며, 기술 보고서에서 코드 생성, 추론, 과학, 수학 벤치마크에서 경쟁력 있는 성능을 보여줘요.