JetBrains가 코딩에 특화된 Mellum 2 12B A2.5B 모델을 공개했어요. JetBrains는 이 모델이 추론 성능에서 Qwen 3.5 9B에 준하는 성능을 낸다고 밝혔어요. 다른 작업에서는 Qwen 3.5 4B보다 성능이 떨어지는 것으로 나타났어요.
모델은 Hugging Face 컬렉션에서 다운로드할 수 있으며, 기술 보고서는 arXiv에서 확인할 수 있어요. Mellum 2는 MoE 아키텍처를 기반으로 하며, 코딩 성능에 집중하여 설계되었어요.