Jetbrains에서 Mellum 2 모델을 공개했는데, 12B 파라미터 MoE 모델임에도 활성화 파라미터가 2.5B로 적어 빠른 속도를 자랑합니다.
tool_test와 test_report라는 자체 테스트에서 Gemma 4 -12B나 GPT-OSS-20B보다 높은 성능을 보여줬으며, 13만 토큰의 컨텍스트에서도 100t/s 이상의 빠른 토큰 생성 속도를 유지했습니다.
AMD Radeon RX 7900 XT 20GB GPU 환경에서 Vulkan 백엔드를 사용했으며, Qwen3.5-9B보다도 빠른 속도를 보여줘 높은 효율성을 입증했습니다.