Weibo AI가 3B 모델 'VibeThinker-3B'를 공개했어요. 이 모델은 AIME 2026에서 94.3점을 기록하며 DeepSeek V3.2와 Kimi K2.5를 능가하는 성능을 보여요.
LiveCodeBench v6에서 80.2 Pass@1, LeetCode 콘테스트에서 96.1% 합격률을 기록하며 코딩 능력도 뛰어난 것으로 평가돼요.
벤치마크 과적합 가능성과 데이터 유출 의혹이 제기되고 있지만, 엄격한 분야에서는 최적화된 학습 파이프라인이 대규모 파라미터 모델에 견줄 수 있다는 점을 입증했어요.