텐센트가 2950억 개의 파라미터를 가진 MoE 모델 Hunyuan Hy3-preview를 공개했어요. 이 모델은 복합적인 추론, 지시 따르기, 코딩, 에이전트 작업에서 상당한 성능 향상을 보여요.
Hy3-preview는 FrontierScience-Olympiad, IMOAnswerBench 등 어려운 STEM 벤치마크에서 뛰어난 결과를 냈고, 칭화대 수학 박사 과정 시험과 중국 고등학교 생물 올림피아드에서도 좋은 성적을 거둬 일반적인 추론 능력을 입증했어요.
새로운 CL-bench와 CL-bench-Life를 자체적으로 구축하여 문맥 학습 능력을 측정했으며, Hy3-preview는 문맥 학습과 지시 따르기 능력 모두에서 향상된 모습을 보여요.