텐센트가 2950억 개의 파라미터를 가진 MoE 모델 Hunyuan Hy3-preview를 공개했어요. 이 모델은 복합적인 추론, 지시 따르기, 문맥 학습, 코딩, 에이전트 작업에서 상당한 성능 향상을 보여줘요.
Hy3-preview는 FrontierScience-Olympiad, IMOAnswerBench 등 어려운 STEM 벤치마크에서 뛰어난 결과를 냈으며, 칭화대학교 수학 박사 과정 시험과 중국 고등학교 생물 올림피아드에서도 좋은 성적을 거둬 일반적인 추론 능력을 입증했어요.
텐센트는 실제 업무 시나리오를 기반으로 문맥 학습 능력을 측정하는 CL-bench와 CL-bench-Life를 개발했으며, Hy3-preview는 문맥 학습과 지시 따르기 능력 모두에서 괄목할 만한 성장을 보여줬어요.