텐센트가 현실 세계 에이전트를 위한 기반 모델인 HY-Embodied-0.5를 공개했어요. 이 모델은 공간-시간 시각적 인식과 복잡한 신체적 추론에 특화되어 있어요.
HY-Embodied-0.5는 혁신적인 MoT(Mixture-of-Transformers) 아키텍처를 사용하여 세밀한 인식을 향상시켰고, 2B 모델과 32B 모델 두 가지 버전으로 제공돼요.
MoT-2B 모델은 2.2B개의 활성화 파라미터만 사용하며, 32B 모델은 Gemini 3.0 Pro에 버금가는 뛰어난 성능을 보여줘요.