새로운 모델들이 GPT-5.4 xHigh, Gemini 3.1 Pro, Hy3 preview 순으로 등장하며 추론 성능 경쟁이 치열해지고 있어요. Hy3 preview는 CHSBO 2025 벤치마크에서 Gemini와 GPT를 능가하는 점수를 기록했어요. 버전 넘버를 따라가기 힘들 정도로 빠르게 모델이 공개되고 있어요.
Hy3가 실제 코딩/수학 문제에서 이 정도 성능을 보이는지, 아니면 벤치마크 최적화 때문인지 의문이 드는 사용자들이 있어요. 사용자들은 이 상황에 대한 의견을 공유하며 모델 성능에 대한 궁금증을 표하고 있어요.