Victor M이 X(구 트위터)에 오픈 웨이트 모델 25개 이상 공개 소식을 전했어요. NVIDIA Nemotron 3 Ultra는 550B 하이브리드 Mamba-MoE 구조로, 1M 컨텍스트를 지원하며 MMLU 89.1의 성능을 보여줘요. Google Gemma 4 12B는 텍스트, 이미지, 오디오, 비디오를 모두 지원하는 완전한 오픈 덴스 모델로, 256K 컨텍스트를 제공하며 140개 이상의 언어를 지원해요.
Ideogram 4는 9.3B 플로우 매칭 DiT 모델로, 텍스트가 풍부한 이미지 생성 분야에서 뛰어난 성능을 발휘하며 GPT Image 2에 이어 2위를 차지했어요. Boson Higgs Audio v3 4B는 102개 언어, 21개 감정을 지원하며, RedNote dots.tts는 완전한 연속(코덱 없음) 오픈 TTS 파이프라인을 제공합니다.
NVIDIA Cosmos3-Super는 64B 옴니모달 월드 모델로, 물리 AI를 위한 액션 트랙토리를 비디오+오디오 생성과 결합하며, JD JoyAI-Echo는 LTX-2.3을 기반으로 최대 5분 길이의 멀티샷 텍스트-비디오를 생성합니다.