Pulse · AI 뉴스

SIQ-1 Qwen3.6, autoresearch 및 자율 에이전트 성능 입증

Qwen · 2026-06-17

AlexWortega가 Qwen-35B-A3 모델을 PPO로 학습시켜 autoresearch 환경에서 GLM-5.2 및 Qwen-350B를 능가하는 성능을 보여줬어요.

bullshit-bench 에서는 NEX 및 GPT-5.5를 압도하며 Claude Opus 4.8 수준의 아이디어를 생성하는 것으로 평가받았어요.

모델 GGUF 파일은 Hugging Face에서 다운로드 가능하며, ZeroGPU 환경에서 데모 에이전트도 체험할 수 있어요.

##Qwen##autoresearch##PPO

매일 핵심 AI 소식을 한국어로, 빠르게