AlexWortega가 Qwen-35B-A3 모델을 PPO로 학습시켜 autoresearch 환경에서 GLM-5.2 및 Qwen-350B를 능가하는 성능을 보여줬어요. bullshit-bench 에서는 NEX 및 GPT-5.5를 압도하며 Claude Opus 4.8 수준의 아이디어를 생성하는 것으로 평가받았어요. 모델 GGUF 파일은 Hugging Face에서 다운로드 가능하며, ZeroGPU 환경에서 데모 에이전트도 체험할 수 있어요.