연구진은 텍스트 기반 추론의 한계를 극복하기 위해 이미지 편집 모델과 이해 모델을 분리한 ETCHR을 공개했어요. ETCHR은 추론 모방과 추론 향상이라는 2단계 레시피로 훈련되어 언어 측면과 생성 측면의 격차를 해소했어요. ETCHR은 Qwen3-VL-8B 모델의 Pass@1 정확도를 55.95에서 60.77로, Gemini-3.1-Flash-Lite 모델의 정확도를 65.08에서 70.55로 향상시켰어요.