DreamLM이 블록 디퓨전 추론 모델 DreamReasoner-8B를 공개했어요. 이 모델은 긴 추론 과정에서 발생하는 성능 저하 문제를 해결하기 위해 개발됐어요.
연구 결과, 작은 블록 크기로 학습하는 것이 효과적인 추론 성능을 유지하는 데 중요하며, 이를 위해 블록 크기 커리큘럼 학습 방법을 제안했어요.
DreamReasoner-8B는 수학 및 코드 추론 벤치마크에서 Qwen3-8B와 경쟁력 있는 결과를 보여줬으며, GitHub에서 모델을 다운로드할 수 있어요.