Pulse · AI 뉴스

DreamReasoner-8B: 블록 크기 커리큘럼 학습을 통한 디퓨전 추론 모델

DreamLM · 2026-06-18

DreamLM이 블록 디퓨전 추론 모델 DreamReasoner-8B를 공개했어요. 이 모델은 긴 추론 과정에서 발생하는 성능 저하 문제를 해결하기 위해 개발됐어요.

연구 결과, 작은 블록 크기로 학습하는 것이 효과적인 추론 성능을 유지하는 데 중요하며, 이를 위해 블록 크기 커리큘럼 학습 방법을 제안했어요.

DreamReasoner-8B는 수학 및 코드 추론 벤치마크에서 Qwen3-8B와 경쟁력 있는 결과를 보여줬으며, GitHub에서 모델을 다운로드할 수 있어요.

##디퓨전모델##추론##DreamReasoner##커리큘럼학습

매일 핵심 AI 소식을 한국어로, 빠르게