MiroMind 연구팀이 과학적 가설 발견을 위한 7B 모델 'MOOSE-Star'와 108,717개의 논문으로 구성된 데이터셋을 허깅페이스에 공개했습니다. MOOSE-Star는 DeepSeek-R1-Distill-Qwen-7B를 기반으로 하며, 배경, 가설, 영감으로 구성된 논문 데이터를 포함합니다. 연구팀은 모델의 성능 평가를 위해 2025년 9월까지의 데이터를 학습 데이터로 사용하고, 10월의 데이터를 테스트 데이터로 활용했습니다.