SupraLabs가 Supra-50M-Reasoning 모델을 공개했어요. 이 모델은 Supra-50M-Instruct를 기반으로 추론 능력을 향상시킨 버전이에요.
새 모델은 답변 전에 사고 과정을 명확히 제시하는 방식으로, 500개의 샘플로 구성된 SupraThink-Dataset-500x 데이터셋으로 학습했어요.
현재 실험 단계이며 환각 현상이 있을 수 있으며, 코드는 Hugging Face에서 공개됐어요. SupraLabs는 Supra-124M, Supra-350M 모델 개발을 준비 중이에요.