SupraLabs가 5000만 파라미터 규모의 새로운 언어 모델 Supra-50M (Base 및 Instruct 버전)을 공개했어요. 이 모델은 교육 웹 텍스트 200억 토큰으로 학습되었으며, 기존 오픈 소스 모델 대비 경쟁력 있는 성능을 보여줘요.
Supra-50M은 다양한 벤치마크에서 우수한 결과를 기록했는데, 특히 BLiMP 에서는 76.3%의 정확도를 달성했어요. 이 모델은 SupraLabs의 확장 계획의 첫 번째 단계로, 향후 더 큰 모델 개발을 위한 기반이 될 예정이에요.
현재 SupraLabs는 Supra-124M, Supra-350M 모델 개발을 진행 중이며, 이 모델들은 추론, 코딩 등 다양한 기능을 포함할 예정이에요.