SupraLabs가 50M 파라미터 규모의 새로운 언어 모델 'Supra-50M' (BASE 및 INSTRUCT 버전)을 공개했어요. 이 모델은 Llama 아키텍처 기반으로 200억 토큰의 고품질 교육 웹 텍스트로 학습됐어요.
Supra-50M은 크기가 작음에도 불구하고 여러 주요 벤치마크에서 경쟁 모델이나 그 이상 성능을 보여줘요. 특히 SciQ에서는 84.70%의 높은 정확도를 기록했어요.
현재 SupraLabs는 Supra-124M, Supra-350M 등 더 큰 모델 개발을 진행 중이며, 사용자 피드백을 환영하며, 모델의 성능 향상에 활용할 예정이에요.