Pulse · AI 뉴스

업스테이지, LLaMa-65b-instruct 공개

Upstage Solar · 2023-07-17

업스테이지에서 LLaMa 모델을 기반으로 한 LLaMa-65b-instruct 모델을 공개했어요. 이 모델은 영어로 텍스트를 생성하며, 다양한 파라미터 크기와 시퀀스 길이를 지원해요.

모델 사용 시 최대 10,000개 이상의 토큰 입력을 처리할 수 있으며, rope_scaling 옵션을 통해 가능해요.

성능 평가는 Open LLM Leaderboard의 벤치마크 데이터셋을 기반으로 진행되었으며, ARC-Challenge, HellaSwag, MMLU, TruthfulQA 등의 평가 항목을 포함했어요.

##업스테이지##LLaMa##Instruct##모델출시

매일 핵심 AI 소식을 한국어로, 빠르게