업스테이지에서 LLaMa 모델을 기반으로 한 LLaMa-65b-instruct 모델을 공개했어요. 이 모델은 영어로 텍스트를 생성하며, 다양한 파라미터 크기와 시퀀스 길이를 지원해요.
모델 사용 시 최대 10,000개 이상의 토큰 입력을 처리할 수 있으며, rope_scaling 옵션을 통해 가능해요.
성능 평가는 Open LLM Leaderboard의 벤치마크 데이터셋을 기반으로 진행되었으며, ARC-Challenge, HellaSwag, MMLU, TruthfulQA 등의 평가 항목을 포함했어요.