백추안(百川)이 새로운 오픈 소스 대규모 언어 모델 Baichuan 2를 공개했어요. 2조 6천억 토큰의 고품질 데이터로 학습되었으며, 중국어와 영어 벤치마크에서 동급 규모 모델 중 최고 성능을 보여요.
Baichuan 2는 7B, 13B 버전의 Base 및 Chat 모델을 제공하며, Chat 모델의 경우 4비트 양자화 버전도 제공돼요. 학술 연구는 완전 공개되며, 상업적 사용은 이메일 신청 후 공식 허가를 받으면 무료로 가능해요.
PyTorch 2.0 환경에서 실행해야 하며, 학습 중인 Checkpoints를 프로젝트에 업로드하여 다양한 단계의 Checkpoint를 로드할 수 있어요.