대규모 언어 모델(LLM)이 인간 언어의 문맥을 이해하는 능력이 점점 더 중요해지고 있어요. 연구에서는 기존 데이터셋을 활용하여 생성 모델 평가에 적합한 문맥 이해 벤치마크를 소개하고 있어요. 이 벤치마크는 4가지의 다양한 작업과 9개의 데이터셋으로 구성되어 LLM의 언어적 능력을 평가할 수 있도록 설계되었어요.