LLM 벤치마크에 사회과학 과제가 부족하여 LLM 평가 및 사회과학 연구 발전을 제한한다는 주장이 제기되었습니다. 벤치마크는 AI 모델의 발전 방향을 결정하는 중요한 역할을 하며, 사회과학 분야의 데이터셋을 통합하여 AI 모델의 일반화 및 견고성을 향상시킬 수 있습니다. BenCSSmark는 사회과학적 관점을 통합한 벤치마크로, 사회적으로 관련성 높은 AI 시스템을 구축하고 협업을 촉진하는 것을 목표로 합니다.