대규모 언어 모델(LLM)이 사회적 담론에 큰 영향을 미치지만, 통제된 사회적 맥락에 따른 LLM 출력의 변화를 조사하는 데이터셋은 부족합니다. 인지 디지털 그림자(CDS)는 LLM이 생성한 담론 분석을 지원하는 19만 건의 합성 코퍼스로, 인간의 페르소나를 반영하거나 AI 어시스턴트 역할을 수행하도록 프롬프트됩니다. CDS는 LLM의 프롬프트, 언어, 입장 및 추론을 연결하는 데이터를 제공하여 사회인구통계 및 심리적 속성을 인코딩합니다.