IMPACTeen은 청소년 대상 소셜 인플루언스 시나리오 텍스트 데이터셋입니다. 1,021개의 텍스트와 5,100개의 어노테이션 기록을 포함하며, 청소년·부모·심리학자·전문가·교사 등 5개 관점 분석 결과가 담겨있습니다.
LLM 생성 후 2단계 인간 검수 과정을 거쳐 청소년 맥락의 현실성을 확보했습니다. 영향력 존재, 기법, 의도, 결과, 저항, 반응, 어노테이션 신뢰도 등 다차원 어노테이션 포함합니다.
소셜 인플루언스 탐지, 어노테이터 불일치 분석, 교차 언어 모델링, 언어 모델 훈련 및 평가에 활용 가능하며, 폴란드어와 영어 버전으로 제공됩니다.