연구진은 50개의 LLM에 45개의 심리 측정 설문지를 적용하여 LLM 간 심리 측정 차이를 분석했습니다. 그 결과, LLM 간의 주요 분산 축은 신체 감각, 감정, 내면의 언어, 이미지, 공감과 같은 풍부한 경험을 묘사하는 항목과 자극에 대한 반응성을 묘사하는 항목을 구분하는 것으로 나타났습니다.
'피노키오 점수(Pinocchio score)'를 활용하여 각 항목의 경험적 요구를 측정했는데, 이 점수는 중립적 프롬프트 조건에서 모델 간 응답 변동성과 인간 시뮬레이션 프롬프트 조건에서 모델 간 응답 변동성의 비율입니다.
PCA 분석 결과, 모델 간 심리 측정 변동의 주요 차원은 모델이 경험의 주체라는 자기 표현 경향을 나타내는 '피노키오 축(Pinocchio Axis)'으로 확인되었으며, 이는 훈련 과정을 통해 형성된 것으로 보입니다.