연구진은 사전 학습된 LLM이 인간 반응 데이터를 추정하는 데 사용될 수 있음을 밝혔습니다.
LLM은 제곱 손실 하에서 조건부 기댓값의 위험 등가 추정기를 유도하며, 베이즈 최적 위험과 일치하는 제한적 기능 위험 등가성을 달성합니다.
LLM의 오차는 표현 편향과 최적화 오차로 분해되며, 표현 편향은 핀스커 부등식에 의해 제한됩니다.
잘 보정된 LLM은 조건부 평균 의존성 추론에 대해 베이즈 최적 위험을 달성하며, 명시적 범위 조건을 통해 제한됩니다.