연구진이 LLM 평가의 편향을 줄이는 새로운 감사 프레임워크를 제안했어요. 인간 감독을 활용한 긍정-미표시 학습 방식으로 LLM 평가 시스템을 개선하는 방식이에요. 부분 최적 수송 기법을 기반으로 인간의 선호도와 일치하고, 편향된 평가관을 수정할 수 있어요.
기존 방식 대비 인간 선호도에 더 잘 맞고, 프레젠테이션 편향에 더 강하며, 해석 가능한 신뢰도 추정치가 제공돼요. LLM 평가 파이프라인의 확장 가능하고 통계적으로 타당한 대안을 제시합니다.