연구에 따르면 자율 언어 모델 에이전트가 증가하면서 신뢰할 수 있는 에이전트를 식별하고 업무를 위임하는 방법이 중요해지고 있어요.
기존의 인간 평판 시스템(KYC, 신용 점수 등)을 에이전트에게 적용하려는 시도가 있지만, 에이전트는 분열적 정체성을 지녀 지속적인 행동, 제재 민감성, 고유성을 보장하기 어렵습니다.
연구는 기존 평판 시스템이 언어 모델 에이전트에게 적용될 수 없으며, 관찰 가능성을 기반으로 한 사전적 행동 제어 프로토콜로 전환해야 한다고 주장합니다.