RobotValues는 가정용 로봇이 인간의 자율성, 효율성, 사회적 적절성과 같은 가치 충돌 상황에서 우선순위를 정하는 능력을 평가하는 벤치마크입니다. 10,000개의 가치 충돌 시나리오로 구성되어 있으며, LLM을 활용해 제작했습니다. VLMs를 평가한 결과, 안전과 수용성을 우선시하는 경향이 있으며, 개인 정보 보호를 우선시하는 행동을 잘 선택하지 않는다는 점을 확인했습니다.
모델이 특정 가치를 우선시하도록 지시받았을 때, 자신의 선호도를 벗어난 행동을 수행하는 데 어려움을 겪으며, 80%의 경우 잘못된 행동을 선택했습니다. 이는 가정용 로봇 평가가 작업 완료 또는 안전 준수뿐만 아니라, 가치 충돌 상황에서 적절한 행동을 선택하는지 여부를 측정해야 함을 시사합니다.