연구진은 LLM 에이전트가 사용자의 교정을 제대로 반영하지 못하는 문제점을 지적했어요. Mem0 메모리 시스템은 관련 점검의 57.5%를 놓치고 있어요. TRACE 기술은 사용자 교정을 규칙으로 변환해 런타임 검사를 통해 에이전트의 오류를 줄여요.
TRACE 기술은 ClawArena 코딩 작업에서 점검 위반율을 in-distribution 작업에서 100%에서 37.6%로, out-of-distribution 작업에서 100%에서 2.0%로 감소시켰어요. MemoryArena 작업에서는 in-distribution 위반율을 100%에서 60.5%로 줄였어요.
TRACE 기술은 개발자가 미리 작성한 런타임 검사 대신 사용자의 실제 채팅 교정을 기반으로 작동해요. 이를 통해 사용자가 반복적으로 교정을 언급할 필요성을 줄일 수 있어요.
실험 코드와 배포 가능한 기술은 GitHub에서 확인할 수 있어요: https://github.com/YujunZhou/TRACE_exp, https://github.com/YujunZhou/tellonce