연구진은 LLM이 장기적인 상호작용에서 정보를 관리하는 문제를 '컨텍스트 기반 신념 관리(CBM)'라고 정의했어요. CBM은 공식적인 증거에 맞춰 예측된 신념 상태를 유지하고, 불필요한 노이즈를 분리하는 것을 의미해요.
새로운 벤치마크 'BeliefTrack'을 통해 CBM 실패 유형(Failed Stay, Failed Update, Failed Isolation)을 진단했는데, 기존 LLM은 심각한 CBM 실패를 보였어요.
강화 학습과 신념 상태 보상을 통해 CBM 실패율을 평균 70.9% 줄였고, 표현 수준에서의 제어를 통해 추가적인 개선을 이끌어냈어요.