WorldLines는 실제 가정 환경에서 장기간 인간을 지원하는 로봇 비서의 장기 기억 능력을 평가하는 새로운 벤치마크 프로젝트입니다. 기존 벤치마크의 한계를 극복하기 위해, 시간 연장된 가정 환경 추적을 구축하여 대화, 행동, 피드백, 객체 상태 변화 등을 포함합니다. ObsMem 프레임워크는 관찰 기반 기억을 유지하여 상태 인지적 의사 결정을 지원합니다.
WorldLines는 Memory QA와 Embodied Task Planning을 위한 증거 기반 샘플을 제공하며, 부분 관찰성, 세계 상태 덮어쓰기, 장기 기억을 행동 계획으로 변환하는 데 어려움이 있음을 보여줍니다. ObsMem은 이러한 문제를 해결하기 위한 강력한 참조 아키텍처를 제시합니다.