연구진은 장기 LLM 에이전트의 의사 결정에 영향을 미치는 메모리 계약 방식을 새롭게 제안했어요. AgenticSTS는 Slay the Spire 2 게임 환경에서 프론티어 LLM의 성능을 평가하는 테스트베드로, 기존 방식과 달리 제한된 메모리 계약을 사용해요. 새로운 테스트베드는 메모리 레이어를 분리하여 연구할 수 있도록 설계되었으며, 관련 데이터와 분석 스크립트를 공개했어요.