연구진은 반복적인 환경에서 로봇 조작을 위한 Vision-Language-Action(VLA) 모델의 신뢰성 저하 문제를 해결하기 위해 온라인 성공 기억 기반의 테스트 시간 적응 프레임워크를 제안했습니다.
제안된 프레임워크는 성공적인 실행 경험을 장기 기억에 저장하고, 추론 시 관련 행동 조각을 검색하여 일관성 없는 후보를 필터링하고, 이를 기반으로 행동 우선순위를 생성합니다.
시뮬레이션 및 실제 환경 실험 결과, 제안된 방법은 장기적인 작업 성공률과 폐루프 안정성을 향상시키는 것으로 나타났습니다.