연구진은 쥐와 같은 설치류가 환경 매개변수의 변화에 대처할 때 망각 메커니즘을 통해 행동을 적응시킬 수 있음을 확인했어요. 비정상 심층 강화 학습(NSRL)은 변화하는 환경에 대처하기 위해 최신 RL 방법을 적용하는 분야예요. 연구에서는 공간 샘플링 값 감쇠(Space-sampled Value Decay)를 심층 가치 기반 RL 아키텍처의 명시적 망각 메커니즘으로 개발했어요.
공간 샘플링 값 감쇠는 심층 Q 네트워크(DQN)와 소프트 액터-크리틱(SAC)의 비정상 환경 평가 시 긍정적인 효과와 한계를 보여줘요. 이 방법은 변화에 대한 완벽한 정보 없이도 환경 변화에 적응하는 데 도움이 되는 간단하면서도 효과적인 접근 방식이에요.
연구는 기존 RL 방법이 요구하는 부분적으로 완벽한 정보(예: 작업 ID, 컨텍스트) 없이도 망각 메커니즘을 통해 환경 변화에 적응할 수 있음을 시사해요.