TSN-Affinity는 지속적인 오프라인 강화 학습(CORL)을 위한 새로운 방법으로, TinySubNetworks와 Decision Transformer를 기반으로 합니다.
이 방법은 작업별 파라미터화와 RL 인지 재사용 전략을 통해 제어된 지식 공유를 가능하게 하며, 행동 호환성과 잠재적 유사성에 따라 작업을 라우팅합니다.
Atari 게임과 Franka Emika Panda 로봇 팔 시뮬레이션 벤치마크에서 테스트 결과, 희소한 SubNetworks에서 강력한 유지력을 보였으며 라우팅을 통해 멀티태스크 성능을 더욱 향상시켰습니다.