Pulse · AI 뉴스

TSN-Affinity: 지속적인 오프라인 강화 학습을 위한 유사성 기반 파라미터 재사용

Decision Transformer · 2026-04-29

TSN-Affinity는 지속적인 오프라인 강화 학습(CORL)을 위한 새로운 방법으로, TinySubNetworks와 Decision Transformer를 기반으로 합니다.

이 방법은 작업별 파라미터화와 RL 인지 재사용 전략을 통해 제어된 지식 공유를 가능하게 하며, 행동 호환성과 잠재적 유사성에 따라 작업을 라우팅합니다.

Atari 게임과 Franka Emika Panda 로봇 팔 시뮬레이션 벤치마크에서 테스트 결과, 희소한 SubNetworks에서 강력한 유지력을 보였으며 라우팅을 통해 멀티태스크 성능을 더욱 향상시켰습니다.

##강화학습##오프라인학습##지속적학습##TinySubNetworks##DecisionTransformer
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기