연구진이 제한된 실제 데이터 환경에서 시뮬레이션-실제 환경 간 격차를 줄이는 AIDA(Adaptive Imagination for Domain Adaptation) 프레임워크를 제안했어요. AIDA는 신뢰할 수 있는 상상력 기반 롤아웃을 생성하여 실제 데이터를 보강하는 방식으로 작동해요.
AIDA는 분포 변화에 민감한 판별기를 사용하여 상상된 전환이 신뢰도가 낮은 영역으로 벗어나는 경우 롤아웃을 잘라내어 신뢰할 수 있는 전환만 사용해요.
AIDA는 신뢰할 수 있는 전환에 대한 자기 일관성 손실을 도입하여 원래 상태와 재구성된 상태 간의 불일치를 줄여 상태 표현을 학습하고 기존 방식보다 뛰어난 성능을 보여줘요.
연구 결과, AIDA는 MuJoCo 작업 5개와 Gymnasium-Robotics 작업 2개에서 기존 방식보다 우수한 성능을 보였으며, 실제 데이터가 부족한 환경에서도 효과적으로 작동하는 것을 입증했어요.