강화 학습 알고리즘의 일반화 능력을 측정하는 새로운 레트로 콘테스트를 시작했어요. 이 콘테스트는 이전 경험에서 학습한 내용을 바탕으로 새로운 환경에 적응하는 능력을 평가합니다. 참가자들은 강화 학습 알고리즘을 활용하여 다양한 환경에서 최상의 성능을 발휘하도록 훈련해야 합니다.