사용자가 파이널 파이트 게임을 AI로 학습시키는 Behavior Cloning 실험을 진행하고 결과를 공유했습니다. 실험 과정에서 액션 공간 재매핑, trajectory alignment 문제, LSTM 정책의 불안정성 등 여러 난관에 부딪혔습니다. AI는 어느 정도 진행 가능하지만, 일관성과 생존 능력 개선이 필요하며, GAIL + PPO로 성능 향상을 계획하고 있습니다.