연구진은 게임 생성 과정에서 플레이어의 상호작용을 고려해야 한다고 주장하며, GUI 에이전트를 활용한 새로운 평가 환경과 게임 생성 방식을 제안했어요.
PlaytestArena는 GUI 에이전트가 게임을 플레이하며 평가하는 환경이며, Play2Code는 게임 에이전트와 GUI 에이전트가 지속적인 루프를 통해 게임을 생성하는 방식이에요.
Play2Code는 기존 방식 대비 66.8%의 루브릭 통과율을 기록하며, 코드 생성과 플레이 간의 상호작용을 통해 게임 생성 품질을 향상시키는 효과를 보여줬어요.