연구진이 고전 게임 배틀쉽을 자연어 질문·응답 형태로 재구성하여 AI 에이전트의 질문 능력을 측정하는 테스트베드를 만들었어요. 선장 역할을 하는 AI는 함선 위치를 묻고, 관측자 역할을 하는 팀원이 실시간으로 답하는 방식으로 진행돼요. 이 테스트베드는 불확실한 환경에서 AI 에이전트가 좋은 질문을 던지는 능력을 평가하고 개선하는 데 활용될 예정이에요.