연구 그룹에서 에이전트들이 서로 토론하며 고품질의 합성 데이터를 생성하는 새로운 훈련 방식을 개발했어요. 이 방식은 에이전트의 정확하고 빠른 평가와 가이드레일 구축을 가능하게 해줘요.