Xiaomi가 실제 모바일 환경에서 사용 가능한 GUI 에이전트 'Xiaomi-GUI-0'을 개발했어요. 기존 에이전트는 시뮬레이션 환경에서 학습되어 실제 사용 환경과의 격차가 컸어요.
Xiaomi-GUI-0은 실제 기기를 중심으로 하는 하이브리드 인프라를 사용해 데이터 수집, 학습, 배포, 평가를 실제 환경과 유사하게 진행했어요.
세 단계의 학습 파이프라인(지도 학습, 단계별 강화 학습, 에이전트 강화 학습)을 거쳐 개발되었으며, 실제 사용 환경에서 72.0%의 성공률을 기록했어요.