Pulse · AI 뉴스

AliyunConsoleAgent: 실제 클라우드 환경에서 증류 및 강화 학습을 통해 웹 에이전트 훈련

Aliyun · 2026-06-08

AliyunConsoleAgent는 실제 클라우드 콘솔에서 자동화된 문서 검증을 위한 웹 에이전트 프레임워크입니다.

AliyunConsoleAgent는 선행 모델 트랙션을 증류하여 지도 학습(SFT)을 진행하고, 그룹 상대 정책 최적화(GRPO) 및 이중 채널 결과 보상 모델을 활용하여 강화 학습을 수행합니다.

AliyunConsoleAgent-32B는 278개 작업 벤치마크에서 63.52%의 성공률을 달성하여 기준 모델보다 20.24% 향상되었으며, 최고 선행 모델과의 격차를 1.82pp까지 좁혔습니다.

##에이전트##강화학습##클라우드##Aliyun
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기