연구진은 시각-언어 모델(VLM) 기반 GUI 정렬의 교사 신호 품질을 개선하는 품질 인식 자가 증류(Quality-Aware Self-Distillation) 방법을 제안했어요.
이 방법은 학생이 생성한 접두사가 목표 좌표에서 벗어날 경우 신호 품질이 저하되는 문제를 해결하기 위해, 부드러운 정확성 인식 게이팅과 교사 확률 스케일링을 사용해요.
실험 결과, 두 가지 메커니즘을 결합했을 때 성능이 향상되었으며, 6개의 GUI 정렬 벤치마크에서 기존 모델과 기준 모델을 능가하는 결과를 보여줬어요.