연구진이 MLLM 기반 모바일 에이전트의 과도한 실행 및 상호 요청 문제를 해결하기 위해 Mobile-Aptus 프레임워크를 제안했어요.
Mobile-Aptus는 상호작용 능력 강화와 신뢰도 편향 교정 두 단계로 구성되어 있으며, 에이전트가 행동과 신뢰도 점수를 함께 출력하도록 학습해요.
실험 결과, Mobile-Aptus는 OS-Kairos, AITZ, Meta-GUI, AndroidControl 4가지 벤치마크에서 최고 성능을 달성했으며, 실제 환경에서 과도한 상호작용 없이 높은 성공률을 보여줬어요.
코드 공개는 GitHub에서 확인할 수 있어요.