연구진은 GUI와 CLI 에이전트의 실행 방식 차이를 정확히 비교하기 위해 새로운 벤치마크를 만들었어요. 화면 기반 GUI 에이전트는 59.1%의 성공률을, CLI 에이전트는 48.2%의 성공률을 기록했어요. 하지만 CLI 에이전트에 기술 보완을 적용하자 성공률이 69.3%로 높아졌어요.
GUI 에이전트는 장기적인 워크플로우에서 안정적인 상호 작용에 제한되는 반면, CLI 에이전트는 기술 인터페이스의 범위와 확장성에 제한되는 것으로 나타났어요. 이 연구는 GUI와 CLI가 서로 다른 실행 병목 현상을 드러낸다는 것을 시사해요.
연구 결과는 GUI 에이전트가 안정적인 상호 작용, CLI 에이전트가 기술 인터페이스의 범위와 확장성에 제약을 받는다는 점을 보여줘요.