연구진은 자율 에이전트 시스템 OpenClaw의 효율성 문제를 분석하고, 작업 특성에 따라 정밀도 요구사항이 다르다는 점을 발견했어요.
QuantClaw는 작업 특성에 따라 정밀도를 동적으로 할당하는 플러그인으로, 가벼운 작업은 저렴한 설정으로, 복잡한 작업은 높은 정밀도를 유지하여 비용 절감과 추론 속도 향상을 목표로 해요.
실험 결과, QuantClaw는 GLM-5 모델에서 최대 21.4%의 비용 절감과 15.7%의 지연 시간 감소를 달성하며 성능 저하 없이 효율성을 높였어요.