Pulse · AI 뉴스

ReVision: 시각적 중복 제거로 컴퓨터 사용 에이전트 확장

Qwen · 2026-06-05

연구진은 컴퓨터 사용 에이전트(CUA)의 비효율적인 시각 정보 처리 문제를 해결하기 위해 ReVision을 개발했어요. ReVision은 연속된 스크린샷에서 중복되는 시각적 영역을 제거하여 토큰 사용량을 줄이고 성능을 향상시키는 기술이에요.

OSWorld, WebTailBench, AgentNetBench 3개 벤치마크에서 Qwen2.5-VL-7B 모델을 사용하여 ReVision을 적용했을 때, 평균적으로 토큰 사용량이 46% 감소하고 성공률이 3% 향상됐어요.

ReVision은 더 많은 과거 정보를 활용하여 CUA의 성능을 지속적으로 개선할 수 있음을 보여주며, 시각적 중복 제거의 중요성을 입증했어요.

##에이전트##컴퓨터비전##Qwen
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기