Pulse · AI 뉴스

장기 과제 모바일 GUI 에이전트의 작업 상태 표현

TSR · 2026-07-01

연구진은 장기 과제 모바일 GUI 에이전트가 작업 상태와 화면 관찰을 분리하는 데 어려움을 겪는다는 점에 주목했어요. Task-State Representation (TSR)은 훈련 없이 작업 상태와 감각 입력을 명시적으로 분리하는 프레임워크예요. TSR은 전역 지침 요약, 하위 목표 진행 추적기, 전환 인식 액션 검증기로 구성돼요.

TSR은 사전 및 사후 시각 비교를 통해 지속적으로 업데이트되며, 에이전트의 추론을 수정 없이 안내해요. 연구 결과, 복잡한 크로스 애플리케이션 및 메모리 집약적인 작업에서 성공률이 최대 12 포인트 향상됐어요.

TSR은 기존 에이전트 아키텍처를 수정하지 않고도 작업 상태를 분리해 에이전트의 성능을 향상시키는 효과적인 방법으로 입증됐어요.

##에이전트##모바일##GUI##TSR##작업상태
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기