연구진이 GUI 상호작용 경로를 분석하여 에이전트의 기술을 자동으로 추출하는 파이프라인을 개발했어요. 추출된 기술 클러스터는 사람이 읽을 수 있을 정도로 정확하지만, 정책 개선에는 큰 도움이 되지 않았어요. 현재 기술은 경계 감지, 순서 없는 세그먼트 표현, 오프라인 보상 모델의 한계로 인해 정책 개선에 충분하지 않다는 것을 보여줘요.
추출된 기술은 InteraSkill Workflows 레이블과 95% 이상의 정확도를 보이지만, 다운스트림 정책 개선에는 2% 미만의 성능 향상만 가져왔어요. 연구 결과는 기술 구조를 파악할 수 있지만, 신뢰성 있는 교차 도메인 정책 개선에는 한계가 있음을 시사해요.
본 연구는 기술 구조를 진단하는 데 초점을 맞추고 있으며, 향후 경계 감지, 세그먼트 표현, 보상 모델 개선을 통해 성능을 향상시킬 수 있을 것으로 기대돼요.