연구진은 에이전트 실행 추적이 기술 노출 위험을 초래할 수 있음을 확인했어요. CapTraceBench 벤치마크와 RedAct 프레임워크를 통해 정보 흐름을 차단하고 기술 유출을 방지하는 방법을 제시했어요. RedAct는 핵심 정보를 차단하고 감사 증거를 보존하며 행동 워터마크를 삽입하여 기술 유출을 억제해요.
정보 흐름 차단 기술 RedAct은 원본 추적 정보의 기술 전송률을 크게 감소시키면서도 감사 증거는 보존해요. 독립적인 행동 워터마크는 93.6%에서 100%의 정확도를 유지하며 오탐율은 1.9% 이하로 제한돼요.