코딩 에이전트의 능력 향상으로 인간 감독이 병목 현상으로 작용하고 있습니다. 제약 없는 에이전트는 보안 위험을 초래하고 코드베이스 확장성을 저해하며 인간 검토 비용을 증가시킵니다. 기존의 대규모 인간 엔지니어링 팀 관리 방식인 접근 제어, 네트워크 정책, 엄격한 코딩 규칙 준수가 코딩 에이전트에게도 적용 가능하며 토큰 비용도 저렴합니다.
문서 CLI(~200 LoC)와 제약 기반 환경을 결합한 실험에서 11개의 백도어가 삽입된 Python 코드베이스에 대한 검토 시, 54.5%였던 검출률이 90.9%로 향상되었습니다. 제약 기반 환경과 도구는 독립적으로 기여했습니다.
Python 언어를 선택한 이유는 언어가 기본적으로 적은 보장을 제공하기 때문이며, 이 원칙은 Rust와 같은 언어에도 적용될 수 있습니다.