연구진은 학습 이론적 보증의 전제 조건을 위반하는 자기 진화형 에이전트 문제를 해결하기 위해 SEA 아키텍처를 제안했어요. SEA는 작은 조향 어댑터와 버전화된 하니스를 활용해 기반 모델을 동결하고, 언제나 유효한 게이트를 통해 수정 사항을 관리하며 감사 가능한 인증서를 발급합니다.
5개의 루프 컨트롤러가 발표된 보증을 구성하며, 검증 루프 메커니즘은 문제 텍스트에서만 계산된 신호를 제공해 게이트가 선택할 수 있는 행동을 기반 모델이 이미 생성하도록 합니다.
SWE-bench Verified 서브셋에서 기반 모델의 역량이 가장 큰 영향을 미치며, 두 개의 강력한 기반 모델에서 의도적으로 아무런 동작도 하지 않는 복합 컨트롤은 +4 및 +5의 기여도를 확인했습니다 (GLM 5.2 24→28; GPT 29→34).