연구진은 분할 준수 예측과 적응형 준수 추론(ACI)을 활용해 연속 AI 에이전트 평가에 대한 분포 자유 커버리지 보장 방안을 제시했어요. 준수 구간은 모든 명목 수준에서 24시간 지평선 기준으로 0.02 이하의 교정 오류를 달성했어요. 다중 에이전트 파이프라인을 위한 합성 불확실성 경계를 개발하고, 잘못된 순위율을 제어하는 준수 회피 규칙과 리더보드 규모의 다중 검정 FDR 보정을 적용했어요.