본 논문은 엔터프라이즈 환경에서 AI 에이전트 기술의 목표, 권한, 품질 기준 등을 명시하는 '계약 기반 기술' 프레임워크를 제안합니다. 이 프레임워크는 SKILL.md 파일을 가독성 있는 작업 계약으로 구성하면서도 경량화된 기술 검색 및 점진적 로딩을 유지합니다. 실험 결과, 계약 기반 기술은 기존 방식 대비 성능을 향상시켰으며, 특히 검토 가능성과 유지보수 측면에서 효과적이었어요.
텍스트 생성 연구에서는 3가지 엔터프라이즈 기술, 15가지 합성 작업, 4가지 지시 조건, 8가지 생성 모델을 활용하여 960개의 출력 결과와 1680개의 교차 심사 기록을 얻었습니다. 도구 호출 과제에서는 8가지 모델과 192개의 시뮬레이션된 도구 호출 기록을 사용했어요.
계약 기반 기술은 작업 의도, 경계, 승인 기준을 명확히 하는 거버넌스 레이어로 이해해야 하며, 독립적인 안전 장치가 아니에요. GovernSpec YAML 계약, 모델 컨텍스트 프로토콜, 런타임 가드레일, 추적 및 평가 시스템과의 경계를 명확히 합니다.