Anthropic이 에이전트 기술을 그래프 형태로 모델링하는 AIP를 공개했어요. 기존 기술은 자연어 지시사항을 기반으로 작동하여 신뢰성 문제와 기술 개선의 어려움을 겪었어요.
AIP는 기술을 실행 그래프로 표현하여, 자연어에서 코드·명령어·도구 호출을 재추론하는 대신 검증된 실행 단위를 제공하여 Claude Sonnet의 평균 작업 보상과 합격률을 통계적으로 유의미하게 향상시켰어요.
기술 개선 과정에서 AIP는 기능 테스트가 가능한 체계를 제공하여 실패 원인을 정확히 진단하고 수정할 수 있도록 했으며, 기술 개선을 측정 가능한 튜닝 루프로 만들었어요.
AIP는 기술 자체의 강화 학습을 위한 자연스러운 행동 공간을 제공하고, 기술 전체에 대한 관리 및 기술 검토를 지원해요.