Pulse · AI 뉴스

연속 AI 에이전트 평가를 위한 분포 자유 불확실성 정량화

arXiv cs.AI · 2026-05-19

연구진은 분할 준수 예측과 적응형 준수 추론(ACI)을 활용해 연속 AI 에이전트 평가에 대한 분포 자유 커버리지 보장 방안을 제시했어요. 준수 구간은 모든 명목 수준에서 24시간 지평선 기준으로 0.02 이하의 교정 오류를 달성했어요. 다중 에이전트 파이프라인을 위한 합성 불확실성 경계를 개발하고, 잘못된 순위율을 제어하는 준수 회피 규칙과 리더보드 규모의 다중 검정 FDR 보정을 적용했어요.

##AI에이전트##불확실성정량화##준수예측##머신러닝
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기