Pulse · AI 뉴스

CIVeX: 언어 에이전트의 인과적 개입 검증 도구

CIVeX · 2026-05-10

연구진은 언어 에이전트의 도구 사용 시 유효한 호출이 반드시 유효한 개입을 의미하는 것은 아니라는 점을 지적하며, CIVeX라는 새로운 인과적 개입 검증 도구를 소개했습니다.

CIVeX는 제안된 행동을 구조적 인과적 쿼리로 매핑하고, 식별 가능성을 검사하여 'EXECUTE', 'REJECT', 'EXPERIMENT', 'ABSTAIN' 중 하나의 결과를 반환합니다.

Causal-ToolBench 테스트에서 CIVeX는 적대적 교란 하에서도 84.9%의 정확도를 달성하며, Claude Opus 모델을 활용한 검증기는 기존 방식보다 오탐을 크게 줄이는 성능을 보였습니다.

##인과관계##언어에이전트##도구사용
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기