연구진은 LLM 에이전트의 표현력을 높이고 안전 문제를 해결하기 위해 LACUNA라는 새로운 프로그래밍 모델을 제시했어요.
LACUNA는 에이전트 액션을 타입 검사된 호출로 제한하고, 실패 시 환경을 변경하지 않도록 설계되어 재시도를 유도하며, 사용 가능한 도구와 데이터 흐름을 제한해요.
BrowseComp-Plus 벤치마크에서 27.1%의 정확도를 달성했고, $τ^2$-bench에서 76.0%의 문제를 해결하며 기존 에이전트와 유사한 성능을 보였어요.