연구진은 LLM 에이전트가 코드를 작성하는 과정에서 런타임과 모델 간의 분리를 해소하는 LACUNA 프로그래밍 모델을 제시했어요. LACUNA는 각 에이전트 액션을 타입 검사를 거친 코드 호출로 처리하여 안전성을 확보하고, 실패 시 환경을 변경하지 않도록 설계됐어요. BrowseComp-Plus 벤치마크에서 27.1%의 정확도를 달성했으며, τ^2-bench에서는 76.0%의 문제 해결률을 보이며 기존 에이전트와 유사한 성능을 보여줬어요.