Anthropic이 Apodex 1.0의 Smol 모델(0.8B, 2B, 4B) 오픈 웨이트를 공개했어요. 이 모델들은 외부 텍스트를 진실로 받아들이지 않고 검증하는 등 에이전트 루프 내 특정 하위 작업에 특화되어 있어요. DeepSearchQA 94.4, BrowseComp 90.3 등 주요 벤치마크에서 높은 점수를 기록했어요. AgentHarness 프레임워크를 오픈 소스로 공개하여 로컬 에이전트 워크플로우 테스트 및 평가를 지원해요.