OpenAI와 Paradigm이 AI 에이전트의 스마트 컨트랙트 취약점 탐지 및 해결 능력을 평가하는 벤치마크 'EVMbench'를 공개했습니다. EVMbench는 AI 에이전트가 고위험 취약점을 식별하고 수정하며 악용하는 능력을 측정하는 데 중점을 둡니다. 이번 벤치마크는 AI 에이전트의 보안 분야 활용 가능성을 보여주고, 스마트 컨트랙트 보안 연구를 촉진할 것으로 기대됩니다.