EngiAI는 시뮬레이션, 검색, 제조 준비를 결합하는 멀티 에이전트 시스템 평가를 위한 벤치마크 스위트입니다. EngiAI는 7가지 프롬프트 스타일, RAG 벤치마크, HPC 벤치마크의 3가지 평가 차원을 포함하며, LangGraph 기반의 멀티 에이전트 시스템(MAS) 구현체입니다. Proprietary 모델은 Beams2D에서 평균 96~97%의 작업 완료율을 보였으며, 오픈소스 4B 파라미터 모델은 55~78%의 성능을 기록했습니다.