Pulse · AI 뉴스

Surface Evolver 벤치마크: LLM의 복잡한 물리 시뮬레이션 작성 능력 평가

OpenAI · 2026-07-03

사용자가 Surface Evolver 벤치마크를 만들어 LLM의 물리 시뮬레이션 작성 능력을 평가했어요. Surface Evolver는 액체 표면 모델링에 사용되는 1992년 툴이에요.

GPT-5.5가 현재까지 여러 과제를 해결하며 가장 좋은 성능을 보였고, GLM-5.2가 최고의 오픈 소스 모델로 평가받았어요.

벤치마크는 문서 참조, 사양 구현, 시뮬레이션 실행, 출력 디버깅 등 에이전트 루프를 포함하며

##LLM##벤치마크##물리시뮬레이션
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기