Pulse · AI 뉴스

LLM, 문서 편집 위임 시 충실도 평가 벤치마크 'DELEGATE-52' 발표

DELEGATE-52 · 2026-05-10

DELEGATE-52는 LLM에 문서 편집 작업을 위임할 때 문서 충실도를 평가하는 벤치마크입니다.

코딩, 결정학, 악보 표기 등 52개 전문 영역에서 깊이 있는 문서 편집이 필요한 작업을 다룹니다.

이 벤치마크는 사용자가 LLM에 긴 문서 편집 작업을 맡기는 위임형 워크플로에서 문서가 얼마나 충실히 유지되는지 측정합니다.

##LLM##벤치마크##문서편집
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기