Pulse · AI 뉴스

BLAST: ASP 기반 구조적 테스트로 LLM 벤치마킹

arXiv cs.AI · 2026-04-24

BLAST는 LLM이 Answer Set Programming(ASP) 코드를 생성하는 정확도를 평가하는 최초의 벤치마킹 방법론과 데이터셋이에요.

두 가지 새로운 의미론적 지표를 활용하여 ASP 코드 생성의 구조적 평가 프레임워크를 제공하며, 그래프 관련 문제 10개와 8개의 최첨단 LLM을 평가했어요.

BLAST는 LLM의 ASP 코드 생성 능력을 측정하고 개선하는 데 기여할 것으로 기대돼요.

##LLM##ASP##벤치마크##코드생성##검증

매일 핵심 AI 소식을 한국어로, 빠르게