BLAST는 LLM이 Answer Set Programming(ASP) 코드를 생성하는 정확도를 평가하는 최초의 벤치마킹 방법론과 데이터셋이에요. 두 가지 새로운 의미론적 지표를 활용하여 ASP 코드 생성의 구조적 평가 프레임워크를 제공하며, 그래프 관련 문제 10개와 8개의 최첨단 LLM을 평가했어요. BLAST는 LLM의 ASP 코드 생성 능력을 측정하고 개선하는 데 기여할 것으로 기대돼요.