QuickScope는 동적 LLM 벤치마크에서 어려운 질문을 식별하는 새로운 방법론을 제시합니다. COUP라는 베이지안 최적화 알고리즘을 수정하여 LLM 파이프라인에 적용하고, 사용자가 원하는 유형의 질문을 타겟팅할 수 있도록 도구를 개발했습니다. 실험 결과, QuickScope는 기존 방법보다 효율적으로 어려운 질문을 발견하고 오탐을 줄이는 것으로 나타났습니다.