CLARITY는 대화형 NL2SQL 시스템의 복합적인 모호성과 다양한 사용자 행동을 고려한 새로운 벤치마크 프레임워크예요. 기존 벤치마크는 단일 모호성 원인을 가정하고 사용자 상호작용에 의존했지만, CLARITY는 실제 오류 모드를 간과하지 않아요. Spider와 BIRD 데이터셋 평가 결과, LLM 기반 시스템도 복합적인 모호성 상황에서 성능이 저하되는 것으로 나타났어요.