연구진은 LLM의 정확성을 보장하기 위해 형식 검증을 활용하는 새로운 데이터셋 NL2VC-60을 공개했어요. 다양한 프롬프트 전략과 uDebug 플랫폼을 통해 LLM의 형식 검증 성공률을 크게 향상시켰어요. Gemma 4-31B는 90.91%의 검증 성공률을 달성했으며, GPT-OSS 120B도 구조적 시그널 피드백을 통해 81.82%까지 성공률이 높아졌어요.