연구진은 논리 규칙으로 정규화된 검증기 LOVER를 제안하여 LLM의 추론 능력을 향상시켰습니다. LOVER는 레이블 없는 데이터를 활용하며, 부정 일관성, 그룹 내 일관성, 그룹 간 일관성 등 세 가지 논리 제약 조건을 활용합니다. 10개 데이터셋 실험 결과, LOVER는 기존 방식보다 성능이 뛰어나고 지도 학습 검증기 수준의 성능을 달성했습니다.