대형 언어 모델(LLM) 기반 문법 오류 교정에서 과도 수정 문제가 발생하는데요, 이 문제를 해결하기 위해 모델 수정이나 추가 훈련 없이 단일 모델이 생성한 여러 후보에 대해 편집 단위 다수결 투표를 수행하는 훈련 없는 추론 방법을 제안합니다.
영어, 체코어, 독일어, 한국어, 힌디어, 루마니아어 등 9개 벤치마크에서 제안된 방법은 대부분의 경우 탐욕적 디코딩과 MBR 디코딩을 능가합니다.
제안된 방법은 사용된 명령어 프롬프트에 관계없이 안정적인 수정 품질을 제공하며, GEC 데이터셋 로딩 및 LLM 추론을 지원하는 두 개의 저장소를 공개했습니다.