연구진은 LLM의 제로샷 개체명 인식(NER) 오류를 줄이기 위해, 초기 인간 어노테이터의 의견 불일치 해결 과정을 모방하는 새로운 프레임워크 DiZiNER를 개발했어요.
DiZiNER는 여러 LLM을 어노테이터와 감독관으로 활용하여, 모델 간 불일치를 분석하고 지시문을 개선하는 방식으로 작동하며, 18개 벤치마크에서 SOTA 결과를 달성했어요.
DiZiNER는 GPT-5 mini와 같은 감독 모델보다 뛰어난 성능을 보여, 의견 불일치 기반 지시문 개선이 모델 성능 향상에 핵심적인 역할을 한다는 것을 입증했어요.