연구진은 상업용 블랙박스 LLM의 환각 문제를 해결하기 위해 분산 정렬 적대적 증류(DisAAD)라는 새로운 방법을 제안했습니다. DisAAD는 경량화된 프록시 모델을 활용하여 블랙박스 LLM의 고품질 출력 영역을 학습하고, LLM이 답변을 잘 알고 있는지 판단하는 능력을 부여합니다. 실험 결과, 원본 LLM 크기의 1%에 불과한 프록시 모델로도 신뢰성 있는 불확실성 추정이 가능했습니다.