Pulse · AI 뉴스

블랙박스 LLM 불확실성 추정: 분산 정렬 적대적 증류

DisAAD · 2026-05-07

연구진은 상업용 블랙박스 LLM의 환각 문제를 해결하기 위해 분산 정렬 적대적 증류(DisAAD)라는 새로운 방법을 제안했습니다.

DisAAD는 경량화된 프록시 모델을 활용하여 블랙박스 LLM의 고품질 출력 영역을 학습하고, LLM이 답변을 잘 알고 있는지 판단하는 능력을 부여합니다.

실험 결과, 원본 LLM 크기의 1%에 불과한 프록시 모델로도 신뢰성 있는 불확실성 추정이 가능했습니다.

##LLM##불확실성##증류##프록시모델

매일 핵심 AI 소식을 한국어로, 빠르게