Pulse · AI 뉴스

협상 에이전트의 신념 추론을 위한 언어 모델 증류: 감사 가능한 협상

BOND · 2026-05-06

BOND(Bayesian Opponent-belief Negotiation Distillation)는 협상 에이전트의 상대방 신념 추론을 가능하게 하는 프레임워크입니다. 이 프레임워크는 LLM 기반의 Bayesian teacher와 8B student language model로 구성됩니다.

CaSiNo 데이터셋에서 BOND는 기존 모델보다 뛰어난 성능을 보였으며, 상대방 우선순위 posterior에 대해 평균 Brier 점수 0.085를 달성했습니다.

증류된 student 모델은 상당한 수준의 신념 신호를 유지하며, 70B structured-CoT baseline보다 훨씬 작은 8B 모델로 더 나은 posterior calibration을 제공합니다.

##협상##에이전트##LLM##베이지안##증류
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기