대규모 언어 모델(LLM)은 RAG나 챗봇 시스템과 같이 실제 시나리오에서 내부 지식과 사용자 신념, 검색된 문서 내용과 같은 외부 정보를 균형을 맞춰야 해요.
연구진은 세 가지 정보원 간의 상호작용 환경을 고려한 새로운 프레임워크를 제안하고, 27개의 LLM을 평가하여 문서 주장을 사용자 주장보다 더 신뢰하는 경향을 확인했어요.
다양한 정보원 상호작용 데이터로 파인튜닝하면 모델의 외부 정보 식별 능력을 향상시킬 수 있으며, 이는 신뢰할 수 있는 LLM 개발에 기여할 수 있을 거예요.