오디오 기반 LLM(ALLM)의 불확실성 추정 연구는 아직 초기 단계이며, 기존 연구가 부족했어요. 연구진은 예측 엔트로피, 의미 엔트로피 등 5가지 방법을 벤치마크하여 다양한 모델과 평가 환경에서 성능을 비교했어요. 의사 결정 신뢰도 평가 벤치마크에서는 모델과 벤치마크에 따라 불확실성 방법의 효과가 달라지는 것을 확인했어요.