본 연구는 제한된 라벨 데이터와 주관적인 비언어적 주석으로 인해 제약받는 화자 신뢰도 자동 감지를 위해 설계되었습니다. 위스퍼 인코더의 심층 의미 임베딩과 eGeMAPS 기술자, 보조적인 음성 스트레스 및 불유창 확률 추정치를 결합하는 하이브리드 프레임워크를 제안합니다. 제안된 접근 방식은 Macro-F1 점수 0.751을 달성하여 WavLM, HuBERT, Wav2Vec 2.0과 같은 자기 지도 기반 모델을 능가했습니다.