연구진은 인간-AI 상호작용에서 중요한 감정 표현을 고려한 새로운 음성 캡셔닝 패러다임인 EmoTransCap을 제안했어요. 담론 수준의 감정 전환을 포착하기 위해 자동화된 파이프라인을 설계하여 대규모 데이터셋을 구축하고, 다중 작업 감정 전환 인식 모델(MTETR)을 활용했어요. EmoTransCap 데이터셋과 모델은 감정 표현을 향상시키고, 감정적으로 지능적인 대화형 에이전트 개발을 지원할 수 있어요.