Pulse · AI 뉴스

MultiLinguahah: 다국어 음성 웃음 분할을 위한 새로운 비지도 방법

MultiLinguahah · 2026-05-07

연구진은 다국어 환경에서 음성 웃음을 분할하는 새로운 비지도 방법을 제안했어요. 이 방법은 에너지 기반으로 분할된 오디오 시퀀스를 이상 감지 문제로 설정하고, BYOL-A 인코더로 학습된 오디오 표현을 사용해 Isolation Forest를 적용해요.

기존의 머신러닝 방법은 수동 주석에 의존하고 영어 중심의 데이터셋을 사용하는데, MultiLinguahah는 이러한 한계를 극복하고자 했어요.

실험 결과, MultiLinguahah는 스탠드업 코미디, 시트콤, AudioSet의 일반적인 짧은 오디오를 포함한 4개 데이터셋에서 기존 방법보다 뛰어난 성능을 보여줬어요.

##음성분할##다국어##비지도학습##웃음감지
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기