연구팀이 다국어 감정 검증 데이터셋 M-EDESConv와 M-TESC를 공개했어요. 감정 검증 응답 식별, 타이밍 감지, 응답 생성 세 가지 하위 과제를 지원하기 위함입니다.
MEGUMI라는 새로운 모델을 제안하여 객관적, 주관적으로 우수한 성능을 보였으며, XLM-RoBERTa 의미론과 언어별 감정 인코더를 융합했어요.
GPT-4.1 Nano와 Llama-3.1 8B를 활용한 EmoValidBench 벤치마크 결과, 현재 LLM은 문맥상 유사하고 다양한 검증 응답을 생성하지만 감정 이해 능력은 개선해야 할 부분이 많다고 밝혔어요.