Pulse · AI 뉴스

STREAM: 스트리밍 미디어에서 고가치 작업 지향 대화 마이닝 프레임워크

Qwen · 2026-05-24

연구진은 수직 도메인 LLM의 데이터 부족 문제를 해결하기 위해 STREAM이라는 새로운 프레임워크를 제안했어요. STREAM은 공개 스트리밍 미디어에서 실제 서비스 대화를 합성하여 데이터 확보의 딜레마를 해결하는 방식이에요. StreamDial 데이터셋은 자동차, 레스토랑, 호텔 도메인을 포함하며 총 87,498개의 대화 세션과 1,497,320개의 턴으로 구성돼요.

StreamDial 데이터셋은 사용자/에이전트 페르소나와 대화 청사진을 결합하여 실제 서비스 행동을 캡처하며, RAG를 통해 지식 기반 응답을 지원해요. 자동 평가 및 다운스트림 작업 결과, StreamDial은 기존 방식보다 대화 품질이 향상되었고, 대화 상태 추적 성능도 개선되었어요.

##LLM##데이터셋##대화형AI##스트리밍
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기