Pulse · AI 뉴스

JoyAI-VL-Interaction: 실시간 비전-언어 상호작용 모델 공개

JoyAI · 2026-06-10

JoyAI-VL-Interaction은 8B 규모의 비전 우선 VL-Interaction 모델입니다. 모델은 스스로 응답 여부를 결정하며, 실시간 상호작용과 시간 인지 능력이 뛰어납니다.

쇼핑객을 앱 화면을 안내하거나 슬라이드 덱에서 강의를 즉흥적으로 진행하는 등, 훈련하지 않은 능력도 새롭게 발견됩니다.

모델은 실시간으로 영상을 스트리밍하여 세상에 진정으로 존재하며, ASR/TTS 모듈, 메모리, 시각화 UI, API 연결 백그라운드 뇌 등 다양한 플러그인을 지원합니다.

Doubao와 Gemini의 영상 통화 어시스턴트보다 인간 평가단이 JoyAI-VL-Interaction을 선호하는 것으로 나타났습니다.

##비전언어##상호작용##모델출시##JoyAI
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기