SenseNova가 새로운 멀티모달 모델 'SenseNova-U1'을 공개했으며, 텍스트-인포그래픽 생성에 뛰어난 성능을 보이는 것이 특징입니다.
이 모델은 기존 방식과 달리 시각 인코더(VE)와 변이형 오토인코더(VAE)를 제거하여 언어와 시각 정보를 통합하는 새로운 아키텍처 'NEO-Unify'를 채택했습니다.
SenseNova-U1은 이미지-텍스트 생성, 시각 이해 등 다양한 기능을 지원하며, 에이전트 학습 단계로 나아가는 발걸음으로 평가받고 있습니다.