ShareLab에서 단일 시각 토크나이저를 활용한 통합 멀티모달 모델 UniAR을 발표했어요. 기존 모델의 한계를 극복하고 이미지 이해와 생성을 통합하는 데 초점을 맞췄어요. UniAR은 사전 학습된 비전 인코더와 멀티레벨 특징 융합, 비트 단위 양자화 방식을 적용해 고해상도 이미지 생성과 멀티모달 이해 성능을 높였어요. 프로젝트 페이지에서 데모를 확인할 수 있으며, 이미지 생성 및 편집 성능에서 최고 수준을 달성했어요.