JoyAI-Image는 시각 이해, 텍스트-이미지 생성, 지시사항 기반 이미지 편집을 위한 통합 멀티모달 모델입니다. 이 모델은 공간적으로 강화된 멀티모달 LLM과 멀티모달 디퓨전 트랜스포머를 결합하여 시각적 인식과 생성을 상호 작용시킵니다. JoyAI-Image는 시공간 추론 능력과 제어 가능한 시각적 합성을 강화하여 기존 모델보다 뛰어난 성능을 보입니다.