구글 딥마인드에서 이미지 생성 능력과 시각 정보 이해를 결합한 통합 모델 '비전 바나나'를 공개했어요. 비전 바나나는 이미지 생성과 함께 의미론적 분할, 객체 분할 등 다양한 시각 이해 작업을 수행할 수 있어요. 이 모델은 이미지 생성 학습이 LLM 사전 학습과 유사하다는 것을 보여주며, 비전 AI와 생성 AI의 통합을 시사해요.