지난 주 오픈소스 이미지 및 비디오 생성 분야에서 주목할 만한 모델들이 공개됐습니다. CausalCine는 영상 내 스토리텔링을 위한 프레임워크, SwiftI2V는 2K 이미지-비디오 생성 모델입니다.
OmniGen2는 이미지 생성, 편집, 조건부 생성 등 다양한 작업을 통합하는 모델이며, HiDream-O1-Image는 8B 모델로 공개되었습니다.
CDM은 디퓨전 모델의 단계를 줄여 고품질 이미지를 생성하고, PhysForge는 물리 기반 3D 에셋을 생성합니다. MiniMind-O는 텍스트, 음성, 이미지 입력을 받아 텍스트와 스트리밍 음성을 출력하는 0.1B 모델입니다.