사용자가 Flow Matching 이미지 생성 모델 첫 시도를 공개했어요. Apple emoji 이미지와 텍스트 라벨로 학습한 모델은 약 470만 파라미터 규모예요.
초기 CNN 기반 접근 방식은 실패했지만, RGB 채널 사용, Residual Block, Self/Cross-Attention 적용으로 개선됐어요.
모델은 현재 emoji 생성 데모로 사용 가능하며, 색상 정보가 중요한 단서로 작용하는 것을 확인했어요.
이 프로젝트는 개발자가 Flow Matching 기술을 학습하는 데 중요한 경험이 됐어요.