Pulse · AI 뉴스

NVidia, 픽셀 디퓨전 트랜스포머 모델 'PixelDiT' 공개

PixelDiT · 2026-06-03

NVidia가 13억 파라미터 규모의 텍스트 기반 이미지 생성 모델 'PixelDiT'를 공개했어요. VAE 없이 작동하며 이미지 편집 기능도 지원합니다.

PixelDiT는 패치 레벨 DiT와 픽셀 레벨 DiT의 이중 구조를 채택하고 Gemma-2-2B-IT 텍스트 인코더를 사용합니다.

다양한 종횡비 지원, 프로젝트 페이지, 논문, GitHub, Hugging Face 페이지, ComfyUI 버전 등 관련 링크가 공개됐어요.

##이미지생성##PixelDiT##NVidia
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기