Pulse · AI 뉴스

Lens: 효율적인 텍스트-이미지 모델 훈련 방식 재고

Lens · 2026-05-20

연구진이 3.8B 파라미터의 T2I 모델 'Lens'를 공개했어요. Lens는 Z-Image와 같은 더 큰 모델보다 성능이 뛰어나거나 비슷하면서도 훈련 비용은 훨씬 적게 들어요.

Lens는 GPT-4.1로 생성된 800만 장의 이미지-텍스트 쌍으로 구성된 데이터셋과 다양한 해상도 이미지를 활용해 훈련 효율성을 높였어요.

세밀한 조정과 RL을 통해 시각적 품질을 개선하고, 사용자 요청과 모델을 정렬하며, 4단계 추론을 위한 증류 가속을 적용했어요.

Lens는 단일 NVIDIA H100 GPU에서 1024^2 이미지 생성에 3.15초, turbo 버전은 0.84초밖에 걸리지 않아요.

##T2I##모델출시##효율성
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기