Pulse · AI 뉴스

Ideogram 4.0 연구 일지: JSON 캡션 기반 이미지 생성 모델 분석

Ideogram · 2026-06-09

Ideogram이 JSON 캡션 기반으로 학습된 오픈 웨이트 모델 'Ideogram 4.0'을 공개했어요. 이 모델은 명시적인 바운딩 박스 레이아웃과 색상 팔레트 제어를 지원해요.

연구 결과, '매직 프롬프트'는 Claude를 활용한 LLM으로, 사용자의 프롬프트를 JSON으로 재작성하는 역할을 해요.

바운딩 박스는 정규화된 좌표 [y1,x1,y2,x2]로 표현되며, 중앙 위치를 활용하여 구도를 잡는 것이 중요해요. 요소 개수는 제한 요인이 아니며, 캡션의 토큰 수 제한이 실제 제약 요인이에요.

로컬 환경에서 '콘텐츠 차단' 이미지가 나타나는 현상은 모델에 내장된 거부 반응 때문이며, 웹사이트는 외부 검열 시스템을 사용하기 때문에 로컬 환경과 다른 결과가 나올 수 있어요.

##Ideogram##이미지생성##오픈소스##JSON##Claude
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기