MetaPoint는 생성 모델의 공간 제어 부족 문제를 해결하는 새로운 방법입니다. 2D 좌표를 특별한 토큰으로 표현하여 모델의 위치 인코딩을 활용, 픽셀 단위 제어 가능합니다.
MetaPoint는 새로운 아키텍처 변경 없이 기존 모델을 활용하며, 객체 위치 제어에 단일 토큰 또는 바운딩 박스에 두 개의 토큰만 사용합니다.
MetaPoint 토큰은 조립 가능하며, 에이전트가 사용자 요청을 구조화된 토큰 시퀀스로 분해하여 생성 과정을 제어하고, 직관적인 편집 시스템을 가능하게 합니다.