연구진은 단일 이미지 기반 3D 생성 모델의 한계를 극복하기 위해 ROAR-3D 기술을 개발했어요.
ROAR-3D는 기존 모델의 2D-3D 연관성을 활용하면서 시점 제어와 기하학적 정보 전달을 분리하여 임의 시점 이미지 조건부 3D 생성을 가능하게 해요.
토큰 단위 시점 라우터는 각 3D 잠재 토큰을 가장 관련 있는 시점에 할당하고, 이중 스트림 어텐션 디자인은 기존 모델의 성능을 유지하면서 보조 시점 정보를 통합해요.
ROAR-3D는 기존 모델에 최소한의 파라미터만 추가하여 1~12개 이상의 시점을 지원하며, 최고 수준의 3D 생성 품질을 달성했어요.