연구진은 멀티뷰 트랜스포머의 확장성 문제를 해결하기 위해 카메라 기반 위치 인코딩 방식을 재검토했어요. 기존 방식의 위치 인코딩은 회전과 이동 정보를 동일 차원으로 저장하여 식별을 어렵게 하고, 학습 확장성을 저해한다는 문제점이 발견됐어요. 연구진은 회전과 이동 정보를 분리하는 새로운 방식인 DPPE(Decoupled Pose Positional Encoding)를 제안하여 안정적인 장기 학습과 뛰어난 일반화 성능을 확보했어요.