연구진은 NeurIPS 2025에서 비전 트랜스포머의 성능을 향상시키는 'PH-Reg' 기법을 발표했습니다. 이 기법은 기존 사전 학습 모델에 레지스터 토큰의 장점을 적용하여 레이블 없는 이미지 데이터만으로도 성능을 개선합니다. PH-Reg는 이미지 증강, 경계 패딩, 밀집 특징 평균화를 통해 기존 모델보다 세분화 및 깊이 추정 성능을 향상시킵니다.
기존 방식보다 저렴하면서도 MaskCLIP, ClearCLIP 등 기존 방법보다 우수한 성능을 보여주며, Denoising Vision Transformers에 비해 훨씬 적은 추가 파라미터만 사용합니다. PH-Reg는 이미지의 이동 및 좌우 반전 불변성을 활용하여 기존 모델의 밀집 특징을 개선합니다.
연구 결과는 세분화 및 깊이 추정 작업에서 학생 모델과 증강되지 않은 교사 모델 모두를 능가하는 것으로 나타났습니다.