Sapiens2는 인간 중심 비전 분야에 특화된 고해상도 트랜스포머 모델 패밀리로, 0.4B에서 5B 파라미터 규모로 제공돼요. 마스크 이미지 재구성 및 자체 증류 대비 학습을 결합하여 다양한 다운스트림 작업에 적합한 기능을 학습하도록 설계됐어요. 포즈 추정, 신체 부위 분할, 법선 추정 등 다양한 분야에서 기존 모델보다 성능을 향상시켰고, 새로운 작업에도 적용 가능해요.