연구진은 3D 마스크 자동 인코더(MAE)의 디코더가 위치 정보에 과도하게 의존하여 의미 있는 표현 학습을 저해한다는 문제를 지적했어요. MPL-MAE 프레임워크를 제안하여 위치 정보 의존성을 완화하고 인코더 특징 활용도를 높였으며, 위치 정보 임베딩 모듈과 게이티드 인터페이스 모듈을 도입했어요. 다양한 실험 결과, MPL-MAE는 기존 방식보다 우수한 성능을 보이며 강력하고 유용한 표현을 학습하는 데 효과적임을 입증했어요.