연구진이 Apple Dense Material Segmentation (DMS) 벤치마크를 부활시켜 비전 트랜스포머 기반의 새로운 기준을 제시했어요.
SegFormer과 Mask2Former 아키텍처 평가 결과, 표준 훈련 방식이 불균일한 질감 필드에서 높은 분산 기울기로 인해 실패하는 것을 확인했어요.
High-Fidelity Logit Projection, Query Entropy Regularization, 물리 기반 증강 파이프라인을 도입하여 SegFormer-B5의 mIoU를 0.4572로 개선하고 기존 CNN 기준을 능가했어요.
데이터 재분할로 성능이 향상되는 '일반화 역설'을 발견했는데, 이는 실제 환경에서의 성능 저하를 야기하는 것으로 분석돼요.