연구진이 Mamba 기반 상태 공간 모델의 경계 정보 손실 문제를 해결하기 위해 Reload-Mamba 프레임워크를 제안했어요. 이 프레임워크는 경계 감지, 클래스 불확실성 인지, 다단계 반-희석 메커니즘을 활용해 성능을 개선했어요. ADE20K 데이터셋에서 47.9%의 mIoU를 달성했으며, Cityscapes 데이터셋에서는 83.2%의 mIoU를 기록했어요.
경계 감지 모듈은 경계 마스크를 활용해 응답 복원을 위한 영역을 식별하고, 클래스 불확실성 인지 Reload Gate는 픽셀 단위 클래스 엔트로피를 활용해 게이팅 신호를 제공해요. 다단계 Reload 메커니즘은 세 개의 디코더 레벨에서 반-희석 처리를 수행하고, 복원된 표현을 상향식으로 융합해요.
ConvNeXt-Tiny 인코더와 멀티 스케일 디코더, 픽셀 단위 방향 어텐션을 사용하는 Mamba 스캔을 기반으로 구축되었으며, PASCAL VOC 2012 데이터셋에서는 87.8%의 mIoU를 달성했어요. 각 설계 요소가 기존 반-희석 아키텍처보다 성능 향상에 기여하는 것을 확인했어요.