ContextShift는 객체 탐지 모델의 맥락 변화에 대한 강건성을 평가하는 새로운 벤치마크입니다. 기존 벤치마크는 집계 지표에 의존하여 맥락 변화에 따른 성능 저하를 제대로 반영하지 못했습니다. 연구 결과, 모델은 맥락 변화 시 거짓 음성이 최대 227% 증가하고 예측 볼륨이 최대 44% 감소하는 경향을 보였으며, 통계적 호환성 축에서 성능이 일관되지 않게 나타났습니다.