연구진은 이미지 분류기의 글로벌 평균 풀링(GAP) 구조를 멀티 인스턴스 학습(MIL) 관점에서 재해석했어요. 이미지 전체 예측이 틀리더라도 공간적 클래스 증거가 회수 가능하다는 점을 입증했어요. 이를 통해 이미지 로그릿을 예측 그리드로 분해하여 GAP에 가려진 공간적 클래스 증거를 추출하는 진단 도구를 제시했어요.
기존 분류기는 단일 레이블 이미지로 학습해도 다중 객체 장면에서 의도된 분류 작업을 학습할 수 있다는 사실을 확인했어요. 이는 GAP이 공간적 클래스 증거를 뭉개는 한계점을 시사하며, 일반적인 분류기 오류는 평균 집계의 알려진 한계를 반영하는 것으로 나타났어요.
연구 결과, 기존 모델은 전경 영역에서 지상 진실 클래스를 일관되게 회수하며, 이는 GAP의 숨겨진 기능을 보여주는 사례예요.