최근 연구에 따르면 모델 내부를 탐색하면 모델 생성 결과로는 알 수 없는 많은 정보를 얻을 수 있다고 해요. 이는 의도치 않거나 악의적인 정보 유출의 위험을 초래하며, 모델 사용자가 모델 소유자가 접근 불가능하다고 생각했던 정보를 학습할 수 있게 만들 수 있어요. 본 연구에서는 비전-언어 모델을 테스트베드로 삼아, 잔차 흐름에서 다양한 '표현 수준'에 저장된 정보를 체계적으로 비교 분석했어요.