연구진은 6개의 최첨단 테이블 모델의 계층별 작동 방식을 분석하여 예측이 어떻게 나타나는지 조사했어요. 분석 결과, 여러 모델에서 깊이별로 상당한 중복성이 발견되어 추론 과정에서 중복 계산이 일어나는 것으로 보입니다. 이러한 분석을 바탕으로 원래 모델의 20% 파라미터만 사용하는 단일 계층 모델을 개발하여 유사한 성능을 달성했어요.