연구진은 잠재 체인 오브 씽킹(Latent CoT)의 약점을 정보 이론적 관점에서 분석하고, 최적화 과정의 기울기 감쇠와 잠재 공간의 표현적 드리프트라는 이중 붕괴 현상을 확인했어요.
과정 감독을 경로 감독(Trajectory Supervision)과 공간 감독(Space Supervision)으로 분해하여, 경로 감독은 단계별 추론 신호를 주입하고 공간 감독은 잠재 다양체의 의미 구조를 보존하는 역할을 해요.
연구 결과, 잠재 체인과 명시적 추론 단계 간의 상호 정보량을 측정하는 통합 잠재 프로브(ULP)를 통해 정보 충실도가 추론 정확도에 영향을 미치는 정보-성능 결합 현상을 발견했어요.