연구진은 테스트 시간 컴퓨팅을 반복적으로 업데이트하여 확장하는 방식이 강력한 추론 패러다임으로 떠오르고 있다고 밝혔습니다. 이 과정에서 학습된 작업 조건 속인계는 유효한 솔루션에 해당하는 안정적인 고정점을 갖는 잠재적 동적 시스템입니다.
Equilibrium Reasoners (EqR)는 외부 검증기나 작업별 사전 지식 없이 테스트 시간 확장을 가능하게 하며, 깊이와 폭의 두 축을 따라 내부 동역학을 확장합니다.
연구 결과, 테스트 시간 확장에서 얻는 이점은 솔루션 정렬된 속인계로의 더 강력한 수렴과 밀접하게 관련되어 있으며, 최대 40,000개의 레이어를 펼쳐서 확장 가능한 잠재적 추론을 통해 정확도를 크게 향상시켰습니다.