연구진은 Looped Transformer가 변동 길이 알고리즘 작업에서 뛰어난 길이 외삽 능력을 보이지만, 예측 변동성이 크다는 문제를 확인했어요. 학습 과정에서 반복 횟수에 확률적 요소를 도입하면 OOD 변동성을 줄이고 추론 시 반복 횟수에 따른 예측을 안정화할 수 있어요. RL-Halting을 활용한 학습 기반 확률적 스케줄은 정확도와 안정성 간의 균형을 개선하지만, 때로는 최적의 계산을 안정화할 수도 있다는 점을 발견했어요.