본 연구는 루프 트랜스포머의 구조적 선택이 테스트 시간의 어려운 문제에 대한 일반화 성능에 미치는 영향을 분석합니다.
제안된 프레임워크는 안정성(reachability, input-dependence, geometry)을 기준으로 루프 아키텍처를 분석하며, 이론적으로 특정 조건 하에서 의미 있는 예측을 가능하게 합니다.
실험 결과, 루프 트랜스포머의 성능은 프레임워크의 예측과 일치했으며, 새로운 recall 배치 방식인 '내부 recall'이 표준 recall과 경쟁하거나 sudoku 문제에서 더 나은 성능을 보였습니다.