연구진이 프로그램-오브-토(PoT)의 실패를 극복하기 위해 RePoT(Recoverable PoT)를 개발했어요. RePoT는 환경을 따라가며 첫 번째 오류 지점까지 이동한 후, LLM을 한 번 더 호출하여 복구를 시도하는 방식이에요.
PoT가 실패하는 약 14%의 문제에서만 추가 LLM 호출이 필요하며, PuzzleZoo-775에서 GPT-5.4-mini-medium 모델에서 최대 96.9%의 정확도를 기록했어요.
Derail-550 벤치마크에서 체크포인트 정보 접근 시 오류 정보만 사용할 때보다 훨씬 높은 성공률을 보이며, 이는 복구 신호가 체크포인트 정보에 있음을 시사해요.