연구진은 LLM의 장기적인 추론 과정에서 발생하는 오류를 감지하고 복구하는 'ReFlect' 시스템을 개발했습니다. ReFlect는 모델 주변에 결정론적인 래퍼를 만들어 독립적인 오류 감지 및 복구 로직을 제공하며, 6가지 추론 영역에서 41%에서 56%의 성공률을 보였습니다. 실험 결과, ReFlect는 기존 방식 대비 작업 성공률을 높이고 SWE-bench 패치 구조 품질을 향상시키는 등 긍정적인 효과를 확인했습니다.