연구진은 기존 RAG 방식이 추론 문제 해결에 효과적이지 않다는 통념을 뒤집고, 문제 해결 과정에서 생성되는 '생각의 흐름(thinking traces)'을 활용한 새로운 RAG 방식이 강력한 성능을 낸다고 밝혔습니다.
T3라는 오프라인 방법을 통해 생각의 흐름을 구조화하여 활용함으로써, Gemini-2.5-Flash, GPT-OSS-120B, GPT-5 등 최신 모델의 추론 능력을 각각 56.3%, 8.6%, 7.6% 향상시켰습니다.
T3 기반 RAG는 추론 비용을 거의 발생시키지 않거나 최대 15%까지 절감할 수 있어, 추론 능력 향상과 비용 절감이라는 두 가지 효과를 동시에 얻을 수 있습니다.