연구진은 LLM의 사고 과정이 자연스럽게 컨텍스트를 압축할 수 있음을 발견했어요. 새로운 패러다임 '사고를 압축으로(TaC)'를 제시하며, 별도 압축 모듈 없이 모델 자체를 활용해 컨텍스트를 압축합니다.
TaC는 기존 압축 방식보다 성능이 뛰어나며, TaC-C는 추가적인 제어 프레임워크를 통해 압축률과 성능을 더욱 향상시켰어요.
4배, 8배 압축 비율에서 기존 방식 대비 F1 점수 17.4%, 23.4%, 정확 일치 점수(EM) 15.7%, 21.7% 향상이라는 결과를 보였어요.