연구진은 LLM의 오개념을 수정하고 쿼리 구조에 적응하기 위해 쿼리 기반 테스트 시간 자체 학습(QueST) 프레임워크를 제안했습니다. QueST는 입력 쿼리 자체에서 파생된 감독 신호를 사용하여 추론 시 모델 파라미터를 조정하며, 외부 데이터 없이 쿼리별 적응을 가능하게 합니다. 7개의 수학적 추론 벤치마크와 GPQA-Diamond 과학적 추론 벤치마크에서 기존 테스트 시간 최적화 방법보다 우수한 성능을 보였습니다.