연구진은 LLM 추론 과정에서 정보 공개 시점을 조절하는 Side-by-Side (SxS) Interleaved Reasoning 방식을 제안했어요. 이 방식은 부분적인 정보 공개와 추가적인 추론을 병행하며, 추론 과정을 뒷받침하는 내용만 공개하는 방식이에요.
Qwen3-30B-A3B, Qwen3-4B 등 두 가지 Qwen3 아키텍처에서 AIME25, GPQA-Diamond 벤치마크를 통해 성능을 검증했는데, 콘텐츠-지연 시간 간의 균형을 개선했어요.
SxS 방식은 토큰 단위의 지연 시간을 활용하여 정확도와 콘텐츠 지연 사이의 균형을 맞추는 데 효과적이었어요.