연구에서는 대규모 언어 모델의 추론 능력이 기본 연산에서 비롯될 수 있음을 밝히고, 정보 회수와 상태 추적이라는 두 가지 기본 연산을 통해 추론을 분석했어요.
하이브리드 모델이 주의 메커니즘 기반 검색과 순환 상태 업데이트를 결합하여 상태 추적과 정보 회수를 모두 요구하는 작업에 더 적합한지 평가했답니다.
연구 결과, 추론 증강이 모델의 효과적인 운영 범위를 확장하고, 하이브리드 모델은 순차적 의존성이 증가함에 따라 더 강력한 성능을 유지하는 것으로 나타났어요.