연구진은 다국어 추론 시 언어 이해 실패로 인한 성능 격차를 줄이기 위해 Luar 프레임워크를 개발했어요. Luar는 강화 학습을 활용해 모델이 직접 추론하거나 영어 번역 후 추론할지 선택하도록 훈련하여 불필요한 번역을 줄여요. 실험 결과, Luar는 기존 방식보다 성능이 뛰어나고, 저자원 언어에서 특히 큰 효과를 보이며, 새로운 저자원 언어에도 적용 가능했어요.