연구진은 신경 라우팅 정책의 장기적인 계획 능력을 향상시키는 새로운 학습 전략인 멀티노드 룩어헤드 예측(MnLP)을 제안했어요. MnLP는 모델이 여러 미래 노드를 동시에 예측하도록 하여 기존의 단기적인 예측 방식의 한계를 극복해요.
MnLP는 원인-결과 관계를 고려하고 불필요한 예측을 제거하는 모듈을 도입하여 학습 효율성을 높이고, 추론 시간의 오버헤드를 최소화해요.
실험 결과, MnLP는 다양한 문제 크기, 분포, 벤치마크에서 기존 학습 방법보다 뛰어난 성능을 보였으며, 다양한 신경망 구조에 통합될 수 있어요.