연구진은 LLM을 활용하여 GPU 커널 성능을 예측하고, 실제 GPU 측정 비용을 절감하는 방법을 연구했어요. LLM은 정확한 예측과 함께, 예측이 틀릴 수 있을 때 GPU 측정을 defer하는 선택성도 갖춰야 효과적이에요. 실험 결과, LLM은 커널 성능을 정확하게 예측하고, 강화 학습을 통해 예측 정확도와 신뢰도 보정이 가능했어요.