Pulse · AI 뉴스

GPU 예측 모델: 커널 런타임 최적화를 위한 LLM의 선택적 대리

arXiv cs.LG · 2026-05-30

연구진은 LLM을 활용하여 GPU 커널 성능을 예측하고, 실제 GPU 측정 비용을 절감하는 방법을 연구했어요.

LLM은 정확한 예측과 함께, 예측이 틀릴 수 있을 때 GPU 측정을 defer하는 선택성도 갖춰야 효과적이에요.

실험 결과, LLM은 커널 성능을 정확하게 예측하고, 강화 학습을 통해 예측 정확도와 신뢰도 보정이 가능했어요.

##LLM##GPU##커널##최적화##강화학습
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기