Pulse · AI 뉴스

MLXP, Kubernetes 기반 LLM 서빙 최적화 기술 도입기

NAVER · 2026-06-11

네이버가 NAVER ENGINEERING DAY 2026에서 발표한 기술 교류 세션을 공개했어요. LLM 추론 성능 극대화를 위한 최신 기술을 Kubernetes 환경에 도입하는 과정에서 발생한 문제 해결 과정을 공유합니다. GPU 워크로드 운영, MLOps, Istio 환경에서 AI 워크로드를 다루는 엔지니어를 대상으로 합니다.

##Kubernetes##LLM##Istio
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기