연구진은 AI 연산 수요 증가와 전력망 부담을 완화하기 위해 풍력 발전소에 AI 연산 인프라를 배치하는 AI Greenferencing 모델을 제안했어요.
XWind는 실시간 지연 시간, KV 캐시 사용률, 큐 깊이 정보를 활용하여 풍력 발전소의 AI 추론 요청을 동적으로 분산하는 경량 라우터예요.
실제 64 GPU A100 테스트베드에서 XWind는 기존 방식 대비 최대 98%까지 P99 지연 시간을 단축하며 다양한 워크로드에서 일관된 성능 향상을 보였어요.