Pulse · AI 뉴스

BUDDY: 예산 기반 동적 깊이 라우팅을 통한 적응형 LLM 추론

BUDDY · 2026-06-08

BUDDY는 LLM 추론 비용 절감을 위해 개발된 예산 기반 동적 깊이 라우팅 프레임워크입니다.

입력에 따라 중간 레이어를 평가하고, 주어진 예산 내에서 상위 k개 레이어를 실행하여 추론 경로를 결정합니다.

Llama 및 Qwen 모델 실험 결과, 기존 정적 가지치기 방법보다 정확도와 연산량 균형을 개선하고, 엄격한 예산 제어 및 실시간 재라우팅을 지원합니다.

##LLM##추론##최적화##BUDDY
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기