Pulse · AI 뉴스

Maestro: 다중 모델·기술 조합을 위한 강화 학습 프레임워크

Maestro · 2026-05-21

연구진이 다양한 LLM과 기술 조합을 효율적으로 관리하는 Maestro 프레임워크를 발표했어요.

Maestro는 강화 학습(RL)을 활용해 모델과 기술을 동적으로 조합하며, 4B 파라미터의 가벼운 정책만으로도 GPT-5와 Gemini-2.5-Pro를 능가하는 70.1%의 평균 정확도를 달성했어요.

학습된 정책은 추가 훈련 없이 새로운 모델과 기술에 일반화되며, 기존 모델보다 59.5% 높은 성능을 보여주고, 낮은 지연 시간으로 효율적인 연산이 가능해요.

##LLM##강화학습##Maestro##에이전트

매일 핵심 AI 소식을 한국어로, 빠르게