아마존 Bedrock에서 모델 증류 기법을 사용하여 대형 모델(아마존 노바 프리미어)의 라우팅 지능을 소형 모델(아마존 노바 마이크로)로 이전하는 방법을 소개합니다. 이 방식은 추론 비용을 95% 이상 절감하고 지연 시간을 50% 줄이면서도 필요한 정교한 라우팅 품질을 유지합니다. 모델 증류는 아마존 Bedrock에서 모델 사용자 정의 기법으로, 비용 효율적인 AI 솔루션 구축에 기여합니다.