Amazon SageMaker AI가 새로운 인스턴스 자동 폴백 기능을 발표했어요. 사용자는 우선순위 목록으로 인스턴스 유형을 정의하고, SageMaker AI가 용량이 제한될 때 자동으로 목록을 처리합니다. 이를 통해 사용자는 수동 개입 없이 사용 가능한 AI 인프라에 엔드포인트를 프로비저닝할 수 있어요.
싱글 모델 엔드포인트, 추론 컴포넌트 기반 엔드포인트, 비동기 추론 엔드포인트에 이 기능이 적용돼요. 인스턴스 유형 목록을 정의하면, SageMaker AI가 자동으로 사용 가능한 인프라를 찾아 엔드포인트를 프로비저닝합니다.
이 기능은 엔드포인트 생성, 확장, 축소 시 용량 제약이 있을 때 자동으로 작동하며, 사용자는 수동으로 개입할 필요가 없어요.