Amazon SageMaker AI에서 NVIDIA Blackwell 아키텍처를 활용한 모델 훈련 방법을 소개합니다. Blackwell의 확장 메모리를 활용하기 위한 배치 크기 및 시퀀스 길이 선택, 모델 크기에 맞는 정밀도 형식 선택, 활성화 체크포인팅 전략 적용 방법을 배울 수 있습니다.
10억에서 640억 파라미터 모델까지 다양한 크기의 모델에 적용 가능하며, 분산 훈련 작업을 P6-B200 인스턴스에서 실행하는 프레임워크를 제공합니다. Blackwell의 성능을 최대한 활용하기 위한 훈련 구성 튜닝 방법을 안내합니다.