연구자가 NLLB-200 600M 모델을 파인튜닝하면서 긴 시퀀스 때문에 배치 크기가 제한되는 문제를 겪었어요. 동적 배치 기법인 dynabatch를 개발하여 GPU 활용률을 높이고, 훈련 처리량을 약 3.3배 향상시켰어요. 이 기법은 주로 인코더-디코더 모델, 특히 MT(기계 번역)에 적합하며, 디코더 전용 모델에는 시퀀스 패킹이 더 효과적일 수 있어요.