Pulse · AI 뉴스

메모리 효율적인 트랜스포머 학습 및 추론을 위한 텐서 및 시퀀스 병렬 처리

arXiv cs.CL · 2026-04-29

연구진은 텐서 병렬 처리와 시퀀스 병렬 처리를 하나의 장치 축에 통합하는 TSP(Tensor and Sequence Parallelism)라는 새로운 병렬 실행 전략을 제시했어요.

TSP는 기존 방식과 달리, 각 랭크에 가중치 샤드와 시퀀스 샤드를 모두 할당하여 파라미터와 활성화 메모리를 동시에 줄여요.

실험 결과, TSP는 긴 컨텍스트와 메모리 제약이 있는 모델 학습에 적합하며, 파이프라인 및 전문가 병렬 처리와 함께 사용할 수 있는 유망한 병렬 처리 방식이에요.

##병렬처리##트랜스포머##메모리최적화##TSP
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기