torchtune은 PyTorch 기반 LLM 후훈련 라이브러리로, 효율적인 파인튜닝, 실험, 배포 워크플로우를 지원합니다. 기존 프레임워크와 달리 투명성과 확장성을 강조하여 모듈화된 구조를 갖추고 있습니다. Axolotl, Unsloth 등과 비교하여 성능과 메모리 효율성이 뛰어나 빠른 연구 반복을 가능하게 합니다.
torchtune은 모델 빌더, 훈련 레시피, 분산 훈련 스택을 통해 PyTorch 구성 요소를 직접 접근할 수 있도록 설계되었습니다. 이는 LLM 후훈련 연구의 재현성을 높이는 데 기여합니다.
본 논문에서는 torchtune의 설계 원칙과 주요 기능을 소개하고, 다양한 후훈련 환경에서 성능을 평가하여 실용적인 기반을 제공합니다.