MOSS-Audio는 음성 기록을 분석하여 자막 생성, 소리 및 이벤트 감지, 음악 분석 등을 수행하는 오픈소스 AI 모델이에요. 팟캐스트 분석, LoRA 학습 데이터 준비, AI 연구 워크플로우 등 다양한 분야에 활용될 수 있으며, Joy Caption과 유사하지만 이미지 대신 오디오를 분석해요. GitHub 저장소에서 GUI를 통해 배치 자막 생성, 유튜브 영상 자막 생성, 파일 분할 등의 기능을 사용할 수 있어요.