Reddit 사용자가 영상 파일에서 .srt 자막을 생성할 수 있는 로컬 호스팅 앱을 찾고 있어요. Qwen-ASR 모델을 사용하려 했지만, 자막 분할이 좋지 않아 활용에 어려움을 겪고 있어요. Whisper 모델 기반 앱도 시도했지만 속도가 느리고 결과가 만족스럽지 않다고 해요.
ComfyUI 노드를 통해 Qwen-ASR을 사용했을 때 텍스트 자체는 좋지만, 자막 분할이 문제라고 언급했어요. Voxtral도 고려 중이지만, 설정 방법을 찾지 못하고 있어요. StorytoolkitAI는 느리고 결과가 불안정하다고 해요.
Reddit 사용자는 로컬에서 자막을 생성할 수 있는 앱을 찾고 있으며, Docker 또는 Windows 환경에서 사용 가능한 앱을 선호하고 있습니다.