사용자가 YouTube 영상 분석 백엔드를 구축 중이며, 현재는 전체 오디오를 다운로드하는 방식이 지연 문제를 야기합니다. 실시간 SSE 스트리밍을 위해 오디오 청킹, Whisper, LLM을 파이프라인화하려 하며, 문장 분할 없이 오디오 청킹하는 최적 방법을 찾고 있습니다. FastAPI의 asyncio만으로 충분한지, 아니면 Celery/Redis 워커가 필요한지 고민하며, 관련 라이브러리나 아키텍처 패턴에 대한 조언을 구합니다.