Pulse · AI 뉴스

Cohere Transcribe 모델, 화자 구분 및 타임스탬프 지원으로 개선

Cohere · 2026-05-23

Cohere Transcribe 모델이 화자 구분 및 타임스탬프 기능을 지원하도록 파인튜닝됐어요. 개선된 모델은 0.097초 이내의 정확한 타임스탬프를 제공하며 최대 32명까지 화자 식별 가능해요. Hugging Face에서 무료로 사용할 수 있어요.

기존 Cohere Transcribe 모델은 화자 구분 및 타임스탬프 기능이 지원되지 않았던 한계가 있었어요. 사용자는 토큰화 과정에서 관련 토큰이 존재함에도 불구하고 기능 미지원에 어려움을 겪었어요. 이번 파인튜닝을 통해 이러한 문제를 해결하고 모델 활용도를 높였어요.

개선된 모델은 `<|t:0.0|> Welcome back. <|t:1.5|> Thanks. <|t:2.4|> ` 와 같은 형식으로 출력하며, 30초당 최대 4명의 화자를 지원하고 `diarize_long.py` 스크립트를 통해 최대 32명의 화자 식별이 가능해요.

##Cohere##Transcribe##오픈소스##음성인식##HuggingFace
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기