Pulse · AI 뉴스

향상된 배치 추론 API: 개선된 UI, 확장된 모델 지원, 3000배 향상된 속도 제한

Together AI Blog · 2025-09-15

새로운 배치 추론 API를 통해 대규모 AI 워크로드를 더 쉽고 빠르게, 저렴하게 처리할 수 있어요.

UI가 간편해졌고, 다양한 모델을 지원하며, 최대 300억 토큰까지 처리 가능한 속도 제한이 3000배 증가했어요.

실시간 API 대비 절반의 비용으로 대규모 데이터셋을 처리할 수 있게 되었어요.

##API##배치추론##성능개선
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기