구글과 메타가 LLM 추론 효율을 자동으로 최적화하는 프레임워크 '오토 TTS'를 공개했어요. AI가 답변 생성 과정에서 연산량을 자동 조절해 정확도를 유지하면서 토큰 사용량과 운영 비용을 줄일 수 있어요. 기존 테스트 타임 스케일링(TTS) 방식의 한계를 해결하는 '오토 TTS'는 토큰 비용을 최대 69.5% 절감할 수 있으며, 이는 차세대 AI 인프라 핵심 기술로 평가받고 있어요.