Pulse · AI 뉴스

구글·메타, AI가 스스로 추론 최적화하는 기술 개발…토큰 비용 69.5% 절감

Google · 2026-05-29

구글과 메타가 LLM 추론 효율을 자동으로 최적화하는 프레임워크 '오토 TTS'를 공개했어요. AI가 답변 생성 과정에서 연산량을 자동 조절해 정확도를 유지하면서 토큰 사용량과 운영 비용을 줄일 수 있어요.

기존 테스트 타임 스케일링(TTS) 방식의 한계를 해결하는 '오토 TTS'는 토큰 비용을 최대 69.5% 절감할 수 있으며, 이는 차세대 AI 인프라 핵심 기술로 평가받고 있어요.

##LLM##AI최적화##구글##메타

매일 핵심 AI 소식을 한국어로, 빠르게