AI 에이전트의 급속한 도입으로 LLM 토큰 소비가 빠르게 증가하고 있으며, 이에 따라 토큰 사용 패턴 분석에 대한 질문이 제기되고 있어요.
연구 결과, 에이전트 작업은 코드 추론 및 채팅보다 1000배 더 많은 토큰을 소비하며, 입력 토큰이 전체 비용을 좌우하는 것으로 나타났어요.
GPT-5에 비해 Kimi-K2와 Claude-Sonnet-4.5는 동일 작업에서 평균적으로 150만 토큰 이상을 더 소비했으며, 모델은 자체 토큰 사용량을 정확하게 예측하지 못했어요.