LLM 추론 비용을 비교하는 스프레드시트가 공개됐습니다. OpenRouter, DeepSeek, Together AI, Fireworks, Groq 등 7개 주요 제공업체의 가격 정보를 담고 있습니다. 캐싱 정책에 따라 동일 모델이라도 비용 차이가 최대 10배까지 발생할 수 있습니다. 특히 에이전트, RAG 파이프라인, 다중 턴 대화 등 반복적인 프롬프트를 사용하는 경우 캐싱 정책이 중요합니다.
스프레드시트는 토큰 가격, 컨텍스트 윈도우, 캐시된 입력 가격, 지원 모델, 제공업체별 가격 차이 등을 비교합니다. DeepSeek V4 Pro 모델의 경우 캐시 히트가 캐시 미스보다 수십 배 저렴한 경우도 있습니다. 모델별 가용성 및 컨텍스트 윈도우가 제공업체마다 일관되지 않은 점도 확인됐습니다.
향후 처리량, 대기 시간, 정밀도, 네트워크 비용 등 추가 데이터 포인트를 포함할 예정입니다. 사용자들은 어떤 지표를 중요하게 생각하는지 의견을 공유해 달라고 요청했습니다.