LLM의 표준 가격 모델은 토큰당 요금제인데, 보고된 토큰 수의 정확성은 사용자에게 직접적인 영향을 미칩니다.
LLM 제공업체는 모델, 토크나이저, 실행 환경을 숨겨 IP를 보호하고, 탈옥을 방지하며, 사용자 개인정보를 보호하기 때문에 감사하기 어렵습니다.
현재 감사 시스템은 제공업체의 보고 내용에 대한 일관성 검사에 불과하며, 제공업체가 조작할 유인이 있는 정보에 의존하는 '신뢰 역설'이 존재합니다.
연구 결과, 상용 수준의 역량을 가진 제공업체는 감지되지 않고도 청구된 토큰 수를 체계적으로 늘릴 수 있으며, 최악의 경우 숨겨진 추론 사용량이 평균 1,469%까지 부풀려질 수 있습니다.