chopratejas가 headroom 프로젝트를 공개했어요. LLM 입력 데이터를 압축해 토큰 사용량을 60~95% 줄여줘요. 작은 모델의 속도를 높여 활용도를 개선할 수 있어요. 프로젝트는 LLM 출력, 로그, 파일, RAG 청크를 압축하는 기능을 제공하며, 일부 텔레메트리 데이터 전송 기능은 사용자가 비활성화할 수 있어요. 작은 모델의 성능을 향상시키는 데 도움을 줘요.