AutoJudge는 LLM 추론 속도를 높이기 위해 토큰 불일치를 자동으로 식별하는 기술이에요. 작은 크기의 분류기를 활용하여 표준 추론 방식보다 1.5~2배 빠른 속도를 낼 수 있어요. 자체 학습 방식으로 토큰 불일치가 실제로 중요한지 판단하여 정확도를 유지하면서 속도를 향상시켰어요.