Tesla V100 16GB 모듈을 활용해 Claude Code를 오프라인으로 실행하기 위한 벤치마크 결과를 공유합니다. 싱글 모듈은 26B 모델을 GPU에 완전히 로드할 수 있으며, 듀얼 모듈은 32GB 용량과 향상된 대역폭을 제공합니다.
싱글 모듈 환경에서 WSL2/MCDM 대비 TCC 드라이버 모드를 사용하면 Gemma 4 26B 모델의 처리 속도가 최대 76% 향상됩니다. 듀얼 모듈 환경에서는 16개의 에이전트를 동시에 실행하며 150~175 tok/s의 성능을 보여줍니다.
Volta GPU 드라이버 지원은 R570~R580 버전으로 제한되며, 전원 공급 장치의 트랜지언트 응답 문제로 인해 시스템이 재부팅되는 현상이 발생할 수 있습니다.