Reddit 사용자가 Mac Studio M3 Ultra와 NVIDIA RTX PRO 6000을 연결하여 Kimi K2.7 Code 모델을 테스트한 결과, RPC를 통해 프리필 속도가 약 14.8% 향상되는 것을 확인했어요.
디코딩 속도는 약 4.2% 향상되었으며, 전체 요청 시간은 약 12.3% 개선되었지만, 네트워크 병목 현상으로 인해 개선폭이 제한적이었어요.
GPU를 추가할수록 프리필 속도가 감소하는 추세는 지속될 것으로 예상되며, 멀티 GPU 환경에서 경험이 있는 사용자들의 의견을 구하고 있어요.