RTX 6000 Pro 4개로 GLM 5.1 모델을 안정적이고 빠르게 구동하는 데 성공했어요. 현재 추론 소프트웨어는 최적화되지 않았지만, 향후 성능 향상이 기대돼요. 컨텍스트 깊이에 따른 처리량 테스트 결과, 64K 컨텍스트에서도 초당 863.5회 처리, 35.87 ppp/s의 성능을 보여줬어요. OpenCode의 전반적인 경험은 Sonnet과 Claude Code에 근접하며, 100만~200만 세션까지 안정적으로 처리할 수 있어요.