Reddit 사용자가 4개의 GPU를 분할 PCIe 슬롯에 연결했을 때 P2P 통신 성능 저하 문제를 분석했어요. PCIe 브릿지가 병목 현상을 일으켜 P2P를 끄는 것보다 성능이 떨어질 수 있다고 설명했어요. 해결책으로 P2P 사용 중단, 중국산 분할 브릿지 사용, Cpayne의 PCIe 브릿지 구매, 텐서 병렬 대신 파이프라인 병렬 사용 등을 제시했어요.
P2P를 켜도 성능 향상은 10~15% 수준이며, 중국산 분할 브릿지는 150~250달러, Cpayne 브릿지는 1200달러에 달할 수 있다고 언급했어요. 파이프라인 병렬은 저 컨커런시 환경에서 성능이 떨어질 수 있다고 설명했어요.
중고 PLX 스위치를 사용할 수 있지만, 펌웨어 제한으로 인해 P2P가 지원되지 않을 수 있으며, 마더보드와 CPU 조합을 통해 각 슬롯에 전용 PCIe 레인을 제공하는 방법도 있지만 리타이머가 필요할 수 있다고 덧붙였어요.