사용자가 16GB VRAM GPU로 16B 모델을 실행하는 데 성공했어요. 두 개의 16GB GPU를 추가했을 때 32B 모델 성능이 저하될지 궁금해했어요. PCIe 대역폭 제한으로 인해 성능이 느려질 수 있는지 질문했어요. PCIe 3.0 x8 슬롯에서 두 GPU를 사용할 경우, 32B 모델이 16B 모델보다 느려질 가능성이 있어요. PCIe 대역폭 제한이 성능에 미치는 영향에 대한 질문입니다.