nvidia에서 Gemma-4-26B-A4B-NVFP4 모델이 5090에서 80% 할당 시 약 8만 토큰의 컨텍스트를 처리할 수 있다는 정보가 확인됐어요. 모델은 18.8GB 용량을 가지고 있으며, 다양한 벤치마크 테스트에서 높은 성능을 보여주고 있어요. Reddit 사용자 reto-wyss가 관련 정보를 공유하며, 모델의 활용 가능성을 제시했어요.