Bonsai 모델의 크기와 성능을 비교한 결과, Bonsai-8B는 Gemma-4-E2B보다 훨씬 낮은 성능을 보였습니다.
Bonsai-8B 모델은 양자화(quantization)를 적용했음에도 불구하고 Gemma-4-E2B와 크기 차이가 크지 않았으며, 1.58비트 모델은 오히려 더 큰 용량을 차지했습니다.
PrismML-Eng에서 제공하는 llama.cpp 포크를 사용하여 Bonsai 모델을 테스트했으며, 결과는 기존의 1비트 모델보다 더 부정확했습니다.