사용자가 Apodex 4B 모델을 주말 동안 테스트하며 검색 에이전트로서의 성능을 확인했어요.
Apodex 모델은 검색 도구를 활용해 답변을 생성하고, 스스로의 답변을 검증하는 방식으로 작동해요.
3090 GPU 환경에서 vLLM을 통해 Apodex 4B를 실행했을 때, 다른 4B 모델 대비 환각 현상이 적고 BrowseComp에서 우수한 성능을 보여줬어요.
현재 gguf 버전이 없어 llama.cpp 환경에서 사용하려면 직접 변환해야 하며, 35B mini 모델의 gguf 버전이 있다면 공유해달라는 요청을 남겼어요.