GGUF는 llama.cpp에서 사용하는 언어 모델 파일 형식으로, 모델 실행에 필요한 메타데이터를 하나의 파일에 담아 배포와 로딩을 간편하게 합니다. 채팅 템플릿은 Jinja2 스크립트로 대화 형식, 도구 호출, 멀티미디어 메시지 인코딩을 처리합니다. 구현체별로 처리 방식이 달라 아직 개선이 필요한 부분도 있습니다.