Z.ai에서 GLM-4.6V 모델 시리즈를 공개했는데, 클라우드 환경에 적합한 106B 모델과 로컬 배포에 최적화된 9B 모델 두 가지 버전이 있어요.
GLM-4.6V는 이미지-텍스트 혼합 콘텐츠 생성, 멀티모달 문서 이해, UI 프론트엔드 복제 및 시각적 편집 기능을 지원하며, 특히 멀티모달 기능 호출 기능을 처음으로 통합했어요.
이 모델은 128K 토큰의 컨텍스트 윈도우를 지원하며, 비슷한 규모의 모델 중 시각적 이해 성능에서 최고 수준을 달성했어요.