Lemonade가 v10.8 업데이트를 공개하며, 20명의 기여자 참여로 7일 만에 개발 완료했습니다.
자동 VRAM 관리 기능으로 유휴 모델을 자동으로 언로드하고 GPU 메모리를 확보하며, 모델 고정 기능을 통해 자주 사용하는 모델이 제거되지 않도록 합니다.
자동 컨텍스트 크기 조정 기능은 사용자가 직접 튜닝하지 않아도 모델 아키텍처와 사용 가능한 메모리에 맞춰 컨텍스트 길이를 자동으로 선택합니다.
MCP 게이트웨이를 통해 로컬 Lemonade 모델을 모델 목록, 채팅, 오디오 녹음, 이미지 생성, 멀티모달 Omni 등 5가지 도구로 활용할 수 있습니다.