사용자 'darshi1337'이 800만 파라미터 HermitLM이라는 소형 LLM과 디스코드 봇을 개발했어요. 이 모델은 해저 채집꾼처럼 독특한 방식으로 대화하며, 현재 10만 개의 데이터셋으로 학습됐어요.
FastAPI 백엔드, 디스코드 통합, Wolfram 기반 수학 라우팅, 웹 검색 라우팅 등 다양한 기능을 포함하고 있으며, EC2 배포도 지원돼요.
모델 크기를 키우지 않고도 라우팅 도구를 활용해 성능을 향상시키는 실험을 목표로 개발됐으며, GitHub에서 관련 코드를 확인할 수 있어요.