연구자들이 가중치를 분리하여 로컬 머신에서 LLM을 실행하는 새로운 기술을 개발했어요. 이 기술은 LLM의 규모 제한을 극복하고, 저렴한 Xeon 머신에서도 고성능 LLM을 실행할 수 있도록 해줍니다. GitHub 저장소에서 관련 코드를 확인할 수 있으며, 유튜브 영상에서 기술 개요를 확인할 수 있어요.