소프트웨어 엔지니어 겸 게이머가 RTX 2060 Super 8GB VRAM으로 GPT-1 모델을 로컬에서 학습하는 데 성공했어요. GPT-2보다 작은 GPT-1 모델을 활용해 10억 개 미만의 파라미터 모델 학습이 가능하며, 관련 코드는 GitHub에서 확인할 수 있어요. 1시간 동안 학습한 모델은 undertrained 상태이지만, 누구나 로컬 환경에서 나노챗과 유사한 모델을 학습할 수 있다는 점이 의미 있어요.