Eitamr 님이 Go 언어에서 cgo 없이 CUDA 바인딩을 개발하는 프로젝트를 진행하고 있어요. 기존 Go CUDA 프로젝트의 빌드 시간 문제와 Docker 이미지 크기를 해결하기 위해 런타임에 libcuda.so를 로드하는 방식을 사용해요. 현재는 간단한 실행기를 통해 OS 스레드와 goroutine 간의 연관성을 관리하며, GPU 벡터 연산 성능 테스트를 진행 중이에요.
4070 Ti GPU에서 1000만 벡터 덧셈 테스트 시 CPU 타임은 160us였지만, 실제 GPU 이벤트 타임은 434us로 차이가 발생했어요. 프로젝트는 아직 초기 단계이며, 그래프 및 멀티 GPU 지원을 추가할 예정이에요.
GitHub 저장소(github.com/eitamring/gocudrv)를 통해 프로젝트 코드를 확인할 수 있으며, 5000 시리즈 GPU 사용자는 테스트 참여를 환영해요.