Pulse · AI 뉴스

텐서 관련 주요 오류 수정 b9820

ggml · 2026-06-27

ggml 프로젝트에서 CUDA 성능 개선 및 백엔드 호환성 관련 수정 사항이 적용됐습니다. 토큰 분할 시 동기화 과정을 줄여 CUDA 성능을 향상시키고, CPU-CUDA 데이터 복사 기능을 추가했습니다. Vulkan과 같은 다른 백엔드에서도 활용 가능한 일반적인 동기화 완화 매크로가 추가됐습니다.

##CUDA##ggml##텐서##성능

매일 핵심 AI 소식을 한국어로, 빠르게

App Store 에서 Pulse 받기 앱에서 열기