Pulse · AI 뉴스

Flash-GMM: GPU 메모리 효율적인 GMM 커널 공개

Flash-GMM · 2026-06-09

연구진이 대규모 데이터셋에서 GMM(Gaussian Mixture Model) 연산을 가속화하는 Flash-GMM 커널을 개발했어요. 기존 방식 대비 20배 빠른 속도를 보여 GPU 메모리 사용량을 줄여 데이터셋 크기를 100배까지 늘릴 수 있어요. IVF coarse quantizer에 통합하여 ANN(Approximate Nearest Neighbor) 검색 성능을 향상시켰고, k-means 대체 가능성을 제시했어요.

##GMM##GPU##ANN##Triton
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기