연구진이 CUDA 커널 개발을 자동화하는 에이전트 스킬을 개발하여 코덱스와 클로드에 적용했습니다. 이 스킬은 GPU 아키텍처 최적화, 라이브러리 통합 패턴 등 전문 지식을 제공하여 복잡한 커널 개발 과정을 단순화합니다.
새로운 스킬은 디퓨저(Diffusers) 파이프라인과 트랜스포머(Transformers) 모델에 대한 작동 커널을 생성했으며, PyTorch 바인딩과 벤치마크를 포함합니다. 이를 통해 CUDA 커널 개발의 장벽을 낮추고 생산성을 향상시킵니다.
이 스킬은 커널 라이브러리에서 제공되며, 단일 명령어로 설치 가능합니다. 사용자는 특정 모델과 아키텍처를 타겟으로 하는 최적화된 커널을 생성하고, PyTorch 기준 성능과 비교하여 개선 효과를 검증할 수 있습니다.