사용자 woct0rdho가 SageAttention의 블록 크기 자동 튜닝 기능을 개발했어요. 입력 크기에 따라 최적 성능을 내도록 블록 크기를 조정하는 방식입니다. 원본 SageAttention보다 빠르다면 자유롭게 사용해볼 수 있어요. SageAttention의 head dim 256 지원 기능 추가 과정에서 자동 튜닝 기능이 파생됐어요. GitHub에서 관련 코드를 확인할 수 있습니다.