Together AI는 FlashAttention과 ThunderKittens 개발팀을 통해 GPU 하드웨어와 AI 생산성 간의 격차를 좁히고 있어요. 커널 연구팀은 하드웨어 수준에서 최적화를 진행하며, 이를 통해 모델 성능을 향상시키고 있어요. 이러한 노력은 Together AI의 AI 모델 개발 효율성을 높이는 데 기여하고 있습니다.