노타가 이기종 컴퓨팅 기반 LLM 추론 최적화 기술을 개발했어요. 인텔 루나 레이크 기반 AI PC에서 GPU와 NPU를 활용해 입력 처리와 답변 생성 단계를 분리했어요. 새 기술은 토큰당 에너지 소비를 약 32% 줄이고 생성 처리량을 약 12% 향상시켰어요. 분리형 추론 방식으로 GPU는 입력 처리, NPU는 답변 생성을 담당해요.