Pulse · AI 뉴스

노타, 이기종 컴퓨팅 기반 AI 추론 기술 개발…GPU·NPU 역할 분배가 핵심

노타 · 2026-06-04

노타가 이기종 컴퓨팅 기반 LLM 추론 최적화 기술을 개발했어요. 인텔 루나 레이크 기반 AI PC에서 GPU와 NPU를 활용해 입력 처리와 답변 생성 단계를 분리했어요.

새 기술은 토큰당 에너지 소비를 약 32% 줄이고 생성 처리량을 약 12% 향상시켰어요. 분리형 추론 방식으로 GPU는 입력 처리, NPU는 답변 생성을 담당해요.

##AI추론##이기종컴퓨팅##AIPC

매일 핵심 AI 소식을 한국어로, 빠르게