NAACA는 훈련 없이 작동하는 신경음성 주의 인지 아키텍처로, 음성 데이터에서 중요한 순간을 놓치지 않도록 설계되었습니다.
OWM(Oscillatory Working Memory)은 음성 신호의 변화를 감지하여 불필요한 ALM(Audio Language Model) 호출을 줄이고, 중요한 정보만 처리하도록 돕습니다.
XD-Violence 데이터셋에서 NAACA는 AudioQwen의 평균 정밀도(AP)를 53.50%에서 70.60%로 향상시켰습니다.