AuRA는 LLM에 오디오 인코딩 능력을 통합하는 새로운 방법으로, ASR 인코더와 LoRA로 조정된 LLM을 활용해 음성 표현을 LLM에 내재화합니다. 기존 방식 대비 AuRA는 음성-언어 결합 모델링을 강화하고 효율적인 병렬 추론을 가능하게 합니다. 여러 벤치마크에서 기존 시스템보다 성능과 효율성 모두 우수합니다.