본 연구는 대규모 오디오 언어 모델(LALM)의 작동 방식과 신뢰성 문제를 심층적으로 분석합니다. LALM의 공격 가능성이 커짐에 따라, 교차 모드 탈옥, 음향 백도어, 생체 정보 유출 등 다양한 취약점을 분류하고 평가했습니다. 연구 결과, 성능 향상과 함께 신뢰성 확보를 위한 'Defense-in-Depth' 아키텍처, 음향 세계 모델링, 내재적 표현 엔지니어링이 필요하다는 결론을 내렸습니다.