대규모 언어 모델(LLM)은 단순한 텍스트 생성기를 넘어선 단계에 진입했어요. 이제는 정보 검색 파이프라인, 기업 비서, 코딩 환경, 로봇 시스템, 보안 운영 워크플로우, 그리고 조직 경계를 넘어 데이터 접근, 도구 호출, 파일 작성, 코드 실행, 자율적 행동이 가능한 자율 에이전트에 통합되고 있어요.
이러한 변화는 LLM의 위험이 모델 가중치 자체에서 비롯되는 것이 아니라 데이터, 프롬프트, 모델 출력, 도구, 메모리, 사용자 권한이 상호 작용하는 전체 생명주기 및 애플리케이션 스택에서 발생한다는 점을 보여줘요.
본 논문은 생명주기 및 애플리케이션 스택 관점에서 LLM 시스템의 취약점을 체계적으로 분석하고, 데이터 수집부터 배포 및 유지보수까지 8단계에 걸친 공격 유형, 위험 요소, 평가 방법, 방어 전략을 제시해요.
향후 LLM 보안 시스템 연구 과제를 제시하며, 합성 보안, 출처 기반 검색, 도구 호출 격리, 장기적 에이전트 평가, 개인 정보 보호 적응, 현실적인 레드 팀 운영, 배포 환경 사고 대응 등의 중요성을 강조해요.