연구진은 제한된 로컬 바이너리 정보만으로 리눅스 배포판 업데이트의 보안 의미를 재구성할 수 있는 언어 모델 에이전트의 가능성을 탐구했습니다.
Patch2Vuln 파이프라인은 ELF 파일 쌍을 추출하고, Ghidra와 Ghidriff를 사용하여 차이점을 분석하며, 후보 도서를 구축하고, 에이전트에게 감사 및 검증 계획을 수립하도록 요청합니다.
25개의 Ubuntu 패키지 쌍을 평가한 결과, 에이전트는 20개의 보안 업데이트 쌍 중 10개에서 보안 관련 패치 함수를 찾고, 11개에서 최종 근본 원인 클래스를 정확히 판단했습니다.