연구진은 코드와 주석의 상호 보완적인 정보를 활용하여 소프트웨어 취약점 탐지 성능을 향상시키는 MultiVul 프레임워크를 제안했어요.
MultiVul은 코드와 주석의 표현을 정렬하는 이중 유사성 학습과 일관성 규제를 사용하며, 다양한 코드-텍스트 쌍을 활용하여 견고성을 높여요.
DeepSeek-Coder-6.7B, Qwen2.5-Coder-7B, StarCoder2-7B, CodeLlama-7B 등 4개의 LLM을 활용한 실험에서 기존 방법 대비 F1 점수 27.07% 향상을 달성했어요.