Anthropic이 AMD MI300X GPU에서 훈련한 CyberSecQwen-4B 모델을 공개했습니다. 이 모델은 사이버 보안 업무에 특화되어, 기존 모델보다 비용 효율적이고 민감한 데이터 유출 위험을 줄입니다.
CyberSecQwen-4B는 4B 파라미터로 구성되어 있으며, Cisco의 Foundation-Sec-Instruct-8B 모델과 비교했을 때 CTI-MCQ 점수에서 8.7점 향상된 성능을 보였습니다.
이 모델은 CVE-CWE 매핑, CTI Q&A 등 사이버 위협 인텔리전스 관련 작업에 활용될 수 있으며, AMD Developer Cloud를 통해 훈련되었고 Apache 2.0 라이선스로 배포됩니다.