사이버 보안 분야의 LLM 성능을 평가하기 위해 새로운 벤치마크인 CyberCertBench를 소개합니다. CyberCertBench는 산업 표준 인증에서 파생된 객관식 문제 풀이(MCQA) 벤치마크로, LLM의 전문 지식을 평가합니다. 연구 결과, 최첨단 모델은 일반적인 네트워크 및 IT 보안 지식에서 전문가 수준을 달성하지만, 특정 벤더의 세부 사항이나 IEC 62443과 같은 공식 표준에 대한 지식은 정확도가 떨어집니다.