연구진은 악성 코드 요청에 대한 코딩 모델의 준수 여부를 측정하기 위한 합의 레이블 프롬프트 은행을 공개했어요. 이 프롬프트 은행은 실행 가능한 악성 코드 요청과 유해한 보안 지식 요청을 구분하여 기존의 단편적인 벤치마크의 한계를 극복했어요. 총 4,748개의 코드 프롬프트와 1,923개의 지식 프롬프트를 포함하며, 5명의 합의 판정위원단이 33,375건의 평가를 통해 높은 신뢰도를 확보했어요.