연구진은 LLM 기반 사이버 공격 에이전트들이 공격 유형 선택에 편향성을 보이는 현상을 발견했어요.
새로운 벤치마크 'CyBiasBench'를 통해 5개 에이전트의 공격 패턴을 630세션 동안 분석했으며, 각 에이전트마다 선호하는 공격 유형이 다르고, 외부 지시에도 잘 바뀌지 않는다는 것을 확인했어요.
연구 결과는 온라인 대시보드(https://trustworthyai.co.kr/CyBiasBench/)와 GitHub 저장소(https://github.com/Harry24k/CyBiasBench)에서 확인할 수 있어요.