Pulse · AI 뉴스

Adversarial Arena: 인터랙티브 경쟁을 통한 데이터 생성 크라우드소싱

arXiv cs.AI · 2026-04-20

연구진은 양질의 대화형 데이터셋 구축을 위해 Adversarial Arena라는 새로운 방법을 제시했어요. 공격팀은 프롬프트를 생성하고, 방어팀은 이에 응답하는 인터랙티브 경쟁 방식을 통해 다양한 데이터를 확보하는 방식이에요.

10개 대학 팀이 참여한 Adversarial Arena 경진대회에서 19,683개의 다중 턴 대화 데이터를 생성했으며, 이는 사이버 보안 분야의 LLM 안전 정렬에 집중되었어요.

Adversarial Arena로 생성된 데이터로 파인튜닝한 오픈소스 모델은 CyberSecEval-Instruct에서 18.47%, CyberSecEval-MITRE에서 29.42% 성능 향상을 보였어요.

##데이터셋##경진대회##LLM
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기