Pulse · AI 뉴스

AI 벤치마크 구축을 통한 교육: 책임감 있는 지식 작업의 과정으로서의 QuestBench

QuestBench · 2026-05-21

연구진은 AI 교육에서 학생들이 AI를 활용하는 방법뿐 아니라, AI의 지식 생산을 평가하고 판단하는 역할에 대한 이해를 높이는 것이 중요하다고 강조했어요.

QuestBench는 학생들이 벤치마크 구축을 통해 AI를 교육하는 과정으로, 학생들은 학문적 지식을 검증 가능한 질문으로 변환하고, 서로의 설계를 검토하며, AI 시스템을 평가해요.

QuestBench는 14개 인문사회과학 분야에 걸쳐 256개의 질문으로 구성되었으며, GPT-5.5를 포함한 13개 시스템의 평가 결과, 평균 질문 통과율은 16.85%에 불과했어요.

학생들은 벤치마크 구축을 통해 전문 지식이 AI가 검색하는 콘텐츠일 뿐 아니라, AI 출력물을 판단하는 기준이 된다는 것을 깨달았으며, QuestBench 데이터셋은 Hugging Face에서 공개되었어요.

##AI교육##벤치마크##QuestBench##GPT-5.5
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기