Pulse · AI 뉴스

간단한 질문 답변 능력 측정 벤치마크 SimpleQA 공개

OpenAI · 2024-10-30

SimpleQA는 언어 모델의 사실 기반 질문 답변 능력을 측정하는 벤치마크입니다.

짧고 사실 확인을 위한 질문에 답하는 모델의 능력을 평가하는 방식으로 설계되었어요.

##벤치마크##사실성##언어모델
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기