Pulse · AI 뉴스

AI 의료 모델 평가 벤치마크 HealthBench 공개

OpenAI · 2025-05-12

HealthBench는 의료 분야 AI 모델의 성능과 안전성을 평가하는 새로운 벤치마크예요.

250명 이상의 의사들의 의견을 반영하여 실제 의료 시나리오에서 모델을 평가하도록 설계됐어요.

HealthBench는 모델 성능과 안전성에 대한 공유된 기준을 제공하는 것을 목표로 하고 있어요.

##의료AI##벤치마크##HealthBench
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기