Pulse · AI 뉴스

프롬프트 언어가 LLM의 진단 추론 정확도에 미치는 영향

OpenAI · 2026-05-19

연구진은 o3, DeepSeek-R1, GPT-4-Turbo, Llama-3.1-405B-Instruct, BioMistral-7B 등 5개 LLM의 영어와 프랑스어 진단 추론 성능을 비교했어요. 180건의 임상 시나리오를 평가한 결과, 5개 모델 중 4개 모델이 영어에서 더 나은 성능을 보였어요. o3 모델은 언어에 따른 성능 차이가 없었어요.

##LLM##진단##언어##의료AI
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기