Pulse · AI 뉴스

언어 모델의 동물 지식 평가 벤치마크 BAGEL 공개

arXiv cs.CL · 2026-04-18

연구진은 언어 모델의 전문적인 동물 지식 평가를 위한 벤치마크 BAGEL을 새롭게 선보였습니다.

BAGEL은 bioRxiv, Global Biotic Interactions 등 다양한 과학 및 참고 자료를 활용하여 제작되었으며, 분류학, 서식지, 행동 등 다방면의 동물 지식을 다룹니다.

BAGEL은 외부 검색 없이 모델의 동물 관련 지식을 측정하여, 모델의 강점과 약점을 정확하게 파악하고 생물 다양성 관련 응용 분야에서 신뢰성을 높이는 데 기여할 것입니다.

##벤치마크##동물지식##언어모델
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기