연구진은 생의학 분야에서 LLM의 성능을 향상시키기 위해 34개의 도구를 활용하는 BioTool 데이터셋을 공개했습니다.
BioTool은 NCBI, Ensembl, UniProt 데이터베이스에서 수집된 도구와 7,040개의 질의-API 호출 쌍으로 구성되어 있으며, 변이, 유전체, 보호체, 진화, 일반 생물학 분야를 포괄합니다.
BioTool로 파인튜닝된 40억 파라미터 LLM은 GPT-5.1을 능가하는 생의학 도구 호출 성능을 보여주었으며, 인간 전문가 평가에서 답변 품질이 향상되었습니다.