연구진이 과학적 추론을 위한 AI 에이전트 협업의 가치를 평가하는 교차 분야 벤치마크를 발표했어요.
분자 구조를 음악으로 변환, 과학 패러다임 변화 감지, 진드기 매개 질병 발생 식별, 외계 행성 후보 검증 등 4가지 과학적 과제를 분석했어요.
다양한 분야가 부분적인 정보만 포착할 때, 협업을 통해 기후-진드기 발생 AUROC 0.944, 외계 행성 검증 AUROC 0.955까지 성능을 향상시킬 수 있어요.
패러다임 변화 감지와 같은 특정 분야에서는 해석 및 추적 가능성 향상에만 기여하며, 분자 음향화에서는 표현력 개선에 집중돼요.