Pulse · AI 뉴스

ScientistOne: 증거 기반 연쇄를 통한 인간 수준의 자율 연구 시스템

ScientistOne · 2026-05-25

연구자들은 자율 연구 에이전트의 출력을 평가할 때 표면적인 검토로는 발견하기 어려운 허위 인용, 재현 불가능한 점수, 구현과 다른 방법 설명 등의 신뢰성 문제를 발견했습니다.

연구팀은 모든 주장이 증거 출처로 추적 가능하도록 하는 '증거 기반 연쇄(Chain-of-Evidence, CoE)' 프레임워크를 제안하고, 이를 기반으로 문헌 검토, 솔루션 발견, 논문 작성 전 과정에서 증거 연쇄를 유지하는 자율 연구 시스템 'ScientistOne'을 개발했습니다.

ScientistOne은 75편의 논문에서 0%의 허위 인용, 100%의 점수 검증 성공률, 93%의 방법-코드 일치율을 달성하며, 5가지 연구 과제에서 인간 전문가 수준의 성능을 능가했습니다.

##자율연구##AI연구##ScientistOne##CoE
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기