S1-DeepResearch는 복잡한 연구 과제를 해결하기 위해 장기 계획, 증거 수집, 추론, 보고서 작성 등을 수행하는 연구 에이전트입니다.
기존 연구 에이전트 학습 데이터는 주로 폐쇄형 질문 답변에 집중되어 있어, 지식 통합, 계획, 파일 이해 등 핵심 연구 역량은 부족합니다.
S1-DeepResearch는 폐쇄형 질문 답변과 개방형 탐색을 결합한 새로운 프레임워크를 통해 고품질 에이전트 학습 경로를 생성하고, 5가지 역량에서 최고 성능을 달성했습니다.