ReCoQA는 데이터베이스 쿼리와 외부 API를 결합하는 하이브리드 워크플로우를 반영하는 벤치마크 부족 문제를 해결하기 위해 개발되었어요. 이 벤치마크는 29,270개의 부동산 사례를 포함하며, 중간 단계에 대한 기계 검증 가능한 감독을 제공하여 복잡한 추론을 지원해요. HIRE-Agent라는 계층적 프레임워크를 통해 다양한 증거를 통합하고, 복잡한 실세계 추론 작업에서 협업의 필요성을 입증했어요.