StreamMA는 멀티 에이전트 추론 시스템으로, 각 추론 단계를 생성 즉시 다음 에이전트로 스트리밍하여 지연 시간을 줄입니다. 스트리밍 파이프라인은 초기 단계의 신뢰성을 활용하여 오류가 발생하기 쉬운 후기 단계를 방지하여 효과를 향상시킵니다. Claude Opus 4.6 및 GPT-5.4를 활용한 8개의 벤치마크에서 StreamMA는 기존 방식보다 평균 7.3% 더 높은 성능을 보였습니다.
멀티 에이전트 추론 시스템의 단계별 확장 법칙을 발견하여, 에이전트 수를 늘리는 것과 독립적으로 효과와 효율을 모두 향상시킵니다. StreamMA는 수학, 과학, 코딩 벤치마크에서 기존 방식 대비 최대 22.4%의 성능 향상을 기록했습니다.
연구 결과는 스트리밍 방식이 파이프라인 속도를 높이고, 초기 단계의 신뢰성을 활용하여 전체적인 추론 품질을 향상시키는 데 기여한다는 것을 보여줍니다.