연구진은 AI 에이전트가 실험 데이터를 학습하여 새로운 개입을 생성할 수 있는지 확인하기 위해 두 단계의 현장 실험을 진행했어요.
의료 처방 메시징 실험 결과, AI 에이전트 방법은 인간 전문가와 챗봇 방법보다 우수한 성과를 냈으며, AI가 생성한 메시지는 클릭률이 69.8%로 기준선보다 6.5%p 높았어요.
AI 에이전트의 성능은 일반적인 추론 능력보다는 특정 분야의 실험 데이터에 크게 의존하는 것으로 나타났어요.
이번 연구는 행동 실험을 일회성 평가에서 벗어나 누적 설계 학습 시스템으로 전환할 수 있음을 보여줘요.