연구진이 LLM 에이전트의 기술과 SOP를 후류 분포로 관리하는 Bayesian-Agent 프레임워크를 공개했어요. 이 프레임워크는 기술 성공/실패를 단순 카운트로 취급하는 대신, 후류 분포를 기반으로 기술을 평가하고 개선합니다.
Bayesian-Agent는 SOP-Bench를 80%에서 95%로, Lifelong AgentBench를 90%에서 100%로, RealFin-Bench를 45%에서 65%로 성능 향상시켰어요. Deepseek-v4-flash 모델을 활용했으며, 다양한 백엔드 환경에서 테스트를 거쳤습니다.
연구 결과는 에이전트 기술 진화가 단순 프롬프트 축적이 아닌, 후류-가이드 하네스 최적화라는 관점에서 바라봐야 함을 시사하며, 소스 코드는 GitHub에서 확인할 수 있어요.