Pulse · AI 뉴스

LLM 에이전트 계획을 위한 자체 진화형 월드 모델

WorldEvolver · 2026-06-30

연구진이 월드 모델의 예측 불확실성 문제를 해결하기 위해 WorldEvolver 프레임워크를 개발했어요. WorldEvolver는 에피소드 메모리, 시맨틱 메모리, 선택적 예측의 세 가지 모듈로 구성돼요. ALFWorld와 ScienceWorld 환경에서 실험 결과, 기존 월드 모델보다 예측 정확도와 계획 성공률 모두에서 우수한 성능을 보여줬어요.

WorldEvolver는 월드 모델의 예측 정확도를 높이는 동시에 에이전트의 계획 성능을 향상시키는 것을 목표로 해요. 월드 모델 파라미터는 고정하고, 테스트 시간에 메모리를 수정하는 방식이에요.

에피소드 메모리는 실제 행동 전환을 활용하고, 시맨틱 메모리는 예측-관찰 불일치에서 지속적인 휴리스틱 규칙을 추출하며, 선택적 예측은 낮은 신뢰도 예측을 필터링합니다.

##LLM##에이전트##월드모델##강화학습##계획
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기