Pulse · AI 뉴스

하나의 정책, 무한한 NPC: Persona-Traceable 공유 강화 학습 정책을 활용한 확장 가능한 게임 에이전트

pcsp · 2026-05-22

연구진은 300개 페르소나 라이프 시뮬레이션 벤치마크에서 pcsp가 최대 17배의 뛰어난 제로샷 페르소나 식별 성능을 보였어요.

pcsp는 의미-행동 정렬에서 스피어만 로(Spearman rho) 약 0.73의 상관관계를 보이며, 기존 LLM 기반 정책보다 22배 빠른 추론 속도를 제공해요.

연구 결과, InfoNCE 트랙토리 일관성 목표가 핵심적인 역할을 하며, 상업용 게임 엔진에서도 프레임당 추론 프로필을 유지하는 것을 확인했어요.

##강화학습##NPC##게임AI##페르소나

매일 핵심 AI 소식을 한국어로, 빠르게