LLM 기반 에이전트가 웹 탐색, 코드 편집 등 다양한 환경에서 활용되지만, 환경 구조 변화에 대한 명시적인 모델 없이 반응하는 한계가 있어요. 텍스트 월드 모델(TWM)은 주어진 상태와 행동 후보에 따라 다음 상태를 예측하는 환경 전이 모델로, 계획, 효율적인 학습, 평가를 지원해요. 본 연구는 TWM의 기반, 구축, 활용, 평가를 체계적으로 검토하고, 연구 설계 공간을 명확히 하며, 미래 연구 과제를 제시합니다.