연구진은 제한된 관찰 데이터만으로 POMDP 세계 모델을 학습하는 Pinductor라는 새로운 방법을 제시했어요. Pinductor는 LLM을 활용하여 후보 POMDP 모델을 제안하고, 데이터를 반복적으로 개선하여 성능을 최적화해요. 실험 결과, Pinductor는 기존 방식보다 샘플 효율성이 뛰어나며, LLM의 성능에 따라 결과가 향상되는 것을 확인했어요.