연구자들은 LLM과 LLM 기반 에이전트 워크플로우에 대한 연구를 진행하면서 LLM에 도덕성이나 자연어 이해와 같은 인간적인 속성이 있다고 가정하는 경향이 있어요.
연구진은 Age of Empires II 비디오 게임을 기반으로 간단한 신경망을 구축하여 LEGO나 보스턴 대도시 지역과 같은 다양한 환경에서도 유사한 속성이 나타날 수 있음을 보여줬어요.
LLM의 인간적인 속성은 경험적으로 독특하지 않으며, 실험자의 관점에 따라 해석이 달라질 수 있으므로 명확한 측정 기준이 필요해요.
연구진은 LLM의 독특함이 아닌 비독특함을 가정하는 'null' 가설을 제안하여 실험을 설계하고, 문명의 시대 2가 기능적, 튜링 완전함을 증명했어요.