연구자들이 LLM의 자기 성찰 가능성을 주장하지만, 인간의 메타인지 연구를 바탕으로 볼 때 이는 성급한 결론일 수 있습니다. LLM이 표면적인 단서에 기반한 패턴 매칭으로 오인할 수 있는 자기 성찰과 진정한 자기 성찰을 구분해야 합니다. 행동 기반 증거만으로는 LLM의 내부 표현에 대한 특권적 접근성을 입증하기 어렵고, 새로운 통제 환경에서는 성능이 무작위 수준으로 떨어집니다.