연구진이 숨겨진 기호 수 N이 무한대로 향하는 스케일링 한계에서 랜덤 언어 모델(RLM)에 대한 이론을 개발했어요. 이 과정에서 문법 온도 틸레플슨은 고정되고 x는 틸레플슨 로그 N으로 향합니다. RLM은 규칙 사용 패턴에 대한 대규모 편차 원리를 기반으로 제어 가능한 설명을 갖습니다.
RLM은 임계값 x_c=1/8 이하에서 규칙 사용이 응축되고 언어 통계가 코퍼스 길이에 의존하는 지점에서 응축 전환을 보입니다. 엔트로피 감소 시작을 나타내는 두 번째 특징 스케일 x=1/2가 있습니다.
연구진은 규칙 수, 엔트로피 등 다양한 관측값에 대한 명시적인 스케일링 법칙을 파생시켜 문법 크기, 코퍼스 길이, 온도 간의 상호 작용에 의해 제어되는 다양한 스케일링, 포화, 임계 영역을 식별했습니다.