자연어 처리에서 언어의 엔트로피는 예측 불가능성과 복잡성을 나타내는 지표입니다. 연구진은 184명의 자원봉사자를 모집하여 우크라이나어의 엔트로피를 측정하는 실험을 진행했습니다. 실험 결과, 우크라이나어의 문자당 엔트로피 상한은 약 1.201 비트이며, 이는 현재 LLM 성능과 비교 분석되었습니다.