Объём памяти, необходимый для хранения всех слов в языке, зависит от разных факторов, например от количества фонем, словоформ, лексических значений, частоты слов и синтаксиса. 12
На примере английского языка учёные проводили следующие подсчёты: 15
- Фонемы. 15 В английском языке 50 фонем, каждая занимает по 15 бит. 15 Итого для фонем нужно 750 бит места в памяти. 5
- Словоформы. 1 Средний объём лексикона взрослого англоговорящего человека — 40 тысяч слов. 1 По разным моделям, для одного слова требуется 5, 10 или 16 бит, что соответствует объёму от 200 до 640 тысяч бит для хранения словоформ. 1
- Лексические значения. 1 По подсчётам учёных, объём информации о лексической семантике занимает от 500 тысяч до 40 миллионов бит, учитывая лексикон в 40 тысяч слов. 1
- Частота слов. 1 Для определения частоты слова необходимо от 1 до 3 бит информации, то есть для всех слов — от 40 до 120 тысяч бит. 1
- Синтаксис. 1 Для синтаксиса учёные подсчитали количество предложений с уникальной синтаксической структурой вне контекста и необходимый объём памяти, который позволяет отличить одну структуру от другой. 1
В итоге учёные пришли к выводу, что вся информация, которую англоговорящий человек получает о своём языке с раннего детства до 18 лет, можно поместить в объёме памяти от 794 тысяч до 40 миллионов бит, при этом средний показатель равняется 12,48 миллиона бит или около 1,5 мегабайта. 1
Учёные уточняли, что их расчёты очень грубые и примерные, и скорее годятся для какого-либо теоретического обоснования, а не для применения в информационных технологиях. 1