Объём памяти, необходимый для хранения всех слов в языке, зависит от разных факторов, например от количества фонем, словоформ, лексических значений, частоты слов и синтаксиса. nplus1.ru dzen.ru
На примере английского языка учёные проводили следующие подсчёты: nplus1.ru fishki.net
- Фонемы. nplus1.ru fishki.net В английском языке 50 фонем, каждая занимает по 15 бит. nplus1.ru fishki.net Итого для фонем нужно 750 бит места в памяти. fishki.net
- Словоформы. nplus1.ru Средний объём лексикона взрослого англоговорящего человека — 40 тысяч слов. nplus1.ru По разным моделям, для одного слова требуется 5, 10 или 16 бит, что соответствует объёму от 200 до 640 тысяч бит для хранения словоформ. nplus1.ru
- Лексические значения. nplus1.ru По подсчётам учёных, объём информации о лексической семантике занимает от 500 тысяч до 40 миллионов бит, учитывая лексикон в 40 тысяч слов. nplus1.ru
- Частота слов. nplus1.ru Для определения частоты слова необходимо от 1 до 3 бит информации, то есть для всех слов — от 40 до 120 тысяч бит. nplus1.ru
- Синтаксис. nplus1.ru Для синтаксиса учёные подсчитали количество предложений с уникальной синтаксической структурой вне контекста и необходимый объём памяти, который позволяет отличить одну структуру от другой. nplus1.ru
В итоге учёные пришли к выводу, что вся информация, которую англоговорящий человек получает о своём языке с раннего детства до 18 лет, можно поместить в объёме памяти от 794 тысяч до 40 миллионов бит, при этом средний показатель равняется 12,48 миллиона бит или около 1,5 мегабайта. nplus1.ru
Учёные уточняли, что их расчёты очень грубые и примерные, и скорее годятся для какого-либо теоретического обоснования, а не для применения в информационных технологиях. nplus1.ru