Длина слова в словарях определяется по длине леммы — словарной формы, представляющей слово, измерённой в звуках. 1
В корпусах текстов длина слова определяется как средняя длина словоформ, представляющих это слово в тексте. 1 Для этого каждую словоформу лемматизируют, то есть ставят в соответствие лемме. 1 Затем вычисляют среднюю длину всех словоформ слова в определённом тексте. 1
Таким образом, в словарях длина слова оценивается косвенно по длине леммы, а в корпусах — по средней длине словоформ, представляющих слово в тексте. 1
Также в корпусах с помощью специальных программ можно определять среднюю длину слова и предложения, характерные сочетания слов и другие статистические характеристики текста. 2