Для определения сложности слов для взрослой аудитории можно использовать различные методы и инструменты: 14
- Формула удобочитаемости Флеша. 1 Опирается на среднюю длину предложения (в словах) и среднюю длину слова (в слогах). 1 Чем выше балл, тем текст удобнее читать, то есть он проще. 1
- Алгоритмы машинного обучения. 1 Позволяют собрать большую коллекцию текстов и выявить разные, не всегда очевидные, признаки этих текстов. 1 На основании этих признаков можно обучить модель определять уровень сложности незнакомого текста. 1
- Простые метрики удобочитаемости. 4 Строятся на характеристиках, которые легко получить из текста без привлечения дополнительных лингвистических ресурсов или разметки. 4 К таким характеристикам относятся, например, средняя длина слова в словах или слогах, количество слов длиной более 5 символов, средняя длина предложения в словах или слогах, количество знаков препинания и т. д.. 4
Оценка сложности также связана с субъективными факторами, такими как языковой опыт, возраст читателя, мотивированность читателя, индивидуальные когнитивные, психологические, неврологические особенности читателя. 4