Сервис «Текстометр» работает при проверке сложности текста следующим образом: gramota.ru
- Пользователь загружает в систему новый текст. gramota.ru Для корректного анализа он проходит несколько этапов предобработки: очистку от всех символов и букв, отличных от русского алфавита, и лемматизацию (приведение каждого слова к начальной, словарной форме). www.researchgate.net
- Алгоритм автоматически определяет значение каждого из около 150 лингвистических показателей. gramota.ru Например, относительное количество имён в родительном падеже, причастий и деепричастий, прилагательных в превосходной степени, глаголов в третьем лице и других параметров. gramota.ru
- Новый текст сравнивается по этим показателям с базой текстов. gramota.ru На следующем шаге алгоритм анализирует, какой уровень сложности эксперты приписывали похожим текстам из базы, и приписывает такой же уровень новому тексту. gramota.ru
Кроме того, сервис «Текстометр» предлагает и другую информацию о тексте: списки ключевых слов и слов — наилучших кандидатов в словарик к данному тексту, статистику по покрытию текста лексическими минимумами ТРКИ, частотный словарь текста, прогноз времени, необходимого для разных видов чтения текста, а также грамматические темы, которые можно отработать на данном тексте. www.academia.edu