Сервис «Текстометр» работает при проверке сложности текста следующим образом: 1
- Пользователь загружает в систему новый текст. 1 Для корректного анализа он проходит несколько этапов предобработки: очистку от всех символов и букв, отличных от русского алфавита, и лемматизацию (приведение каждого слова к начальной, словарной форме). 2
- Алгоритм автоматически определяет значение каждого из около 150 лингвистических показателей. 1 Например, относительное количество имён в родительном падеже, причастий и деепричастий, прилагательных в превосходной степени, глаголов в третьем лице и других параметров. 1
- Новый текст сравнивается по этим показателям с базой текстов. 1 На следующем шаге алгоритм анализирует, какой уровень сложности эксперты приписывали похожим текстам из базы, и приписывает такой же уровень новому тексту. 1
Кроме того, сервис «Текстометр» предлагает и другую информацию о тексте: списки ключевых слов и слов — наилучших кандидатов в словарик к данному тексту, статистику по покрытию текста лексическими минимумами ТРКИ, частотный словарь текста, прогноз времени, необходимого для разных видов чтения текста, а также грамматические темы, которые можно отработать на данном тексте. 3