Возможность найти отличия между лексическими составами двух корпусов текстов. t.me Например, выяснить, чем Толстой отличается от Достоевского, а Тургенев — от Гончарова. t.me
Учёт распределения слов в тексте. t.me Даже если какое-то слово встречается часто, но лишь в одном фрагменте длинного текста, оно не будет отмечено как характерное для всего корпуса. t.me
Вычисление сходства текстов. sysblok.ru Stylo выдаёт результат в виде таблиц с частотностями и показателями «стилистической близости», а также в виде разных визуализаций этих данных. sysblok.ru
Работа с вариациями метода Delta. locusclassicus.github.io Например, с «вюрцбургской Delta», которая использует косинусное расстояние, что во многих случаях позволяет повысить точность классификации. locusclassicus.github.io
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.