Система «Антиплагиат» обнаруживает сгенерированные тексты с помощью алгоритмов машинного обучения, которые обучены распознавать характерные паттерны, характерные для текстов, созданных нейросетями. 14
Некоторые особенности сгенерированных текстов, на которые ориентируется система:
- Синтаксические паттерны. 1 Генераторы текста часто используют предсказуемые синтаксические структуры. 1
- Ограниченный лексический диапазон. 1 Генераторы текста склонны повторять определённые фразы и слова. 1
- Семантические несовершенства. 1 Несмотря на высокий уровень развития, генераторы текста иногда создают контекстно или логически некорректные предложения. 1
- Статистическая схожесть. 1 Сгенерированные тексты могут иметь схожие статистические характеристики (например, частоту определённых слов и фраз) с другими текстами, созданными тем же генератором. 1
Некоторые методы анализа текста, которые использует «Антиплагиат»:
- Лексико-грамматический анализ. 5 Проверка частотности слов, их сочетаемости и грамматических конструкций. 5
- Семантический анализ. 5 Оценка смысловой нагрузки и логических связей между предложениями. 5
- Стилистический анализ. 5 Изучение особенностей подачи материала и используемых языковых средств. 5
Если в проверяемом документе обнаружены сгенерированные фрагменты, система «Антиплагиат» выделяет их, а сам документ маркируется как «Подозрительный». 4