Современные системы антиплагиата сталкиваются с растущей сложностью распознавания текстов, созданных нейросетями. 3 Даже специализированные алгоритмы не всегда точно определяют авторство. 3
Некоторые методы, которые используются для обнаружения контента, созданного нейросетями:
- Лингвистический анализ. 1 Алгоритмы оценивают лексическое разнообразие, анализируют частоту использования редких слов и фиксируют характерные штампы нейросетей. 1
- Статистические методы. 1 Они выявляют статистические аномалии в тексте — слишком «правильное» распределение слов, неестественную последовательность предложений и параграфов, отсутствие характерных для человека стилистических «шероховатостей». 1
- Водяные знаки. 1 Это невидимые для человека модификации текста, которые ИИ добавляет при генерации. 1 Это может быть особый порядок слов или скрытые статистические паттерны, распознаваемые специальными детекторами. 1
Один из сервисов, который обнаруживает тексты, сгенерированные нейросетями, — «Антиплагиат». 23 В основе его работы лежит детектор искусственного интеллекта, обученный на огромной базе данных. 3 Если система находит признаки нейросетевого происхождения, подозрительные фрагменты выделяются красным цветом, а весь документ маркируется как сомнительный. 3
Некоторые признаки текста, сгенерированного нейросетью:
- Чрезмерная конкретность. 3 Нейросети, такие как ChatGPT, строят фразы на основе вероятности появления слов. 3
- Галлюцинации и выдуманные факты. 3 Алгоритмы могут вводить неточности или даже придумывать данные при недостаточной информации. 3
- Отсутствие самоанализа. 3 Нейросети не способны признавать ошибки или корректировать текст без явного указания. 3
- Неперсонализированный стиль. 3 Тексты, созданные нейросетями, нередко лишены индивидуальности и экспертного подхода. 3