Детектор сгенерированных текстов в системе «Антиплагиат» работает на основе уникального алгоритма. 2 Он анализирует текст на наличие фрагментов, предположительно созданных при использовании моделей глубокого обучения GPT2, GPT-3, GPT-4, ChatGPT. 2
Принцип работы заключается в том, что детектор смотрит на «предсказуемость» каждого следующего слова в тексте. 3 Например, если дополнять приложение «Каждый день он ходит на…», то очевидные ответы — «работу» или «учёбу». 3 Нейросети, особенно устаревшие, составляют именно такие предсказуемые цепочки, чтобы не потерять связность. 3 Такую последовательность и вычисляют сервисы. 3
Детектор машинно-сгенерированных текстов обучен и протестирован на большом наборе данных, что минимизирует риск ложного срабатывания. 2 Если в проверяемом документе обнаружены сгенерированные фрагменты, система «Антиплагиат» выделяет их, а сам документ маркируется как «Подозрительный». 2