Система «Антиплагиат» обнаруживает заимствования в научных текстах с помощью нескольких алгоритмов: 13
Для дословного заимствования используется построение инвертированного индекса. 1 Документ из коллекции представляется в виде набора перекрывающих друг друга последовательностей слов определённой длины (n-грамм). 1 Затем документы-кандидаты упорядочиваются в соответствии с выбранной функцией схожести совпавших последовательностей слов. 1
Для поиска переводных заимствований из англоязычных документов используется следующий алгоритм: 13
Для обнаружения фрагментов, сгенерированных искусственным интеллектом, в системе «Антиплагиат» используется детектор, который работает на основе алгоритмов искусственного интеллекта. 2 Он обучен и протестирован на большом массиве данных, что сводит к минимуму риск ложного срабатывания. 2 В основе этой функции лежит ряд признаков, свойственных искусственно сгенерированным текстам. 2