Возможно, имелись в виду алгоритмы поиска уникальных имён в списке имён. Один из возможных подходов — отсортировать список имён, тогда префиксы будут располагаться перед более длинным именем, и останется только сравнить имя со следующим именем. 2
Ещё один метод — найти большой список фамилий и отчеств, а затем сравнить его со списком имён. 2
Также можно обучить пространственную модель, используя список имён, и использовать её для идентификации имён и фамилий. 2
Возможно, имелись в виду алгоритмы поиска похожих документов в многоязыковых корпусах. Один из таких алгоритмов — метод «шинглов». 34 Он основан на представлении документа в виде всевозможных последовательностей фиксированной длины, состоящих из соседних слов. 3
Ещё есть информация о семантических сетях, которые могут использоваться для поиска информации, в том числе уникальных имён. 5 Например, большая многоязычная семантическая сеть BabelNet построена на основе англоязычного тезауруса WordNet и материалов многоязычной Википедии. 5