Некоторые методы ранжирования в информационных системах:
- Булева модель. en.wikipedia.org Простая базовая модель запроса, где документы не извлекаются, если они полностью не совпадают друг с другом. en.wikipedia.org
- Модель векторного пространства. en.wikipedia.org Решает проблему частичного сопоставления документов, вводя векторы элементов индекса, каждому из которых присвоен вес. en.wikipedia.org
- Частота терминов — обратная частоте документов (tf-idf). en.wikipedia.org Один из самых популярных методов, в котором весами являются термины (например, слова, ключевые слова, фразы и т. д.), а размерами — количество слов внутри корпуса. en.wikipedia.org
- Вероятностная модель. en.wikipedia.org Применяет теорию вероятности к поиску информации, где релевантность выражается в терминах вероятности. en.wikipedia.org
- Алгоритм PageRank. en.wikipedia.org Выводит распределение вероятностей, используемое для представления вероятности того, что человек, случайно щёлкнув по ссылкам, попадёт на какую-либо конкретную страницу. en.wikipedia.org
- Индекс цитирования. habr.com Показатель, указывающий на значимость страницы и вычисляющийся на основе ссылающихся страниц на неё. habr.com
Также существуют методы ранжирования, учитывающие, например, посещаемость веб-страниц, общую эффективность сайтов, информативность новостных источников и другие критерии. www.dissercat.com