Некоторые методы ранжирования информации:
- Поточечные методы. 4 Они независимо определяют рейтинг для каждого документа. 4
- Попарные методы. 4 Их идея — сравнить релевантность двух документов и определить порядок для каждой пары. 4
- Списочные методы. 4 Они моделируют порядок для всех документов в выдаче. 4
Некоторые популярные методы из разных типов:
- OC SVM (One Class Support Vector Machine). 4 Базовый поточечный метод. 4 Алгоритм заключается в построении параллельных гиперплоскостей, которые выступают в роли порогов. 4 По взаиморасположению документа и гиперплоскостей делается предсказание о степени релевантности документа. 4
- TF-IDF (term frequency-inverse document frequency). 2 Учитывает, как часто встречаются слова на странице, и их относительную важность в документе. 2