Механизм метапоиска в современных поисковых системах работает за счёт смешивания и переранжирования результатов поиска других поисковых систем. ru.wikipedia.org ru.ruwiki.ru
Процесс происходит так: ru.wikipedia.org
- Метапоисковая система собирает ранжированные результаты поиска по конкретному запросу из нескольких поисковых систем. ru.wikipedia.org ru.ruwiki.ru
- С помощью связующего алгоритма отсеивает дублирующиеся результаты. ru.wikipedia.org
- Создаёт новый ранжированный список, который предоставляет пользователю через централизованный интерфейс. ru.wikipedia.org ru.ruwiki.ru
Некоторые особенности работы метапоиска на примере поисковой системы Яндекс: yandex.ru
- Все пользовательские запросы сначала попадают в метапоиск. yandex.ru Система обрабатывает каждый запрос в реальном времени: выясняет, из какого региона он был задан, к какому классу относится и т. п., проводит лингвистическую обработку. yandex.ru
- Метапоиск проверяет, формировались ли в последнее время результаты поиска для этого запроса. yandex.ru Результаты поиска по часто задаваемым запросам некоторое время хранятся в памяти метапоиска, а не формируются каждый раз заново. yandex.ru
- Если ответа в памяти нет, то метапоиск передаёт запрос на сервера другой компьютерной системы — «базового поиска». yandex.ru
- На базовом поиске хранится поисковая база, которая разбита на части и хранится на разных серверах. yandex.ru Метапоиск выбирает наименее загруженные сервера таким образом, чтобы вместе они содержали целую поисковую базу. yandex.ru
- Каждый из серверов отдаёт список документов, в которых есть слова из запроса, обратно в метапоиск. yandex.ru
- Там они объединяются, ранжируются с помощью технологии Матрикснет (метод машинного обучения) и попадают на страницу результатов поиска. yandex.ru