Гибридные поисковые системы отличаются от классических тем, что их индекс собирается не только за счёт сканирования краулером, но и благодаря пользовательским источникам данных: реестрам документов, каталогам, справочникам. 1
В классических поисковых машинах пауки сканируют все страницы в интернете и формируют собственный индекс (базы данных) с информацией о веб-документах. 1 Поиск по БД в таких системах условно состоит из трёх этапов: нахождение наиболее релевантного поисковой фразе документа, ранжирование остальных документов исходя из их суммарной релевантности и кластеризация документов. 1
Таким образом, гибридные поисковые системы сочетают в себе функции систем, использующих поисковых роботов, и систем, управляемых человеком. 3