Вопросы к Поиску с Алисой
Разница между последовательным и параллельным поиском подстрок в больших объёмах данных заключается в способе обработки информации. loginom.ru habr.com
Последовательный поиск предполагает полное чтение файла (или файлов) основного слоя таблицы. habr.com На каждой прочитанной странице проверяется видимость каждой версии строки, а версии, не удовлетворяющие условиям запроса, отбрасываются. habr.com Последовательное сканирование хорошо работает при низкой селективности. habr.com
Параллельный поиск предполагает чтение страниц таблицы последовательно, но несколькими параллельно работающими процессами. habr.com Процессы синхронизируются между собой с помощью специально отведённого участка общей памяти, чтобы не прочитать одну и ту же страницу дважды. habr.com
Таким образом, параллельный поиск позволяет ускорить обработку больших объёмов данных, так как позволяет обрабатывать меньшие объёмы информации за один проход и снижает требования к памяти. loginom.ru Однако запуск процессов и пересылка данных требуют определённых ресурсов, поэтому не каждый запрос имеет смысл выполнять параллельно. habr.com