Алгоритм фильтрации рекламы в интернете работает на основе списков фильтрации — это текстовый файл, где содержатся правила для блокировки элементов сайта. thecode.media
Процесс происходит так: thecode.media
- Разработчики блокировщика собирают множество страниц с разной рекламой и анализируют их. thecode.media
- Они разделяют размещаемую рекламу по разным признакам: одна прячется внутри блоков с ad в названии, другая — в блоках со стандартными баннерными размерами и так далее. thecode.media
- Затем они составляют документ — правила для блокировщика, с которыми он сверяется, чтобы понять, перед ним реклама или нет. thecode.media
- Если то, что видит блокировщик, подпадает под описание из документа, он это скрывает и не показывает пользователю. thecode.media
Некоторые категории правил списков фильтрации: thecode.media
- Блокировка по URL. thecode.media Правила, явно указывающие URL или паттерны URL, которые нужно блокировать. thecode.media
- Скрытие элементов с использованием CSS-селекторов. thecode.media Правила для скрытия рекламных баннеров или виджетов. thecode.media
- Опции запросов. thecode.media Ограничения, которые применяются только к определённым типам запросов, например к изображениям или скриптам. thecode.media
- Исключения (белые списки). thecode.media Правила, которые исключают некоторые URL или элементы из блокировки, чтобы избежать ложных срабатываний или разрешить рекламу на сайтах, которые пользователь хочет поддержать. thecode.media
Также для распознавания рекламы используют искусственный интеллект и технологию компьютерного зрения. www.cossa.ru