Вопросы к Поиску с Алисой
Байесовский классификатор используется для автоматической сортировки электронной почты, в частности для фильтрации спама. ru.wikipedia.org ru.ruwiki.ru
Процесс происходит так: система заранее обучена на наборе писем, которые точно известны как спам и не спам. habr.com Для каждого слова в письмах вычисляется и сохраняется его «вес» — оценка вероятности того, что письмо с этим словом — спам. ru.wikipedia.org
При проверке вновь пришедшего письма вычисляется вероятность «спамовости». ru.wikipedia.org «Вес» письма — усреднённый «вес» всех его слов. ru.wikipedia.org Письмо относят к спаму или не спаму в зависимости от того, превышает ли его «вес» некую планку, заданную пользователем (обычно берут 60–80%). ru.wikipedia.org
После принятия решения по письму в базе данных обновляются «веса» для вошедших в него слов. ru.wikipedia.org
На основе байесовского классификатора построены многие современные спам-фильтры, в том числе такие как Mozilla Thunderbird, BayesIt!, SpamAssassin. masters.donntu.ru