Формула Байеса применяется в системах фильтрации спама для анализа частоты использования определённых слов или фраз как в спамовых, так и в неспамовых электронных письмах. www.geeksforgeeks.org
Процесс происходит так: www.softring.ru
- Фильтр собирает словари «спамных» и «неспамных» слов и словосочетаний. www.softring.ru Для каждого употреблённого в письмах слова рассчитывается и сохраняется его «вес» — вероятность того, что сообщение с этим словом — спам. cyberleninka.ru elib.sfu-kras.ru
- При получении почты фильтр «взвешивает» каждое письмо, выясняет, сколько в нём содержится «плохих» слов, а сколько — «хороших». www.softring.ru
- На основании этих расчётов письму выставляется оценка. www.softring.ru Например, послание с вероятностью 95% — спам, а письмо с вероятностью 80% — не спам. www.softring.ru
- Письма, получившие высокую спам-оценку, укладываются в корзину или в специально отведённую папку, а письма с низкой спам-оценкой помещаются в папку входящих. www.softring.ru
Изначально байесовские фильтры не умеют отсеивать спам, поэтому пользователю приходится самостоятельно указывать: это письмо — спам, а это — не спам. www.softring.ru Таким образом фильтр проходит обучение и постепенно, с ростом словарей, начинает эффективно отсеивать невостребованную почту. www.softring.ru