Изменения

Перейти к: навигация, поиск

Формула Байеса

401 байт убрано, 00:46, 13 января 2012
м
Метод фильтрации спама
При проверке письма вычисляется вероятность того, что оно {{---}} спам. Для каждого слова эксперементально подсчитывается его ''вес'' {{---}} процент содержания этого слова в письмах, отмеченных пользователем, как спам. Тогда ''весом'' письма является среднее ''весов'' всех его слов. Таким образом, программа(анти-спам бот) считает письмо спамом, если его ''вес'' больше какой-то заданной пользователем планки (обычно 60-80%). После вынесения решения о полученном письме происходит пересчёт в базе данных весов слов, составляющих текст письма. Почтовый фильтр, основанный на такой системе, называется ''байесовским.''
Недостаток метода заключается в том, что он основан на предположении, что одни слова чаще встречаются в спаме, а другие {{---}} в обычных письмах. Таким образом, если данное предположение неверно, то метод неэффективен. '''ЗамечаниеПример.''' Если 80% писем, содержащих фразу <tex>"</tex>Привет :) Как дела?)<tex>"</tex>, являлись спамом, то и следующее письмо с этим словосочетанием c большой вероятностью {{---}} спам.
== См. также ==
*[http://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D0%BE%D1%80%D0%B5%D0%BC%D0%B0_%D0%91%D0%B0%D0%B9%D0%B5%D1%81%D0%B0 http://ru.wikipedia.org/wiki/Теорема_Байеса]
315
правок

Навигация