Формула Байеса

По формуле Байеса можно более точно пересчитать вероятность, беря в расчет как ранее известную информацию, так и данные новых наблюдений. Формула Байеса позволяет «переставить причину и следствие»: по известному факту события вычислить вероятность того, что оно было вызвано данной причиной. События, отражающие действие «причин», в данном случае называют гипотезами, так как они — предполагаемые события, повлекшие данное.

Теорема

Определение:

Формула Байеса (или теорема Байеса) (англ. Bayes' theorem) — соотношение различных предполагаемых вероятностей различных событий, которое дает вероятность, что какое-то событие является результатом ряда независимых друг от друга событий , который, возможно, привел к .

Теорема (формула Байеса):

,

где

— вероятность события ,

— вероятность события при наступлении события ,

— вероятность наступления события при истинности события ,

— вероятность наступления события .

Доказательство:

Из замечания определения условной вероятности следует, что вероятность произведения двух событий равна:

По формуле полной вероятности:

Если вероятности под знаком суммы известны или допускают экспериментальную оценку, то

Примеры

Определение вероятности заболевания

Пусть событие [math]A[/math] наступило в результате осуществления одной из гипотез [math]B_1,B_2 \ldots B_n[/math]. Как определить вероятность того, что имела место та или иная гипотеза? Вероятность заразиться гриппом [math]0.01[/math]. После проведения анализа вероятность, что это грипп [math]0.9[/math], другая болезнь [math]0.001[/math]. Событие [math]A[/math] истинно, если анализ на грипп положительный, событие [math]B_1[/math] отвечает за грипп, [math]B_2[/math] отвечает за другую болезнь. Также предположим, что:

, — априорные (оцененные до испытания) вероятности.

, — апостериорные (оцененные после испытания) вероятности тех же гипотез, пересчитанные в связи «со вновь открывшимися обстоятельствами » — с учётом того факта, что событие достоверно произошло.

Рассмотрим вероятность гриппа при положительном анализе:

Парадокс теоремы Байеса

При рентгеновском обследовании вероятность обнаружить заболевание [math]N[/math] у больного равна [math]0.95[/math], вероятность принять здорового человека за больного равна [math]0.05[/math]. Доля больных по отношению ко всему населению равна [math]0.01[/math]. Найти вероятность того, что человек здоров, если он был признан больным при обследовании. Предположим, что:

,

.

Вычислим сначала полную вероятность признания больным:

Вероятность «здоров» при диагнозе «болен»:

Таким образом, [math]83.9\%[/math] людей, у которых обследование показало результат «болен», на самом деле здоровые люди. Удивительный результат возникает по причине значительной разницы в долях больных и здоровых. Болезнь [math]N[/math] — редкое явление, поэтому и возникает такой парадокс Байеса. При возникновении такого результата лучше всего сделать повторное обследование.

Метод фильтрации спама

Существует метод для фильтрации спама, основанный на применении наивного байесовского классификатора^[1], в основе которого лежит применение теоремы Байеса. Имеется набор писем: спам и не спам. Подсчитаем для каждого слова вероятность встречи в спаме, количество в спаме ко всему количеству в тексте. Аналогично для слов из не спама. Подсчитаем произведения вероятностей для каждого из класса, и где максимум, туда и определяем письмо.

См. также

Примечания

↑ К.В.Воронцов — Наивный байесовский классификатор

Источники информации

Википедия — Теорема Байеса
Wikipedia — Bayes' theorem
Scheg12g — Наглядное объяснение теоремы Байеса
Habrahabr — Теорема Байеса и наивный байесовский классификатор
Гмурман В. Е. Теория вероятностей и математическая статистика, — М.: Высшее образование. 2005 — 52 с.

[1] К.В.Воронцов — Наивный байесовский классификатор

[1]

Формула Байеса

Содержание

Теорема

Примеры

Определение вероятности заболевания

Парадокс теоремы Байеса

Метод фильтрации спама

См. также

Примечания

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты