Изменения

Перейти к: навигация, поиск

Формула Байеса

6736 байт добавлено, 00:02, 5 марта 2018
Нет описания правки
По '''формуле Байеса''' можно более точно пересчитать вероятность, беря в расчет как ранее известную информацию, так и данные новых наблюдений.
Формула Байеса позволяет '''«переставить причину и следствие»''': по известному факту события вычислить вероятность того, что оно было вызвано данной причиной.
События, отражающие действие «причин», в данном случае называют гипотезами, так как они {{---}} предполагаемые события, повлекшие данное.
==Теорема==
{{Определение
|definition='''Формула Байеса''' — одна из основных формул элементарной теории (или теорема Байеса) (англ. ''Bayes' theorem'') {{---}} соотношение различных предполагаемых вероятностейразличных событий, которая позволяет определить которое дает вероятность того, что произошло какое-либо то событие<tex>A</tex> является результатом <tex>X</tex> ряда независимых друг от друга событий <tex>B_1,B_2 \ldots B_n</tex>, который, имея на руках лишь косвенные тому подтверждениявозможно, которые могут быть неточныпривел к <tex>A</tex>.
}}
{{Теорема| about == Формулировка =формула Байеса| statement =:<mathtex>P(B_i|A)=\fracdfrac{P(A|B_i)P(B_i)}{\sum_sum\limits_{j=1}^N P(A|B_j)P(B_j)}</mathtex>,
где
: <mathtex>P(A)</mathtex> {{---}} вероятность события ''<tex>A'';</tex>,: <mathtex>P(A|B)</mathtex> {{---}} вероятность события ''<tex>A'' </tex> при наступлении события ''<tex>B'';</tex>,: <mathtex>P(B|A)</mathtex> {{---}} вероятность наступления события ''<tex>B'' </tex> при истинности события ''<tex>A'';</tex>,: <mathtex>P(B)</mathtex> {{---}} вероятность наступления события ''<tex>B''</tex>.| proof Из замечания определения [[Условная вероятность|условной вероятности]] следует, что вероятность произведения двух событий равна:: <tex>P(B \cap A)=P(A \cap B)= Пример P(A|B)P(B)</tex>По [[Формула полной вероятности|формуле полной вероятности]]:: <tex>P(A)=\sum\limits_{j=1}^N P(A|B_j)P(B_j)</tex> Если вероятности под знаком суммы известны или допускают экспериментальную оценку, то: <tex>P(B_i|A)=\dfrac{P(A|B_i)P(B_i)}{\sum\limits_{j=1}^N P(A|B_j)P(B_j)}</tex>  }} == Примеры == ===Определение вероятности заболевания=== Пусть событие А <tex>A</tex> наступило в результате осуществления одной из гипотез <tex>B_1,B_2 \ldots B_n</tex>. Как определить вероятность того, что имела место та или иная гипотеза?Вероятность заразиться гриппом <tex>0.01</tex>. После проведения анализа вероятность, что это грипп <tex>0.9</tex>, другая болезнь <tex>0.001</tex>.Событие <tex>A</tex> истинно, если анализ на грипп положительный, событие B<subtex>1B_1</subtex> отвечает за грипп, B<subtex>2B_2</subtex> отвечает за другую болезнь.
Также предположим, что:
: <mathtex>P(A|B_1)=0.01</mathtex>=0,9,: <mathtex>P(A|B_2)=0.99</mathtex>=0,001,{{---}} ''априорные'' (оцененные до испытания) вероятности. : <mathtex>P(A|B_1)=0.9</mathtex>=0,01,: <mathtex>P(A|B_2)=0.001</mathtex>=0{{---}} ''апостериорные'' (оцененные после испытания) вероятности тех же гипотез, пересчитанные в связи «со вновь открывшимися обстоятельствами » {{---}} с учётом того факта,99что событие достоверно произошло.
Рассмотрим вероятность гриппа при положительном анализе:
<mathtex>P(B_1|A)=\fracdfrac{P(B_1 \wedge cap A)}{P(A)}</math>=<math>\fracdfrac{P(A|B_1)P(B_1)}{P(A|B_1)P(B_1)+P(A|B_2)P(B_2)}=\dfrac{100}{111}</tex> ===Парадокс теоремы Байеса===При рентгеновском обследовании вероятность обнаружить заболевание <tex>N</tex> у больного равна <tex>0.95</mathtex>, вероятность принять здорового человека за больного равна <tex>0.05</tex>. Доля больных по отношению ко всему населению равна <tex>0.01</tex>. Найти вероятность того, что человек здоров, если он был признан больным при обследовании.Предположим, что:: <tex>P(B_1|B)=0.95</tex>,: <tex>P(B_1|A)=0.05</tex>,: <tex>P(B)=0.01</tex>,: <tex>P(A)=0.99</tex>. Вычислим сначала полную вероятность признания больным:<tex>0.99 \cdot 0.05 + 0.01 \cdot 0.95 =0.059</tex> Вероятность «здоров» при диагнозе «болен»:<tex>P(A|B_1) = \dfrac{0.99 \cdot 0.05}{0.99 \cdot 0.05 + 0.01 \cdot 0.95}=0.839</tex> Таким образом, <mathtex>83.9\frac%</tex> людей, у которых обследование показало результат «болен», на самом деле здоровые люди. Удивительный результат возникает по причине значительной разницы в долях больных и здоровых. Болезнь <tex>N</tex> {100{---}}редкое явление, поэтому и возникает такой парадокс Байеса. При возникновении такого результата лучше всего сделать повторное обследование. ===Метод фильтрации спама===Существует метод для фильтрации спама, основанный на применении '''наивного байесовского классификатора'''<ref>[http://www.machinelearning.ru/wiki/images/9/98/Voron-ML-Bayes-slides.pdf К.В.Воронцов {111{---}}Наивный байесовский классификатор] </mathref>, в основе которого лежит применение теоремы Байеса.Имеется набор писем: спам и не спам. Подсчитаем для каждого слова вероятность встречи в спаме, количество в спаме ко всему количеству в тексте. Аналогично для слов из не спама. Подсчитаем произведения вероятностей для каждого из класса, и где максимум, туда и определяем письмо. == См. также ==* [[Дискретная случайная величина]]* [[Дисперсия случайной величины]]* [[Ковариация случайных величин]] == Примечания ==<references/> == Источники информации ==* [http://ru.wikipedia.org/wiki/Теорема_Байеса Википедия {{---}} Теорема Байеса]* [http://en.wikipedia.org/wiki/Bayes%27_theorem Wikipedia {{---}} Bayes' theorem]*[http://schegl2g.bget.ru/bayes/YudkowskyBayes.html Scheg12g {{---}} Наглядное объяснение теоремы Байеса]*[http://habrahabr.ru/company/surfingbird/blog/150207/ Habrahabr {{---}} Теорема Байеса и наивный байесовский классификатор]* Гмурман В. Е. Теория вероятностей и математическая статистика, {{---}} М.: Высшее образование. 2005 {{---}} 52 с.  [[Категория:Дискретная математика и алгоритмы]] [[Категория: Теория вероятности ]]
286
правок

Навигация