Формула полной вероятности — различия между версиями
Shersh (обсуждение | вклад) |
Shersh (обсуждение | вклад) (Добавлены примеры, и дополнена теоретическая часть) |
||
Строка 4: | Строка 4: | ||
{{Определение | {{Определение | ||
|definition = | |definition = | ||
− | [[Мощность множества | Не более чем счётное]] [[Множества | множество]] событий <tex> B_1, B_2, ..., | + | [[Мощность множества | Не более чем счётное]] [[Множества | множество]] событий <tex> B_1, B_2, ..., B_{n} </tex>, таких что: |
− | # все события попарно несовместны: <tex> \forall i,~j = 1, 2, ..., n~ | + | # все события попарно несовместны: <tex> \forall i,~j = 1, 2, ..., n~B_{i} \cap B_{j} = \varnothing </tex> |
− | # их объединение образует пространство элементарных исходов: <tex>P( | + | # их объединение образует пространство элементарных исходов: <tex>P(B_{i})~>~0,~B_1~\cup ~B_2~\cup ...~\cup ~B_n = \Omega </tex> |
}} | }} | ||
В этом случае события <tex>B_i</tex> ещё называются гипотезами. | В этом случае события <tex>B_i</tex> ещё называются гипотезами. | ||
Строка 14: | Строка 14: | ||
формула полной вероятности | формула полной вероятности | ||
| statement = | | statement = | ||
− | Вероятность события <tex> A~\subset ~\Omega </tex>, которое может произойти только вместе с одним из событий <tex> | + | Вероятность события <tex> A~\subset ~\Omega </tex>, которое может произойти только вместе с одним из событий <tex> B_1, B_2, ..., B_{n} </tex>, образующих |
− | <tex> | + | |
+ | полную группу, равна сумме произведений вероятностей гипотез на условные вероятности события, вычисленные соотвественно при каждой из гипотез. | ||
+ | |||
+ | <tex> {P}(A) = \sum\limits_{i=1}^{n} {P}( A \mid B_i) {P}(B_i) </tex> | ||
| proof = | | proof = | ||
− | + | Так как события <tex>\{B_i\}_{i=1}^{n} </tex> образуют полную группу, то по определению событие <tex> A </tex> можно представить следующим образом: | |
− | <tex> A = A\cap | + | <tex> |
+ | A~=~A \cap \Omega ~=~ A \cap \big( \bigcup\limits_{i=1}^{n} B_{i} \big) ~=~ \bigcup\limits_{i=1}^{n} ( A \cap B_{i} ) | ||
+ | </tex> | ||
+ | События <tex>\{B_i\}_{i=1}^{n} </tex> попарно несовместны, значит и события <tex> (A\cap B_{i}) </tex> тоже несовместны. Тогда после применения теоремы о сложении вероятностей несовместных событий, а также воспользовавшись определением условной вероятности, получаем: | ||
− | + | <tex> | |
+ | {P}(A)~=~{P}\Big( \bigcup\limits_{i=1}^{n} ( A \cap B_{i} ) \Big) ~=~ \sum\limits_{i=1}^{n} {P}(A\cap B_i) ~=~ \sum\limits_{i=1}^{n} {P}(A \mid B_i){P}(B_i) | ||
+ | </tex> | ||
− | + | }} | |
− | |||
− | + | ==Пример== | |
+ | '''Условие.''' Имеются 3 одинаковые урны с шарами. В первой из них 3 белых и 4 черных шара, во второй {{---}} 2 белых и 5 чёрных, а в третьей {{---}} 10 чёрных шаров. Из случайно выбранной урны наудачу вынут шар. С какой вероятностью он окажется белым? | ||
− | + | '''Решение.''' Будем считать события <tex> B_1, B_2, B_3 </tex> выбором урны с соотвествующим номером, а событие <tex>A</tex> {{---}} выбором белого шара. По условию задачи все события выбора урны равновероятны, значит: | |
+ | |||
+ | <tex> {P}(B_1)~=~{P}(B_2)~=~{P}(B_3)~=~ \genfrac{}{}{}{0}{1}{3} </tex> | ||
− | <tex>{ | + | Теперь найдём вероятность события <tex>A</tex> при выборе каждой урны: |
− | }} | + | |
− | == | + | <tex> |
+ | {P}(A \mid B_1) = \genfrac{}{}{}{0}{2}{7} ,~ {P}(A \mid B_2) = \genfrac{}{}{}{0}{3}{7} ,~ {P}(A \mid B_3) = 0. | ||
+ | </tex> | ||
+ | |||
+ | В результате получаем | ||
+ | <tex> | ||
+ | {P}(A) ~=~ \genfrac{}{}{}{0}{1}{3} \cdot \genfrac{}{}{}{0}{2}{7} +\genfrac{}{}{}{0}{1}{3} \cdot \genfrac{}{}{}{0}{3}{7} +\genfrac{}{}{}{0}{1}{3} \cdot 0 ~\approx ~ 0{.}238 | ||
+ | </tex> | ||
+ | |||
+ | ==Метод фильтрации спама== | ||
+ | При проверке письма вычисляется вероятность того, что оно {{---}} спам. Для каждого слова эксперементально подсчитывается его ''вес'' {{---}} % содержания этого слова в письмах, отмеченных пользователем, как спам. Тогда ''весом'' письма является среднее ''весов'' всех его слов. Таким образом программа(анти-спам бот) считает письмо спамом, если его ''вес'' больше какой-то заданной пользователем планки (обычно 60-80%). После вынесения решения о полученном письме происходит пересчёт в базе данных весов слов, составляющих текст письма. | ||
+ | |||
+ | Недостаток метода заключается в том, что одни слова чаще встречаются в спаме, а другие {{---}} в обычных письмах. Тогда метод неэффективен, если данное предположение неверно. | ||
− | + | '''Замечание.''' Если 80% писем, содержащих фразу <tex>"</tex>Привет :) Как дела?)<tex>"</tex>, являлись спамом, то и следующее письмо с этим словосочетанием c большой вероятностью {{---}} спам. | |
− | : | ||
− | |||
− | |||
− | |||
==См. также== | ==См. также== | ||
Строка 48: | Строка 66: | ||
== Источники == | == Источники == | ||
− | *[http://ru | + | * [http://nsu.ru/mmf/tvims/chernova/tv/lec/node14.html NSU | Формула полной вероятности] |
+ | * [http://vm.psati.ru/downloads/uch-pos-tv.pdf Конспект лекций | Теория вероятностей] | ||
+ | |||
+ | [[Категория: Дискретная математика и алгоритмы]] | ||
+ | [[Категория: Формула полной вероятности]] |
Версия 05:22, 6 декабря 2011
Формула полной вероятности позволяет вычислить вероятность интересующего события через вероятности событию произойти при выполнении гипотез и вероятность этих гипотез.
Теорема
Определение: |
Не более чем счётное множество событий , таких что:
|
В этом случае события
ещё называются гипотезами.Теорема (формула полной вероятности): |
Вероятность события , которое может произойти только вместе с одним из событий , образующих
полную группу, равна сумме произведений вероятностей гипотез на условные вероятности события, вычисленные соотвественно при каждой из гипотез. |
Доказательство: |
Так как события образуют полную группу, то по определению событие можно представить следующим образом:
События попарно несовместны, значит и события тоже несовместны. Тогда после применения теоремы о сложении вероятностей несовместных событий, а также воспользовавшись определением условной вероятности, получаем: |
Пример
Условие. Имеются 3 одинаковые урны с шарами. В первой из них 3 белых и 4 черных шара, во второй — 2 белых и 5 чёрных, а в третьей — 10 чёрных шаров. Из случайно выбранной урны наудачу вынут шар. С какой вероятностью он окажется белым?
Решение. Будем считать события
выбором урны с соотвествующим номером, а событие — выбором белого шара. По условию задачи все события выбора урны равновероятны, значит:
Теперь найдём вероятность события
при выборе каждой урны:
В результате получаем
Метод фильтрации спама
При проверке письма вычисляется вероятность того, что оно — спам. Для каждого слова эксперементально подсчитывается его вес — % содержания этого слова в письмах, отмеченных пользователем, как спам. Тогда весом письма является среднее весов всех его слов. Таким образом программа(анти-спам бот) считает письмо спамом, если его вес больше какой-то заданной пользователем планки (обычно 60-80%). После вынесения решения о полученном письме происходит пересчёт в базе данных весов слов, составляющих текст письма.
Недостаток метода заключается в том, что одни слова чаще встречаются в спаме, а другие — в обычных письмах. Тогда метод неэффективен, если данное предположение неверно.
Замечание. Если 80% писем, содержащих фразу
Привет :) Как дела?) , являлись спамом, то и следующее письмо с этим словосочетанием c большой вероятностью — спам.