Изменения

Перейти к: навигация, поиск

Корреляция случайных величин

2986 байт добавлено, 21:52, 4 марта 2018
м
Fix ticket
== Определение ==
{{Определение
|definition=
<b>Корреляция случайных величинСреднеквадратичным отклонением</b>(англ. ''standart deviation'') <tex>\sigma_{\eta}</tex> называется величина, равная квадратному корню из [[Дисперсия_случайной_величины | дисперсии]] случайной величины <tex>\eta</tex>: пусть <tex>\sigma_{\eta}=\sqrt{D(\eta)}</tex>}}{{Определение|definition=Пусть <tex>\eta,\xi</tex> {{---}} две [[Дискретная_случайная_величина | случайные величины]], определённые на одном и том же вероятностном пространстве. Тогда их корреляция определяется следующим образом<b> корреляцией случайных величин </b> (англ. correlation) <tex>\eta</tex> и <tex>\xi</tex> называется выражение следующего вида:: <tex dpi = "150">\mathrm{Corr}(\eta,\xi)=\dfrac{\mathrm{Cov}(\eta,\xi) \over }{\sigma_{\eta} \times \sigma_{\xi}}</tex>, где <tex>\mathrm{Cov}(\eta,\xi)</tex> {{---}} [[Ковариация_случайных_величин | ковариация случайных величин]].
}}
== Вычисление ==
Заметим, что <tex>\sigma_{\xi} = \sqrt{D(\xi)} = E\big((\xi-E(\xi))^2\big)</tex>{{---}} среднеквадратичное отклонение.: <tex dpi = "150">\mathrm{Corr}(\eta,\xi)=\dfrac{\mathrm{Cov}(\eta,\xi) \over }{\sigma_{\eta} \times \sigma_{\xi}} = \dfrac{E\big((\eta-E\eta)(\xi-E\xi)\big) \over }{{\sqrt{D(\eta)} \times \sqrt{D(\xi)}}} =\dfrac{E(\xi \times \eta) - E(\xi) \times E(\eta) \over }{{\sigma_{\eta} \times \sigma_{\xi}}}</tex> == Корреляция и взаимосвязь величин ==Значительная корреляция между случайными величинами всегда означает, что присутствует некая взаимосвязь между значениями конкретной выборки, но при другой выборке связь вполне может отсутствовать. Поэтому при нахождении взаимосвязи не нужно делать поспешных выводов о причинно-следственном характере величин, а следует рассмотреть наиболее полную выборку, чтобы делать какие-либо выводы. Коэффициенты корреляции устанавливают лишь статистические взаимосвязи, но не более того.
== Свойства корреляции ==
|statement=
Корреляция симметрична:
: <tex>\mathrm{Corr}(\eta,\xi) = \mathrm{Corr}(\xi,\eta)</tex>.
|proof=
: <tex dpi = "150">\mathrm{Corr}(\eta,\xi) = \dfrac{ E(\eta \times \xi) - E(\eta) \times E(\xi) \over }{\sqrt{D(\eta)} \times \sqrt{D(\xi)} } = \dfrac{ E(\xi \times \eta) - E(\xi) \times E(\eta) \over }{\sqrt{D(\xi)} \times \sqrt{D(\eta)} } = \mathrm{Corr}(\xi,\eta)</tex>.
}}
 
{{Утверждение
|statement=
Корреляция случайной величины с собой равна <tex>1:</tex>.
|proof=
: <tex dpi = "150">\mathrm{Corr}(\eta,\eta) = \dfrac{ E(\eta \times \eta) - E(\eta) \times E(\eta) \over }{\sqrt{D(\eta)} \times \sqrt{D(\eta)} } = \dfrac{D(\eta) \over }{D(\eta)} = 1</tex>}} {{Утверждение|statement=Корреляция лежит на отрезке <tex>[-1, 1]</tex>.   
}}
 
{{Утверждение
|statement=
Если <tex>\eta,\xi</tex> независимые случайные величины, то: <tex>mathrm{Corr}(\eta,\xi) = 0\pm 1 </tex>.|proof=Пусть , то <tex>\eta</tex> и <tex>\xi</tex> - [[Независимые_случайные_величины|независимые величины]]линейно зависимы. Тогда <tex>E(\eta \times \xi)=E(\eta) \times E(\xi)</tex>, где <tex>E</tex> - их [[Математическое_ожидание_случайной_величины|математическое ожидание]]. Получаем:: <tex dpi = "150"> }} {E(\xi) \times E(\eta) - E(\xi) \times E(\eta) \over {E\big((\eta-E(\eta))^2\big) \times E\big((\xi-E(\xi))^2\big)}} Утверждение|statement= 0</tex><b>Но обратное неверно:</b>Пусть Если <tex>\eta</tex> - [[Дискретная_случайная_величина|случайная величина]], распределенная симметрично около 0, а и <tex>\xi=\eta^2</tex>. линейно зависимы, то <tex>\mathrm{Corr}(\eta,\xi)=0</tex>, но <tex>\eta</tex> и <tex>\xipm 1 </tex> - зависимые величины.  
}}
 
{{Утверждение
|statement=
Корреляция лежит не на всей вещественной оси: Если <tex>-1 \leqslant eta,\xi</tex> независимые случайные величины, то <tex>\mathrm{Corr}(\eta,\xi) \leqslant 1= 0</tex>.
|proof=
Для доказательства используем свойство Пусть <tex>\eta</tex> и <tex>\xi</tex> {{---}} [[Ковариация_случайных_величинНезависимые_случайные_величины|ковариациинезависимые величины]]: . Тогда <tex>|CovE(\eta,\xi)| \leqslant \sqrt{D=E(\xieta)} \cdot \sqrt{DE(\etaxi)}</tex>, где <tex>E</tex> {{---}} их [[Математическое_ожидание_случайной_величины|математическое ожидание]]. Тогда при раскрытии модуля получаемПолучаем:: <tex>-\sqrtmathrm{Corr}(\eta, \xi) = \dfrac{DE(\xi)} E(\cdot eta) - E(\sqrt{Dxi) E(\eta)} {{E\leqslant Covbig((\eta,-E(\eta))^2\xibig) E\leqslant big((\sqrt{Dxi-E(\xi)} )^2\cdot \sqrt{D(\etabig)}} = 0</tex>. Поделим левую и правую части на <b>Но обратное неверно:</b>Пусть <tex>\sqrteta</tex> {D({---}} [[Дискретная_случайная_величина|случайная величина]], распределенная симметрично около <tex>0</tex>, а <tex>\xi)} \cdot \sqrt{D(=\eta)}^2</tex> и получим: . <tex dpi = "150">-1 \leqslant mathrm{CovCorr}(\eta,\xi) \over \sqrt{D(\xi)} \cdot \sqrt{D(\eta)}} \leqslant 1=0</tex>, т.е. : но <tex>-1 \leqslant Corr(\eta,</tex> и <tex>\xi) \leqslant 1</tex>, ч.т.д{{---}} зависимые величины.
}}
== Примеры ==
[[Файл:Пример_графиков_корреляции.png|600px|thumb|right|3 диаграммы рассеивания двух случайных величин X и Y]]В общем смысле корреляция {{- --}} это зависимость между случайными величинами, когда изменение одной влечет изменение распределения другой.
=== Определение корреляции по диаграмме ===
[[Файл:Пример_графиков_корреляции.png|600px|thumb|right|3 диаграммы рассеивания двух случайных величин <tex>X</tex> и <tex>Y</tex>]]
 
#Соответственно, на '''первом графике''' изображена '''положительная корреляция''', когда увеличение <tex>Y</tex> ведет к постепенному увеличению <tex>X</tex>.
#'''Второй график''' отображает '''отрицательную корреляцию''', когда увеличение <tex>X</tex> воздействует на постепенное уменьшение <tex>Y</tex>.
#'''Третий график''' показывает, что <tex>X</tex> и <tex>Y</tex> связаны слабо, их распределение не зависит от изменения друг друга, поэтому корреляция между ними будет '''равна <tex>0</tex>'''.
 
=== Определение корреляции по таблице ===
Рассмотрим <tex>2</tex> случайные величины: курс акций нефтедобывающей компании (<tex>X</tex>) и цены на нефть (<tex>Y</tex>).
 
{| class="wikitable"
|-
! X
| <tex>2003,6</tex> || <tex>2013,2</tex> || <tex>2007,6</tex> || <tex>2007,4</tex> || <tex>2039,9</tex> || <tex>2025</tex> || <tex>2007</tex> || <tex>2017</tex> || <tex>2015,6</tex> || <tex>2011</tex>
|-
! Y
| <tex>108,4</tex> || <tex>107,96</tex> || <tex>108,88</tex> || <tex>110,44</tex> || <tex>110,2</tex> || <tex>108,97</tex> || <tex>109,15</tex> || <tex>108,8</tex> || <tex>111,2</tex> || <tex>110,23</tex>
|-
|}
Для упрощения вычислений определим <tex>X</tex> и <tex>Y</tex> как равновероятные случайные величины. Тогда их математическое ожидание и дисперсию легко посчитать:
 
<tex>E(X) = 2014,73</tex>
 
<tex>E(Y) = 109,42</tex>
 
<tex>D(X) = 104,9361</tex>
1. Соответственно<tex>D(Y) = 0, на '''первом графике''' изображена '''положительная корреляция''', когда увеличение Y ведет к постепенному увеличению X.959661</tex>
2. '''Второй график''' отображает '''отрицательную корреляцию'''Используя формулу, когда увеличение <tex>\mathrm{Corr}(\eta,\xi)=\dfrac{E(\xi \eta) - E(\xi)E(\eta)}{{\sigma_{\eta} \sigma_{\xi}}}</tex> определяем, что корреляция между величинами <tex>X</tex> и <tex>Y воздействует на постепенное уменьшение X</tex> составляет <tex>0,240935496</tex>, то есть <tex>24\%</tex>.
3== См. '''Третий график''' показывает, что X и Y связаны слабо, их распределение не зависит от изменения другой также ==*[[Дисперсия случайной величины, поэтому корреляция между ними будет '''равна 0'''.|Дисперсия случайной величины]]*[[Ковариация случайных величин|Ковариация случайных величин]]
== Ссылки Источники информации ==
* [http://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D1%80%D1%80%D0%B5%D0%BB%D1%8F%D1%86%D0%B8%D1%8F Википедия {{---}} Корреляция]
* [http://en.wikipedia.org/wiki/Correlation_and_dependence Wikipedia {{---}} Correlation and dependence]
286
правок

Навигация