Изменения

Перейти к: навигация, поиск

Корреляция случайных величин

2110 байт убрано, 21:52, 4 марта 2018
м
Fix ticket
Корреляция лежит на отрезке <tex>[-1, 1]</tex>.
|proof=
Для доказательства будем использовать [[Ковариация случайных величин#Неравенство Коши — Буняковского | неравенство Коши-Буняковского]]:
 
<tex>\mathrm{Cov}^2(\eta, \xi) \leqslant \sigma_\eta ^2\sigma_\xi ^2</tex>
 
Если правая часть не равна <tex>0</tex>, то приходим к следующему неравенству:
 
<tex> \dfrac{\mathrm{Cov}^2(\eta,\xi)}{(\sigma_\eta ^2\sigma_\xi ^2)} \leqslant 1</tex>
 
<tex>\mathrm{Corr}^2(\eta,\xi) \leqslant 1</tex>
<tex>-1 \leqslant \mathrm{Corr}(\eta,\xi) \leqslant 1</tex>.
}}
Если <tex> \mathrm{Corr}(\eta, \xi) = \pm 1 </tex>, то <tex>\eta</tex> и <tex>\xi</tex> линейно зависимы.
|proof=
В доказательстве будем использовать [[Ковариация случайных величин#Неравенство Коши — Буняковского | неравенство Коши-Буняковского]]. <br>
Так как <tex> \mathrm{Corr}(\eta, \xi) = \pm 1 </tex>, тo <tex>\mathrm{Cov}^2(\eta,\xi) = \sigma_\eta ^2\sigma_\xi ^2</tex>
 
Из этого следует, что дискриминант этого уравнения <tex>\sigma_\xi ^2t^2+2\mathrm{Cov}(\eta,\xi)t+\sigma_\eta ^2 = 0</tex> равен <tex>0</tex> .
 
То есть уравнение имеет единственный корень <tex> t_0 </tex>.
 
Получаем, что <tex>\sigma_\xi ^2t_0 ^2+2\mathrm{Cov}(\eta,\xi) t_0+\sigma_\eta ^2 = 0</tex>.
 
Из этого следует, что <tex> E\big((\xi-E(\xi) +t_0 \eta - t_0 E(\eta))^2\big) = 0 </tex>
 
Это возможно только тогда, когда <tex> \xi-E(\xi) +t_0 \eta - t_0 E(\eta) = 0</tex>;
Видим, что <tex>\eta</tex> и <tex>\xi</tex> линейно зависимы.
}}
Если <tex>\eta</tex> и <tex>\xi</tex> линейно зависимы, то <tex>\mathrm{Corr}(\eta, \xi)= \pm 1 </tex>.
|proof=
Предположим, что существует линейная зависимость: <tex>\xi = k \times \eta + b</tex>.
Тогда мы имеем <tex>E(\xi)=k E(\eta) + b</tex>
 
<tex> \mathrm{Cov}(\eta, \xi) = E((\eta - E(\eta))(\xi - E\xi))=k E\big((\eta-E(\eta))^2\big)=k \sigma_\eta ^2 </tex>.
 
По свойству дисперсии <tex> \sigma_\xi ^2 = D(\xi) = E\big((\xi-E(\xi))^2\big)= k^2 E\big((\eta-E(\eta))^2\big)= k^2 \sigma_\eta ^2 </tex>
Получаем, что
<tex>\mathrm{Corr}(\eta, \xi)= \dfrac{\mathrm{Cov}(\eta, \xi)}{\sigma_\eta \sigma_\xi}=\dfrac{k}{|k|}</tex>.
}}
: <tex>\mathrm{Corr}(\eta, \xi) = \dfrac{E(\xi) E(\eta) - E(\xi) E(\eta)}{{E\big((\eta-E(\eta))^2\big) E\big((\xi-E(\xi))^2\big)}} = 0</tex>
<b>Но обратное неверно:</b>
Пусть <tex>\eta</tex> {{---}} [[Дискретная_случайная_величина|случайная величина]], распределенная симметрично около <tex>0</tex>, а <tex>\xi=\eta^2</tex>. <tex>\mathrm{Corr}(\eta,\xi)=0</tex>, но <tex>\eta</tex> и <tex>\xi</tex> {{---}} зависимые величины.
}}
[[Файл:Пример_графиков_корреляции.png|600px|thumb|right|3 диаграммы рассеивания двух случайных величин <tex>X</tex> и <tex>Y</tex>]]
1. #Соответственно, на '''первом графике''' изображена '''положительная корреляция''', когда увеличение <tex>Y</tex> ведет к постепенному увеличению <tex>X</tex>. 2. #'''Второй график''' отображает '''отрицательную корреляцию''', когда увеличение <tex>X</tex> воздействует на постепенное уменьшение <tex>Y</tex>. 3. #'''Третий график''' показывает, что <tex>X</tex> и <tex>Y</tex> связаны слабо, их распределение не зависит от изменения друг друга, поэтому корреляция между ними будет '''равна <tex>0</tex>'''.
=== Определение корреляции по таблице ===
Рассмотрим <tex>2 </tex> случайные величины: курс акций нефтедобывающей компании (<tex>X</tex>) и цены на нефть (<tex>Y</tex>).
{| class="wikitable"
|-
! X
| <tex>2003,6 </tex> || <tex>2013,2 </tex> || <tex>2007,6 </tex> || <tex>2007,4 </tex> || <tex>2039,9 </tex> || <tex>2025 </tex> || <tex>2007 </tex> || <tex>2017 </tex> || <tex>2015,6 </tex> || <tex>2011</tex>
|-
! Y
| <tex>108,4 </tex> || <tex>107,96 </tex> || <tex>108,88 </tex> || <tex>110,44 </tex> || <tex>110,2 </tex> || <tex>108,97 </tex> || <tex>109,15 </tex> || <tex>108,8 </tex> || <tex>111,2 </tex> || <tex>110,23</tex>
|-
|}
<tex>D(Y) = 0,959661</tex>
Используя формулу, <tex>\mathrm{Corr}(\eta,\xi)=\dfrac{E(\xi \eta) - E(\xi)E(\eta)}{{\sigma_{\eta} \sigma_{\xi}}}</tex> определяем, что корреляция между величинами <tex>X</tex> и <tex>Y</tex> составляет <tex>0,240935496</tex>, т.е. то есть <tex>24\%</tex>.
== См. также ==
286
правок

Навигация