Корреляция случайных величин — различия между версиями
Kabanov (обсуждение | вклад) (→Определение корреляции по диаграмме) |
(→Свойства корреляции) |
||
Строка 18: | Строка 18: | ||
: <tex dpi = "150">Corr(\eta,\xi) = { E(\eta \times \xi) - E(\eta) \times E(\xi) \over \sqrt{D(\eta)} \times \sqrt{D(\xi)} } = { E(\xi \times \eta) - E(\xi) \times E(\eta) \over \sqrt{D(\xi)} \times \sqrt{D(\eta)} } = Corr(\xi,\eta)</tex> | : <tex dpi = "150">Corr(\eta,\xi) = { E(\eta \times \xi) - E(\eta) \times E(\xi) \over \sqrt{D(\eta)} \times \sqrt{D(\xi)} } = { E(\xi \times \eta) - E(\xi) \times E(\eta) \over \sqrt{D(\xi)} \times \sqrt{D(\eta)} } = Corr(\xi,\eta)</tex> | ||
}} | }} | ||
+ | |||
{{Утверждение | {{Утверждение | ||
|statement= | |statement= | ||
− | Корреляция | + | Корреляция лежит на отрезке <tex>[-1, 1]</tex>: |
+ | |||
|proof= | |proof= | ||
− | + | Для доказательство используем свойства ковариации | |
+ | <tex>Cov^2(\eta, \xi) \le \sigma_\eta ^2\sigma_\xi ^2</tex> | ||
+ | из этого выходят <tex> {Cov^2(\eta,\xi)\over(\sigma_\eta ^2\sigma_\xi ^2)} \le 1</tex> | ||
+ | |||
+ | при условии, конечно, что знаменатель не обращается в нуль. | ||
+ | |||
+ | <tex>Corr^2(\eta,\xi) \le 1</tex> что из этого следует | ||
+ | |||
+ | <tex>-1 \le Corr(\eta,\xi) \le 1</tex> | ||
+ | |||
}} | }} | ||
+ | |||
+ | {{Утверждение | ||
+ | |statement= | ||
+ | Если <tex> Corr(\eta, \xi) = \pm 1 </tex>, то <tex>\eta</tex> и <tex>\xi</tex> линейно зависимые | ||
+ | |||
+ | |proof= | ||
+ | Для доказательство используем доказательство свойства ковариации. | ||
+ | Так как у нас <tex> Corr(\eta, \xi) = \pm 1 </tex> | ||
+ | то это обозначает что <tex>Cov^2(\eta,\xi) = \sigma_\eta ^2\sigma_\xi ^2</tex> | ||
+ | равенство на этом неравенстве <tex>\sigma_\xi ^2t^2+2Cov(\eta,\xi)t+\sigma_\eta ^2 \ge 0</tex> выполняется только при условии что дискриминант равен нулю т.е. имеет один корень <tex> t_0 </tex>. | ||
+ | |||
+ | Из этого выходят <tex> E((\xi-E\xi +t_0 \eta - t_0 E\eta))=E((V + t_0 W)^2) = 0 </tex> | ||
+ | единственная случая это может произойти, если <tex> \xi-E\xi +t_0 \eta - t_0 E\eta = 0</tex>; | ||
+ | |||
+ | Ясно что <tex>\eta</tex> и <tex>\xi</tex> линейно зависимы. | ||
+ | }} | ||
+ | |||
+ | {{Утверждение | ||
+ | |statement= | ||
+ | Если <tex>\eta</tex> и <tex>\xi</tex> линейно зависимы то <tex>Corr(\eta, \xi)= \pm 1 </tex>. | ||
+ | |||
+ | |proof= | ||
+ | Предположим что <tex>\xi = k \eta + b</tex>. | ||
+ | Потом, мы имеем что <tex>E\xi=kE\eta + b</tex>; и так | ||
+ | <tex> Cov(\eta, \xi) = E((\eta - E\eta)(\xi - E\xi))=kE((\eta-E\eta)^2)=k\sigma_\eta ^2 </tex>. | ||
+ | |||
+ | Кроме того, по свойствам дисперсии, | ||
+ | <tex> \sigma_\xi ^2 = D[\xi] = E((\xi-E\xi)^2)= k^2 E((\eta-E\eta)^2)= k^2 \sigma_\eta ^2 </tex> | ||
+ | |||
+ | Из этого следует, что | ||
+ | <tex>Corr(\eta, \xi)= {Cov(\eta, \xi)\over \sigma_\eta \sigma_\xi}={k\over |k|}</tex>, | ||
+ | |||
+ | ясно что это равно на <tex>\pm 1</tex>, знак зависит от знака <tex>k</tex>. | ||
+ | }} | ||
+ | |||
{{Утверждение | {{Утверждение | ||
|statement= | |statement= | ||
Строка 33: | Строка 79: | ||
<b>Но обратное неверно:</b> | <b>Но обратное неверно:</b> | ||
Пусть <tex>\eta</tex> - [[Дискретная_случайная_величина|случайная величина]], распределенная симметрично около 0, а <tex>\xi=\eta^2</tex>. <tex>Corr(\eta,\xi)=0</tex>, но <tex>\eta</tex> и <tex>\xi</tex> - зависимые величины. | Пусть <tex>\eta</tex> - [[Дискретная_случайная_величина|случайная величина]], распределенная симметрично около 0, а <tex>\xi=\eta^2</tex>. <tex>Corr(\eta,\xi)=0</tex>, но <tex>\eta</tex> и <tex>\xi</tex> - зависимые величины. | ||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
}} | }} | ||
Версия 23:30, 11 января 2013
Содержание
Определение
Определение: |
Корреляция случайных величин: пусть случайные величины, определённые на одном и том же вероятностном пространстве. Тогда их корреляция определяется следующим образом:
| — две
Вычисление
Заметим, что
Свойства корреляции
Утверждение: |
Корреляция симметрична:
|
|
Утверждение: |
Корреляция лежит на отрезке : |
Для доказательство используем свойства ковариации из этого выходятпри условии, конечно, что знаменатель не обращается в нуль. что из этого следует |
Утверждение: |
Если , то и линейно зависимые |
Для доказательство используем доказательство свойства ковариации. Так как у нас то это обозначает что равенство на этом неравенстве выполняется только при условии что дискриминант равен нулю т.е. имеет один корень .Из этого выходят Ясно что единственная случая это может произойти, если ; и линейно зависимы. |
Утверждение: |
Если и линейно зависимы то . |
Предположим что . Потом, мы имеем что ; и так .Кроме того, по свойствам дисперсии, Из этого следует, что ясно что это равно на , , знак зависит от знака . |
Утверждение: |
Если независимые случайные величины, то
|
Пусть независимые величины. Тогда , где - их математическое ожидание. Получаем: и -Но обратное неверно: Пусть - случайная величина, распределенная симметрично около 0, а . , но и - зависимые величины. |
Примеры
В общем смысле корреляция - это зависимость между случайными величинами, когда изменение одной влечет изменение распределения другой.
Определение корреляции по диаграмме
1. Соответственно, на первом графике изображена положительная корреляция, когда увеличение Y ведет к постепенному увеличению X.
2. Второй график отображает отрицательную корреляцию, когда увеличение X воздействует на постепенное уменьшение Y.
3. Третий график показывает, что X и Y связаны слабо, их распределение не зависит от изменения друг друга, поэтому корреляция между ними будет равна 0.
Определение корреляции по таблице
Рассмотрим 2 случайные величины: курс акций нефтедобывающей компании (X) и цены на нефть (Y).
X | 2003,6 | 2013,2 | 2007,6 | 2007,4 | 2039,9 | 2025 | 2007 | 2017 | 2015,6 | 2011 |
---|---|---|---|---|---|---|---|---|---|---|
Y | 108,4 | 107,96 | 108,88 | 110,44 | 110,2 | 108,97 | 109,15 | 108,8 | 111,2 | 110,23 |
Для упрощения вычислений определим X и Y как равновероятные случайные величины. Тогда их математическое ожидание и дисперсию легко посчитать:
Используя формулу,
определяем, что корреляция между величинами X и Y составляет 0,240935496, т.е. 24%.