Корреляция случайных величин — различия между версиями
Kabanov (обсуждение | вклад) (→Определение корреляции по диаграмме) |
(→Свойства корреляции) |
||
| Строка 18: | Строка 18: | ||
: <tex dpi = "150">Corr(\eta,\xi) = { E(\eta \times \xi) - E(\eta) \times E(\xi) \over \sqrt{D(\eta)} \times \sqrt{D(\xi)} } = { E(\xi \times \eta) - E(\xi) \times E(\eta) \over \sqrt{D(\xi)} \times \sqrt{D(\eta)} } = Corr(\xi,\eta)</tex> | : <tex dpi = "150">Corr(\eta,\xi) = { E(\eta \times \xi) - E(\eta) \times E(\xi) \over \sqrt{D(\eta)} \times \sqrt{D(\xi)} } = { E(\xi \times \eta) - E(\xi) \times E(\eta) \over \sqrt{D(\xi)} \times \sqrt{D(\eta)} } = Corr(\xi,\eta)</tex> | ||
}} | }} | ||
| + | |||
{{Утверждение | {{Утверждение | ||
|statement= | |statement= | ||
| − | Корреляция | + | Корреляция лежит на отрезке <tex>[-1, 1]</tex>: |
| + | |||
|proof= | |proof= | ||
| − | + | Для доказательство используем свойства ковариации | |
| + | <tex>Cov^2(\eta, \xi) \le \sigma_\eta ^2\sigma_\xi ^2</tex> | ||
| + | из этого выходят <tex> {Cov^2(\eta,\xi)\over(\sigma_\eta ^2\sigma_\xi ^2)} \le 1</tex> | ||
| + | |||
| + | при условии, конечно, что знаменатель не обращается в нуль. | ||
| + | |||
| + | <tex>Corr^2(\eta,\xi) \le 1</tex> что из этого следует | ||
| + | |||
| + | <tex>-1 \le Corr(\eta,\xi) \le 1</tex> | ||
| + | |||
}} | }} | ||
| + | |||
| + | {{Утверждение | ||
| + | |statement= | ||
| + | Если <tex> Corr(\eta, \xi) = \pm 1 </tex>, то <tex>\eta</tex> и <tex>\xi</tex> линейно зависимые | ||
| + | |||
| + | |proof= | ||
| + | Для доказательство используем доказательство свойства ковариации. | ||
| + | Так как у нас <tex> Corr(\eta, \xi) = \pm 1 </tex> | ||
| + | то это обозначает что <tex>Cov^2(\eta,\xi) = \sigma_\eta ^2\sigma_\xi ^2</tex> | ||
| + | равенство на этом неравенстве <tex>\sigma_\xi ^2t^2+2Cov(\eta,\xi)t+\sigma_\eta ^2 \ge 0</tex> выполняется только при условии что дискриминант равен нулю т.е. имеет один корень <tex> t_0 </tex>. | ||
| + | |||
| + | Из этого выходят <tex> E((\xi-E\xi +t_0 \eta - t_0 E\eta))=E((V + t_0 W)^2) = 0 </tex> | ||
| + | единственная случая это может произойти, если <tex> \xi-E\xi +t_0 \eta - t_0 E\eta = 0</tex>; | ||
| + | |||
| + | Ясно что <tex>\eta</tex> и <tex>\xi</tex> линейно зависимы. | ||
| + | }} | ||
| + | |||
| + | {{Утверждение | ||
| + | |statement= | ||
| + | Если <tex>\eta</tex> и <tex>\xi</tex> линейно зависимы то <tex>Corr(\eta, \xi)= \pm 1 </tex>. | ||
| + | |||
| + | |proof= | ||
| + | Предположим что <tex>\xi = k \eta + b</tex>. | ||
| + | Потом, мы имеем что <tex>E\xi=kE\eta + b</tex>; и так | ||
| + | <tex> Cov(\eta, \xi) = E((\eta - E\eta)(\xi - E\xi))=kE((\eta-E\eta)^2)=k\sigma_\eta ^2 </tex>. | ||
| + | |||
| + | Кроме того, по свойствам дисперсии, | ||
| + | <tex> \sigma_\xi ^2 = D[\xi] = E((\xi-E\xi)^2)= k^2 E((\eta-E\eta)^2)= k^2 \sigma_\eta ^2 </tex> | ||
| + | |||
| + | Из этого следует, что | ||
| + | <tex>Corr(\eta, \xi)= {Cov(\eta, \xi)\over \sigma_\eta \sigma_\xi}={k\over |k|}</tex>, | ||
| + | |||
| + | ясно что это равно на <tex>\pm 1</tex>, знак зависит от знака <tex>k</tex>. | ||
| + | }} | ||
| + | |||
{{Утверждение | {{Утверждение | ||
|statement= | |statement= | ||
| Строка 33: | Строка 79: | ||
<b>Но обратное неверно:</b> | <b>Но обратное неверно:</b> | ||
Пусть <tex>\eta</tex> - [[Дискретная_случайная_величина|случайная величина]], распределенная симметрично около 0, а <tex>\xi=\eta^2</tex>. <tex>Corr(\eta,\xi)=0</tex>, но <tex>\eta</tex> и <tex>\xi</tex> - зависимые величины. | Пусть <tex>\eta</tex> - [[Дискретная_случайная_величина|случайная величина]], распределенная симметрично около 0, а <tex>\xi=\eta^2</tex>. <tex>Corr(\eta,\xi)=0</tex>, но <tex>\eta</tex> и <tex>\xi</tex> - зависимые величины. | ||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
}} | }} | ||
Версия 23:30, 11 января 2013
Содержание
Определение
| Определение: |
Корреляция случайных величин: пусть — две случайные величины, определённые на одном и том же вероятностном пространстве. Тогда их корреляция определяется следующим образом:
|
Вычисление
Заметим, что
Свойства корреляции
| Утверждение: |
Корреляция симметрична:
|
|
|
| Утверждение: |
Корреляция лежит на отрезке : |
|
Для доказательство используем свойства ковариации из этого выходят при условии, конечно, что знаменатель не обращается в нуль. что из этого следует |
| Утверждение: |
Если , то и линейно зависимые |
|
Для доказательство используем доказательство свойства ковариации. Так как у нас то это обозначает что равенство на этом неравенстве выполняется только при условии что дискриминант равен нулю т.е. имеет один корень . Из этого выходят единственная случая это может произойти, если ; Ясно что и линейно зависимы. |
| Утверждение: |
Если и линейно зависимы то . |
|
Предположим что . Потом, мы имеем что ; и так . Кроме того, по свойствам дисперсии, Из этого следует, что , ясно что это равно на , знак зависит от знака . |
| Утверждение: |
Если независимые случайные величины, то
|
|
Пусть и - независимые величины. Тогда , где - их математическое ожидание. Получаем: Но обратное неверно: Пусть - случайная величина, распределенная симметрично около 0, а . , но и - зависимые величины. |
Примеры
В общем смысле корреляция - это зависимость между случайными величинами, когда изменение одной влечет изменение распределения другой.
Определение корреляции по диаграмме
1. Соответственно, на первом графике изображена положительная корреляция, когда увеличение Y ведет к постепенному увеличению X.
2. Второй график отображает отрицательную корреляцию, когда увеличение X воздействует на постепенное уменьшение Y.
3. Третий график показывает, что X и Y связаны слабо, их распределение не зависит от изменения друг друга, поэтому корреляция между ними будет равна 0.
Определение корреляции по таблице
Рассмотрим 2 случайные величины: курс акций нефтедобывающей компании (X) и цены на нефть (Y).
| X | 2003,6 | 2013,2 | 2007,6 | 2007,4 | 2039,9 | 2025 | 2007 | 2017 | 2015,6 | 2011 |
|---|---|---|---|---|---|---|---|---|---|---|
| Y | 108,4 | 107,96 | 108,88 | 110,44 | 110,2 | 108,97 | 109,15 | 108,8 | 111,2 | 110,23 |
Для упрощения вычислений определим X и Y как равновероятные случайные величины. Тогда их математическое ожидание и дисперсию легко посчитать:
Используя формулу, определяем, что корреляция между величинами X и Y составляет 0,240935496, т.е. 24%.
