Ковариация против корреляции

Разница между ковариацией и корреляцией

Ковариация и корреляция — это два термина, которые в точности противоположны друг другу, они оба используются в статистике и регрессионном анализе, ковариация показывает нам, как две переменные отличаются друг от друга, тогда как корреляция показывает нам взаимосвязь между двумя переменными и как они связаны.

Корреляция и ковариация — это две статистические концепции, которые используются для определения взаимосвязи между двумя случайными величинами. Корреляция определяет, как изменение одной переменной повлияет на другую, а ковариация определяет, как два элемента изменяются вместе. Сбивает с толку? Давайте углубимся дальше, чтобы понять разницу между этими тесно связанными терминами.

Что такое ковариация?

Ковариация измеряет, как две переменные движутся относительно друг друга, и является расширением концепции дисперсии (которая говорит о том, как изменяется одна переменная). Может принимать любое значение от -∞ до + ∞.

  • Чем выше это значение, тем более зависимы отношения. Положительное число означает положительную ковариацию и указывает на прямую связь. Фактически это означает, что увеличение одной переменной также приведет к соответствующему увеличению другой переменной, если другие условия останутся постоянными.
  • С другой стороны, отрицательное число означает отрицательную ковариацию, которая указывает на обратную связь между двумя переменными. Хотя ковариация идеально подходит для определения типа отношений, она плохо подходит для интерпретации их величины.

Корреляция против ковариации

Что такое корреляция?

Корреляция — это шаг впереди ковариации, поскольку она количественно определяет взаимосвязь между двумя случайными величинами. Проще говоря, это единичная мера того, как эти переменные изменяются относительно друг друга (нормализованное значение ковариации).

  • В отличие от ковариации, у корреляции есть верхний и нижний предел диапазона. Он может принимать только значения от +1 до -1. Корреляция +1 указывает на то, что случайные величины имеют прямую и сильную связь.
  • С другой стороны, корреляция -1 указывает на то, что существует сильная обратная зависимость, и увеличение одной переменной приведет к равному и противоположному уменьшению другой переменной. 0 означает, что эти два числа независимы.

Формула ковариации и корреляции

Выразим эти две концепции математически. Для двух случайных величин A и B со средними значениями как Ua и Ub и стандартным отклонением как Sa и Sb соответственно:

Фактически отношения между ними можно определить как:

Формула

И корреляции, и ковариация находят применение в областях статистического и финансового анализа. Поскольку корреляция стандартизирует отношения, она полезна при сравнении любых двух переменных. Это помогает аналитику придумывать такие стратегии, как парная торговля и хеджирование, не только для обеспечения эффективной доходности портфеля, но и для защиты этой доходности от неблагоприятных движений на фондовом рынке.

Инфографика корреляции и ковариации

Давайте посмотрим на главную разницу между корреляцией и ковариацией.

Корреляция и ковариация инфографики

Ключевые отличия

  • Ковариация — это показатель степени изменения двух случайных величин относительно друг друга. С другой стороны, корреляция измеряет силу этой связи. Величина корреляции ограничена сверху +1, а снизу -1. Таким образом, это определенный диапазон. Однако диапазон ковариации неопределен. Может принимать любое положительное или отрицательное значение (теоретически диапазон от -∞ до + ∞). Вы можете быть уверены, что корреляция 0,5 больше, чем 0,3, и первый набор чисел (с корреляцией 0,5) более зависим друг от друга, чем второй набор (с корреляцией 0,3). Интерпретировать такой результат с помощью ковариационных расчетов будет сложно.
  • Изменение масштаба влияет на ковариацию. Например, если значение двух переменных умножается на одинаковые или разные константы, это влияет на вычисленную ковариацию этих двух чисел. Однако применение того же механизма корреляции умножение на константы не меняет предыдущий результат. Это связано с тем, что изменение масштаба не влияет на корреляцию.
  • В отличие от ковариации, корреляция — это безразмерная мера взаимозависимости двух переменных. Это упрощает сравнение вычисленных значений корреляции между любыми двумя переменными независимо от их единиц измерения и размеров.
  • Ковариацию можно рассчитать только для двух переменных. С другой стороны, корреляцию можно рассчитать для нескольких наборов чисел. Еще один фактор, который делает корреляцию желательной для аналитиков по сравнению с ковариацией.

Ковариация против сравнительной таблицы корреляции

Основа Ковариация Корреляция
Имея в виду Ковариация — это показатель степени зависимости двух случайных величин друг от друга. Более высокое число означает более высокую зависимость. Корреляция — это показатель того, насколько сильно связаны эти две переменные, при условии, что другие условия постоянны. Максимальное значение +1, что означает идеальную зависимость.
Отношения Корреляцию можно вывести из ковариации. Корреляция обеспечивает меру ковариации по стандартной шкале. Он выводится путем деления вычисленной ковариации на стандартное отклонение.
Значения Значение ковариации лежит в диапазоне от -∞ до + ∞. Корреляция ограничена значениями в диапазоне от -1 до +1.
Масштабируемость Влияет на ковариацию На корреляцию не влияет изменение шкалы или умножение на константу.
Единицы Ковариация имеет определенную единицу, поскольку она выводится путем умножения двух чисел и их единиц. Корреляция — это безразмерное абсолютное число от -1 до +1, включая десятичные значения.

Заключение

Корреляция и ковариация очень тесно связаны друг с другом, но все же сильно отличаются. Ковариация определяет тип взаимодействия, но корреляция определяет не только тип, но и силу этой связи. По этой причине корреляцию часто называют частным случаем ковариации. Однако, если нужно выбирать между двумя, большинство аналитиков предпочитают корреляцию, поскольку на нее не влияют изменения размеров, местоположения и масштаба. Кроме того, поскольку он ограничен диапазоном от -1 до +1, полезно проводить сравнения между переменными по доменам. Однако важным ограничением является то, что обе эти концепции измеряют единственную линейную зависимость.

УЗНАТЬ БОЛЬШЕ >>

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован.