гетероскедастичность


Определение гетероскедастичности

Тест гетероскедастичности относится к неравномерной дисперсии в последовательности переменных. Его также называют ошибкой. В идеале исследователям нужна гомоскедастичность или однородность дисперсии. Однородная дисперсия объясняет предположение исследователя.

Искусственный интеллект поможет тебе заработать!

Подписывайся на канал "Виртуальный Каппер" и получай точные и бесплатные прогнозы на спорт от искусственного интеллекта.

гетероскедастичность

Конусообразная форма видна, когда гетероскедастическая дисперсия нанесена на график. Это изображает ошибки в дисперсии. Большинство реальных данных демонстрируют гетероскедастичность. Более вероятен неравный разброс — это становится проблемой для допущений регрессии. Исследователи изменяют статистическую модель, пытаясь найти лучшие результаты.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Оглавление

Ключевые выводы

  • Гетероскедастичность обычно относится к неравному рассеянию точек данных. В результате наблюдаемые значения отклоняются от предсказанных значений неравномерно.
  • Существует два подтипа: чистая и нечистая гетероскедастическая дисперсия. Такие статистические ошибки характерны для больших диапазонов и перекрестных исследований.
  • Гетероскедастическая дисперсия снижает точность коэффициента вариации — аналитики должны переработать или улучшить свою модель, чтобы определить большую точность.
  • Некоторые регрессионные модели склонны к гетероскедастической дисперсии. Аналитики пытаются решить такие ошибки, изменяя зависимую переменную.

Объяснение гетероскедастичности

Гетероскедастичность в переводе с греческого означает данные с различной дисперсией. Например, в статистике, если последовательность случайных величин имеет одинаковую конечную дисперсию, это называется гомоскедастической дисперсией; если последовательность не имеет одинаковой дисперсии, она известна как гетероскедастическая дисперсия.

Дисперсия — это средство описания степени распределения данных вокруг центрального значения или точки. Более низкая дисперсия указывает на более высокую точность измерения данных, тогда как более высокая дисперсия означает более низкую точность.

гетероскедастичность

Остаточный разброс отображается на графике для визуализации корреляции между данными и конкретной статистической моделью. Если дисперсия гетероскедастична, это рассматривается как проблема. Исследователи ищут гомоскедастичность. Точки данных должны иметь постоянную дисперсию, чтобы удовлетворить предположение исследователя.

На остаточных графиках гетероскедастичность регрессии имеет конусообразную форму. На точечных диаграммах дисперсия увеличивается с увеличением подобранного значения. Для перекрестных исследований, таких как доход, диапазон варьируется от бедности до граждан с высоким доходом; при нанесении на график данные гетероскедастичны.

Гетероскедастичность подразделяется на два типа.

  1. Чистая гетероскедастичность
  2. Нечистая гетероскедастичность

В чистой гетероскедастической дисперсии выбранная статистическая модель верна. Но при этом наблюдаются нечистые (остаточные) гетероскедастические дисперсионные ошибки — в результате статистическая модель для заданных данных неверна. Эти ошибки вызывают дисперсию.

Методы

Существует три метода исправления гетероскедастичности и улучшения модели:

  1. Переопределение переменных
  2. Взвешенная регрессия
  3. Преобразование зависимой переменной

В первом методе аналитик может переопределить переменные, чтобы улучшить модель и получить желаемые результаты с большей точностью. Во втором методе регрессионный анализ соответствующим образом взвешивается. Наконец, третий подход заключается в замене работы в каждой модели. Например, есть зависимая переменная и предикторная переменная; при изменении зависимой переменной вся модель обновляется. Таким образом, это важный подход к продвижению вперед.

Независимые переменные, используемые в регрессионном анализе, называются переменными-предикторами. Переменная-предиктор предоставляет информацию о связанной зависимой переменной относительно конкретного результата.

Крайне важно определить, демонстрируют ли данные чистую гетероскедастическую дисперсию или нечистую гетероскедастическую дисперсию — подход различается для каждого подтипа. Кроме того, важно улучшить переменные, используемые в нечистой форме. Если их игнорировать, эти переменные вызывают смещение в точности коэффициентов, и p-значения становятся меньше, чем должны быть.

Причины

Гетероскедастическая дисперсия обусловлена ​​следующими причинами.

  • Это происходит в наборах данных с большими диапазонами и колеблется между наибольшими и наименьшими значениями.
  • Это происходит из-за изменения пропорциональности факторов.
  • Среди других причин характер переменной может быть основной причиной.
  • В основном это происходит в перекрестных исследованиях.
  • Некоторые регрессионные модели склонны к гетероскедастической дисперсии.
  • Это может быть вызвано неправильным выбором регрессионных моделей.
  • Это также может быть вызвано формированием набора данных и неэффективностью вычислений.

Примеры

Пример №1

Самый простой гетероскедастический пример — потребление домохозяйств. Разница в потреблении увеличивается с ростом дохода — прямо пропорционально. Потому что, когда доход низок, дисперсия в потреблении также низка. Люди с низким доходом тратят преимущественно на предметы первой необходимости и счета — меньше дисперсии. Напротив, с увеличением дохода люди склонны покупать предметы роскоши и приобретают множество привычек, менее предсказуемых.

Пример #2

Примером гомоскедастичности является тренер, сопоставляющий количество пробежек, набранных каждым игроком, со временем, проведенным на тренировках. В этом случае баллы станут зависимой переменной, а время обучения — переменной-предиктором.

Пример №3

В основном гетероскедастичность применяется на фондовом рынке — сравнивается дисперсия запасов на разные даты. Кроме того, инвесторы используют гетероскедастическую дисперсию в регрессионных моделях для отслеживания ценных бумаг и портфелей. Гетероскедастическая дисперсия может или не может быть предсказана в зависимости от конкретной ситуации, рассматриваемой в исследовании.

Например, когда цены на продукт изучаются при запуске новой модели, гетероскедастичность предсказуема. Но для сравнения осадков или доходов характер дисперсии нельзя предсказать.

Гомоскедастичность против гетероскедастичностигород

  • Гомокедастичность относится к равной дисперсии остатков. С другой стороны, неравная дисперсия остатков вызывает гетероскедастическую дисперсию. В регрессионном анализе термин «остаток» относится к разнице между наблюдаемыми и прогнозируемыми данными.
  • При использовании регрессионных моделей исследователи обращают внимание на гомоскедастическую дисперсию. Таким образом, гетероскедастическая дисперсия рассматривается как проблема, требующая решения.
  • Гомоскедастичность встречается редко, тогда как гетероскедастическая дисперсия обычно наблюдается в реальных примерах.
  • Гомоскедастичность также называют однородностью дисперсии. С другой стороны, гетероскедастичность часто называют «ошибкой».
  • Гомоскедастичность не классифицируется, но гетероскедастическая дисперсия имеет подтипы — чистый и нечистый.

Часто задаваемые вопросы (FAQ)

1. Что такое гетероскедастичность простыми словами?

Это неравное отклонение наблюдаемых данных от прогнозируемых данных. На графике видна конусообразная форма, показывающая неравную дисперсию остатка. Гетероскедастическая дисперсия может быть предсказана в определенных сценариях — в зависимости от приложения.

2. Что такое гетероскедастичность в регрессии?

В регрессионном анализе невязка показывает неравномерный разброс дисперсии вокруг измеренных значений и поэтому считается ошибкой. Гетероскедастическая дисперсия очень часто наблюдается в данных регрессии, включающих большие диапазоны. Выбор модели регрессии играет ключевую роль в дисперсии. Некоторые статистические модели подвержены ошибкам. Данные и выбранная статистическая модель должны подходить друг другу.

3. Что вызывает гетероскедастичность?

Это вызвано большим количеством наборов данных и перекрестных исследований. Это также может быть вызвано неправильным выбором — некоторые регрессионные модели склонны к гетероскедастической дисперсии. Кроме того, это может быть вызвано характером выбранных переменных.

Это руководство по гетероскедастичности и ее определению. Мы объясним это в регрессии на примерах и сравним с гомоскедастичностью. Подробнее об этом вы можете узнать из следующих статей —

  • Лучшие книги по эконометрике
  • Выведенный статистика
  • Описательная статистика

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *