Мультиколлинеарность

Определение мультиколлинеарности

Мультиколлинеарность относится к статистическому явлению, при котором две или более независимых переменных сильно коррелируют. Он отмечает почти идеальное или точное соотношение между предикторами. Эта сильная корреляция между исследовательскими переменными является одной из основных проблем линейного регрессионного анализа.

В линейном регрессионном анализе никакие две переменные или предикторы не могут каким-либо образом иметь точное отношение. Таким образом, когда возникает мультиколлинеарность, это негативно влияет на модель регрессионного анализа, и исследователи получают недостоверные результаты. Следовательно, обнаружение такого явления заранее экономит время и усилия исследователей.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Оглавление

Определение мультиколлинеарности

Мультиколлинеарность относится к статистическому случаю, который возникает, когда две или более независимые переменные сильно коррелируют друг с другом.
Коллинеарность означает, что одной переменной достаточно, чтобы объяснить или повлиять на другую переменную/переменные, используемые в линейном регрессионном анализе.
Согласно допущению регрессионного анализа, коллинеарность является серьезной проблемой для исследователей, поскольку влияние одной переменной на другую может сделать регрессионную модель сомнительной.
Он находит актуальность в различных нишах, включая инвестиции на фондовом рынке, науку о данных и программу бизнес-аналитики.

Объяснение мультиколлинеарности

Мультиколлинеарность в регрессии используется в обсервационных исследованиях, а не в экспериментальных. Основная причина этого заключается в предположении, что появление любого экземпляра коллинеарности, вероятно, повлияет на регрессионный анализ. Регрессионный анализ. зависимые и независимые переменные. Y = a + bX + E — это формула. подробнее и ее результаты. Таким образом, когда две или более переменных сильно коррелируют и возникает мультиколлинеарность, это становится серьезной проблемой для исследователей или статистиков.

Во-первых, при корреляции переменных это явление вызывает колебание значений коэффициентов, сопровождающих независимые переменные. конечная цель), которая измеряется в математическом, статистическом или финансовом моделировании. Короче говоря, даже самые незначительные изменения в модели влияют на коэффициенты. Во-вторых, коллинеарность сильно влияет на точность коэффициентов. В результате статистическая мощность линейной регрессииЛинейная регрессияЛинейная регрессия представляет собой взаимосвязь между одной зависимой переменной и одной или несколькими независимыми переменными. Примерами линейной регрессии являются взаимосвязь между ежемесячными продажами и расходами, уровнем IQ и результатами тестов, ежемесячными температурами и продажами кондиционеров, населением и мобильными продажами. Модель становится сомнительной, поскольку индивидуальная сила или усилия переменных остаются неопределенными.

Причины

Проведение тест мультиколлинеарности помогает в легком обнаружении такого явления. Некоторые из причин, вызывающих коллинеарность, включают:

Выбор сделан

Первое, что нужно иметь в виду, — это выбрать подходящие вопросы для обнаружения случаев коллинеарности в модели. Во-вторых, выбор зависимых переменных имеет решающее значение, поскольку они могут не подходить для данного сценария. Выбранный набор данных также играет большую роль в определении коллинеарности. Следовательно, исследователи должны выбирать правильно спланированные эксперименты с улучшенными данными наблюдений, которыми трудно манипулировать.

Использование переменных

Другой причиной такого явления является неправильное использование переменных. Следовательно, исследователи должны проявлять осторожность при исключении или включении задействованных переменных, чтобы избежать случаев коллинеарности. Кроме того, исследователи должны избегать повторения переменных в модели.

Если пользователи включают одни и те же переменные с разными именами или переменную, которая объединяет две другие переменные в модели, это неправильное использование переменной. Например, когда общий инвестиционный доход включает две переменные – доход, полученный от акций и облигацийОблигацииОблигации относятся к долговым инструментам, выпущенным правительствами или корпорациями для приобретения средств инвесторов на определенный период.Подробнее и процентный доход от сбережений – общий доход от инвестиций представляется как переменная может нарушить всю модель.

Степень корреляции

Основной причиной является сильная корреляция между переменными. Это означает, что одна переменная существенно влияет на другую в регрессионной модели. В результате вся модель может не дать надежных результатов. Степень мультиколлинеарности определяется относительно стандарта допуска, который представляет собой процент от коэффициента инфляции дисперсии (VIF).

Если коэффициент инфляции мультиколлинеарности дисперсии равно 4, что указывает на допуск 0,25 или ниже, может возникнуть явление. С другой стороны, если оно равно 10 и 0,1 или меньше соответственно, мультиколлинеарность наверняка существует.

Типы мультиколлинеарности

Мультиколлинеарность существует в четырех типах:

Высокая мультиколлинеарность: это означает высокую или сильную корреляцию между двумя или более независимыми переменными, но не идеальную.
Идеальная мультиколлинеарность: Эта степень коллинеарности указывает на точное линейное отношение. Линейное отношение. Линейное отношение описывает отношение между двумя различными переменными — x и y — в виде прямой линии на графике. При представлении линейной зависимости с помощью уравнения значение y получается через значение x, отражая их корреляцию между двумя или более независимыми переменными.
Мультиколлинеарность на основе данных: возможность коллинеарности в этом случае возникает из выбранного набора данных.
Структурная мультиколлинеарность: Эта проблема возникает, когда у исследователей плохо разработана основа для регрессионного анализа.

Примеры

Рассмотрим следующее примеры мультиколлинеарности понять применимость концепции:

Пример 1

Фармацевтическая компания нанимает ABC Ltd, KPO, для предоставления исследовательских услуг и статистического анализа заболеваний в Индии. Последний в качестве параметров prima facie выбрал возраст, вес, профессию, рост и здоровье.

В приведенном выше примере существует ситуация коллинеарности, поскольку независимые переменные напрямую коррелируют с результатами. Следовательно, рекомендуется сначала настроить переменные перед началом любого проекта, поскольку они могут напрямую повлиять на результаты.

Пример 2

Эта концепция важна на фондовом рынке, где рыночные аналитики используют инструменты технического анализа для определения ожидаемых колебаний цен на активы. Они избегают любых индикаторов или переменных, которые, кажется, устанавливают коллинеарность. Это связано с тем, что аналитики стремятся выяснить влияние каждого фактора на рынок по-разному с разных сторон.

Средства

Обнаружение мультиколлинеарности меняет всю структуру и устройство, подготовленное для проведения наблюдательного исследования. Короче говоря, исследователям приходится начинать все с нуля. Поэтому вот список нескольких способов решения проблемы:

Поскольку нехватка данных может вызвать проблему коллинеарности, полезно собрать больше данных.
Для тех переменных, которые с меньшей вероятностью представляют изучаемую ситуацию, лучше удалить из набора предикторы.
Если есть возможность пренебречь степенью коллинеарности, учитывая ее меньшее значение, надо не нарушать расположение и продолжать с тем же.
Хотя мультиколлинеарность влияет на коэффициенты, она не влияет на прогнозы. Таким образом, если исследователи стремятся только делать прогнозы, им не нужно сильно сосредотачиваться на корреляции переменных.

Часто задаваемые вопросы (FAQ)

Что такое мультиколлинеарность?

Это статистическое явление, которое возникает, когда две или более независимых переменных, используемых в регрессионном анализе, сильно или сильно коррелируют. Этот метод используется в обсервационных исследованиях, а не в экспериментальных, учитывая его влияние на общую модель регрессии. Он находит важное значение в инвестициях на фондовом рынке, науке о данных, программе бизнес-аналитики и т. Д.

Почему мультиколлинеарность является проблемой?

Это считается одной из основных проблем линейного регрессионного анализа, поскольку сильная корреляция между переменными влияет на их значение и изменяется так же, как и при изменении значения другой переменной. Это, в свою очередь, влияет на всю композицию, подготовленную для анализа исследователями. Таким образом, перед проведением регрессионного анализа рекомендуется выявить любые возможности коллинеарности.

Как обнаружить мультиколлинеарность?

Лучший способ обнаружить коллинеарность в модели линейной регрессии — это мультиколлинеарный коэффициент инфляции дисперсии (VIF), рассчитанный для определения стандарта допуска и оценки степени коллинеарности. Например, если VIF равен 4, что указывает на допуск 0,25 или ниже, существует вероятность того, что это явление произойдет. С другой стороны, если он равен 10 и 0,1 или ниже соответственно, мультиколлинеарность наверняка будет существовать.

Мультиколлинеарность

Определение мультиколлинеарности