Регрессия
Что такое регрессия?
Регрессионный анализ — это основанное на статистике измерение, используемое в финансах, инвестициях и т. д. с целью установления взаимосвязи между зависимой переменной и другими независимыми переменными. Основное внимание уделяется определению силы вышеупомянутых отношений.
Оглавление
Пояснения
- Чтобы объяснить регрессионный анализ простыми словами, предположим, что руководитель отдела продаж компании изо всех сил пытается спрогнозировать продажи на следующий месяц. На продажи продукта влияют многочисленные факторы, начиная от погоды и заканчивая новой стратегией конкурента, фестивалем и изменением образа жизни потребителей.
- Это метод выравнивания нескольких факторов, влияющих на продажу, которые оказывают наибольшее влияние. Это может помочь ответить на многие вопросы, например, какие факторы являются наиболее важными, какие менее важными, какова взаимосвязь между ними и, что наиболее важно, какова уверенность этих факторов.
- Эти факторы называются переменными. Основным фактором, который мы пытаемся спрогнозировать, является зависимая переменная, а другими факторами, влияющими на зависимую переменную, являются независимые переменные. выходное значение (т. е. конечная цель), которое измеряется в математическом, статистическом или финансовом моделировании. Подробнее.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Формула
Простой линейный регрессионный анализ в ExcelЛинейная регрессия Анализ в ExcelЛинейная регрессия — это статистический инструмент Excel, который используется в качестве модели прогнозного анализа для изучения взаимосвязи между двумя наборами данных. Используя этот анализ, мы можем оценить взаимосвязь между зависимой и независимой переменными. Подробнее можно выразить в виде приведенной ниже формулы, измеряющей взаимосвязь между зависимой переменной и одной независимой переменной.
Y = а + bX + ϵ
Здесь:
- Y- Зависимая переменная
- ИКС – Независимая (пояснительная) переменная
- а – Перехват
- б – Склон
- ϵ – Остаток (ошибка)
Как интерпретировать регрессионный анализ?
Можно интерпретировать это, предполагая простой сценарий. Мы берем связь между ценами на антикварную коллекцию, выставленную на аукцион, и ее возрастом. Чем старше становится антиквариат, тем выше его цена. Предполагая, что мы установили данные для последних 50 предметов, выставленных на аукцион, мы можем предсказать будущие аукционные цены на основе возраста предмета. Используя эти данные, мы можем построить уравнение регрессии.
Формула регрессииФормула регрессииФормула регрессии используется для оценки взаимосвязи между зависимой и независимой переменными и для определения того, как изменение независимой переменной влияет на зависимую переменную. Y = a + b X +читать дальше, который может установить связь между возрастом и ценой, выглядит следующим образом:
y = β0 + β1 x + ошибка
- Здесь зависимым фактором является Y. Д представляет собой цену каждого предмета, выставленного на аукцион, тогда как независимым фактором является X, который определяет возраст.
- Параметры β0 и β1 неизвестны и будут оцениваться по уравнению.
- б0 — константа, определяющая линейную линию тренда и пересекающая ось Y.
- б1 является константой, которая демонстрирует величину изменения значения зависимой переменной как связанную функцию изменения, связанного с независимыми переменными.
- Это называется наклоном уравнения. Когда наклон линейный, существует пропорциональная связь между возрастом и ценой, а когда наклон обратный, это означает, что связь косвенно пропорциональна.
ошибка может быть определен как шум или изменение целевой переменной и является случайным.
Реальные примеры регрессионного анализа
Предположим, нам нужно установить связь между продажами и суммой, потраченной на рекламу, связанную с продуктом.
В целом мы можем наблюдать положительную связь между объемом продаж и суммой, потраченной на рекламу. Сопоставив простое уравнение линейной регрессии, мы получили:
Y = а + bX
Предположим, мы получаем значение как
Y= 500 +30X
Интерпретация результата:
Прогнозируемый наклон 30 помогает нам заключить, что средние продажи увеличиваются на 30 долларов в год по мере увеличения расходов на рекламу.
Типы регрессионного анализа
#1 – Линейный
Это можно выразить в виде приведенной ниже формулы. Он измеряет отношение между зависимой переменной и одной независимой переменной.
#2 – Полиномиальный
Этот метод использует анализ для измерения взаимосвязи между отдельными зависимыми факторами и несколькими независимыми переменными.
#3 – Логистика
Здесь зависимый фактор или переменная являются бинарными. Независимые переменные могут быть непрерывными или бинарными. Мы можем позволить себе иметь более двух категорий в полиномиальной логистической регрессии при выборе нашей независимой переменной.
#4 – Квантиль
Это аддитивная концепция линейной регрессии, и ее используют в основном, когда в данных присутствуют выбросы и асимметрия.
#5 – Эластичная сетка
Это полезно, когда вы имеете дело с очень сильно коррелированными независимыми переменными.
# 6 – Регрессия основных компонентов (PCR)
Этот метод применим, когда слишком много независимых переменных или мультиколлинеарность. Мультиколлинеарность. Мультиколлинеарность — это статистическое явление, при котором две или более переменных в регрессионной модели настолько зависят друг от друга, что одна из них может быть линейно предсказана по другой с высокой точностью. Он чаще всего используется в наблюдательных исследованиях и реже используется в экспериментальных исследованиях.
# 7 – Частичный метод наименьших квадратов (PLS)
Это противоположно главному компоненту, где у нас есть сильно коррелированные независимые переменные. Это также применимо, когда есть много независимых переменных.
#8 – Вектор поддержки
Он может обеспечить решение линейных и нелинейных моделей. Он использует нелинейные функции ядра, чтобы найти оптимальное решение для нелинейных моделей.
#9 – Порядковый номер
Это относится к предсказанию ранжированных значений. Подходит, когда зависимая переменная порядковая.
# 10 – Пуассон
Это применимо, когда зависимая переменная имеет данные счета.
#11 – Отрицательный бином
Он также применим для управления данными подсчета только потому, что отрицательная биномиальная регрессия не предполагает, что распределение подсчета имеет дисперсию, равную его среднему значению. Напротив, регрессия Пуассона предполагает, что дисперсия равна ее среднему значению.
# 12 – Квази Пуассон
Это замена отрицательной биномиальной регрессии. Это также применимо к рассредоточенным данным подсчета. Дисперсия квазипуассоновской модели является линейной функцией среднего, тогда как дисперсия отрицательной биномиальной модели является квадратичной функцией среднего.
#13 – Кокс
Он больше используется для анализа данных о времени до события.
Разница между регрессией и корреляцией
- Регрессия устанавливает связь между независимой дисперсией и зависимой переменной, когда обе переменные различны. Напротив, корреляция определяет связь или зависимость двух переменных там, где нет различий.
- Основная цель регрессии — создать линию наилучшего соответствия, а оценка одной переменной выполняется на основе других. В то же время корреляция демонстрирует линейную связь. Линейная связь. Линейная связь описывает отношение между двумя различными переменными — x и y — в виде прямой линии на графике. При представлении линейной зависимости с помощью уравнения значение y получается через значение x, отражая их корреляцию между двумя переменными.
- При этом мы оцениваем величину определенного изменения распознанной переменной (X) по оценочной переменной (Y). При корреляции коэффициент измеряет степень, в которой две переменные движутся вместе.
- Это процесс оценки величины случайных независимых переменных на основе величины статической зависимой переменной. Напротив, корреляция помогает нам определить конкретное значение, чтобы выразить взаимозависимость между переменными.
Заключение
- Регрессионный анализРегрессионный анализРегрессионный анализ показывает, как изменятся зависимые переменные, когда одна или несколько независимых переменных изменяются под действием факторов, и используется для анализа связи между зависимыми и независимыми переменными. Формула Y = a + bX + E. Читать далее в первую очередь использует данные для установления взаимосвязи между двумя или более переменными. Предполагается, что прошлые отношения также отразятся в настоящем или будущем. Однако мало кто считает это временным лагом между прошлым и настоящим/будущим.
- Тем не менее, это широко используемый метод прогнозирования и оценки. Хотя он включает математику, которая может показаться сложной для многих пользователей, этот метод сравнительно прост в использовании, особенно при наличии модели.
Рекомендуемые статьи
Эта статья представляет собой руководство о том, что такое регрессия и ее значение. Здесь мы обсуждаем разницу между регрессионным анализом и корреляцией, а также типы и примеры. Вы можете узнать больше из следующих статей: –
- Нелинейная регрессия в Excel
- Асимметрия Значение
- Примеры линейной регрессии
- Формула множественной регрессии
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)