Примеры линейной регрессии
Что такое линейная регрессия?
Линейная регрессия — это метод статистического моделирования, который показывает взаимосвязь между одной зависимой переменной и одной или несколькими независимыми переменными. Это один из самых распространенных видов прогнозного анализа. Этот тип распределения формируется в виде линии, называемой линейной регрессией. В этой статье будут рассмотрены примеры линейного регрессионного анализа в Excel.
Чтобы выполнить линейный регрессионный анализ, во-первых, нам нужно добавить Надстройки Excel Надстройки ExcelНадстройка — это расширение, добавляющее дополнительные функции и параметры к существующему Microsoft Excel. Узнайте больше, выполнив следующие шаги.
Оглавление
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Нажмите «Файл» — «Параметры» (откроется всплывающее окно «Параметры Excel»).
SS: Сумма квадратов.
РС: у нас два МС
- Регрессия MS представляет собой регрессию SS/регрессию Df.
- Остаточная MS представляет собой среднеквадратичную ошибку (Residual SS / Residual Df).
Ф: F-критерий для нулевой гипотезыНулевая гипотезаНулевая гипотеза предполагает, что выборочные данные и данные населения не имеют различий, или, говоря простыми словами, он предполагает, что утверждение, сделанное человеком в отношении данных или населения, является абсолютной истиной и всегда верно. Таким образом, даже если выборка будет взята из генеральной совокупности, результат, полученный при изучении выборки, будет таким же, как и предположение. Читать дальше.
Значение F: P-значения, связанные со значением
Коэффициент: Коэффициент дает вам оценку метода наименьших квадратов.
T Статистика: T Статистика для нулевой гипотезы по сравнению с альтернативной гипотезой.
P-значение: Это p-значение для проверки гипотезы.
Нижние 95% и верхние 95%: Это нижняя граница и верхняя граница доверительного интервала. Доверительный интервал = среднее значение выборки ± критический фактор × стандартное отклонение выборки. читать далее
Вывод остатков.: У нас есть 12 наблюдений, основанных на данных. Во втором столбце представлены «Прогнозируемые» продажи, а в третьем — «Остатки». Остатки — это разница прогнозируемых продаж от фактических.
Пример#2
Выберите прогнозируемый столбец продаж и маркетинга.
Перейдите в группу диаграмм на вкладке «Вставка». Затем выберите значок диаграммы «Scatter».
Он вставит точечную диаграмму в excelInsert. Точечная диаграмма в Excel. Точечная диаграмма в Excel — это двухмерный тип диаграммы для представления данных. Оси X и Y, которые связаны друг с другом, эта диаграмма в основном используется в исследованиях корреляции и регрессионных исследованиях данных. Подробнее. См. изображение ниже.
Щелкните правой кнопкой мыши в любой точке, затем выберите Добавить линию тренда в excelЛиния тренда В ExcelЛиния тренда, часто называемая линией наилучшего соответствия, отображает тренд данных. Он показывает общую тенденцию, шаблон или направление на основе доступных точек данных.Подробнее. Это добавит линию тренда на ваш график.
- Вы можете отформатировать линию тренда, щелкнув правой кнопкой мыши в любом месте линии тренда и выбрав формат линии тренда.
- Вы можете внести дополнительные улучшения в диаграмму. т. е. форматирование линии тренда, изменение цвета и заголовка и т. д.
- Вы также можете отобразить формулу на графике, проверив формулу на графике и отобразив значение R-квадрата.
Еще несколько примеров линейного регрессионного анализа:
- Прогнозы продажи зонтов основаны на дожде, который произошел в этом районе.
- Прогноз продаж кондиционера на основе температуры летом.
- В сезон экзаменов увеличились продажи канцтоваров, в основном, руководств по экзаменам.
- Прогнозирование продаж после размещения рекламы на основе высокого TRP, где размещается реклама, популярности представителя бренда и количества посетителей в месте размещения, где публикуется реклама.
- Продажа дома в зависимости от местности, площади и цены.
Пример №3
Предположим, у нас есть девять учеников с их уровнем IQ и числом, которое они набрали на тесте.
СтудентОценка за тестIQРам100145Шьям97140Кул93130Каппу91125Раджу89115Вишал86110Вивек82100Винай7895Кумар7590
Шаг 1: Сначала найдите зависимые и независимые переменные. Здесь результат теста является зависимой переменной, а IQ — независимой переменной, поскольку результат теста меняется по мере изменения IQ.
Шаг 2: Перейдите на вкладку «Данные» — нажмите «Анализ данных» — выберите «Регрессия» — нажмите «ОК».
Это откроет для вас окно «Регрессия».
Шаг 3. Введите диапазон результатов теста в поле «Входной диапазон Y» и IQ в поле «Входной диапазон X». (Отметьте «Ярлыки», если в вашем диапазоне данных есть заголовки. Выберите параметры вывода, затем проверьте нужные остатки. Нажмите «ОК».)
Вы получите итоговый результат, показанный на изображении ниже.
Шаг 4: Анализ регрессии по сводному выводу.
Сводный вывод
Несколько R: Здесь коэффициент корреляции равен 0,99, что очень близко к 1, что означает, что линейная зависимость очень положительная.
R-квадрат: Значение R-Square равно 0,983, что означает, что 98,3% значений соответствуют модели.
P-значение: Здесь P-значение составляет 1,86881E-07, что намного меньше 0,1. Это означает, что IQ имеет значительные прогностические значения.
См. диаграмму ниже.
Вы можете видеть, что почти все точки падают на линию или близлежащую линию тренда.
Пример №4
Нам нужно спрогнозировать продажи кондиционеров на основе продаж и температуры в другом месяце.
МесяцТемператураПродажиЯнв 2538893Фев2842254Мар3142845Апр3347917Май3751243Июн4069588Июль3856570Авг3750000
Выполните следующие шаги, чтобы получить результат регрессии.
Шаг 1: Сначала найдите зависимые и независимые переменные. Продажи — это зависимая переменная, а температура — независимая переменная, поскольку продажи меняются при изменении температуры.
Шаг 2: Перейдите на вкладку «Данные» — нажмите «Анализ данных» — выберите «Регрессия» — нажмите «ОК».
Это откроет для вас окно регрессии.
Шаг 3. Введите продажи в поле «Входной диапазон Y» и Temp в поле «Входной диапазон X». (Отметьте «Ярлыки», если в вашем диапазоне данных есть заголовки. Выберите параметры вывода, затем проверьте нужные остатки. Нажмите «ОК».
Это даст вам итоговый вывод, как показано ниже.
Шаг 4: Проанализируйте результат.
Несколько R: Здесь коэффициент корреляции равен 0,877, около 1, что означает линейную связь. Линейная связь. Линейная связь описывает отношение между двумя различными переменными — x и y — в виде прямой линии на графике. При представлении линейной зависимости с помощью уравнения значение y выводится через значение x, отражая их корреляцию. Читать далее положительно.
R-квадрат: Значение R-Square равно 0,770, что означает, что 77% значений соответствуют модели.
P-значение: Здесь P-значение составляет 1,86881E-07, что намного меньше 0,1. Это означает, что IQ имеет значительные прогностические значения.
Пример №5
Теперь давайте проведем регрессионный анализ для нескольких независимых переменных:
Во-первых, вам нужно спрогнозировать продажи мобильного телефона, который будет запущен в следующем году. Затем у вас есть цена и население стран, влияющих на продажи мобильных телефонов.
Выполните следующие шаги, чтобы получить результат регрессии.
Мобильная версияПродажиКоличествоНаселениеUS63860858823UK61841877660KZ60876873631CH58188726842HN52728864573AU52388680809NZ51075728661RU49019689778
Шаг 1. Сначала найдите зависимые и независимые переменные. Здесь продажи являются зависимой переменной, как количество и население. Оба являются независимыми переменными, поскольку объем продаж зависит от количества и численности населения страны.
Шаг 2. Перейдите на вкладку «Данные» — нажмите «Анализ данных» — выберите «Регрессия» — нажмите «ОК».
Это откроет для вас окно регрессии.
Шаг 3. Введите продажи в поле «Входной диапазон Y» и выберите количество и население в поле «Входной диапазон X». (Отметьте «Ярлыки», если в вашем диапазоне данных есть заголовки. Выберите параметры вывода, затем проверьте нужные остатки. Нажмите «ОК».
Запустите регрессию, используя анализ данных на вкладке «Данные». Это даст вам следующий результат.
Сводный вывод
Несколько R: Здесь коэффициент корреляцииКоэффициент корреляцииКоэффициент корреляции, иногда называемый коэффициентом взаимной корреляции, представляет собой статистическую меру, используемую для оценки силы взаимосвязи между двумя переменными. Его значения варьируются от -1,0 (отрицательная корреляция) до +1,0 (положительная корреляция). Читать дальше составляет 0,93, что очень близко к 1, что означает, что линейная связь очень положительна.
R-квадрат: Значение R-Square равно 0,866, что означает, что 86,7% значений соответствуют модели.
Значение F: Значимость F меньше 0,1, что означает, что уравнение регрессии имеет значительную прогностическую ценность.
P-значение: Если вы посмотрите на P-значение для количества и населения, вы увидите, что значения меньше 0,1, что означает, что количество и население имеют значительные прогностические значения. Меньшее количество P-значений означает, что переменная имеет более значимые прогностические значения.
Однако количество и популяция имеют значительную прогностическую ценность. Тем не менее, если вы посмотрите на P-значение для количества и населения, вы увидите, что количество имеет меньшее P-значение в excelP-значение. В ExcelP-значение или значение вероятности является решающим фактором для нулевой гипотезы для вероятности предполагаемый результат является истинным, принимается или отвергается, и принимается альтернативный результат в случае отклонения предполагаемых результатов. читать больше, чем население. Это означает, что количество имеет более важное прогностическое значение, чем население.
То, что нужно запомнить
- Всякий раз, когда вы выбираете данные, вы всегда должны проверять зависимые и независимые переменные.
- Линейный регрессионный анализ рассматривает взаимосвязь между средним значением переменных.
- Он только моделирует взаимосвязь между линейными переменными.
- Иногда это не лучший вариант для решения реальной проблемы. Например: (возраст и заработная плата). В большинстве случаев заработная плата увеличивается с возрастом. Однако после выхода на пенсию возраст увеличивается, а заработная плата снижается.
Рекомендуемые статьи
Эта статья была руководством по линейной регрессии и ее определению. Здесь мы обсудим, как выполнить линейный регрессионный анализ в Excel с помощью примеров и загружаемого листа Excel. Вы можете узнать больше об Excel из следующих статей: –
- Статистика в Excel
- Доверительный интервал в Excel
- Формула регрессии
- Описательная статистика в Excel
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)