Примеры линейной регрессии


Что такое линейная регрессия?

Линейная регрессия — это метод статистического моделирования, который показывает взаимосвязь между одной зависимой переменной и одной или несколькими независимыми переменными. Это один из самых распространенных видов прогнозного анализа. Этот тип распределения формируется в виде линии, называемой линейной регрессией. В этой статье будут рассмотрены примеры линейного регрессионного анализа в Excel.

Чтобы выполнить линейный регрессионный анализ, во-первых, нам нужно добавить Надстройки Excel Надстройки ExcelНадстройка — это расширение, добавляющее дополнительные функции и параметры к существующему Microsoft Excel. Узнайте больше, выполнив следующие шаги.

Оглавление

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Нажмите «Файл» — «Параметры» (откроется всплывающее окно «Параметры Excel»).

Пример столбца Excel в числа 4.4

SS: Сумма квадратов.

РС: у нас два МС

  • Регрессия MS представляет собой регрессию SS/регрессию Df.
  • Остаточная MS представляет собой среднеквадратичную ошибку (Residual SS / Residual Df).

Ф: F-критерий для нулевой гипотезыНулевая гипотезаНулевая гипотеза предполагает, что выборочные данные и данные населения не имеют различий, или, говоря простыми словами, он предполагает, что утверждение, сделанное человеком в отношении данных или населения, является абсолютной истиной и всегда верно. Таким образом, даже если выборка будет взята из генеральной совокупности, результат, полученный при изучении выборки, будет таким же, как и предположение. Читать дальше.

Значение F: P-значения, связанные со значением

Коэффициент: Коэффициент дает вам оценку метода наименьших квадратов.

T Статистика: T Статистика для нулевой гипотезы по сравнению с альтернативной гипотезой.

P-значение: Это p-значение для проверки гипотезы.

Нижние 95% и верхние 95%: Это нижняя граница и верхняя граница доверительного интервала. Доверительный интервал = среднее значение выборки ± критический фактор × стандартное отклонение выборки. читать далее

Вывод остатков.: У нас есть 12 наблюдений, основанных на данных. Во втором столбце представлены «Прогнозируемые» продажи, а в третьем — «Остатки». Остатки — это разница прогнозируемых продаж от фактических.

Пример#2

Выберите прогнозируемый столбец продаж и маркетинга.

Создайте график линейной регрессии Шаг 1

Перейдите в группу диаграмм на вкладке «Вставка». Затем выберите значок диаграммы «Scatter».

Создайте график линейной регрессии Шаг 2

Он вставит точечную диаграмму в excelInsert. Точечная диаграмма в Excel. Точечная диаграмма в Excel — это двухмерный тип диаграммы для представления данных. Оси X и Y, которые связаны друг с другом, эта диаграмма в основном используется в исследованиях корреляции и регрессионных исследованиях данных. Подробнее. См. изображение ниже.

Создайте график линейной регрессии Шаг 3

Щелкните правой кнопкой мыши в любой точке, затем выберите Добавить линию тренда в excelЛиния тренда В ExcelЛиния тренда, часто называемая линией наилучшего соответствия, отображает тренд данных. Он показывает общую тенденцию, шаблон или направление на основе доступных точек данных.Подробнее. Это добавит линию тренда на ваш график.

Добавить линию трендаДобавить линию тренда 1

  • Вы можете отформатировать линию тренда, щелкнув правой кнопкой мыши в любом месте линии тренда и выбрав формат линии тренда.
  • Вы можете внести дополнительные улучшения в диаграмму. т. е. форматирование линии тренда, изменение цвета и заголовка и т. д.
  • Вы также можете отобразить формулу на графике, проверив формулу на графике и отобразив значение R-квадрата.

Еще несколько примеров линейного регрессионного анализа:

  1. Прогнозы продажи зонтов основаны на дожде, который произошел в этом районе.
  2. Прогноз продаж кондиционера на основе температуры летом.
  3. В сезон экзаменов увеличились продажи канцтоваров, в основном, руководств по экзаменам.
  4. Прогнозирование продаж после размещения рекламы на основе высокого TRP, где размещается реклама, популярности представителя бренда и количества посетителей в месте размещения, где публикуется реклама.
  5. Продажа дома в зависимости от местности, площади и цены.

Пример №3

Предположим, у нас есть девять учеников с их уровнем IQ и числом, которое они набрали на тесте.

СтудентОценка за тестIQРам100145Шьям97140Кул93130Каппу91125Раджу89115Вишал86110Вивек82100Винай7895Кумар7590

Шаг 1: Сначала найдите зависимые и независимые переменные. Здесь результат теста является зависимой переменной, а IQ — независимой переменной, поскольку результат теста меняется по мере изменения IQ.

Шаг 2: Перейдите на вкладку «Данные» — нажмите «Анализ данных» — выберите «Регрессия» — нажмите «ОК».

Пример линейной регрессии 1.3

Это откроет для вас окно «Регрессия».

Окно регрессии

Шаг 3. Введите диапазон результатов теста в поле «Входной диапазон Y» и IQ в поле «Входной диапазон X». (Отметьте «Ярлыки», если в вашем диапазоне данных есть заголовки. Выберите параметры вывода, затем проверьте нужные остатки. Нажмите «ОК».)

Пример линейной регрессии 2.2

Вы получите итоговый результат, показанный на изображении ниже.

Пример линейной регрессии 2.3

Шаг 4: Анализ регрессии по сводному выводу.

Сводный вывод

Несколько R: Здесь коэффициент корреляции равен 0,99, что очень близко к 1, что означает, что линейная зависимость очень положительная.

R-квадрат: Значение R-Square равно 0,983, что означает, что 98,3% значений соответствуют модели.

P-значение: Здесь P-значение составляет 1,86881E-07, что намного меньше 0,1. Это означает, что IQ имеет значительные прогностические значения.

См. диаграмму ниже.

Пример линейной регрессии 2.4

Вы можете видеть, что почти все точки падают на линию или близлежащую линию тренда.

Пример №4

Нам нужно спрогнозировать продажи кондиционеров на основе продаж и температуры в другом месяце.

МесяцТемператураПродажиЯнв 2538893Фев2842254Мар3142845Апр3347917Май3751243Июн4069588Июль3856570Авг3750000

Выполните следующие шаги, чтобы получить результат регрессии.

Шаг 1: Сначала найдите зависимые и независимые переменные. Продажи — это зависимая переменная, а температура — независимая переменная, поскольку продажи меняются при изменении температуры.

Шаг 2: Перейдите на вкладку «Данные» — нажмите «Анализ данных» — выберите «Регрессия» — нажмите «ОК».

Пример линейной регрессии 1.3

Это откроет для вас окно регрессии.

Окно регрессии

Шаг 3. Введите продажи в поле «Входной диапазон Y» и Temp в поле «Входной диапазон X». (Отметьте «Ярлыки», если в вашем диапазоне данных есть заголовки. Выберите параметры вывода, затем проверьте нужные остатки. Нажмите «ОК».

Пример линейной регрессии 3.2

Это даст вам итоговый вывод, как показано ниже.

Пример линейной регрессии 3.3

Шаг 4: Проанализируйте результат.

Несколько R: Здесь коэффициент корреляции равен 0,877, около 1, что означает линейную связь. Линейная связь. Линейная связь описывает отношение между двумя различными переменными — x и y — в виде прямой линии на графике. При представлении линейной зависимости с помощью уравнения значение y выводится через значение x, отражая их корреляцию. Читать далее положительно.

R-квадрат: Значение R-Square равно 0,770, что означает, что 77% значений соответствуют модели.

P-значение: Здесь P-значение составляет 1,86881E-07, что намного меньше 0,1. Это означает, что IQ имеет значительные прогностические значения.

Пример №5

Теперь давайте проведем регрессионный анализ для нескольких независимых переменных:

Во-первых, вам нужно спрогнозировать продажи мобильного телефона, который будет запущен в следующем году. Затем у вас есть цена и население стран, влияющих на продажи мобильных телефонов.

Выполните следующие шаги, чтобы получить результат регрессии.

Мобильная версияПродажиКоличествоНаселениеUS63860858823UK61841877660KZ60876873631CH58188726842HN52728864573AU52388680809NZ51075728661RU49019689778

Шаг 1. Сначала найдите зависимые и независимые переменные. Здесь продажи являются зависимой переменной, как количество и население. Оба являются независимыми переменными, поскольку объем продаж зависит от количества и численности населения страны.

Шаг 2. Перейдите на вкладку «Данные» — нажмите «Анализ данных» — выберите «Регрессия» — нажмите «ОК».

Пример линейной регрессии 1.3

Это откроет для вас окно регрессии.

Окно регрессии

Шаг 3. Введите продажи в поле «Входной диапазон Y» и выберите количество и население в поле «Входной диапазон X». (Отметьте «Ярлыки», если в вашем диапазоне данных есть заголовки. Выберите параметры вывода, затем проверьте нужные остатки. Нажмите «ОК».

Пример линейной регрессии 4.2

Запустите регрессию, используя анализ данных на вкладке «Данные». Это даст вам следующий результат.

Пример линейной регрессии 4.3

Сводный вывод

Несколько R: Здесь коэффициент корреляцииКоэффициент корреляцииКоэффициент корреляции, иногда называемый коэффициентом взаимной корреляции, представляет собой статистическую меру, используемую для оценки силы взаимосвязи между двумя переменными. Его значения варьируются от -1,0 (отрицательная корреляция) до +1,0 (положительная корреляция). Читать дальше составляет 0,93, что очень близко к 1, что означает, что линейная связь очень положительна.

R-квадрат: Значение R-Square равно 0,866, что означает, что 86,7% значений соответствуют модели.

Значение F: Значимость F меньше 0,1, что означает, что уравнение регрессии имеет значительную прогностическую ценность.

P-значение: Если вы посмотрите на P-значение для количества и населения, вы увидите, что значения меньше 0,1, что означает, что количество и население имеют значительные прогностические значения. Меньшее количество P-значений означает, что переменная имеет более значимые прогностические значения.

Однако количество и популяция имеют значительную прогностическую ценность. Тем не менее, если вы посмотрите на P-значение для количества и населения, вы увидите, что количество имеет меньшее P-значение в excelP-значение. В ExcelP-значение или значение вероятности является решающим фактором для нулевой гипотезы для вероятности предполагаемый результат является истинным, принимается или отвергается, и принимается альтернативный результат в случае отклонения предполагаемых результатов. читать больше, чем население. Это означает, что количество имеет более важное прогностическое значение, чем население.

То, что нужно запомнить

  • Всякий раз, когда вы выбираете данные, вы всегда должны проверять зависимые и независимые переменные.
  • Линейный регрессионный анализ рассматривает взаимосвязь между средним значением переменных.
  • Он только моделирует взаимосвязь между линейными переменными.
  • Иногда это не лучший вариант для решения реальной проблемы. Например: (возраст и заработная плата). В большинстве случаев заработная плата увеличивается с возрастом. Однако после выхода на пенсию возраст увеличивается, а заработная плата снижается.

Рекомендуемые статьи

Эта статья была руководством по линейной регрессии и ее определению. Здесь мы обсудим, как выполнить линейный регрессионный анализ в Excel с помощью примеров и загружаемого листа Excel. Вы можете узнать больше об Excel из следующих статей: –

  • Статистика в Excel
  • Доверительный интервал в Excel
  • Формула регрессии
  • Описательная статистика в Excel

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *