Пошаговая регрессия
Что такое пошаговая регрессия?
Пошаговая регрессия — это пошаговый процесс построения модели путем введения или исключения переменных-предикторов. Во-первых, переменные проходят Т-тесты и F-тесты. Затем переменные-предикторы индивидуально проверяются на соответствие модели линейной регрессии.
В процедуре пошагового отбора используются программные пакеты, специально разработанные для тестирования моделей. Некоторые из этих моделей включают сотни переменных. Однако существуют определенные ограничения — ошибки и несоответствия обнаруживаются на этапе статистической значимости. Пошаговая регрессия, Python и другие языки программирования тесно связаны между собой.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Оглавление
Ключевые выводы
- Модель пошаговой регрессии строится постепенно — путем добавления или удаления переменных-предикторов. В основном существует три типа ступенчатой регрессии: прямая, обратная и множественная.
- Обычно пошаговый отбор используется для статистической обработки данных. Пошаговый выбор упрощает сложные модели расчета, вводя только правильные переменные (относящиеся к желаемому результату). Другие переменные отбрасываются.
- «Пошаговый регрессия in r» означает модель для различных подмножеств данных. В SPSS для выполнения остаточного анализа используется пошаговая регрессия; проверяется точность модели.
Объяснение пошаговой регрессии
Ступенчатая регрессия используется для разработки регрессионной модели, чтобы ввести только релевантные и статистически значимые переменные. Другие переменные отбрасываются. Однако каждый расчет регрессии содержит нежелательные переменные. Эти переменные являются прогнозирующими и излишне усложняют процесс.
Таким образом, пошаговый анализ выбора исключает переменные, не относящиеся к модели. Для разделения переменных проводятся F-тесты и Т-тесты. Кроме того, для модели также могут быть выбраны другие тесты, обеспечивающие оптимальное использование.
Регрессия модель описывает отношения между переменными. Данная переменная может быть независимой, зависимой, ответной или целевой переменной. Например, если изучается взаимосвязь между ростом и весом, она называется моделью линейной регрессии.
Логистика ступенчатый регрессия зависит от характера и размера переменных. Эти переменные проходят проверку на соответствие данной модели. Это может занять много времени; каждый человек проверяется независимо. Поэтому аналитики используют пакеты программного обеспечения (предназначенные для автоматического тестирования переменных) для экономии времени.
Весь процесс выполняется по крупицам — переменные сообщаются только тогда, когда они соответствуют заданным параметрам. Этот процесс можно использовать в любой модели линейной или логистической пошаговой регрессии.
Как и следовало ожидать, существует определенная критика этого метода. Например, некоторые статистики считают пошаговый отбор предвзятым; он чрезмерно фокусируется на одной модели.
Типы ступенчатой регрессии
Метод далее подразделяется на следующие подтипы.
#1 – Пошаговая регрессия вперед
Форвардная модель пуста и не содержит переменных. Вместо этого каждая предикторная переменная сначала проверяется, а затем вводится в модель. Сохраняются только те, которые соответствуют критериям статистической значимости.
Этот процесс повторяется до тех пор, пока не будет получен желаемый результат. Это называется прямой регрессией, потому что процесс движется в прямом направлении — тестирование происходит в направлении построения оптимальной модели.
#2 – Обратная ступенчатая регрессия
Это противоположно «прямой регрессии». При использовании обратного подхода модель уже содержит много переменных. Затем каждая переменная подвергается тестированию — переменные, не соответствующие стандартам статистической значимости, отбрасываются. Этот процесс повторяется для всех переменных до тех пор, пока не будет получен желаемый результат.
#3 – Двунаправленная ступенчатая регрессия
Двунаправленный подход представляет собой просто комбинацию прямой и обратной регрессии. Это, естественно, немного сложно. Тем не менее, аналитики используют этот сложный подтип, чтобы сэкономить время, когда присутствует слишком много переменных.
Примеры
Давайте рассмотрим несколько примеров, чтобы лучше понять регрессию.
Пример №1
Джоэл путешествует с одной сумкой — он может нести только определенный вес — тридцать килограммов. В настоящее время багаж Джоэла весит тридцать девять килограммов. Поэтому его просят уменьшить лишний вес, убрав некоторые предметы.
Джоэл открывает свою сумку и теперь в замешательстве; он не уверен, какой предмет следует бросить, а какой взять. Что еще более важно, объем каждого предмета очевиден, но он не совсем уверен, какой предмет весит больше, а какой меньше.
Джоэл пытается действовать методом проб и ошибок. Сначала он пытается убрать некоторые предметы и взвешивает сумку. С многочисленными испытаниями он приближается к разрешенному пределу в тридцать килограммов. Среди удаленных предметов были мини-гаджеты, пара туфель, его кожаная куртка и несколько книг.
В каком-то смысле Джоэл переделал свою сумку под желаемый вес. Это был упрощенный пример пошагового отбора. Здесь Джоэл был аналитиком, обувь, книги и гаджеты — переменными, сумка — моделью, а требуемый результат — тридцать килограммов. Чтобы быть точным, Джоэл использовал метод обратного исключения, чтобы убедиться, что правильные переменные соответствуют модели.
В качестве альтернативы Джоэл мог бы попробовать метод прямой регрессии. В этом случае он начал бы с требуемого результата — тридцати килограммов веса. Затем он двигался вперед, чтобы построить модель (наполнить сумку предметами). Джоэл может добиться этого, взвесив каждый элемент по отдельности, а затем решив, какие из них исключить, а какие включить.
Пример #2
Аппроксимация функция двух переменных является еще одним примером пошагового отбора. Подход прямого выбора обычно используется, когда коэффициенты модели установлены равными нулю. Далее в модель вводятся переменные одна за другой. Сначала коэффициенты равны нулю; позже выбирается конкретная переменная, которая идеально соответствует модели.
Напротив, другие переменные могут выбирать разные факторы, например, самую высокую корреляцию. Некоторыми менее распространенными подтипами регрессии являются метаэвристическая оптимизация и нечеткие системы Такаги-Сугено.
Использование
Ступенчатая селекция используется для следующих целей.
- Постройте модель, содержащую только связанные переменные (с требуемой статистической значимостью).
- «Пошаговая регрессия по r» означает модель для различных подмножеств данных.
- Этот метод исключает из модели ненужные переменные, чтобы сделать ее идеальным набором.
- В SPSS для выполнения остаточного анализа используются пошаговые регрессии; проверяется точность модели. SPPS — это программный пакет, используемый при изучении социальных наук.
- В некоторых случаях пошаговый отбор повторяется для обеспечения точности модели (при работе с критической темой).
Часто задаваемые вопросы (FAQ)
1. Когда использовать модель пошаговой регрессии?
Модель пошагового выбора используется всякий раз, когда предоставляется несколько переменных, и аналитики хотят получить конкретный результат. Модель отделяет соответствующие переменные от других для достижения требуемых результатов. Кроме того, пошаговый отбор повышает точность модели — все переменные, используемые в модели, являются статистически значимыми. Переменные, не отвечающие статистической значимости, отбрасываются.
2. Как сообщить о результатах пошаговой регрессии?
Чтобы создать отчет о поэтапном выборе, выполните следующие действия.
– Проверьте переменную результата.
– Проверьте переменные-предикторы.
– Определите модель (линейную или логистическую).
– Определите метод выбора (вперед, назад или множественный).
– Предопределить работу модели.
– Установить ограничения (правило остановки).
3. Каковы недостатки пошаговой регрессии?
Недостатки ступенчатой селекции заключаются в следующем:
– Ошибки возникают при проверке гипотез.
– Это приводит к необъективному исключению (правило параметра).
– Он откровенно ориентирован на одну модель.
– Часто выбор модели непостоянен.
Рекомендуемые статьи
Эта статья была руководством к тому, что такое пошаговая регрессия. Мы объясняем его типы, примеры и способы использования в Python и SPSS. Подробнее об этом вы можете узнать из следующих статей —
- Множественная линейная регрессия
- Логистическая регрессия против линейной регрессии
- Регрессия к среднему
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)