Дискриминантный анализ
Что такое дискриминантный анализ?
Дискриминантный анализ относится к статистическому методу, который может определять принадлежность к группе на основе набора предикторов метрик, которые являются независимыми переменными. Основная функция этого метода состоит в том, чтобы отнести каждое наблюдение к определенной группе или категории в соответствии с независимыми характеристиками данных.
Техника классификации данных, дискриминантный анализ работает с ответами на вопросы, поставленными в виде переменных и других факторов, служащих предикторами. Он также используется для определения вклада каждого параметра в деление групп. Идентификация одной или нескольких линейных комбинаций выбранных переменных — вот как работает дискриминантный анализ.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Оглавление
Ключевые выводы
- Модель определения принадлежности к группе может быть построена с использованием дискриминантного анализа.
- Модель состоит из дискриминантной функции или, для более чем двух групп, набора дискриминантных функций, основанных на линейных отношениях переменных-предикторов, обеспечивающих наилучшее различение между группами.
- Различают два типа дискриминантного анализа: линейный и квадратичный.
- Если групп больше двух, модель будет состоять из дискриминантных функций.
Объяснение дискриминантного анализа
Дискриминантный анализ (ДА) — это многомерный метод, который используется для разделения двух или более групп наблюдений (индивидов) на основе переменных, измеренных в каждой экспериментальной единице (выборке), и для выявления влияния каждого параметра на разделение групп.
Кроме того, прогнозирование или отнесение вновь определенных наблюдений к ранее указанным группам можно проверить с помощью линейной или квадратичной функции для отнесения каждого индивидуума к существующим группам. Это можно сделать, определив, к какой группе принадлежит каждый человек.
Система определения принадлежности к группе может быть построена с помощью дискриминантного анализа. Метод включает дискриминантную функцию (или, для более чем двух групп, набор дискриминантных функций), основанную на линейных комбинациях переменных-предикторов, обеспечивающих наилучшее различение между группами. Если групп больше двух, модель будет состоять из дискриминантных функций. После построения функций с использованием выборки экземпляров, для которых известно членство в группе, их можно применять к новым наблюдениям, которые содержат измерения для переменных-предикторов, но принадлежность к группе которых неизвестна.
Предположения
- Образцы должны быть свободны друг от друга и независимы.
- Переменные, используемые в качестве предикторов, должны иметь многомерное нормальное распределение, а матрицы дисперсии-ковариации для каждой группы должны быть одинаковыми.
- Предполагается, что случаи не могут соответствовать более чем одной группе, поскольку членство в группе считается взаимоисключающим (то есть ни один случай не принадлежит более чем к одной группе) (то есть все случаи являются членами группы).
- Если членство в группе основано на значениях непрерывной переменной, рассмотрите возможность использования линейной регрессии, чтобы воспользоваться более подробной информацией, предлагаемой постоянной переменной. Процедура наиболее эффективна, когда членство в группе является действительно категориальной переменной.
Типы
Линейный и квадратичный дискриминантный анализ две разновидности статистического метода, известного как дискриминантный анализ.
#1 – Линейный дискриминантный анализ
Часто известный как LDA, это контролируемый подход, который пытается предсказать класс зависимой переменной, используя линейную комбинацию независимых переменных. Он основан на гипотезе о том, что независимые переменные имеют нормальное распределение (непрерывное и числовое) и что каждый класс имеет одинаковую дисперсию и ковариацию. С помощью этого метода можно осуществить как классификацию, так и снижение условности.
№2 – Квадратичный дискриминантный анализ
Это подтип линейного дискриминантного анализа (LDA), который использует квадратичные комбинации независимых переменных для прогнозирования класса зависимой переменной. Предположение о нормальном распределении сохраняется. Даже если это не предполагает, что классы имеют одинаковую ковариацию. QDA создает квадратичную границу решения.
Приложение
С помощью дискриминантного анализа можно не только решать вопросы классификации. Это также позволяет установить информативность тех или иных классификационных признаков и помогает выбрать разумный набор геофизических параметров или методологий исследования.
Предприятия используют дискриминантный анализ как инструмент, помогающий извлечь смысл из наборов данных. Это позволяет предприятиям внедрять инновационные и конкурентоспособные средства, поддерживающие потребительский опыт, настройку, рекламу, прогнозирование и многие другие общие стратегические цели.
Функция управления персоналом состоит в том, чтобы оценивать эффективность работы потенциальных кандидатов, используя справочную информацию, чтобы предсказать, насколько хорошо кандидаты будут работать после приема на работу.
Основываясь на многих показателях производительности, промышленное предприятие может прогнозировать, когда отдельные части машины могут выйти из строя или потребовать обслуживания.
Способность предвидеть рыночные тенденции, которые повлияют на новые продукты или услуги, необходима для продаж и маркетинга.
Пример
Рассмотрим пример, где можно использовать дискриминантный анализ.
Считайте, что вы отвечаете за кредитный отдел в банке ABC. Менеджер банка просит вас найти лучший способ выдавать кредиты, чтобы уменьшить безнадежные долги и дефолты. У вас есть опыт управления финансами, поэтому вы решили провести дискриминантный анализ, чтобы понять проблему и найти решение.
Создание профиля кредитного риска для существующих клиентов кредитным отделом банка, чтобы определить, представляют ли новые претенденты на кредит кредитный риск, является каноническим примером динамического финансового анализа. Другие примеры включают определение того, будут ли новые потребители совершать покупку, будут ли они лояльны к определенному бренду, будет ли подход к продажам иметь низкий, умеренный или высокий уровень успеха, или какую категорию примут новые покупатели. впадать в.
Кроме того, он показывает, какие из предикторов являются наиболее дифференцирующими (имеют наибольшие дискриминационные веса), или, другими словами, какие параметры наиболее эффективно отличают эти потребительские сегменты друг от друга, а также причины, по которым респонденты попадают в одну группу, а не в другую группу. В двух словах, это метод категоризации, дифференциации и профилирования отдельных лиц или групп.
Дискриминантный анализ против логистической регрессии
- Когда зависимая переменная является дихотомической, предпочтительным методом является логистическая регрессия (LR). Однако, когда он номинальный, дискриминантный анализ (ДА) является методом выбора (более двух групп).
- LR будет принимать как непрерывные, так и категориальные переменные-предикторы. DA будет принимать только непрерывные (или фиктивные) предикторы и вообще не будет принимать предикторы категории.
- Когда более строгие допущения DA не выполняются. LR предпочтительнее DA в качестве метода анализа (LR требует меньше допущений).
- DA требует многомерной нормальности, тогда как LR может допускать значительные отклонения от ожидаемого значения переменной (переменных).
- По сравнению с DA, LR может использоваться для решения более широкого круга исследовательских задач.
- В LR фиктивные переменные генерируются от вашего имени автоматически, в то время как в DA за их создание отвечает исследователь.
Дискриминантный анализ против кластерного анализа
- В отличие от дискриминантного анализа, который иллюстрирует обучение с учителем, кластерный анализ иллюстрирует обучение без учителя.
- Категория объекта неизвестна при выполнении кластерного анализа. Категория объекта уже установлена до начала дискриминантного анализа.
- В процессе кластерного анализа представлено правило категоризации. Дискриминантный анализ не дает правила категоризации.
- Цель обучения кластерному анализу — ознакомиться с категорией каждого элемента. Цель обучения дискриминантному анализу — ознакомиться с правилом классификации.
Часто задаваемые вопросы (FAQ)
Что такое линейный дискриминантный анализ?
Линейный дискриминант Фишера используется в статистике и других областях, чтобы найти линейную комбинацию признаков, которая характеризует или различает по крайней мере два класса объектов или событий. Линейный дискриминантный анализ считается обобщенной версией линейного дискриминанта Фишера. Он стремится найти такую линейную комбинацию.
Что такое квадратичный дискриминантный анализ?
Хорошим примером генеративной модели является квадратичный дискриминантный анализ (КДА). QDA предполагает, что распределение каждого класса является гауссовым. Приоритет класса — это только процент от общего числа точек данных, которые могут быть отнесены к этому конкретному классу. Среднее значение входных переменных, связанных с конкретным классом, составляет вектор среднего значения для данного класса.
Как работает линейный дискриминантный анализ?
Линейный метод Оценка вероятности того, что новый набор входных данных принадлежит каждому классу, может быть получена с помощью дискриминантного анализа. LDA генерирует прогнозы, оценивая вероятность того, что новый набор входных данных принадлежит каждому классу. Затем эти вероятности используются для принятия решений. Класс, который достигает наибольшей вероятности, обозначается как выходной класс, и на основании данных можно сделать вывод. Для получения результатов может быть использована любая из классификаций дискриминантного анализа.
Рекомендуемые статьи
Эта статья была руководством по дискриминантному анализу и его объяснению. Здесь мы объясняем концепцию с ее предположениями, типами, применением и примером. Вы также можете найти несколько полезных статистических статей здесь:
- Качественный анализ
- Когортный анализ
- Количественный анализ
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)