Древо решений
Что такое дерево решений?
Дерево решений — это блок-схема в форме древовидной структуры, используемая для отображения возможных результатов для заданных входных данных. Древовидная структура состоит из корневого узла, ветвей, внутренних и конечных узлов. Отдельный внутренний узел представляет собой решение о разделении, а каждый конечный узел представляет прогноз класса.
Это полезно при построении обучающей модели, которая предсказывает класс или значение целевой переменной с помощью простых правил принятия решений. Учитывая информацию и варианты, относящиеся к решению, это помогает предприятиям определить, какое решение в любой момент выбора принесет наибольшую прогнозируемую финансовую отдачу.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Оглавление
Ключевые выводы
- Дерево решений представляет собой направленную блок-схему, построенную по структуре, похожей на дерево. Древовидная структура включает корневые узлы, ветви, внутренние узлы и конечные узлы.
- Процесс принятия решения осуществляется путем разветвления узлов, которые изображают различные возможности, когда пользователь решает выбрать или отказаться от варианта. Результаты или заключительные узлы называются листом.
- Структура позволяет принимать решения, классифицируя их как лучшие или худшие.
- Это помогает сделать вывод, позволяя интерпретировать данные визуально
Объяснение дерева решений
Дерево решений — это классификатор, который помогает в принятии решений. Он изображается как корневое дерево, заполненное узлами с входящими ребрами. Один узел без какого-либо входящего ребра называется «корневым» узлом, а каждый из остальных узлов имеет только одно входящее ребро. Точно так же узел с выступающими краями является внутренним или тестовым узлом. В то же время оставшиеся в конце узлы являются листьями, называемыми терминальными или решающими узлами. Кроме того, каждый внутренний узел в структуре делит пространство экземпляров на несколько подпространств определенной дискретной функцией значений входных атрибутов.
Каждый тест учитывает один атрибут. Затем пространство экземпляров делится в соответствии со значением атрибута. В случаях, связанных с числовыми атрибутами, можно ссылаться на него как на диапазон. Каждый лист получает класс, представляющий идеальное целевое значение. Кроме того, лист может содержать вектор вероятности, отображающий вероятность того, что целевое свойство будет иметь конкретное значение. По результатам испытаний на пути можно классифицировать экземпляры. Это возможно путем перемещения их из корня дерева в лист. Короче говоря, критерии остановки и техника обрезки напрямую контролируют сложность дерева.
Состав
Структура содержит следующее:
- Корневой узел: Корневой узел представляет всю совокупность или выборку. Затем он разбивается на два или более однородных множества.
- Разделение: Процесс разделения включает в себя разделение узла на несколько подузлов.
- Узел решения: Подузел становится узлом принятия решений, когда он делится на несколько подузлов.
- Листовые или терминальные узлы: Узлы, которые не разделяются, являются листовыми или конечными узлами.
- Обрезка: Сокращение — это процесс удаления подузлов из узла принятия решений. Можно описать это как расщепление в обратном направлении.
- Филиал или поддерево: Ветвь или поддерево — это подразделение общего дерева.
- Родительский и дочерний узел: Узел, разделенный на дочерние узлы, называется родительским узлом. Подузлы являются потомками родительского узла.
Использование
Дерево решений обычно лучше всего подходит для задач со следующими характеристиками:
1. Экземпляры, представленные парами атрибут-значение:
Экземпляры обладают фиксированными наборами атрибутов и их значений. Эти деревья помогают принимать решения с ограниченным числом возможных непересекающихся значений и позволяют числовое представление вещественных атрибутов, таких как уровень или степень.
2. Целевые функции с дискретными выходными значениями:
Он допускает логические (да или нет) классификации и функции с более чем двумя возможными выходными значениями и выходными значениями с действительными значениями.
3. Разделительные описания:
Они полезны при представлении дизъюнктивных выражений.
4. Данные с отсутствующими значениями атрибутов:
Метод помогает принять решение даже при отсутствующих или неизвестных значениях.
В реальных приложениях они полезны как при принятии бизнес-инвестиционных решений, так и в общих индивидуальных процессах принятия решений. Деревья решений широко популярны в качестве прогностических моделей при проведении наблюдений. Кроме того, обучение дереву решений — это контролируемый подход к обучению, используемый в статистике, интеллектуальном анализе данных и машинном обучении.
Примеры
Посмотрите эти примеры, чтобы получить лучшее представление:
Пример №1
Дэвид рассматривает возможность инвестирования определенной суммы. Следовательно, он рассматривает три варианта: взаимные фонды, долговые фонды и криптовалюты. Он анализирует их по одному приоритетному критерию — они должны давать доход более 60%. Дэйв понимает, что связанный с этим риск также высок, но сумма, которую он вкладывает, — это дополнительные деньги, которые он может потерять. Поскольку такую отдачу могут дать только криптовалюты, он выбирает их.
Посмотрите на иллюстрацию процесса принятия решений ниже.
Пример #2
У Дейва с собой 100 000 долларов. Он хочет их потратить, но не знает, как. Он знает, что хочет новую машину, но также понимает, что это обесценивающийся актив, и его стоимость со временем имеет тенденцию к снижению. С другой стороны, у него есть еще один вариант — вложиться в него. Если он выберет этот вариант, он может разделить их, положить на Roth IRA (специальный индивидуальный пенсионный счет) и использовать оставшуюся часть для покупки дома, который может приносить ему пассивный доход за счет арендной платы. Поэтому он предпочитает инвестировать.
Преимущества недостатки
Вот основные преимущества и недостатки использования дерева решений;
№1 Преимущества
- Это помогает легко принимать решения, позволяя интерпретировать данные визуально.
- Структура может использоваться для комбинации числовых и нечисловых данных.
- Классификация дерева решений позволяет принимать решения, распределяя их по категориям в соответствии со спецификацией.
№2 Недостатки
- Если древовидная структура становится сложной, можно интерпретировать нерелевантные данные.
- Расчеты в прогнозном анализе могут легко стать утомительными, особенно когда путь принятия решения содержит множество случайных переменных.
- Незначительное изменение данных может существенно повлиять на структуру дерева решений, выражая результаты, отличные от тех, которые возможны в обычных условиях.
Дерево решений против случайного леса против логистической регрессии
- Дерево решений — это структура, в которой каждое образование в форме вершины является вопросом, а каждое ребро, спускающееся с этой вершины, — потенциальным ответом на этот вопрос.
- Случайный лес объединяет выходные данные различных деревьев решений для получения единого результата. Таким образом, он решает проблемы классификации и регрессии; этот метод прост и адаптируем.
- Логистическая регрессия вычисляет вероятность возникновения определенного события на основе набора независимых переменных и заданного набора данных. В этом методе диапазон зависимой переменной составляет от 0 до 1.
Хотя все они связаны с выводом на основе вероятности, все три различны.
Часто задаваемые вопросы (FAQ)
1. Что такое дерево решений в машинном обучении?
Решение древовидное обучение — это контролируемое машинное обучение, при котором обучающие данные непрерывно сегментируются на основе конкретных данных. Он производит соответствующий вывод для данного ввода, как в обучающих данных.
2. Что такое энтропия в дереве решений?
Энтропия определяет, как дерево решений решает разделить данные. Информационная энтропия измеряет уровень неожиданности (или неопределенности) значения случайной величины. Проще говоря, это измерение чистоты.
3. Как работает дерево решений?
Процесс принятия решения осуществляется путем разветвления узлов, начиная с корневого узла. Разветвленные узлы отображают различные возможности, когда пользователь решает выбрать или отказаться от этого варианта в зависимости от предпочтений. Результаты или заключительные узлы называются листом.
4. Что такое анализ дерева решений?
Анализ дерева решений — это взвешивание всех «за» и «против» решений и выбор наилучшего варианта из древовидной структуры. Процесс включает в себя усвоение данных, классификацию дерева решений и выбор наилучшего доступного варианта.
Рекомендуемые статьи
Это было руководство к тому, что такое Дерево решений и его определение. Мы объясняем его структуру, использование, примеры, преимущества, недостатки и сравнение с логистической регрессией/случайным лесом. Подробнее об этом вы можете узнать из следующих статей —
- Древовидная диаграмма
- Анализ решений
- Теория принятия решений
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)