Árvores de Decisão Flashcards
Uma árvore de decisão é um grafo hierarquizado. Indique e descreva cada parte em que uma árvore de decisão se encontra dividida?
- Nodos: cada nodo interno testa um atributo do dataset
- Ramos: cada ramo identifica um valor (ou conjunto de valores) do nodo testado
- Folhas: cada folha representa uma decisão
Quais os paradigmas de modelos de decisão? Descreve cada um deles.
- Paradigma Top-down: construído a partir do conhecimento de especialistas; o “todo” é dividido em “partes”
- Paradigma Bottom-up: construído pela identificação de relações entre os atributos do dataset; o modelo é induzido por “generalização” de dados
Quais os tipos de árvores de decisão? Descreva cada um.
- Contínuo: o atributo de decisão representa uma sequência, conjunto ou intervalo de possíveis valores
- Discreto: o atributo de decisão representa uma categoria ou classe
Quais os passos de desenvolvimento/construção de um modelo de árvore de decisão?
- observação de exemplos (objetos)
- generalização por indução
- criação do modelo
- apresentação de um problema
- obtenção da resolução do problema (previsão)
Que algoritmos de modelação de árvores de decisão existem? (Chega dizer os 3 primeiros)
- Algoritmo ID3
- Algoritmo C4.5
- Algoritmo J48
- Algoritmo CART
- Algoritmo CHAID
Como funciona o Algoritmo ID3?
O algoritmo ID3 é utilizado para a construção de árvores de decisão. Este algoritmo trata de selecionar qual o atributo a ser nodo. O atributo com a maior redução de entropia é a melhor escolha para ser nodo (para reduzir a profundidade da árvore).
De maneira a realizar esta decisão, serão utilizados os conceitos de Entropia e Ganho.
O que é a Entropia?
A entropia é uma medida de incerteza associada a um conjunto de objetos. A entropia identifica o grau de desorganização dos dados.
O algoritmo C4.5 é uma extensão do Algoritmo ID3. Quais as melhorias do algoritmo C4.5 face ao ID3?
- Manipula atributos contínuos e discretos
- Lida com Missing Values
- Permite a atribuição de pesos aos atributos
(Mais importante) - Permite fazer a poda da árvore
Como é que o Algoritmo C4.5 realiza a poda da árvore (Tree Pruning)?
Retrocede 1 iteração na árvore e remove ramos que contribuem menos ou não contribuem para a definição da solução, substituindo-os por folhas