Árvores de Decisão Flashcards

1
Q

Uma árvore de decisão é um grafo hierarquizado. Indique e descreva cada parte em que uma árvore de decisão se encontra dividida?

A
  • Nodos: cada nodo interno testa um atributo do dataset
  • Ramos: cada ramo identifica um valor (ou conjunto de valores) do nodo testado
  • Folhas: cada folha representa uma decisão
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quais os paradigmas de modelos de decisão? Descreve cada um deles.

A
  • Paradigma Top-down: construído a partir do conhecimento de especialistas; o “todo” é dividido em “partes”
  • Paradigma Bottom-up: construído pela identificação de relações entre os atributos do dataset; o modelo é induzido por “generalização” de dados
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quais os tipos de árvores de decisão? Descreva cada um.

A
  • Contínuo: o atributo de decisão representa uma sequência, conjunto ou intervalo de possíveis valores
  • Discreto: o atributo de decisão representa uma categoria ou classe
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quais os passos de desenvolvimento/construção de um modelo de árvore de decisão?

A
  1. observação de exemplos (objetos)
  2. generalização por indução
  3. criação do modelo
  4. apresentação de um problema
  5. obtenção da resolução do problema (previsão)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Que algoritmos de modelação de árvores de decisão existem? (Chega dizer os 3 primeiros)

A
  • Algoritmo ID3
  • Algoritmo C4.5
  • Algoritmo J48
  • Algoritmo CART
  • Algoritmo CHAID
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Como funciona o Algoritmo ID3?

A

O algoritmo ID3 é utilizado para a construção de árvores de decisão. Este algoritmo trata de selecionar qual o atributo a ser nodo. O atributo com a maior redução de entropia é a melhor escolha para ser nodo (para reduzir a profundidade da árvore).
De maneira a realizar esta decisão, serão utilizados os conceitos de Entropia e Ganho.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

O que é a Entropia?

A

A entropia é uma medida de incerteza associada a um conjunto de objetos. A entropia identifica o grau de desorganização dos dados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

O algoritmo C4.5 é uma extensão do Algoritmo ID3. Quais as melhorias do algoritmo C4.5 face ao ID3?

A
  • Manipula atributos contínuos e discretos
  • Lida com Missing Values
  • Permite a atribuição de pesos aos atributos
    (Mais importante) - Permite fazer a poda da árvore
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Como é que o Algoritmo C4.5 realiza a poda da árvore (Tree Pruning)?

A

Retrocede 1 iteração na árvore e remove ramos que contribuem menos ou não contribuem para a definição da solução, substituindo-os por folhas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly