Árvores de Decisão Flashcards

1
Q

O que é uma árvore de decisão?

A

Uma árvore de decisão é um modelo de aprendizado de máquina que particiona recursivamente o espaço de dados em subconjuntos baseados em um critério de seleção, como a entropia ou o ganho de informação, para resolver problemas de classificação ou regressão.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quais são os componentes principais de uma árvore de decisão?

A

Os componentes principais são nós de decisão, folhas de decisão e ramos. Os nós de decisão representam pontos de escolha baseados em atributos, as folhas de decisão representam os resultados finais, e os ramos conectam os nós e folhas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Como é feita a seleção de atributos para o nó raiz em uma árvore de decisão?

A

Um atributo é escolhido para ser o nó raiz, e ramificações são criadas para cada valor possível desse atributo, dividindo o conjunto de dados em subconjuntos menores.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

O que é entropia em árvores de decisão?

A

Entropia é uma medida da pureza de um conjunto de dados. Máxima entropia ocorre quando há quantidades iguais de observações positivas e negativas, enquanto mínima entropia ocorre quando há apenas observações positivas ou apenas negativas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

O que é ganho de informação em árvores de decisão?

A

Ganho de informação é a redução esperada na entropia causada pela divisão dos dados de acordo com um atributo. É usado para selecionar os atributos que melhor separam os dados em classes puras.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qual é o papel do algoritmo ID3 em árvores de decisão?

A

O algoritmo ID3 cria um ranking de atributos com base no ganho de informação e insere os atributos na árvore de decisão de acordo com esse ranking.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quais são as vantagens das árvores de decisão?

A

As vantagens incluem facilidade de compreensão, construção rápida, criação de regras de previsão compreensíveis e a capacidade de transformar facilmente a árvore em regras do tipo “Se… Então…”.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quais são as desvantagens das árvores de decisão?

A

As desvantagens incluem o risco de overfitting e underfitting, a possibilidade de ser computacionalmente caro classificar dados contínuos, e o fato de que apenas um atributo é testado de cada vez.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

O que é poda em árvores de decisão?

A

Poda é a técnica de remover sub-árvores inteiras para simplificar a árvore, convertendo nós em folhas e atribuindo a classificação mais comum do conjunto de treinamento ao nó folha resultante, para evitar overfitting.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly