Árvores de Decisão Flashcards
O que é uma árvore de decisão?
Uma árvore de decisão é um modelo de aprendizado de máquina que particiona recursivamente o espaço de dados em subconjuntos baseados em um critério de seleção, como a entropia ou o ganho de informação, para resolver problemas de classificação ou regressão.
Quais são os componentes principais de uma árvore de decisão?
Os componentes principais são nós de decisão, folhas de decisão e ramos. Os nós de decisão representam pontos de escolha baseados em atributos, as folhas de decisão representam os resultados finais, e os ramos conectam os nós e folhas.
Como é feita a seleção de atributos para o nó raiz em uma árvore de decisão?
Um atributo é escolhido para ser o nó raiz, e ramificações são criadas para cada valor possível desse atributo, dividindo o conjunto de dados em subconjuntos menores.
O que é entropia em árvores de decisão?
Entropia é uma medida da pureza de um conjunto de dados. Máxima entropia ocorre quando há quantidades iguais de observações positivas e negativas, enquanto mínima entropia ocorre quando há apenas observações positivas ou apenas negativas.
O que é ganho de informação em árvores de decisão?
Ganho de informação é a redução esperada na entropia causada pela divisão dos dados de acordo com um atributo. É usado para selecionar os atributos que melhor separam os dados em classes puras.
Qual é o papel do algoritmo ID3 em árvores de decisão?
O algoritmo ID3 cria um ranking de atributos com base no ganho de informação e insere os atributos na árvore de decisão de acordo com esse ranking.
Quais são as vantagens das árvores de decisão?
As vantagens incluem facilidade de compreensão, construção rápida, criação de regras de previsão compreensíveis e a capacidade de transformar facilmente a árvore em regras do tipo “Se… Então…”.
Quais são as desvantagens das árvores de decisão?
As desvantagens incluem o risco de overfitting e underfitting, a possibilidade de ser computacionalmente caro classificar dados contínuos, e o fato de que apenas um atributo é testado de cada vez.
O que é poda em árvores de decisão?
Poda é a técnica de remover sub-árvores inteiras para simplificar a árvore, convertendo nós em folhas e atribuindo a classificação mais comum do conjunto de treinamento ao nó folha resultante, para evitar overfitting.