Decision Trees Flashcards
Gehören Entscheidungsbäume zum überwachten oder unüberwachten Lernen?
zum überwachten Lernen
Was sind die Vorteile von Entscheidungsbäumen?
Was sind die Nachteile von Entscheidungsbäumen?
Was bedeutet eine geringere Entropie?
weniger Unsicherheit
Wie berechnet man die Entropie eines Datensets?
Wie bestimmt man die Information (entropy) to classify a tuple in D?
Wie bestimmt man die Average information needed, after using attribute A to split D into k partitions?
Wie berechnet man den Information Gain?
(Information gained by branching on attribute age)
Wie bestimmt man die Gini Impurity?
Wie bestimmt man die Qualität eines Splits anhand der Gini Impurity?
Wie berechnet man den GainRatio?
Wozu braucht man den GainRatio?
Weil die Gini Impurity biased gegenüber Splits mit mehreren unterschliedlichen Klassen ist, über die, die Daten aufgeteilt werden
Wie würde das Gain Kriterium aussehen, wenn man fehlende Datan an einem Attribut hat?
Was ist Pruning?
Das entfernen von Subbäumen und austauschen durch Blätter nach der Buildingphase, um Overfitting zu vermeiden
Was ist das Problem beim Prepruning?
Es ist schwierig einen threshold vorher zu definieren