Visual Interpretation of Data Flashcards
Was sind die Limitation von statistischen Verfahren, um Outlier zu finden?
Wie detektiert man Outlier anhand von Regression?
Wie funktioniert das Detektieren von Outliern mit der Nearest Neighbour Methode?
A sample si in a data set S is an outlier if at least a fraction p of the samples in S lies at a distance greater than d from si
Wie kann man die Distanz zwischen zwei Vektoren mit nominalen Attributen berechnen?
Wie kann man die Distanz von binären Attributen berechnen?
asymmetric and symmetric
Was ist der Jaccard coefficient
misst die similarity for
asymmetric binary variables
Was ist die Minkowski distance?
Welche Eigenschaften hat eine metrische Distanz?
Welchen Wert hat die supremum distanz?
This is the maximum difference between any component (attribute)
of the vectors
Wie berechnet man die Cosine Similarity?
Was betrachtet die Cosine similarity im Vergleich zu anderen Methoden?
Cosine similarity considers vector orientations
but not vector lengths