Ki Anwendungen Flashcards
Was sind die Hauptunterschiede zwischen überwachten und unüberwachten Lernmethoden in der Bioinformatik?
Überwachtes Lernen klassifiziert Objekte oder sagt Werte vorher basierend auf bekannten Klassen und nutzt Algorithmen wie neuronale Netze und Regressionsmodelle. Unüberwachtes Lernen erkennt Muster in ungeordneten Daten ohne vorher bekannte Klassen, z.B. durch hierarchisches oder k-Means-Clustering.
Was ist eine Support Vector Machine und wofür wird sie verwendet?
Eine SVM ist ein Algorithmus für überwachtes Lernen, der Datenpunkte durch Einfügen einer Hyperebene klassifiziert, um die Klassen optimal zu trennen. Sie wird häufig zur Klassifikation von komplexen biologischen Daten verwendet.
Was ist der Unterschied zwischen einem Training Set und einem Test Set?
Ein Training Set enthält gelabelte Daten zur Mustererkennung und Modellentwicklung, während ein Test Set ungesehene, ungelabelte Daten enthält, um die Genauigkeit und Verallgemeinerungsfähigkeit des Modells zu evaluieren.
Wie funktionieren künstliche neuronale Netze (KNN) und wofür werden sie eingesetzt?
KNN bestehen aus miteinander verbundenen Neuronen, die Eingabedaten verarbeiten und durch Gewichtung und Aktivierungsfunktionen Ausgaben generieren. Sie werden für komplexe Mustererkennungsaufgaben wie die Bild- und Sprachverarbeitung eingesetzt.
Was ist Backpropagation und wie wird es in neuronalen Netzen verwendet?
Backpropagation ist ein Algorithmus zum Training neuronaler Netze, bei dem die Fehler zwischen vorhergesagten und tatsächlichen Werten durch die Schichten des Netzes zurückpropagiert werden, um die Gewichte zu optimieren und die Vorhersagegenauigkeit zu erhöhen.
Wie funktioniert das k-Means-Clustering-Verfahren?
k-Means-Clustering gruppiert Datenpunkte in k Cluster, indem es wiederholt die Zuordnung der Punkte zu den nächstgelegenen Clusterzentren und die Berechnung neuer Zentren basierend auf den Mittelwerten der zugehörigen Punkte iteriert.
Was ist der Unterschied zwischen agglomerativem und divisivem Clustern?
Agglomeratives Clustern beginnt mit jedem Objekt als eigenem Cluster und fusioniert schrittweise die ähnlichsten Cluster, während divisives Clustern mit einem großen Cluster beginnt und es schrittweise in kleinere unterteilt.
Wie werden Heatmaps zur Darstellung von Genexpressionsdaten verwendet?
Heatmaps visualisieren die Expression von Genen in verschiedenen Proben, wobei Farben die Intensität der Expression darstellen. Dendrogramme zeigen die Ähnlichkeit der Proben und Gene basierend auf Clustering-Ergebnissen.
Welche Metriken werden zur Beurteilung der Leistung eines Klassifikationsmodells verwendet?
Sensitivität, Spezifität, positiver Vorhersagewert (PPV) und negativer Vorhersagewert (NPV) werden verwendet, um die Genauigkeit eines Modells zu bewerten. Diese Metriken werden aus der Konfusionsmatrix berechnet.
Wie wird KI zur Klassifikation von Hautveränderungen eingesetzt?
KI, speziell neuronale Netze, werden auf gelabelten Bilddaten von Hautveränderungen trainiert, um zwischen benignen und malignen Läsionen zu unterscheiden. Diese Modelle können in einigen Fällen eine ähnliche oder bessere Leistung als Dermatologen erzielen.