VL4 Flashcards
Def. Lernen
• Aneignen von Wissen & Kenntnissen bzw. das Einprägen in das Gedächtnis
• Das Lernen beinhaltet auch den Vorgang, im Laufe der Zeit durch Erfahrungen, Einsichten usw. zu Einstellungen und Verhaltensweisen zu gelangen, die von Bewusstsein und Bewusstheit bestimmt sind
Def. KI
• Eigenschaft von technischen Systemen, Aufgaben zu lösen, deren Lösung durch einen Menschen Intelligenz erfordern
Funktionsweise des Maschinellen Lernens
• Verarbeitung großer Datenmengen als Datenbasis
• Systematische Ableitung von Zusammenhängen & Regeln auf der Basis von Erfahrungswerten (Daten)
• Anwendung dieser abgeleiteten Regeln auf anderen (neuen) Daten
• Ableitung komplexer, generalisierbarer Regelwerke, welche nicht durch klassische Programmierung abgedeckt werden kann
• Prädiktive Verfahren des Maschinellen Lernens benötigen eine in Training & Testing aufgeteilte Lernphase
Trainingsdaten- und Testdaten
• Aufteilung der Daten in Trainings- und Testdaten
• I.d.R. Randomisierte Auswahl der Datensätze
• Vermeidung von Ungleichverteilung in den Datensätzen (Bsp 90% Mann, 10% Frau)
• Verhältnis von Traings-zu Testdaten nach klassischer Aufteilung
- 70% Trainingsdaten
- 30% Testdaten
• Testdatensatz soll identische Wahrscheinlichkeitsverteilung wie die des Trainingsdatensatzes haben
Trainingsphase
• Datenbasis zum KI-gestützten Lernen repräsentiert durch Trainingsdaten Trainingsdaten
• Enthalten alle Infos, die ein Experte benötigt , um eine fundierte Entscheidung zu treffen
• Enthalten das Wissen, welches von der KI gelernt werden soll
• Darstellung einer repräsentativen Stichprobe für die zu lernende Aufgabe
Ziel der Trainingsphase:
• Bestimmung eines statistischen Zusammenhangs durch Erstellung eines Modells
Testphase
• Bewertung der Generalisierungsleistung des trainierten KI-Modells
Testdaten
• Testdaten & Trainingsdaten unabhängig
• Testdaten wichtig zu evaluieren, ob trainierte KI gut von gelernten auf neue Daten generalisieren kann
• Testdaten werden bei dem Training nicht genutzt
• KI kennt die Daten nicht (!)
• passt trainierte Modell gut zu den Testdaten, kann Modell auf unbekannte Daten angewandt werden
Wie viele Daten benötigen wir für das Lernen von KI?
• Keine eindeutige Antwort auf diese Frage (!)
• Quantität der Daten ist wichtig, jedoch unter Berücksichtigung der Qualität von Daten (!)
• Maßstäbe für die Notwendigkeit von Daten
> Je intuitiver das vorherzusagende Problem, desto weniger Daten brauchen Sie
> Je seltener die Existenz des vorherzusagenden Problems, desto mehr Daten brauchen Sie
> Je mehr Eigenschaften Ihre Daten haben, desto mehr Daten brauchen Sie
Grundgedanken der Programmierung
• Lösung von statischen Problemen in der einfachsten Form durch die Definition von Regeln (Bspw. „Wenn-Dann“-Konstrukte)
• Wenn Situation A > führe Aktion B aus; wenn Aktion B > Schlussfolgerung C
• Explizite Ableitung von Ergebnis-Antworten
• Klassische Programmierung funktioniert für Ereignisse, die wir mit hoher Sicherheit erwarten
-> Der Nutzer klickt auf einen Button, die App sendet eine Anfrage an eine Datenbank
Unterschied zwischen KI und Programmierung
Programmierung
• Definition einer (statischen, begrenzten) Regelmenge
• Integration von Daten
• Durchführung programmierter Regeln (kein Lernprozess!)
> Ableitung von Antworten
Maschinelles Lernen
• Integration von Antworten
• Integration von Daten
• Trainieren & Testen (Lernen) auf historischen Daten
> Ableitung von generalisierbaren Regeln durch Modelle
Unterschied von KI zur Programmierung
Programmierung
• Definition einer statischen, begrenzten Regelmenge (Wenn- Dann- Konstrukte)
• Integration von Daten
• Durchführung programmierter Regeln (kein Lernprozess!)
> Ableitung von Antworten
Maschinelles Lernen
Integration von Antworten & Daten
• Trainieren & Testen (Lernen) auf historischen Daten
> Ableitung von generalisierbaren Regeln durch Modelle