4.3 Sprachverarbeitung Flashcards
Sprachverarbeitung - Relevanz
wichtiger Anwendungsbereich der vergangenen und aktuellen KI-Technike
Sprachverarbeitung - Hauptbestandteilen
- Spracherkennung
- Sprachverstehen
- Spracherzeugung
Sprachverarbeitung - Spracherkennung
- Identifizieren von Wörtern in der gesprochenen Sprache
- Umwandlung von Sprache in Text
Sprachverarbeitung - Sprachverstehen
- Entnahme von Bedeutungen aus Wörtern und Sätzen
- Leseverstehen
Sprachverarbeitung - Spracherzeugung
- Fähigkeit Informationen und Bedeutungen auszudrücken
- in Form von wohlgeformten Sätzen oder längeren Texten
Sprachverarbeitung - Hauptaspekt
Sprache auf menschlichem Niveau zu interpretieren und zu verwenden
Sprachverarbeitung auf menschlichem Niveau - Möglichkeiten
- Kommunikation von Menschen mit Maschinen in ihrer natürlichen Sprache
- ermöglichen eine Reihe interessanter sprachzentrierter Anwendungen:
- automatischen Übersetzung
- Erzeugung von Textauszügen, Zusammenfassungen oder kompletten Werken der Literatur
Verarbeitung natürlicher Sprache - Entwicklungen
- Virtuelle Assistenten
- Verbesserte maschinelle Übersetzungen
- Extraktion von Schlüsselwörtern
- Stimmungsanalyse
- Fähigkeit von Spracherkennungssoftware zur Identifikation des Sprechenden
- Fähigkeit von Spracherkennungssoftware zur Erkennung von Wörtern
Verarbeitung natürlicher Sprache - Virtuelle Assistenten
- auf handelsüblichen Telefonen und Laptops
- können immer besser auf komplexe Anfragen reagieren
Verarbeitung natürlicher Sprache - Verbesserte maschinelle Übersetzungen
- zwischen zwei verschiedenen menschlichen Sprachen
- mittlerweile auch auf handelsüblichen Smartphones, Tablets oder Notebooks
Verarbeitung natürlicher Sprache - Extraktion von Schlüsselwörtern
um große Textmengen zu analysieren
-> z. B. mediale Berichterstattung unterstützen
Verarbeitung natürlicher Sprache - Stimmungsanalyse
- von E-Mail- und Social-Media-Texten
- zur Bewertung der Stimmung und emotionalen Einstellung des Verfassenden zum Thema
Zusammenhang Denkvermögen und Sprache
menschliches Denkvermögen und logische Schlussfolgerungen beruhen auf Sprache
-> Fähigkeit Sprache zu verarbeiten, ist eng mit Konzept der Intelligenz selbst verbunden
Turing-Test - Ziel
entscheiden, ob eine Maschine als intelligent angesehen werden kann
Turing-Test - Durchführung
- Maschine und Mensch beteiligt
- beantworten über eine telegrafische Verbindung eine Reihe von Fragen eines Abfragesystems
- Wenn Fragesteller nicht erkennen kann, welcher Gesprächspartner eine Maschine ist, wird die Maschine als intelligent angesehen
Turing-Test - Quintessenz
Fähigkeit der Maschine natürliche Sprache zu verarbeiten
Sprachverarbeitung als technische Disziplin
- entstand Mitte der 1950er-Jahre
- hoher Bedarf an englischen und russischen Übersetzenden
- erste Ergebnisse zwar vielversprechend
- aber Übersetzung weitaus komplexerals ursprünglich angenommen
Winter in der Forschung zur Verarbeitung natürlicher Sprache
- Im Jahr 1974
- Automatic Language Processing Advisory Committee (ALPAC) bezeichnete Sprachverarbeitung als hoffnungslos
- -> Finanzierung der Forschung vorübergehend eingestellt
Aufleben der Forschung zur Verarbeitung natürlicher Sprache - Zeitpunkt
1980er-Jahre
Aufleben der Forschung zur Verarbeitung natürlicher Sprache - Gründe
- Anstieg der Rechenleistung
- Paradigmenwechsel
- Anwendung der Wahrscheinlichkeitstheorie
Aufleben der Forschung zur Verarbeitung natürlicher Sprache - Anstieg der Rechenleistung
- im Einklang mit dem Mooreschen Gesetz
- ermöglichte rechenintensivere Methoden zur Verarbeitung natürlicher Sprache
Aufleben der Forschung zur Verarbeitung natürlicher Sprache - Paradigmenwechsel
- zunächst Grammatik-orientierten Ansatz
- später Modelle auf statistischer und entscheidungstheoretischer Grundlage
Aufleben der Forschung zur Verarbeitung natürlicher Sprache - Grammatik-orientierter Ansatz
- Versuch immer komplexere Regelwerke zu implementieren
- um Komplexität der natürlichen Alltagssprache zu bewältigen
Aufleben der Forschung zur Verarbeitung natürlicher Sprache - Modelle auf statistischer und entscheidungstheoretischer Grundlage
- Verwendung von Entscheidungsbäumen
- anstelle von manuell erstellten und kodierten Regeln für die Verwendung von Wörtern
-> harten Wenn-Dann-Entscheidungen
Aufleben der Forschung zur Verarbeitung natürlicher Sprache - Anwendung der Wahrscheinlichkeitstheorie
- Technik namens „Part-of-Speech-Tagging“ (POS-Tagging,)
- auf Deutsch etwa: Zuordnung von Wörtern und Satzzeichen zu Wortarten
Anwendung der Wahrscheinlichkeitstheorie - POS-Tagging
nutzt stochastisches Markow-Modell zur Beschreibung eines dynamischen Systems wie Sprache
POS-Tagging - Markow-Modell
nächsten Zustand wird bestimmt von:
* nur dem letzten Zustand des Systems
* einer Reihe von Übergangsregeln
im Gegensatz zu Ansätzen, welche die gesamte Vorgeschichte berücksichtigen
Verlagerung zu statistischen und entscheidungstheoretischen Modellen - Folge
Erhöhung der Robustheit der Methoden zur Verarbeitung natürlicher Sprache
Abb. Natural Language Processing im Kontext von Chatbots
Natural Language Processing - Herausforderungen
- Möglichkeiten der Fragestellung
- Entscheidungsalternativen
- Antwortmöglichkeiten