Seminare Flashcards

1
Q

Definition Strukturalismus

A
  • Richtung der Linguistik
  • von Schweizer
  • Grundidee: Beobachtung, dass Zeichenketten immer nur im Bezug auf andere Zeichenketten einen Sinn und Funktion besitzen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Strukturalismus - lokaler Kontext

A
  • alle Wörter, die mit einem zu beobachtenden Wort in einem Satz auftreten
  • 1 Wort, hat n lokale Kontexte
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Strukturalismus - globaler Kontext

A
  • Menge der Idealen Kontexte eines Wortes
  • 1 Wort hat 1 globalen Kontext
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Ortographische Muster

A
  • syntagmatisch
    -> gemeinsames Auftreten in einem gemeinsamen lokalen Kontext
    -> Aufgabe: Vorhersagen des Kontextes
  • paradigmatisch
    -> ähnliche Kontexte (globaler Kontext)
    -> Aufgabe: Vorhersage eines Wortes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

statistische Signifikanz

A
  • funktionaler u. inhaltlicher Zusammenhang für alle Ebenen einer Sprache
  • 3 Ebenen:
    -> morphologisch, syntaktische, semantische
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Morphologie - Definition

A
  • Gebiet der Linguistik, das sich mit Gesetzmäßigkeiten der Wortbildung beschäftigt
  • Gegenstand der Morphologie ist das Morphem, sowie die Art und Weise, wie Morpheme zu Wortformen kombiniert werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Morphem - Definition

A

die kleinste bedeutungstragende Einheit der Spreche

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Allmorphem - Definition

A
  • verschiedene Varianten eines Morphems
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Arten von Morphemen

A
  • Basismorpheme
    -> beschreiben Sachverhalte d. außersprachlichen Wlet
    -> auch Stamm eines Wortes genannt
    -> Bsp.: Kind, seh
  • Derivative
    -> werden an Wortstämme angefügt
    -> unterscheidung Primär- und Sekundärstamm, jenachdem wie viele Affixe dem Stamm schon hinzugefügt wurden
  • grammatische Morpheme/Flexive
    -> tragen nur grammatische Bedeutung
    -> werden an Wortstämme angefügt (affgiert)
    -> z. B. geh > geht oder Kind > Kinder
  • Freie Morpheme: können ohne Affixe im Text auftreten
  • gebundene Morpheme: können NICHT ohne Affixe im Text auftreten; alle grammatikalischen Morpheme, Derivate und einige Basismorpheme
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Operationen zur Bildung von Wortformen

A
  • Flexion
    -> dient der Ableitung grammatischer Wortformen aus einem Stamm und schafft syntaktische Oberfächenvarianten ein und desselben Wortstammes
    -> im Deutschen meist durch Anhängen von Flexionssuffxen, wie z. B. Kind > Kinder
    -> aber auch Um- und Ablaute auf (Haus> Häuser od. singen > sang), die zur Entstehung von Allomorphen führen
  • Komposition
    -> schafft ebenfalls Wortneubildungen, bei denen diesmal aber zwei Stämme (bzw. zwei freie Morpheme) aneinandergefügt werden
    -> Ergebnis ist Kompositum
  • Derivation
    -> schafft neue Wörter durch Anfügung (Affgierung) von Derivativen an
    Wortstämme.
    -> meisten Derivative haben dabei eine charakteristische Bedeutung, die sie dem Stamm hinzufügen
    -> Derivationssuffxe ändern zudem meist die Wortart des
    Stamms.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Bedeutung für Text-Mining

A
  • morphologische Strukturen müssen dann verarbeitet werden, wenn morphologische Klassifikation versch. Wortformen für weitere Analyse nötig ist
  • Allmorphie ist Problem, wenn man Wortform durch Abschneiden einer Endung auf Stamm reduziert würden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Grundformreduktion

A
  • Lemmatisierung
  • eien Wortform wird auf eine im Lexikon aufgezeichnete Form zurückgeführt
  • Häser > Haus
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Stammformreduktion

A
  • Stemming
  • Verschiedene Wortformen werden auf selben Stamm zurückgeführt
    -> in versch. Sprachen unterschiedlich schwer
    -> im Englischen oft verwendetes Verfahren: Porter-Stemmer
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Fachtexte - Definition

A
  • informieren Fachleute desselben Faches und ermöglichen eine Kommunikation mit vertretern anderer Disziplinen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Terminologie - Definition

A
  • Sammlung von Fachausdrücken, die in Form eines Thesaurus geschrieben sind
  • Thesaurus: Nennung von Sachgebiet, Synonyme usw.
  • Fachausdrücke: Nomina, Vebren, einezelne Wörter oder Mehrworteinheiten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Ausnahmen und Sonderfälle in Fachsprache

A
  • inkonkrte Rechrscheibung und unübliche Schreibweise
    -> ae statt ä, alte Rechtschreibung, Schreibweisen in sozialen Medien (z.B.:thx)
  • Sonderregelungen der Sprache
  • Sonderfälle: geringe Fehlerquote kann toleriert werden
16
Q

Operatinale Semantik

A

Wirkugn von Programmen, die den Zustand einer Maschine verändern

17
Q

Semantische Repräsentation - Grundprinzip

A

Der Semantischenrepräsentationssprache (SRS) wird durch semantische Interprätation eine Bedeutung zugeteilt

17
Q

Referentielle Semantik

A

Bedeutung - Das mit einem Ausdruck bezeichnete Objekt

18
Q

Prozedurale Semantik

A

Gebrauch sprachlicher Ausdrücke legt ihre Bedeutung fest

18
Q

Axiomatische Semantik

A

Transformation von logischen Aussagen über Zustände

18
Q

Semantische Relationen

A
  • Synonyme
  • Gegensätze
  • Ober- u. Unterbegriffe
  • Antonyme (hell - dunkel, im Bezug auf Licht)
  • Komplementärbegriffe (lebendig - tot, im Bezug auf Körperzustand)
18
Q

Denotationale Semantik

A

weist jedem Programm die Ergebniss der zu berechnenden Funktion als Semantik zu

19
Q

Strukturalistische Semantik

A

Bedeutung eines Ausdrucks ist abhängig von Kontext

20
Q

Syntax - Definition

A

Wissenschaft des Prinzips und Prozesses nach dem Sätze in bestimmten Sprachen konstruiert werden

21
Q

Dependenzstruktur

A
  • Dependenz: Stellt bestehende Abhängigkeiten zwischen Wörtern winws Satzes dar
  • Löschtest
    -> Sinnverlust eines Wortes nach löschen eunes anderen Wortes
    –> gelöschtes Wort diesem übergeortnet
  • Dependenzbaum
    -> Wurzel immer Verb
    -> repräsentiert flexible und effektive syntaktische Zusammenhänge
  • Anwendung
    -> inhaltlich-funktionale Kategotrien (Subjekt, Objekt…)
22
Q

Konstituentenstruktur

A
  • Konstituenten: Unmittelbare Bausteine von Sätzen (Wörter und Wortkombinationen)
  • Verschiebetest: Bestimmung der Konstituenten
  • Phasen-Struktur-Grammatik
    -> Konst: Wort oder eine Phrase, die von einer syntaktischen Regel als Einheit behandelt wird
    -> Rahmen für syntaktischen Regeln ist kontextfreie Ersetzungsgrammatik
    (also in der Chomsky-Hierarchie eine Typ-2 Grammatik) mit allen Wörtern einer
    Sprache als terminalen Symbolen, den syntaktischen Kategorien und Phrasen als nichtterminalen Symbolen und den syntaktischen Regeln als Produktionsregeln
    -> Grundlegende Konstituenten sind dabei die syntaktischen Kategorien Nomen (N), Verb (V), Adjektiv/Adverb (A), Präposition (P) und Artikel (Art), sowie die nichtterminalen Phrasen NP, VP, AP und PP
    -> Syntaktische Strukturen werden in Form eines Syntaxbaums beschrieben, mit dem auch syntaktische Mehrdeutigkeiten dargestellt werden können
  • Anwendung
    -> automat. Syntaxanalyse
    -> POS-Tags
23
Q

Ziel Syntaktisce Repräsentation

A

Angabe gramatischer Regeln zur Bestimmung einer Menge an syntaktisch korrekter Sätze in einer Sprache

24
Q

Probabilistische Parsen

A
  • regelbasiertes Paradigma
    -> mehrdeutige syntaktische Struktur einer Folge von Wörtern
    -> Bestimmung ob Folge von Wörtern in Sprache zulässig
  • Wahrscheinlichkeit
    -> Berechnung mittels Wkt Auftreten von Wortkombinationen in einem Corpus
    -> Darstellung von Mehrdeutigkeiten eines Satzes
  • Probailistische kontextfreie Grammatik (PCFG)
    -> Anwendung von Datenbanken für die Regeln
25
Q

Fachsprache Definition

A
  • Texte, die Wissen zu einem bestimmten Thema vermitteln
  • Unterschiede zu Allgemeinsprache:
    -> Syntaktische und semantische Beschränkungen (z. B. Grammatik)
    -> Fachgebietsspezifische lexikalische Beschränkungen (z. B. Fachterminologie)
    -> Fachgebietsspezifische Morphologie (z. B. Charakteristische Morpheme)
26
Q

Welchen Einfluss haben Sprachregister auf die Verwendung von Sprache

A
  • Sprachregister sind bestimmt durch situative Faktoren:
    -> Kanalfaktoren (z. B. Email, Telefon)
    -> Soziale Rollen (z. B. Höflichkeitsformen)
    -> Reglementierte Formulierungen
  • Sprachregister bestimmen Form des Textes
27
Q

Möglichkeiten der Segmentierung von Text

A
  • Satzsegmentierung
    -> Regeln für Satzanfang
    -> Regeln für Satzende:
    -> Abkürzungen (mit „.“)
  • Wortformensegmentierung
    -> Trennung mit Trennsymbo
    -> Berücksichtigung erlaubter Zeichen
28
Q

Herausforderungen bei der Segmentierung von Text und einige Lösungsstrategien

A
  • Grundgedanke:
    -> Die Segmentierung im Sinne der Textverarbeitung meint die algorithmische Zerlegung von
    Texten in Sätze und von Sätzen in Wörter. Für die Trennung der einzelnen Elemente werden
    dabei Trennregeln benötigt.
  • Schwierigkeiten:
    -> Auftreten von Ausnahmefällen bei denen allgemeine Trennregeln nicht verwendbar sind
    → Aufstellung zusätzlicher Regeln und Ausnahmelisten