Chap 4 Info Extr Flashcards

1
Q

Schritte der IE aus Arztbriefen

A

1 Festlegung des Inputformats txt oder html
2 Anonymis. Pesudonym. des Inputs
3 Segmentierung in Abschnitte und deren Kategoris.
4 Segment. von Abschn. in Segm. wie Nominalphrasen
5 Generierung aggregierter Dok. aus gleichen Seg.
6. Integrierte Erstelleung der Terminologie und der IE Regeln
7 Methoden zur Effektivitätssteigerung bei der Termin.-Erstelleung
8 ggf Terminologie-Bereinigung und hierar. Strukturierung.
9 ggf. Abbildung auf externe Terminologien
10 Confidence Estimation: Grobe Evaluation mit einfach Heuristiken
11 Goldstandard-Erstellung
12 Evaluation auf Basis des letzten Goldstandards mit Fehlerklassifikation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Precision

A

TP/(TP+FP)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Recall

A

TP/(TP+FN)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

F1

A

2PrecisionRecall / (Precision+Recall)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Segmentierung von Arztbriefen verwendete Methoden

A
Scoring Ansatz Regelbasiert
Erkennung mit WOrtlisten RB
Dokumentenähnlichkeit RB (lokale, globale Konsistenz)
Korrekturregeln RB
Überschriftenreduktion RB
Naive Bayes Statistisch
How well did you know this?
1
Not at all
2
3
4
5
Perfectly