étape 3 : collecte de données Flashcards
index KWIC?
keyword in context, un type d’affichage lors de la recherche d’un terme dans son contexte où chaque phrase est aligné.
aligne les concordances
permet un regard rapide
affichage plein texte
le terme qu’on recherche dans son contexte complet, dans le texte spécialisé (souvent mis en couleur ou en gras)
offre plus d’information lorsqu’on en a besoin
token
nombre de chaînes de caractères, de mots graphiques
type
nombre de chaîne de caractères différentes (comme les variations flexionnelles)
premier indice pour un extracteur de termes
la fréquence : surtout pour les termes simples
ANTCONC
comparaison entre deux corpus établi des données significative
deuxième indice pour un extracteur de terme
- découper en mot graphique
- découpage morphosyntaxique
- lemmatisation
TERMOSTAT
TROISIÈME indice pour un extracteur de terme
retrouver des patrons typiques que l’on voit dans certaine langue
N+adj
N+N
N+prep+N
mots qu’on va utiliser dans un concordancier pour trouver des liens cause-effet
TERME + cause, est causé par, résulte de, affecte
mots qu’on va utiliser dans un concordancier pour trouver des liens : entités-fonctions
TERME + sert à, est utilisé pour
type de mots à utiliser dans un concordancier pour trouver les caractéristique d’un terme
terme + adjectif
type de mots à utiliser dans un concordancier pour trouver les activités d’un terme
terme + verbe
type de mots à utiliser dans un concordanciers pour trouver le lien GÉNÉRIQUE - HYPERONYME d’un terme
terme + est un type de, une sorte de
CQL?
CORPUS QUERY LANGUAGE
quel type d’information retrouve t-on dans les sources primaires mais pas secondaires
la répartition et la fréquence
quel type d’information retrouve t-on dans les source SECONDAIRE et pas PRIMAIRE
les informations d’usage d’un terme