Cours 5 Flashcards
Quels sont les avantages et les limites des analyses sociolinguistiques du recueil et de l’analyse de corpus?
Avantages :
- Accès au parler spontané
- Possibilité de travailler sur la phonétique/phonologie
- Possibilité de contrôler le profil sociodémographique des participants
Limites :
- Certaines formes linguistiques peu fréquentes dans un corpus donnée, donc difficiles à explorer (traits lexicaux)
- Difficile de faire oublier la formalité de la situation au participant (micro, enregistreuse)
- Transcription chronophage
- Nombre limité de locuteurs
- Coûteux (participants, enquêteurs, transcripteurs)
Quels sont les avantages et les limites des textes du recueil et de l’analyse de corpus?
Avantages :
- Accès à une quantité potentiellement gigantesque de données
- On peut manipuler automatiquement des ensembles de textes de milliards de mots : rapide, idéal pour les analyses quantitatives
Limites :
- On doit se fier au travail automatisé et donc accepter une certaine quantité de « bruit » dans nos corpus
- Plus difficile de limiter l’époque observée
- Plus difficile de déterminer le profil sociodémographique des locuteurs
- Les logiciels qui lemmatisent sont limités par leurs dictionnaires disponibles
- En extrayant les occurrences d’un lemme, on peut faire face à des doublons
Quelles sont les données en mode introspection de la recherche de Guillaume?
- Un espèce de…
- Un genre de…
- ? une type de…
- *un sorte de…
- Un·e drôle de…
- Un·e bizarre de…
- Un·e étrange de…
- ? un·e curieux·se de…
- ?* un·e rigolo de…
- ?* un·e insolite de…
Quelles sont les données dans la littérature de la recherche de Guillaume?
- Aucun article scientifique à la base
- Cependant, l’Académie française finit par se prononcer sur le sujet pour dire que « Le mot Espèce est féminin, et doit le rester lorsqu’il est suivi d’un complément (Espèce de…) »
- Donc, Larousse finit par ajouter à sa définition de Espèce qu’il faut « Éviter l’emploi au masculin un espèce de (même s’il est fréquent dans l’expression orale relâchée) »
- À la suite de ces deux constats sur l’utilisation de « un espèce de », on commence à voir des articles scientifiques sur le sujet.
- L’ouvrage Le bon usage rapporte donc plusieurs cas de l’utilisation de cette expression dans plusieurs textes datant de plusieurs années.
Quelle est l’hypothèse de Guillaume?
- H : La construction « adjectivale » avec espèce et genre fait partie de la grammaire des francophones. Il ne s’agit pas d’un effet de neutralisation du déterminant indéfini avec espèce.
o Q : quelle est la fréquence d’accord du Dét avec le CDN?
o Est-ce que la situation a évolué depuis 50 ans et comment?
Quelle est la méthodologie employée par Guillaume?
- Corpus Sankoff-Cédergren Montréal 1971
- Corpus Hochelaga-Maisonneuve 2012
- Sketch Engine (corpus écrit web)
- Inclusions :
o Un·e X de/d’
o Aucun·e espèce de/d’… - Exclusions :
o L’espèce de/d’…
o Le/la genre de/d’…
o Interruptions
o Genre non identifiable (prononciation/enregistrement) - Limite : J’ai fait confiance à la transcription!!!
Quelle est la conclusion de la recherche de Guillaume?
- Taux d’accords en 2012 autour de 82%
- Progression du phénomène en 50 ans (surtout avec genre)
- Plus de données seront nécessaires pour terminer cette étude
- Une vérification avec spectrogramme serait souhaitable
- Est-ce que la construction admet plus de noms/adjectifs? À suivre!
Qu’est-ce que la sémantique?
- Sémantique : étude scientifique de la signification
- Deux niveaux d’analyse :
o Sémantique lexicale : traite du sens des mots (ex : chien)
o Sémantique de la phrase : traite des relations sémantiques
–> À l’intérieur de la phrase
–> Entre les phrases - Est-ce que rivière est l’équivalent de river?
o Non, parce que rivière et river n’ont pas le même sens
–> La rivière du Saguenay, the Saguenay River
Rivière : + cours d’eau, - se jette dans la mer
–> Le fleuve Saint-Laurent, the St. Lawrence River
Fleuve : + cours d’eau, + se jette dans la mer
–> Donc en anglais, si on veut dire l’équivalent de fleuve en français il faut dire « river »
Qu’est-ce que l’analyse sémique (ou componentielle)?
o Permet de comparer des mots
o Tout comme les phonologues ont divisé les phonèmes en unités plus petites (les traits distinctifs), les sémanticiens divisent les mots en unités de sens minimales : les traits sémiques ou sèmes
o Exemples :
–> /p/ : [+consonne], [-nasal], [+occlusive], [-voisée]
–> /b/ : [+consonne], [-nasal], [+occlusive], [+voisée]
–> Femme : [+humain], [+adulte], [+femelle]
–> Homme : [+humain], [+adulte], [-femelle]
o Mots de même catégorie syntaxique référant à des réalités proche
o But : dégager les différences minimales qui les distinguent
o Méthode surtout utilisée pour des noms
Qu’est-ce que les sèmes? Les sémèmes?
- Sèmes : caractérisent sémantiquement les termes (en première ligne du tableau, en gras : pour s’asseoir, matériau rigide, etc.)
- Sémème : collection de sèmes particulier dont dispose chaque terme
Comment se fait l’analyse sémique?
- L’analyse sémique se fait sous forme de tableau :
o Colonnes :
–> 1e colonne : sème générique (p.ex. pour s’asseoir)
–> Colonnes suivantes : sèmes distinctifs (p.ex. matériau rigide, avec bras, etc.)
o Lignes : mots à comparer (p.ex. chaise, fauteuil, etc.)
o Sèmes codés à l’aide des symboles +, - ou 0 pour chaque mot
o Peu importe l’ordre des colonnes, il est seulement important que le sème générique soit en premier
o - : veut dire par exemple qu’il n’y a jamais de dossier sur un tabouret
o 0 : va parfois avoir des bras sur un canapé et parfois non
Quelle est l’utilité de l’analyse componentielle?
o Le lexique est un ensemble structuré, qui contient des sous-ensembles organisés (même si l’ensemble lexical est flou, il y a quand même une organisation)
o Ces sous-ensembles organisés sont en fait des microsystèmes lexicaux dont les éléments ont un dénominateur commun
o Ces sous-ensembles sont appelés « champs sémantiques »
Qu’est-ce qu’un champ sémantique?
o Association d’un ensemble de termes du lexique (champ lexical) à une notion particulière (champ notionnel)
o L’analyse sémique permet de décrire les champs sémantiques
Quelles sont les caractéristiques sémantiques du noms, soit les traits binaires?
o Humain vs non humain
–> Exemples : Jean, policière, garçon vs vache, fourmi, mer
o Animé vs inanimé
–> Humains et animaux vs autres
–> Exemples : vedette, frère, athlète, fourmi, vache vs tulipe, cartable, auto, ville
–> Seuls les noms animés peuvent varier en genre (et ils ne peuvent pas tous!)
- Comptable (ou discret) vs massif (ou dense/compact)
o Les noms comptables peuvent être utilisés avec un déterminant
–> Exemples :
Oiseau : un oiseau, deux oiseaux, trois oiseaux
Chandail : cinq chandail, dix chandails, quinze chandails
Personne : cent personnes, mille personnes
o Les noms massifs peuvent être utilisés avec un déterminant partitif (du, de la, de l’, des)
–> Exemples : du riz, du courage, de l’eau, de la farine
o Certains noms peuvent avoir le trait comptable ou non comptable selon le contexte dans lequel ils sont employés
–> Exemple :
Comptable : Il faut deux farines différentes pour faire ce pain
Non comptable : J’ajoute de la farine pour épaissir cette sauce
- Concret vs abstrait
o Les noms ont le trait concert lorsqu’ils désignent des réalités qui peuvent être perçues par les sens (vue, odorat, toucher, gout, ouïe)
o Exemples : chien, eau, rivière, télévision, vent vs idée, haine, amour, violence, confiance
- Un nom peut posséder plus d’un trait
- Il ne peut cependant posséder qu’un seul de trait de chaque paire à la fois
Qu’est-ce que les restictions sélectionnelles? Pourquoi sont-elles une utilité de l’analyse componentielle?
- Utilité de l’analyse componentielle : les restrictions sélectionnelles
o La lexie peut être décrite selon 3 axes :
–> Son sens (signifié)
–> Sa forme (signifiant)
–> Sa combinatoire restreinte - Afin d’assurer qu’une entrée ne soit pas combinée avec d’autres entrées lexicales, il faut spécifier les restrictions sélectionnelles de chaque item
o Parler : sujet doit être [+humain]
o Tuer : objet doit être [+animé]
o Dormir : sujet doit être [+animé]
o Verser : objet doit être [+massif]