Cours 6 - Les analyses factorielles Flashcards
Quelle est la question de la dimensionnalité ?
Dans un item, il y a différentes sources de variances (erreurs, attributs). Combien et quels sont les attributs ?
Comment peut être la dimensionnalité d’un test ?
uni ou muli-dimentionnel
-> il faut identifier précisément combien il y a de dimensions et quelles sont-elles
Exemple de la dimensionnalité d’un gâteau
chocolat, beurre, sucre, oeufs farine
Gâteau = a(chocolat) + b(beurre) + c(sucre) + d(oeufs) + e(farine)
Gâteau = a(chocolat) + b(beurre) + c(sucre) + d(oeufs) + e(farine)
Que peut on dire de cette équation ?
Chaque ingrédient est un attribut. On identifier combien il y en a, puis on identifie l’importance de chaque ingrédient avec des coéfficients. Ces ingrédients vont être pondérés.
Pour un gateau, on pourrait avoir bcp de chocolat mais peu de beurre, et l’inverse pour un autre gâteau. Donc les dimensions sont les mêmes mais la pondération est différente.
Dimensionnalité d’un test
On va prendre que des items ou p.ex. la composante verbale est la plus importante.
On crée un score composite qui va majoritairement dans le verbal mais évalue aussi les autres.
Il faut apporter ensuite des preuves sur quel est l’attribut majoritaire (mais y’a tjrs plusieurs attribut qui sous-tendent le résultat).
Commencer par utiliser les analyse factorielles pour essayer de comprendre quels sont les dimensions qui sous-tendent la performance.
A quoi sert l’analyse factorielle ?
Pour comprendre quel attribut est évaluer pour chacune des épreuve, faut regarder la corrélation d’un attribut avec tous les autres. (colonnes). L’objectif serait d’arriver à faire des regroupement.
Mais pour arriver à faire des hypothèses sur les attributs qui sous-tendent les différentes épreuves, il faudrait tenir compte de toutes les corrélations en même temps mais c’est pas possible. C’est pour ça qu’on fait des analyse factorielles pour réduire la quantité de corrélations.
Quelles sont les types d’analyses ?
Analyse factorielles exploratoire
- variable formative -> analyse en composantes principales (ACP)
- Variable réflective -> analyse en axes principaux
Analyse facotrielles confirmatoires
Lors d’une analyse en axes principaux, que fait on avec la matrice de corrélation ?
L’objectif va être de réduire cette matrice de corrélation (réduire la quantité d’informations) et d’essayer d’identifier les attributs psycho.
L’analyse factorielle va tenir compte de toutes ces corrélations et nous dire comment s’organise les items.
Quelle est la première information qu’on va avoir qd on réalise une analyse factorielle ?
les saturations
A quoi correspondent les saturations ?
Ces saturations correspondent à une corrélation, il s’agit d’une corrélation entre l’item et un attribut psycho qui n’a pas été observé mais obtenu par inférence.
A partir de quoi est faire une corrélation ?
à partir de 2 scores manifestes
Quand parle-t-on de saturation et plus de corrélation ?
Qd on test l’association d’une variable manifeste et une variable latente (= non observée)
Quelles saturations sont acceptables ou non ?
Il n’y a pas de critère statistique mais généralement on accepte des saturation autour de .30 et .40. Si on a plus de .70, c’est très fort.
Quel travail fait-on avec les saturations ?
Le travail est d’identifier pour chaque item où se trouve la valeur la plus importante.
Pour l’item 1 p.ex. c’est PA1, puis PA2.
On fait ce travail pour chaque item en identifiant la valeur la plus élevée.
Ici dans l’exemple du cours, ts les items semblent partager un même items en commun (PA1), donc pour les 6 items, l’attribut psycho qui se cache derrière PA1 est le plus important
Qu’est-ce qu’une saturation (dans une représentation visuelle) ?
Projections sur les axes de référence.
Les saturations traduisent des coordonnées
spatiales.
P.ex. item 2 projette à .59 sur PA1 et .53 sur axe PA2.
Ts les items ici saturent avec la même importance sur le 1e ingrédient mais ça varie sur la deuxième attribut : on a un paquet avec 1,2,3 et un autre avec 4,5,6.
Donc 1,2,3 doivent avoir les mêmes attributs psycho.
A quoi servent les valeurs propres ?
Les valeurs propre nous renseigne sur l’importance de chacun des facteurs.
Comment obtient-on les valeurs propres ?
Pour les obtenir, on travail sur toutes les saturations associée à un attribut. On élève chaque saturation au carré et on les additionne.
-> somme des saturation élevées au carré
Quels critères peuvent être utilisés pour déterminer combien de facteurs on conserve et combien on élimine ?
- Critère de Kaiser
- Scree plot
- Parallel analysis
En quoi consiste le critère de Kaiser ?
Seuls les facteurs avec une valeur propre > 1 doivent être conservés. Les autres doivent être éliminés.
Ce critère est très mauvais !
En quoi consiste le scree plot ?
C’est une rpz en 2D avec les facteurs sur l’axe des x et les valeurs propres sur les y.
À partir de là, la logique est de dire qu’on part du dernier facteur et on trace une droite pour aligner tous les derniers facteurs. Et tous les facteurs qui sont alignés peuvent être éliminés car il n’explique qu’un tout petit peu plus de variance.
Donc on garde que ceux qui sortent de l’alignement.
En quoi consiste l’analyse parallèle ?
Il fait une simulation à partir des données et nous disent combien de facteurs sont nécessaires.
c’est le critère qui donne les résultats les plus corrects
Les critères donnent-ils tjrs le même résultat ?
Non. Dans l’exemple du cours il y a le même résultat mais c’est pas tjrs le cas
Après avoir déterminer quels facteurs on garde, que fait-on ?
Il faut maintenant interpréter les facteurs, savoir quels attributs psycho ils rendent compte.
Dans l’exemple du cours, on a gardé PA1 et PA2.
Il a besoin d’aller voir quels sont les items sur PA1 et sur PA2 et déterminer ce qui correspond.
Quelle stratégie utilise-t-on pour interpréter les facteurs et déterminer les attributs ?
la rotation des facteurs
Qu’est-ce que la rotation de facteurs ?
Les saturations sont une projection sur un système de coordonnées.
L’axe ne nous amène pas à comprendre les attributs psycho -> on va effectuer des rotations de ce système d’axe pour faciliter l’interprétation
Quels sont les types de rotation ?
- Si facteurs orthogonaux (=facteurs indépendants) : rotation Varimax
- Si facteurs corrélés -> rotation oblique : Promax - oblimin
Que se passe-t-il dans la représentation graphique qd on fait une rotation ?
Le positionnement respectif est tjrs le même d’un pdv spatial. La distance entre les items est la même mais on a changé d’axe de rotation. Comme si on avait décallé le système d’axe, donc autre axe de référence pour avoir de nouvelles coordonnées.
Que se passe-t-il avec les saturations quand on fait une rotation ?
L’application de la rotation conduit à des modif des valeurs de saturations (coordonnées spatiales) et donc des valeurs propres.
on augmente la différenciation entre les items
Quel est l’intérêt de faire une rotation ?
faciliter l’interprétation
Quelle étape fait-on après la rotation ?
Chercher quelle part de variance les facteurs expliquent pour chaque items
Comment on va Chercher quelle part de variance les facteurs expliquent pour chaque items?
grâce à la communauté, noté h2.
si p.ex. h2 est de .49, alors les facteurs expliquent 49% de la variance.
On obtient également u2, qui serait ici de .51 est qui représente ce qui n’est pas expliqué par les facteurs
A quoi sert la notion de communauté ?
Cela permet de voir si les facteurs sont de bons indicateurs de la variance.
-> probabilité que les facteurs soient vrm utiles
Comment obtient-on la communauté ?
La communauté est obtenue par la somme de toutes les saturations élevées au carré
A quoi servent les analyses factorielles ?
es analyse factorielles servent à expliquer les différences interindividuelles sur les tests.
Dans le WISC5 on a 5 facteurs et on est arrivé à ce nombre grâce aux analyses factorielles.
Qu’est-ce que le concept d’ergodicité ?
On considère que la structure des diff inter- est valable pour la structure intra.
Ce qu’on a observé pour expliquer les diff entre individu s’applique aussi de manière individuelle.
P.ex. des fois le modèle en 5 facteur du WISC5 ne suffit pas car il n’y a pas tjrs les 5 facteurs chez ts les enfants.
La grille de départ n’est pas valable pour tous les individus. Il faut trouver alors une organisation qui fasse du sens.