Niveau, dispersion, profile Flashcards

Question 1

Q

Quels sont les 3 composantes d’un jeu de données?

Answer

A

Niveau, dispersion, profile.

Question 2

Q

Dans le cadre des statistiques, qu’est-ce qui résume une distribution?
Que faut-il lui associer pour que ce «résumé» veuille dire quelque chose?

Answer

A

La moyenne.

Associer: variance/écart-type.

Question 3

Q

Que peut-on calculer à partir d’un jeu de données (calculs de base)?

Answer

A

Moyenne
Covariance
Variance
Ecart-type

Question 4

Q

À quoi sert l’écart-type et comment fonctionne-t-il?

Answer

A

Utilité: vérifier la représentativité de la moyenne.

Fonctionnement: plus l’écart-type est petit, plus la moyenne est représentative.

Question 5

Q

Dans le cadre des statistiques, qu’est-ce que le niveau?

Answer

A

La moyenne.

Question 6

Q

Dans le cadre des statistiques, qu’est-ce que la dispersion?

Answer

A

Variance/écart-type.

Question 7

Q

Dans le cadre des statistiques, qu’est-ce que le profile?

Answer

A

Silhouette (la forme graphique des données).

Question 8

Q

À quel composante d’un jeu de données le test T et dérivés (ANOVA, MANOVA, etc.) sont-ils sensibles?

Answer

A

Au niveau (moyenne).

Question 9

Q

À quel composante d’un jeu de données l’analyse factorielle (AF) est-elle sensible?

Answer

A

Au profile (silhouette) (corrélation???).

Question 10

Q

Quel calcul fait-on lorsque nous centrons des données?

Quelle en est la conséquence mathématique?

Answer

A

Données brutes moins moyenne.

Moyenne = 0.

Question 11

Q

Quel(s) calcul(s) fait-on lorsque nous standardisons des données?
Quels sont les moyennes et écart-type de données standardisées?
En général comment appelle-t-on cette standardisation?

Answer

A

Calculs de la standardisation:

Données brutes moins moyenne (= données centrées);
données centrées divisées par écart-type (= données standardisées).

μ = 0, σ = 1

Appelée score Z.

Question 12

Q

Quelle est la formule simplifiée de l’écart-type?

Answer

A

s = sqrt((n∑(x^2)-(∑x)^2))/(n(n-1)))

Question 13

Q

Quel calcul doit-on faire pour trouver la variabilité partagée (variance expliquée) d’une corrélation?

Answer

A

Il faut mettre le coefficient de corrélation au carré (p.ex: r = 0.84; r^2 = 0.71, donc la corrélation explique 71% de la variance).

Question 14

Q

Qu’est-ce que l’effet de «restriction de gamme»?

Answer

A

Lorsqu’il y a peu d’observation il y a un risque de «restriction de gamme», c’est-à-dire qu’on ne trouve pas de corrélation à cause d’un n (échantillon) trop petit.

Question 15

Q

Dans la «Classification des principales techniques d’analyse des données», quelles sont les types de populations que l’on peut avoir?

Answer

A

Homogène et hétérogène.

Question 16

Q

Dans la «Classification des principales techniques d’analyse des données», quelles sont les types de solutions que l’on peut avoir?

Answer

A

Dimensionnelle et non-dimensionnelle.

Question 17

Q

Dans la «Classification des principales techniques d’analyse des données», quel est le type d’information que l’on peut avoir?

Answer

A

«Profil» et «profile & niveau»

Question 18

Q

Dans la «Classification des principales techniques d’analyse des données», quelles sont les types de niveaux que l’on peut avoir?

Answer

A

Analyse multidimensionnelle  (MDS)
Analyse typologique
Analyse multidimensionnelle  (INDSCAL)
Analyse multivariée de la variance / De segmentation.

Question 19

Q

Comment appelle-t-on des facteurs qui sont totalement indépendants l’un de l’autre?

Answer

A

Des facteurs orthogonaux.

Question 20

Q

Avec quel modèle statistique fait-on des rotations?
Avec quel type de données effectue-t-on une rotation?
À quoi sert une rotation?

Answer

A

On fait des rotations dans des Analyses Factorielles.
Une rotation se fait avec les saturations (corrélations).
Une rotation sert à rendre les données plus lisible pour les êtres humains.

Question 21

Q

Que fait une rotation de données?

Answer

A

La rotation redistribue (les variances? saturations?) entre les facteurs retenus (VP > 1).
Ce qui permet de garder moins de facteur, donc de retrouver les dimensions les plus importantes (données plus faciles à traiter).
Mais on perd une partie de l’information initiale.
(Il s’agit de changer les axes de référence des observations, alors que ces observations restent au même endroit les unes par rapport aux autres.)

Question 22

Q

Quels sont les types de facteurs que l’on trouve en AF?

Expliquez-les.

Answer

A

Facteur général: toutes les variables contribuent à ce facteur (profiles similaires).
Facteur de groupe/unipolaire: sous-ensemble de variables qui saturent fortement et d’autres qui ne contribuent pas au facteur.
Facteur bipolaire: saturations positives extrêmes et saturations négatives extrêmes.

Question 23

Q

Quels sont les risques inhérents d’un facteur?

Answer

A

¿¿¿Que le facteur résume aussi des biais et qu’ils soient redistribués sur les facteurs où la rotation a été effectuée.???

Question 24

Q

À quoi est sensible l’analyse en Cluster?

Answer

A

Au niveau (moyennes).

Question 25

Q

Dans la «Classification des principales techniques d’analyse des données», à quel type de population l’analyse en Cluster correspond-il?
À quel composante du jeu de données fait-elle référence?

Answer

A

Population de l’analyse en Cluster: homogène.

Composante du jeu de données: niveau (moyennes).

Question 26

Q

Que trouve-t-on au sommet d’un arbre d’analyse en Cluster?

Que trouve-t-on tout en-bas, et pourquoi?

Answer

A

En haut de l’arbre: hétérogénéité maximale;

- En bas de l’arbre: homogénéité maximales, parce que chaque élément est dans son propre groupe.

Question 27

Q

Que ne faut-il jamais dire lorsque les saturations d’une Analyse Factorielle concordent?
Pourquoi?

Answer

A

Il ne faut jamais dire que les individus sont en accord/désaccord avec les items!
Parce que l’AF est une analyse de profile (silhouette).

Question 28

Q

Que nous disent les saturations factorielles?

Qu’est-ce que cela veut dire à propos des items de deux facteurs différents, p.ex.?

Answer

A

Ce qui est concordant et discordant en terme de profile.
Cela veut dire que s’il y a augmentation du score des items dans un profile, il y aura une augmentation des scores des items de l’autre profile (et vice-versa).

Question 29

Q

De quoi faut-il s’aider pour pour pouvoir interpréter des facteurs d’une AF?
Comment les calcule-t-on?

Answer

A

Interprétation des facteurs: scores factoriels (SF).
Calcul d’un SF:
- prendre les scores bruts des items du facteur;
- multiplier chaque score brut avec la saturation correspondante du facteur;
- additionner les résultats;
- on obtient le SF.

Question 30

Q

Et on fait quoi avec tout ça???
C’est quoi le but?
Pages 8 à 12-13.

Answer

A

bla-bla-bla

Question 31

Q

Comment fait-on pour définir une composante (facteur) d’une analyse factorielle?

Answer

A

Pour chaque composante (facteur) on retient les saturations > .60
On regarde les items correspondants.
Tenter de définir ce que cela représente.

Question 32

Q

Comment se calcule une communalité (communauté)?

À quoi sert-elle?

Answer

A

Pour un item = somme des carrés des saturations.

Cest la variance expliquée par les facteurs retenus pour un item.

Question 33

Q

Comment se calcule une valeur propre?

À quoi sert-elle?

Answer

A

Somme des saturations au carré d’un facteur.

Sert à rejeter les facteurs ayant une valeur propre

Question 34

Q

Pourquoi inverse-t-on l’échelle des items dans un questionnaire?

Answer

A

Pour voir s’il y a congruence ou incongruence dans les réponses.

Question 35

Q

Comment interpréter un scatterplot d’Analyse Factorielle?

Answer

A

regarder les points sur facteur 1 (abscisse): général, unipolaire ou bipolaire?
regarder les points sur facteur 2 (ordonnée): général, unipolaire ou bipolaire?
on essaie de faire des groupes de points (regarder les espaces)
on regarde le point en commun dans chaque groupe et essayer de ressortir un qualificatif pour chaque groupe

Question 36

Q

Quelle est la différence entre MDS et ACP?

Answer

A

Dans la MDS la possibilité d’interpréter la configuration obtenue en terme de distances (cf. carte géographique: plus il y a de points plus ça devient précis).

Question 37

Q

Que se passe-t-il si on augmente le nombre d’observations?

Answer

A

On augmente la fidélité.

Question 38

Q

Par opposition à l’ACP, sur quoi travaille la MDS?

Answer

A

MDS: distances
ACP: corrélations (saturations)

Question 39

Q

Comment les signes des saturations et orientation des axes sont-ils définis?

Answer

A

De manière arbitraire.

Question 40

Q

Dans une ACP à 2 dimensions, quel dimension va sur quel axe?

Answer

A

Dimension la plus importante (dimension 1) sur l’abscisse.

Question 41

Q

Quelle est la différence entre les Clusters et la MDS?

Answer

A

MDS travaille sur dimensions, pas les Clusters.

Question 42

Q

Dans une MDS quelles sont les limites à respecter dans le Stress et RSQ pour qu’on puisse considérer l’interprétation des dimensions mesurées?

Question 43

Q

Comment tente-t-on d’interpréter des dimensions dans un tableau Stimulus Coordinates (SPSS)?

Answer

A

On regarde dimension après dimension;
on regroupe les valeurs négatives et positives en excluant les valeurs autour de 0 (pour 2 dimensions regarder le scatterplot).

Question 44

Q

Quid cluster