Niveau, dispersion, profile Flashcards

1
Q

Quels sont les 3 composantes d’un jeu de données?

A

Niveau, dispersion, profile.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Dans le cadre des statistiques, qu’est-ce qui résume une distribution?
Que faut-il lui associer pour que ce «résumé» veuille dire quelque chose?

A

La moyenne.

Associer: variance/écart-type.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Que peut-on calculer à partir d’un jeu de données (calculs de base)?

A

Moyenne
Covariance
Variance
Ecart-type

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

À quoi sert l’écart-type et comment fonctionne-t-il?

A

Utilité: vérifier la représentativité de la moyenne.

Fonctionnement: plus l’écart-type est petit, plus la moyenne est représentative.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Dans le cadre des statistiques, qu’est-ce que le niveau?

A

La moyenne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Dans le cadre des statistiques, qu’est-ce que la dispersion?

A

Variance/écart-type.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Dans le cadre des statistiques, qu’est-ce que le profile?

A

Silhouette (la forme graphique des données).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

À quel composante d’un jeu de données le test T et dérivés (ANOVA, MANOVA, etc.) sont-ils sensibles?

A

Au niveau (moyenne).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

À quel composante d’un jeu de données l’analyse factorielle (AF) est-elle sensible?

A

Au profile (silhouette) (corrélation???).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quel calcul fait-on lorsque nous centrons des données?

Quelle en est la conséquence mathématique?

A

Données brutes moins moyenne.

Moyenne = 0.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quel(s) calcul(s) fait-on lorsque nous standardisons des données?
Quels sont les moyennes et écart-type de données standardisées?
En général comment appelle-t-on cette standardisation?

A

Calculs de la standardisation:

  1. Données brutes moins moyenne (= données centrées);
  2. données centrées divisées par écart-type (= données standardisées).

μ = 0, σ = 1

Appelée score Z.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quelle est la formule simplifiée de l’écart-type?

A

s = sqrt((n∑(x^2)-(∑x)^2))/(n(n-1)))

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quel calcul doit-on faire pour trouver la variabilité partagée (variance expliquée) d’une corrélation?

A

Il faut mettre le coefficient de corrélation au carré (p.ex: r = 0.84; r^2 = 0.71, donc la corrélation explique 71% de la variance).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce que l’effet de «restriction de gamme»?

A

Lorsqu’il y a peu d’observation il y a un risque de «restriction de gamme», c’est-à-dire qu’on ne trouve pas de corrélation à cause d’un n (échantillon) trop petit.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Dans la «Classification des principales techniques d’analyse des données», quelles sont les types de populations que l’on peut avoir?

A

Homogène et hétérogène.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Dans la «Classification des principales techniques d’analyse des données», quelles sont les types de solutions que l’on peut avoir?

A

Dimensionnelle et non-dimensionnelle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Dans la «Classification des principales techniques d’analyse des données», quel est le type d’information que l’on peut avoir?

A

«Profil» et «profile & niveau»

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Dans la «Classification des principales techniques d’analyse des données», quelles sont les types de niveaux que l’on peut avoir?

A
Analyse multidimensionnelle  (MDS)
Analyse typologique
Analyse multidimensionnelle  (INDSCAL)
Analyse multivariée de la variance / De segmentation.
19
Q

Comment appelle-t-on des facteurs qui sont totalement indépendants l’un de l’autre?

A

Des facteurs orthogonaux.

20
Q

Avec quel modèle statistique fait-on des rotations?
Avec quel type de données effectue-t-on une rotation?
À quoi sert une rotation?

A

On fait des rotations dans des Analyses Factorielles.
Une rotation se fait avec les saturations (corrélations).
Une rotation sert à rendre les données plus lisible pour les êtres humains.

21
Q

Que fait une rotation de données?

A

La rotation redistribue (les variances? saturations?) entre les facteurs retenus (VP > 1).
Ce qui permet de garder moins de facteur, donc de retrouver les dimensions les plus importantes (données plus faciles à traiter).
Mais on perd une partie de l’information initiale.
(Il s’agit de changer les axes de référence des observations, alors que ces observations restent au même endroit les unes par rapport aux autres.)

22
Q

Quels sont les types de facteurs que l’on trouve en AF?

Expliquez-les.

A
  • Facteur général: toutes les variables contribuent à ce facteur (profiles similaires).
  • Facteur de groupe/unipolaire: sous-ensemble de variables qui saturent fortement et d’autres qui ne contribuent pas au facteur.
  • Facteur bipolaire: saturations positives extrêmes et saturations négatives extrêmes.
23
Q

Quels sont les risques inhérents d’un facteur?

A

¿¿¿Que le facteur résume aussi des biais et qu’ils soient redistribués sur les facteurs où la rotation a été effectuée.???

24
Q

À quoi est sensible l’analyse en Cluster?

A

Au niveau (moyennes).

25
Q

Dans la «Classification des principales techniques d’analyse des données», à quel type de population l’analyse en Cluster correspond-il?
À quel composante du jeu de données fait-elle référence?

A

Population de l’analyse en Cluster: homogène.

Composante du jeu de données: niveau (moyennes).

26
Q

Que trouve-t-on au sommet d’un arbre d’analyse en Cluster?

Que trouve-t-on tout en-bas, et pourquoi?

A
  • En haut de l’arbre: hétérogénéité maximale;

- En bas de l’arbre: homogénéité maximales, parce que chaque élément est dans son propre groupe.

27
Q

Que ne faut-il jamais dire lorsque les saturations d’une Analyse Factorielle concordent?
Pourquoi?

A

Il ne faut jamais dire que les individus sont en accord/désaccord avec les items!
Parce que l’AF est une analyse de profile (silhouette).

28
Q

Que nous disent les saturations factorielles?

Qu’est-ce que cela veut dire à propos des items de deux facteurs différents, p.ex.?

A

Ce qui est concordant et discordant en terme de profile.
Cela veut dire que s’il y a augmentation du score des items dans un profile, il y aura une augmentation des scores des items de l’autre profile (et vice-versa).

29
Q

De quoi faut-il s’aider pour pour pouvoir interpréter des facteurs d’une AF?
Comment les calcule-t-on?

A

Interprétation des facteurs: scores factoriels (SF).
Calcul d’un SF:
- prendre les scores bruts des items du facteur;
- multiplier chaque score brut avec la saturation correspondante du facteur;
- additionner les résultats;
- on obtient le SF.

30
Q

Et on fait quoi avec tout ça???
C’est quoi le but?
Pages 8 à 12-13.

A

bla-bla-bla

31
Q

Comment fait-on pour définir une composante (facteur) d’une analyse factorielle?

A
  • Pour chaque composante (facteur) on retient les saturations > .60
  • On regarde les items correspondants.
  • Tenter de définir ce que cela représente.
32
Q

Comment se calcule une communalité (communauté)?

À quoi sert-elle?

A

Pour un item = somme des carrés des saturations.

Cest la variance expliquée par les facteurs retenus pour un item.

33
Q

Comment se calcule une valeur propre?

À quoi sert-elle?

A

Somme des saturations au carré d’un facteur.

Sert à rejeter les facteurs ayant une valeur propre

34
Q

Pourquoi inverse-t-on l’échelle des items dans un questionnaire?

A

Pour voir s’il y a congruence ou incongruence dans les réponses.

35
Q

Comment interpréter un scatterplot d’Analyse Factorielle?

A
  1. regarder les points sur facteur 1 (abscisse): général, unipolaire ou bipolaire?
  2. regarder les points sur facteur 2 (ordonnée): général, unipolaire ou bipolaire?
  3. on essaie de faire des groupes de points (regarder les espaces)
  4. on regarde le point en commun dans chaque groupe et essayer de ressortir un qualificatif pour chaque groupe
36
Q

Quelle est la différence entre MDS et ACP?

A

Dans la MDS la possibilité d’interpréter la configuration obtenue en terme de distances (cf. carte géographique: plus il y a de points plus ça devient précis).

37
Q

Que se passe-t-il si on augmente le nombre d’observations?

A

On augmente la fidélité.

38
Q

Par opposition à l’ACP, sur quoi travaille la MDS?

A

MDS: distances
ACP: corrélations (saturations)

39
Q

Comment les signes des saturations et orientation des axes sont-ils définis?

A

De manière arbitraire.

40
Q

Dans une ACP à 2 dimensions, quel dimension va sur quel axe?

A

Dimension la plus importante (dimension 1) sur l’abscisse.

41
Q

Quelle est la différence entre les Clusters et la MDS?

A

MDS travaille sur dimensions, pas les Clusters.

42
Q

Dans une MDS quelles sont les limites à respecter dans le Stress et RSQ pour qu’on puisse considérer l’interprétation des dimensions mesurées?

A

Sress .9

43
Q

Comment tente-t-on d’interpréter des dimensions dans un tableau Stimulus Coordinates (SPSS)?

A
  1. On regarde dimension après dimension;
  2. on regroupe les valeurs négatives et positives en excluant les valeurs autour de 0 (pour 2 dimensions regarder le scatterplot).
44
Q

Quid cluster

A

???