Niveau, dispersion, profile Flashcards
Quels sont les 3 composantes d’un jeu de données?
Niveau, dispersion, profile.
Dans le cadre des statistiques, qu’est-ce qui résume une distribution?
Que faut-il lui associer pour que ce «résumé» veuille dire quelque chose?
La moyenne.
Associer: variance/écart-type.
Que peut-on calculer à partir d’un jeu de données (calculs de base)?
Moyenne
Covariance
Variance
Ecart-type
À quoi sert l’écart-type et comment fonctionne-t-il?
Utilité: vérifier la représentativité de la moyenne.
Fonctionnement: plus l’écart-type est petit, plus la moyenne est représentative.
Dans le cadre des statistiques, qu’est-ce que le niveau?
La moyenne.
Dans le cadre des statistiques, qu’est-ce que la dispersion?
Variance/écart-type.
Dans le cadre des statistiques, qu’est-ce que le profile?
Silhouette (la forme graphique des données).
À quel composante d’un jeu de données le test T et dérivés (ANOVA, MANOVA, etc.) sont-ils sensibles?
Au niveau (moyenne).
À quel composante d’un jeu de données l’analyse factorielle (AF) est-elle sensible?
Au profile (silhouette) (corrélation???).
Quel calcul fait-on lorsque nous centrons des données?
Quelle en est la conséquence mathématique?
Données brutes moins moyenne.
Moyenne = 0.
Quel(s) calcul(s) fait-on lorsque nous standardisons des données?
Quels sont les moyennes et écart-type de données standardisées?
En général comment appelle-t-on cette standardisation?
Calculs de la standardisation:
- Données brutes moins moyenne (= données centrées);
- données centrées divisées par écart-type (= données standardisées).
μ = 0, σ = 1
Appelée score Z.
Quelle est la formule simplifiée de l’écart-type?
s = sqrt((n∑(x^2)-(∑x)^2))/(n(n-1)))
Quel calcul doit-on faire pour trouver la variabilité partagée (variance expliquée) d’une corrélation?
Il faut mettre le coefficient de corrélation au carré (p.ex: r = 0.84; r^2 = 0.71, donc la corrélation explique 71% de la variance).
Qu’est-ce que l’effet de «restriction de gamme»?
Lorsqu’il y a peu d’observation il y a un risque de «restriction de gamme», c’est-à-dire qu’on ne trouve pas de corrélation à cause d’un n (échantillon) trop petit.
Dans la «Classification des principales techniques d’analyse des données», quelles sont les types de populations que l’on peut avoir?
Homogène et hétérogène.
Dans la «Classification des principales techniques d’analyse des données», quelles sont les types de solutions que l’on peut avoir?
Dimensionnelle et non-dimensionnelle.
Dans la «Classification des principales techniques d’analyse des données», quel est le type d’information que l’on peut avoir?
«Profil» et «profile & niveau»