Cours 7 Flashcards
Quelle est la différence entre la moyenne, la médiane et le mode ?
➜ Moyenne : somme des valeurs divisée par leur nombre.
➜ Médiane : valeur centrale d’un ensemble ordonné.
➜ Mode : valeur la plus fréquente.
Quels sont les tests paramétriques les plus utilisés pour comparer des moyennes ?
➜ Test t et ANOVA.
Pourquoi la médiane est-elle plus robuste que la moyenne en présence de valeurs extrêmes ?
➜ Parce qu’elle n’est pas influencée par les valeurs aberrantes.
Quelle est la signification de l’écart-type ?
➜ Il mesure la dispersion des valeurs autour de la moyenne.
Pourquoi l’étendue est-elle une mesure limitée de la dispersion ?
➜ Parce qu’elle ne prend en compte que les valeurs extrêmes et ignore la distribution globale.
Quelle est la différence entre une erreur de type I et une erreur de type II ?
➜ Une erreur de type I rejette une hypothèse vraie, tandis qu’une erreur de type II ne détecte pas un effet réel.
Pourquoi utilise-t-on le test de Mann-Whitney ?
➜ Pour comparer deux groupes lorsque les données ne suivent pas une distribution normale.
Dans quel cas faut-il utiliser une ANOVA plutôt qu’un test t ?
➜ Lorsque l’on compare plus de deux groupes.
Pourquoi la distribution normale est-elle importante en statistique ?
➜ Elle permet d’appliquer de nombreux tests statistiques basés sur cette hypothèse.
Que représente un centile dans une distribution de données ?
➜ La valeur sous laquelle se trouve un certain pourcentage des observations.
Pourquoi utilise-t-on une transformation en Z dans les analyses statistiques ?
➜ Pour normaliser les données et comparer des distributions différentes.
Pourquoi faut-il fixer un seuil de signification avant une analyse statistique ?
➜ Pour éviter d’interpréter des différences qui pourraient être dues au hasard.
Quels sont les trois éléments principaux d’une distribution de données ?
➜ La tendance centrale, la dispersion et la forme de la distribution.
Pourquoi la médiane est-elle plus robuste que la moyenne ?
➜ Parce qu’elle n’est pas affectée par les valeurs extrêmes.
Quelle est la relation entre variance et écart-type ?
➜ L’écart-type est la racine carrée de la variance.
Pourquoi l’étendue est-elle une mauvaise mesure de dispersion ?
➜ Parce qu’elle ne prend en compte que les valeurs extrêmes et pas la répartition globale des données.
Que signifie une distribution asymétrique à droite ?
➜ La majorité des valeurs sont concentrées à gauche, avec une queue allongée à droite.
Que mesure le coefficient d’aplatissement (kurtosis) ?
➜ Le degré de concentration des valeurs autour de la moyenne.
Pourquoi la loi normale est-elle souvent utilisée en statistique ?
➜ Parce que de nombreux phénomènes naturels suivent cette distribution.
Dans une loi normale, quelle proportion des valeurs se trouvent à ±1 écart-type de la moyenne ?
➜ Environ 68,3 %.
Quelles sont les étapes d’un test d’hypothèse ?
➜ 1. Formuler H₀ et H₁
2. Fixer le seuil de signification (α)
3. Calculer la statistique de test
4. Comparer avec la valeur critique
5. Tirer une conclusion
Pourquoi une valeur p inférieure à 0,05 est-elle considérée comme significative ?
➜ Parce qu’elle indique qu’il y a moins de 5 % de chances que le résultat soit dû au hasard.
Que signifie une erreur de type I ?
➜ Rejeter une hypothèse nulle alors qu’elle est vraie (faux positif).
Que signifie une erreur de type II ?
➜ Ne pas rejeter une hypothèse nulle alors qu’elle est fausse (faux négatif).
Dans quel cas utilise-t-on un test t pour échantillons indépendants ?
➜ Lorsque l’on compare la moyenne de deux groupes distincts.
Pourquoi l’ANOVA est-elle préférable à plusieurs tests t lorsqu’on compare plus de deux groupes ?
➜ Pour éviter l’augmentation du risque d’erreur de type I.
Quelle est la différence entre un test t pour échantillons indépendants et un test t apparié ?
➜ Le test apparié compare les moyennes de mêmes individus mesurés à deux moments.
Quand doit-on utiliser un test non paramétrique ?
➜ Lorsque les conditions d’application des tests paramétriques ne sont pas respectées (ex. absence de normalité).
Quel test non paramétrique est l’équivalent du test t pour échantillons indépendants ?
➜ Le test de Mann-Whitney.
Pourquoi le test du Khi-deux est-il utilisé pour les variables catégorielles ?
➜ Pour vérifier l’indépendance entre deux variables qualitatives.
Quelle est la différence entre une corrélation de Pearson et une corrélation de Spearman ?
➜ Pearson pour les variables continues, Spearman pour les variables ordinales ou non normales.
Quel est le risque d’interpréter une corrélation comme une causalité ?
➜ Il peut exister une variable confondante expliquant la relation.
Pourquoi utilise-t-on une régression linéaire ?
➜ Pour prédire la valeur d’une variable en fonction d’une autre.
Pourquoi le théorème de la limite centrale est-il fondamental en statistique ?
➜ Il garantit que la distribution des moyennes échantillonnales suit une loi normale.
Que se passe-t-il si l’échantillon est trop petit pour appliquer le théorème de la limite centrale ?
➜ La distribution des moyennes peut rester asymétrique et invalider les tests paramétriques.