examen 2 Flashcards
Quels sont les 4 tests que l’ont peut appliquer pour des lois normales (paramétriques) et quand peut-on les appliquer?
1-Test T: Pour faire une comparaison entre deux moyennes
2-ANOVA : comparaison entre plus de deux moyennes
3-Pearson : Corrélation, liaison entre deux variables quantitatives
4-Régression linéaire:décrire la relation entre une variable aléatoire dépendante (y) et un ensemble de variables indépendantes ou prédictives x. Pour prédire des données
Que faut-il faire avant d’appliquer un test paramétrique ou non paramétrique et pourquoi faut-il faire ça?
Vérifier s’il s’agit d’une loi normale ou pas
Pour savoir quel test appliquer
Peut-on appliquer des tests non paramétriques sur des lois normales?
Oui mais ces tests sont moins performants.
Est-il vrai de dire qu’on compare la même mesure quantitative sur deux groupes différents pour comparer deux moyennes?
Oui: H0 = Μ1 = Μ2
H1 = Μ1 ≠ Μ2 (bilatéral) ou Μ1
Est-il vrai de dire que les échantillons n’ont pas à avoir le même nombre d’éléments pour pouvoir comparer les moyennes?
Oui vrai.
Est-il vrai de dire que plus les variances sont différentes plus le ratio monte en valeurs?
Oui
Comment s’écrit l’hypothèse statistique du test lorsqu’il y a égalité des variances des deux populations?
H0:Q2x1=Q2x2
Comment s’écrit l’hypothèse statistique du test lorsque les variances des deux populations sont différentes?
H1:Q2x1=/(égale pas)Q2x2
Quoi faire lorsque les conditions d’applications ne sont pas respectées?
Lorsque les variances Q2 1 et Q2 2 ne sont pas homogènes mais la distribution est normale il faut faire le test de Weich T à appliquer après le test de T (SPSS) donne les 2 résultats.
Lorsqu’on utilise le test bilatérale on utiles quoi?
Le P du test
Lorsqu’on utilise le test unilatérale on utilise quoi?
Le P divisé par 2: P/2
À quoi consiste le test ANOVA?
1-La méthode consiste à analyser la variance totale, intragroupe et intergroupe pour comparer les moyennes et tester l’hypothèse.
2-L’ANOVA va analyser la variabilité intra groupe et inter groupe pour donner une moyenne globale
3-Les groupes sont identifiés par une variable qualitative (nominale) qui représente le facteur de classification.
4-Un test ANOVA n’est pas une répétition de test.
5-On ne peu pas remplacer l’ANOVA par une série de tests t. car le risque de répéter le test plusieur fois augmente le risque d’erreurs.
ex: H0=Ma=mb=mk (mk:c’est l’adition de toute les autres moyenne après les deux première on écri mk pour représenter les autres)
Condition à respecter pour le test d’ANOVA?
1-Distribution normale pour chaque groupe
2-homogénéité des variances
a)Variance homogène (similaires): ANOVA
b)Variance hétérogène (différentes):Welch, ANOVA
3-Indépendance des données (important)
pas de données appariées.
4-On va utiliser le test de comparaison multiple seulement si on refuse Ho.
Que veut dire des séries statistiques doubles?
1-Qui analyse deux variable en même temps
2-Analyse simultanée de deux variables mesurés sur les mêmes éléments
Ex:Élément=un individu
-Variable1 :QI
-Variable2 : Largeur du crâne
-Variable 3 :Nombre d’années d’études
Que veut dire Corrélation paramétrique, r de Peareson?10
1-C’est une mesure de la liaison linéaire entre deux variables c’est à dire la capacité de prédire une variable x par une autre y à l’aide d’un modèle linéaire.
2-C’ est un indice statistique qui exprime l’intensité et le sens (positif ou négatif) de la relation linéaire entre deux variables quantitatives.
3-Il permet de mesurer l’intensité de la liaison entre deux caractères quantitatifs.
4-Ce coefficient est nul (r = 0) lorsqu’il n’y a pas de relation linéaire entre les variables (ce qui n’exclut pas l’existence d’une relation autre que linéaire).
5-Ce coefficient est de signe positif si la relation est positive (directe, croissante) et de signe négatif
si la relation est négative (inverse, décroissante).
6-Ce coefficient varie entre -1 et +1
7-L’intensité de la relation linéaire sera donc plus
forte quand la valeur du coefficient est proche de +1 ou de - 1, et plus faible lorsqu’elle est proche de 0.
8-une valeur proche de +1 montre une forte liaison entre les deux caractères ( relation linéaire croissante c’est-à-dire que les variables varient dans le même sens)
9-une valeur proche de -1 montre également une forte liaison mais la relation linéaire entre les deux caractères est décroissante (les variables varient dans le sens contraire);
10-une valeur proche de 0 montre une absence de relation linéaire entre les deux caractères.
À quoi sert le coefficient de corrélation? 5
1-Mesurer le degré d’association entre deux variables
2-Indiquer si les variations des valeurs d’une variable x sont associées aux variations d’une variable y
3-Ne donne aucune indication sur la forme de la relation car c’est une simple association
4-La Corrélation positive, c’est toute augmentation au niveau de X correspond à une augmentation au niveau de Y. Les deux variables varient dans le même sens et avec une intensité similaire. Exemple: la taille et le poids
5-La Corrélation négative, c’est toute augmentation au niveau de X qui correspond à une diminution au niveau de Y. Les deux variables varient dans deux sens opposés et avec une intensité similaire
Que-est ce que une Régression?3
1-Résume la relation entre une variable dépendante y et une ou plusieurs variables indépendantes x
2-Décrit la forme de la relation (linéaire, non-linéaire)
3-Calcule des paramètres qui ont une signification (pente, taux, asymtote, etc
Pour qu’il y ait série statistique double, il faut quoi?
1-Il faut qu’au moins l’une des deux variables soit aléatoire (aléatoire : qui veut dire variable non contrôlée)
-Exemple : Une variable aléatoire et une variable contrôlée (il y a au moins une variable que je ne connait pas)
Variable 1 : pression systolique (variable aléatoire) devient la variable dépendante
Variable 2 : dose du médicament (variable contrôlée) devient la variable indépendante
Expliquez: Mesure de la liaison linéaire entre deux variables?3
1-Covariance : mesure de la dispersion conjointe de deux variable quantitatives (x et y) autour de leur moyenne
2-Corrélation : mesure de la liaison entre deux variable x et y
3-Corrélation linéaire de Pearson :mesure de la liaison linéaire entre deux variables quantitatives x et y
Conditions d’application du test de signification du r de Pearson? 4
1-Les deux variables sont quantitatives
2-La distribution de la population est bi-modale
3-Indépendance des observations (pas d’autocorrélation) Je peux utiliser n’importe quel ordre,
4-Sont dépendantes : Série temporel (la température n’a pas d’ordre mais)et spatial(Chicoutimi et Québec on des température similaire, les observations proches on tandense à être plus similaire)
Les résultats peuvent être faussés si?3
1-Trop de points.
2-Trop de valeurs exceptionnels.
3-Corrélation ne veux pas dire cause et effet
Quand utilise t’on le Chi2?5
1-Pour comparer des groupes dans la quels j’ai regroupé des données quantitatives
2- Pour comparer plusieurs groupes indépendants décrits par une variable qualitative
3- Pour vérifier si les groupes proviennent de la même population statistique
4-Estimer la conformité entre une distribution observée et une distribution théorique
5-Penser à une tarte: la somme fait 100%
À quoi sert le tableau de contingence?
À détecter soit la présence/abscence
Pour visualiser le tableau de contingence on peut faire quoi?
UN graphique circulaire ou à barres