COURS 7 - Test T, Test F, Test U, Test V Flashcards
Le test non paramétrique pour comparaison de moyenne pour données indépendantes se nomme:
test U
Le test non paramétrique pour comparaison de moyenne pour données apparié se nomme:
test V
Quel test utiliser dans ce cas:
La réponse des patients au médicament A est-elle aussi variable que la réponse au médicament B?
test F pour comparaison de variance
lors de la vérification de variance a l’étape 4 du test de student, le mini test F doit toujours être:
a) bilatéral
b) unilatéral a droite
c) unilatéral a gauche
a) bilatéral
var. test(xx,yy,alternative = “less”) sur R est un test:
a) Test de Student bilatérale
c) test de student unilatréal a droite
c) test de student unilatéral a gauche
d) test de fisher bilatéral
e) test de fisher unilatéral a droite
f) test de fisher unilatéral a gauche
f) test de fisher unilatéral a gauche
Laquelle des conditions suivantes n’est pas une condition appartenant au test T de Student?
a) La variable doit être quantitative.
b) Échantillons tirés de populations à distribution normale.
c )Échantillons tirés de populations dont les variances sont égales.
d )Indépendance des observations.
e) Toutes ces conditions font partie du test T de Student
e) Toutes ces conditions font partie du test T de Student
A quoi sert le test de Shapiro-Wilk?
a) vérifier la normalité
b) vérifier la variance
c) vérifier l’indépendance de données
d) vérifier le degrés de liberté
e) vérifier le sens du test choisi (unilatéral ou bilatéral)
a) vérifier la normalité
Shapiro-Wilk normality test
data: IgGT
W = 0.974, p-value = 0.2974
Les données sont-elles distribuées normalement?
oui, on accepte H0
Qu’est ce que le problème de Behrens-Fisher?
a) Violation des conditions du test T
b) Le test t ne rejette pas assez souvent H0 quand les moyenne diffères.
c) Le test t rejette trop souvent H0 même quand les moyennes sont égales.
d) Lorsque les données sont normales mais pas de variances égale et qu’on utilise le test T
a, c et d
Quel sont les conséquence d’utiliser la correction de Welsh dans le test T ?
baisse le nombre de degrés de liberté
Est ce que le F calculé peut être négatif?
non
Lors de la vérification des condition du test de STUDENT a l’étape 4, pourquoi le F alpha du mini test F est toujours bilatérale?
car on cherche a vérifier si les échantillons sont équivariant. Ce n’est pas nécessaire de savoir si le groupe A qui est plus équivariant ou moins que le groupe B, donc pas besoin de déterminer un sens a notre mini test F
Pourquoi lorsqu’on fait un test F bilatéral on doit chercher la valeur critique F (a/2, v1, v2) et non F (a,v1,v2) ?
on cherche la valeur critique a 0.025 et non 0.05 car c’est un test bilatéral, le risque de rejeter serait 2x plus grand:10 % au lieu de 5%
var.test(xx, yy, alternative = “two.sided”)
p value = 0,0014
Est-ce la condition d’équivariance est respecté dans le test de student?
p-value plus petite que 0.05
on rejette H0
il n’y a pas d’équivariance
la condition n’est pas respecté
On rejette H0 si tcal > t (alpha,v1)
voici les informations qu’on a :
> x1 x2 t.test(x1, x2, alternative = “two.sided”)
Welch Two Sample t-test
data: x1 and x2 t = -1.67, df = 92.846, p-value = 0.09742 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -2.074104 0.176500 sample estimates: mean of x mean of y 7.804671 8.753473
Est-ce qu’on rejette ou pas H0?
a) on rejette H0
b) on ne rejette pas H0
c) on a seulement le t cal = -1.67 mais on n’a pas la valeur critique de T (alpha,v) pour pouvoir répondre a la question
b) on ne rejette pas H0 car la p value est plus grande que 5%
Quelle condition n’appartient pas au test de Fisher
a) Les variables doivent être quantitatives.
b) Échantillons tirés de populations à distribution normale.
c )Échantillons tirés de populations dont les variances sont égales.
d )Indépendance des observations.
e) Toutes ces conditions font partie du test F
c )Échantillons tirés de populations dont les variances sont égales.
Qu’est-ce que l’inférence statistique?
Tester une hypothèse portant sur la population statistique à l’aide de données provenant d’un échantillon représentatif.
D’où peut provenir la distribution de référence? (3)
- consultée dans des tables
- fournie par un programme d’ordinateur
- obtenue par permutations aléatoires des données
Comment faire pour éviter que la valeur F calculée (test de variances) soit trop près de zéro (à gauche) dans un test unilatéral?
On appelle «1» et on met au numérateur la variance la plus grande entre les deux groupes.
Pourquoi il est préférable de toujours faire un test à droite pour le test F?
A) car à gauche c’est négatif, et on ne peut avoir une variance négative
B) car à gauche ça se rapproche de 0, et le rapport entre les variances se rapproche de 0 si H0 est vraie.
C) Parce que le rapport entre les variances sera le même peut importe laquelle est au numérateur, mais le signe sera différent
D) La plupart des tables ne fournissent pas les valeurs pour la queue de gauche
B) car à gauche ça se rapproche de 0, et le rapport entre les variances se rapproche de 0 si H0 est vraie.
D) La plupart des tables ne fournissent pas les valeurs pour la queue de gauche
Qu’est-ce qui diffère quand on fait un test F bilatéral?
A) On fait pour la variance la plus petite entre les deux groupe au numérateur
B) On regarde alpha/2
C) On regarde pour le alpha x 2
B) On regarde alpha/2
on met encore la plus grande variance au numérateur
Pour les comparaisons de moyennes, dites l’affirmation qui est la meilleure:
a) on pourrait faire simplement un teste de différence de moyennes: moy1-moy2
b) on de pourrait pas faire simplement un teste de différence de moyennes: moy1-moy2
c) on pourrait faire simplement un teste de différence de moyennes mais ça ne tient pas adéquatement compte des caractéristiques des données (variance)
c) on pourrait faire simplement un teste de différence de moyennes mais ça ne tient pas adéquatement compte des caractéristiques des données (variance)
Pourquoi les données doivent-elles être équivariantes pour le comparaison de moyennes?
a) parce que on veut regarder la moyenne et non la variance
b) si ça varie trop dans les deux groupes, il est difficile de distinguer les moyennes et si elles sont différentes
c) si ça varie trop entre les deux groupes, il est difficile de distinguer les moyennes et si elles sont différentes
b) si ça varie trop dans les deux groupes, il est difficile de distinguer les moyennes et si elles sont différentes
La distribution s’allonge et les moyennes se rapprochent
Pour le test de t pour comparer 2 moyennes:
a) R utilise toujours la formule pour les grands échantillons, mais fait une correction au besoin
b) R utilise la formule qui est la meilleure, selon l’échantillon
c) R utilise toujours la formule pour les petits échantillons
c) R utilise toujours la formule pour les petits échantillons
Pourquoi est-ce qu’on utilise une formule différente lorsqu’un des effectif est plus petit que 30?
a) parce que l’échantillon est trop petit et on a pas assez de puissance
b) parce que la variance globale est mal estimée et on a besoin d’un écart-type et une variance pondérée
c) parce que les moyennes ne sont pas représentatives à et les échantillons ne sont plus équivariants.
b) parce que la variance globale est mal estimée et on a besoin d’un écart-type et une variance pondérée
Ça fait quoi un test de conformité?
a) Ça vérifie si c’est conforme
b) Ça vérifie qu’il y a assez d’écarts entre la distribution de référence et la distribution réelle des données pour pouvoir rejeter H0
c) Ça compare la distribution réelle des données à la distribution de référence calculée avec les mêmes paramètres
c) Ça compare la distribution réelle des données à la distribution de référence calculée avec les mêmes paramètres
On veut vérifier la normalité d’un jeu de données:
1) quel test on effectue
2) Si H0 n’est pas rejetée, ça veut dire quoi?
3) Si H0 est rejetée, ça veut dire quoi?
On veut vérifier la normalité d’un jeu de données:
1) quel test on effectue
- -> Shapiro-Wilk
2) Si H0 n’est pas rejetée, ça veut dire quoi?
- -> Les données sont issues d’une distribution normale, on peut faire le test t
3) Si H0 est rejetée, ça veut dire quoi?
- -> Les données s’écartent d’une distribution normale, on ne remplie pas les conditions pour faire un test t.
QUESTION POUR MARLENA:
Si le test statistique est un procès, H0 ça correspond à quoi?
La présomption d’innocence.
On rejette H0 seulement en dehors de tout doute raisonnable que la personne est coupable.
C’est quoi le problème de Behrens-Fisher?
Ça cause quoi?
C’est lorsque les variances sont inégales dans un test t.
Ça fait que le test rejette trop souvent H0, même si les moyennes sont égales. C’est comme si il testait deux hypothèses nulles, l’égalité des moyennes ET l’égalité des variances.
Qu’est-ce qu’on fait si on veut faire un test t pour comparer 2 moyennes mais que les variances des échantillons sont inégales, avec un petit échantillon?
a) on fait un mini test F
b) on fait le test t si les données sont normales
c) on fait une correction de Welch
d) on fait un autre test
d) on fait un autre test
Quand n1 et n2 <50 et que les variances sont inégales, on a des erreurs de type I trop élevées.
Qu’est-ce qu’on fait si on veut faire un test t pour comparer 2 moyennes mais que les variances des échantillons sont inégales, avec un grand échantillon?
a) on fait un mini test F
b) on fait le test t si les données sont normales
c) on fait une correction de Welch
d) on fait un autre test
c) on fait une correction de Welch
Vrai ou faux.
Si les variances sont inégales et les données ne sont pas normales on peut faire un test t par permutations.
Faux, les variances doivent être égales pour un test par permutation
En général, ça fait quoi des variances inégales pour le test t?
Des erreurs de type I élevées (H0 trop souvent rejetée alors qu’elle ne devrait pas l’être, faux positif)
En général, ça fait quoi des données non normales pour le test t?
Test est trop conservateur, rejette pas assez souvent H0, mais de puissance. Erreur de type II (faux négatifs)
C’est quoi l’erreur type?
Écart-type/racine de n
Il arrive quoi si on applique un test non paramétrique alors qu’on peut appliquer un test paramétrique?
a) On augmente le nombre de faux positifs
b) On augmente la puissance
c) On ne peut pas le faire
d) On augmente le nombre de faux négatifs
d) On augmente le nombre de faux négatifs
C’est à dire, on perd de la puissance.