Examen 1 Flashcards
Si un échantillon est aléatoire et représentatif, à quel type de validité cela contribue-t-il ?
Validité externe
Un protocole expérimental permet de bonifier quel type de validité ?
Validité interne
Définissez ce qu’est une variable discrète. Donnez-en un exemple.
C’est une variable qui prend un nombre limité de valeurs. Ex : le sexe biologique, le niveau d’étude, une échelle de Likert.
Définissez ce qu’est une variable continue. Donnez-en un exemple.
C’est une variable qui représente la magnitude d’une caractéristique. Ex : l’âge, les résultats scolaires, le poids.
Distinguer brièvement Paramètre et Estimateur. Dites pourquoi nous utilisons les estimateurs.
Un paramètre est une caractéristique de la population. Un estimateur est une caractéristique d’un échantillon qui devrait nous aider à inférer une caractéristique de la population.
Vrai ou faux : La suffisance est une propriété des estimateurs.
Vrai.
Vrai ou faux : La moyenne est une mesure de la tendance centrale qui ne prend pas en compte toutes les données de la distribution
Faux
Vrai ou faux : Les degrés de liberté, c’est le nombre de valeurs indépendantes qui peuvent être calculées avec un échantillon de grandeur N. Ainsi, pour un ensemble de N observations indépendantes, il y a N-5 degrés de liberté.
Faux (il y a N-1 dl)
Vrai ou faux : Les degrés de liberté, c’est le nombre de valeurs indépendantes qui peuvent être calculées avec un échantillon de grandeur N. Ainsi, pour un ensemble de N observations indépendantes, il y a N-5 degrés de liberté.
Faux (il y a N-1 dl)
Vrai ou faux : Le score Z est un exemple de transformation linéaire.
Vrai
Les transformations linéaires changent les propriétés métriques des données.
Faux
Les transformations linéaires influencent les conclusions statistiques que l’on peut avoir et servent souvent aux chercheurs afin d’obtenir un résultat qui leur plaît.
Faux.
Qu’est-ce qu’une distribution dite normale?
Un élément central des principes de la statistique inférentielle. Lorsque µ et σ sont connus, la distribution normale permet de calculer la probabilité d’observer une valeur dans un étendu déterminé.
Qu’est-ce que le théorème de la limite centrale?
Plus le N de l’échantillon est grand, plus la distribution d’échantillon s’approche d’une courbe normale et plus les tests inférentiels sont valides et puissants.
Vrai ou faux : lorsqu’on teste l’hypothèse nulle, on teste la probabilité que H0 est vrai.
FAUX : on teste la probabilité d’obtenir les résultats obtenus si H0 était vrai.
Qu’est-ce que l’erreur alpha ?
Rejeter l’H0 (donc conclure H1) alors que H0 aurait du être gardée.
Qu’est-ce que l’erreur bêta ?
Garder H0 alors qu’on aurait dû la rejeter.
Qu’est-ce que 1-B ?
La puissance (conclure que H1 alors que c’est vraiment H1)
Qu’est-ce que 1-a ?
Conclure que H0 alors que c’est vraiment H0
Qu’est-ce qu’une grandeur d’effet?
On parle de la signifiance du résultat. À quel point la différence significative est signifiante. Par exemple, si une différence entre deux diètes est significative, elle n’est pas nécessairement signifiante si elle n’est que de 0.2 kg.
Donnez un exemple d’évènements à la fois indépendants et mutuellement exclusifs.
Obtenir 2 fois ‘‘pile’’ en lancant un dé.
Quelle est la formule pour obtenir la probabilité de lancer 3 dés et d’obtenir 3 fois ‘‘5’’ ?
Loi multiplicative : 1/6 x 1/6 x 1/6
Quelle est la formule pour obtenir la probabilité de lancer un dé et d’obtenir 3, 4 ou 5 ?
Loi additive : 1/6 + 1/6 + 1/6
Quelle formule utilisera-t-on pour calculer le nombre d’arrangements possibles d’équipes de deux différentes dans une classe de 50 personnes?
Combinaison.
Nommez les deux raisons pour lesquelles le Théorème de Bayes gagne en popularité.
- Il permet d’estimer des probabilités qui sont inconnues avec l’approche inférentielle (comme la probabilité que H0 soit vraie). 2. Il ne présuppose pas la distribution normale.
Qu’est-ce que la distribution binomiale?
• Une distribution discrète et non continue. Elle traite des situations où des essais donnent un résultat parmi deux résultats mutuellement exclusifs (par ex. : pile ou face).
Vrai ou faux : le test de Khi-carré est un test basé sur la distribution normale.
Faux (basé sur la distribution khi-carré)
On fait un test du khi-carré à classification à un facteur. On obtient un khi-carré de 37.229 et un alpha de moins de 0.001. On a 2 degrés de liberté et un N de 634. Quand on va voir dans la table des valeurs critiques du khi-carré, on obtient une valeur critique de 13.82. Retient-on H0 ? Comment écrit-on cela ?
On rejette H0 parce que X2 (2, N = 634) = 37.229, p < 0.001.
Quels sont les deux indices de force d’association offerts par SPSS pour le X²? Quand est-ce qu’on utilise les deux?
Phi de Cramer : pour les tables de contingence 2x2
V de Cramer : pour les tables de contingence de plus de 2x2
Suite à un Test T sur des échantillons indépendants, on obtient ce tableau de sortie SPSS. Un étudiant qui suit le cours de Méthodes Quantitatives 1 vous demande si l’on rejette ou on conserve Ho, il est un peu mélangé à savoir comment prendre la décision statistique, mais il est convaincu qu’un senior de MQ2 pourra l’aider. Alpha = 0.05 et sig (bilatérale) = 0.016.
On rejette H0 parce que p=0.016, donc p = plus petit que 0.05.
un d de Cohen de 0.56 est trouvé. Comment qualifiez vous cette taille d’effet.
• Moyenne (d=environ 0.50)
Vrai ou faux : en augmentant le alpha, on diminue la puissance.
Faux.
Vrai ou faux : Plus la différence entre µ0 et µ1 est élevée, plus la puissance l’est aussi.
Vrai.
Le d de cohen est la différence des deux moyennes de population exprimée en écarts-types.
Vrai.
La statistique δ (delta) permet de combiner le d de Cohen et la taille d’échantillon (n) dans la même valeur.
Vrai.
Pour obtenir une bonne puissance, il faut un petit échantillon.
Faux.
Qu’est-ce que représente le coefficient de corrélation au carré (r²)?
C’est le pourcentage de variance expliquée d’une variable par l’autre.
Compléter la phrase : Le coefficient de corrélation de Pearson (r) fonctionne bien lorsque _____________________________________ (3 conditions).
La relation entre les variables est linéaire + Les variables ont des échelles assez continues + Respecte les postulats d’homogénéité des variances et de normalité.
Vrai ou faux : a) Il est possible d’utiliser un test-t pour tester la signification de rpb ?
Vrai.
Vrai ou faux : Le phi (ϕ) est en fait un simple r
Vrai
Vrai ou faux : Le rho de Spearman (rs) et le tau de Kendal sont utiles pour les données de rapport.
Faux.
Vrai ou faux : Le rho de Spearman (rs) et le tau de Kendal sont utiles lorsqu’on ne rencontre pas les postulats d’applications de la corrélation, à ce moment on doit les utiliser puisqu’ils sont non-paramétriques.
Vrai.
Que représente le p ?
Le pourcentage de chances d’avoir nos résultats si H0 est vraie.
Vrai ou faux : pour qu’un test soit statistiquement significatif, le p doit être plus PETIT que le seuil alpha.
Vrai.
Vrai ou faux : la valeur observée d’un X2 correspond au seuil alpha.
Faux : la valeur CRITIQUE d’un X2 correspond au seuil alpha.
Dans un test de X2, rejette-t-on H0 lorsque la valeur obtenue est plus petite ou plus grande que la valeur critique ?
On rejette H0 lorsque la valeur obtenue et plus GRANDE que la valeur critique.
Quelles sont les 4 propriétés d’un estimateur ?
Suffisance, Absence de biais, Efficacité, Robustesse
Qu’est-ce qu’une permutation ?
Tous les arrangements possibles d’un nombre d’éléments choisis dans l’ensemble, étant donné que chaque élément est choisi au hasard, sans remise.
Quelle est la différence entre permutation et combinaison ?
Dans une combinaison, on ne tient pas compte de l’ordre des éléments dans les arrangements. (BC ou CB est considéré comme le même arrangement, alors que dans une permutation, BC et CB est considéré comme deux arrangements).
Qu’est-ce que les degrés de liberté ?
C’est le nombre de valeurs indépendantes qui peuvent être calculées avec un échantillon de grandeur N
Quelles sont les deux corrections qu’on peut apporter au khi-carré ?
Correction de Yates et Test de Fisher.
Quand applique-t-on la correction de Yates au khi-carré ?
Pour les tables de contingence 2x2 ou quand les fréquences observées sont en bas de 5.
À quoi servent la correction de Yates et le test de Fisher ?
À obtenir une valeur plus conservatrice au Khi-2.
Vrai ou faux : le test de Fisher donne une valeur du khi-2 moins réduite (plus conservatrice) que la correction de Yates.
Vrai
Qu’est-ce que la robustesse d’un estimateur ?
Sa capacité à ne pas être affecté par des données abberantes.
Vrai ou faux : plus on a de degrés de liberté, plus c’est difficile d’avoir des résultats significatifs.
Faux : moins on a de degrés de liberté, plus c’est difficile d’avoir des résultats significatifs.
À quoi sert la convergence scientifique ou la réplication des résultats ?
À contrer l’erreur alpha : les différences dûes au hasard ne devraient pas être reproduites.
La forme de la distribution binomiale change en fonction de quoi ?
Du N (nombre d’essais) et du p (probabilité de succès).
Vrai ou faux : une distribution binomiale avec un grand N s’approche d’une distribution normale
Vrai
Pour le test du signe : comment calcule-t-on la probabilité d’obtenir au moins 10 différences positives dûes au hasard ?
On fait p(10) + p(11) + p(12) (etc). Si le résultat obtenu est plus petit que le niveau alpha, on rejette l’H0 comme quoi c’est le hasard qui explique l’effet.
Quel est l’avantage du test du signe ?
Il ne postule pas que les données suivent la distribution normale.
X2 à deux variables : comment calcule-t-on les degrés de liberté à partir d’une table de contingence ?
(L-1) (C-1)
Quand utilise-t-on les rapports de vraisemblance pour calculer un test de X2 ?
Quand les échantillons sont de petite taille, cela donne un résultat plus juste. Quand les échantillons sont de grande taille, ça donne le même résultat.
Les test Phi et V de Cramer sont des tests similaires à un coefficient de corrélation. Ils prennent en considération le N par rapport à la valeur du X2. Que signifie un r de 0.30 ?
Un effet moyen.
Que signifie une puissance de test-t de .38 %
Si H0 est fausse, on a 38% de chance de trouver un effet significatif.
Le test t exprime la différence entre 2 valeurs en ___.
Nombre d’erreurs types
Pour un test t sur 2 échantillons, la moyenne de la distribution d’échantillonnage de l’H0 devrait être ___.
0
Quelles sont les 4 conditions d’utilisation (postulats de base) d’un test t ?
Normalité, N supérieur à 30, Indépendance des observations, Homogénéité des variances