Stats, examen 1 Flashcards

1
Q

Qu’est-ce qu’un Test value? (3)

A
  1. Il peut représenter le point central dans une échelle de réponse (par exemple dans une échelle de 0 à 10, le chiffre 5 serait le test value puisqu’il s’agit du point central.
  2. La valeur moyenne d’une variable (basée sur des recherches précédentes).
  3. Il peut représenter le niveau de chance.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quand utilise-t-on un test t pour un échantillon?

A

Pour évaluer si la moyenne d’une variable est significativement différente d’une valeur constante, appelé ‘‘test value’’ par SPSS.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quels sont les prérequis pour effectuer un test t pour un échantillon? (2)

A
  1. La distribution doit être normale.

2. Les données (scores) doivent être indépendantes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Nommez le ou les graphique(s) les plus pertinents pour l’analyse d’un test t sur un échantillon.

A

Histogramme

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quand utilise-t-on un test t pour échantillons appariés?

A

Il s’agit d’un test qui utilise des données auxquelles chaque cas a des scores en deux variables.

Ce test évalue si la moyenne de la différence entre ces deux variables est significativement différente de zéro. C’est une statistique utilisée à des designs de mesures répétées.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelles sont les applications du test t pour échantillons appariés?

A

Les designs de mesures répétées peuvent être avec intervention (ex: mesurer satisfaction au travail avant et après l’instauration d’un programme) et sans intervention (ex: déterminer si les employés sont plus préoccupés par le salaire ou la sécurité au travail).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quels sont les pré-requis du test t pour échantillons appariés? (2)

A
  1. La différence des scores doit être normalement distribuée (vérifier à l’aide du test S-W ou K-S avec correction Lilliefors)
    - Avec des échantillons moyens ou larges, les valeurs de p peuvent être considérés valides (n>= 30).
  2. Indépendance entre les scores.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quels sont les graphiques pertinents pour un test t pour échantillons appariés?

A

L’histogramme, la boite à moustache et le error bar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Pourquoi la boite à moustache est-il un graphique particulièrement pertinent dans le test t pour échantillons appariés?

A

Il permet de voir graphiquement la distribution des deux variables, notamment la médiane.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Pourquoi l’Error Bar est-il un graphique particulièrement intéressant dans le test t pour échantillons appariés?

A

Il permet de voir graphiquement la position de la moyenne et des écarts-types, en considérant l’ensemble des variables à l’étude, notamment la dispersion des variables.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelle est la notation d’un test t (pour tous les test t)?

A

t(df en petit) = t; p<0,05

t(df en petit) = t; p<0,01

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quand utilise-t-on un test t pour échantillons indépendants?

A

Lorsqu’on veut évaluer la présence d’une différence significative entre les moyennes de deux groupes différents.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vrai ou Faux. Avec le test t pour échantillons appariés, chaque cas doit avoir des scores pour deux variables (variable groupe et test).

A

Faux. Le test t pour échantillons indépendants nécessite que chaque cas aient des scores pour deux variables: la variable groupe et la variable test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quelles sont les deux types de variables que chaque score doit avoir dans un test t pour échantillon indépendant?

A

La variable groupe et la variable test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Dans un test t pour échantillon indépendant, laquelle des deux variables (groupe ou test) doit comporter deux catégories? Exemple?

A

Variable groupe.

Ex: Hommes et femmes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est-ce que la variable test des scores d’un test t pour échantillons indépendants?

A

Il s’agit d’une dimension quantitative.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Quelle variable est la variable dépendante dans les scores d’un test t pour échantillons indépendants?

A

La variable test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Quels sont les pré-requis d’un test t pour échantillons indépendants (3)?

A
  1. La distribution doit être normale
  2. Vérifier l’égalité de la variance (pour savoir quelle valeur de p il faut retenir)
  3. Les scores de la variable test doivent être indépendants. Par exemple, si qql intègre un groupe, il ne peut pas intégrer l’autre.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Est-il possible de violer le préalable indiquant que la distribution doit être normale pour effectuer un test t pour échantillon indépendant? Le cas échéant, précisez les conditions.

A

Oui, Selon Field (2005), avoir un échantillon modéré (n >= 15 par groupe) ou large (n >= 30 par groupe).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Quels sont les graphiques pertinents à l’analyse du test t pour échantillon indépendants?

A

Error Bar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Pourquoi le ‘‘Error Bar’’ est-il le graphique le plus pertinent pour l’analyse d’un test t pour échantillon indépendants?

A

Il présente les moyennes et les écarts-types pour chaque groupe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Que faut-il observer dans un histogramme afin de l’interpréter?

A

Le niveau d’aplatissement et le niveau de symétrie.

Hauteur du sommet? Ecq ça ressemble à une courbe normale? Les deux queues sont-elles éloignées de la courbe normale? Y a-t-il des données abberrantes?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Quel est l’objectif principal d’un test T pour échantillon unique?

A

Comparer la moyenne de notre échantillon à une autre moyenne (test-value).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Comment calcule-t-on le degré de liberté?

A

n-1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

La barre d’erreur (‘‘Error Bar’’) nous renseigne sur quoi?

A
  1. La répartition des données autour de la moyenne (ecq les données sont regroupées autour de la moyenne ou non). Si les barres sont très petites, bonne moyenne. Sinon, non.
  2. La moyenne est-elle représentative de l’ensemble des données?
  3. La probabilité d’une différence est-elle significative entre les scores?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Dans quel test évalue-t-on la variance?

A

Test T pour échantillons indépendants.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Comment analyser la variance dans un tableau pour le test t pour échantillon indépendant?

A

On veut que les variances soient similaires. Si le ‘‘sig’’ n’est pas significatif, on peut assumer que c’est pareil. Alors, on prend la première ligne du tableau pour procéder à l’interprétation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Que mesure le d de Cohen?

A

Il évalue la magnitude d’un effet dans une population. (ampleur de la différence)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Quel d de Cohen indique un effet fort?

A

0,8

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

effet de 0,2 d de Cohen?

A

Effet faible

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Effet de 0,5 d de Cohen?

A

Effet moyen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Dans quelles situations peut-on faire de l’inférence dans la barre d’erreur?

A

On ne peut JAMAIS faire d’inférence avec la Barre d’erreur!! C’est une façon d’exposer les données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Que peut-on analyser dans une barre d’erreur?

A
  1. Chevauchement
    ex: elles se chevauchent, mais pas parfaitement. La longueur des barres n’est pas égale.
  2. Données rapprochées ou non de la moyenne.
  3. Pas une statistique inférentielle, même s’il y a chevauchement.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Qui sont les auteurs significatifs au 17e siècle?

A

Le chevalier de Méré
Blaise Pascal
Pierre Fermat
Christian Huygens

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Qui a élaboré le problème des parties?

A

le chevalier de MÉRÉ

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Qu’est-ce que le problème des parties?

A

par exemple, quand deux personnes jouent à un jeu et et que l’un gagne la partie, mais qu’ils doivent l’interrompre, comment séparer les gains et déterminer le gagnant?

La valeur de l’argent se modifie en fonction des probabilités. Mais de MÉRÉ n’a jamais réussi à comprendre cela.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Quelle est la contribution de Blaise Pascale et en quoi cela consiste-t-il?

A

Le triangle de Pascal (ou arithmétique) : expliquer qu’il y a quelque chose d’exponentiel dans les chiffres. Permet entre autres de résoudre le problème des parties.

Il a également contribué à résoudre le problème des parties.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Quelle est la contribution de Pierre Fermat?

A

Aide à résoudre le problème des parties.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Qui est le premier à avoir écrit un traité sur le calcul du hasard et le calcul de l’espérance?

A

Christian HUYGENS

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Qu’est-ce que le calcul de l’espérance, établie par qui?

A

Le pourcentage de chance que quelque chose se produise.

Christian HUYGENS

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

Qui a établi la loi des grands nombres?

A

Jacob Bernouilli

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

Qu’est-ce que la loi des grands nombres?

A

Plus la taille de l’échantillon, plus les caractéristiques statistiques de l’échantillon se rapprochent de celles de la population.

Ex du lancer: plus on effectuer de lancers, plus on se rapproche du 50-50 pile ou face.

Donc la taille de l’échantillon est un élément central dans cette loi!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
43
Q

Qui a posé les bases et les propriétés de la loi normale?

A

Abraham de MOIVRE

44
Q

Qui a énoncé le théorème central limite?

A

Abraham de MOIVRE

45
Q

Qu’est-ce que le théorème central limite?

A

Tout sommes de variables aléatoires indépendantes tend vers une variable aléatoire.

La convergence en loi de la somme d’une suite de variables aléatoires vers la loi normale.

1ere version de MOIVRE : toutes les variables en général aléatoires devraient se situer habituellement sur la courbe normale.

46
Q

Qu’est-ce que Abraham de MOIVRE a établi comme principe de la loi normale, plus précisément?

A

La cloche symétrique; permet de savoir où certains individus se situent par rapport à d’autres.

Tendance d’une plus grande fréquence vers le centre de la distribution.

47
Q

Qui a précisé les principes de la théorie des probabilités et en quoi cela consiste-t-il?

A

Abraham de MOIVRE

Premières observations systématiques du hasard et de l’incertitude dans les jeux ou dans les phénomènes climatiques.

48
Q

Quelle est la contribution de Simon de LAPLACE?

A

Il a effectué la démonstration du théorème central limite en se basant sur la théorie des grands nombres.

49
Q

Quelle est la définition d’une probabilité selon LAPLACE?

A

Fraction dont le numérateur est le nombre de cas favorable et dont le dénominateur est le nombre de cas possibles.

50
Q

Est-ce que la définition de LAPLACE par rapport aux probabilités est adéquate?

A

Non, car les données n’ont pas toutes les mêmes valeurs. (exemple: questions d’examen)

51
Q

Quelle est la contribution de GAUSS?

A
  1. Il apporte un fondement plus rigoureux à la loi normale.
    (par exemple, ‘‘Le traitement du signal’’ ; lorsqu’un signal est transmis, une perte d’information apparait à cause du moyen de transmission ou du décodage du signal).
  2. Élaboration de la méthode des moindres carrés (permet d’étudier et de comparer des données expérimentales)
  3. Inclut la notion d’erreur de mesure dans la théorie de la loi normale. (notamment, le fait que plusieurs choses peuvent influencer les réponses, les données). Il y a possibilité de biais.
52
Q

Qui a développé la loi de la distribution des événements rares?

A

Siméon Denis POISSON.

53
Q

Qu’est-ce que la loi de la distribution des événements rares (ou loi de Poisson)?

A

Il s’agit de quelle façon on peut observer un comportement en fonction de son nombre d’apparitions dans le temps.

Quelque chose qui va décrire le comportement, le nombre d’événements qui se produit dans un intervalle de temps fixé, avec fréquence ou moyenne connue.

54
Q

Qui sont les auteurs importants au 19e siècle?

A

Tchevychev
Markov
Galton

55
Q

Quelle est la contribution de Tchevychev?

A

Il présenta une généralisation de la loi des grands nombres.

56
Q

Quelle est la contribution de Markov?

A

Il a démontré rigoureusement le théorème central limite.

57
Q

Qu’est-ce que la biométrie anglaise et qui l’a développé?

A

Étude de l’hérédité

Galton

58
Q

Quel mathématicien permet de faire un lien entre la psycho et les stats?

A

Galton

59
Q

Qu’à développé Galton?

A
  1. Biométrie anglaise (étude de l’hérédité)
  2. Fondateur de l’eugénisme
  3. Fondateur de la psychologie différentielle
60
Q

Qu’est-ce que l’eugénisme?

A

Idée que l’on peut influencer la sélection naturelle à notre avantage.

61
Q

Quel était un des objectif principal de la psychologie différentielle?

A

Quantifier les différente caractéristiques physiques et psychologiques des individus

62
Q

Qu’est-ce que le facteur G et qui l’a développé?

A

L’intelligence est le facteur G

Spearman

63
Q

Quelle est la différence entre Spearman et Pearson?

A

Les corrélations de Spearman n’exigent pas une loi normale afin de pouvoir les effectuer.

La loi normale ne constitue pas un prérequis. On peut donc faire des analyse de données non paramétriques.

64
Q

Vrai ou Faux. Les corrélations de Spearman s’appliquent uniquement sur des valeurs continues.

A

Faux. Corrélations de Spearman s’appliquent sur des valeurs continues et ordinales.

65
Q

Qu’exigent les corrélations de Pearson?

A

La loi normale est les données paramétriques.

66
Q

Qui a contribué aux corrélations polychoriques et en quoi consistent-elles?

A

Pearson.

Surtout utilisées pour faire des accords inter-juge; permet d’estimer la corrélation qui serait présente sir les traits évalués avaient été conceptualisés sur une échelle continue.

Permet de transformer ces réponses en variables continues pour faire des analyses factorielles ensuite.

67
Q

Qui a travaillé sur le test du khi-carré et qu’est-ce que c’est?

A

Pearson.

Permet d’évaluer sur les résultats sont différents de ce qui est du au hasard.

68
Q

Quelle est la contribution de Gosset?

A

Il a élaboré le test T de Student (comparaison de moyennes- comparé une moyenne à une valeur connue).

69
Q

Quelle est la contribution de Andrei KOLMOGOROV?

A

Test de normalité (permet d’évaluer si la distribution est normale ou pas)

Test non paramétrique (test Kilmogorov-Smirnov)

70
Q

Qu’est-ce que Fisher a démontré?

A

Que le test t ne couvre pas des échantillons de grande taille.

Il a donc apporté des modifications et a travaillé sur l’analyse de la variance (ANOVA) et analyse factorielle

71
Q

On peut décomposer la statistique en cinq étapes. Lesquelles?

A
  1. Identification de la population et du thème à étudier
  2. Cueillette de données
  3. Regroupement, classification et présentations des données
  4. Comparaison avec des modèles théoriques
  5. Interprétation, conclusion et prévision
72
Q

Quelle est la définition de la statistique?

A

La science qui traite des principes et des méthodes servant à recueillir, classe, organiser, synthétiser et présenter des données numériques.

Puis, à partir de calculs précis, analyser, interpréter, tirer des conclusions et prendre des décisions à partir de données numériques.

73
Q

Recensement versus échantillonnage?

A

Recensement: poser les questions à l’ensemble de la population.

Échantillonnage: une partie de la population visée

74
Q

Quelle est la définition de statistique descriptive?

A

L’étude de l’ensemble des méthodes permettant de cueillir, classe, synthétiser, décrire et présenter des données numériques (qualitatives ou quantitatives).

75
Q

Quelle est la définition de statistiques (ou modèles) probabilistes?

A

L’étude des phénomènes liés au hasard et à l’incertitude.

76
Q

Quelle est la définition des statistiques inférentielles?

A

L’étude de l’ensemble des méthodes permettant de tirer des conclusions concernant une population déterminée, à partir de données provenant d’un échantillon choisi dans cette population.

En gros: ecq on peut généraliser les résultats de l’échantillon à la population?

77
Q

Pourquoi étudier les statistiques?

A
  1. Les données numériques peuvent constituer un matériel de base important à partir duquel on prend des décisions. (en visant à minimiser les effets ou les biais du chercheur)
  2. Pour bien chercher, comprendre et interpréter une information.
  3. L’étude de la statistique nous rend capable de lire avec un oeil critique l’information chiffrée; nous permet de comprendre et de mener correctement les expériences, les enquêtes et les travaux cliniques de recherche.
78
Q

Population versus échantillon?

A

Tout ensemble sur lequel porte une étude statistique versus tout sous-ensemble d’une population

79
Q

Unité statistique?

A

Les éléments de tels ensembles.

80
Q

Variable statistique?

A

Attribut ou caractéristique que possède chacune des unités statistiques.

81
Q

Quel est le chiffre qui revient le plus souvent?

A

Mode

82
Q

Quel est le chiffre au milieu?

A

Médiane

83
Q

Qu’est-ce qu’une moyenne?

A

Une valeur qui représente toutes les données

84
Q

Qu’est-ce qu’une moyenne tronquée ou ajustée?

A

Une moyenne ou les valeurs extrêmes ont été enlevées.

85
Q

Vrai ou Faux. La médiane constitue une mesure de position, mais plus souvent une mesure de tendance centrale.

A

Vrai.

86
Q

Quelles sont les mesures de tendance centrale?

A

Mode, Médiane, Moyenne, Moyenne tronquée ou ajustée

87
Q

Quelles sont les mesures de position (non centrale)?

A

Quartiles, quintiles, déciles, centiles, (médiane)

88
Q

Décrivez les mesures de dispersion.

A

Étendue: différence entre la plus grande et la plus petite données

Écart moyen: moyennes des distances entre chacune des données et la moyenne

Variance: moyenne des carrés des écarts

Écart-type: racine carrée de la variance

89
Q

Variable statistique qualitative?

A

Nominale et ordinale

90
Q

Variable statistique quantitative?

A

Intervalle et proportion

91
Q

Différence entre variable intervalle et proportion?

A

Dans une variable proportion, le zéro signifie une absence de la caractéristique alors que le zéro dans une variable intervalle ne signifie pas l’absence de la caractéristique.

92
Q

Que faire lorsque confronté à des données manquantes?

A
  1. Estimation éduquée : insérer nous-même une valeur
  2. Average imputation: Regarder l’ensemble des participants et regarder la moyenne à l’item 3, par exemple. Attribuer cette valeur au participant avec la valeur manquante. (par contre, réduit la variabilité ; moins apparent avec grands échantillons)
  3. Commun point imputation: Avec échelle, donner la valeur centrale au participant. (échelle de 1 à 5, serait 3). On peut aussi donner le mode.
  4. Enlever la donnée (plus facile avec grand échantillon)
  5. Contacter le participant (pas recommandé éthiquement)
  6. Créer un modèle théorique (modèle de régression) qui nous permet de dire ce qu’aurait été la réponse du participant en se basant sur plusieurs variables.
93
Q

Quels sont les indices à vérifier afin d’établir si on a une courbe normale?

A
  1. Mode, médiane et moyenne similaires?
  2. Écart-type plus petit que moyenne (ou moitié de moyenne?)
  3. Vérifier score Skewness et Kurtosis (score 0 et 1 ou 0 et -1 est acceptable). Plus le chiffre est élevé, plus c’est révélateur d’un problème.
  4. Diviser le score de Skewness par son erreur. Le barème doit être entre -1, 96 et +1,96.
  5. Comparaison de moyenne attendue et moyenne observée (si c’est semblable, on a plus de chances de se retrouver dans une courbe normale)
94
Q

Qu’est-ce que la moyenne attendue?

A

Additionner donnée minimum et maximum et diviser par 2.

95
Q

À l’aide de quel indice évalue-t-on une courbe leptokurtique?

A

Score de Kurtusis positif.

96
Q

Qu’est-ce qu’un score négatif du Kurtosis révèle?

A

Une courbe platikurtique.

97
Q

Qu’est-ce qu’un score positif et négatif du Skewness révèlent?

A

SKEWNESS

Positif: Asymétrie vers la gauche
Négatif : Asymétrie vers la droite

98
Q

Que mesure le Skewness et le Kurtosis?

A

Skewness: Symétrie ou asymétrique de la courbe (est-ce que la courbe se déplace plus vers la gauche ou la droite?)

Kurtosis: Aplatissement de la courbe (est-ce que la courbe est plus aplatie ou vers le haut?)

99
Q

Comment détermine-t-on si on utilise un test Kolmogorov-Smirnov ou Shapiro-Wilk?

A

En fonction de la taille d’échantillon.

Kolmogorov: n =< 50 (50 à 300 participants)
Shapiro-Wilk: n > 50

100
Q

Vrai ou Faux. Le test Kolmogorov-Smirnov est un test paramétrique.

A

Faux.

101
Q

Vrai ou Faux. Dans le test Kolmogorov-Smirnov, il y a H0 et H1.

A

Vrai.

102
Q

Comment évaluer une distribution normale pour le test Kolmogorov-Smirnov?

A

H0 = échantillon provient d’une distribution normale

H1: Échantillon ne provient pas d’une distribution normale.

103
Q

Comment évaluer une distribution normale pour le test Shapiro-Wilk?

A

Si p plus petit que 0,05 = rejet de H0 = distribution pas normale

Si p plus grand que 0,05 = rejet de H0 = distribution normale

(explication à vérifier)

104
Q

Que représente la boite à moustache?

A

Données en 4 quartiles.

105
Q

Que permet de voir la boite à moustache?

A

S’il y a des données aberrantes, notamment.

VOIR

  1. Est-ce que les moustaches sont égales?
  2. Est-ce que la médiane est au milieu?
  3. Est-ce qu’il y a des données aberrantes?
106
Q

Qu’examine le test Q-Q?

A

Test de normalité

Les points doivent suivre la ligne. S’ils ne les suivent pas= asymétrie.

(Mentionner si un côté dévie plus de la ligne que d’autre) explications : quelques/plusieurs quantiles observés s’éloignent de la ligne….