Cours 4 Flashcards

1
Q

Que sont les fréquences?

A

Le nombre de personnes qui ont répondu à un énoncé ou qui ont coché telle case. La fréquence d’un événement ou d’un comportement c’est combien de fois on l’observe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Pour une échelle ordinale on ne peut pas faire de moyenne mais on peut faire une analyse de quoi?

A

On peut faire une analyse de fréquence.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce que les graphique nous donnent et comment évalue-t-on la pertinence de ceux-ci?

A

Un aperçu global de nos données. Il ne faut pas qu’ils nous donnent des détails qui nous sont inutiles, juste ceux qui sont suffisants et utiles.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quels sont les avantages du diagramme à bande?

A

Il nous donne une bonne idée de la distribution des fréquences dans notre échantillon et il nous permet de voir la fréquence de scores correspondant aux différentes valeurs d’une variable (quelles valeurs de la variable sont les plus fréquentes).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quelle est la particularité des diagrammes en barres pour les variables catégorielles et discrètes?

A

On voit la séparation entre les différentes valeurs de la variable parce qu’il n’y a pas de continuité entre les valeurs de la variable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Les diagrammes en barres sont pour quels types de variables?

A

Catégorielles et discrètes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Les histogrammes sont pour quel type de variables?

A

Continues.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelle est la particularité des valeurs de la variable affichées sur un histogramme?

A

Il n’y a pas d’espace entre les différentes valeurs de la variable pour démontrer une continuité entre celles-ci.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Comment peut-on dire si un hitogramme a une asymétrépositibe ou négative?

A

La queue des valeurs (les valeurs extrêmes) va s’en aller vers les positifs si l’asymétrie positive et vers les négatifs si l’asymétrie est négative

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelle est la particularité du diagramme en tige et feuille?

A

On peut voir toutes les valeurs de la variable. On peut voir les participants individuellement et non seulement le nombre de participants de chaque groupe comme avec l’histogramme.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Si on veut comparer un histogramme et un diagramme en tige et feuilles que peut-on faire?

A

On peut tourner le diagramme en tige et feuille et ainsi obtenir une représentation semblable à celle d’un histogramme avec tous ses avantages.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

En quoi le diagramme en tige et feuilles peut-il être particulièrement pratique?

A

Pour comparer deux distributions différentes en les mettant “dos à dos”.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce que la moyenne nous donne comme idée?

A

Elle nous donne une idée du score typique de l’échantillon.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Avec quels types de variables est-il pertinent de faire la médiane?

A

Avec les variables discrètes et continues.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce que la médiane?

A

La valeur qui coupe en deux parts égales, la valeur du milieu de l’échantillon.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Que faut il faire avant de calculer la médiane?

A

Il faut classer les chiffres en ordre numérique croissant.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Quelle est la formile de la médiane?

A

(n+1)/2 , où n= nombre de scores qu’on a

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Quel est le désavantage de la médiane?

A

Ça devient long à calculer avec de grands échantillons.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Que faut-il faire quand on veut calculer la médiane et qu’il y a un nombre pair de scores nous empêchant ainsi de trouver la valeur du milieu?

A

Il faut faire la moyenne des deux score se trouvant de chaque côté d’où se trouverait la valeur du milieu s’il y avait un nombre impair de scores.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Quel est l’avantage de la médiane?

A

Elle n’est pas influencée par les scores extrêmes parce qu’il y a 50% des scores à gauche et 50% des scrores à droite peu importe leur valeur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Qu’est-ce que le mode?

A

C’est le valeur la plus fréquente d’une variable, celle qui revient le plus souvent. Le score obtenu par le plus grand nombre de participants.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Comment peut-on identifier le mode?

A

Sur un diagramme en barres, un histogramme ou un diagramme en tige et feuilles c’est le point le plus élevé de la distribution.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Quel est le désaventage du mode?

A

Il est peu utilisé pour des analyses statistiques.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Quand peut-on choisir d’utiliser la moyenne?

A

Quand la distribution de scores est assez également répartis. Ce n’est pas grave s’il y a quelques valeurs extrêmes, ce qu’il faut vérifier c’est s’il y en a beaucoup ou non et/ou si les valeurs extrêmes sont beaucoup extrêmes ou non.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Question à l’examen: un graphique, la moyenne, la médiane, quel est le meilleur choix entre les deux? Comment savoir?

A

Il faut regarder les scores extrêmes. S’il y en a beaucoup ou qu’ils sont trop grands il faut prendre la médiane.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Qu’est-ce que les mesures de variabilité nous disent?

A

De quelle façon les différentes observations sont regroupées autour de la valeur centrale et si les scores varient beaucoup ou très peu entre les individus.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Uelles sont les 4 mesures de la variabilité?

A

1-L’étandue
2- L’espace interquartile
3- La variance
4- L’écart-type

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Qu’est-ce que l’étendue?

A

C’est la différence entre le score le plus élevé et le score le moins élevé. Elle ne dépend que des scores extrêmes.
Étendue = valeur maximum - valeur minimum

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Quel est le désavantage de l’étendue?

A

Elle ne nous informe pas sur les scores entre les extrêmes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Qu’est-ce que l’espace interquartile?

A

On l’obtient en éliminant 25% des valeurs supérieures et 25% des valeurs inférieure de la distribution quand celle-ci est classée en ordre croissant puis en faisant l’étendue des valeurs restantes (le 50% du milieu).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Qu’est-ce que la variance?

A

Elle mesure la variation des valeurs autour de la moyenne. C’est la moyenne du degré au quel chaque participant va s’éloigner de la moyenne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Quel est le signe de la variance pour un échantillon? et pour une population?

A

Pour un échantillon: s^2

Pour une population: un o avec une barre vers la droite sur le dessus et un exposant à la 2.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Qu’arrive-t-il si on essais de calculer la variance sans avoir mis les valeurs au carré?

A

Elles s’annulent à cause des différentes valeurs négatives et positives.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Dans la formule de la variance (feuille de formules) que veulent dire les variables?

A

X=le score
X avec la barre au-dessus=moyenne de l’écantillon
N=nombre de participants
(X-Xbarre)= écart à la moyenne de chaque score.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Comment on calcule l’écart-type?

A

En faisant la racine carrée de la variance.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Quel est le signe pour l’écart-type de l’échantillon? et de la population?

A

Pour l’échantillon: s

Pour la population: un o avec une barre sur le dessus à droite (lettre grecque)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Que permet la boîte à moustache?

A

Elle permet d’identifier facilement les scores extrêmes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Décrivez la boîte à moustaches.

A
  • Le rectangle c’est la boite qui est délimitée par les quartiles de 25% en haut en 75% en bas (donc 50% dans la boîte).
  • La ligne dans la boîte c’est la médiane.
  • Les lignes qui sortent en haut et en bas de la boîte c’est les moustaches.
  • Les lignes rattachées aux moustaches ce sont les valeurs adjacentes.
39
Q

Qu’est-ce qu’un diagramme de dispersion (nuage de point permet de voir?

A

Les tendances générales concernant les liens entre les deux variables.

40
Q

Les représentations graphiques permettent quoi?

A

D’avoir un aperçu global des tendances centrales et de dispersion de nos données.

41
Q

Que retrouve-t-on au centre (point le plus haut) sur une courbe normale?

A

La moyenne, la médiane et le mode.

42
Q

Donnez 5 exemple de variables dont les valeurs sont normalement distribuées.

A
  • La taille
  • Le poids
  • La pointure des souliers
  • Le stress situationnel
  • La quotient intellectuel
43
Q

Donnez 3 raisons pour lesquelles un échantillon ne serait pas distribué normalement.

A

1- Échantillon biaisé
2- Taille d’échantillon insuffisante
3- La forme de la distribution de la population est non normale.

44
Q

Qu’est-ce qu’une distribution bimodale?

A

Une distribution qui a deux modes qui sont visibles sur un histogramme et qui peuvent être dus à la présence de participants tirés de deux populations différentes.

45
Q

Quel est le lien entre la taille de l’échantillon et la distribution normale?

A

Plus l’échantillon est grand et plus il aura tendance à être distribué normalement.

46
Q

Qu’est-ce que l’applatissement?

A

C’est la largeur du “dome” fait par la courbe. Quand l’applatissement est de 0 la courbe est normale. Elle est positive si la courbe est plus mince qu’une courbe normale et elle est négative si la courbe est plus large qu’une courbe normale.

47
Q

Quels autres noms donne-t-on à l’applatissement?

A

La voussure ou la kurtose.

48
Q

Quel est le nom d’une courbe avec un applatissement négatif?

A

Platycurtique

49
Q

Quel est le nom d’une courbe ayant un applatissement positif?

A

Leptocurtique

50
Q

Quel est le nom de la distribution asymétrique en anglais?

A

Skewness

51
Q

Comment nomme-t-on des distributions qui sont non normales?

A

Des distribution asymétriques.

52
Q

Qu’est-ce qui nous dit quand une distribution asymétrique est positive ou négative?

A

Quand la queue de valeurs tend vers les valeurs élevées elle est positive et quand la queue tend vers les valeurs basses elle est négative.

53
Q

Une probabilité varie entre quoi et quoi?

A

Entre 0 et 1 (entre 0 et 100%).

54
Q

Aire sous la courbe normale est associée à quoi?

A

Aux scores Z.

55
Q

Qu’est-ce qu’un score Z?

A

C’est le pourcentage de la surface sous la courbe normale qui se trouve entre -z et +z avec une symétrie à la moyenne. z est associé à combien de fois l’écart type (ex: z=1,96 donc 1,96 fois l’écart-type de chaque côté de la moyenne).

56
Q

Avec le score z et la table des pourcentages, on peut trouver quoi?

A

La probabilité de trouver un score plus grand ou plus petit qu’une valeur de score Z.

57
Q

Quelle est la moyenne et la l’écart-type d’une distribution normale?

A

Moyenne: 0

Écart-type: 1

58
Q

Si on veut calculer le score z mais moyenne de l’échantillon n’est pas de 0 et que l’écart-type n’est pas de 1, que fait-on?

A

On peut transformer toute distribution de données qui ressemble à une distribution normale en une distribution ayant une moyenne de 0 et un écart-type de 1 en utilisant le score standardisé.

59
Q

À quoi correspondent les variables dans l’équation de l’écart-type?

A

X=le score observé qu’on veut savoir le score z (ou probabilité de retrouver dans la distribution via la table des pourcentages)
X barre=la moyenne de l’échantillon
s= l’écart-type de l’échantillon

60
Q

En quoi les scores z sont très utiles?

A

Quand on veut comparer des scores provenant de distributions ayant différentes moyennes et différents écart-types (exemple comparer les notes de deux personnes pour un même cours mais qui sont dans deux groupes différents, on va voir à combien d’écart-type elles sont de la moyenne (score z) ).

61
Q

Qu’est-ce que des postulats?

A

Des conditions qu’on examine avant de faire un test statistique.

62
Q

Quel est le desavantage du diagramme de dispersion?

A

Quand on a des données ordinales et que les points se superposent parce que deux personnes ou plus s’ils représente la même valeur.

63
Q

Que faut-il faire si on a une distribution bimodale?

A

Il faut séparer les deux groupes.

64
Q

Pour une distribution bimodale, la moyenne et l’ècart-type sont-ils de bon indicateurs?

A

Non

65
Q

Dans une distribution standardisée 68%, 95%, 99% et 99,9% des scores se situent entre quoi et quoi (z=?)?

A

68%: -1,00 et 1,00
95%: -1,96 et 1,96
99%: -2,58 et 2,58
99,9%: -3,29 et 3,29

66
Q

Vrai ou faux, la moyenne des scores Z donne toujours 0.

A

Vrai

67
Q

Comment on sait si une distribution de scores devie trop de la distribution normale?

A

On transforme les valeurs de l’assymétrie et de l’applatissement en scores Z (les 2 formules sont sur la feuille de formules) puis on utilise la distribution des scores z pour estimer la probabilité des données si la distribution de la population est normale.

68
Q

Qu’arrive-t-il si la valeur du z aplatissement ou du z asymétrie est plus grande que 1,96 ou plus petite que -1,96?

A

Il est peu probable que es données étudiées suivent la loi normale.

69
Q

Qu’est-ce qu’un intervalle de confiance?

A

L’intervalle de confiance vient indiquer l’incertitude entourant l’estimation de la moyenne de la population (paramètre). Elle donne l’ampleur de l’erreur de mesure. Elle spécifie un intervalle autour de la statistique dans lequel devrait se trouver notre paramètre dans 95% des réplication de l’étude.

70
Q

Vrai ou faux, plus l’échantillon est gros plus l’erreur standard va avoir tendance à être petite.

A

Vrai

71
Q

Que veux dire É-T dans la formule de l’erreur standard à la moyenne?

A

Écart-type

72
Q

Quand utilise-t-on l’erreur standard de la moyenne?

A

Quand on savoir l’erreur d’estimation qu’on a fait en estimant la valeur de la moyenne de la population sur la valeur de la moyenne de l’échantillon.

73
Q

L’intervalle de confiance tient compte de quoi?

A

De l’erreur d’estimation de la valeur du paramètre, qu’on appelle erreur standard de la moyenne.

74
Q

Qu’est-ce que l’erreur d’échantillonage?

A

Une dispersion des estimations provenant de plusieurs échantillons (statistiques) autour du paramètre (population) à estimer.

75
Q

Que dit le théorème de la limite centrale?

A

La moyenne de toutes les moyennes d’échantillons est égale à la moyenne de la population et on réduit ainsi l’erreur d’échantillonage.

76
Q

Qu’est-ce que significatif veut dire?

A

Qu’on a rejetté l’hypothèse nulle. Cella indique que l’effet est peu probable dans le cas où l’hypothèse nulle serait vraie, donc d’obtenir un lien (effet) entre les variables alors qu’il n’y en a pas en vrai.

77
Q

Comment on trouve alpha (p)?

A

C’est nous qui le fixe, souvent c’est p<0,05

78
Q

Par rapport à la significativité, qu’est-ce qui arrive si l’échantillon est trop gros?

A

Tout devient significatif et c’est problématique.

79
Q

Qu’est-ce qu’une erreur de première espèce?

A

Trouver un effet alors qu’il n’y en a pas dans la population. C’est donc le 5% restant qui peut arriver quand on fixe p (alpha) à 0,05.

80
Q

Qu’est-ce qu’une erreur de deuxième espèce?

A

Ne pas trouver d’effet alors qu’il y en avait un.

81
Q

Comment intéragissent les deux types d’erreur (première et deuxième espèce)?

A

Elles sont reliées, quand une augmente l’autre diminue.

82
Q

Qu’est-ce que la puissance?

A

100-bêta=puissance

C’est la capacité à trouver un lien dans la population alors qu’il en existe un pour vrai. On fixe bêta à 0,20 (20%). Donc 80% de chance de trouver un lien quand il y en a un pour vrai et 20 de chances de se tromper.

83
Q

Qu’est-ce qu’un test bilatéral?

A

Quand on rejette 5% de chances de se tromper et qu’on met 2,5% de chaque côté de la distribution des probabilités. c’est quand l’hypothèse est non directionnelle.

84
Q

Qu’est-ce qu’un test unilatéral?

A

C’est quand le 5% de chances de se tromber qu’on rejette se trouve tout d’un seul côté de la distribution des probabilités. c’est quand l’hypothèse est directionnelle.

85
Q

Si on a une échelle ordinale, on fait un test paramétrique ou pas? (corrélation)

A

non paramétrique, on trouve un rs

86
Q

Dans une corrélation, si les distributions ne sont pas normales on peut utiliser quel type de r?

A

Le rs de Spearman qui est non paramétrique et pour une échelle ordinale.

87
Q

Quand tu mets r au carré ça donne quoi?

A

Le % de variance commune (coefficient de détermination).

88
Q

Si on restreint l’étendue des donnés dans une corrélation quel est l’effet de ça?

A

ça diminu la corrélation pcq les donnée tendent à moins varier.

89
Q

correlation artielle?

A

on garde constante une 3e variable.

90
Q

Erreur de prédiction en régression (résidus)?

A

La différence entre le y prédit et le vrai y.

91
Q

dans l’équation des degrés de liberté:
n=?
p=?

A

n=nombre de participants

p=nombre de prédicteurs

92
Q

Comment on trouve l’erreur standard autour du coefficient de régrassion?

A

b1 +/- (2*erreur standard de b1)

93
Q

la différence entre erreur syandard et écart-type?

A

les écart-type c’est pour les scores et l’erreur standard c’est pour les distribution d’échantillon mais ça revient au même