Cours 1 Flashcards

1
Q

kess-ce qu’une variable

A

Le ou les concept(s) qui peut être mesuré et qui diffère d’une entité à l’autre ou à travers le temps.

en gros on peut le mesurer et ça valeur peut changer dans le temps et d’un concept à l’autre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

nomme les types de variables (pas vi et vd)

A

tangible= ca se compte comme de l’argent ex: taille, nb. de freres et soeurs etc.

ou abstrait (climat de travail, personnalité, intelligence, etc.). (souvent avec des mots

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

constante

A

valeur fixe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

ecq une variable dans une étudude pourrait etre une constante dans une autre

A

Une variable dans une étude pourrait être choisie comme constante dans une autre. * Tout dépend si c’est une entité qui dans un contexte précis peut prendre des valeurs différentes ou au contraire qui a une valeur fixe!

  • Une variable dans une étude pourrait être choisie comme constante dans une autre. Ex: le nombre de sommeil des étudiants de udem. Udem es tune constante car tous les étudiants doivent venir de udem

Mtn sim on étude porte sur le nb. D’heures de travailles de tous les étudiants du québec, udem n’est pas une constante pcq ya des gens de plein d’écoles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Variable explicative d’une autre variable, celle qui est introduite ou manipulée par le chercheur

A

vi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Variable qui subit l’influence de l’autre variable

A

vd

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

variable nominale

A

NOMinal donc c’est le NOM d’une catégorie. ex: homme femme, lieu de naissance, couleur de peau. c’est qualitatif.
qqch ou qq ne peut jamais appartenir à deux catégories. si elle a des caractéristique de plus d’une catégories, il faut créer une nuvelle aractéristique avec ces catégories

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

donc en gros les échelles de mesures c’est la nature d’une variable. chaque variable a une différente nature et l’échelle de mesure permet de désigner quel est la nature de ce qu’on mesure. par exemple, avec ordinal, c’est l’ordre avec nominal, c’est la catégorie. catégorie 2 et arriver 2e place ne veut pas dire la meme chose car c’est deux valeurs n’ont pas la meme nature et donc pas la meme échelle de mesure

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

variable ordinal

A

les variables ordinales indiquent le rang, mais elles n’indiquent pas la magnitude des différences entre les rangs. Par conséquent, avec une mesure ordinale, la dif-
férence entre le rang 1 et le rang 2 n’est pas nécessairement égale à la différence entre le rang 2 et le rang 3.

ça permet de montrer l’emplacement d’un observation par rapport aux autres

contrairement aux variable nominal, le chiffre à une signification

ex: e, lorsque le Canada obtient le premier rang, on ne sait pas si la qualité de vie au Canada est légèrement ou fortement supérieure aux pays qui obtiennent les rangs 2, 3 ou 2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

variable à intervale

A

L’ordre et la différence relative entre les valeurs sont connus. ex: les : un psychologue est en mesure d’indiquer non seulement si quelqu’un est moins anxieux que sa mère, mais s’il l’est beaucoup ou légèrement moins.

-ya pas de valeur absolue. ce qui veut dire qu’aucune observation peut avoir la valeur de zero (rien).
ex: 0 degré ne veut pas dire que ya pas de température.
puisque ya pas de zéro absolue, il peut y avoir des valeurs négativ. ex: -7 dgré.

vu que ya pas de zéro absolu, tu peux pas dire que tel observation est deux fois plus grande qu’une autre. c’est pcq c’est sur un continum

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

variable de rapport

A

-a toutes les caractéristiques des autres variables.
- a un zero absolu
-tu peux dire 2 fois plus ou le tière de telle variable par exemple.
-pas de valeurs négatives

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

fréquence

A

t le décompte du nombre d’observations ayant obtenu une certaine valeur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

synonyme de fréquence

A

effectif

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

à quoi sert la distribution des effectifs

A

à organiser informations que contient la banque de données en regroupant ensemble celles qui sont identiques et permet ainsi d’en réduire le nombre.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

différents types de distributions:
simple

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

La distribution groupée des donné ou (fréquence catégorie)

A

La distribution groupée des données consiste à regrouper dans la même catégorie les observations qui sont proches les unes des au

entre a et b

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

avantage et désavantage de distribution groupée des données

A

La simplifi cation de la banque de données que permet une distribution groupée augmente certes la clarté de l’information, mais elle le fait en sacrifi ant des détails.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

pourcentage cumulatif

A

= pourcentage la fréquence de la catégorie+ le pourcentage de tous les catégories précédentes.

ex: 56% des gens gagent 45$ ou moins

**truc pour s’en souvenir= le pourcentage cumulatif de la dernière catégorie est de 100%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

3 manières principale de distinguer des distributions

A

les tendances centrales
l’étendue
Par leur forme (symétrie et aplatissement)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

étendue

A

valeur maximale-minimale=étendue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

polygone des effectifs absolus vs polygone des effectifs cumulatif

A

absolu = juste la fréquence normale et cumulatif = fréquence cumulative

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

à quoi servent les mesures de tendance centrales

A

Lorsque nous ne connaissons pas la valeur obtenue par une personne spécifique sur une variable, on se sert des mesures de tendance centrale de la distribution pour estimer sa valeur.

ex: Tiana a quel âge? * Tiana vient d’obtenir son diplôme baccalauréat * Âge moyen au moment de l’obtention du diplôme baccalauréat: 26 ans

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

le mode (Mo)

A

La valeur la plus fréquente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

La médiane(Md)

A

la valeur divisant la distribution en deux parties égales.
la valeur au centre de la distribution

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

La moyenne (Mx)

A

la somme des valeurs, divisée par le nombre des valeurs : (ΣX) /N

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

ques-ce que décrit les mesures de tendance centrale

A

la valeur typique d’une distribution

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

le mode

A

La valeur la plus fréquente
*Il est possible d’avoir plusieurs modes (uni, bi, multi)
*Peut-être déterminé par inspection visuelle (en regardant courbe
*Le mode n’est pas affectée par les scores extrêmes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

ecq le mode est affecté par les valeurs extrêmes

A

non

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

la médiane

A

La valeur qui divise la distribution (x) en deux groupes égaux; *La médiane n’est pas affectée par les scores extrêmes; *Peut-être déterminé par inspection visuelle

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

que faut-il faire pour la médiane quand “n” est paire

A

faut faire la moyenne des deux valeurs qui divisent la distribution

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

quel est l’équation pour trouver la valeur qui est la médiane

A

n+1/2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

quelle mesure de tendance centrale tient compte de chaque observation, est sensible à tout changement dans la distribution (retrait, ajout d’observations, score extrême, etc. );

A

la moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

la moyenne

A

Utilise 100% de l’information; *Très sensible à tout changement *Se calcule par la somme des observations divisé par le nombre; *Elle est influencée par les valeurs extrêmes et est sensible aux changements dans la distribution

La moyenne est la mesure de tendance centrale la plus utilisée

C’est la mesure de tendance centrale qui fait le moins d’erreurs dans sa description des valeurs de toute la distribution;

calcule pour la moyenne= somme de tous les observations divisé par le nb. d’observations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

nomme les mesures de tendance centrale qui fit avec les différents niveaux de mesure

A

-nominal: mode
-ordinal: mode, médiane
-intervalle: mode, médiane, moyenne
-rapport: mode, médiane, moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

c’est quoi M(x)

A

moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

comment peut-on décrire la modalité d’une distribution

A

en comptant le nombre de sommets (bimodal, multimodal etc.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

quel caractéristique des distribution désigne le fait que les données extrêmes sont dans une certaine direction

A

la symétrie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

bimodal = 2 modes

A
39
Q

symétrique: mode= médiane (donc la valeur la plus fréquente est située au centre de la distribution.

A
40
Q

asymétrique= la valeur la plus fréquente n’est pas au centre de la distribution

A
41
Q

leptocurtique

A

-les valeurs sont très concentrées autour du mode
donc la fréquence est seulement haute pour quelques valeurs. ex: nhl ce l’est pcq 3/4 des joueurs ont un salaire similaire

42
Q

Asymétrie positive

A

la moyenne est étirée du côté positif et donc la moyenne surestime la valeur typique. il est mieux d’utiliser la médiane

43
Q

asymétrie négative

A

la moyenne est étirée du côté négatif et donc la moyenne sous-estime. la médianne décrit mieux la distribution

44
Q

asymétrie nulle

A

mode=moyenne=médianne

45
Q

L’asymétrie indique la position de la médiane par rapport a la moyenne;

A
46
Q

si c’est platycurtique, quest-ce que ça dit sur la moyenne?

A

que la moyenne est pas aussi fiable

47
Q

La tendance centrale c’est celle qui résume le mieux la distribution. ca nous donne une idée globale sur qqch

A
48
Q

comment décrire l’asymétrie

A

la distance entre la médiane et la moyenne. quand la moyenne est plus forte que la médiane, c’est asymétrique positif. quand elle la moyenne est moins forte que la médiane, c’est asymétrique négatif. c’est causé par les données extrêmes qui rendent la moyenne moins bonne

49
Q

quest-ce qui fait que la moyenne est bonne ou mauvaise

A

si les données sont assez similaires l’une de l’autre la moyenne est bonne. si elles sont très différentes, la moyenne n’est pas tres bonne

50
Q

mesures de dispersion= permet de déterminer différence entre les items d’une distribution

A
51
Q

l’étendue

A

nous permet de voir la différence des informations dans une distribution mais est pas fiable. seulement une donnée peut completement changer l’étendue. ex: valeur maximale pourrait tout changer

52
Q

étendue interquartile

A

50% de la distribution. ca comprend 25% de la distribution avant la médiane et 50% de la distribution apres la médiane. Pour le calculer on fait Q3-Q1.

c’est plus stable que l’étendue car ça n’utilise pas les donnée max et min qui sont ouvent des données extrêmes. cependant, ca utilise seulement 50% de la distribution donc pas autant valide.

53
Q

déviance (écart à la moyenne)

A

la différence entre chaque valeur et la moyenne. donc observation-la moyenne.

54
Q

on veut savoir à quel points les observations d’une distributions sont différentes l’une de l’autre et donc à quel point la moyenne est représentative de la distribution. On trouve donc la différence entre chaque observation et la moyenne(écart à la moyenne ou déviance). ensuite on additionne chaque écart à la moyenne mais le probleme c’est que ça donne toujours 0.

Pour remédier à ce problème on rend chaque écart à la moyenne au carré (somme des différences au carré) plus le chiffre est gros plus les observations de la distribution sont différentes. cela marche pour comparer deux distribution de meme N, mais si ya pas le meme N, ya un probleme car plus N est gros plus la somme des différences au carré est grosse. c’est pour ça qu’il faut utiliser la variance.

A
55
Q

la variance,

A

c’est l’écart moyen au carré
donc c’est la somme de tous les écart au carré, divisé par N-1. plus la variance est grande, plus ya de différence entre les observations de la distribution et moins bonne est la moyenne. donc en gros la variance sert à mesurer le degré de précision de la moyenne.

56
Q

l’écart type,

A

c’est l’écart moyen
donc c’est la variance mais avec une racine carrée.

57
Q

dans quelle situation la variante est plus grande que 0

A

si la variable est une consante.

58
Q

à partir de combien d’observation la variance ne change pas vrm (stable)

A

30 et plus

59
Q

comment interpréter la variance si les moyennes ne sont pas identiques

A

coefficient de variabilité

60
Q

quel truc mathématique à utiliser pour:

déterminer la précision de la moyenne entr deux distributions de meme moyenne:

déterminer la variabilité entre deux distributions de différentes moyennes

A

écart type

coéfficiant de variabilité (s/M(x))

61
Q

explique l’utilité de chacune:

-mesures de tendance centrale
-mesure de dispersion
-position relative des observations

A

valeur typique
différence entre les valeurs
comparer un observation comparé aux autres

62
Q

le rang absolu

A

Transformation de scores bruts ordonnés en nombres représentant leur position (rang), du plus petit au plus grand (ou l’inverse); Procédure: * Comptez le nombre total d’observations (n); * Triez les observations en ordre de grandeur (1 à n); * Assignez le rang « 1 » à la valeur la plus forte (ou la plus faible) et le rang n à la valeur la plus faible (ou la plus forte); * Lorsque deux observations sont identiques, assignez le rang 27 mitoyen aux deux;

Avantage: * Facile à comprendre et à calculer Désavantages: * Le rang absolu étant une mesure ordinale, on perd certaines informations: * La différence entre l’observation qui occupe le rang 3 et celle qui occupe le rang 4 pourrait être grande ou petite; * Peut être interprété seulement si nous connaissons la taille de la distribution;

63
Q

dans quel situation le rang absolue est utile

A

Le rang absolu est très utile lorsqu’il faut faire un choix: * Lors de l’admission, on choisit la meilleure université; * En organisation, pour la sélection des employés: il faut choisir les trois meilleurs employés; * L’admission aux programmes d’études contingentés (on ne peut accepter que les 10 meilleurs étudiants). Le rang absolu est facile à interpréter: * Ex.: L’UdeM obtient la 81e place mondiale au classement Impact du «Times Higher Education» (n=2112)

64
Q

le rang percentile, c’est le pourcentage cumulatif de l’observation avant x + (le pourcentage de x divisé par 2)

A
65
Q

avec quelle mesure de tendance, le 50e percentile est-il égale

A
66
Q

martin a eu une note se situant au 75e percentile . que peut on conclure

A

martin a une note égale ou supérieur à 75% de la classe.
25% de la classe a une note supérieur à martin.

67
Q

Que faut-il faire si ya pas le percentile recherché

A

on prend le percentile le plus proche.

68
Q

les quartiles incluent quels percentiles

A

25,50 et 75

69
Q

désavantages du percentile

A

fonctionne mieux avec distribution normale et marche mal ave petite distribution

70
Q

la valeur étalon (z ou t)

A

c’est l’écart entre une observation et la moyenne.

l’équation est (x-Mx)/ écart type

71
Q

avec la talon z on peut comparer divers variables et personnes pcq c’est standarisé. donc c’est comme une distribution qui fonctionne pour tout.

A
72
Q

l’écart à la moyenne calcule seulement la distance entre moyenne et la valeur. c’est pas 100% précis. pour etre plus précis, faut savoir à quel point les autres valeurs de la distributions sont éloignée de la moyenne. c’est là que le score z vient en jeu.

A
73
Q

deux particularités d’une distribution au complet représentée en z

A

la moyenne est = à 0 et le s= 1

74
Q

pourquoi transformer une distribution en score z

A

: tous les échantillons, lorsqu’ils sont exprimés en valeurs éta-
lons Z, détiennent la même moyenne (0) et le même écart-type (1). Grâce à cette transformation, les valeurs obtenues par une personne sur n’im-
porte quelles variables sont directement comparables

75
Q

qu’à t’on besoin pour comparer des performences sur 2 variables?

A

que les variables aient la meme moyenne et variance.

76
Q

la standarisation

A

rendre une diistribution en score z

77
Q

formule pour changer score z en score brute

A

x=(z*s)+xM

78
Q

à quoi sert le score t

A

à ce que ce soit plus simple pour ceux qui sont pas des expères en statistiques.

79
Q

quel est la moyenne est quel est l’écart type pour score t

A

moyenne=50
écart type= 10

80
Q

qu’est-ce qu’indique le rang percentile

A

ile indique la proportion des observations égales ou inférieures à n’importe quelle valeur d’une distribution.

81
Q

pk peut-on facilement changer un score z en percentile avec la distribution normale?

A

le score z nous donne la distance entre la moyenne et une valeur. une fois que nous avons la distance, c’est facile de le rendre en percentile car pour une distribution normale, on connait tous les pourcentages de la distribution. il reste juste à faire un addition 34,5 +50= 84.5

82
Q

à quoi ca sert de transformer score z en percentile.

A

c’est plus claire et aide ceux moins habitués

83
Q

écart-type= écar en moyenne avec la moyenne. le score z nous donne le nombre d’écart-type qu’une valeur est par rapport à la moyenne

A
84
Q

équatoin pour la probabilité

A

c’est la valeur divisé par le total

85
Q

caractéristiques de la distribution normale

A
86
Q

kess-ce que permet de déterminer le tableau de la densité sous la courbe normale

A

probabilité d’avoir = ou supérieur à notre valeur

87
Q

comment trouver probabilité d’avoir plus que notre valeur z

A

1- p de densité sous la courbe

88
Q

qu’à-t-on besoin pour utiliser le score z et la distribution normale

A

on a besoin d’avoir une distribution normale. ensuite on a besoin de connaitre la moyenne de la distribution et l’écart type. à partir de ca on trouve le z. après avoir le z, grâce à un tableau, on peut connaitre la densité sous la courbe et la probabilité d’avoir ou avoir moins que notre valeur. on peut aussi trouver la probabilité d’avoir plus que notre valeur.

on peut aussi trouver la probabilité d’avoir entre deux valeurs. On peut aussi trouver le rang percentile

89
Q

densité=percentile

A
90
Q

comment passer de percentile à note originale

A

percentile, à score z, à note originale

91
Q

comment calculer si un évènement est rare?

A

en trouvant la probabilité d’avoir un résultat supérieur

92
Q

de combein doit etre la probabilité supérieur pour qu’un résultat soit qualifié de rare

A

moins de 5%

93
Q

peu de variance=leptocurtique

A