Intra Flashcards

1
Q

Une caractéristique essentielle pour la corrélation et la régression

A

La variance

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Années quantitatives vs qualitatives + le meilleur?

A

Quantitative:
+ de données
Peut faire médiane
+ fréquent

Qualitatives:
Données plus petites

Pas un de meilleur, ça dépend de la situation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Comment fonctionne les recherches?

A

On part d’observation, puis hypothèse + vérifier si valide

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Déf. variable

A

Tout ce qui varie
Opposé: constante

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Déf. unité d’analyse

A

Entité qui fournit l’information sur la variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

2 types de variable

A

Indépendante (x)
Variable prédictrice
Ce qui déclenche une réaction

Dépendante (y)
Variable résultante
Suit influence de x

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

4 types d’échelle de mesure

A

Nominale:
Catégorie d’entité
Dichotomique ou multichotomique
AUCUNE opération mathématique

Ordinale:
A une gradation
On perd la distance, connait juste la position (connait pas l’écart)
Plus grand/plus petit seulement

Intervalle:
Gradation entre les chiffres
Écart entre réponse le même
Addition/soustraction

Proportions:
Donne le + d’infos, peut distinguer différence
Écart entre réponses le même
Zéro absolu existe!
Addition/soustraction/multiplication/division

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Est ce qu’on peut passer d’échelle en échelle

A

Oui, mais seulement de proportion à nominale pas le contraire
(passer à des échelles avec - infos)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Échelle de Likert

A

Échelle ordinale, mais avec des chiffres pour préciser que l’écart est le même

(si juste les mots = ordinal, mais avec les chiffres = intervalle)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Importance vue d’ensemble

A

Si on fait questionnaire avec question ordinal, mais veut faire régression après = pas possible

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Validité vs fidélité

A

Validité:
Mesure le bon concept

Fidélité:
Résultats devraient être similaires

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Utilité de recueillir en forme de variable

A

Permet de résumer une grande quantité d’infos dans quelque chose de simple

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Descriptive vs inférentielle

A

Descriptive:
Décrit un échantillon

Inférentielle:
Déterminer qlqch d’une population grâce à un échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Catégories peuvent créer de 2 façons

A

Relié à la théorie
Catégorie intuitive

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Ce qu’il faut s’assurer dans un tableau de fréquence avec catégorie

A

Que 2 chiffres ne sont pas dans la même catégorie
inclu/exclu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Histogramme et variables

A

Ligne horizontale:
Ligne x
Abscisse

Ligne vertical:
Ligne y
Ordonnée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

3 caractéristiques des distributions

A

Étendue
Forme (symétrie/aplatissement)
Tendance centrale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Déf. étendue

A

Différence entre valeur minimale et maximale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Asymétrie déf.

A

Asymétrie positive:
La droite qui va vers le bas va vers le positif
+ de score faible

Asymétrie négative:
La droite qui va vers le bas va vers le négatif
+ de score élevé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Aplatissement déf.

A

Leptokurtique (leap):
Pic vers le haut
Kurtose positive

Platykurtique:
Plateau vers le haut
Kurtose négative

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Caractéristiques distribution normale (4)

A

-Majorité des scores sont au centre
-Courbe normale est un polygone de fréquence
-Beaucoup de phénomènes naturels se distribuent de cette manière

Symétrique (asymétrie et aplatissement = 0)

Unimodale

Moyenne, mode et médiane presque identique

Atteint jamais 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Tendance centrale déf.

A

Le centre d’une distribution de fréquence (valeur typique d’une observation)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Mesure de tendance centrale

A

Moyenne
Médiane
Mode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Déf. mode

A

Score le plus fréquent

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Différents types de mode

A

Unimodale, bimodale et multimodale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Déf. médiane

A

Partage la distribution en 2 groupes égaux

Pas affecté par scores extrêmes!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Déf. moyenne (4)

A

-Plus utilisée
-Influencé par valeurs extrêmes et sensible aux changements
-Fait le moins d’erreur
-Erreur moyenne à 0!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Déf. déviance

A

Différence entre valeur observé et la moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Tendance centrale et niveau de mesure

A

Nominale: mode
Ordinale: Mode et médiane
Intervalle et Proportions: Mode, médiane et moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Est ce que la moyenne est toujours la meilleure mesure?

A

Non! pas si valeur extrême

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Devrait on utiliser la moyenne dans une distribution bimodale ou multimodale

A

Non parce qu’elle va tomber dans le milieu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Devrait on utiliser la moyenne dans une distribution leptokurtique ou platykurtique

A

Leptokurtique = ok

Platykurtique = moins bon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Quelle mesure de tendance centrale utilisée selon l’asymétrie

A

Asymétrie nulle:
Mode=Md=Moyenne

Asymétrie négative:
Mode = meilleure
Md = meh
Moyenne = nope

Asymétrie positive:
Moyenne = meilleure
Md = meh
Mode = nope

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Lorsqu’il y a une grande variance est ce que la moyenne est bonne

A

La moyenne devient un moins bon estimateur
(pourrait exister des sous-groupes)

DONC utiliser moyenne avec écart-type

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Caractéristiques variance (4)

A

Plus la variance est grande, plus le phénomène est intéressant

Valeur minimal = 0 (constante)
Valeur maximal = infini

Peut pas être plus bas que 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Déviance vs variance

A

Déviance:
Différence entre UNE valeur observée et sa moyenne

Variance:
Degré de différence entre les observations et la moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Formule déviance vs au carré vs variance

A

Déviance:
une valeur - moyenne et additionné pour toutes les données

Mettre au carré:
Pour ne pas que ça donne zéro

Variance:
Même chose mais divisé par population - 1

Variance peut JAMAIS être NÉGATIVE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Comment interpréter variance

A

Si proche de 0:
Moyenne = peu d’erreur d’estimation
Science = peu intéressant

Si loin de 0
Moyenne= plus d’erreur d’estimation
Science= intéressant

Si = 0
Constante

Plus il y a d’observations loin de la moyenne, plus la variance va être élevé

Si on rajoute des valeurs proches de la moyenne s va diminuer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Déf. écart-type

A

Plus simple à comprendre que la variance

On l’obtient en prenant la racine carré de la variance

Une variance plus grande = écart-type plus grand

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Déf. coefficient de variabilité

A

Interpréter variance si les moyennes ne sont pas identiques

Écart-type/moyenne

Variable avec CV plus grand = peut détecter différences individuelles entre les observations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

Trois stratégies pour interpréter une observation à partir de sa position

A

Rang absolu
Percentile
Score Z (valeur étalon)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

Rang absolu déf. avantage et désavantage

A

Transformation des valeurs en position (rang)

Avantage:
Facile à comprendre
Utile pour faire choix

Désavantage:
Mesure ordinale donc perd précision
Taille entre les rangs est inconnu
Peut être interprété seulement si on connait n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
43
Q

Percentile déf. + avantage et désavantage

A

Positionne les gens par rapport aux autres observations

Avantages:
Comparer un score à une norme
Facilement compréhensible
Fournit plus de détails que le rang absolu

Désavantage:
Percentile est moins adaptée aux petits échantillons
Sensible aux déviations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
44
Q

Score z déf.

A

Positionne les gens par rapport à la moyenne

Prend en compte la variabilité pas comme le percentile

Tient en compte tendance centrale et différences individuelles (variabilité)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
45
Q

Comment déterminer position de l’observation par standardisation

A

valeur - moyenne

Si positif = au dessus de la moyenne et vice-versa

Plus le z est grand, plus grand écart avec la moyenne

46
Q

Est ce que la variabilité a un impact même si moyenne est la même

A

Oui

47
Q

Score z de 0 =
z=1

A

Même chose que la moyenne
Écart type

48
Q

Convertir toutes les observations en score z permet quoi

A

les variables auront toutes la même moyenne et le même écart type

49
Q

Quand peut on utiliser le score z

A

Elle peut être normal ou asymétrique mais elle doit être unimodale

50
Q

Comment calculer le score z

A

valeur - la moyenne divisé par l’écart type

51
Q

Comment faire en sorte que la distribution se rapproche de la distribution normale

A

En augmentant n

52
Q

Densité et distribution normale

A

Densité loin de la moyenne est petite

53
Q

Déf. densité

A

Densité = proportion = probabilité = percentile

54
Q

Comment obtenir proportion

A

n/N

55
Q

Si la distribution n’est pas normale qu’est ce qu’on peut calculer

A

le score z mais pas la densité

56
Q

Comment savoir si un événement est rare

A

Apparait moins que 5% dans une distribution

57
Q

Recensement vs sondage

A

Recensement = population
Sondage = échantillon

58
Q

Paramètres vs statistiques

A

Paramètre: population (lettre grec)
Statistique: échantillon (lettre latin)

59
Q

Ce qui est important quand on détermine un écahntillon

A

Représentativité

60
Q

Si on connait pas les paramètres d’une population comment prendre un échantillon

A

Échantillon aléatoire

61
Q

Deux critères pour l’échantillon aléatoire simple

A

-Critère de la chance égale
Chance égale d’être choisi (pas à une sortie de métro)

-Critère de l’indépendance des réponses
Réponse d’une personne ne doit pas être influencée
Anonymat, deux personnes d’une même famille

Exigent que chaque différence x moins moyenne est indépendante

62
Q

Plus un échantillon est grand, plus il a de chance

A

d’être représentatif et de faire moins d’erreur

MAIS à un certain point ça n’augmente plus

63
Q

Pourquoi lorsqu’on calcule la variance ou l’écart type d’un échantillon on divise par n-1

A

Degré de libération qui compense le biais en exagérant la variance
CAR un échantillon exclut généralement les valeurs extrêmes

64
Q

Vrai ou Faux
Il n’y a pas de biais d’inférence avec la population

A

Vrai

65
Q

H1 vs H0

A

H1 = prédiction, la théorie est juste

H0 = Théorie ou prédiction est erronée

66
Q

Le test de référence se fait toujours sur

A

H0

Soit rejet de H0 ou non-rejet de H0

Le rejet de H0 mène à l’acceptation de H1, mais pas l’inverse!!

En effet, si H0 n’est pas rejeté ça veut pas dire que H1 est 100% faux

67
Q

Principaux concepts d’inférence

A

On peut jamais prouver que H1 est fausse à partir d’un échantillon, il faudrait examiner la population ce qui est impossible

68
Q

Déf. erreur d’échantillonage

A

Fluctuation naturelle entre les échantillons tirés de la même population (pas les mêmes valeurs)

69
Q

Déf. erreur type de la moyenne

A

Fluctuation naturelle entre les moyennes des échantillons tirés de la même population

70
Q

Hypothèses pour savoir si ils proviennent de la même population

A

Rejet de H0 si la différence entre les moyennes est plus grande que l’erreur type de la moyenne

71
Q

Erreurs type 1 vs type 2

A

Types 1 (alpha):
Conclure qu’il existe une différence entre 2 moyennes alors qu’en réalité il n’y en avait pas

Conclure à tort au rejet de H0

Types 2 (beta):
Conclure qu’il n’existe pas différence entre 2 moyennes alors que la différence existe

Conclure à tort au non-rejet de H0

72
Q

Déf. erreur type de la moyenne

A

Fluctuation typique entre les moyennes des échantillons provenant de la même population

Écart-type divisé par racine carré de n

73
Q

Comment calculer IC (intervalle de confiance)

A

moyenne + ou - (Erreur type de la moyenne * z)

74
Q

Z pour intervalle de confiance de 0,05 : 0,01 et 0,001

A

z=1,96 pour 0,05

z=2,58 pour 0,01

z=3,1 pour 0,001

75
Q

Rejeter H0 = à quoi

A

Que l’échantillon fait partie de la population

76
Q

Comment réduire le risque d’un alpha

A

Accroitre les bornes de l’IC

Augmentant erreur type de la moyenne

Choisir un seuil alpha plus petit

Réduire nombre d’observations n

77
Q

Si je réduis mon risque d’erreur de type 1 j’augmente…

A

Le risque d’erreur de type 2

78
Q

Comment réduire le risque d’une erreur bêta?

A

Réduire les bornes de l’IC

Réduire l’erreur type de la moyenne

Choisir seuil alpha plus grand

Augmentant le nbre d’observations

79
Q

Déf. corrélation

A

Lien entre deux variables (H1) ou (H0)

Connaissant x il est possible d’estimer y

Max +1 et Min -1

80
Q

Corrélation négative vs positive

A

Négative:
Si les deux diminuent

Positive:
Si les deux augmentent

81
Q

Corrélation varie selon 2 choses

A

-Taille
Plus forte est rxy plus grande la réaction de l’incertitude

-Direction
Positives ou négatives

82
Q

Une corrélation négative ne veut pas que la corrélation est faible?

A

Vrai

83
Q

Plus élevée est la corrélation (taille), plus…

A

x nous renseigne sur y

84
Q

La corrélation indique que x cause y

A

FAUX

Corrélation n’indique pas de cause à effet

85
Q

Il y a corrélation si

A

La position des observations restent identiques
Même si la position est inversée!

86
Q

Si les scores x et y sont… (3)

A

Similaires = association positive

Inversés = association négative

Aléatoire = pas d’association rxy=0

87
Q

Pour faire une corrélation il faut faire quoi à nos variables

A

Standardiser (pas d’unité de mesure)

88
Q

Postulats de Pearson (3)

A

x et y mesures à intervalle et variables continues

Distribué normalement sans valeur extrême

Relation xy est linéaire!

89
Q

Déf. relation linéaire

A

Changement constant, ligne droite

90
Q

Si la variable n’a pas de variance la corrélation sera…

A

de zéro!

91
Q

Deux causes de le manque de variance

A

Observations sont trop homogènes (Donner exam 1004 à des gens avec un PHD)

Variable est incapable de distinguer entre les observations (Donner exam de 4e année à des élèves de l’uni)
Manque de difficulté

92
Q

3 choses nécessaires pour une cause

A

Corrélation entre x et y

Cause doit précéder l’effet

Délai entre la cause et l’effet

93
Q

Seuil de signification

A

H1 = corrélation p< 0,05
H2= pas de corrélation p> 0,05

94
Q

Proportion de variance/ coefficient de détermination

A

rxy à la deux donne la variance commune entre x et y

ET

à quel point la corrélation viendra réduire notre incertitude quant à la relation entre x et y

95
Q

Coefficient de non détermination

A

1 - rxy ^ 2

Incertitude restante

96
Q

But de la régression

A

Utiliser la relation générale rxy pour faire une prédiction individualisé et plus précise que la moyenne

97
Q

Plus le rxy est grand plus la prédiction est

A

juste

98
Q

Régression simple standardisé vs non-standardisé

A

Standardisé:
Passe toujours par 0
La relation entre x et y est moins forte si droite est couchée

Non-standardisée:
Produit un estimé en valeur original
Ordonnée à l’origine ne sera pas zéro
Intègre que le x et y n’ont pas la même moyenne et écart type

99
Q

Comment trouver valeur prédite ^y

A

rxy * Zx

100
Q

En régression comment on appelle le rxy

A

Régression standardisé (B) bêta

101
Q

inconvénients régression simple standardisée

A

Produit un estimé de y en score Z plutôt qu’en valeur de l’échelle originale

DONC seulement utile pour déterminer si une variable x est liée à une variable y sur le plan théorique

102
Q

Coefficient de régression rxy en valeur non standardisé

A

b

103
Q

Si rxy est négatif, B et b

A

sont négatifs aussi + même chiffre

104
Q

Ordonnée à l’origine

A

a

Prend en considération qu’ils ne sont pas de la même moyenne

Ajuste la valeur ^y pour qu’elle soit sur l’échelle de y

105
Q

Est ce qu’on utilise B ou b

A

B = contexte théorique
est ce que x prédit y

b = même échelle
contexte pratique

106
Q

Erreur d’estimation avec régression

A

Plus élevé corrélation rxy, plus élevé le B et b

Plus élevé le coefficient, plus précise la prédiction
DONC qté d’erreur plus faible

107
Q

4 types d’erreur

A

Écart- type:
Écart typique entre observation et moyenne

Erreur type échantillonnage:
Plusieurs échantillons provenant de la même population ne vont pas contenir les mêmes personnes

Erreur type de la moyenne:
Écart typique entre la moyenne d’échantillons tirés de la même population

Erreur type d’estimation (régression):
Écart typique entre le score prédit et le score réel

108
Q

Comment calculer erreur d’estimation

A

^y - y
valeur prédite - véritable valeur

109
Q

Comment trouver intervalle de confiance avec régression

A

^Y +- z * Se

110
Q

Relation entre Se et b ou B

A

Plus faible est rxy ou B, plus élevée sera Se (pas pour b)

Si rxy ou B est parfait, Se=0