Métho II (examen 1) Flashcards

1
Q

qu’est-ce qu’une population et un exemple

A

ensemble des individus ou événements qui nous intéressent
exemple = toutes les marmottes du Québec

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

qu’est-ce qu’un échantillon avec un exemple

A

sous ensemble de la population
exemple = marmottes sur le campus de l’UL

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

qu’est-ce qu’une unité d’observation ainsi qu’un exemple

A

un objet sur lequel on peut collecter des données
exemple = une marmotte du campus

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

différence entre échantillon probabiliste et non probabiliste

A

Probabiliste
- aléatoire
- toutes les unités ont autant de chances d’être sélectionnées
- représentatif de toutes la population
- plus économique qu’un recensement

Non probabiliste
- unités ne sont pas sélectionnées au hasard
- de convenance = un groupe de personnes faciles à recruter

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

pourquoi utilisé un échantillon

A
  • permet tirer des conclusions sur une population = inférences
  • estimer certaines caractéristiques d’une population
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

différence entre validité interne et externe

A
  • interne = à quel point ai-je vraiment mesuré ce que je voulais mesuré
  • externe = à quel point mes observations sur l’échantillon sont-elles généralisables à la pop
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

quel type d’échantillon a la plus grande validité externe

A

échantillon aléatoire car il est généralisable à l’ensemble de la pop

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

différences entre échantillonnage aléatoire et aléation (randomisation)

A
  • échantillonnage aléatoire = constitué un échantillon par une méthode faisant en sorte que chaque unité a autant de chance d’être sélectionnée pour participer à l’étude = augmente validité externe
  • aléation = répartition aléatoire des unités d’observation dans différents groupes = augmente validité interne
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

différences entres les trois concepts suivants: variable, variable discrète, variable continue

A
  • variable = valeur représentant une caractéristique d’une unité d’observation
  • variable discrète = variable prenant un nombre limité de valeurs, ne peut pas être autre chose entre les deux = Likert, niveau étude, binaire (oui ou non)
  • variable continue = valeur numérique représentant la magnitude d’une caractéristique = âge, score motivation, résultats scolaire
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

différences entres les 4 concepts suivants: données qualitatives, données quantitatives, variable indépendante, variable dépendante

A

-données qualitatives = représente souvent une catégorie = catégorie emploi
- données quantitatives = données numériques
- variable dépendante = ce qui est mesuré ou prédit = intensité sx
- variable indépendante = ce qui est manipulé = traitement, dosage médic

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

différences entre les échelles de mesures suivantes: nominale, ordinale, intervalles, rapport

A
  • nominale = étiquettes sans ordre particulier = couleur de cheveux, niveau étude
  • ordinale = objets classés suivant un continuum ordonné = échelle Likert
  • intervalles = différences fixes entre les points de l’échelle donc pas de rapport entre les données = échelle température car pas un zéro absolu
  • rapport = présence zéro absolu = poids
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

exemple expliquant qu’il n’y a pas de rapport dans les échelles intervalles

A

si j’ai 20$ dans mes poches et qu’on m’en donne 20 de plus, je ne suis pas 2 fois plus riches, car j’ai 100$ dans mon compte de banque et non 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

pourquoi est-ce important de connaître nos types d’échelle

A

permet de savoir quel type de test statistique doit être utilisé pour répondre à la question de recherche

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

différence entres ces types de statistiques: descriptive, inférences statistiques, paramètre, estimateur d’un paramètre

A
  • statistiques descriptives = description d’une caractéristiques d’un ensemble de données = moyenne, écart-type
  • inférence statistique = tirer une conclusion sur la population à partir des résultats échantillonnaux
  • paramètre = caractéristique d’une population = moyenne d’âge pop
  • estimateur = caractéristique d’un échantillon visant à inférer une caractéristique de la population = moyenne âge échantillon
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

vrai ou faux, les statistiques inférentielle constitue la plus grandes partie des études statistiques

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

que représente X

A

un ensemble de données
X = (3,4,5,6,7,8)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

qu’est-ce que des mesures de tendance central

A

comme des moyennes = permettre de décrire une distribution de données avec un seul chiffre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

qu’est-ce qu’un mode

A

le score le plus fréquent dans une distribution, mais peut être bimodale, si deux scores sont autant fréquent

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

qu’est-ce que des mesures de variabilité

A

voir à quel point les scores varie autour de la moyenne, plus elle est grande plus les scores varient

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

qu’est-ce que la variance

A

à quel point les différentes variables s’écarte de la moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

qu’est-ce que l’écart-type

A

racine carrée de la variance

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

qu’est-ce que des degrés de liberté

A

Le nombre d’observations indépendantes sur lequel un estimé repose
degré de liberté pour un estimateur = nb total de valeurs - nb de paramètre estimé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

comment savoir si des estimés sont dépendants de l’un l’autre

A

si la valeur de chacun des estimé en calculé en fonction d’une moyenne dont chacun contribue ils sont dépendants

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

pourquoi dans le calcul de la variance d’un échantillon il y a un n-1 au dénominateur

A

puisque l’on estime la moyenne on doit venir faire moins 1 pour enlevé le degré de liberté relié à la moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

que représente l’air sous la courbe normale

A

la probabilité de se retrouver entre deux variables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

qu’est-ce que la distribution échantillonnage

A

-le fait de prendre toutes les moyennes en faisant tous les échantillons possibles
-distribuer toutes ses moyennes sur un graphique (fréquence apparition de ma moyenne y et valeur de ma moyenne x)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

vrai ou faux, la moyenne de la distribution d’échantillonnage et de la population est différente

A

faux, elles sont pareilles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

vrai ou faux, plus la taille de l’échantillon dans la distribution d’échantillonnage est grand, plus la forme de la distribution sera normale et avec moins de variance

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

qu’est-ce que l’erreur échantillonnage

A

erreur type = écart-type de la distribution d’échantillonnage = plus le résultat de mon erreur-type est petit plus ma distribution est proche de la moyenne = bon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

que permet de quantifier l’erreur-type

A

la variabilité interéchantillonnale = variabilité naturelle observée entre les échantillons = si mes données sont plus hautes qu’un seuil (o.o5) mes données ne sont pas dû au hasard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

si la moyenne de notre échantillon est très _ de celle de la distribution échantillonnage, la donnée observée est _ ainsi plus je m’éloigne de la moyenne de la distribution échantillonnage plus ce que j’ai observé est _

A
  • proche
  • fréquente
  • rare
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

vrai ou faux, la distribution échantillonnage porte seulement sur des moyennes

A

faux, elle peut être sur toutes sortes de statistiques

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

que représente Ho (hypothèse nulle)

A

il n’y a aucun changement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

comment faire la décision ou non de rejet Ho

A

si ma valeur de t a une probabilité plus petite que o.o5 mes données sont rares et on rejette Ho

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

que représente p dans le test hypothèse

A

il ne s’agit pas d’une taille d’effet il s’agit de la probabilité que nos résultats soit vrai si Ho l’est

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

plus _ est _ plus on a des chances d’avoir une grande puissance statistique

A

plus échantillon est grand

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

pourquoi il ne faut pas se fier à seulement un test hypothèse et que faut-il utiliser en plus

A
  • test hypothèse est dichotomique ce qui peut créer des erreurs de type 1 ou 2
  • il faut aussi interpréter nos résultats avec la puissance statistique et la taille effet (différence petite, moyenne grande entre mes groupes)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

qu’est-ce que la convergence scientifique

A

le fait de faire de plus en plus des études sur un sujet = moins il aura de résultats erronés avec des erreur de type 1 et 2 due au hasard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

qu,est-ce que la point de vue analytique des statistiques

A

avoir un événement qui peut se produire de A manière mais pas de B manière et que chacune des manières sont autant probable = lancer de dé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

point de vue fréquentiste des statistiques

A
  • en ayant un grand nombre échantillons on peut estimer la probabilité d’un événement
  • plus le nombre échantillon augmente plus la probabilité se rapproche de la vérité sans l’atteindre = limite
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

point de vue subjectif des statistiques

A

probabilité est la croyance subjective d’une personne à propos de la probabilité d’occurrence d’un événement

si je demande à mon amie de venir voir un film les probabilités est qu’elle dise oui

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

qu’est-ce qu’un événement

A

probabilité de l’événement X se produise

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
43
Q

qu’est-ce que des événements indépendants

A

occurence ou non de l’événement 1 n’influence pas occurence ou pas du deuxième (pile ou face)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
44
Q

qu’est-ce que des événements mutuellement exclusifs

A

si événement 1 survient le 2 ne peut pas survenir en même temps (être inscrit en première et deuxième année)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
45
Q

qu’est-ce qu’un ensemble événements exhaustifs

A

inclut tous les événements possibles = si on lance un dé à 6 face non truqué mon ensemble exhaustif des résultats possibles = 1,2,3,4,5,6

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
46
Q

différence entre probabilité simple, probabilité conjointe et probabilité conditionnelle

A
  • simple = p(A)
  • conjointe = probabilité de cooccurrence de 2+ événements = p (A,B)
  • conditionnelle = probabilité événement survienne si l,autre est survenue (A si B) = p (A I B)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
47
Q

qu’est-ce que la loi additive

A

additionner les probabilités occurrence événements mutuellement exclusifs = événements ne peuvent pas survenir en même temps = probabilité que l’un ou l’autre survienne

probabilité de piger un caramel peut importe la sorte = additionne probabilité caramel mou + caramel dur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
48
Q

qu’est-ce que la loi multiplicative

A

multiplier la probabilité d’occurrence de deux événements indépendants (un n’influence pas l’autre) = permet avoir occurrence conjointe (avoir A et B)

piger caramel mou le remettre et piger un autre caramel mou = multiplier probabilité caramel mou par probabilité caramel mou

*si on ne remet pas cela n’est plus indépendant

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
49
Q

peut-on faire des tests d’hypothèses avec la distribution binomiale

A

oui

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
50
Q

est-ce que les données qualitatives peuvent aussi être des chiffres

A

oui mais plus souvent des mots

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
51
Q

le test du khi-carré a un seul paramètre, lequel

A

k correspondant au degrés de liberté

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
52
Q

comment noter les degrés de liberté avec le paramètre k

A

X2(k) = X2(3)
*2 est en exposant
*le chiffre entre parenthèse représente le nombre de degrés de liberté

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
53
Q

la moyenne est (égale, supérieure, inférieure) au nombre de degrés de liberté

A

égale
moyenne = k

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
54
Q

plus k augmente plus la variance (diminue, augmente, aucun effet) et quel est le calcul de la variance

A

augmente
variance = 2k

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
55
Q

plus k augmente plus la courbe devient (asymétrique, symétrique)

A

symétrique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
56
Q

que permet de déterminer le test khi-carré d’ajustement

A
  • déterminer si les valeurs que l’on observe sont assez différentes de celles qu’on obtiendrait par hasard
  • pour que l’on rejette l’idée quelles ont été obtenues par hasard (Ho)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
57
Q

avec le test du khi-carré d’ajustement comment calculer les fréquences observées versus celles attendues

A
  • celles observées proviennent des observations faites durant l’expérience
  • celles attendues = moyenne = total possible/options possibles = 32 rats/ 4 corridors
58
Q

pourquoi est-ce que dans la formule standard du khi-carré on divise par A

A

permet de considérer si la différence est importante ou non

59
Q

que permet le khi-carré d’analyse de tables de contingence

A
  • faire un test du khi-carré pour des variables classées selon plus d’une dimension = dimension corridors et dimension animaux
  • savoir s’il y a une association entre les dimensions
60
Q

comment trouver le nombre de degré de liberté pour
- test khi-carré ajustement
- tables de contingence

A
  • ajustement = nombre catégorie ou colonne - 1
  • table = (nb lignes-1)(nb colonnes -1)
61
Q

comment savoir si mes valeurs attendues sont correctes pour mon test de tables de contingence

A

dépend grosseur tableau
- tableau 2*2 = mes valeurs attendues doivent être chacune supérieures à 5
- tableau supérieur = 80% de mes valeurs attendues doivent être supérieures à 5 et aucune inférieur à 1

62
Q

pourquoi lors de l’interprétation du khi-carré il n’y a pas une mention de la direction

A

car le test ne le dit pas, on peut allé par nos propres observations du tableau pour la direction

63
Q

3 conditions application du test de khi-carré

A
  • indépendance des observations (ne peut pas être mutuellement exhaustif)
  • inclusion des non-occurences = on doit inclure par exemple la condition pas de motoneige
  • doit être des variables catégorielles
64
Q

qu’est-ce que Phi (cercle barré)

A

Ce test repose sur l’idée que l’on peut considérer
toutes les tables 2 x 2 possibles qu’on peut
obtenir à partir de totaux marginaux pour
effectuer un test statistique

65
Q

que permet d’avoir phi

A

savoir si significatif ou non ainsi que la taille d’effet (faible, modérée, élevée)

66
Q

quand peut-on utiliser phi

A

seulement avec des tables de 2*2 sinon il faut utiliser le V de cramer

67
Q

qu’est-ce que l’on observe comme relation entre la taille du n ainsi que la taille de l’erreur standard dans une distribution échantillonnage

A
  • plus le n augmente plus l’erreur standard sera petite
  • ainsi plus on aura confiance que n’importe quelle moyenne est en général plus proche de la vrai moyenne de la pop
  • plus notre n est grand plus notre moyenne est proche de celle de la pop
68
Q

quelles sont les deux paramètres à connaître pour faire un test z sur une seule moyenne

A
  • moyenne de la population
  • écart-type population
69
Q

pour utiliser un test t notre échantillon doit être au moins de combien

A
  • n plus grand ou égal à 25
  • n plus grand ou égal à 30
70
Q

pourquoi dans le test t il est demandé d’avoir un n plus grand ou égal à 30

A
  • dans le test du student, la distribution varie selon le nombre de degrés de liberté
  • moins on a de degrés de liberté plus notre distribution s’appliatit
  • ainsi plus on a de dl plus on approche d’une distribution normale soit avec infinie de dl
  • mais impossible avoir infinie de dl, mais avec 29 dl (n de 30 - 1) on approche assez de la distribution normale
71
Q

quand utiliser une test de t pour deux moyennes

A
  • quand j’ai deux moyennes a comparer
  • et que mes groupes sont indépendants ainsi le score de un ne dépend pas du score de l’autre
72
Q

quelle est la principale différence entre test t sur une moyenne versus deux moyennes

A
  • la manière de calculer l’erreur standard
73
Q

qu’est-ce que l’on utilise lorsque nos échantillons sont de tailles différentes pour notre test t

A
  • estimation combinée de la variance
74
Q

qu’est-ce que l’on utilise pour prendre notre décision pour un test t indépendant échantillons inégaux

A
  • d de cohen = taille de l’effet trouvé
  • petit effet = d de 0,2
  • moyen effet = d de 0,5
  • grand effet = d de 0,8
75
Q

à quoi faut-il faire attention avec l’interprétation du d de cohen

A
  • bien qu’il y ait des barèmes il faut tenir compte du contexte, car selon cohen cela peut sembler un petit effet mais en prenant le contexte un grand effet (sécurité routière)
76
Q

quelles sont les conditions d’application d’un test t sur échantillons indépendants inégaux

A
  • des données sur échelle intervalle ou rapport
  • normalité de la distribution échantillonnage soit n plus grand ou égal à 30
  • indépendance des observations
  • homogénéité des variances
77
Q

qu’est-ce que la robustesse

A
  • un test robuste est un test peu affecté par des écarts modérés à ses conditions application
  • ou un estimateur est robuste est peu affecté par des valeurs extrêmes
78
Q

quel estimateur est le plus robuste versus le moins robuste

A
  • plus = médiane, car même si j’ai des valeurs extrêmes elle ne change pas
  • moins = moyenne, car change beaucoup par les valeurs extrêmes
79
Q

pourquoi le test t est dit robuste

A

car il est peu affecté par des écarts modérés à ses conditions d’application

80
Q

quelles sont les 3 manières d’augmenter la puissance statistique

A
  • augmenter le niveau alpha mais augmente le risque d’erreur de type 1 = à éviter
  • augmenter la distance entre la distribution H1 et H0 en utilisant des de meilleurs traitements, meilleures questionnaires, etc.
  • augmenter la grandeur de n, car permet de diminuer la variance = diminuer le chevauchement entre les courbes donc meilleure puissance
81
Q

quels sont les deux moyens les plus utilisé pour augmenter la puissance statistique

A
  • éloigner la distribution H1 de celle de H0
  • augmenter taille échantillon pour diminuer variance
82
Q

quel est l’utilité de l’erreur standard dans test t pour échantillons indépendants

A
  • quantifier la variabilité de la différence entre les moyennes des échantillons
83
Q

que permet l’estimation combinée de la variance

A

calculer l’erreur standard lorsque les tailles échantillon sont différentes

84
Q

synonyme erreur-type et ce quelle représente

A
  • erreur standard = écart-type de la distribution échantillonnage
  • plus elle est petite plus ma distribution est proche de la moyenne
85
Q

que permettent de savoir les tests statistiques

A
  • estimer la probabilité d’avoir nos résultats si ho est vrai
86
Q

qu’est-ce que le test de fisher

A
  • faire toutes les tables de 2 par 2
  • déterminer proportion de ces tables qui ont des résultats aussi extrêmes ou plus que nos données
87
Q

que représente axe des x et axe des y de la distribution normale

A

x = valeurs variable
y = densité probabilité

88
Q

quel type d’erreur augmente en diminuant le seuil alpha

A
  • erreur type 2
89
Q

quel type de variables on a besoin pour les khi-carré et pourquoi

A
  • qualitative ou quantitative catégorielle car besoin de nombre entier
90
Q

3 conditions utilisations pour khi-carré

A
  • variables catégorielles
  • mention non-occurence
  • indépendance des variables (ne s’influencent pas entre elles)
91
Q

que permet de calculer le théorème central limite

A
  • permet de calculer ce dont on a besoin pour faire test hypothèse
92
Q

paramètres nécessaires pour test z versus test t

A

z = écart-type et moyenne pop
t = moyenne

93
Q

qu’est-ce qu’exprime un test t sur échantillons indépendants sur 2 moyennes

A

différence entre 2 valeurs en quantité d’erreurs standard

94
Q

qu’est-ce que nous permet de trouver le d de cohen

A
  • nombre écart-type séparant les 2 moyennes = taille ou magnitude de l’effet trouvé
95
Q

pour interpréter une test t il faut quoi

A
  • p
  • d
96
Q

qu’est-ce que test z

A

vérifier si la moyenne d’un échantillon diffère significativement de la moyenne de la pop

97
Q

qu’est-ce que test t

A

moyenne échantillon unique diffère significativement d’une valeur référence connue ou moyenne pop

98
Q

3 méthodes pour augmenter la puissance statistique ainsi que la moins et plus recommandé

A
  • augmenter seuil alpha = peu recommandé, car augmente risque erreur type 1
  • augmenter différence entre Ho et H1 = permet distancer les distribution et rejeter Ho avec plus de certitude
  • augmenter n pour diminuer erreur standard = utiliser des mesure qui porte seulement sur ce qu’on a un intérêt
99
Q

est-ce les tests paramétriques ou non paramétriques qui ont plus de souplesse et l’effet de cette souplesse

A
  • beaucoup souplesse = non paramétriques = diminue la puissance
  • préférable utilisé test paramétrique pour augmenter la puissance
100
Q

quelle est la manière la plus facile d’augmenter la puissance

A
  • augmenter la taille échantillon (n)
101
Q

3 manières pour savoir à combien augmenter la taille échantillon

A
  • estimer la taille effet attendue = fier aux autres études, estimer subjectivement, ou utilisé seuil de cohen
  • trouver delta = avec un niveau habituellement de 0.8
  • faires les calculs = d Cohen estimé / niveau delta (dans tableau pour puissance de 0,8 avec alpha 0,5) = exposant 2 = arrondit réponse à la hausse = nous donne notre taille échantillon
102
Q

pourquoi arrondit à la hausse notre taille échantillon

A

car si arrondit à la baisse cela diminue notre puissance statistique

103
Q

est-ce mieux de calculer notre taille échantillon avant ou après avoir commencer notre étude

A

avant

104
Q

quand (2) utilisé la corrélation de Pearson

A
  • quand on étudie des différences entre moyennes = différences moyennes sur niveau anxiété entre un groupe traitement et contrôle
  • des relations entre des variables continues = entre longueur bec et hauteur bec
105
Q

différence entre régression et corrélation

A
  • régression = niveau prédéterminés ou chercheur souhaite prédire la VD à l’aide de la VI
  • corrélation = VI et VD sont aléatoires ou lorsque cherche seulement à quantifier le degré de relations entre
106
Q

comment est-ce que la droite de régression en vient à être à sa position

A
  • car elle cherche à minimiser l’erreur de prédiction soit être le plus possible au milieu des données
107
Q

que représente r

A

corrélation = degré auquel les points se resserrent autour de la droit de régression

108
Q

si nous avons seulement la valeur de x et nous cherchons la valeur de y que pouvons nous utiliser avec la corrélation

A
  • la droite car elle nous donnera pour chaque valeur de x la valeur de y
109
Q

pour que la corrélation de Pearson fonctionne bien la relation entre les variables doit être comment

A

linéaire = mon nuages de points formes une ligne = absence de courbatures

110
Q

à quoi ressemble une corrélation forte

A

les points sont proches de la ligne = plus le r est grand plus la corrélation est forte

111
Q

comment savoir si ma corrélation est positivement parfait, aucune corrélation ou corrélation négative parfaite

A
  • selon la disposition de mes points par rapport à ma ligne
112
Q

qu’est-ce qu’une covariance

A
  • degré auquel deux variables varient ensemble
  • pareille pour variance mais pour 2 variables au lieu de 1
113
Q

pourquoi dans la covariance on divise par les écart-type

A
  • car la grandeur des écart-type influence la covariance
  • plus ils sont grands = covariance grande
  • plus ils sont petits = covariance petite
  • ainsi en divisant pas écart-type on tient compte de cet effet
114
Q

comment tester le niveau de signification de la corrélation de Pearson

A

avec la distribution de t de student

115
Q

pour conclure le niveau de signification de corrélation de Pearson que faut-il

A
  • p (niveau alpha)
  • r = corrélation
  • r2 = probabilité de variabilité qui est attribuable à l’une l’autre des variable
116
Q

comment interpréter r et r2

A

r = petit effet (0.1), moyen effet (0.3), grand effet (0.5)
r2 = petit (0.01), moyen (0.09), grand (0.25)
toujours interpréter avec le contexte aussi

117
Q

vrai ou faux, une corrélation implique la présence de liens de cause à effet

A

faux

118
Q

pour trouver la corrélation bisérielle de points, je peux utiliser t de student ou le d de cohen

A

oui

119
Q

pourquoi ne pas utilisé le rho de spearman comme test de niveau de signification

A
  • aucune manière accepté par tous de calculer l’erreur standard lorsque l’on a des petits échantillons
120
Q

comment utilisé le coefficient tau de Kendal

A

pour chaque ligne compter le nombre de lignes plus basses ayant un rang plus petit que celui de départ

121
Q

3 avantages d’utilisation du tau de Kendall au lieu du rho de spearman

A
  • existe une manière de calculer l’erreur standard
  • t est distribué de manière normal pour n plus grand ou égal à 10
  • approximer la distribution de “ à l’aide de la distribution normale (Z) et
    obtenir une valeur p à partir de la distribution Z, pour faire un test d’hypothèse
122
Q

dans quels cas étudie-t-on les différences entre les moyennes
- test t
- anova
- corrélation
- test z
- quand on a une VI catégorielle et une VD continue
- relations entre variables

A
  • test t
  • anova
  • test z
  • VI catégorielle et VD continue
123
Q

dans quel contexte est-ce qu’on utilise davantage une corrélation plutôt qu’une analyse de régression

A
  • lorsqu’on souhaite quantifier le degré de relation entre deux variables considérées comme aléatoires
124
Q

que représente le coefficient de corrélation de Pearson r dans le contexte d’une régression linéaire

A
  • la mesure dans laquelle les points de données se resserrent autour de la droite de régression indiquant la correspondance entre les valeurs réelles et prédites
125
Q

principale différence entre la covariance et le coefficient de corrélation

A
  • les deux indiquent le degré de variation conjointe entre deux variables
  • mais coefficient de corrélation pondère par les écarts-types de x et y
126
Q

avec quel distribution doit-on effectuer un test d’hypothèse sur la corrélation de Pearson

A
  • distribution du t de Student
127
Q

dans un test d’hypothèse avec corrélation de Pearson on trouve la valeur de _ pour ensuite calculer la valeur de _

A
  • r
  • t
128
Q

pourquoi il est important de rapporter une taille d’effet lors d’un test d’hypothèse

A
  • parce que la taille d’effet quantifie l’intensité de la relation entre les variables
129
Q

principale différence entre le coefficient de corrélation r et le coefficient de détermination r2

A
  • r indique la force et direction de la relation linéaire
  • r2 mesure la proportion de la variance dans la VD qui peut être prédite à partir de la VI
130
Q

comment calculer le niveau de signification d’une corrélation bisérielle de point

A
  • en utilisant la valeur de rpb pour calculer une valeur t puis en trouvant la valeur p correspondante dans une table de la distribution t de Student
131
Q

différence entre rpb2 et taille d’effet d de cohen

A
  • dpb2 indique la proportion de la variance dans la VD expliquée par la VI
  • d de cohen quantifie la différence entre les moyennes deux gorupes en écarts-type
132
Q

comment le tes khi-carré et coefficient phi sont-ils interconnectés

A

phi est calculé à partir de la valeur du khi-carré pour quantifier la force de l’association entre les variable

133
Q

comment le tau de kendall est différent du coefficient de corrélation de Spearman

A
  • Kendall est basé sur le principe des inversions de rangs alors que pas le cas du Rho de SPearman
134
Q

on parle de probabilité ou de fréquence dans la distribution normale et pourquoi

A
  • probabilité, car c’est continue
135
Q

que permet de faire une distribution échantillonnage

A
  • faire inférance à une pop à partir d’un échantillon
136
Q

qu’est-ce que l’on remarque avec le théorème central limite et la taille échantillon

A
  • plus nos échantillons augmentent en taille plus notre distribution sera normale et donc s’approchera de la population
137
Q

différence entre erreur standard et erreur échantillonnage

A
  • standard = à quel point ma distribution échantillonnage s’éloigne ou non de la moyenne de la pop
  • échantillonnage = notre échantillonnage a des résultats différents de nos hypothèses et dû au hasard
138
Q

qu’est-ce que la taille d’effet pour la distribution échantillonnage

A
  • à quel point H1 et H0 s’éloigne ou sont porches
  • plus la taille effet est grande plus il sera facile d’observé un effet et de prendre une décision
139
Q

le coefficient de corrélation bissérielle et similaire à quel test

A

tes-t

140
Q

le coefficient phi est équivalent à quel test

A

khi-carré de tables de contingence