Cours 10 : Phase analytique II Flashcards
Sur quels deux concepts importants repose l’inférence statistique?
Distribution d’échantillonnage
Probabilité
relation observées entre des variables
Permettent de vérifier s’il y a une association entre une ou plusieurs variables (Catégorielle)
tests de liaison
différence entre des groupes
test de comparaison
Vrai ou faux?
Si l’échantillon est représentatif de la population la moyenne m1 observée est près de la moyenne
u inconnue.
vrai
La moyenne de l’échantillon sélectionné aléatoirement constitue une approximation de la valeur réelle moyenne de la population (u).
Quelle est la condition d’application du théorème de la limite centrale?
n > ou = 30 (taille de l’échantillon)
choisir (avec un risque d’erreur) entre deux hypothèses
Test d’hypothèse
Quel est l’objectif avec le test d’hypothèse?
rejeter H0 (hypothèse nulle) et accepter H1 (hypothèse alternative/de recherche)
Quelles sont les 7 étapes du test d’hypothèse?
- Formulation des hypothèses
- Choix du seuil de signification: erreur de type I
- Puissance du test: l’erreur de type II.
- Calcul du test statistique.
- Détermination de la valeur critique
- Définition de la règle de décision
- Application de la règle de décision et conlusion
Retenue lorsque H0 est rejetée .
Les différences observées sont significatives.
hypothèse alternative/de recherche
Les paramètres ou les distributions sont identiques.
Les différences observées sont dues au hasard
Hypothèse nulle
Quelle hypothèse fait l’objet du test statistique?
H0 (hypothèse nulle)
poids des nouveaux-nés de mères
fumeuses (mf) et non fumeuses (mnf).
Sachant que le poids moyen des nouveaux-nés est de 3.2 kg, vous vous demandez si le poids des nouveaux-nés de mères fumeuses est identique.
H0 : umf = umnf = 3,2 kg
H1 : umf n’égale pas umnf
À quel décision aboutit toujours la vérification des hypothèses?
rejet ou non de H0
Pourquoi l’erreur de type 1 est la plus importante?
On conclut à tort en faveur de l’hypothèse de recherche (rejeter H0, alors qu’elle est vraie)
p.421 à 428
compare des paramètres en tenant compte de postulats sur la distribution des données
n > 20
variables continues
plus puissants
tests paramétriques
comparer les distributions plutôt que les paramètres (basés sur les rangs plutôt que les valeurs des variables étudiées)
n < 20
nominales ou ordinales
plus robustes
tests non paramétriques
La présence d’une association entre deux variables implique-t-elle une relation de causalité?
Non
Deux variables sont liées lorsque…
la variation de l’une entraîne une variation de l’autre
Tests non paramétriques pour les variables catégorielles
chi-carré (x2)
coefficient de contingence
Dans l’association entre le sexe et l’intensité de l’AP, dans quel cas on aurait une H0?
Mêmes valeurs pour les hommes et les femmes
Comment savoir si l’on rejette H0?
comparer la valeur du test avec la valeur critique
(valeur du test < valeur critique = on garde, sinon on rejete)
Permet de mesurer l’association entre deux variables quantitatives
- Quantifie la force
- Indique la direction
test de corrélation de Pearson (r)
Sa valeur x 100 = pourcentage de
variance commune entre les deux
variables.
coeffecient de détermination (r2)
Vrai ou faux?
Une corrélation proche de zéro implique l’absence de relation entre les deux variables
Pas nécessairement, car la corrélation mesure la relation LINÉAIRE entre deux variables
Tests non paramétriques pour les variables quantitatives
corrélation de Spearman (r) ou test ta de Kendall (t)
Test paramétrique pour variables quantitative
corrélation de Pearson (r)
Quand est-ce que r est significatif?
Plus 𝑟 s’éloigne de 0, plus il est probable que la corrélation soit significative. (À VÉRIFIER)
Prédire la valeur d’une variable dépendante (continue) en se fondant sur la valeur d’une seule variable indépendante (continu ou autres)
régression linéaire simple
Prédire la valeur d’une variable dépendante (continue) en se fondant sur la valeur de plusieurs variables indépendantes (nominales ou continues)
regression multiple
Déterminer quelles sont les variables (nominales ou continues) qui ont un effet significatif sur la variable dépendante dichotomique (nominale)
regression logistique
Quelles sont les 3 fonctions de la régression?
vérifier l’association
décrire la liaison
prédire y avec x
Y = a + bX
Que donne b (coefficient de régression bêta)?
la direction (signe) et la force (valeur)
Forme de régression servant à prédire une variable nominale/catégorielle
Exemple : présence ou absence d’une condition ou d’une maladie.
regression logistique
Dans une régression logistique, la variable dépendante est-elle continue ou binaire (oui/non)?
binaire (dichotomique)
Quelle est l’H0 de la CT entre les hommes et les femmes?
que les valeurs soient égales
Test t pour échantillons indépendants
mesurer les différences entre les moyennes de deux groupes indépendants
Test t pour échantillons appariés
comparer les moyennes ou les médianes entre deux groupes appariés
analyse de la variance (ANOVA)
statistique F
comparer les moyennes entre 3 groupes indépendants ou plus
analyse de la variance par mesures répétées (F)
comparer les moyennes entre 3 groupes appariés ou plus
Postulats du test t indépendants
- Deux échantillons indépendants
- Variables continues
- Distribution normale des variables
- Égalité des variances entre les groupes
Postulats du test t appariés
- Deux échantillons appariés (même sujets dans les deux groupes)
- Variables continues
- La différence des valeurs pairées suit une distribution normale
Avantage: les différences entre les participants sont éliminées
is there a difference between two groups (quel test?)
test t indépendant
is there a difference in a group between two points in time (quel test?)
test t appariés
Le principe d’ANOVA est de scinder la variation totale (SCET) en deux composantes:
- variation entre les groupes (SCEB)
- variation à l’intérieur des groupes (SCEW); aussi appelée variance résiduelle
Explique la statistique F
rapport de la variance between et within
F =between/within
La somme des écarts pr à la moyenne
variance totale
Explique between
variance intergroupe : on compare la moyenne de chaque groupe à la moyenne générale
explique within
variance intragroupe : on compare chaque sujet à la moyenne de son groupe
valeur test = 11,89
valeur critique = 2.84
Est-ce qu’on rejète H0?
Oui, car il y a des différences significatives entre les groupes
(vt > vc)
Si les sujets ne sont pas indépendants (mêmes sujets pour plusieurs conditions expérimentales), quel modèle d’ANOVA utilise-t-on?
ANOVA à mesures répétées
Comment se nomme la variance qui ne représente pas le facteur A, le facteur B ni l’interaction A/B?
variance résiduelle (SCEw)
Lorsque les pentes sont différentes, y a-t-il une interaction?
oui