stats inférentielles : principaux test Flashcards
Qu’est-ce qu’un test d’hypothèse
choisir avec un risque d’erreur entre deux hypothèse
hypothèse nulle (Ho)
hypothèse alternative ou hypothèse de recherche (h1)
nommer les 6 étapes du test d’hypothèse
- formulation des hypothèse
- choix du seuil de signification (erreur de type 1)
- puissance su test (erreur de type 2)
- calcul du test statistique
- Déterminant de la valeur critique
- Définition de la règle de décision
- Application de la règle de décision
Qu’est ce que la vérification empirique des hypothèses
vérifier, au moyen de tests statistiques, des hypothèses au sujet des relations entres variables (tests de liaison) ou de différences entre les groupes (test de comparaison)
Que postule l’hypothèse nulle
qu’il n’y a pas de relation entre les variables ou qu’il n’y a pas de différences entre les groupes
Que postule l’hypothèse de recherche
indique les résultats attendus par le chercheur
elle contredit l’hypothèse nulle
Quelle hypothèse fait l’objet du test statistique
seule l’hypothèse nulle (Ho)
À quoi mène la vérification des hypothèses
aboutit toujours à une prise de décision : rejeter ou pas Ho
qu’est-ce qu’implique rejeter Ho
accepter H1
Pourquoi l’erreur de type 1 est la plus importante
rejeter Ho quand Ho est vraie
on conclut à tort en faveur de l’hypothèse de recherche
Quel seuil est universellement admis
p<0,05 (5%)
qu’est-ce qu’implique un seuil de 5%
on accepte de faire une erreur dans 5% des cas
Que représente l’erreur de type 2
il représente la vraisemblance de ne pas obtenir une différence significative, donc un effet
Quel autre nom donne-t-on à l’erreur de type 2
manque de puissance
Quel est le complément à la probabilité d’erreur de type 2
la puissance statistique
que représente la puissance statistique d’un test
la capacité à détecter une différence significative qui existe réellement
(ce qui revient à la probabilité de rejeter correctement H0)
Quel est la norme de puissance statistique
puissance statistique de 80% (erreur de type 2 = 20%)
facteur affectant la puissance statistique
- importance de la différence
- ecart type
- taille de l’échantillon
- niveau alpha
qu’est-ce qui influent sur l’efficacité d’une étude ?
la magnitude de la différence réelle
l,écart type
la taille de l’échantillon
DÉfinir test bilatéral
on rejette Ho s’il y a une différence, qu’elle soit positive ou négative
on ne précise pas la direction de H1
qu’est-ce qu’une valeur critique
valeurs au delà desquelles on rejette Ho
Définir test unilatéral
on rejette Ho en précisant la direction anticipée de la différence
Quel est le plus puissant , test unilatéral ou bilatéral ?
unilatéral est plus puissant et favorise le rejet de Ho
plus de capacité d’anticiper un effet
Quelles sont les 2 grandes classes de tests statistiques
tests paramétriques
tests non paramétrique
Définir tests paramétrique
tests basés sur un certain nombre de postulats concernant la distribution des données
données doivent suivre une distribution normale
permettent de déceler plus facilement des différences ou des relations ; ils sont plus puissants
Définir test non paramétrique
ne sont pas basés sur des postulats concernant la distribution de données
- utilisés pour des données ne satisfaisant pas aux postulats de normalité
- utiles pour des données nominales ou ordinales
- utilisés avec des échantillons de petite taille (<20)
- sont plus robustes que les test paramétrique
V/F les test paramétriques ont souvent des test non paramétriques équivalents?
vrai
À quoi sert le test de liaison
permet de vérifier s’il y a une association entre une ou plusieurs variables
Quand est-ce que deux variables sont liées ?
quand la variation de l’une entraîne une variation de l’autre
Est-ce que la présence d’une association entre deux variables implique une relation de causalité ?
en aucun cas
À quoi sert le test du chi-carré
vérifier s’il y a un lien entre les variables catégorielles
À quoi sert le test de corrélation de Pearson
mesurer l’association entre deux variables quantitatives
vérifie s’il y a une association
quantifie la force de l’association (valeur du coefficient de corrélation)
indique la direction de l’association (signe)
À quoi correspond le coefficient de détermination
coefficient de corrélation élevé au carré
sa valeur x100 = pourcentage de variance commune entre les deux variables
Quelles sont le 3 fonctions de la régression
- vérifier l’existence d’une association dépendante (Y) et d’une variable indépendante (X)
- décrire comment Y est lié à X
- Prédire Y à parir de X
Régression linéaire simple
Y=a+bx Y= variable dépendante X=variable indépendante a=point d'intersection avec axe Y b= coefficient de régression bêta
À quoi sert le coefficient de régression bêta
donne la direction et la force de la relation entre X et Y
Dans le cas de la régression linaire, est-ce que le choix de variable sur les axes est important ?
oui contrairement au test de Pearson
Comment différencier la régression linéaire simple de la régression linéaire multiple
plusieurs variables en jeu
En régression linéaire il est important d’utiliser le plus de variable possible ?
pas trop pour rien, utiliser seulement les plus importante
plus j’utilise de prédicteur, plus je peux fournir une meilleure variance de la variable dépendante
Quel type de test de régression prédit la valeur d’une variable dépendante en se fondant sur la valeur d’une variable indépendante
régression linaire simple
Quel type de test de régression prédit la valeur d’une variable dépendante d’après les valeurs de plusieurs variables indépendantes
régression linéaire multiple
Quel type de régression linéaire à comme variable dépendante un variable nominale
régression logistique
À quoi sert le test t de student
sert à comparer les moyennes de deux populations
-moyenne d’un échantillon à une moyenne théorique
-moyennes de deux échantillons indépendants
-moyennes de deux échantillons appariées (paires t-test)
les données viennent des mêmes sujets (devis avant et après groupe unique)
Quel est le principe du test t de student
le test conssite à estimer l’écart-type de la différence entre les moyennes, à calculer la valeur t0 et à comparer cette valeur à la distribution théorique de la loi T de student
Quels sont les postulats du test t de student
- la VD doit avoir une distribution normale
- les deux groupes doivent avoir les mêmes variance : homogénéité des variance
- similaire au test z pour des effectifs >30
Quel est le principe de l’analyse de la variance : ANOVA
- comparer les différences entre 3 groupes et plus
- scinder la variation totale (SECt) en deux temps
variation entre les groupe (SCEb)
variation à l’intérieur des groupes (SCEw)
que signifie SCEt (variance totale)
l’écart de chacune des infirmations p/r à la moyenne générale
combien de facteur à ANOVA
2
à quoi ressemblera la courbe ANOVA s’il n’y a aucune interaction
parfaitement parallèle
ANCOVA : effet de covariance
effet associer à différents facteurs
on tient compte de la variance associer à une covariable