statistique inférentielles Flashcards

1
Q

Qu’est-ce qu’une vérification empirique des hypothèses?

A

Vérifier, au moyen de tests statistiques, des hypothèses au sujet des relations entre variables (tests de liaison) ou de différences entre les groupes (tests de comparaison).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quels sont les 2 types d’hypothèse que nous formulons au départ?

A

 Hypothèses nulle (H0)

 Hypothèse alternative ou hypothèse de recherche (H1)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quel est la différence entre l’hypothèse nulle et l’hypothèse de recherche?

A

L’hypothèse nulle (H0) : postule qu’il n’y a pas de relation (liaison) entre les variables ou qu’il n’y a pas de différences entre les groupes. (Comparaison)
L’hypothèse de recherche (H1) : indique les résultats attendus par le chercheur; elle contredit l’hypothèse nulle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelle hypothèse fait l’objet du test statistique?

A

toujours l’hypothèse nulle, car on veut la rejeter

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Donner un exemple pour les 2 hypothèses dans cette situation? “poids des nouveaux-nés est de 3.2 kg, vous vous demandez si le poids des nouveaux-nés de mères fumeuses est identique.”

A
  • H0 : La moyenne des nouveaux-nés mf et des mnf ont le même poids soit = 3.2
  • H1 : La moyenne des nouveaux-nés mf est différent des mnf, donc n’égal pas 3.2, (hypothèse non directionnelle ; tests bilatéral, car on n’estime pas la direction de la différence)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Que peut-on affirmer quand on rejette l’hypothèse nulle et que celle-ci est fausse?

A

Cela veut dire l’acceptation de l’hypothèse de recherche

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quel est l’erreur de type 1 qui est la plus populaire, la plus importante?

A

on rejette l’hypothèse nulle, mais elle est vraie, donc il n’y a pas de différence et on va conclure à tors notre hypothèse de recherche.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quand on dit que l’alpha est égale à 5%, qu’est-ce que ça veut dire?

A
  • Le niveau α correspond au niveau de signification.
  • Choix du seuil: le seuil universellement admis pour α est de 5%
  • Pour un niveau égal à 5%, on accepte de faire une erreur dans 5% des cas.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quel est l’erreur de type II?

A

la vraisemblance de ne pas obtenir une différence significative, donc un effet. On l’appelle aussi le manque de puissance, car on conclut à tort qu’il n’y a pas d’effet (peut ne pas l’avoir remarqué)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Le complément à la probabilité d’erreur de type II est _______.

A

la puissance statistique (1-β)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quel est la définition de la puissance statistique d’un test?

A

sa capacité à détecter une différence significative qui existe réellement, ce qui revient à la probabilité de rejeter directement hypothèse nulle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quel est la norme d’une bonne puissance statistique?

A

Une puissance statistique (capacité à détecter un effet quand il y en a un) de 80% (erreur type II = 20%) est la norme
Le nombre de sujet est important pour avoir une puissance de 80% (à voir quand on fait une recherche)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quels sont les 4 paramètres que nous devons regarder pour le calcul du test statistique?

A
  1. Importance de la différence
  2. Écart-type (variance des distributions)
  3. taille de l’échantillon (ex : un intervalle de confiance à 95% dépends de la taille de l’échantillon)
  4. Niveau alpha
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Définit ce qu’est une valeur critique?

A

valeurs au-delà desquelles on rejette H0 (on va conclure qu’il y a un effet)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce qu’un test bilatéral?

A

on rejette H0 s’il y a une différence, qu’elle soit positive ou négative.
zone de rejet est 2,5% de côté positif et négatif

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est-ce qu’un test unilatéral?

A

on rejette H0 en précisant la direction anticipée de la différence. (la zone de rejet est déterminer positivement ou négativement)

17
Q

Entre les test unilatéral et bilatéral, lequel est le plus puissant?

A

Le test unilatéral est plus puissant que le test bilatéral et favorise le rejet de H0 (plus grand capacité à voir un effet)

18
Q

Quel est la différence entre un test paramétrique et un test non paramétrique.

A

Tests paramétriques : tests basés sur un certain nombre de postulats concernant la distribution des données
Test non paramétriques : ne sont pas basés sur un certain nombre de postulats concernant la distribution des données

19
Q

Quels sont les particularité d’un test paramétrique?

A
  • Les données doivent suivre une distribution normale

- Tests paramétriques permettent de déceler plus facilement des différences ou des relations, ils sont plus puissants.

20
Q

Quels sont les particularités d’un test non paramétrique?

A
  • Utilisés pour des données ne satisfaisant pas aux postulats de normalité.
  • Utiles pour des données nominales ou ordinales
  • Utilisés avec des échantillons de petite taille (˂ 20)
  • Sont plus robustes que les tests paramétriques
21
Q

Vrai ou faux : Les tests paramétriques ont souvent des tests non-paramétriques équivalents. (peut en faire même si la distribution n’est pas normale)

A

vrai

22
Q

Que permet un test de liaison?

A

Permettent de vérifier s’il y a une association entre une ou plusieurs variables.

23
Q

Comment pouvons-nous dire que deux variables sont liés?

A

Deux variables sont liées lorsque la variation de l’une entraîne une variation de l’autre (si X bouge, Y va varier)

24
Q

Est-ce que lorsque 2 variables sont liés, il y une relation de causalité?

A

La présence d’une association entre deux variables n’implique en aucun cas une relation de causalité (ça demande une étude expérimentale pour avoir une relation de cause à effet)

25
Q

Quel est le test paramétrique associé aux variables catégorielles?

A

Test du chi-carrée (x2)

voir exemple : est-ce qu’il y a une association entre le tabagisme et le sexe?

26
Q

Quel est le test paramétrique associé aux variables quantitatives?

A

corrélation de Pearson

27
Q

Que permet de mesurer un tests de corrélation (r de Pearson)?

A

Permet de mesurer l’association entre deux variables quantitatives

  • Vérifie s’il existe une association
  • Quantifie la force de l’association
  • Indique la direction de l’association.
28
Q

Que permet de savoir la valeur du r?

A

la valeur du coefficient de corrélation (le signe désigne la direction) : -1.0 ˂ r ˂ 1.0

29
Q

Quel est la différence entre une fiable corrélation et une forte corrélation?

A

faible corrélation : Un r=0.08 (peut élever, car près de zéro)
Un r2=0.0064 (0,64%) ce n’est pas beaucoup
Grande dispersion entre les points
Forte corrélation : Une corrélation significative positive, car presqu’une pente droite (près du 1)
Peut être positive ou négative

30
Q

Qu’est-ce qu’un test de régression : prédiction?

A

On veut prédire la variable dépendante à partir d’une variable indépendante.
La régression à 3 fonctions :
- Vérifier l’existence d’une association entre une variable dépendante (Y) et une variable indépendante (X)
- Décrire comment Y est lié à X
- Prédire Y à partir de X

31
Q

Quel est la différence entre une régression linéaire simple / régression multiple / régression logistique?

A

régression linéaire simple : Prédit la valeur d’une variable dépendante en se fondant sur la valeur d’une variable indépendante
Régression multiple : Prédit la valeur d’une variable dépendante d’après les valeurs de plusieurs variables indépendantes. (une extension de l’analyse de la régression linéaire). “variable dépendante : quels sont les variables qui ont un impact sur la probabilité d’un événement continue”
Régression logistique : variable nominale

32
Q

Que permet de comparer un Test t de student?

A

Sert à comparer les moyennes de deux populations

  • Moyenne d’un échantillon à une moyenne théorique
  • Les moyennes de 2 échantillons indépendants (sont-ils différents?)
  • Les moyennes de 2 échantillons appariées : les données viennent des mêmes sujets (devis avant-après groupe unique.
33
Q

Quel est le principe du test t de student?

A

le test consiste à estimer l’écart-type de la différence entre les moyennes (Δ=différence entre les moyennes et ont divisé par l’écart-type), à calculer la valeur : et à comparer cette valeur à la distribution théorique de la loi T de student.

34
Q

Quel postulat pouvons-nous faire avec le test t student?

A
  • La VD doit avoir une distribution normale (pas besoin qu’elle soit tout à fait normal quand on a beaucoup de monde)
  • Les 2 groupes doivent avoir les même variances : homogénéité des variances (variances entre les 2 groupes doivent être comparable)
  • Similaire au test z pour des effectifs ≥ 30
35
Q

Quel est le but du test t student?

A

Le but est de rejeter l’hypothèse nulle, donc de dépasser le seuil critique pour dire qu’il y a une différence.

36
Q

Pouvez-vous nommer un autre test de comparaison autre qu’un test t de student?

A

test de t indépendant

37
Q

Quel sont les 3 termes (variations) utiliser pour l’analyse de variance ANOVA?

A

1- variance entre les groupes (moyenne des 3 groupes par rapport à la moyenne générale)
2- variation à l’intérieur des groupes (variance résiduelle soit chaque individu par rapport à la moyenne de son groupe)
3- moyenne générale soit indépendamment du groupe, l’écart de chaque point par rapport à la moyenne.

38
Q

l’analyse de variance ANOVA permet de comparer les différences entre les 3 groupes ou plus avec quel principe?

A

Principe : scinder la variation totale (SCET) en deux termes :

  • Variation entre les groupes (SCEB)
  • Variation à l’intérieur des groupes (SCEW)
39
Q

Qu’est-ce qu’un effet de co-variables?

A

Co-variable est susceptible d’influencer mes résultats. Ex : dans l’expérience précédant, je pense que l’âge pourrait avoir un impact et je pourrais retirer son impact pour être indépendant de ma co-variable.