Cours 10-11-12 : Phase analytique Flashcards

1
Q

Que faut-il dans une étude dans la section méthodologie?

A
  • Puissance statistique suffisante
  • Présence d’un groupe contrôle
  • Pas de biais dans la répartition des participants dans le groupe contrôle ou ce que fait le groupe contrôle (placébo)
  • Analyse statistique robuste ou simple corrélation?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quels sont les étapes de la phase analytique?

A
  1. ANALYSE DES DONNÉES
    - Statistiques descriptives: décrire et résumé les données
    - Statistiques interférentielles: Estimer les paramètre d’une population et vérifier les hypothèses au moyen de tests statistiques appropriés
  2. PRÉSENTATION ET INTERPRÉTATION DES RÉSULTATS
    - Présentation: Figures et tableaux
    - Interprétation: Faire ressortir la signification des résultats et indiquer s’ils confirment ou non l’hypothèse
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce qu’une variable?

A

Caractéristique qui peut prendre une valeur différente selon les individus

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelles sont les deux grand types de variables?

A
  • Qualitative (catégorielle)
    Observe, pas de valeur numérique
    Mesurée d’après une échelle nominale ou ordinale
  • Quantitative (numérique)
    Mesurer, quantité
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quelles sont les deux types de variables qualitative?

A
  • Nominale
    Classes nommées pas de hiérarchie
    Binaire: 2 classes
    Ex.: Groupes ethniques
  • Ordinale
    Classes ordonnées selon une échelle de valeurs
    Ordre dans les différentes classes
    Ex.: Classement à une course de 10 km
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelles sont les deux types de variables quantitative?

A
  • Discrète
    Discontinue
    Résultat d’un dénombrement
    Ex.: Nb de personnes dans une famille, nb de grossesses (peut pas avoir un enfant et demi)
  • Continue
    Peut prendre toute valeur numérique
    Mesurée d’après une échelle d’intervalle ou de proportion
    Ex.: Tension artérielle systolique
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

À quoi servent les mesures en statistiques?

A

À décrire et à résumer les données afin de les exprimer et de les comparer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelles sont les deux types de mesures pour résumer les données?

A
  • Mesures de tendance centrale

- Mesure de dispersion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce qu’une mesure de tendance centrale?

A

Résume la position dans une distribution en fonction des valeurs possibles de la variable étudiée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est-ce qu’une mesure de dispersion?

A

Résume l’étalement de la distribution
La dispersion des valeurs autour de la valeur centrale (moyenne)

Permet d’évaluer le degré d’étalement des scores autour de la moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelle est la conséquence d’utiliser une mesure de tendance ou de dispersion?

A

Il y a toujours une perte d’information

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quelles sont les mesures de tendance centrale?

A
  • Moyenne
  • Médiane
  • Mode
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est ce qu’une moyenne (µ ou x avec une barre au-dessus)?

A
  • Mesure la plus couramment utilisée
  • Influencée par la valeur de toutes les observations et est donc très sensible à la présence des données extrêmes
  • Peut devenir non représentative de l’échantillon si la distribution est fortement asymétrique
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce que la médiane (Md)?

A
  • Valeur qui occupe la place du milieu
    Ex.: 1, 2, TROIS, 4, 5
  • Environ 50% des observations se retrouvent de chaque côté
  • Déterminée par le nombre d’observations et non pas la valeur de celle-ci
  • Rôle purement descriptif
  • Pour données sur échelle ORDINALE
  • Décrit la valeur moyenne d’une distribution asymétrique
  • Indice de tendance centrale basé sur la fréquence d’observations
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est ce que le mode (Mo)?

A
  • Valeur la plus fréquente d’une série d’observations (pic de la distribution)
  • Mesure peu utilisée
  • Purement descriptif, pour définir l’allure de la distribution (unimodale ou bimodale)
  • Pour données sur échelle NOMINALE
  • Pas influencer par les valeurs extrêmes
  • Ne permet pas d’opérations mathématiques
  • Décrit des variables catégorielles
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est-ce qui se passe dans le cas d’une distribution parfaitement symétrique?

A

La moyenne, la médiane et le mode sont égaux

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qu’est-ce qu’une mesure décrivant la distribution d’une population?

A

Le coefficient de d’asymétrie (skewness) (CD)

Souvent valeurs de -1.0 à 1.0
La valeur indique le degré de dissymétrie et le signe la direction

Si la distribution est symétrique -> CD = 0

Courbe normale (symétrique):
Mode=médiane=moyenne

Asymétrie positive (tire vers la droite):
Mode, Médiane, moyenne

Asymétrie négative (tire vers la gauche):
Moyenne, Médiane, Mode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Quelles sont les mesures de dispersion?

A
  • Étendue (E)
  • Variance (s 2)
  • Écart-type (s)
  • Coefficient de variation (CV)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Qu’est-ce que l’étendue?

A

Différence entre la valeur (V) la plus grande et la valeur la plus petite d’une série d’observations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Qu’est-ce que la variance?

A
  • Mesure de l’étendue des scores basée sur la déviation de chacun de ceux-ci par rapport à la moyenne
  • Séries d’écart, et on fait la moyenne de ces écarts là
  • Représente la valeur globale de dispersion des scores par rapport à la moyenne
  • Plus la variance est grande Plus la distribution sera étendue (plus il y aura de dispersion dans nos scores)
  • Très difficile à concrétiser/comprendre en regardant sa valeur
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Qu’est-ce que l’écart type?

A
  • On peut l’interpréter comme une mesure linéaire de la variabilité au sein d’une distribution
  • S’exprime dans les même unités que la moyenne
  • Dans le cas d’une distribution normale, l’écart-type devient une mesure de dispersion très importante en raison de la relation existant entre celui-ci et la moyenne
  • Dispersion des valeurs d’une distribution qui tient compte de l’écart de chaque valeur par rapport à la moyenne du groupe
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Qu’est-ce que l’écart-type de la moyenne (erreur type)?

A
  • L’erreur type, aussi appelée l’écart-type de la moyenne, donne une idée de la précision avec laquelle la moyenne de l’échantillon est représentative de la moyenne de la population
  • L’erreur type de la moyenne est toujours plus petite que l’écart-type
  • Plus on a un échantillon qui est représentatif de la moyenne de la population, plus erreur type de la moyenne va être petite
  • C’est mieux de rapporter l’écart-type que l’erreur type de la moyenne dans une étude
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Qu’est-ce que le coefficient de variation?

A
  • C’est le rapport de l’écart-type sur la moyenne
  • Écart-type exprimé en % de la moyenne, donc indépendant des unités de mesure
  • Exprime le degré de dispersion d’une distribution autour de la moyenne
  • Utile pour comparer la dispersion de deux variables de nature différente (unités différentes)

Exemple:
Laquelle des variables présente la plus grande dispersion?
BMI: 27.9 +- 7.7kg/m2
CT: 89.5 +- 18.1 cm

  1. 7 / 27.9 x 100 = 26.9%
  2. 1 / 89.5 x 100 = 20.2%

Donc, c’est le BMI

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Qu’est-ce que les mesures de position?

A

Permettent de situer une donnée par rapport aux autres dans une distribution

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Quels sont les deux types de mesure de position?
- Score percentile | - Score standardisé
26
Qu'est-ce que le score percentile?
Indique le rang d'un score en donnant le pourcentage d'observations se situant en dessous de ce score. Ex.: P90 -> 90% du monde on un score inférieur à vous
27
Qu'est-ce que le score standardisé (score z)?
Exprime un score en fonction de son écart-type par rapport à la moyenne. Score dont l'écart par rapport à la moyenne s'exprime en unités d'écart-type: -3.0 à 3.0. Permet de comparer des scores qui n'ont pas le même point de référence.
28
Qu'est-ce que donne le tableau des aires sous la courbe normale?
Donne le % de scores entre la moyenne et le score z.
29
Qu'est-ce que l'inférence statistique?
L'inférence statistique utilise les données de l'échantillon pour estimer les paramètres de la population et vérifier les hypothèses de recherche. Inférer à partir d'un échantillon, les paramètres de la population qui est inconnue. Suppose une prise de décision de la part du chercheur. Cette prise de décision comporte un risque ou une probabilité d'erreur
30
(Inférence statistique) | Quand on fait une estimation, on suppose...
- Que la valeur observée a peu de chance d'être exactement celle de la population - Que cette valeur est néanmoins assez proche si l'échantillon est représentatif - Qu'en répétant l'échantillonnage on trouverait d'autres valeurs relativement proches de la vrai valeur inconnue
31
Pourquoi la relation entre l'écart-type et le score z est utile?
Car ça nous permet de calculer les scores percentiles correspondant à des scores z déterminés.
32
Les statistique inférencielles reposent sur le théorème de la limite centrale. C'est quoi?
Théorème de la limite centrale: - La moyenne d'une variable calculée sur un échantillon est elle même une variable aléatoire. Elle varie selon l'échantillon. - Cette variable aléatoire suit une loi normale. - Cette loi normale est centrée sur la moyenne de la population.
33
Qu'est-ce que l'estimation ponctuelle?
Estimation de la valeur d'un paramètre d'une population faite à partir de la statistique mesurée auprès de l'échantillon.
34
Qu'est-ce que l'estimation par intervalle de confiance (IC)?
Estimer un intervalle dans lequel la moyenne inconnue µ a la plus grande probabilité de se retrouver. - Se fait à partir de la distribution théorique de la courbe normale et du théorème de la limite centrale - L'intervalle de confiance est donc une gamme de valeurs dans laquelle devrait se trouver le paramètre de la population
35
Quelles sont les types d'estimation des paramètres?
- Estimation ponctuelle | - Estimation par intervalle de confiance
36
Qu'est-ce que l'intervalle de confiance à 95%?
Il y a 95% de chances que µ se situe entre deux valeurs déterminer. Établie à partir de la moyenne d'échantillonnage et son écart-type
37
Quels sont les concepts de l'inférence statistique?
- Concept des distributions d'échantillonnage: Fluctuations d'échantillonnage - Concept de probabilité: Probabilité que les valeurs de l'échantillon constituent de réelles estimations des paramètres de la population (intervalle de confiance à 95%); Probabilité que les relations observées entre des variables (tests de liaison) ou les différences entre des groupes (tests de comparaison) ne soient pas le résultat du hasard; La probabilité sert de guide à la prise de décision en recherche
38
Qu'est-ce que la vérification empirique des hypothèses?
Vérifier, au moyen de tests statistiques, des hypothèses au sujet des relation entre variables (tests de liaison) ou des différences entre les groupes (tests de comparaison)
39
Qu'est-ce qu'un test d'hypothèse?
Choisir (avec risque d'erreur) entre deux hypothèses: - Hypothèse nulle (H0) - Hypothèse alternative ou de recherche (H1)
40
Quelle est la démarche des tests d'hypothèses?
1. Formulation des hypothèses 2. Choix du seuil de signification: erreur de type I 3. Puissance du test: l'erreur de type II 4. Calcul du test statistique 5. Détermination de la valeur critique 6. Définition de la règle de décision 7. Application de la règle de décision
41
Qu'est-ce que H0?
Hypothèse nulle Pas d'association entre les variable ou pas de différence entre les groupes On veut la rejeter pour favoriser H1
42
Qu'est-ce que H1?
Hypothèse de recherche Hypothèse alternative Notre hypothèse de recherche Hypothèse que le chercheur désire prouver en rejettant H0
43
Quelle hypothèse fait l'objet du test statistique?
Repose toujours sur H0
44
Est-ce que les statistiques descriptive permettent de tester les hypothèses de recherche au moyen de tests statistiques?
Non
45
Le coefficient d'asymétrie (Skewness) d'une distribution parfaitement symétrique est égale à quoi?
0
46
Plus le nombres d'observations (n) augmente,...
plus la variance diminue
47
Identifiez l'intrus: - Moyenne - Écart-type - Médianne - Mode
Écart-type, car c'est une mesure de dispersion. Les autres sont des mesures de tendance centrale.
48
Qu'est-ce qu'une variable binaire?
Variable mesurée selon une échelle nominale ne comportant que deux catégories.
49
Quelle est le type de variable: 1. Nombre de frères et soeurs 2. Statut matrimonial 3. Échelle de perception de l'effort 4. Temps pour compléter un quiz 5. Date de naissance
1. Quantitative discrète 2. Qualitative nominale 3. Qualitative ordinale 4. Quantitative continue 5. Quantitative continue
50
Quel est des objectifs de l'inférence statistique?
Tester les hypothèses de recherche Estimer les paramètres de la population
51
Qu'est-ce que l'erreur de type I?
Rejetter H0 alors qu'elle est vrai. | C'est l'erreur la plus grave parce que l'on favorise H1 alors qu'elle est fausse
52
Qu'est-ce que le niveau (ou seuil) de signification?
Le niveau de signification à 5% d'un test statistique signifie que le chercheur à 5 chances sur 100 de se tromper en remettant l'hypothèse nulle à la faveur de l'hypothèse alternative
53
Qu'est-ce que l'erreur de type II?
Conclure à tort que H0 est vrai, alors qu'elle est fausse. Représente la probabilité de ne pas obtenir une différence significative, donc un effet, alors qu'en réalité il y en a une Manque de puissance
54
Qu'est-ce que la puissance statistique?
Correspond à notre capacité de détecter s'il y a une différence
55
Quels sont les facteurs qui affecte la puissance statistique?
- Importance de la différence (Taille de l'effet) - Écart-type - Taille de l'échantillon - Le niveau de signification
56
L'ampleur de l'effet (ou taille de l'effet) est un facteur à considérer le calcul de la puissance statistique. Plus l'ampleur de l'effet est grand ...
...plus la taille de l'échantillon requis pour le détecter sera petit. En considérant tous les autres paramètres affectant la puissance statistique égaux, il sera plus facile de détecter une différence entre deux groupes si l'ampleur de l'effet est grand, donc avec une taille d'échantillon plus petite
57
Qu'est-ce que la détermination de la valeur critique?
Valeur issue d'une table statistique (propre à chaque test) qui détermine les zones de rejet et de non rejet de H0. Cette valeur dépend du seuil de signification et du nombre de degrés de liberté
58
Qu'est-ce que le degrés de liberté?
Nombre de valeurs dans une distribution susceptible de varier de façon aléatoire
59
Qu'est-ce qu'une valeur critique?
Valeurs au delà desquelles on rejette H0
60
Qu'est-ce le test bilatéral?
On rejette H0 s'il y a une différence, qu'elle soit positive ou négative On ne précise pas la direction de H1 Test généralement utilisé
61
Qu'est-ce que le test unilatéral?
On rejette H0 en précisant la direction anticipée de la différence On tiens compte de la direction
62
Quel test est le plus puissant pour rejeter H0?
Test unilatéral | Car la valeur du seuil de rejet est plus petit
63
Quelles sont les deux grandes classes de tests statistiques?
Tests paramétrique | Tests non paramétrique
64
Qu'est-ce qu'un test paramétrique?
Compare des paramètres en tenant compte de postulats sur la direction des données Les données doivent suivre une distribution normale Pour des variables continues Permet de déceler plus facilement des différences ou des relations Test plus puissant
65
Qu'est-ce qu'un test non paramétrique?
Comparer les distributions plutôt que les paramètres (basés sur les rangs plutôt que les valeurs des variables étudiées) Pour des données ne satisfaisant pas aux postulats de normalité Pour des variables nominales ou ordinales Utilisés avec des échantillons de petite taille (moins que 20) Sont plus robustes que les tests paramétriques
66
Les tests paramétriques ont-ils souvent des tests non paramétriques équivalent?
Oui
67
Qu'est-ce que des mesures d'association?
Test de liaison Permettent de vérifier s'il y a une association entre une ou plusieurs variables
68
Deux variables sont liées quand?
Lorsque la variation de l'une entraine la variation de l'autre (Covariation entre 2 variables)
69
Est-ce que la présence d'association entre deux variable implique une relation de causalité?
Non
70
Qu-est-ce que le test du chi-carré (x2)?
Servent à comparer des fréquences observées avec des fréquences théoriques. Adapté pour des variables qualitatives
71
Quels sont les différents test de chi-carré?
- De conformité - D'homogénéité - D'indépendance
72
Qu'est-ce que le test de chi-carré de conformité?
Comparer une distribution observée à une distribution théorique Ex.: Plus ont fait des lancés de dés, plus la proportion de chaque chiffre est égale
73
Qu'est-ce que le test de chi-carré d'homogénéité?
Comparer deux ou plusieurs distributions observés sur plusieurs échantillons Est-ce que deux population ont une distribution identique? Utiliser ce test si ont veux savoir la proportion de statut sociaux économique est similaire entre les hommes et les femmes.
74
Qu'est-ce que le test de chi-carré d'indépendance?
Étudier sur un même échantillon la liaison entre les distributions de deux variables nominales
75
Qu'est-ce que le r de Pearson?
Permet de mesurer l'association entre deux variables quantitatives Vérifie s'il existe une association Quantifie la force de l'association Indique la direction de l'association Valeurs de r: -1.0 à 1.0 r = 1.0 -> Covariation parfaite entre les deux variables. Indique la force de l'association Le signe + ou - indique la direction de l'association
76
Qu'est-ce que le coefficient de détermination (r2)?
La valeur de r x 100 Pourcentage de variance commune entre les deux variables r2 ajusté: - Dépend du nombre de VI qu'on met dans le modèle - Plus il y a des variables utile dans la prédiction de notre VI, plus r2 va augmenter - Variables pas utile, r2 va diminuer
77
Qu'est-ce qu'un test de régression?
Prédire une variable dépendante à partir d'une variable indépendante 3 fonctions: - Vérifier l'existence d'une association entre une variable dépendante (Y) et une variable indépendante (X) - Décrire comment Y est lié à X - Prédire Y à partir de X Plus le coefficient de régression bêta est grand, plus la relation entre les deux variables est importante
78
Qu'est-ce que la régression logistique?
Forme de régression servant à prédire une variable nominale : Présence ou absence d'une condition ou d'une maladie VD est binaire VI peut être nominale ou continu
79
Qu'est-ce que le test t de student?
Sert à comparer les moyennes de 2 populations Le test consiste à estimer l'écart-type de la différence entre les moyennes, à calculer la valeur t et à comparer cette valeur à la distribution théorique de la loi T de student VD doit avoir une distribution normale Les deux groupes doivent avoir les mêmes variances: homogénéité des variances
80
Qu'est-ce que le test t de student indépendant?
Mesurer les différences entre les moyennes de deux groupes indépendants
81
Qu'est-ce que l'analyse ANOVA?
Comparer les différences entre trois groupes ou plus Scinder la variation totale (SCEt) en deux composantes: - Variation entre les groupes (SCEb) - Variation à l'intérieur des groupes (SCEw); aussi appelée variance résiduelle
82
Est-ce que le test de corrélation de Pearson est utilisé pour évaluer l'association entre deux variables catégorielles?
Non
83
La régression logistique est une technique de régression permettant de prédire quoi?
L'impact d'une de plusieurs variables indépendante sur la survenue d'une condition ou d'une maladie. Elle se caractérise par le fait que la variable dépendante à prédire est dichotomique (survenue ou non de la condition ou la maladie)
84
Identifiez l'intrus: - Test de t de student - Test de t de student pour données paires - Test de corrélation de Pearson - Test d'ANOVA à mesures répétées - Test d'ANOVA
Test de corrélation de Pearson, c'est un test de liaison, tandis que les autres sont des tests de comparaisons
85
Est-ce que l'ANOVA classique peut être utilisé pour comparer les moyennes entre les conditions si une variable est mesurée plusieurs fois? Ex.: À des moments différents ou dans diverses conditions expérimentale, sur les mêmes sujets
Non, il faut utilisé l'ANOVA à mesures répétées - La condition d'indépendance entre les groupes ne s'applique plus; on a un seul groupe de sujets - Les mêmes sujets sont mesurés sous chacun des niveaux de traitement ou à différents moments - Il faut donc séparer la variance liée au traitement (entre les conditions) de la variance liée aux sujets Avantage: Permet de tenir compte des différences interindividuelles Les réponses d'individus différents aux mêmes traitements varient en fonction de leurs caractéristiques personnelles, de leurs expériences et de leurs réactivités individuelles
86
Quels sont les moyens d'exposer les résultats de recherche?
- Tableaux | - Figures
87
Comment utiliser un tableau quand on veut présenter des résultats?
- Utiliser quand il s'agit de présenter les valeurs exactes des résultats - Décrire les participants selon les groupes - Composantes: titre, rangées, colonnes, entête, note explicative sous le tableau
88
Comment utiliser une figure pour présenter des résultats?
- Présentation visuelle de certains résultats, souvent les résultats les plus importants - Ne devraient pas répéter les résultats déjà présentés sous forme de tableaux