Cours 10-11-12 : Phase analytique Flashcards

1
Q

Que faut-il dans une étude dans la section méthodologie?

A
  • Puissance statistique suffisante
  • Présence d’un groupe contrôle
  • Pas de biais dans la répartition des participants dans le groupe contrôle ou ce que fait le groupe contrôle (placébo)
  • Analyse statistique robuste ou simple corrélation?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quels sont les étapes de la phase analytique?

A
  1. ANALYSE DES DONNÉES
    - Statistiques descriptives: décrire et résumé les données
    - Statistiques interférentielles: Estimer les paramètre d’une population et vérifier les hypothèses au moyen de tests statistiques appropriés
  2. PRÉSENTATION ET INTERPRÉTATION DES RÉSULTATS
    - Présentation: Figures et tableaux
    - Interprétation: Faire ressortir la signification des résultats et indiquer s’ils confirment ou non l’hypothèse
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce qu’une variable?

A

Caractéristique qui peut prendre une valeur différente selon les individus

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelles sont les deux grand types de variables?

A
  • Qualitative (catégorielle)
    Observe, pas de valeur numérique
    Mesurée d’après une échelle nominale ou ordinale
  • Quantitative (numérique)
    Mesurer, quantité
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quelles sont les deux types de variables qualitative?

A
  • Nominale
    Classes nommées pas de hiérarchie
    Binaire: 2 classes
    Ex.: Groupes ethniques
  • Ordinale
    Classes ordonnées selon une échelle de valeurs
    Ordre dans les différentes classes
    Ex.: Classement à une course de 10 km
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelles sont les deux types de variables quantitative?

A
  • Discrète
    Discontinue
    Résultat d’un dénombrement
    Ex.: Nb de personnes dans une famille, nb de grossesses (peut pas avoir un enfant et demi)
  • Continue
    Peut prendre toute valeur numérique
    Mesurée d’après une échelle d’intervalle ou de proportion
    Ex.: Tension artérielle systolique
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

À quoi servent les mesures en statistiques?

A

À décrire et à résumer les données afin de les exprimer et de les comparer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelles sont les deux types de mesures pour résumer les données?

A
  • Mesures de tendance centrale

- Mesure de dispersion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce qu’une mesure de tendance centrale?

A

Résume la position dans une distribution en fonction des valeurs possibles de la variable étudiée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est-ce qu’une mesure de dispersion?

A

Résume l’étalement de la distribution
La dispersion des valeurs autour de la valeur centrale (moyenne)

Permet d’évaluer le degré d’étalement des scores autour de la moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelle est la conséquence d’utiliser une mesure de tendance ou de dispersion?

A

Il y a toujours une perte d’information

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quelles sont les mesures de tendance centrale?

A
  • Moyenne
  • Médiane
  • Mode
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est ce qu’une moyenne (µ ou x avec une barre au-dessus)?

A
  • Mesure la plus couramment utilisée
  • Influencée par la valeur de toutes les observations et est donc très sensible à la présence des données extrêmes
  • Peut devenir non représentative de l’échantillon si la distribution est fortement asymétrique
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce que la médiane (Md)?

A
  • Valeur qui occupe la place du milieu
    Ex.: 1, 2, TROIS, 4, 5
  • Environ 50% des observations se retrouvent de chaque côté
  • Déterminée par le nombre d’observations et non pas la valeur de celle-ci
  • Rôle purement descriptif
  • Pour données sur échelle ORDINALE
  • Décrit la valeur moyenne d’une distribution asymétrique
  • Indice de tendance centrale basé sur la fréquence d’observations
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est ce que le mode (Mo)?

A
  • Valeur la plus fréquente d’une série d’observations (pic de la distribution)
  • Mesure peu utilisée
  • Purement descriptif, pour définir l’allure de la distribution (unimodale ou bimodale)
  • Pour données sur échelle NOMINALE
  • Pas influencer par les valeurs extrêmes
  • Ne permet pas d’opérations mathématiques
  • Décrit des variables catégorielles
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est-ce qui se passe dans le cas d’une distribution parfaitement symétrique?

A

La moyenne, la médiane et le mode sont égaux

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qu’est-ce qu’une mesure décrivant la distribution d’une population?

A

Le coefficient de d’asymétrie (skewness) (CD)

Souvent valeurs de -1.0 à 1.0
La valeur indique le degré de dissymétrie et le signe la direction

Si la distribution est symétrique -> CD = 0

Courbe normale (symétrique):
Mode=médiane=moyenne

Asymétrie positive (tire vers la droite):
Mode, Médiane, moyenne

Asymétrie négative (tire vers la gauche):
Moyenne, Médiane, Mode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Quelles sont les mesures de dispersion?

A
  • Étendue (E)
  • Variance (s 2)
  • Écart-type (s)
  • Coefficient de variation (CV)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Qu’est-ce que l’étendue?

A

Différence entre la valeur (V) la plus grande et la valeur la plus petite d’une série d’observations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Qu’est-ce que la variance?

A
  • Mesure de l’étendue des scores basée sur la déviation de chacun de ceux-ci par rapport à la moyenne
  • Séries d’écart, et on fait la moyenne de ces écarts là
  • Représente la valeur globale de dispersion des scores par rapport à la moyenne
  • Plus la variance est grande Plus la distribution sera étendue (plus il y aura de dispersion dans nos scores)
  • Très difficile à concrétiser/comprendre en regardant sa valeur
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Qu’est-ce que l’écart type?

A
  • On peut l’interpréter comme une mesure linéaire de la variabilité au sein d’une distribution
  • S’exprime dans les même unités que la moyenne
  • Dans le cas d’une distribution normale, l’écart-type devient une mesure de dispersion très importante en raison de la relation existant entre celui-ci et la moyenne
  • Dispersion des valeurs d’une distribution qui tient compte de l’écart de chaque valeur par rapport à la moyenne du groupe
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Qu’est-ce que l’écart-type de la moyenne (erreur type)?

A
  • L’erreur type, aussi appelée l’écart-type de la moyenne, donne une idée de la précision avec laquelle la moyenne de l’échantillon est représentative de la moyenne de la population
  • L’erreur type de la moyenne est toujours plus petite que l’écart-type
  • Plus on a un échantillon qui est représentatif de la moyenne de la population, plus erreur type de la moyenne va être petite
  • C’est mieux de rapporter l’écart-type que l’erreur type de la moyenne dans une étude
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Qu’est-ce que le coefficient de variation?

A
  • C’est le rapport de l’écart-type sur la moyenne
  • Écart-type exprimé en % de la moyenne, donc indépendant des unités de mesure
  • Exprime le degré de dispersion d’une distribution autour de la moyenne
  • Utile pour comparer la dispersion de deux variables de nature différente (unités différentes)

Exemple:
Laquelle des variables présente la plus grande dispersion?
BMI: 27.9 +- 7.7kg/m2
CT: 89.5 +- 18.1 cm

  1. 7 / 27.9 x 100 = 26.9%
  2. 1 / 89.5 x 100 = 20.2%

Donc, c’est le BMI

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Qu’est-ce que les mesures de position?

A

Permettent de situer une donnée par rapport aux autres dans une distribution

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Quels sont les deux types de mesure de position?

A
  • Score percentile

- Score standardisé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Qu’est-ce que le score percentile?

A

Indique le rang d’un score en donnant le pourcentage d’observations se situant en dessous de ce score.

Ex.: P90 -> 90% du monde on un score inférieur à vous

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Qu’est-ce que le score standardisé (score z)?

A

Exprime un score en fonction de son écart-type par rapport à la moyenne.

Score dont l’écart par rapport à la moyenne s’exprime en unités d’écart-type: -3.0 à 3.0.

Permet de comparer des scores qui n’ont pas le même point de référence.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Qu’est-ce que donne le tableau des aires sous la courbe normale?

A

Donne le % de scores entre la moyenne et le score z.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Qu’est-ce que l’inférence statistique?

A

L’inférence statistique utilise les données de l’échantillon pour estimer les paramètres de la population et vérifier les hypothèses de recherche.

Inférer à partir d’un échantillon, les paramètres de la population qui est inconnue.

Suppose une prise de décision de la part du chercheur. Cette prise de décision comporte un risque ou une probabilité d’erreur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

(Inférence statistique)

Quand on fait une estimation, on suppose…

A
  • Que la valeur observée a peu de chance d’être exactement celle de la population
  • Que cette valeur est néanmoins assez proche si l’échantillon est représentatif
  • Qu’en répétant l’échantillonnage on trouverait d’autres valeurs relativement proches de la vrai valeur inconnue
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Pourquoi la relation entre l’écart-type et le score z est utile?

A

Car ça nous permet de calculer les scores percentiles correspondant à des scores z déterminés.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Les statistique inférencielles reposent sur le théorème de la limite centrale. C’est quoi?

A

Théorème de la limite centrale:

  • La moyenne d’une variable calculée sur un échantillon est elle même une variable aléatoire. Elle varie selon l’échantillon.
  • Cette variable aléatoire suit une loi normale.
  • Cette loi normale est centrée sur la moyenne de la population.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Qu’est-ce que l’estimation ponctuelle?

A

Estimation de la valeur d’un paramètre d’une population faite à partir de la statistique mesurée auprès de l’échantillon.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Qu’est-ce que l’estimation par intervalle de confiance (IC)?

A

Estimer un intervalle dans lequel la moyenne inconnue µ a la plus grande probabilité de se retrouver.

  • Se fait à partir de la distribution théorique de la courbe normale et du théorème de la limite centrale
  • L’intervalle de confiance est donc une gamme de valeurs dans laquelle devrait se trouver le paramètre de la population
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Quelles sont les types d’estimation des paramètres?

A
  • Estimation ponctuelle

- Estimation par intervalle de confiance

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Qu’est-ce que l’intervalle de confiance à 95%?

A

Il y a 95% de chances que µ se situe entre deux valeurs déterminer.

Établie à partir de la moyenne d’échantillonnage et son écart-type

37
Q

Quels sont les concepts de l’inférence statistique?

A
  • Concept des distributions d’échantillonnage: Fluctuations d’échantillonnage
  • Concept de probabilité:
    Probabilité que les valeurs de l’échantillon constituent de réelles estimations des paramètres de la population (intervalle de confiance à 95%);
    Probabilité que les relations observées entre des variables (tests de liaison) ou les différences entre des groupes (tests de comparaison) ne soient pas le résultat du hasard;
    La probabilité sert de guide à la prise de décision en recherche
38
Q

Qu’est-ce que la vérification empirique des hypothèses?

A

Vérifier, au moyen de tests statistiques, des hypothèses au sujet des relation entre variables (tests de liaison) ou des différences entre les groupes (tests de comparaison)

39
Q

Qu’est-ce qu’un test d’hypothèse?

A

Choisir (avec risque d’erreur) entre deux hypothèses:

  • Hypothèse nulle (H0)
  • Hypothèse alternative ou de recherche (H1)
40
Q

Quelle est la démarche des tests d’hypothèses?

A
  1. Formulation des hypothèses
  2. Choix du seuil de signification: erreur de type I
  3. Puissance du test: l’erreur de type II
  4. Calcul du test statistique
  5. Détermination de la valeur critique
  6. Définition de la règle de décision
  7. Application de la règle de décision
41
Q

Qu’est-ce que H0?

A

Hypothèse nulle
Pas d’association entre les variable ou pas de différence entre les groupes
On veut la rejeter pour favoriser H1

42
Q

Qu’est-ce que H1?

A

Hypothèse de recherche
Hypothèse alternative
Notre hypothèse de recherche
Hypothèse que le chercheur désire prouver en rejettant H0

43
Q

Quelle hypothèse fait l’objet du test statistique?

A

Repose toujours sur H0

44
Q

Est-ce que les statistiques descriptive permettent de tester les hypothèses de recherche au moyen de tests statistiques?

A

Non

45
Q

Le coefficient d’asymétrie (Skewness) d’une distribution parfaitement symétrique est égale à quoi?

A

0

46
Q

Plus le nombres d’observations (n) augmente,…

A

plus la variance diminue

47
Q

Identifiez l’intrus:

  • Moyenne
  • Écart-type
  • Médianne
  • Mode
A

Écart-type, car c’est une mesure de dispersion. Les autres sont des mesures de tendance centrale.

48
Q

Qu’est-ce qu’une variable binaire?

A

Variable mesurée selon une échelle nominale ne comportant que deux catégories.

49
Q

Quelle est le type de variable:

  1. Nombre de frères et soeurs
  2. Statut matrimonial
  3. Échelle de perception de l’effort
  4. Temps pour compléter un quiz
  5. Date de naissance
A
  1. Quantitative discrète
  2. Qualitative nominale
  3. Qualitative ordinale
  4. Quantitative continue
  5. Quantitative continue
50
Q

Quel est des objectifs de l’inférence statistique?

A

Tester les hypothèses de recherche

Estimer les paramètres de la population

51
Q

Qu’est-ce que l’erreur de type I?

A

Rejetter H0 alors qu’elle est vrai.

C’est l’erreur la plus grave parce que l’on favorise H1 alors qu’elle est fausse

52
Q

Qu’est-ce que le niveau (ou seuil) de signification?

A

Le niveau de signification à 5% d’un test statistique signifie que le chercheur à 5 chances sur 100 de se tromper en remettant l’hypothèse nulle à la faveur de l’hypothèse alternative

53
Q

Qu’est-ce que l’erreur de type II?

A

Conclure à tort que H0 est vrai, alors qu’elle est fausse.

Représente la probabilité de ne pas obtenir une différence significative, donc un effet, alors qu’en réalité il y en a une

Manque de puissance

54
Q

Qu’est-ce que la puissance statistique?

A

Correspond à notre capacité de détecter s’il y a une différence

55
Q

Quels sont les facteurs qui affecte la puissance statistique?

A
  • Importance de la différence (Taille de l’effet)
  • Écart-type
  • Taille de l’échantillon
  • Le niveau de signification
56
Q

L’ampleur de l’effet (ou taille de l’effet) est un facteur à considérer le calcul de la puissance statistique. Plus l’ampleur de l’effet est grand …

A

…plus la taille de l’échantillon requis pour le détecter sera petit.

En considérant tous les autres paramètres affectant la puissance statistique égaux, il sera plus facile de détecter une différence entre deux groupes si l’ampleur de l’effet est grand, donc avec une taille d’échantillon plus petite

57
Q

Qu’est-ce que la détermination de la valeur critique?

A

Valeur issue d’une table statistique (propre à chaque test) qui détermine les zones de rejet et de non rejet de H0. Cette valeur dépend du seuil de signification et du nombre de degrés de liberté

58
Q

Qu’est-ce que le degrés de liberté?

A

Nombre de valeurs dans une distribution susceptible de varier de façon aléatoire

59
Q

Qu’est-ce qu’une valeur critique?

A

Valeurs au delà desquelles on rejette H0

60
Q

Qu’est-ce le test bilatéral?

A

On rejette H0 s’il y a une différence, qu’elle soit positive ou négative

On ne précise pas la direction de H1

Test généralement utilisé

61
Q

Qu’est-ce que le test unilatéral?

A

On rejette H0 en précisant la direction anticipée de la différence

On tiens compte de la direction

62
Q

Quel test est le plus puissant pour rejeter H0?

A

Test unilatéral

Car la valeur du seuil de rejet est plus petit

63
Q

Quelles sont les deux grandes classes de tests statistiques?

A

Tests paramétrique

Tests non paramétrique

64
Q

Qu’est-ce qu’un test paramétrique?

A

Compare des paramètres en tenant compte de postulats sur la direction des données

Les données doivent suivre une distribution normale

Pour des variables continues

Permet de déceler plus facilement des différences ou des relations

Test plus puissant

65
Q

Qu’est-ce qu’un test non paramétrique?

A

Comparer les distributions plutôt que les paramètres (basés sur les rangs plutôt que les valeurs des variables étudiées)

Pour des données ne satisfaisant pas aux postulats de normalité

Pour des variables nominales ou ordinales

Utilisés avec des échantillons de petite taille (moins que 20)

Sont plus robustes que les tests paramétriques

66
Q

Les tests paramétriques ont-ils souvent des tests non paramétriques équivalent?

A

Oui

67
Q

Qu’est-ce que des mesures d’association?

A

Test de liaison

Permettent de vérifier s’il y a une association entre une ou plusieurs variables

68
Q

Deux variables sont liées quand?

A

Lorsque la variation de l’une entraine la variation de l’autre (Covariation entre 2 variables)

69
Q

Est-ce que la présence d’association entre deux variable implique une relation de causalité?

A

Non

70
Q

Qu-est-ce que le test du chi-carré (x2)?

A

Servent à comparer des fréquences observées avec des fréquences théoriques.
Adapté pour des variables qualitatives

71
Q

Quels sont les différents test de chi-carré?

A
  • De conformité
  • D’homogénéité
  • D’indépendance
72
Q

Qu’est-ce que le test de chi-carré de conformité?

A

Comparer une distribution observée à une distribution théorique
Ex.: Plus ont fait des lancés de dés, plus la proportion de chaque chiffre est égale

73
Q

Qu’est-ce que le test de chi-carré d’homogénéité?

A

Comparer deux ou plusieurs distributions observés sur plusieurs échantillons

Est-ce que deux population ont une distribution identique?

Utiliser ce test si ont veux savoir la proportion de statut sociaux économique est similaire entre les hommes et les femmes.

74
Q

Qu’est-ce que le test de chi-carré d’indépendance?

A

Étudier sur un même échantillon la liaison entre les distributions de deux variables nominales

75
Q

Qu’est-ce que le r de Pearson?

A

Permet de mesurer l’association entre deux variables quantitatives

Vérifie s’il existe une association
Quantifie la force de l’association
Indique la direction de l’association

Valeurs de r: -1.0 à 1.0
r = 1.0 -> Covariation parfaite entre les deux variables. Indique la force de l’association

Le signe + ou - indique la direction de l’association

76
Q

Qu’est-ce que le coefficient de détermination (r2)?

A

La valeur de r x 100

Pourcentage de variance commune entre les deux variables

r2 ajusté:

  • Dépend du nombre de VI qu’on met dans le modèle
  • Plus il y a des variables utile dans la prédiction de notre VI, plus r2 va augmenter
  • Variables pas utile, r2 va diminuer
77
Q

Qu’est-ce qu’un test de régression?

A

Prédire une variable dépendante à partir d’une variable indépendante

3 fonctions:

  • Vérifier l’existence d’une association entre une variable dépendante (Y) et une variable indépendante (X)
  • Décrire comment Y est lié à X
  • Prédire Y à partir de X

Plus le coefficient de régression bêta est grand, plus la relation entre les deux variables est importante

78
Q

Qu’est-ce que la régression logistique?

A

Forme de régression servant à prédire une variable nominale : Présence ou absence d’une condition ou d’une maladie

VD est binaire
VI peut être nominale ou continu

79
Q

Qu’est-ce que le test t de student?

A

Sert à comparer les moyennes de 2 populations

Le test consiste à estimer l’écart-type de la différence entre les moyennes, à calculer la valeur t et à comparer cette valeur à la distribution théorique de la loi T de student

VD doit avoir une distribution normale
Les deux groupes doivent avoir les mêmes variances: homogénéité des variances

80
Q

Qu’est-ce que le test t de student indépendant?

A

Mesurer les différences entre les moyennes de deux groupes indépendants

81
Q

Qu’est-ce que l’analyse ANOVA?

A

Comparer les différences entre trois groupes ou plus

Scinder la variation totale (SCEt) en deux composantes:

  • Variation entre les groupes (SCEb)
  • Variation à l’intérieur des groupes (SCEw); aussi appelée variance résiduelle
82
Q

Est-ce que le test de corrélation de Pearson est utilisé pour évaluer l’association entre deux variables catégorielles?

A

Non

83
Q

La régression logistique est une technique de régression permettant de prédire quoi?

A

L’impact d’une de plusieurs variables indépendante sur la survenue d’une condition ou d’une maladie.

Elle se caractérise par le fait que la variable dépendante à prédire est dichotomique (survenue ou non de la condition ou la maladie)

84
Q

Identifiez l’intrus:

  • Test de t de student
  • Test de t de student pour données paires
  • Test de corrélation de Pearson
  • Test d’ANOVA à mesures répétées
  • Test d’ANOVA
A

Test de corrélation de Pearson, c’est un test de liaison, tandis que les autres sont des tests de comparaisons

85
Q

Est-ce que l’ANOVA classique peut être utilisé pour comparer les moyennes entre les conditions si une variable est mesurée plusieurs fois?

Ex.: À des moments différents ou dans diverses conditions expérimentale, sur les mêmes sujets

A

Non, il faut utilisé l’ANOVA à mesures répétées

  • La condition d’indépendance entre les groupes ne s’applique plus; on a un seul groupe de sujets
  • Les mêmes sujets sont mesurés sous chacun des niveaux de traitement ou à différents moments
  • Il faut donc séparer la variance liée au traitement (entre les conditions) de la variance liée aux sujets

Avantage: Permet de tenir compte des différences interindividuelles

Les réponses d’individus différents aux mêmes traitements varient en fonction de leurs caractéristiques personnelles, de leurs expériences et de leurs réactivités individuelles

86
Q

Quels sont les moyens d’exposer les résultats de recherche?

A
  • Tableaux

- Figures

87
Q

Comment utiliser un tableau quand on veut présenter des résultats?

A
  • Utiliser quand il s’agit de présenter les valeurs exactes des résultats
  • Décrire les participants selon les groupes
  • Composantes: titre, rangées, colonnes, entête, note explicative sous le tableau
88
Q

Comment utiliser une figure pour présenter des résultats?

A
  • Présentation visuelle de certains résultats, souvent les résultats les plus importants
  • Ne devraient pas répéter les résultats déjà présentés sous forme de tableaux