Module 2A: Questions, objectifs et hypothèses de recherche Flashcards

1
Q

Variable:

A

Caractéristique susceptible d’être différente selon les personnes, lieux ou temps

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Valeur:

A

Tout état que prend la variable

(ex: variable sexe → 2 valeurs, masculin/féminin)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Types de variables: (3)

A
  1. Variables de personnes: attributs anatomiques, physiologiques, sociaux, économiques, culturels
  2. Variables de lieux: pays, régiom, situation géographique
  3. Variables de temps: quand?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Classification des variables: (2 types, 2 sous-types chaque)

A
  1. Variable quantitative: numérique
    1. Discrète → uniquement nombres entiers (ex: # d’enfants)
    2. Variable → continue, contient des fractions (ex: taille)
  2. Variable qualitative: attributs, toujours discrète
    1. Dichotomique → possèdent que deux modalités
    2. Ordinale → avec séquence claire
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Moyenne vs. proportion:

A

Moyenne: valeurs quantitatives

Proportion: valeurs qualitatives

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Échelle de classification:

A

Doit permettre de distribuer toutes les observations (chacune dans une seule catégorie)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Échelle de classification:

A

Doit permettre de distribuer toutes les observations (chacune dans une seule catégorie)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Deux conditions pour assurer que le classification des observations est juste:

A
  1. Mutuellement exclusives: each data point can only be in one class
  2. Collectivement exhaustives: must apply to all data
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Trois types d’échelles de classification:

A
  1. Échelle nominale: classes sont nommées
  2. Échelle ordinale: classes sont nommées et ordonnées (plus petit → plus grand ou vice versa)
  3. Échelle par intervalle: nommées et ordonnées et une relation de distance entre les valeurs
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Passage d’une échelle → une autre:

A

Each pass down = more data lost, therefore becomes +++ general

individuel (6 years old) → intervalle (1-7 years old) → ordinale (school-aged child) → nominale (child)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Distributions de fréquences:

A

Rend les données plus claires et intelligibles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Fréquence absolue:

A

= #observations/classe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Colonnes dans tableau de distribution de fréquences: 4

A
  1. Classes
  2. Effectif/fréquence absolue
  3. Fréquence relative (% de répartition des effectifs dans les classes) → 10/70 people = 12.8%
  4. Fréquence relative cumulée (additionne fréquence relative des classes, % in that class and those above it)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Représentation graphique: échelle nominale/ordinale

A
  • Diagramme en secteurs proportionnelles (pie graph)
    • Proportions des valeurs prises par une variable
    • Seulement une série de données
  • Diagramme en barres proportionnelles
    • Analogue à la représentation par tarte
  • Diagramme en barres
    • Chaque barre représente fréquence de la classe d’une variable
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Représentation graphique: échelle par intervalle (4)

A
  • L’histogramme:
    • Utilisée pour variables quantitatives continue:
      • Chaque rectangle doit:
        • Suivent l’ordre des classes
        • Base coïncide avec l’intervalle de la classe correspondante
        • Aire de rectangle = fréquence de la classe correspondante
  • Polygone de fréquences:
    • Utilisée pour variables continue et discrètes mais réservée pour les variables continues
    • Obtenu par passer ligne par milieu des sommets des rectangles de l’histogramme
  • Graphe en lignes:
    • Variable y en fonction d’une variable x
  • Graphe des percentiles:
    • Partagent une distribution en 100 parties égales entre elles
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Règles générales de représentation graphique

A
  • Doivent êtres aussi simples que possible
  • Titre clair, concis, et précis
  • Échelle et unités spécifiques
  • Sources indiquées
  • Légende ajoutée si nécessaire

IMPORTANT D’ÉVITER SOUTE SURCHARGE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Trois mésures de tendance centrale:

A
  1. Moyenne
  2. Médiane
  3. Mode
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Moyenne arithmétique:

A

Somme des valeurs observées/nombre de valeurs

19
Q

Lacune de la moyenne arithmétique:

A
  • Influencée +++ par des valeurs extrêmes (surtout élevées)
  • Mais dim. quand tu aug. # d’observations
20
Q

Moyenne pondérée:

A

Donne un poids à chaque classe selon son importance dans l’ensemble

somme des (moyennes des classes x par nombre d’observations) / nombre total d’observations

21
Q

Moyenne géométrique:

A
  • Utilise produit des valeurs observées
  • Seulement valeurs positives
  • Permet de réduire l’influence des valeurs extrêmes (surtout basses)
  • Utilisée dans contexte d’analyses de laboratoires (svt asymétriques)
22
Q

Comportement des moyennes arithmétiques vs. géométriques en présence de valeurs extrêmes:

A
23
Q

Médiane:

A
  • N’est pas influencée par valeurs extrêmes
  • Préfère aux autres mesures si distribution est +++ asymétrique
24
Q

Mode:

A

VALEUR QUI REVIENT LE + SOUVENT

  • Influencé par les fréquences des observations
  • Plus sensible aux changements
  • Moins stable que la moyenne
  • Utilisée pour variables qualitatives et quantitatives
25
Q

Relation entre échelle et mesure de tendance centrale:

A
26
Q

Cinq mesures de dispersion:

A
  1. Étendue
  2. Quantiles
  3. Variance
  4. Écart type
  5. Coefficient de variation
27
Q

Étendue:

A

Max - min

Ne subit l’influence que des valeurs extrêmes

28
Q

Quantiles:

A

Diviser l’ensemble en un certain # de parties égales

Quartile → 4 parties égales, percentiles → 100 parties égales

29
Q

Variance:

A

Distance de chaque valeur par rapport à la moyenne

Somme des carrées des écarts par rapport à la moyenne/# d’observations

30
Q

Écart type: (standard deviation)

A

Racine carrée de la variance:

Mesure de la dispersion des valeurs d’un échantillon statistique ou d’une distribution de probabilité

31
Q

Écart type dans sous-ensemble de la population (échantillon)

A

Utilise dénominateur n-1 pour corriger le biais

32
Q

Notation pour population vs. échantillon:

A
33
Q

Coefficient de variation:

A

Permet de comparer deux distributions d’une même variable/variables différences même s’ils ont des unités différents

Aug. CV = aug. variabilité des données

34
Q

Taille de l’échantillon dépend de:

A
  1. Plus petite différence que l’on veut détecter
  2. Précision souhaitée
  3. Puissance souhaitée
  4. Variabilité des données

Aug. précision = Aug. taille

Aug. variabilité = Aug. taille

Aug. taille = Aug. puissance

Aug. puissance = Aug. confiance

35
Q

Quatres types d’échantillonnage:

A
  1. Échantillon aléatoire simple: sélection au hasard
  2. Échantillon aléatoire stratifié: divise d’abord en strates et ensuite sélectionner de façon aléatoire des membres de chacune des strates
  3. Échantillonnage systématique: choisi de façon régulière, selon un intervalle régulier, à l’intérieur de la population ciblée
  4. Échantillonnage en grappes: basant sur la position géographique de la population ciblée, on la divise d’abord en grappes et ensuite sélectionne un certain nombre de façon aléatoire
36
Q

Comment formuler question de recherche?

A

P: population

I: Intervention/exposion

C: comparateur

O: outcome (conséquence potentielle)

T: temps

37
Q

Étude à visée étiologique:

A

Comprendre les liens cause-à-effet entre des facteurs de risque et des maladies

38
Q

Étude à visée prédictive:

A

Prédire développement d’une maladie (dépistage/dx) ou complications (prognostic) chez personne à partir de l’information disponible à moment donné

39
Q

Hypothèse nulle:

A
  • Postule l’absence d’effet/non-existence d’une relation/association/différence
  • Présomption d’absence d’effet
  • Affirme de la différence observée est purement due au hasard ou qu’il n’y a pas d’association statistique entre 2 variables
40
Q

Confrontation d’une hypothèse nulle:

A

Hypothèse alternative/contre-hypothèse

41
Q

Test d’hypothèse statistique (test de signification):

A

Permet d’estimer à quel point les données qu’on observe dans l’étude sont compatibles avec l’hypothèse nulle → calculer valeur d’un test statistique → valeur-p

42
Q

Valeur-p:

A

Probabilité que nos observations sont compatibles avec l’hypothèse nulle

  1. P élévée: données sont compatibles avec nulle et on accepte hypothèse nulle
  2. P très faible: données sont peu compatibles avec nulle et on rejette nulle
43
Q

Degré de signification p:

A
  • Probabilité que l’hypothèse nulle est vrai
  • Fixe a priori le seuil de signification statistique (risque alpha): normalement à 5% ou 1%
    • Si valeur-p < signification fixé = improbable que résultat est par hasard
      • = différence observée est statistiquement significative