UA4 Flashcards

1
Q

Qu’est-ce qu’une variable qualitative?

A

Une variable qui ne peut être mesuré au sens numérique mais peut être classé. (ex.: oui ou non, dichotomique)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce qu’une variable quantitative?

A

Une variable qui correspond à une mesure numérique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Comment peuvent être classées les variables quantitatives?

A

Discrètes: Chiffre complet - ex: nombre de personne, de visite à l’hôpital, etc…

Continues

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quels sont les outils utilisés pour rassembler et synthétiser des données statistiques descriptives?

A

Tableaux, graphiques, indicateurs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est-ce que la distribution de fréquence?

A

Portrait ordonné de chaque valeur que prend une variable (ou un intervalle de valeurs) et de la fréquence (%) à laquelle ces valeurs sont observées.

ex.: Tableau qui décrit des tranches d’âge et la fréquence d’un risque qui leur est attribué, histogramme

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce qu’un histogramme qui a une distribution symétrique et unimodale?

A

Belle courbe en forme de cloche symétrique, sans ‘‘double pic’’

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est-ce qu’un histogramme qui a une distribution asymétrique et unimodale

A

Courbe en forme de cloche ‘‘déformée’’, tend plus d’un côté que de l’autre sans double pic

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce qu’un histogramme bimodale

A

Qui a double pic

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce qu’une variable abérante?

A

Valeur à l’intérieur d’un ensemble de données qui fluctue de manière extraordinaire par rapport aux autres

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelles mesures sont fréquemment utilisées pour décrire les paramètres de position des résultats?

A

Moyenne, médiane et mode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelles mesures sont fréquemment utilisées pour décrire les paramètres de dispersion des résultats?

A

Étendue et variance (écart-type)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quels sont les avantages et désavantages d’une moyenne?

A

Avantages: Faciles à utiliser et à calculer
Désavantages: Affectés par les variables aberrantes/extrêmes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quels sont les avantages et les désavantages d’une médiane?

A

Avantages:
* Facile à calculer
* Facile à interpréter
* La médiane est peu affectée par les valeurs extrêmes

Désavantages:
* Peut être fastidieuse à calculer lorsque l’échantillon est grand
* Ne représente que la valeur qui divise l’échantillon en 2 parties, et ne donne aucune information sur les autres valeurs de la distribution
* D’un point de vue mathématique, la médiane est beaucoup moins facile à utiliser que la moyenne pour les tests de signification statistique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce que le mode?

A

La valeur de la variable pour laquelle la fréquence est la plus élevée. Le mode est rarement employé seul pour mesurer la tendance centrale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vrai ou faux: Il peut n’y avoir aucun mode dans une étude

A

Vrai ! Si une valeur ne revient pas 2 fois, pas de mode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quels sont les avantages et les désavantages d’un mode?

A

Avantages:
* Le mode n’est pas affecté par les valeurs extrêmes
* Peut être calculé sur des variables qualitatives et quantitatives
* Bon indicateur quand une population est hétérogène et
présente plusieurs valeurs dominantes

Désavantages:
* Dans un petit échantillon, il peut ne pas y avoir de mode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qu’est-ce que la variabilité?

A

La fiabilité (ou la précision) est indiqué par la variabilité. Plus la variabilité est grande moins la moyenne se rapproche de la valeur réelle

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

À quoi servent les paramètres de dispersion?

A

Fournissent une information supplémentaire sur la position
relative des autres points de l’échantillon par rapport à la
mesure de tendance centrale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Comment calculer l’étendue?

A

La différence entre la plus grande valeur et la plus petite valeur des observations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Qu’est-ce que la différence de risque?

A

Mesure d’association qui donne une information sur l’effet réel de l’exposition ou excès/réduction de risque attribuable à l’exposition.

= Incidence de l’issue chez les patients ayant reçu le traitement actif - Incidence de l’issue chez les patients ayant reçu le traitement contrôle

Incidence = nb de cas / échantillon total (contrôle ou expérimental)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

EXEMPLE D’INTERPRÉTATION DE DIFFÉRENCE DE RISQUE !

A

Différence de risque :
I(fumeurs) – I(non fumeurs) = 0,83 - 0,33 = 0,50
Le risque supplémentaire de l’infarctus associé au tabagisme est de 50 pour 100

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Comment calculer un NNT?

A

= 1 / (I exposés - I non-exposés) = 1/différence de risque

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Vrai ou Faux: Si NNT = 3,3 , on peut l’arrondir à la baisse, à 3

A

FAUX ! On arrondit à la hausse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Quels sont les avantages et désavantages des NNT?

A

Avantages:
* Résumé utile des résultats
* Utile pour éclairer la prise de décision des médecins et des patients sur les options de traitement
* Relativement facile à calculer

Désavantages:
* Le NNT est basé sur la valeur la plus probable dans une population normalement distribuée - il ne tient pas compte du risque de base individuel d’un patient
* Son interprétation est subjective

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Comment calculer un NNH?

A

1 / différence de risque

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Quel biais est évité par la randomisation?

A

Biais de confusion !! PAS DE SÉLECTION

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Quel type d’analyse nécessite un ajustement pour les variables confondantes?

A

L’analyse per protocol !

28
Q

Devrions nous interpréter des variables ajustées ou non ajustées?

A

Ajustées car moins de biais de confusion, peu importe lequel est statistiquement significatif

29
Q

Quelle est la valeur nulle pour un OR ? Pour une différence/proportion?

A

OR = 1
Différence/proportion = 0

30
Q

Si on a un résultat non statistiquement significatif, sur quel paramètre devrions-nous nous questionner en premier?

A

Se questionner sur la taille de l’échantillon

31
Q

Comment on peut savoir si des résultats sont semblables ou non lorsqu’on les compare entre eux plutôt qu’avec la valeur de référence?

Ex.: Comparer conséquence 2-3 et 4-5 verres d’alcool ensemble plutôt qu’avec 0-1 (référence)

A

Regarder les IC ! Si se chevauchent, risques SEMBLABLES

32
Q

Pourquoi n’est-il pas toujours faisable ou recommandé de faire une randomisation?

A

Considérations éthiques

33
Q

Comment on peut déterminer si la perte au suivi a eu une influence sur les résultats?

A

On peut comparer analyse ITT avec per protocol. Si différence entre les résultats, alors a des conséquences

34
Q

Comment éviter un biais d’information?

A
  • Le suivi des participants soit identique d’un groupe à l’autre
  • L’évaluation des issues soit identique d’un groupe à l’autre
  • Utiliser le plus possible des variables dichotomiques
35
Q

Quel type de régression doit être faite pour un outcome dichotomique?

A

Régression logistique
Dans études per protocol seulement

36
Q

Quel type de régression doit être faite pour un outcome continu?

A

Régression linéaire
Dans études per protocol seulement

37
Q

Quel IC est le plus précis, 95% ou 99%?

A

95%. Un IC de 99% est nécessairement plus large pour inclure 99% de la pop, mais plus un IC est large, moins il est précis

38
Q

Vrai ou Faux: Un IC de 95% indique qu’il y a 95% de chance que l’estimé de l’échantillon sera compris entre borne inf. et sup. de l’IC

A

FAUX ! Concerne la population, pas l’échantillon. 100% des résultats sont dans l’IC pour l’échantillon

39
Q

Comment différencier entre 2 résultats lequel est le plus précis?

A

Comparer les IC. Le plus petit IC est le plus précis

40
Q

Quelle valeur de p value est statistiquement significative

A

Si p + petit que 0.05 (5%)

41
Q

Qu’est-ce que l’inférence statistique?

A

Consiste à estimer les caractéristiques inconnues d’une population à partir d’un échantillon issu de cette population. A une certaine marge d’erreur possible

42
Q

Qu’est-ce qu’un intervalle de confiance?

A

Se définit comme 2 valeurs numériques (bornes) de part et d’autre de l’estimateur ponctuel observé qui définissent une étendue, qui avec un certain niveau de confiance (1 – α) va inclure la vraie valeur du paramètre à estimer.

43
Q

Qu’est-ce qu’une hypothèse?

A

Une hypothèse statistique peut être simplement définie comme un énoncé (une affirmation) concernant les caractéristiques (valeur des paramètres) dans une ou plusieurs populations

44
Q

Qu’est-ce que le test d’hypothèse?

A

Démarche ayant pour but de fournir une règle de décision permettant, sur la base de résultats obtenus à partir d’un ou plusieurs échantillons aléatoires, de faire un choix entre deux hypothèses statistiques

45
Q

Quelles sont les étapes de la démarche du test d’hypothèse?

A
  1. Formulation des hypothèses statistiques
  2. Choix du seuil de signification α
  3. Préciser les présupposées nécessaires à l’application du test
  4. Choix de la statistique qui convient au test et l’écart-réduit
  5. Établir la règle de décision
  6. Calcul de l’écart-réduit
  7. Calcul du p-value
  8. Interprétation des résultats et
    conclusion
46
Q

Comment appelle-t-on les 2 hypothèses que l’on émet dans un test d’hypothèse

A

Hypothèse nulle (H0): Hypothèse que l’on désire contrôler. Elle consiste à dire qu’il n’existe pas de différence entre les paramètres comparés ou que la différence observée n’est pas significative et est due aux fluctuations d’échantillonnage

Hypothèse alternative (H1) est la négation H0, elle est équivalente à dire « H0 est fausse ». La décision de rejeter H0 signifie que H1 est vraisemblable.

47
Q

Que représente la variable a (alpha)?

A

Risque (consenti à priori) de rejeter à tort l’hypothèse nulle H0 alors que celle-ci est vraie, s’appelle le seuil de signification du test et s’énonce en probabilité comme suit:
α= Pr(rejeter H0| H0 est vraie) = Pr(choisir H1| H0 vraie)

On va choisir normalement α = 5

48
Q

Quelle est l’utilité de la régression linéaire?

A

Utilisée lorsqu’on veut expliquer la
variation d’une variable dépendante (issue) continue à partir de
certaines caractéristiques des patients (indépendantes). On veut évaluer la relation entre variable dépendante (ex: pression artérielle) et celles indépendantes (ex: sexe, âge, poids…)

49
Q

Comment FAIRE une régression linéaire?

A

Les résultats se retrouvent dans un graphique sous forme d’un nuage de point. La régression linéaire forme une droite qui estime le mieux la relation entre les variables

50
Q

Comment calculer l’écart-type?

A

Racine carrée de la variance

51
Q

Qu’est-ce que la valeur Z

A

1-a

52
Q

Quelle est la valeur de Z pour a=5%

A

1,96

53
Q

Quelle est la valeur de Z pour a=1%

A

2,58

54
Q

Comment calculer l’écart type de la moyenne?

A

Si la variance est connue, o/(racine de n)
Si inconnue, on estime: s/(racine de n)

55
Q

Quelle est la valeur s?

A

L’écart-type de l’échantillon

56
Q

Qu’est-ce que l’interprétation probabilistique?

A

Interprétation probabilistique :
« Si on sélectionne de façon indépendante plusieurs échantillons à partir d’une population ayant une distribution normale, 95% des intervalles de confiance de niveau 95% vont contenir la moyenne de la population μ. »

57
Q

Qu’est-ce que l’interprétation pratique?

A
  1. «Lorsqu’on sélectionne un échantillon à partir d’une population distribuée de façon normale, on est certain à 95% que l’intervalle de confiance à 95% contient la moyenne de la population μ. »
  2. « Lorsqu’on calcule un intervalle de confiance de niveau 95%, on a que 5% des chances que la vraie moyenne de la population μ ne soit pas comprise dans l’intervalle.”
58
Q

Vrai ou faux: Plus n est grand, plus IC est petit

A

Vrai

59
Q

Vrai ou faux: Plus la variance de X (σ^2) est petite, plus IC est grand

A

Faux ! Plus la variance de X est grande, plus l’IC est grand

60
Q

Vrai ou faux: Plus α est petit, plus IC est grand

A

Vrai

61
Q

Vrai ou faux: La largeur de l’IC nous indique la précision de l’estimateur ponctuel

A

Vrai

62
Q

Vrai ou faux: Le p-value est la probabilité d’obtenir une valeur de la statistique moins extrême que celle qu’on a observée dans notre échantillon en supposant que l’hypothèse nulle est vraie

A

FAUX ! Le p-value est la probabilité d’obtenir une valeur de la statistique PLUS extrême que celle qu’on a observée dans notre échantillon en supposant que l’hypothèse nulle est vraie

63
Q

Comment inverser un rapport de cote?

A

1/RC

64
Q

Comment inverser un IC?

A

1/limite haute ; 1/limite basse

65
Q

Comment déterminer si un rapport de cote représente une association faible ou forte?

A

Forte si très loin de 1, ex 3.5