Conférence 5 Flashcards

1
Q

Quels sont les 4 grandes familles des statistique descriptive?

A

Mesures de fréquence
Mesures de tendance centrale
Mesures de dispersion
Mesures de position

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quel est le but des statistiques inférentielles?

A

Permet d’effectuer une généralisation, à partir d’un échantillon, vers une population ou sous-population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Que signifie le péché mortel des statistique?

A

Utiliser des statistiques descriptives pour établir une relation de causalité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

comment sont écrit les mesures de fréquence?

A

-en absolue ou relatif
-en forme de tableau ou graphique
- si données en continue= histogramme
-si données sont discrète= diagramme à bâtons

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

que signifie une mesure de tendance centrale?

A

distribution normale/courbe normale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

définition de la médiane?

A

la valeur du milieu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

définition du mode?

A

celui qui revient le plus souvent

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

qu’est que le SKEW?

A

coefficient d’asymétrie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

que signifie coefficient positif p/r au Skew?

A

Le skew mesure l’asymétrie d’une distribution de données par rapport à une distribution symétrique. Un coefficient positif indique que la distribution est asymétrique à droite, ce qui signifie que :
1) la queue à droite plus longue
2) moyenne > médiane

Imagine que tu étudies les revenus mensuels d’un groupe de personnes :
La plupart des gens gagnent entre 1000 $ et 3000 $.
Mais il y a quelques individus qui gagnent 10 000 $, 20 000 $, ou même 50 000 $. Cela crée une distribution asymétrique vers la droite (skew positif).

La moyenne (la somme de tous les revenus divisée par le nombre de personnes) est élevée, à cause des très riches. (La moyenne finit par être plus élevée que ce que gagne vraiment la plupart des gens.)
La médiane (le revenu au milieu si tu ranges tout dans l’ordre) est plus basse, car la majorité gagne beaucoup moins.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

dans quel cas peut être pertinent d’utiliser la mesure de position?

A

pour les distributions asymétriques

Les mesures de position (comme la médiane, le quartile, ou encore les percentiles) sont particulièrement pertinentes pour les distributions asymétriques car elles permettent de décrire la position des données de manière plus robuste que les mesures comme la moyenne, qui peuvent être fortement influencées par les valeurs extrêmes (outliers).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

que signifie kurtose?

A

la courbe est étiré

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

que signifie l’étendue de la distribution?

A

distance entre la plus petite mesure et la plus grande mesure

Étendue large : Si l’étendue est grande, cela signifie que les données sont très dispersées entre la valeur la plus basse et la plus haute.

Étendue petite : Si l’étendue est petite, cela signifie que les données sont concentrées dans une plage étroite autour de la valeur minimale et maximale.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

que signifie la variance de la distribution?

A

somme des écarts par rapport à la moyenne au carré/ nombre d’observation–> sert à calculer l’écart type

Résumé :
La variance est une mesure qui décrit à quel point les données sont dispersées autour de leur moyenne. Elle nous indique si les valeurs sont proches de la moyenne ou, au contraire, très éloignées les unes des autres.

Imagine que tu as un groupe d’élèves et leurs notes :
Si tout le monde a des notes proches, comme 10, 11, 12, les données sont peu dispersées et la variance sera faible.
Si les notes sont très différentes, comme 2, 10, 18, les données sont très dispersées et la variance sera grande.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

quel est la différence entre l’écart-type et l’Erreur-type?

A

écart type: mesure de dispersion
erreur-type: mesure de précision de vos observation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

différence entre erreur-type 1 et 2?

A

1: faux positif
2: faux négatif

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

que signifie l’hypothèse nul?

A

absence de la pathologie

17
Q

que signifie la valeur P?

A

probabilité de commettre une erreur de type 1

18
Q

est ce que la valeur P donne de l’information sur la pertinence clinique des résultats?

19
Q

À quoi sert la valeur P?

A

La valeur p indique UNIQUEMENT que la probabilité de commettre une erreur de type 1 était INFÉRIEURE au seuil de signification statistique préalablement déterminé par les auteurs de l’étude.

Exemple :
* Tu fais un test pour savoir si un nouveau médicament est plus efficace qu’un placebo.
* Hypothèse nulle (H0) : Le médicament n’est pas plus efficace que le placebo.
* Tu obtiens une valeur p=0,03
o Cela signifie qu’il y a seulement 3 % de chances d’obtenir un tel résultat si le médicament n’avait en réalité aucun effet.
o Puisque p<0,05 on rejette l’hypothèse nulle et on conclut que le médicament est significativement efficace.

20
Q

nommez des exemples d’effets non-spécifique?

A

▪ Guérison naturelle

▪ Régression vers la moyenne (Par exemple, si un étudiant obtient une note très élevée à un examen, il est probable que sa note suivante soit plus proche de sa moyenne habituelle)
-Exemple du joueur de hockey

▪ Effet Hawthorne (changement comportement sujets étudiés parce qu’ils sont observés/évalués)

▪ Phénomène de Rogers (une situation où une comparaison entre deux groupes peut donner des résultats contradictoires lorsqu’ils sont examinés globalement par rapport à lorsqu’ils sont divisés en sous-groupes)

▪ Paradoxe de Simpson (données montrent une tendance dans chaque groupe séparé, mais que cette tendance disparaît ou s’inverse quand on regarde les données ensemble, souvent à cause d’un facteur caché.)

▪ “Vrai” effet placebo

21
Q

Qu’est qu’une intervalle de confiance?

A

estimation de l’intervalle pouvant contenir la valeur réelle d’un paramètre recherché

22
Q

que signifie la taille d’effet?

A

mesure de la magnitude d’un effet

23
Q

Vrai ou faux
la taille d’effet est une mesure comparative de la magnitude d’un effet

24
Q

que signifie l’analyse par intention-to-treat?

A

▪ Notion d’attrition non-aléatoire.
▪ Induit un biais d’attrition.
Attrition = un participant arrête de participer ou ne suit pas les consignes de l’étude avant que celle-ci se termine

Même si un patient arrête de participer, on prend en compte son suivi et son évolution.

25
Q

que signifie la puissance de l’étude?

A

capacité à détecter un effet donné dans l’étude

exemple: chercher ces clés dans le noir= puissance faible car fort possible de ne pas les trouver

26
Q

Qu’est que le NNT?

A

NNT = number needed to treat

NNT: 100 / (% d’amélioration de groupe expérimentale- % groupe contrôle)
donc si NNT est de 6.7= il faut traiter 6.7 patient pour en guérir 1

Il indique combien de patients doivent être traités pour qu’un seul patient bénéficie d’un effet positif spécifique du traitement.

27
Q

Quels sont les deux catégories des statistiques inférentielles?

A
  • test de différences (exemple test-t et ANOVAS)
  • tests de relation (Spearman, Pearson, régression)
28
Q

courte description du T-tests?

A

▪ Compare des groupes indépendants (T-Test indépendant, 2 échantillons)
▪ À un point dans le temps, une variable à la fois.

▪ Compare un groupe dépendant (T-Test dépendant, 1 échantillon)
▪ À plusieurs points dans le temps.

29
Q

courte description des anovas?

A

▪ ANalysis Of VAriance
▪ Compare la différence entre 3 groupes ou plus (anova simple). ▪ Utilise une seule variable dépendante (anova simple)

▪ Compare la différence à 3 moments ou plus (anova mesures répétées).
▪ Utilise généralement une seule variable dépendante

Exemple :
Imaginons que tu veuilles savoir si trois différents types de régimes alimentaires affectent la perte de poids. Tu as trois groupes de participants :
* Groupe 1 : Régime A
* Groupe 2 : Régime B
* Groupe 3 : Régime C
Hypothèse :
* Hypothèse nulle (H₀) : Il n’y a pas de différence de perte de poids entre les trois régimes (les moyennes de perte de poids sont égales).
* Hypothèse alternative (H₁) : Il y a une différence de perte de poids entre au moins deux des trois régimes.
Étapes avec l’ANOVA :
1. On mesure la perte de poids pour chaque participant dans chaque groupe.
2. L’ANOVA compare la variance entre les groupes (différences de perte de poids entre les régimes) et la variance à l’intérieur de chaque groupe (différences individuelles au sein du même régime).
3. Si la variance entre les groupes est beaucoup plus grande que celle à l’intérieur des groupes, l’ANOVA conclut que les régimes ont des effets différents.

30
Q

que permet une analyse de covariance?

A

▪ Aide à contrôler une COvariable pouvant affecter le résultat.
▪ Souvent utilisé pour des variables démographiques.

Exemple :
Imaginons que tu veux tester l’impact de trois régimes alimentaires (A, B et C) sur la perte de poids. Cependant, tu sais que l’âge des participants peut aussi influencer la perte de poids, donc tu veux ajuster cette variable (âge) dans ton analyse.

ANOVA seule : Comparerait simplement la perte de poids entre les trois groupes sans prendre en compte l’âge.
ANCOVA : Ajusterait les résultats de perte de poids pour l’âge et comparerait ensuite les moyennes de perte de poids entre les groupes de manière plus précise.

31
Q

quelle est la différence entre la corrélation de Pearson et de spearman?

A

Pearson: variable continu
Spearman: non paramétrique du PCC et variable ordinées

Exemple Pearson :
Si tu mesures la taille et le poids de personnes, et que les deux variables suivent une relation linéaire (plus une personne est grande, plus elle est lourde), la corrélation de Pearson serait appropriée.

Exemple Spearman :
Si tu classe des étudiants en fonction de leur performance (très bonne, bonne, moyenne, faible) et que tu veux mesurer la relation entre leur âge et leur performance (sans supposer que cette relation est linéaire), la corrélation de Spearman serait plus appropriée.

32
Q

que vise l’analyse de régression linéaire?

A

▪ Vise à estimer, expliquer ou prédire la contribution d’un (OU plusieurs) facteurS à la variance d’un phénomène.
▪ Utilisée pour les variables continues.

Exemple :
Imaginons que tu veux savoir si le temps d’étude (X) affecte les résultats à un examen (Y).

X (indépendante) : Temps d’étude (en heures)
Y (dépendante) : Score à l’examen (sur 100)
En collectant les données (par exemple, le temps d’étude et le score de chaque étudiant), la régression linéaire te permet de trouver l’équation de la droite qui prédit le score en fonction du temps d’étude.

33
Q

que vise l’analyse de régression logistique?

A

▪ Vise à estimer, expliquer ou prédire la contribution d’un (OU plusieurs) facteurS à la variance d’un phénomène.
▪ Utilisée pour les variables dichotomiques.

34
Q

Quelle mesure permet de représenter l’étendue d’une distribution?

A

écart-type

Exemple :
Imaginons deux distributions de scores d’examen :
Distribution A : {50, 55, 52, 53, 51}
Distribution B : {30, 70, 45, 80, 60}
Les deux distributions ont la même moyenne (52), mais l’écart type de la distribution B sera beaucoup plus grand, car les valeurs sont beaucoup plus éloignées de la moyenne. Cela signifie que la dispersions des scores dans B est plus large, et donc l’étendue de la distribution B est plus grande que celle de A.

35
Q

la corrélation de spearman est utiliser pour quoi?

A

des variables ordinées

36
Q

si plusieurs patients doivent être traités pour obtenir un succès thérapeutique additionnel qu’arrivera-t-il au NNT?

A

il sera très élevé

37
Q

de quoi parle-t-on? la taille de la différence entre deux intervention, en absolu?

A

la taille d’effet