Analyse des données quantitatives Flashcards
Que comprend la partie “description de l’analyse des données quantitatives” ?
- Détermine les analyses statistiques;
-Statistiques descriptives
-Statistiques inférentielles
-Logiciels utilisés
Statistiques descriptives
- Analyse de fréquences
- Mesures de tendance centrale
- Mesure de dispersion
- Mesure de forme
- Logiciel SPSS
Types de variables
Nominale catégorielle:
* Comprend des catégories qui ne suivent pas un ordre naturel
* Dichotomique (binaire)
* Non-paramétrique
* Types d’analyses;
-Mode
-Distribution de fréquences
-Pourcentage
-Corrélation de contingence
Ordinale catégorielle:
* Catégories classées par rang ou par ordre de grandeur
* Paramétrique ou non-paramétrique
* Types d’analyses;
-Mode
-Médiane
-Distribution de fréquences
-Pourcentage
-Corrélation de contingence
Intervalle continue:
* Distance égale entre les nombres
* Zéro arbitraire
* Paramétrique
* Types d’analyse;
-Mode, médianne, moyenne
Proportion continue:
* Intervalles égaux entre les unités
* Zéro absolu
* Paramétrique
* Types d’analyses;
-Mode, médiane, moyenne
Quels sont les deux types d’analyses?
Descriptives:
* Décrire les caractéristiques de l’échantillon et répondre aux questions
* Structurer et représenter l’information contenue dans les données
Inférentielles:
* Estimer des paramètres et vérifier des hypothèses (loi des probabilités)
* Généraliser les données
Mesures de tendance centrale
Mode:
* La valeur la plus fréquente dans une distribution de fréquences
* Modale, bimodale, multimodale
Médiane:
* Correspond au point milieu de la distribution des fréquences
* Valeurs extrêmes
* 50e percentile
Moyenne:
* Somme des scores individuels divisée par le nombre
* Valeurs extrêmes et petits échantillons
Mesures de dispersion
Étandue:
* Différence entre la valeur la plus élevée et la plus basse
Variance:
* Moyenne des carrés des écarts données par rapport à la moyenne de la distribution
* Utile pour comparer un échantillon à un autre
* Pas d’unité de valeur
Écart-type:
* Tient compte de la distance entre chacun des scores d’une distribution par rapport à la moyenne du groupe
* Racine carrée de la variance
* Pas d’unité de valeur
La distribution normale
- Bidirectionnelle/infini
- Symétrique/ μ tenant compte des σ
- Total de 1
- A priori pour analyses paramétriques;
-Skewness (permet de voir à quel point la courbe peut tirer d’un côté ou de l’autre)
-Kurtosis (À quel point la courbe a un pic, ou bien est applatie)
Quels tests utiliser pour vérifier des hypothèses?
Pour déterminer différence entre groupes:
* Deux groupes:
-Variables continues: Test t
-Variables catégorielles: Khi2
- 3 groupes +: ANOVA (analysis of variance)
Pour déterminer le degré de relations entre les variables:
* Deux scores:
-Variables continues: Corrélation Pearson (entre -1 et +1)
-Variables catégorielles: Corrélation Spearman ou Phi
* Plus de deux scores:
-ANOVA à mesures répétées
Quelles sont les 3 étapes importantes en analyse quantitative pour choisir un test?
- Identifier les variables dépendante et indépendante
- Déterminer le type de variables (catégorielles, continues)
- Choisir le bon test
Quels sont les logiciels d’analyse de données quantitatives? À quoi servent-ils?
- Excel
- SPSS
- SAS
–>Types d’analyses:
-Descriptives/analytiques
-Bivariées/multivariées
–>Représentations graphiques
–>Programmation
Comment présenter des résultats quantitatifs?
- Questions/hypothèses
-
Texte:
-Description objective
-Choix -
Tableaux:
-Regroupement
-Signification - Éviter les répétitions
- Le premier tableau dans une étude est généralement un tableau descriptif, dans lequel on présente les différentes variables à l’étude, nommer le nombre de personnes dans chaque catégorie et les pourcentages
La signification des résultats
Significatif:
* Rejet de Ho
* p<0,05
* Erreur de type 1 possible
* Vérification validité interne et externe
Non-significatif:
* Non rejet de Ho
* p>0,05
* Erreur de type 2 possible
* Vérification validité interne
Mixtes ou contradictoires:
* Contexte d’hypothèses multiples
* Types de mesure, fidélité, validité
Significative, mais non prédits:
*Résultats inattendus, au-delà des hypothèses modèles
Signification statistique vs clinique
Signification statistique:
* Déterminer si différence ou relation
* Rejet de Ho
* Seuil de signification: p<0,05 ou 0,01
Signification clinique:
* Utilisée pour la pratique professionnelle ou l’avancement des connaissances d’une discipline
* Lorsque les résultats sont à la limite d’être significatifs (ex: p=0,06)
* Significatifs d’un point de vue clinique ; permettent d’avancer les connaissances
Interprétation de l’analyse statistique
- Synthèse et mise en lien de la recension;
-Nouveautés
-Similarités
-Différences - Forces et faiblesses
- Généralisation des résultats (validité externe)
- Recommendations pour recherches futures
- Implications pour la pratique professionnelle ou plan politique
Quelles sont les différentes choses à regarder quand on fait une analyse inférentielle?
- Tableaux croisés
- Hypothèse
- Mesures d’association
- Logiciel spss
- Graphique
Les tableaux croisés
- Analyse des données en fonction de deux variables (parfois plus)
- Variable indépendante vs variable dépendante
- Comparaison des différences entre deux (ou plus) catégories de la variable indépendante
Formulation de l’hypothèse
H0 (hypothèse nulle): Il n’existe pas de différence entre les femmes qui ont des implants mammaires et les femmes qui n’en ont pas par rapport au risque de cancer du sein à un stade avancé
H1 (hypothèse alternative): Il existe une différence entre les femmes qui ont des implants mammaires et les femmes qui n’en ont pas par rapport au risque de cancer du sein
Qu’est-ce qu’une mesure d’association?
- Le mot “associé” réfère à deux mesures principales;
-Risque relatif (RR)
-Rapport de cotes (RC)
Vrai ou faux? Dans une étude de cohorte, une des méthode d’analyse de données souvent utilisée est un tableau croisé
Vrai
Qu’est-ce que le risque absolu?
- Proportion de personnes avec un résultat positif (dans les gens exposés et non-exposés)
Risque absolu É: Proportion du groupe exposé avec le résultat (a÷ (a+b))
Risque absolu NÉ: Proportion du groupe non-exposé avec le résultat (c÷(c+d)
Qu’est-ce que le risque relatif?
- Rapport des risques abolus dans les deux groupes (éxposés et non-éxposés)
RR=RAé÷RAné
Ex: RR=0,75/0,10=7,5
Les gens exposés ont 7,5x plus de risque que ceux non-exposés
- Indice utile en santé publique et santé des populations
- Moyen simple et rapide de savoir si l’exposition et les résultats sont liés
- Peut avoir un risque + ou -
- Utilisé dans les études expérimentales ou de cohorte (quand on veut comparer des groupes exposés et non-exposés)
Rapport de cote
- La cote est la proportion de personnes dans chaque groupe à risque qui ont l’issue défavorable, par rapport à la proportion de ceux qui ont l’issue favorable
- Dans un tableau de contingence;
-Cote des é: A÷B
-Cote des né: C÷D - L’odds ration (OR ou RC) est le rapport entre les deux cotes
- Utilisé en étude cas-témoins
OR = ORé÷ORné
OU
OR=AxD ÷ BxC
- Ex: OR=2,25
Les chances sont 2,5x plus grandes pour le gorupe A/B que C/D
Vrai ou faux? RR s’agit d’une estimation de RC
Faux. RC est une estimation de RR
Vrai ou faux? les épidémiologistes préfèrent généralement RR
Vrai. Il permet mieux d’exprimer le risque