Cours 9 Flashcards
Mesure =
Processus qui consiste en l’attribution de chiffres pour décrire des caractéristiques
On utilise une mesure soit pour :
pour décrire des attribut ou une quantité
Attribut =
le chiffre est un code, pas une valeur (ex. niveau socioéconomique, OS)
Quantité =
un nombre décrit la valeur de la caractéristique (ex. âge, score de bien-être)
La mesure permet :
une caractérisation stable et favorise ainsi la comparaison (avec d’autres temps de mesure ou d’autres études)
Mesure - Opérationnalisation :
processus qui permet de mesurer un concept / construit.
Mesure - nominale :
catégories sans ordre particulier (ex. genre, statut de séropositivité)
Mesure - ordinales :
catégories dont l’ordre reflète une certaine progression (ex. niveau d’accord/désaccord)
Mesure - cardinales :
échelles d’intervalle ou de proportion
intervalle : la valeur 0 est arbitraire
proportion : la valeur 0 est absolue (indique l’absence)
L’erreur de mesure =
écart entre la mesure et la réalité
Mesure - aléatoire
attribuable à des facteurs dont la variation n’est pas structurée
Mesure - systématique :
attribuable à des facteurs dont l’effet sur la
mesure est structuré ou uniforme
L’erreur systématique peut être le reflet de problèmes avec :
La validité ou la fidélité d’un instrument de mesure
Mesure - fidélité :
capacité d’un instrument de mesure à reproduire le
même résultat (sur la même personne dans le même contexte).
Mesure - validité :
l’instrument mesure bien le concept qu’il doit mesurer; il produira en moyenne une mesure représentative de la réalité.
Mesure - Fidélité temporelle (test-retest) :
stabilité d’une mesure faite sur la même personne, mais à des moments différents
Mesure - Fidélité des formes parallèles :
stabilité de la mesure d’un
concept à partir d’instruments différents
Mesure - Fidélité interjuges :
stabilité des classifications ou des scores
attribués par des intervieweurs ou des évaluateurs
Pour évaluer la fidélité des formes parallèles, on calculera ?
l’association (corrélation) entre les deux mesures
Pour évaluer la fidélité temporelle ou la fidélité interjuges:
- proportion d’accords observés
- statistique de Kappa (κ) qui décrit l’accord en tenant compte du niveau d’accord pouvant être obtenu par la chance
Kappa (κ) : à partir de combien on est dans le degré d’accord parfait ? et en dessous de combien on hésite à l’utiliser ?
80 : accord parfait
75 : hésite
Mesure - Cohérence interne (homogénéité) :
à l’intérieur de l’instrument chaque dimension est cohérente avec les autres
pour évaluer la cohérence interne, on utilise ?
alpha de Cronbach (α)
Mesure - Validité de construit :
lien entre le construit et la mesure
Mesure - Validité de contenu:
la capacité d’un instrument à couvrir l’étendue d’un
concept
Mesure -
Validité de critère:
comparer la mesure avec une autre mesure
qui est considérée comme étant une référence (un critère)
L’échantillonnage probabiliste a l’avantage de ?
permettre le recours aux probabilités et lois statistiques pour guider l’inférence.
Population =
Paramètre
échantillon =
statistique
Pourquoi utiliser un échantillon ?
lorsqu’il est impossible d’analyser l’ensemble de la population
Échantillon - son utilité dépend de sa représentativité qui varie selon :
- mode de collecte
- taille (p/r hétérogénéité)
- effet à détecter
Si on répétait l’échantillonnage, on obtiendrait :
différents échantillons
Si on avait différents échantillons, on pourrait avoir :
différentes statistiques (mesures de tendance centrale, de dispersion, …)
On s’appuie sur quoi pour estimer la variabilité
théorique des statistiques issues de notre échantillon ?
des lois de probabilités
Erreur-type :
écart-type de la moyenne d’échantillonnage
Fréquence:
nombres d’observations associées à une valeur ou catégorie
Fréquence cumulée:
On utilise la fréquence cumulée pour déterminer le nombre d’observations qui se situent au-dessus (ou au-dessous) d’une valeur particulière dans un ensemble de données.
Proportion : Utile pour comparer ?
les distributions de populations de tailles différentes
Rapport (ratio):
relation entre deux quantités qu’on veut comparer
Proportion:
les deux quantités sont liées
numérateur est un sous-ensemble du dénominateur
Taux:
processus dynamique, on observe un changement dans le temps
Boîte à moustaches (ou diagramme en boîte, box plot) :
Représentation graphique d’une distribution qui intègre différentes mesures
Les diagrammes à moustache facilitent :
la comparaison des
populations
Tendance centrale :
ce qui est typique de la population
ce qui se passe «en moyenne»
Mesures de tendance centrale - Différentes mesures :
Moyenne
Moyenne pondérée
Médiane
Mode
Qui suis-je ?
Mesure de tendance centrale la plus connue.
Moyenne
Comment calculer une moyenne ?
Somme des observations divisée par le nombre d’observations
Qui suis-je ?
Toutes les observations n’ont pas le même
poids.
Moyenne pondérée
Qu’est ce qui permet de modifier la contribution relative des observations ?
Moyenne pondérée
Qui suis-je ?
Sépare la distribution en deux groupes égaux (50%)
Médiane
médiane = moins affectée que … par les valeurs extrêmes
la moyenne
Qui suis-je ?
Catégorie ou valeur ayant la fréquence la plus élevée
Mode
Quelle mesure de tendance centrale est approprié pour les variables nominales et ordinales ?
Le mode
Mesures de dispersion - variabilité peut être décrite de différentes façons:
- Étendue
- Écart moyen
- Variance
- Écart-type
- Coefficient de variation
Qui suis-je ?
Différence entre les valeurs minimale et maximale de la distribution.
étendue
Quelles est le façon la plus simple de décrire la variabilité.
Calculer l’étendue
Qui suis-je ?
Décrit comment chacune des observations
est éloignée de la moyenne
écart moyen
A qui cela fait-il référence ?
Pour des raisons mathématiques, les valeurs absolues ne sont pas idéales.
Variance
Qui suis-je ?
La racine carrée de la variance
écart type
Qui suis-je ?
Exprime la variabilité relativement à la moyenne
Coefficient de variation
Plus le coefficient de variation est petit, plus :
les valeurs de la distribution tendent à être proches de la moyenne.
On qualifiera une distribution en fonction de :
son écart par rapport à la distribution normale.
On décrit l’écart d’une distribution selon 2 dimensions :
l’asymétrie et l’aplatissement.
Forme de la distribution : aplatit / étroit
Négatif ? Positif ?
négatif quand très applatit
positif quand plus étroit
Quelle mesure de tendance centrale utilisé avec : une variable nominale ?
Mode
Quelle mesure de tendance centrale utilisé avec : une variable ordinale ?
Mode / médiane
Quelle mesure de tendance centrale utilisé avec : une variable cardinale ?
SI forme de la distribution est asymétrique : mode et médiane
SI forme de la distribution est symétrique : mode, médiane, moyenne
Mode - particularité :
- Non influencé par les valeurs extrêmes
- Ne permet pas d’opérations mathématiques
Médiane - particularité :
- Ne tient pas compte de la valeur numérique de
toutes les observations - Sépare une distribution en deux groupes de même
taille
Moyenne - particularité :
- La valeur de toutes les observations sont prises en
compte - Mesure de tendance centrale la plus stable
- Est influencée par les valeurs extrêmes