Final Flashcards
Qu’est-ce que la fiabilité ou fidélité d’une mesure?
La reproductibilité des scores obtenus par les mêmes personnes lorsqu’on leur administre la même mesure plusieurs fois ou sous des conditions d’administration variables.
Quel est le concept fondamental sur lequel repose la fidélité?
L’erreur de mesure, c’est-à-dire les fluctuations du score dues à des facteurs non pertinents et aléatoires.
Comment est calculé le score observé?
Score observé = Score vrai + Erreur de mesure.
Qu’est-ce que le coefficient de fidélité? (2)
La corrélation entre deux séries indépendantes de scores observés, interprétée comme le pourcentage de la variance des scores vrais.
(1 - r) représente le pourcentage de la variance d’erreur.
Qu’est-ce que la fidélité par test-retest?
Administration de la même mesure aux mêmes sujets après un certain intervalle de temps pour évaluer la stabilité des scores.
Quels sont les facteurs d’erreur dans la fidélité par test-retest?
- Conditions de mesure (ex: bruit)
- Caractéristiques des sujets (ex: anxiété)
Quel est le postulat important de la fidélité par test-retest?
La caractéristique mesurée doit être stable à l’intérieur de l’intervalle de temps considéré.
Qu’est-ce que la fidélité par versions parallèles?
Technique consistant à administrer deux versions d’une même mesure aux mêmes sujets pour évaluer la cohérence des scores.
Quels sont les difficultés de la fidélité par versions parallèles? (2)
Construction de deux mesures vraiment équivalentes (échantillonnage particulier)
Sensibilité à l’effet de pratique (intervalle de temps non nul)
Qu’est-ce que la fidélité par bissection?
Technique qui consiste à diviser un test en deux parties équivalentes pour calculer des sous-scores et évaluer la cohérence interne.
Cela aide à estimer la fidélité d’un demi-test.
Quel est le coefficient de fidélité utilisé dans la fidélité par bissection?
Formule de Spearman Brown
Permet corriger coefficient de cohérence pour tenir compte du raccourcissement d’un test ou facteur d’allongement
Qu’est-ce que l’homogénéité en termes de fidélité?
Degré de cohérence entre les différentes observations (items) d’une mesure.
Comment évaluer la fidélité inter-correcteurs?
En calculant la corrélation entre les scores attribués par au moins deux correcteurs ou examinateurs.
Qu’est-ce que la validité d’une mesure? (2)
Degré avec lequel une mesure évalue ce qu’elle est supposée mesurer et avec quel degré de précision
Quels sont les trois types de validation d’une mesure?
- Validation de contenu (pertinence et couverture du contenu)
- Validation de construit (cohérence avec structure théorique)
- Validation critériée ou pragmatique (relation avec un critère externe)
Chacune de ces méthodes a pour but d’évaluer différents aspects de la validité.
Qu’est-ce que la validation de contenu?
Analyse du contenu d’une mesure pour s’assurer qu’elle est représentative du domaine de comportements à mesurer.
Cela implique d’évaluer la pertinence et la couverture des contenus mesurés.
Quels sont les deux aspects de la représentativité en validation de contenu?
- Pertinence de chaque observation par rapport à l’univers mesuré
- Couverture de tous les aspects de l’univers mesuré
Quelle est la procédure de validation de contenu?
- Détermination des utilisations prévues (buts et clientèle)
- Définition de ce que l’on souhaite mesurer
- Création des observations
- Évaluation des observations (confirmer représentativité avec experts)
Qu’est-ce qu’on doit faire vu que le point de départ d’une mesure est vague?
Déterminer portée de la construction mentale (Construit hypothétique)
Étendue du domaine mesuré (comportements)
Plus d’explication sur l’évaluation des observations (4)
Validation par experts
Mise à l’essai des observations (tester avec un échantillon)
Analyse quantitative des observations sur la clarté et signification des observations (collecte avis de ces participants)
Sélection finale d’observations adéquates
Qu’est-ce qui guide l’élaboration du plan de la structure de la mesure?
La théorie pour les construits mentaux ou une analyse de contenu pour les comportements.
Quels sont les éléments à déterminer lors de la création des observations?
Le format, le niveau de difficulté et le nombre d’observations, on passe ensuite à la première rédaction
Qu’est-ce que la validation critériée?
Une méthode qui calcule la corrélation entre le résultat à la mesure et un critère externe.
Quels types de validation critériée existent?
- Validation concomitante
- Validation prédictive
Quand utilise-t-on la validation concomitante? (2)
Administration de la mesure et mesure du critère en même temps
Lorsque la mesure à valider est utilisée pour un diagnostic.
Quand utilise-t-on la validation prédictive?
Administration de la mesure précède mesure du critère
Lorsque la mesure à valider sert à prédire un état futur.
Quels types de critères sont considérés lors de l’analyse de la validité pour aptitudes?
- Performance académique (mesure validité test qui mesure aptitudes spécifiques)
- Performance à un cours spécialisé (mesure validité test qui mesure aptitudes spécifiques)
- Rendement au travail (même fins + standardisation plus difficile, car différence d’un lieu de travail à un autre)
Qu’est-ce qu’un groupe contrasté dans le contexte des critères composites?
Comparaison entre deux groupes ayant des caractéristiques distinctes, comme des élèves de conservatoire et d’autres disciplines.
Souvent utilisé pour valider tests de personnalité
Qu’est-ce que la validité de construit?
Un ENSEMBLE de méthodes visant à établir jusqu’à quel point une mesure est adéquate pour un construit théorique.
Quel est le but principal de la validation de construit?
Montrer la correspondance entre la théorie et les faits qu’elle prédit
Donc implique qualité de la mesure ET qualité de la construction théorique
Quels types de corrélations sont calculés pour appuyer la validité de construit + 2 buts?
Corrélation entre les scores obtenus à cette mesure vs d’autres mesures
Buts:
-Montrer présence de corrélation entre mesures qui sont senser mesurer la même chose
-Absence de corrélation entre mesures qui sont senser mesurer des construits indépendants
Qu’est-ce que la validation convergente?
Démontrer des corrélations élevées entre une mesure et d’autres variables théoriquement liées.
Qu’est-ce que la validation discriminante?
Trouver des corrélations nulles ou faibles avec d’autres variables non liées.
Comment sont exprimés les coefficients de validité?
Sous forme de coefficients de corrélation
Quels facteurs peuvent influencer le degré de validité d’une mesure?
Les spécificités de l’échantillon de validation
DONC il faudrait tujours avoir une description détaillée de l’échantillon
Pourquoi faut-il décrire le groupe lors de la présentation d’un coefficient de validité?
Pour contextualiser la validité par rapport à la population comparée
AINSI le coefficient peut seulement être appliqué au population qui ressemble à l’échantillon
Fiabilité est mesuré à partir de quel groupe
Groupe représentatif appelé échantillon de normalisation ou de validation
Ex. Facteurs non pertinents
Anxiété dans test d’intelligence
Divers types de fidélité (5)
Stabilité (fidélité par test-retest)
Équivalence
Cohérence interne
Homogénéité
Fidélité inter-correcteurs
Qu’est ce que le coefficient de fidélité dans la stabilité et équivalence
Corrélation entre les scores obtenus à chacune des mesures
Qu’est ce qu’indique la stabilité d’une mesure
À quel point on peut généraliser les résultats d’une mesure à diverses occasions
Habituellement, la corrélation test-retest… à mesure que l’intervalle de temps…
+ temps à ne pas dépasser
Diminue
Augmente
(Moins en moins stable plus que le temps passe)
On ne devrait pas dépasser 6 mois
Difficultés avec stabilité
Apprentissage peut modifier performance
Donc rarement utilisé sauf si mesure est peu sensible à l’effet de répétition
Plus un test a des questions, plus il a de chance à être …
Fidèle
Minimum 10 questions
Quoi faire si on juge que fidélité est insatisfaisante + coefficient de fidélité satisfaisant
Formule prophétique de Spearman-Brown pour savoir combien de questions ajouter
Sources d’erreur équivalence
Même que stabilité si intervalle de temps non nul
Échantillonnage particulier
Sources d’erreur cohérence interne
Échantillons particuliers des items qui servent à calculer chaque sous-score
C’est quoi la cohérence interne d’un test
Scores fournis sont indépendants du contenu spécifique des items qui composent le test
(Résultat ne sont pas dû aux questions choisis)
Méthode courante de bissection
Items pairs vs impairs
Plus un test est long, plus il sera
Fidèle
La corrélation entre 2 sous-scores estime quoi
la fidélité d’un demi-test seulement
Coefficient de fidélité homogénéité
Coefficient alpha (alpha de Cronbach)
Sources d’erreur homogénéité (2)
Échantillon particulier des observations (caractéristiques de l’échantillon)
Hétérogénéité des observations (incohérence dans items)
Mieux quand homogène
Si la caractéristique à mesurer est hétérogène quoi faire
Faire plusieurs sous tests homogènes
Comment calculer homogénéité si score sont dichotomiques
Coefficient de Kuder-Richardson (coefficient KR-20)
Pourquoi examinateur engendrait erreur
Consignes ou grilles de correction peu précises
Qu’est ce que la fidélité inter-correcteurs
Score obtenu ne dépend pas de la personne qui corrige
Quel coefficient utilisé pour fidélité inter-correcteurs (5)
2 correcteurs:
Corrélation de Pearson
+ 2 correcteurs:
Coefficient de corrélation interclasse (CCI)
Pas échelle continue:
Indice Kappa
2 correcteurs:
K de Cohen
+ 2 correcteurs:
K de Fleiss
Une mesure n’est jamais
valide
C’est son utilisation spécifique qui l’est
La validité d’une mesure est en général….
la pertinence des inférences que l’on tire des résultats fournis par la mesure
Validité apparente vs validité de contenu
Apparente:
-Ce que la mesure semble mesurer
-Peut augmenter celle-ci en modifiant observations pour sembler plus pertinentes pour les examinés
De contenu:
-Ce qu’elle mesure réellement
Validation critériée s’applique à quel cas
Existe une mesure indépendante et directe de la caractéristique que la mesure est supposée mesurer
La méthode de validation critérié présuppose quoi
L’existence du critère
DONC ne mesure pas un construit purement théorique, prédit plutôt où ce situe l’examiné par rapport à ce critère
Que fait-on lorsque l’intervalle de temps entre l’administration de la mesure et la mesure du critère est trop long dans la validité critériée
On fait la validation concomitante en comparant performance d’échantillons pré-sélectionnés
Diagnostic psychiatrique
Établir la validité de certains tests de personnalité
Jugement appréciatifs (3)
Servent surtout à valider tests de personnalité
Appréciations de l’entourage sont l’un des meilleurs critères
Comme diagnostic psychiatrique mais les experts sont l’entourage
Liens avec les tests existants (2)
Lorsqu’on élabore un nouveau test pour remplacer l’ancien
On utilise l’ancien pour établir la validité du nouveau test (recoupement avec validation de construit)
Conditions pour validité de construit (2)
Définition claire et explicite du construit qu’on prétend mesurer
Car ancrée dans un réseau d’explications et de justifications théoriques
Certains auteurs considèrent les coefficients d’homogénéité comme des indices de la validité… (2)
construit
Mais indices très indirects et peu informatifs pour validité construit car ce sont des indices de cohérence de la mesure
Types et méthodes pour fidélité (5)
Stabilité = fidélité par test-retest
Équivalence = fidélité par version parallèle
Cohérence interne = fidélité par bissection
Homogénéité = fidélité par cohérence inter-items
Fidélité inter-correcteurs
Validation de construit vs contenu vs critériée
Contenu:
Vérifie que le test couvre bien tout le domaine mesuré.
Construit:
Vérifie que le test mesure bien le construit théorique
Critériée:
Vérifie que le test prédit ou reflète un critère concret.
Différence entre ces concepts : Stabilité, Équivalence, Cohérence interne, Homogénéité et Fidélité inter-correcteurs
Stabilité : Mesure la consistance des résultats dans le temps.
Équivalence : Mesure la consistance entre différentes versions d’un test.
Cohérence interne : Mesure si les items d’un test mesurent le même construit.
Homogénéité : Mesure si les items mesurent un seul construit sans sous-dimensions.
Fidélité inter-correcteurs : Mesure l’accord entre les correcteurs.
Erreur alpha ou bêta plus important?
Alpha
Est ce qu’on a un critère objectif pour juger si un échantillon est bien représentatif d’une population
Non, on peut juste juger la qualité du procédé
2 grands types d’échantillonnage
Procédés d’échantillonnage probabiliste ou aléatoire
Procédés d’échantillonnage non probabiliste ou empirique (+ utilisé en sciences humaines)
Caractéristiques procédés d’échantillonnage probabiliste ou aléatoire
Choisir participants aléatoire
Multiplier suffisamment le nbre pour que le hasard puisse effectivement jouer son rôle
Très contraignant, il faut une base de sondage (liste exhaustive)
Solution possible = RDT
Pourquoi multiplier suffisamment le nbre pour que le hasard puisse effectivement jouer son rôle
Réduire risques de distorsion potentielle par rapport à la population
Échantillonnage aléatoire simple (2)
Chacune des unités dans la population ont une chance égale de faire partie de l’échantillon
Précède par tirage systématique
(détermine la taille désirée et on fixe l’intervalle)
Échantillonnage stratifié, c’est quoi
Divise la population en sous-population ou strates en fct d’un critère
Puis, constitue échantillon aléatoire pour chaque strate à partir de base de sondage
Pourquoi emploie-t-on l’Échantillonnage stratifié
Pour contrôler les variables parasites
Atteinte d’une précision avec un échantillon inférieure à celui d’un échantillon aléatoire simple
CAR population en strate plus homogène peut réduire variance de l’estimateur (jusqu’à 6 strates)
Pas obligé d’avoir un échantillon stratifié proportionnel
L’augmentation de la taille de l’échantillon représente presque la seule façon de…
Réduire la variance de l’estimateur
Quel méthode on peut utiliser pour augmenter précision de l’échantillon avec l’échantillonnage stratifié
Allocation optimale:
Plus de sujets dans les groupes de plus grande variabilité
Quand utilise-t-on l’échantillonnage par grapes (2)
Très difficile d’identifier chaque élément d’une population
OU
Plus pratique de sélectionner des groupes d’individu que des individus
Très utilisé en psycho
C’est quoi l’échantillonnage par grappes
On sélectionne des groupes d’individus et chacun de ces individus appartient à l’échantillon
Risque erreur échantillonnage par grappes
En fonction du nombre de grappes et leur taille
Pire: 2 grappes de 150 sujets
Meilleur: 10 grappes de 30 sujets
Qu’est ce qu’on recherche dans l’échantillonnage par grappes
Plus de variabilité possible entre les grappes contrairement au échantillonnage stratifié
C’est quoi l’échantillonnage à plusieurs degrés
Prélever de façon aléatoire dans chaque groupe sélectionné plutôt que d’inclure tout le monde dans le groupe comme avec l’échantillonnage par grappes
Nombre de degré selon le nombre de fois qu’on prend pas tout le monde
Qu’est ce qu’un procédé d’échantillonnage non probabiliste ou empirique (5)
Permettent pas de déterminer la probabilité qu’un élément soit inclus dans l’échantillon
Assure pas qu’un accroissement de la taille de l’échantillon diminue l’erreur d’échantillonnage
Moins coûteux
Plus adapté aux sciences humaines
Moins sensibles aux imprévus comme (perte de sujets)
Échantillonnage accidentel c’est quoi (3)
Trop souvent utilisé en sciences humaines
Prendre les cas qui se présentent à nous sans qu’il aie un lien avec objet de recherche
Ceux qui ne fréquentent pas l’endroit ont aucune chance d’être choisi
Caractéristiques échantillonnage aléatoire
Représente aucune population définie donc difficile de généraliser les conclusions
Version améliorée de l’échantillonnage accidentel
Échantillonnage dirigé si on a des renseignements sur les lieux comme population gay
Échantillonnage de volontaire, c’est quoi
Faire appel à des volontaires (publicité)
Quand on utilise échantillonnage de volontaire (3)
Pas de base de sondage
Ne peut pas contacter directement les participants pour des raisons éthiques
Ne peut s’accommoder d’un autre type d’échantillon
Désavantage échantillonnage de volontaire
Problème pour la généralisation des résultats, car jamais certains que volontaires ont les mêmes caractéristiques que ceux ayant refusé de participer
Qu’est ce que Sears conseille plutôt pour l’échantillonnage volontaire
Collecter des données en milieu naturel
Échantillonnage par quotas caractéristiques (3)
L’une des formes les plus courantes
Sans base de sondage jusqu’à ce qu’un nombre précis d’unités pour des sous-populations ont été sélectionnés
Peut être fondé sur des proportions de la population mais pas essentiel comme stratifié
Quatre étapes pour échantillonnage par quotas
- Subdivision de la population en sous catégories selon la variable de stratification
- Collecte de statistiques pour chaque sous groupe
- Détermination des quotas à respecter
- Sélection des participants
Différence entre échantillonnage par quotas et stratifié
Stratifié = on sélectionne les unités au hasard
Quotas = interviewer décide
Si échantillonnage quotas n’est pas proportionnel à la population que faire
Pas essentiel que ça soit proportionnel
MAIS
Il faut contrebalancer a posteriori les disproportions lors de l’analyse des résultats
C’est quoi une variable discontinue
Variable nominale (nom), ordinale (1er, 2e) ou qualitative
Avec variable discontinue et temps de mesure
Chi carré de conformité avec variable discontinue
Sans équivalent paramétrique
Deux variables discontinues et un temps
Chi carré d’indépendance
Deux temps de mesure et 2 variables discontinues)
McNemar
C’est quoi une variable continue
Variables à intervalles égaux comme échelle de Likert ou variable de rapport
Test qu’on peut employer avec les variables continues
Tous les tests paramétriques et non paramétriques sauf chi-carré et McNemar
Test si variable normale
Test paramétrique T et ANOVA
Test si variable anormale
Test non-paramétrique si distribution très anormale
Sauf pour T et ANOVA avec asymétrie entre -1 et +1
Asymétrie positive vs négatif
Positive = majorité des scores sont faibles
Négative = majorité ont des scores élevés
Comment tester normalité d’une distribution
Moins de 50 sujets:
Test de Kolmogorov-Smirnov
Plus de 50 sujets:
Test de Shapiro-Wilk
p>0,5 = distribution normale
Test à faire si variance égale
Test paramétrique T et analyses de variance (ANOVA)
Test à faire si variance inégale
Test non paramétrique sauf test T (SPSS fait correction) et ANOVA (avec effectifs des groupes égaux)
Comment l’égalité ou homogénéité des variances est testée
Test de Levene
p>0.5 = variance homogène
Plans de recherche classique avec variable indépendante discontinue et variable dépendante continue (3)
- Plan à Groupes indépendants :
2 groupes de sujet ou plus et mesure une seule fois
Ex: femmes vs hommes et nbre de savons achetés
-Plan à mesures répétées:
Un seul groupe de sujet mesuré plusieurs fois
Ex: Nbre boites achetées avant et après publicité
-Plan combiné:
Combinaison plan à groupes indépendants avec un plan à mesures répétées
Ex: Nbre boites achetées avant et après publicité selon le genre
Deux variables continues choix de tests
Si linéaire et homoscédatique = Corrélation de Pearson
SINON corrélation de Spearman
OU
Régression linéaire simple si linéaire et homoscédastique
PAS d’équivalent non paramétrique
Qu’est ce que contiennent les plans
Variable indépendante ou plus et variable dépendante continue
Si plans à groupes indépendants avec une variable indépendante et 2 niveaux
Test T à groupes indépendants (paramétrique)
Mann-Whitney (non paramétrique)
Plans à groupes indépendants avec Variable indépendante à deux niveaux ou plus
ANOVA simple à groupes indépendants (paramétrique)
Kruskall-Wallis (non paramétrique)
Plans à groupes indépendants Plus d’une variable indépendante
ANOVA factorielle inter-sujets (paramétrique)
Pas d’équivalent non paramétrique
Plans à mesures répétées avec deux mesures (2 temps)
Test T pairé (paramétrique)
Wilcoxon (non paramétrique)
Plans à mesures répétées deux mesures ou plus (deux temps ou plus)
ANOVA simple à mesures répétées (paramétrique)
Friedman (non paramétrique)
Plans à mesures répétées Plus d’une variable indépendante
ANOVA factorielle intra-sujets (paramétrique)
Pas d’équivalent non paramétrique
Plan mixte (Combiné)
ANOVA pour plan combiné (sur SPSS)
Pas d’équivalent non paramétrique
Qu’est ce qui est préférable lorsque nous choisissons la taille de l’échantillon
La taille la plus grande possible, car plus petite est l’erreur d’estimation de l’estimateur (dans les échantillons aléatoires!)
Le test devient plus puissant lorsque…
L’effet existe
Puissance requise dans les échantillons
Maximum de 20% d’erreur bêta soit 80% de puissance
Puissance = 1-erreur bêta
Qu’est ce que la puissance et on assume que c’est quoi à priori
Permet de détecter un effet
Souvent on ne peut pas prévoir l’effet donc on prend un effet moyen
Les tailles d’effet varient selon quoi
Les tests statistiques
Effet moyen pour test T à groupes indépendants que ça soit à échantillon unique ou pairé
0.5
Effet moyen corrélation de Pearson
0.3
Effet moyen chi-carré de conformité
0.3
Effet moyen analyses de variances simples
0.25
Comment calculer le nombre requis de participants PAR groupe
Calcule pour un effet moyen avec une erreur alpha de 0.5 dans un test d’hypothèse bilatéral selon le test statistique employé
Nbre participants test T à groupes indépendants
64 participants pour chaque groupe
Nbre participants corrélation de Pearson
85 pour LE groupe
Nbre de participants pour chi-carré de conformité et d’indépendance
Varient selon le degré de liberté
Produit du nombre de niveau - 1
Ex: (2-1) x (2-1)
Nbre participants pour analyses de variances simples
Varient selon le nbre de groupe
C’est quoi l’analyse des résultats et ces deux objectifs
Vise à établir les faits
1.Vérifier les hypothèses de départ
2.Examiner toute données susceptible de faire progresser les connaissances
Qu’est ce que génère l’analyse des résultats
Hypothèses confirmées ou partiellement confirmés ou infirmées
Facteurs qui limitent ou modulent l’influence des variables à l’étude
Résultats inattendus
Qu’est ce que l’interprétation des résultats
Vise à expliquer les faits, intégrer les informations, à les coordonner et faire surgir des pistes de recherche future
Les explications et les conclusions dépendent de quoi
Du degré de certitude
Résultats ont confirmé ou infirmé les hypothèses, partiellement confirmé ou pas d’hypothèse
Interprétation avec hypothèses confirmées (3)
Peu de problème d’interprétation, car faits anticipés et mesurés concordent
Contexte théorique qui a généré cet hypothèse reçoit un appui
Donc on doit expliquer comment cela contribue au progrès du savoir
De quoi faut-il rester prudent avec une hypothèse confirmée
Possibilité d’erreur de type 1 (rejeter hypothèse nulle alors que vraie)
À cause du choix de participants, instruments de mesures ou plan de recherche
Comment éliminer erreur de type 1
Analyse critique des divers aspects de la recherche pour renforcer validité interne et s’assurer de ne pas avoir d’agents de non-validité
Deux cas de figure des hypothèses partiellement confirmées
1.Résultats n’appuient que certaines hypothèses =
-interprète les hypothèses vraies comme les hypothèses confirmées
-interprète hypothèse fausse comme hypothèse infirmées
- Effets non prévus d’interaction (variable modératrice comme niveau socio-économique)
-Précise une position théorique ou délimite portée réelle
-Difficile à intégrer avec rigueur car explications à posteriori
-Donc interpréter avec nuance
-Proposer stratégies de recherche
Premier cas de figure hypothèses infirmées (4)
Les résultats d’une recherche vont dans le sens attendu, mais l’hypothèse est infirmée (pas statistiquement significatif)
PAR CONTRE, des fois c’est que la variable indépendante n’est pas assez différente des conditions expérimentales pour observer un effet
DONC il faut suggérer une façon pour avoir un changement plus grand (souvent en manipulant la VI)
CE qui augmente la taille de l’Effet
Si variable indépendante n’est pas en cause pour l’hypothèse infirmée
Voir si il y a des erreurs de méthodologies, si oui proposer correctif
OU
Manque de puissance de l’étude (trop grande erreur de type 2 = accepter hypothèse nulle alors que non)
SI c’est ça soit :
-Problème échantillonnage
-Problème à la mesure
Si problème de mesure qui réduit la puissance alors
Mesures pas assez précises pour détecter les vraies différences
DONC il faut augmenter sensibilité de nos mesures
Soit
Choisir items plus liés au variable (augmente validité instrument)
Choisir autre instrument
Si problème échantillonnage qui réduit puissance
Augmenter nombre de participants pour rendre test statistique plus puissant
Modifier choix de participants en choisissant une méthode d’échantillonnage qui tient compte des variables (échantillonnage stratifié)
Augmenter différence entre les groupes ou réduire variance interne des groupes
Comment augmenter la différence entre les groupes ou réduire variance interne des groupes
Variance intergroupe / variance intra groupe
- Augmenter la différence réelle entre les groupes (augmenter le numérateur) en augmentant l’écart entre ceux-ci, ce qui augmentera la taille de la statistique.
Ex: comparer ceux qui ont 90% et ceux qui ont 25% - Réduire la variabilité interne des groupes (diminuer le dénominateur) en choisissant des participants plus homogènes dans chacun des groupes
Ex: prendre les élèves du secondaire plutôt que les Québécois
Second cas de figure pour hypothèses infirmées
Résultats d’une recherche sont à l’opposé de ce qui avait été prédit par l’hypothèse et que celle-ci est par conséquent infirmée
=
Problème majeur de méthodologie
OU
Nécessité de réviser ces hypothèses de recherche
Dans quel contexte on n’a pas d’hypothèse
Recherche dite descriptive sans intention de vérifier des hypothèses
Ou examiner la relation entre 2 variables
Interprétation des résultats si pas d’hypothèse pour recherche descriptive
Tenir compte de la validité externe (validité échantillonnale et écologique)
Attention particulière au choix des participants, car doivent représenter la population
Interprétation des résultats si pas d’hypothèse pour recherche descriptive sur relations entre 2 variables
Porter attention au statut des variables étudiées
Pas trop complexes, pas de mécanisme inconnu= Examiner validité externe
Complexe = examiner aussi validité interne
Si la généralisation des résultats d’une recherche est possible =
Bonne validité externe (validité échantillonnale et écologique)
Validité échantillonnale et menace
Résultats peuvent se généraliser à toute population dont l’échantillon est représentatif = connaître population visée par l’étude et juger des moyens utilisées pour faire l’échantillon
Première menace:
Déficience dans la représentativité de l’échantillon
Selon Neale et Liebert, atteinte à la validité externe quand
Selon le degré d’interaction entre les caractéristiques des participants et les comportements
Interaction = certaines particularités des participants influencent ces comportements (généralisation doit se limiter aux personnes ayant mêmes caractéristiques)
Pas d’interaction = les résultats sont aussi valides pour d’autres personnes n’ayant pas ces caractéristiques
Validité écologique (4)
Résultats obtenus dans un contexte donné s’appliquent à la situation dans laquelle se trouvent habituellement les participants
Peut être risqué de généraliser à d’autres contextes
L’important est la signification que confère le participant à la situation
DONC validité écologique est adéquate si les sujets perçoivent l’environnement dans lequel ils sont examinés comme ayant les propriétés que le chercheur pense être présentes dans cet environnement
Comment écrire un article scientifique (6)
- Résumé
De la théorie, de la méthode et des résultats principaux - Introduction
Recension de la littérature et hypothèses - Méthodologie
Participants, matériel, procédure (plan de recherche, déroulement de l’expérience, consignes) - Résultats
Analyses statistiques employés et présentation des résultats - Discussion
Interprétation et discussion des résultats. Recommandations pour des recherches futures - Références
Selon recommandations des périodiques, universités, etc., qui ont la priorité
Que doit-on regarder lors de l’analyse critique d’un texte scientifique
Analyser sa structure de base
(Ordre de présentations de sections, contenu des sections)
DONC on doit évaluer la qualité d’un article scientifique pour chacune des sections en se basant sur des critères
Erreurs les plus fréquentes dans les articles scientifiques selon Spilker (5)
Intro= description incomplète objectifs, revue littérature too much or not enough
Méthode=Description incomplète et omission d’infos
Résultats= Présente une partie seulement, trop compliquée, cacher données
Discussion = Manque clarté, comparaison avec études favorables seulement
Conclusion = généralisation sans preuve
Qu’est ce qu’un article de synthèse
Fait le point de façon qualitative sur un sujet donné
Recenser les articles sur ce sujet et faire évaluation critique
Pas de statistiques
D’autres formes de publication qui ressemblent à des articles de synthèse mais le sont pas (3)
- Certains éditoriaux avec un sujet et s’appuient sur études originales et représentent position du comité de rédaction
- Consensus d’experts qui représentent pas position du comité de rédaction, conclusions font parfois office de guide de pratique
- Guides pratiques rédigés par des experts qui étudie en ensemble des preuves scientifiques pour faire recommendations à leurs collègues
Avantages et désavantages des articles de synthèse (5)
Avantages :
-Permet de gagner du temps, car fait le tour d’une question de recherche
-Permet avoir accès à des commentaires critiques sur la validité des études
Désavantage:
-Critère choix articles = arbitraires
-Critères de validité = arbitraires
-Auteurs peuvent orienter conclusions dans sens convictions personnelles
Grille Mullrow vs Oxman et Guyatt pour critères d’évaluation des articles de synthèse
Mullrow:
-Présence d’un résumé structuré (résumé) et proposition de pistes de recherche (conclusion)
Oxman et Guyatt:
-Reproductibilité des études et absence d’erreurs systématiques (biais) (Méthode)
-Analyse des résultats divergeant (Résultats)
-Conclusions s’appuyant sur données citées (conclusion)
Qu’est ce qu’une méta analyse
Étude quantitative avec tests statistiques sur un sujet qui cumulent résultats de plusieurs études
Recherche non-expérimentale de type quantitative
Deux grandes classes de méta-analyse
- Combiner les seuils de signification p pour obtenir un seuil de signification globale
Méthode de Stouffer:
Transformer probabilité p en score Z, faire sommation score Z, diviser résultat par racine carrée nbre étude, retransformer en p
Mantel et Haenszel plus populaire avec addition successive des probabilités p
2.Combiner tailles d’effet pour obtenir taille effet globale (méthode Glass plus utilisée)
-Calcul taille effet par corrélation r
0.1 = petit 0.3 = moyen 0.5 = grand
ou différences de moyennes
0.2 = petit 0.5 = moyen 0.8 = grand
Avantages et désavantages méta-analyses (6)
Avantages:
-Permet en cas de résultats différents d’avoir une vue globale
Désavantages :
-Hétérogénéité des études sur les plan des devis de recherche
-Résultats négatifs non publiés
-Tiennent pas compte de la qualité méthodologique des études
-Critère subjectif inclusion études
-Experts ne s’entendent pas sur meilleur test statistique à utiliser
Critères évaluation des méta-analyses (3)
Même qu’articles de synthèse + Eysenck
-Comparabilité des sujets, de la méthode et de la mesure des résultats
-Mention des tests statistiques utilisés
-Méta-analyses effectuées par des experts reconnus dans leur spécialité et familiarisés avec le réseau de la recherche
Règle d’or en déontologie
Évaluer si les bénéfices potentiels de la recherche sont plus grands que les risques pour les participants
Code de déontologie les plus utilisés en recherche au Québec
Trois Conseils de recherche du Canada (IRSC, CRSNG, CRSH)
Deux objectifs principaux des codes de déontologie
- Assurer le bien-être et la protection des individus et des groupes
- Guider la réflexion et le comportement du chercheur pour qu’il prenne les meilleures décisions déontologiques lorsqu’il y a dilemme
Deux grandes perspectives déontologiques
Recherche avec des animaux
Recherche avec des participants humains (traité dans le code des trois conseils de recherche du Canada)
Trois situations particulières où recherche avec animaux est autorisé en psycho.
- Permettent une meilleure compréhension du comportement
- Aident à mieux comprendre l’espèce animale à l’étude
- Comme conséquence d’améliorer le bien-être des humains ou des animaux
Divers principes déontologiques liés aux animaux de laboratoire (4)
-Traiter humainement les animaux
-Responsable de leur confort et santé
-Doit tout faire pour diminuer inconfort, douleur, infection et maladie
-Ne peut utiliser des animaux pour enseignement si administre traitements douloureux ou enseigner technique de chirurgie
Quand est ce que l’utilisation de méthode invasive avec des animaux provoquant stress, douleur et privation
En l’absence de d’autres méthodes et si valeur prospective le justifie
4 notions éthiques avec participants humains
Consentement
Respect
Duperie
Risques de la recherche
Qu’est ce que le chercheur doit obtenir avant l’expérimentation
Consentement ou l’accord des participants
Quels sont les deux aspects du consentement
Capacité légale d’accepter ou non l’expérimentation (consentement libre)
Mis au courant de la nature, des risques et avantages (consentement éclairé)
Aspects du consentement libre (4)
-Libre de prendre part ou non
-Peut en tout temps se retirer de l’expérience
-Rémunération n’influence pas le consentement, compensation non excessive
-Si population qui ne peut pas donner leur consentement = consentement tuteur ou parent (enfants, handicapées, perte autonomie)
Qu’est ce que le consentement éclairé (2)
S’engager à fournir toutes les informations pour prendre décision dans un langage simple et compréhensible
Infos fourni verbalement et écrit dans un formulaire de consentement signé par chercheur et participant
Infos qui doivent être donnés (6)
-Objectifs du projet
-Méthodes et techniques employées
-Avantages et risques inhérents
-Confidentialité résultats et anonymat participants
-Liberté de retrait de l’expérimentation en tout temps
-Coordonnées du chercheur pour questions ou plaintes
Cas où pas nécessaire d’avoir consentement libre et éclairé (2)
-Renseignements anonymes consignés dans banques de données
-Observation des comportements des gens dans un lieu public sans chercheur intervienne
Aspects du respect (9)
-Chercheur conscient du déséquilibre des forces en sa faveur, utilise pas pour exploiter ou tromper
-Respecter ses engagements (à l’heure)
-Explications claires
-S’inquiète conséquences possibles
-Pas de propos désobligeants
-Traite pas comme objet
-Promouvoir autodétermination, autonomie
-Consentement libre et éclairé
-Droit valeurs et attitudes différentes des nôtres
Quand a-t-il un manque d’intimité (3)
-Intrusion dans la personnalité ou vie privée des gens sans les informer
-Caractéristiques personnelles explorés à leur insu
-Vie privée est examinée sans leur consentement
Déf. duperie
Dissimuler renseignements essentiels ou induire délibérément en erreur quant aux buts véritables ou méthodes utilisées
Quand est ce que le code de déontologie accepte la duperie (2)
- Valeur prospective de la recherche doit être démontrée
- Faire la preuve qu’aucune autre méthode aussi efficace est disponible
Chercheur qui utilise duperie est soumis à 2 responsabilités
- S’engage à ne cacher aucun des éléments qui pourraient influencer leur désir de faire partie de la recherche (risques ou inconforts)
- Chercheur doit informer le + rapidement possible lors d’une séance d’information
(dernière étape de cette séance demander au participant s’il consent qu’on utilise ces données)
Exemples bénéfices (3)
Meilleure connaissance de soi, un mieux-être, sentiment d’avoir participé à l’avancement des connaissances
Exemples risques (5)
Fatigue musculaire, douleur, inconfort, nervosité, diminution de l’estime de soi
Qu’arrive-t-il lorsque les risques sont importants (2)
Chercheurs et comité d’évaluation déontologiques doivent se montrer prudents
Chercheur doit démontrer une réelle expertise de la méthode qui comporte un risque
Chercheur et responsabilité envers la science (2)
-Le protocole de recherche doit être de qualité ainsi que les analyses statistiques et l’interprétation des résultats
-Pas le droit de fabriquer ou falsifier ses résultats
Chercheur responsabilité envers participants (2)
-Chercheur doit maintenir après la recherche anonymat des participants et confidentialité des infos
-Si participant révèle info troublante du passé = doit respecter confidentialité
Si révèle futur ou actuellement = plus tenu au secret professionnel et doit prévenir autorités