cours 4 validité Flashcards

1
Q

quelles sont les différences entre les modèles exploratoires et confirmatoires?

A

exploratoires:
pour créer un questionnaire sur épuisement étudiant, variables prédicatrices de l’épuisement, on bâtit alors un modèle explicatif

confirmatoires:
on veut savoir si ce modèle est valable pour tous les étudiants de sherbrooke, on compare alors avec d’autres étudiants, si résultats confirment les autres résultats alors c’est confirmatoire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

quelques exemples de validité:

A

admission à l’université de sherbrooke
- cote r est reliée à nos notes et qui est corrélé à nos notes universitaires, peut toujours y avoir une erreur de prédiction (si ont niaisé au cegep) = erreur d’estimation
(y = a+b(x)+e)

inventaire de dépression et diagnostic de dépression

dépistage des problèmes scolaires

meilleur prédicateur = comportement qui a été fait dans le passé

inventaire de personnalité (corréler extraversion et nombre d’amis)

test de rendement (score permis de conduire corrélé avec nombre d’accidents/contraventions)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

quelle est la définition de la validité et les 3 précisions supplémentaires?

A
  • est-ce qu’un test mesure ce qu’il devrait mesurer?
  1. un score dans un but précis (on veut prédire une variable en particulier) ex: entrevue = évalue habiletés sociales
  2. une question de degré et non pas de tout ou rien = se calcul avec coefficient de corrélation (r), plus la prédiction est valide, plus la corrélation est élevée
  3. la validité ne garantie pas l’exactitude des normes
    (validité de l’échantillon ne garantit pas la validité de la population)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

quels éléments sont nécessaires pour que le test construit soit adéquat?

A
  1. bonne définition du construit (variable) pour pouvoir bien le développer
  2. mesure valide (superposition du test et du construit)
    - jusqu’à quel point le test est cohérent avec ma variable
    - variable sous-représentée ou variance sous-pertinente (ex si les items ne représentent qu’une partie du construit)

ex: mesurer quantité alcool chez européens = prendre du vin à tous les jours est normal, donc variance peu pertinente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

qu’est-ce que la validité d’apparence?

A

est-ce que le test paraît valide?
donc, à l’oeil est-ce que le test mesure ce qu’il est sensé mesurer

divergences d’opinion à propos de la validité d’apparence
parfois suscite de la désirabilité sociale
ex: je ment souvent, la plupart vont dire faux
peut être utile en contexte d’emploi, car ça prépare la personne au travail et aux exigences de celui-ci

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

quelles sont les 3 éléments à établir à ce qui attrait à la validité?

A
  1. est-ce que les scores d’un test sont valides à une fin particulière, ou encore de l’interprétation d’un test à une fin particulière
    ex: on ne dit pas: le test de Rorschach est-il valide? mais plutôt l’indice de dépression du test de Rorschach est-il valide pour déterminer le degré de gravité d’une dépression?
  2. déterminer le degré de validité (faible, modérée ou élevée), donc si le test est assez valide pour justifier son utilisation (grâce au coefficient de corrélation (r))
  3. doit faire la distinction entre la validité et l’exactitude des normes pour un test, un test peut être valide alors que c’est ses normes qui sont déficientes (l’inverse peut aussi être vrai)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

la validité représente la partie du construit qui est bien représentée, quels sont les deux autres instances que la validité ne couvre pas?

A
  1. sous-représentation du construit (donc des parties du construit étudié qui ne sont pas mesurés par le test)
  2. variance non-reliée au construit (lorsque le test mesure aussi d’autres caractéristiques qui ne sont pas associées au construit étudié)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

qu’est-ce que le classement traditionnel de validité?

A
  1. validité de contenu
  2. validité de critères
  3. validité concomitante
    • validité prédictive
    • validité de construit
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

qu’est-ce que le nouveau système de classification de la validité?

A
  1. validité de contenu
  2. relations avec les autres variables
    • convergente et discriminante
    • test-critères
  3. processus de réponse
  4. structure de réponse
  5. conséquences
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

qu’est-ce que la validité de contenu?

A

pour que le contenu d’un test soit valide, il doit bien correspondre au contenu du domaine étudié.

l’application de la validité de contenu implique souvent la notion d’échantillonnage (doit couvrir un échantillon représentatif de tous les éléments possibles du domaine)

la validité de contenu à deux applications principales: les tests de rendement scolaire et les tests d’aptitudes professionnels

l’objectif est de déterminer le degré auquel le contenu du test correspond au contenu de la matière scolaire ou de l’emploi visé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

quelles sont les deux applications principales de la validité de contenu?

A
  1. tests de rendement scolaire
    - le contenu doit être proportionnel au temps aloué aux différents éléments vu dans le cadre de l’apprentissage ex: dans l’examen de psychométrie, l’histoire de la psychométrie et la validité n’auront pas le même nombre de questions (part de subjectivité)
  2. tests d’aptitudes professionnels
    - le domaine de contenu est composé des connaissances et compétences nécessaires pour occuper un poste en particulier
    - analyse de poste = élaboration de la liste des connaissances et compétences nécessaires à un poste

problématique au niveau de l’opérationnalisation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

par quoi débute l’établissement de la validité de contenu?

A

par une définition rigoureuse du contenu à couvrir

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

quelle est la fonction essentielle de la validité de critère?

A

définir la relation entre les résultats au test et un autre critère considéré comme un important indicateur du construit à l’étude (critère externe)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

quels sont les deux contextes généraux liés à la validité de critère?

A
  1. validité prédictive
    - vise à prédire la valeur que prendront certains critères à l’avenir
    ex: un inventaire de personnalité peut servir à prédire la probabilité d’une tentative de suicide dans l’avenir
  2. validité concomitante
    - concerne la concordance entre les résultats à un test et la valeur actuelle d’autres variables au même moment
    ex: évaluation de la relation entre les résultats à un test de dépression et les évaluations que font les cliniciens de la gravité actuelle de la dépression

en générale, les deux se ressemblent, la différence réside essentiellement dans le moment de l’évaluation de la variable critère

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

quelles sont les trois applications courantes de la validité de critère?

A
  1. utilisation d’un critère externe et réaliste
  2. utilisation de groupes contrastés
  3. utilisation d’un autre test
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

qu’est-ce qui caractérise l’utilisation d’un critère externe lié à la validité de critère?

A
  • critère externe donne une définition réaliste du construit à l’étude
  • on peut considérer le test que l’on valide comme un substitut possible au critère externe
    ex: au lieu d’une interrogation d’une heure d’un patient par trois cliniciens afin de déterminer la gravité de la dépression, on pourrait faire passer un test de 15 min
  • la validité du test s’exprime sous la forme de coefficient de corrélation = coefficient de validité

Y: valeur prédite du critère
X: le résultat au test
Y = a + b(x)
- lorsqu’on connait la corrélation entre deux variables, on peut l’utiliser pour prédire la valeur de Y à partir de X

  • il y aura une forte corrélation positive si le test prédit bien le comportement
  • r(au carré) = nous donne le pourcentage de la variance de la vd expliquée par la vi
    ex: 0.6 (r) -> au carré = 0.36 = 36% de la vd expliquée par la vi (forte corrélation)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

qu’est-ce qui caractérise la méthode de groupes contrastés lié à la validité de critère?

A
  • le critère est la composition du groupe
  • on veut démontrer que le test permet de différencier un groupe d’un autre
  • le composition du groupe est considéré comme une bonne définition du critère
  • plus la différenciation est élevée, meilleure est la validité du test
    ex: création d’un test évaluant l’abus d’alcool = étudiants udes vs clients d’un centre de désintoxication
  • parfois difficile d’obtenir un contraste significatif dépendamment des groupes utilisés
    ex: patients atteints d’un trouble anxieux généralisé vs étudiants en psycho udes

groupe contraste = point de comparaison
groupe critère = groupe évalué

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

dans quel cas on utilise l’erreur type d’estimation?

A

lié aux prédictions concernant le critère externe

on utilise alors la droite de prédictions et dispersion

erreur type d’estimation = écart type des véritables scores critères autour des scores prédits

permet d’estimer les probabilités que les cas aient des valeurs supérieures ou inférieures d’une certaine valeur aux prédictions concernant le critère externe

on présume que cette erreur est distribué normalement (explique la courbe normale dans le diagramme de nuage)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

vrai ou faux?
en lien avec l’erreur type d’estimation, si on fait en x la même chose qu’on fait en y, alors il ne devrait pas y avoir de différences entre les deux, car les deux sont fortement associés?

A

faux
ex: lorsqu’on ment dans notre entrevue sur nos compétences requises pour le poste (erreur d’estimation)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

quel est le lien entre la validité critère avec groupes contrastes et la taille d’effet (D de Cohen)?

A

plus le D de Cohen est élevé, plus la distinction est grande et moins les deux courbes se chevauchent = ce qui veut dire qu’il y a beaucoup de différences entre les deux groupes

D cohen = (moyenne 1 - moyenne 2)/écart type

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

qu’est-ce que la validité critère avec corrélations avec d’autres tests?

A
  • consiste à démontrer la corrélation entre le test à valider et un autre test dont la validité est établie ou présumée pour le construit à l’étude
  • on cherche à déterminer la similitude des construits mesurés par les deux tests (corrélation positive)
  • pour éviter confusion avec validité de critère, on l’appelle validité convergente pour exprimer la relation de concordance
  • mesure étalon = meilleure test critère dans le domaine pour aller corrélé avec notre test
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

pourquoi faire validité critère avec autres tests si on a déjà ces autres tests pour mesurer notre construit?

A
  • le nouveau test pourrait être plus court et moins dispendieux que le test critère
  • les normes du nouveau test pourraient être meilleures ou les processus d’établissement des scores pourraient être plus efficaces (donc amélioration ou mise à jour du test critère)
  • trop théorique, on veut quelque chose de concret (veut voir vrai comportement)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

comment on nomme le meilleur test critère dans le domaine à corrélé avec notre nouveau test (validité convergente)?

A

mesure étalon (golden standard)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

quelles sont les conditions affectant le coefficient de relation (r) pour la validité critère?

A
  1. la linéarité:
    - doit être linéaire et non curvilinéaire, facilement observable dans une distribution bivariée
  2. l’homoscédascité:
    - l’erreur type d’estimation doit être constante à tous les niveaux de la droite (répartition égale du nuage)
  3. homogénéité:
    - homogénéité du groupe crée de la restriction de la variance, un groupe plus hétérogène permet une meilleure validité prédictive
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

qu’est-ce qui caractérise la relation entre fidélité et validité?

A
  • la fidélité ne garantie pas la validité
  • en général, si la fidélité est faible alors ça va nécessairement affecter la validité
  • si la fidélité du test est nulle (scores = erreurs aléatoires), sa validité peut être également nulle
  • cependant, si la fidélité d’un test est parfaite, il est possible que la validité soit nulle = le test mesure avec fidélité autre chose que ce qu’il est sensé mesurer
26
Q

qu’est-ce que l’atténuation?

A

est la limite imposée à la validité par une fidélité imparfaite

27
Q

quelle est l’importance de la validité du critère sur lequel on se base pour valider notre test?

A
  • lorsqu’on examine la validité de critère d’un test, on doit également penser à la validité de la définition opérationnelle du critère

ex: on fait un test pour évaluer le succès de vente
mais comment on définit le succès d’un vendeur? plusieurs options:
- le chiffre total des ventes
- le nombre de nouveaux clients
- l’évaluation du directeur des ventes, etc.

28
Q

qu’est-ce que la contamination du critère?

A

est-ce que les juges sont toujours objectifs?

ex: il y a beaucoup de variations qui ne sont pas nécessairement liées à la criminalité-> basé aussi sur impressions sociales des intervenants = contamination de la variable

la corrélation peut alors être augmentée ou diminuée en fonction de la subjectivité des juges

29
Q

qu’est-ce que la validité convergente et discriminante?

A

convergente:
corrélation entre notre test et un test qui mesure le même construit = validité convergente

discriminante:
notre test ne sera pas corrélé avec un construit similaire, mais plus différent
ex: test portant sur l’estime de soi devrait avoir une corrélation nulle avec échelle de narcissisme (donc mesure bien estime de soi et non narcissisme)
est donc convergente et divergente = solidifie notre test, car n’est pas corrélé avec un critère inattendu

30
Q

qu’est-ce que la matrice multitrait-multiméthode?

A
  • constitue une application particulière des concepts de validité convergente et discriminante
  • tests sensés mesurer plusieurs traits au moyen de différentes méthodes
    ex: traits = anxiété et dépression
    méthodes = questionnaires d’auto-évaluations, techniques projectives et évaluations par des cliniciens
  • but: démontrer que les corrélations relatives à un trait couvrant différentes méthodes sont supérieures aux corrélations relatives aux méthodes qui couvrent différents traits
31
Q

qu’est-ce que la méthode de combinaison de l’information de différents tests? (validité critère)

A
  • utilisation de la corrélation multiple pour prédire Y (critère),mais à l’aide de plusieurs VI (tests) = meilleure prédiction de Y avec plusieurs variables
    ex: critère = moyenne générale des étudiants 1ere année
    autres variables = test d’admission, rang au secondaire et test sur motivation scolaire
  • en augmentant le nombre de variables on diminue la variance non expliquée et on augmente la variance expliquée dans la VD (critère)

*on ne peut pas toujours ajouter des variables pour ajouter des variables = affecte les degrés de liberté
(si degrés de liberté sont augmentés = affecte ratio f (si significatif ou pas)

buts:
- offrir la meilleure prédiction possible en lien avec le critère de manière économique (en n’employant pas plus de variable que nécessaire)
- connaître de manière théorique les variables (lesquelles sont redondantes et lesquelles contribuent efficacement à la prédiction d’un VD)

unité —> R (r mais majuscule)

32
Q

quelle est la différence entre la corrélation et la régression simple?

A

aucune, c’est la même chose

33
Q

qu’est-ce que la validité incrémentale? (validité de critère)

A

but:
on ne veut pas juste de la variance commune, on veut de la variance qui est expliquée par l’ajout d’un prédicateur

  • quand on ajoute une variable a corrélé au critère (régression multiple), on doit s’assurer que ça n’explique pas de la variance commune ou de la variance déjà expliquée
    ex: préoccupation climatique = vote QS, mais très fortement lié à la variable d’âge (jeunes sont plus impliqués dans environnement), donc explique un peu la même variance = variance incrémentale faible
  • une variance incrémentale faible entraîne l’affaiblissement du ratio f (significatif), qui demeure tout de même significatif car représente quand même la réalité (mais une des variables n’est pas nécessaire)
34
Q

qu’est-ce qui est supérieur entre la prédiction statistique et la prédiction clinique?

A

la prédiction statistique sera toujours supérieure à la prédiction clinique

lorsqu’on combine les résultats de plusieurs sources ça va toujours battre les résultats cliniques (moins bonne minimisation des erreurs)

35
Q

qu’est-ce qui caractérise le bêta standardisé?

A

il ne sera jamais affecté par les unités de mesure ex: âge en nombre d’année, revenu en $ = pas les mêmes unités, mais on peut quand même les comparer grâce au bêta standardisé

utile avec score Z (courbe normale)

36
Q

vrai ou faux:
le degré de variance expliquée par une variable est toujours en fonction des autres variables mis dans l’équation de la régression?

A

vrai

exemple:
prédiction sur achat d’une voiture (critère) = prix + côté sympathique du vendeur (variables)
choix entre deux voitures, une est plus chère que l’autre, le côté sympathique du vendeur explique alors 0% de la variance car variable de sympathie a beaucoup moins de valeur que la variable du prix
si les deux voitures ont le même prix, le côté sympathique du vendeur explique alors 100% de la variance

37
Q

quels sont les différents termes liés aux négatifs et positifs?

A

vrai positif:
vous pensez avoir le sida et le test dit que vous avez le sida

faux positif:
vous n’avez pas le sida, mais le test dit que vous avez le sida

vrai négatif:
vous n’avez pas le sida et le test affirme que vous n’avez pas le sida

faux négatif:
vous avez le sida, mais le test dit que vous ne l’avez pas

dans le meilleure des mondes, on a seulement des vrais positifs et des vrais négatifs, mais ce n’est pas toujours le cas
il faut alors minimiser la présence de faux positifs et de faux négatifs

38
Q

théorie de la décision:
quels sont les deux facteurs qui affectent la proportion de résultats appropriés (vrais positifs et négatifs), des faux positifs et de faux négatifs?

A
  1. le degré de corrélation entre le critère et le test
  2. l’emplacement du point de coupure du test
39
Q

théorie de la décision:
qu’est-ce que le point de coupure?

A

réalité de la psychométrie:
on doit faire un compromis entre le taux de faux positifs et de faux négatifs et choisir lequel sera plus élevé (décision prise en fonction du critère)
ex: dans un cas de tentatives de suicide, vaut mieux avoir des faux positifs (n’est pas suicidaire, mais test dit que l’est) que des faux négatifs (est suicidaire, mais test dit que l’est pas)

le point de coupure va faire varier la sensibilité et la spécificité de notre mesure

pour bien positionner notre point de coupure on doit aller vérifier le taux de base du critère (stats bayésienne)
= fréquence du critère qui permet de calculer la probabilité d’un événement en fonction d’un score à un test

*peut fluctuer dans les populations (ex: le taux de base de la covid varie pendant les grosses vagues

40
Q

théorie de la décision:
en quoi consiste les statistiques bayésiennes?

A
  • mettre en relief la taux de base avec le risque
  • dépend du nombre d’individus = peut tromper car on regarde seulement une partie de l’équation
  • si on joue avec le taux de base = augmente la probabilité de donner diagnostic
  • calcul à l’aide d’un arbre de fréquence:
    (probabilité d’avoir vrai positif)/(probabilité d’avoir vrai positif + probabilité d’avoir faux positif)
    = % des chances d’avoir un vrai positif
  • pour augmenter la certitude = ajout d’un second test (deuxième arbre de fréquence)
41
Q

théorie de la décision:
quoi faire pour augmenter la certitude de vrais positifs de mon test?

A

ajouter un second test validé (deuxième arbre de fréquence)

42
Q

qu’est-ce que la sensibilité?

A
  • est le degré auquel le test permettra de définir le groupe critère
    ex: les personnes ayant tenté de se suicider
  • donc d’identifier correctement les membres du groupe critère
43
Q

qu’est-ce que la spécificité?

A
  • degré auquel le test détermine ou non les membres du groupe contraste
    ex: les personnes n’ayant pas tenté de se suicider
44
Q

quelle est la relation entre la sensibilité, la spécificité et le point de coupure?

A

sensibilité: identifier correctement les membres de groupes critère (personnes suicidaires)

spécificité: degré auquel le test détermine ou non les membres du groupe contraste (personnes pas suicidaires)

but du point de coupure:
maximiser la sensibilité et la spécificité (+ de vrais positifs et de vrais négatifs)
ex: point de coupure = hospitaliser les gens suicidaires, ne pas hospitaliser les gens pas suicidaires

dans un cas de tentative de suicide on ne doit pas mettre un point de coupure élevée pour ne pas laisser partir des personnes suicidaires, donc on accepte que la spécificité soit plus faible

45
Q

qu’est-ce qui affectent la sensibilité et la spécificité?

A
  1. le point de coupure (plus la sensibilité augmente, plus la spécificité baisse et vice versa)
  2. le degré de séparation entre les groupes (plus il est élevé, meilleures sont la sensibilité et la spécificité)
46
Q

qu’est-ce que la courbe de roc?

A

en lien avec point de coupure, sensibilité et spécificité

la diagonale répartie le test en deux, à 50% = la ligne de pile ou face, la courbe de roc ne doit pas être em dessous de la diagonale (on classifie mieux notre cas grâce à notre test qu’avec un 25 cents)

47
Q

qu’est-ce que la validité de construit?

A

donne plusieurs méthodes pour démontrer la validité en ajout à la validité de contenu et la validité de critère

48
Q

qu’est-ce que la méthode de structure interne? (validité construit)

A

deux sous-catégories:
- cohérence interne
- analyse factorielle

cohérence interne:
la mesure prise au moyen du test est effectuée de manière constante et donc contribue à confirmer que le test mesure bien un construit précis
= alpha de cronbach élevé
*cependant la cohérence interne à elle seule n’est pas une preuve assez forte pour définir complètement le construit

analyse factorielle:
> 0.3 = significatif
> 0.9 = peut être regroupé en une seule dimension
- ces relations peuvent être observables dans la matrice de corrélation
- si j’ai beaucoup d’items, est-ce que je suis capable de les réduire en quelques dimensions
- va être un étape incontournable pour voir si notre construit est adéquat à notre test
- est-ce que nos items vont dans les dimensions qui étaient théoriquement prévues

49
Q

quels sont les deux sous-catégories de la structure interne?

A
  1. cohérence interne
  2. analyse factorielle
50
Q

quelle est la différence entre une analyse factorielle exploratoire et une analyse factorielle confirmatoire?

A

analyse factorielle exploratoire:
réduction de plusieurs items en quelques dimensions si sont grandement corrélés entre eux
ex:
- ceux qui ont des longs bras ont aussi des longues jambes = peut réduire pour taille de l’individu (réduit à une seule mesure)

  • examen portant sur la mémoire, pour une question on compare le système de mémoire à des composantes informatiques —> ne sont pas dans même dimension que les autres questions = création d’un nouveau facteur, on doit donc retirer cet item

analyse factorielle confirmatoire:
- on confirme notre structure avec un nouvel échantillon pour observer si nos corrélations demeurent élevées

51
Q

qu’est-ce que le processus de réponse? (validité de construit)

A

est une analyse de la manière dont les sujets répondent au test
leur processus de réponse peut constituer un élément de preuve quant à la validité du test
pas une preuve suffisante à elle même

52
Q

qu’est-ce que la méthode de l’effet des variables expérimentales? (validité construit)

A

ressemble à la méthode de groupes contrastes dans le cas de la validité de critère
la différence est que les groupes contrastes de la validité de critère sont formés naturellement, alors que les groupes étudiés pour la validité de construit sont formés précisément pour l’analyse de la validité du test

ex: administration du test à 50 personnes, on leur fait ensuite passer une formation de 10 heures, puis on leur administre de nouveau le test, on pourrait s’attendre à des scores plus élevés (nécessite groupe témoin pour éliminer la possibilité qu’un hausse des scores découle seulement de l’effet de pratique)

53
Q

qu’est-ce que la méthode de changements développementaux? (validité de construit)

A

on s’attend à ce que les aptitudes mentales des enfants augmentent avec l’âge

54
Q

quelles sont les principales façons d’analyser la validité de construit?

A
  • analyse factorielle
  • structure interne
  • processus de réponse
  • effets des variables expérimentales
  • changements développementaux
55
Q

qu’est-ce que la validité différentielle?

A

est-ce qu’un test prédit également (aussi bien ou aussi mal) pour différents groupes?

un test biaisé ne mesure pas le construit ciblé de la même façon pour différents groupes

est-ce que ma droite de régression prédit aussi bien pour tous les groupes ethniques?

critique tests psychométriques = biaiser envers certains groupes (culturels)

*différence de moyennes entre deux groupes ne signifie pas automatiquement la présence de biais

pour prouver absence de biais
biais de la pente:
Y = a + b(x)
pente = b
ordonnée = a

56
Q

qu’est-ce que le biais de l’ordonnée à l’origine?

A
  • les deux groupes ont la même pente (corrélations parfaites), mais le groupe A partent systématiquement de plus haut (alors que le groupe B est à 0, le groupe A est à 10) = pas la même ordonnée à l’origine
  • en temps normal, la droite de régression est déterminée pour les deux groupes combinés
  • généralement moins grave que le biais de la pente car il suffit d’ajouter un bonus de 10 au groupe B pour rendre le test équitable (ajustement en disant que le test sous-estime constamment le groupe B de 10 points)
  • on peut aussi corriger par une question bonus
57
Q

qu’est-ce que le biais de la pente?

A
  • les droites de régression des deux groupes n’ont pas la même pente = car le degré de corrélation n’est pas le même pour les deux groupes
  • la différence des pentes signifient qu’il y aura surestimation ou sous-estimation de certains résultats du groupe A et de certains résultats du groupe B
  • on ne sera pas capable de prédire systématiquement Y pour les deux groupes
58
Q

qu’est-ce qui caractérise l’absence de biais, mais avec une différence au niveau de la moyenne des groupes?

A
  • pas de biais car pas d’erreur d’ordonnée ou de pente
  • les deux groupes ont la même pente, seulement il y a un groupe dont la moyenne est plus élevée
59
Q

qu’est-ce que la généralisation de la validité? (préoccupations pratiques)

A
  • fait de soupeser toutes les preuves et de déterminer la pertinence des études existantes relativement à l’usage prévu

nécessite:
- une connaissance du domaine du contenu en question
- une bonne connaissance de la recherche déjà effectuée au moyen du test et de tests semblables
- une compréhension des concepts et des méthodes abordés dans le présent chapitre
- une analyse perspective des circonstances locales relativement à l’utilisation prévue du test

60
Q

qu’est-ce que la méta-analyse? (préoccupations pratiques)

A
  • technique consistant à résumer les données statistiques de plusieurs études distinctes portant sur un sujet donné
61
Q

analyse finale: standard relatif, quel devrait être le degré de validité?

A

la réponse à la question sur la validité est relative, il faut se demander si:
- un test est plus ou moins valide qu’un autre (test vs test), si les deux ont des degrés de validité insatisfaisantes, on prend la moins pire
- préférable d’utiliser un test plutôt que rien (test vs rien)
- un test ayant un faible degré de validité est mieux que de fonder notre décision sur aucune données (test vs pile ou face)