INFERENCE SUR UN PROTOCOLE UNIVARIE STRUCTURE PAR UN CROISEMENT Flashcards

0
Q

Dans une recherche, on souhaite étudier l’effet du nombre de distracteurs sur la détection de la présence d’un objet cible lors d’une tâche de détection visuelle. Dans ce type d’expérience, le sujet doit appuyer sur un bouton à l’apparition d’un objet sur l’écran (cible). Cet objet est présenté au milieu de plusieurs autres objets (les distracteurs). On fait l’hypothèse que la cible sera d’autant moins bien détectée que les distracteurs seront nombreux. Pour cet exemple, nous allons considérer que 30 sujets doivent détecter la présence d’un objet cible présenté parmi 20 distracteurs (condition 20) dans une première condition, et parmi 40 distracteurs dans une seconde condition (condition 40). La variable dépendante est la détection ou non de la cible.

A
  • Pour tester l’hypothèse d’une diminution des détections dans la condition 40, nous allons considérer la fréquence des individus qui vérifient l’hypothèse, et la comparer à une fréquence théorique de 50% correspondant à une réponse au hasard.
  • Pour cela nous allons recoder les modalités de la variable en notant 1 les cas de détection et 0 les cas de non détection .
  • Nous obtenons ainsi une variable pseudonumérique sur laquelle il est facile de calculer les différences entre la condition 20 et la condition 40. ( condition 20 - condition 40)
  • Dans le protocole des différences, les différences nulles correspondent aux individus qui ont répondu de la même façon dans les deux conditions. Du point de vue de notre hypothèse, ils ne sont pas informatifs. Nous allons donc les ignorer.
  • Les différences négatives correspondent aux individus dont les réponses s’opposent à notre hypothèse (non détection en condition 20 et détection en condition 40).
  • A contrario, les différences positives correspondent aux individus dont les réponses sont conformes à notre hypothèse (détection en condition 20 et non détection en condition 40). Ce sont ces deux derniers que nous allons considérer pour tester notre hypothèse. C’est ce qu’on appelle le test du signe.
  • Si on fait abstraction des cas d’égalité, il nous reste alors 10 individus dont 7 vont dans le sens de l’hypothèse.
  • Nous allons situer cet échantillon dans une distribution théorique correspondant à des réponses au hasard, soit une fréquence de détection de 50%.
  • la distribution exacte est la distribution binomiale. Nous avons pour cette distribution les paramètres suivants : P=0,5 ; Q=1-0,5 et n=10. Il ne nous reste qu’à appliquer la procédure de calcul présenté précédemment
  • La première colonne contient les différentes valeurs de k qui vont dans cet exemple de 0 à 10. On trouve dans la deuxième colonne le nombre de k éléments dans n éléments (voir le mode de calcul dans le CHAPITRE 2 - 3.2.2). Dans la troisième colonne la proportion P est élevée à la puissance k et dans la troisième colonne Q est élevée à la puissance n-k. La dernière colonne correspond au produit des trois précédentes. C’est notre distribution d’échantillonnage. On peut voir dans cette distribution que la proportion d’échantillons dans lesquels on a 70% ou plus d’individus conformes à l’hypothèse est de 0,117+0,044+0,010+0,001=0,172.
  • Cette proportion étant supérieure au seuil .025, le résultat est donc non significatif.
  • Dans le cadre d’un modèle d’échantillonnage combinatoire, cela veut dire que le protocole observé des différences n’est pas atypique d’une distribution où on a 50% de réponses conformes à l’hypothèse. Autrement dit, les deux séries d’observations peuvent être considérée comme homogènes.
  • D’un point de vue fréquentiste, P=0,5 correspond à l’hypothèse nulle, c’est-à- dire l’absence de différence entre la condition 20 et la condition 40. La proportion doit alors être interprétée comme la probabilité d’obtenir un échantillon où il y a 70% de réponses conformes dans une population où il y en a 50%. Cette probabilité étant trop élevée (supérieure au seuil repère) l’hypothèse nulle n’est pas rejetée.
  • D’un point de vue psychologique, cela signifie que nos données ne nous permettent pas de conclure que l’augmentation du nombre de distracteurs diminue la fréquence de détection de la cible. Cela dépend en fait de la nature des distracteurs qui, s’ils sont suffisamment différents de la cible, peuvent même en plus grand nombre favoriser la détection de la cible. C’est ce qu’on nomme l’effet « pop out ».
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

Dans le cas d’un protocole structuré par un croisement avec une variable nominale dichotomique, par quoi est donnée la distribution exacte?

A

La distribution exacte nous est donnée par la distribution binomiale. Nous avons en effet deux événements possibles (égalité ou différence des observations dans les deux conditions) et l’hypothèse d’homogénéité des groupes d’observations (ou l’hypothèse nulle dans l’approche fréquentiste) revient à postuler une égalité des fréquences de ces deux événements dans la distribution d’échantillonnage.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Avec qu’elle distribution peut être approchée la distribution binomiale?

A

-La distribution binomiale calculée précédemment peut être approchée à l’aide d’une distribution de X2 à 1 degré de liberté.
-cette distribution approchée peut être utilisée à condition que les effectifs théoriques soient tous supérieurs à 5 et sous réserve d’appliquer la correction de continuité.
La formule du calcul de X2 est alors la suivante : “ X2 corr =somme de ( (eobs - ethéo) -0,5) au carré /ethéo 2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Que permet le test du signe?

A
  • le test du signe consiste à ne considérer que les différences non nulles et à situer le protocole des différences dans la distribution d’échantillonnage. -Pour l’utilisation de X2, cela revient à construire la distribution des effectifs observés en recodant les données selon trois modalités : les différences conformes à l’hypothèse, les différences nulles et les différences non conformes à l’hypothèse.
    -Dans l’exemple précédent, nous avons ainsi la distribution observée suivante :
    Conformes: 7 Nulles: 20 Non conforme: 3 Total: 30
    -Les différences nulles n’étant pas informatives du point de vue de l’hypothèse à tester, on peut en faire abstraction.
    Nous obtenons ainsi les effectifs observés suivants où les différences conformes correspondent au cas de détection dans la condition 20 et de non détection dans la condition 40. Les différences conformes correspondant à l’inverse.
    Différences observées: Conforme: 7 Non conforme: 3 Total 10
    Différences théoriques: Conforme: 5 Non conforme: 5 Total: 10
    -Les effectifs théoriques correspondent à une fréquence des différences conformes de 0,5 et une fréquence des différences non conformes de 1-0,5=0,5.
    -Nous avons donc comme effectifs théoriques : 10*0,5 soit 5.
    -Les effectifs théoriques étant supérieurs ou égaux à 5, nous pouvons calculer X2corr : “
    X2 corr ( (7 -5) - 0,5) au carré / 5 + ( (3 -5) - 0,5) au carré / 5 = 0,9
    -On consulte ensuite la table de X2[1], en cherchant la valeur la plus proche mais inférieure à la valeur observée.
    -Dans notre exemple, c’est la valeur .46, ce qui nous permet de lire en tête de colonne une valeur de p de .50
    -Le test peut donc être déclaré non significatif puisque p est supérieur au seuil repère .05 (notre table est bilatérale).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelles distributions approchées doivent être utilisées dans le cas de variables numériques et quand doivent elle être utilisées?

A
  • avec une variable numérique, deux distributions approchées peuvent être utilisées : la distribution de Z et la distribution de T.
  • Dans le cas où l’échantillon doit être situé dans une population, la moyenne et la variance parente sont connues. C’est alors le test du z qui doit être utilisé.
  • Dans le cas où l’échantillon doit être situé dans une distribution, si la variance parente est connue c’est également le test du z qui doit être utilisé. Lorsque la variance parente n’est pas connue, il faut utiliser le test du t de Student.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quel est le le principe général de l’inférence sur un protocole numérique structuré par un croisement?

A

le principe général de l’inférence sur un protocole numérique structuré par un croisement consiste à calculer le protocole des différences et à le situer dans la distribution d’échantillonnage des différences.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Imaginons que, dans une recherche, on mesure, en minutes, le temps que les sujets mettent à lire un texte. Puis qu’on leur donne un second texte traitant du même sujet, présenté différemment. On fait l’hypothèse que les connaissances acquises au cours de la lecture du premier texte aideront à la lecture du second. Le temps de lecture devrait être plus court pour le second texte.

A

-On est dans le cas d’un protocole structuré par un croisement, chaque sujet ayant vu les deux tâches. Pour comparer le temps moyen de lecture des deux textes, il faut construire le protocole dérivé des différences individuelles.
-Pour cela, on calculera, pour chaque sujet la différence entre les temps de lecture du premier et du second texte.
-La dernière colonne du tableau représente le protocole dérivé des différences individuelles.
-En calculant ce protocole, on construit une nouvelle variable.
-Si on ne considère que cette dernière variable, on se trouve alors dans le cas d’un protocole univarié non structuré. Si on connaît la variance parente, on peut alors utiliser le test du z tel qu’il a été présenté pour les protocoles non structurés. Dans cet exemple, la moyenne des différences de l’échantillon est de -0,3 et l’écart-type des différences est de 1,77. Imaginons que l’écart-type de la population parente σ0 soit de 1,80. La moyenne parente est de 0.
-Rappelons que nous testons l’absence de différences, ce qu’on nomme également l’hypothèse nulle.
Dans notre exemple, l’application de la formule de z nous donne un zobs de :
de : zobs = (m - μ0) / (sigma0 / racine carrée de n) :
( -0,3 - 0) / ( 1,80 / racine carrée de 10) = -0,52
-La lecture de la table du Z se fait comme précédemment en recherchant dans la table la valeur de zobs et en lisant la proportion associée. –Dans notre exemple, nous faisons l’hypothèse que le temps de lecture du texte 2 est plus court que le temps de lecture du texte 1. C’est donc la proportion cumulée à gauche des échantillons que nous cherchons.
-La proportion que nous lisons dans la table en regard de -0,52 est de 0,302. Elle représente la proportion des échantillons dans lesquels la valeur de Z est inférieure à -0,52. Cette proportion étant supérieur au seuil repère de .025, le test peut être déclaré non significatif.
-Comme précédemment, l’interprétation du test dépend du modèle d’échantillonnage dans lequel on se situe. Du point de vue du modèle combinatoire toujours possible quel que soit le cas de figure, il s’agit de tester l’homogénéité des deux groupes d’observations.
-Autrement dit, si la moyenne des différences est proche de 0, les données des deux tâches peuvent être mélangées. Le test étant non significatif, les deux groupes d’ observations doivent être considérés comme homogènes.
-Dans cet exemple, on peut également se placer dans l’approche fréquentiste. On teste en effet une hypothèse et on peut considérer, que toutes choses égale par ailleurs, les deux tâches sont équivalentes. Les sujets peuvent également être considérés comme tirés au hasard dans la population.
-De ce point de vue, la proportion peut alors être interprétée comme une probabilité d’obtenir une telle moyenne des différences dans l’espace des échantillons. La probabilité d’obtenir une moyenne des différences de -0,3 étant trop élevée, on ne peut rejeter l’hypothèse nulle. Il n’y a donc pas de différence entre les deux groupes d’observations. On ne peut donc pas dire que la lecture du second texte soit plus rapide que la lecture du premier.
-Ce qui d’un point de vue psychologique pose la question du transfert de connaissance du premier au second texte.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Dans ce type d’expérience, l’expérimentateur fait apprendre à deux reprise une liste de mots aux sujets et mesure le nombre de répétitions nécessaires pour que les sujets soient capables de restituer parfaitement la liste. La réduction du nombre de répétition constitue l’économie au réapprentissage. Imaginons que la liste comporte 20 mots. Dans une première phase, le sujet doit apprendre la liste par cœur. On mesure le nombre de répétitions nécessaires à un rappel parfait des 20 mots. Quelques semaines après, les mêmes sujets sont à nouveau invités à réapprendre la même liste de mots. On mesure à nouveau le nombre de répétitions nécessaires pour un rappel parfait de la liste. Bien qu’avant le deuxième apprentissage, les sujets n’aient pas été capables de rappeler la liste, on fait l’hypothèse qu’ils n’ont pas oublié leur premier apprentissage, ce qui devrait se traduire par un nombre de répétitions nécessaires à un rappel parfait moins important pour le second apprentissage.

A

-Nous sommes dans le cas d’un protocole structuré par un croisement, chaque sujet ayant vu les deux tâches.
-Pour comparer le nombre de répétitions dans les deux apprentissages, il faut construire le protocole dérivé des différences individuelles.
-Pour cela, on calculera, pour chaque sujet la différence entre le nombre de répétition au premier et du second apprentissage. La dernière colonne du tableau représente le protocole dérivé des différences individuelles.
-En calculant ce protocole dérivé, on construit une nouvelle variable. Si on ne considère que cette dernière variable, on se trouve alors dans le cas d’un protocole univarié non structuré. Ne connaissant pas la variance parente, le test du Z ne peut être employé.
-Dans ce cas, on calculera le t de Student. Dans cet exemple, la moyenne des différences est de 2,08. L’écart-type corrigé des différences est de 1,87. On peut, à partir de ces paramètres calculer la valeur de tobs:
t obs = (m - μ0 ) / (sigma0 / racine carrée de n) (2,08 - 0) / (1,87 / racine carrée de12) = 3, 85
-Rappelons que dans cet exemple, nous testons l’absence de différences, autrement dit l’hypothèse nulle. La moyenne parente sera donc de 0 et tobs est de 3,85.
-Nous avons 12 observations donc 11 degrés de liberté. C’est donc la ligne 11 qu’il nous faut regarder.
-Nous cherchons ensuite sur cette ligne la valeur inférieur ou égale la plus proche à notre t obs. Cette valeur est de 3,11.
-Nous testons l’hypothèse que les sujets font moins de répétitions lors du second apprentissage pour parvenir à un rappel parfait. Notre hypothèse est donc orientée du coté des valeurs basses. En conséquence, nous regarderons le seuil unilatéral, et lisons en tête de colonne la proportion recherchée. Elle est de .005.
-Cette proportion étant inférieure au seuil repère de .025, le résultat est déclaré significatif au seuil de .005.
-Comme précédemment, l’interprétation d’un point de vue statistique dépend du modèle d’échantillonnage dans lequel on se place. Du point de vue du modèle combinatoire, toujours possible quel que soit le cas de figure, il s’agit de tester l’homogénéité des deux groupes d’observations. Autrement dit, si la moyenne des différences est proche de 0, les données des deux tâches peuvent être mélangées.
-Le test étant significatif, les deux groupes d’ observations doivent être considérés comme hétérogènes.
-La valeur de t étant positive, on a t1>t2. On peut donc dire que les sujets ont besoin de moins de répétitions, dans le second apprentissage, pour réapprendre parfaitement la liste de mots.
-Dans cet exemple, on peut également se placer dans l’approche fréquentiste. On peut, en effet, considérer que les sujets sont tirés au sort dans la population et que toutes choses égales par ailleurs, les deux tâches sont comparables. De ce point de vue, la proportion p peut être interprétée comme étant la probabilité d’obtenir une différence de 2,08. Autrement dit, on a 5 chances sur mille d’obtenir un échantillon présentant une moyenne supérieure ou égale à celle observée dans notre échantillon. Ce qui permet dans trop de risque de rejeter l’hypothèse nulle d’absence de différences. -D’un point de vue psychologique, on peut donc généraliser l’idée que les sujets réapprennent plus vite une liste de mots, même si à première vue il ne s’en souviennent pas. Ce qui montre que le premier apprentissage n’est pas perdu, mais seulement inaccessible en mémoire.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly