Examen intra Flashcards
Vocabulaire:
Paramètre + exemple
Mesure utilisée pour décrire la population (ex: ensemble des chômeurs du Québec)
Signes pour population (paramètres) + échantillon (indices statistiques)
Population= Moyenne: (genre de u) Écrat-type: (rond avec barre) Nombre d'unité: N Pourcentage: (pi)
Échantillon= Moyenne: (X barre) Écrat-type: s Nombre d'unité: n Pourcentage: p
Types d’échantillons au hasard
- simple
- grappes
- plusieurs degrés
(Permettent de déterminer la probabilité qu’a un élément de la population d’être inclus dans l’échantillon)
Échantillon au hasard simple (+ exemple)
Chance égale d’être sélectionné (ex: tirage au sort)
Échantillons non probabilistes (ou empirique) + exemple type
Ne permettent pas de déterminer la probabilité qu’a un élément de la population d’être inclus dans l’échantillon
(Exemple: échantillonnage de convenance, de volontaires)
Variable indépendante
C’est la cause. Condition qui est manipulée pour en observer les effets. (Ex: un traitement)
Variable explicative + exemple de niveau (variable indépendante)
Dans un étude non expérimentale ou corrélationnelle (ex: enquête). Pas manipulée, mais observée. Peut prendre diverses valeurs qu’on appelle des niveaux (ex: gars ou fille)
Variable dépendante
C’est la mesur de l’effet d’une variable indépendante. (Exemple: mon traitement est-il efficace ou non?)
Variable à expliquer (variable dépendante)
Dans étude non expérimentale ou corrélationnelle (ex: enquête) car pas de réelle relation de cause à effet parce qu’on ne contrôle pas les variables de confusion oi parasites
Variables de confusion (ou parasite) + exemple
Autres causes possible (ex: dans mon traitement, d’autres causes qui amène la réussite ou l’échec) (ex: la conduite automobile, gars ou fille change quelque chose, donc on va prendre juste un des deux)
4 types déchelles de mesure de la variable dépendante
- nominale
- ordinale
- à intervalles
- de rapport
Variables discontinues (nominales + qualitatives)
Valeurs nominales ou qualitatives. Valeurs catégorielles (un ou l’autre, pas entre deux, ex le sexe des sujets)
Peuvent aussi être ordinales (ex: classement à un examen par rapport aux autres étudiants de la classe)
Variables continues (intervalles+rapport)
Intervalles. (Ex: quotient intellectuel des sujets ou échelle de Likert (degré d’accord))
Rapports. (Ex: argent en banque). Ont un zéro absolu
Les 3 plans de recherche classique
- à groupe indépendant
- a mesures répetées
- plan combiné
Plan à groupes indépendants + formulation
Deux groupes de sujet ou plus, mesurées une seule fois (ex: sexe / masculin ou féminin / nombre de boites de savon acheté)
Formalisation : 2
Plan à mesures répetées + formulation
Un seul groupe de sujets mesurés plus d’une fois (ex: temps de la mesure / avant publicité ou après publicité / nombre de boites de savon acheté par hommes et femmes)
Formulation : (2)
Plan combiné + formulation
Combinaison des deux groupes (indépendants+mesures répetées) (ex: temps de la mesure / avant publicité (féminin ou masculin) et après publicité (féminin ou masculin) / nombres de boites de savon acheté)
Qu’est-ce qu’un histogramme?
Diagramme a bande
Qu’est-ce qu’un polygone de fréquence?
Diagramme a ligne brisée
Qu’est-ce que le mode?
Mesure de…
La mesure qui revient le plus (la plus fréquente)
Mesure de tendance centrale
Qu’est-ce que la médiane?
Mesure de …
Résultat au centre de la distribution
Mesure de tendance centrale
Qu’est-ce que la moyenne?
Mesure de la tendance centrale la plus utile
Les 3 mesures de tendances centrales
- mode
- médiane
- moyenne
Dans une distribution normale, le mode, la médiane et la moyenne sont….
Égales
4 mesures de dispersion
- l’étendue
- l’écart-type
- le skewness (asymétrie)
- le kurtosis (kurtose ou aplatissement)
L’étendue
(L’étendue interquartile aussi)
Mesure de….
On soustrait le minimum au maximum (on soustrait : derniere valeur - premiere valeur)
Mesure de dispersion
Étendue interquartile: calcule la différence entre deux autres valeurs plus stable. Se trouve en retirant 25% des scores les plus faibles, 25% des scores kes plus élevés, puis utiliser l’étendue
L’écart-type ou déviation standard
Mesur de….
La racine carrée de la variance (variance : sommation au carrés des X - la moyenne, divisée par n-1)
Mesure de dispertion
Les deux prémisses pour qu’un échantillon soit aléatoire (et donc représentatif de la population)
1- chaque membre de la population doit avoir une chance égale d’être sélectionné
2- les observations doivent être égales les unes des autres
Le skewness (asymétrie) Mesure de... Snewness positif = ... Skewness négatif = ... Skewness = 0 = .... Varie de ....
Nous renseigne si la majorité des sujets ont des résultats élévés ont des résultats faibles (skewness positif), potentiellement normaux (skewness = 0) ou élevés (skweness négatif)
Varie de moins infini a plus infini
Mesure de dispersion
Le kurtosis (kurtose ou aplatissement) Mesure de.... Kurtosis négative = .... Kurtosis = 0 = .... Kurtosis positive = .... Varie de...
Nous renseigne sinles sujets ont des résultats très étalés du plus faible au plus élevé (kurtosis négatif ou distribution placycurtique), des résultat potentiellement normaux (kurtosis = 0) ou des résultats très concentrés aux alentours du mode (kurtosis positive ou distribution leptocurtique)
Mesure de dispersion
Varie de moins infini a plus infini
Courbes skewness (+,-, normale)
\+ = curve plus haute a gauche - = curve plus haute a droite Normale = curve plus haute au milieu
Courbes kurtose
- = curve plus plate \+ = curve tres pointue Normale = curve ronde, pas pointue mais pas étendue
Distribution normale:
- comment est la courbe?
- 2 caractéristiques pour que ce soit normal
- Courbe en forme de cloche
- doit être unimodale et symétrique (on peut alors utiliser les tests paramétriques T et les analyses de variance
Tester la normalité de la distribution avec le test de Kolmogorov-Smirnov ou Shapiro-Wilk
-combien de participants?
K-S: avec plus de 50 participants
S-W: avec 50 participants et moins
Socre Z
- comment le calculer
- exemple d’utilisation
- (le score individuel - la moyenne) / l’écart-type
- ex: comparer les résultats, à une même matière de deux étudiants dans deux écoles différentes
Pourcentage distribution normale (dans la cloche)
- proche de la moyenne
- très supérieur ou très inférieurs
- extrêmement supérieurs ou extrêmement inférieurs (.0214)
- 68% proche de la moyenne (.3413 de chaque coté)
- 5% très supérieur ou très inférieurs (.1359) (plus ou moins 1,96 unité de score Z)
- 1% extrêmement supérieurs ou extrêmement inférieurs (.0214) (plus ou moins 2,58 unités de score Z)
Statistiques inférentielles:
-utilisées quand….
-employé quand on généralise les conclusions d’un échantillon à une population
Erreurs peuvent être dues à…: (types d’erreures de mesure + exemple pour chaque)
- erreur de l’instrument de mesure (ex: question mal comprise dans une enquête)
- l’erreur du sujet (ex: celui qui veut donner une réponse mais en inscrit une autre)
- l’erreur de l’expérimentateur (ou l’interviewer (ex: erreur de saisie des données)
- l’erreur due au hasard ( différences dans les échantillons)
Est-il préférable d’utiliser les teste paramétriques ou non-paramétriques et pourquoi?
Paramétriques, car ils sont légèrement plus puissants (capable de détecter un effet lorsqu’il existe)
Lettre pour: Corrélation Chi-charré Test T ANOVA
Corrélation (r)
Chi-carré (x2)
Test T (T)
ANOVA (F)
Calculer les degrés de liberté pour
- test T à échantillon unique
- test T à groupes indépendant
- corrélation de Pearson
- chi-carré
- ANOVA simple (one-way)
- corrélation de Pearson
- test T à échantillon unique: nombre de participants - 1
- test T à groupes indépendant:
sommation des nombres de participants par groupe - 1
-corrélation de Pearson:
Nombre d’observations (participante) - le nombre de mesures corrélées (variables)
-chi-carré:
Produit du nombre de niveaux de la ou les variables - 1
-ANOVA simple (one-way):
2 degrés de liberté:
•inter-groupe: se situe au numérateur : nombre de groupes -1
•intra-groupe: se situe au dénominateur : nombre total de sujets- le nombre de groupes
-corrélation de Pearson :
Nombre d’observations (sujets) - le nombre de variables
Sig. Doit etre égal a combien pour que le test statistique soit significatif?
0,05
2 manières de présenter les résultats
1- tableaux (de fréquence)
2- graphiques
Objectif premier de la corrélation bivariée
Quantifier la relation entre deux mesures continues (mesurer à quel point les mesures varient simultanément)
Corrélation bivariée
Relation directe?
Relation inverse?
Aucune relation?
Relation directe: si un indicidu obtient un score élevé à la mesure X, obtient aussi un score élevé à la mesure Y
Relation inverse: un indicidu obtient un score élevé à la mesure X, obtient un score faible à la mesure Y
Aucune relation: un indicidu obtient un score élevé à la mesure X, obtient un score quelquonque à la mesure Y
La corrélation entre deux variables peut etre attribuable a 3 choses
1- relation de cause à effet (coup de marteau sur le pouce cause de la douleur)
2- une cause commune (ex: chaleur est une cause commune ou variable parasite, fait augmenter le nombre de noyade et de vente de crème glacée)
3- une relation fortuite (fausse corrélation) (ex: réussite à l’examen et l’âge de la personne)
Pour qu’il y ait causalité, il faut que la cause produise (…) et qu’il n’y ait pas (…) en son (…), que la (…) précède l’effet et que n’interviennent pas de variables (…)
L’effet …. d’effet….. absence…. cause… parasites
Important de noter que la méthode corrélationnelle ne fait qu’observer les variables et ne permet pas un contrôle parfait des variables de confusion! On ne peut donc jamais etre certain de…
La causalité lorsqu’on utilise cette méthode
L’étude corrélationnelle simplifiée:
Mesurer….. et évaluer……
Mesurer deux variables (par observation) et à évaluer le niveau de relation qui existe entre elles
Comment quantifier la force de la relation dans l’étude corrélationnelle
Avec le coefficient de corrélation (qui va de -1 a +1)
3 manieres de Calculer le coefficient de Pearson
1- r = (produit des scores standards (Z) de chacune des deux mesures) / nombre de sujets (N)-1
E Zxi • Zyi
_____________
N-1
2- à partir des écarts à la moyenne (tableau)
3- à partir des scores bruts (tableau)
Valeurs extrêmes
Valeurs éloignées qui faussent les résultats de la corrélation de Pearson.
Valeurs extrêmes elevées = valeurs plus grandes que (la valeur du 75e centile + (1.5 x étendue interquartile))
Valeurs extrêmes faibles = valeurs plus petites que (la valeur du 25e centile - (1.5 x étendue interquartile))
S’assurer que, pour faire la des corrélations de Pearson, il n’y ait pas de valeurs extrêmes
Seul qui nous informe si le lien entre la valeur X et la valeur Y est assez fort en tenant compte du degré de liberté
Test d’hypothèse statistique
Hypothèse statistiques: hypothèse nulle
Sur laquelle porte le test statistique
Conservée si p est plus grand que 5% ou rejetée si p est plus petit ou égale a 5%
Hypothèse statistiques: hypothèse nulle dans corrélation bivariée
“Il n’y a pas de relation linéaire entre les deux variables”
Hypothèse statistiques: hypothèse alternative
H1
L’hypothèse de recherche qui est confirmée si l’hypothèse nulle est rejetée ou infirmée si l’hypothèse nulle est conservée
Elle peut etre bidirectionnelle “il y a une relation linéaire entre les deux variables”
Ou unidirectionnelle si le contexte théorique le justifie “il y a une relation linéaire directe (ou inverse) entre les deux variables”
Hypothèse statistique: taille d’échantillon pour avoir un effet moyen
85 participants
Représentation graphique d’une corrélation est…
Un nuage de points
Chaque point = intersection des mesure X et Y
Nuage de points (sa forme nous indique….)
Relation directe (coefficient positif) Relation inverse (coefficient négatif) Ou aucune relation (coefficient près de 0) Plus le coefficient est fort, plus les points sont enlignés
Corrélation de Spearman (non paramétrique)
Utilisé quand le relation est curvilinéaire
Transforme les données à intervalles (numériques) en range et cherche a établir ensuite s’il existe un lien monotone (c-a-d croissant ou décroissant) entre les variables
Corrélation partielle:
Quand on pense qu’une relation entre deux variables peut être affectée par des variables parasites
Corrélation partielle de premier ordre, de deuxieme ordre, de troisieme ordre
1er: quand on ne controle qu’une variable parasite
2e: quand on ne controle pas deux variables
3e : 3 variables
Calcul de corrélation partielle de premier ordre
Calculer les corrélations entre la variable parasite et chacune des variables X et Y, puis de retirer ensuite les liens trouvés dans le calcul de la corrélation entre X et Y
Régression linéaire simple:
Objectif premier
Objectif: prédire une mesure continue qui sera inconnue a partir de la connaissance d’une autre mesure continue connue
(La variable a expliquer est connue, ce qu’on désire c’est d’etre capable de la prédire quand elle sera inconnue)
Mesure de X quand on connait la mesure de Y
Régression linéaire simple:
Si deux mesures ne sont pas reliées (corrélation non significative) une prédiction est elle possible?
Non
Régression linéaire simple:
Plus la corrélation est forte….
Plus la prédiction est précise
Avant de faire une Régression linéaire simple, il faut s’assurer qu’il y a….
Une corrélation bivariée significative
Régression linéaire simple:
Quand la corrélation est pratiquement parfaite (+1 ou -1), la ligne de régression est tout simplement…. MAIS, quand pas parfait et que le nuage de points comporte des irrégularités, on doit…..
La droite qui joint tous les points du nuage de points
Estimer où se situe la ligne de régression
Regression linéaire simple:
Formule de prédiction d’une valeur Y à partir d’une valeur X connue
Prédire x quand y est connu
Y = bX + a
a= l'ordonnée à l'origine (quand X=0, combien vaut Y?) b= la pente de la ligne de régression (si j'augmente d'une unité à X, de combien j'augmente d'unité a Y?)
X = bY + a
Relation entre la régression et la corrélation:
Qu’est-ce qu’on obtient en multipliant la pente des deux lignes de régression (X et Y)
On obtient le coefficient de corrélation au carré ( ou coefficient de détermination)
Qu’est-ce que la prédiction d’une mesure X ou Y?
Une estimation d’une mesure lorsqu’on connait l’autre mesure dans tous les cas ou la corrélation est significative, mais non parfaite
Erreur standard (type) de l’estimation:
- qu’est-ce que le résidu?
- calculer l’erreur type
- l’écart entre les valeurs prédites et les valeurs réelles dans la prédiction d’une mesure X ou Y
- la moyenne quadratique de ces résidus (se calcule a l’ordi)
Quand on prédit une valeur d’Y ou X, celle-ci se situe dans une zone allant de…
La valeur prédite moins l’erreur standard d’estimation, à la valeur prédite plus l’erreur standard d’estimation
Calculer à la main l’erreur standard d’estimation:
Formule
Se= Sy racine (1-r2)
Se (erreur type d’estimation) = Sy (écart type de la variable dépendante) x (racine carrée de (1- r2 (coefficient de détermination)
Quels sont les deux types de méthodes d’échantillonnage?
Probabiliste et non probabiliste
Quelle est la différence entre les deux types de méthodes d’échantillonnage?
Échantillonnage probabiliste: chaque unité a une “chance” d’être sélectionnée et que cette chance peut être quantifiée
Échantillonnage non probabiliste: chaque unité à l’intérieur d’une population n’a pas une chance égale d’être sélectionnée
Quelle est la différence entre pramètre et statistique?
Paramètre: mesure utilisée pour décrire la population
Statistique: mesure utilisée pour décrire un échantillon
Je veux étudier la grandeur des nouveau-nés de l’hôpital Ste-Justine en 2017. Je sélectionnerai au hasard 30 dossiers de nouveau-nés. Quel type d’échantillonnage ai-je utilisé?
Échantillons probabilistes
Je veux vérifier s’il existe un lien entre la consommation de cannabis et les résultats scolaires. Quelle est ma variable indépendante?
Quelle est ma variable dépendante?
Indépendante: Consommation de cannabis
Dépendante: résultats scolaires
Je veux vérifier s’il existe un lien entre la consommation de cannabis et les résultats scolaires. Mes résultats démontrent qu’il existe une corrélation entre les deux. Puis-je conclure que fumer conduit à de moins bons résultats scolaires?
Non. Il se peut que fumer soit la cause de moins bons résultats. Mais il se peut aussi qu’avoir de moins bons résultats conduise à fumer. Ou encore que les gens plus sociables tendent à la fois à fumer du cannabis et à prendre lers résultats moins au sérieux.
Quelle est la mesure de tendance centrale la plus utile?
La moyenne
Quelle est la mesure de tendance centrale qui nous donne le résultat au centre de la distribution?
Médiane
Quelle est la mesure de tendance centrale qui nous donne les résultats les plus fréquents?
Mode
Quelle est la mesure du score individuel - la moyenne / écart type?
Distribution normale
Comment nomme-t-on une distribution ou les trois mesures de tendance centrale sont égales?
Score Z
Comment nomme-t-on une distribution que : mode > médiane > moyenne
Skewness (-)
Comment nomme-t-on une distribution que : moyenne > médiane > mode
Skewness (+)
Quels sont les 2 conditions pour qu’une distribution soit considéré normale?
Elle doit être unimodale et symétrique
Quel type de tests je devrai employer si ma distribution a une asymétrie plus petite que < -1
Test non paramétrique
Pour tester la normalité de la distribution, puis-je employer le test de Shapiro-Wilk avec 80 participants?
NON. Shapiro-Wilk = 50 participants et moins
TRUC: nom plus petit donc moins
Pour tester la normalité de la distribution, puis-je employer le test de Kolmogorov-Smirnov avec 80 participants?
OUI. Kolmogorov-smirnov: plus de 50 participants
TRUC: nom plus long donc plus
Quelle mesur me permettra de comparer les résultats d’un joueur de basket ball avec un joueur de hockey?
Score Z. Utile lorsqu’on compare des individus de groupes différents
Dans une distribution normale, quel % des participants ont des résultats près d’une unité de score Z?
68% (34,1 de chaque côté du milieu de la cloche)
Dans une distribution normale, quel % des participants ont des résultats très supérieurs ou très inférieurs à la moyenne (plus ou moins 1,96 unité de score Z)
5% (2,1%) plus petit de chaque coté de la courbe
Quels sont les 4 types d’erreurs de mesure?
1) l’erreur de l’instrument de mesure
2) l’erreur du sujet
3) l’erreur de l’expérimentateur ou interviewer
4) erreur due au hasard
J’ai une population de 1000 individus. Je sélectionne un échantillon de 100 participants pour effectuer une corrélation de Pearson. Quel sera mon degré de liberté?
ddl= 98 : n de mon échantillon 100 - nombre de variables dans la corrélation 2
Je rejette l’hypothèse que mon médicament ait un effet de guérison sur le cancer alors qu’en réalité, il y avait un réel effet. Quel type d’erreur je viens de commettre?
De type 2 l’hypothèse nulle ( que mon médicament n’ai aucun effet) est maintenue alors que c’est faux
Combien de participatns minimum dois-je avoir dans mon échantillon pour massurer d’une distribution déchantillonnage de la moyenne normale?
30 participants et plus
Quel pourcentage de chance que la moyenne de l’échantillon se situe à moins de deux écarts type?
95% (1,96)
Une décision de pouvoir rejeter l’hypothèse nulle repose sur quoi?
- la distribution des indices statistiques
- la table de T (valeurs critiques en fonction de la taille d’échantillonnage)
- la sitribution d’échantillonnage de la moyenne
Lors du test de français de secondaire 5, la moyenne de la population des élèves est de 68%. Un groupe d’étudiants d’une école XYZ a obtenu 71%. Peut-on affirmer que ce groupe est significativement différent de la moyenne?
NON. Tout dépend de combien grand doit être l’écart à la moyenne pour pouvoir rejeter l’hypothèse nulle. La différence significative
Lors du test de français de secondaire 5, la moyenne de la population des élèves est de 68%. Un groupe d’étudiants d’une école XYZ a obtenu 71%. Si 71% se situe dans la zone de rejet: quelle décision je prendrai?
Et si il est dans la zone d’acceptation?
- rejeter l’hypothèse nulle, donc le groupe à un écart significativement différent de la moyenne de la population
- maintenir l’hypothèse nulle. Donc, je ne peux pas affirmer que le groupe a une différence significative à la moyenne de la population.
Un groupe d’étudiant est composé de 20 étudiants. Puis-je utiliser la distribution d’échantillonnage de la moyenne pour prendre une décision?
NON. le n doit être plus grand que 30
Lors du test de français de secondaire 5, la moyenne de la population des élèves est de 68%. Un groupe d’étudiants d’une école XYZ a obtenu 71%.
1) Quelle serait l’hypothèse nulle et l’hypothèse alternative du test de français?
2) Quelle serait-elles si je voulais affirmer que ce groupe est supérieur à la moyenne?
1. Hypothèse nulle: H0: moyenne groupe XYZ = 68 Hypothèse alternative: H1: moyenne groupe XYZ pas = 68 (TEST BILATÉRAL)
2. Hypothèse nulle: H0: moyenne groupe xyz <= 68 Hypothèse alternative H1: moyenne groupe xyz > 68 (TEST UNILATÉRAL)
Suite au calcul de corrélation entre 2 variables, j’obtiens rxy= 0,261; p=0,10. Selon la table de Cohen, comment puis-je définir ma corrélation
Le seuil de signification (p=0,10) n’est pas atteint (p<0,5) pour assurer une corrélation
Suite au calcul de corrélation entre 2 variables, j’obtiens rxy= 0,451; p<0,05. Selon la table de Cohen, comment puis-je définir ma corrélation
On peut parler d’une corrélation moyenne forte
Table de Cohen:
0,10 = faible
0,30= moyenne
0,50 = forte
Quelle donnée nous donne la force de la relation?
La corrélation r
Trouvez l’étendue pour l’ensemble de données suivants:
A) 6/8/11/15/24/38
B) 11/-6/-2/16/9/-8/17/19
C) 6,4/3,8/5,9/4,7/5,3/7,1/3,2
A) 32
B) 27
C) 3,8
Nombre de mariages enregistré par année
1: 40 650
2: 40 812
3: 41 300
4: 41 450
5: 39 594
6: 40 734
7: 39 993
8: 38 814
9: 37 828
10: 35 716
Calculer: A- étendue B- médiane C- les quartiles supérieur et inférieur D- l'écart interquartile
A- 5734
B- 40 321,5
C- q1= 38 814 à Q3 40 812
D- 1998
Comment se nomme le degré avec lequel la connaissance de X permet de réduire l’incertitude de Y?
Coefficient de détermination
Si rxy= 1, quel est mon coefficient de détermination?
100% (degré de certitude)
Coefficient de détermination = degré de relation entre les 2 variables
Si rxy= 0,5 quel est mon degré de relation entre les deux variable?
rxy2 = 0,5 x 0,5 = 25%
= 25% de variance expliqué
=25% de variance partagée
= 25% de degré de relation entre les 2 variables
= 25% de coefficient de détermination
Distribution d’échantillonnage: pour avoir une distribution normale, combien de participants faut-il dans l’échantillon?
30
Distribution d’échantillonnage: si la distribution des données se distribue normalement, on présume que les moyennes….
Se distribuent normalement
Test T: combien de participants faut-il pour atteindre une valeur critique de 1,96?
121
Formulation des hypothèse:
- hypothèse nulle (+ signes)
- hypothèse alternative (+ signes)
H0: hypothèse maintenue jusqu’a preuve du contraire, pour la formuler, on utilise le symbole =
H1: hypothèse qu’on voudrait démontrer. On utilise les symboles pas égal, >,
Erreurs dans les hypothèses:
- erreur de type 1: quand l’hypothèse nulle est rejetée, alors qu’elle est vraie
- erreur de type 2: quand l’hypothèse nulle est maintenue, alors qu’elle est fausse
Étapes d’un test d’hypothèse:
-étape 1
1- formuler l’hypothèse nulle et l’hypothèse alternative
Étapes d’un test d’hypothèse:
-étape 2
2- choisir le seuil de signification du test : noté par la lettre “a” qui est fixé a 0,05 ou moins
Doit aussi se questionner sur la taille de l’échantillon. La taille de l’échantillon détermine la puissance du test d’hypothèse
Étapes d’un test d’hypothèse:
-étape 3
3- déterminer la distribution pour effectuer le test
Étapes d’un test d’hypothèse:
-étape 4
4- définir la région critique : on utilise la table des Z pour déterminer la valeur critique qui correspond au seuil de signification désiré. Si la moyenne Xbarre diffère de 1,96 erreur type ou plus de la valeur hypothétique moyenneH0, il est justifié de rejeter l’hypothèse bulle
Hypothèses: Définitions: -différence significative -région de rejet de l'hypothèse nulle -région d'acceptation
- une différence entre l’estimateur (ex: Xbarre) et la valeur supposée du paramètre (ex: u) qui mène au rejet de l’hypothèse nulle
- constituée de l’intervalle ou les intervalles de valeurs à l’intérieur desquels il est jugé fort improbable (selon “a”) que l’indice statistique se situe
- la région complétmentaire de la ou les régions de rejet
Étapes d’un test d’hypothèse:
-étape 5
5- établir la règle de décision:
Maintenir H0 si la valeur de l’indice statistique se situe dans la région d’acceptation
OU
Rejeter H0 si la valeur de l’indince statistique se situe dans la région de rejet
Étapes d’un test d’hypothèse:
-étape 6
6- faire les calculs nécessaire: calculer la valeur de l’indice statistique qui permet d’estimer le paramètre concerné.
RC = Xbarre - MoyenneH0 (écart-type de l’échantillon/ racine carrée de la taille de l’échantillon)
______________________
ObarreMoyenne
Xbarre= erreur standard de la moyenne (estimation de l’écart type de la moyenne d’échantillonnage de la population lorsque celui-ci est inconnu (écart-type de l’échantillon / racine carrée de la taille de l’échantillon)
Étapes d’un test d’hypothèse:
-étape 7
Prendre la décision
Test bilatéral
-régions de rejet
Lorsqu’on ne peut spécifier de direcion particulière pour l’hypothèse alternative (H1 pas égal a …)
Donc deux régions de rejet (“a”/2)
Test unilatéral
-région de rejet
Quand on peut spécifier une direction particuliere pour l’hypothese alternative (H1 plus petit ou plus grand)
-une seule région de rejet, soit a
Probabilité des erreurs de type 1 et de type 2 (symboles)
1- “a”
2- “B avec longue queue au bas”
Distribution d’échantillonnage de la différence entre deux moyennes (formule)
On calcule la différence de la moyenne des deux échantiollons, donc Xbarre1 - Xbarre2 = d
Formules test T:
Rapport critique
Erreur type de la différence entre deux moyennes d’échantillonnage
Rapport critique:
RC= (Xbarre1-Xbarre2) - Õ
________________________
Õxbarre1-xbarre2
Õxbarre1-xbarre2 =
RACINE ((S1ala2/n1) + (S2ala2/n2))
Test d’hypothèse sur deux moyennes lorsque les écart-type population sont inconnus
On doit les estimer avec l’aide des écarts-types échantillonnaux
Calculer la valeur de T (test T)
La différence des moyennes des échantillons / erreur type de la différence entre les deux moyennes d’échantillonnage
Échelles de mesure nominale
Nommer la catégorie à laquelle chaque observations appartien (ex:prénom, couleur des yeux, etc.)
Il faut attribuer des nombres au variables numériques
(A appartient a la catégorie 1, B à la catégorie 2)
Échelle de mesure ordinale
Mesure la position de chaque observation par rapport aux autres (cette position se nomme le rang)
Ne mesure pas la différences entre les observation (juste dire le cheval #1 est arrivé avant le #2, pas combien de temps)
(A est plus grand que B. A est premier, les autres ne le sont pas)
Échelle de mesure à intervalles:
Mesure la position de chaque individu, mais aussi l’ampleur des différences entres elles
-n’ont pas de point zero
-ex: échelle de Likert
(La différence entre A et B est plus grande que la différence entre B et C)
Échelle de mesure de rapport
Comme intervalle, mais ont un point zero absolu
Ex: la taille, montant d’argent en banque…
Peut dire que qqch est deux fois plus petit que l’autre
Les formes de distribution:
La distribution unimodale
Une seule bosse qui indeique que l’effectif pour une des valeurs ou intervalle de valeurs est plus grande que celle de n’importe quelle valeur (va avec le mode)
Les formes de distribution: distribution bimodale
Contient deux modes.
Les formes de distribution:
Distribution symétrique
La fréquence des valeurs se répartit également des deux côtés de la valeur modale
Les formes de distribution:
Distribution asymétrique
Distribution asymétrique + : valeurs plus étirées du côté droit de l’abscisse
Distribution asymétrique - : valeurs plus à gauche
3 Façons de déterminer la postition d’une observation par rapport aux autres:
- le rang
- le rang percentile
- valeur étalon
3 Façons de déterminer la postition d’une observation par rapport aux autres:
-Le rang
Indique la position de chaque observation sur une échelle de 1 à N (les placer en ordre croissant ou décroissant
3 Façons de déterminer la postition d’une observation par rapport aux autres:
-le rang percentile
Pourcentage fe personnes qui tombent sous cette valeur plus la moitié des personnes qui tombent exactement sur cette valeur.
3 Façons de déterminer la postition d’une observation par rapport aux autres:
-4 étapes pour construire un tableau des percentiles
- compiler la fréquence des notes (1 personne a obtenu 29%, 2 ont obtenus 49%, etc)
- convertir la distribution des effectifs en pourcentage (4e colonne)
- Cumuler les ppircentages pour obtenir un pourcentage cumulatif (5e colonne)
- Calculer: pourcentage inférieur à X + (1/2 x pourcentage de X) = rang percentil
La valeur étalon Z
Indique la position d’une observation par rapport à la moyenne
Plus la valeur étalon Z est loin de zéro, plus la valeur brute qui lui correspond est…
Loin de la moyenne
Calculer la cote Z
(La valeur - la moyenne) / écart type
Exemple cote Z: un étudiant à obtenu 70% à l’examen d’anthropologie et 80% en littérature. Est-il meilleur en littérature qu’en anthropologie? La moyenne et l’écart-type de l’examen d’anthropologie:
Xbarre = 50
s = 10
La moyenne et l’écart-type pour l’examen de littérature
Xbarre = 65
s = 15.
- Convertir les deux performances en valeurs étalons Z. La valeur Z pour l’examen d’anthropologie est (70-50)/10 = +2 (très supérieure à la moyenne). Calculer la valeur étalon Z = (70-65)/15= +0,33. (plutôt proche de la moyenne). La note en anthropologie étant beaucoup plus forte que la note moyenne de sa classe et la note en littérature, étant beaucoup plus proche de la moyenne, nous pouvons alors conclure que l’étudiant est plus fort en anthropologie qu’il ne l’est en littérature
La moyenne d’une distribution en valeur étalon Z est toujours de…
Zéro
L’écart-type d’une distribution en valeur étalon Z est toujours de…
1
Formule pour ramener une valeur étalon à sa valeur initiale brute
X = (ZxS) + Xbarre
X= (Cote Z x écart-type) + moyenne
Valeur étalon T
- A une moyenne de..
- A un écart-type de…
Moyenne: 50
Écart-type: 10
Comment calculer la valeur étalon T
T = (10xZ) + 50
même calcul que valeur étalon Z