Examen 1 Flashcards
3 définition de la statistique
1-Mathématique de l’expérimentation
2-Ensemble de méthode à partir des quelles on recueille, organise, résume, présente et analyse des données afin d’en tirer des conclusions et de prendre des décisions.
3-Étude scientifique des données numériques décrivant les variations naturelles.
Distinguer le mot statistique4
1-Domaine scientifique (les trois définitions déjà vue)
2-Une statistique=Une quantité, un paramètre.
3-Statistique estimée=moyenne, variance
4-Des statistiques=Des données ex: quantité de neige…
Pourquoi utiliser la statistique?4
À cause de la très grande variabilité: 1- Intrinsèque du matériel biologique 2-génétique entre les individus 3-due au développement des individus 4-Des réactions d'un même individu à différents moments
Quel effort doit-on faire en statistique?
L’abstraction :passer d’une sorte de recherche à une autre. ex: Absence ou présence d’oiseaux dans une région, pourrait être pareil a des personnes qui ont ou non la dépression.
Définition d’élément2
1-Unité qui composent une population
2-Synonymes: Objet, individu, unité d’échantillonnage, sujet, événement, comportement, localité, parcelle, observation, prélèvement, entité…
Définition de population?
Ensemble des éléments visés en principe, par une problèmatique scientifique
Définition d’inférence?4
1-Porter un jugement sur un ensemble vaste (population statistique) à partir d’un sous-ensemble (l’échantillon) avec l’application des lois de probabilités.
2-Passer de l’échantillon à la population.
3-Pour qu’il y ai une bonne inférence statique l’échantillon doit-être représentatif et précis pour mesurer la caractéristique de la population.
4- L’inférence permet d’estimer ou de déterminer le résultat dans la population le plus près de la réel réalité possible
Définition de recensement?
Tout les sujet de la population sont examinés.
Définition d’échantillonnage?4
1-Une partie des sujets de la population sont examinés.
2-Plusieurs échantillons peuvent être constitués.
3-L’échantillon en lui-même n’est pas intéressant, ce sont les conclusions sur la population que l’on peut en tirer de son observation qui en fait l’intérêt=inférence
4-L’échantillonnage aléatoire et exhaustif (recensement) sont deux bonnes façons.
Quel sont les facteurs qui influencent la précision de l’inférence?2
1-La représentativité de l’échantillon (méthode d’échantillonnage).
2-Taille de l’échantillon
La taille de l’échantillon est un compromis entre le degré de précision à atteindre et le budget de l’enquête ainsi que le temps qu’on à sur?3
1-Variabilité des caractéristiques (phénomènes) que l’on mesure.
2-La taille de la population (plus l’échantillon est gros, plus il se rapproche de la réalité).
3-Les méthodes d’échantillonnage et d’estimation.
Définition d’échantillon?2
1-Partie de la population sur lequel je vais faire des mesures (observation).
2-Échantillon représentatif:Qui reflète fidèlement la complexité et la composition de la population
Définition d’échantillon aléatoire?2
1- Il doit être représentatif de la population dont il est extrait.
2-Si il y a 1000 étudiants qui ont une chance sur 1000 d’être sélectionner. Donc chaque élément de la population a une probabilité connue et non nulle d’appartenir à l’échantillon.
Définition d’échantillon aléatoire simple?
Prélèvement au hasard et de façon indépendante, d’un certain nombre n d’élément de la population statistique de N éléments= Chaque élément de la population doit avoir la même probabilité d’être sélectionné.
Définition de variable?2
1-Toute caractéristique mesurable ou observable sur un élément d’échantillonnage (var. propre) ou sur son environnement (var. associée).
2-Synonyme:Descripteur, caractère, attribut, trait, profile, item, stimulus (en étude du comportement).
Quel sont les deux types de statistique?
1-Descriptive.
2-Inférentielle.
À quoi sert la statistique descriptive (ou exploratoire)?3
1-Décrire une variable, un lien entre variable, un tableau de chiffres.
2-Visualiser grâce à des représentations adaptées un ensemble de données complexes.
3-Résumer une série de valeur par des indices.
À quoi sert la statistique inférentielle?4
1-Généraliser un résultat observé sur un échantillon à toute la population.
2-Réfuter une hypothèse grâce à l’utilisation de critères fiables et contrôlables.
3-Prévoir un résultat numérique à partir d’un échantillon.
4-Estimer des paramètres auxquels on n’a pas accès.
Nommez les deux grand types de constructions/méthodes?
1-Les tests hypothèses.
2-Modèles mathématique: Prévision mathématique ou non (Les modèle sont des construction mathématique ou non).
Quels sont les deux choses à retenir en statistique?
1-Exactitude (justesse): Écart d’une série de mesures de contrôle par rapport à la valeur vraie.
2-Précision: Variabilité de mesures de contrôle répétées. (C’est pour ça qu’il faut montrer pas seulement la moyenne mais les variations qui existe.
Pourquoi les statistiques et probabilités ne sont pas intuitives?6
1-Car on a tendance à passer aux conclusions.
2-Tendance à être trop confiant.
3-Voire des structures dans les données aléatoires.
4-Coïncidence sont fréquentes mais elles ne peuvent pas être prédites.
5-Tendance à ignorer les explications alternatives.
6-Dupés par la régression vers la moyenne ex: Les parents qui sont grands on tendance à avoir des enfants plus petits qu’eux et les parents qui sont petits des enfants plus grands qu’eux.
Qu’est ce que l’inflation?
Le dollar qui perd de la valeur.
En statistique la question est de savoir si toutes les erreurs ne sont pas voulues et s’il n’y a pas de l’abus pour jouer avec les résultat dû à quoi?5
1-Mauvais échantillonnage. 2-Petit échantillons. 3-Graphique déformés et pictographies. 4-Questions surchargées. 5-Corrélation et cause-effet.
La distribution bimodale est affectée par quoi?
Par exemple le sexe mâle/femelle.
S’il y a des données exceptionnelles que doit-on faire?4
1-Vérifier la mesure, pourquoi elles sont exceptionnelles. Si on la rejette expliquer pourquoi. Si on la garde démontrer pourquoi.
2-Tenir compte de la variation au tour de la moyenne.
3-Vérifier si la distribution des données est normales, est-elle symétrique? Si non est-elle lié à d’autre facteur.
4-Exploration des données: Combien de zéro?
Quels question doit-on se pauser pour les Intervalles de confiance et pourquoi?3
1-Est-ce que cette augmentation est vérifiable statistiquement?
2-Est-ce qu’elle a un impact au niveau pratique pour moi?
3-Car même si c’est statistiquement vrai, ça ne veut pas dire que dans la vie réelle cela est pratique.
Pourquoi les scientifiques n’apprécient pas les graphiques en 3D?
Car il sont difficile à lire et biaisés dans la vision
Les graphique à tartes (circulaire), peuvent servir pour la vente d’un produit mais pas pour?
Les années, car il servent à montrer des proportions dont la sommes est de 100%
De quel façon ne faut-il pas interpréter les graphique?
De la cause à effet.
Les surfaces de graphique peuvent visuellement quoi?
Nous induire en erreur.
Quel sont les trois points d’introduction à la démarche scientifique?3
1-La question: L’objectif d’une recherche est de répondre à une question
2-La problématique: C’est le pourquoi
3-l’hypothèse:Proposition liée à la définition de la problématique qui peut être vérifiée par une recherche
Sur quel shéma doit-on se baser pour émettre un hypothèse?10
1-Quel sorte d’approche
2-Quel élément
3-Quel population statistique
4-Quel variable
5-Quel plan et stratégie d’échantillonnage (définir comment je vais choisir les personnes)
6-Quel type de traitement je vais utiliser(placebo etc)
7-Quel méthode analyse et statistique je veux faire (Au début je dois savoir quelle expérience je veux faire pour savoir quel méthode je vais appliquer
8-Faire la préparation (mettre tout en place, faire une collecte de données, faire le traitement informatique et interpréter)
9-Interpréter les résultats
10-conclusion avec nouvelle question pour repartir une nouvelle expérience.
Nommez les trois types d’expérience scientifique?3
1-Descriptive: Obtenir une image aussi précise et fidèle que possible d’une situation ou d’un phénomène particulier (dresser un bilan, définir quelque chose)
2-Expérimentale:Observer dans des conditions contrôlées l’effet de la variation d’une ou plusieurs variables sur l’état d’un phénomène étudié. Travailler avec une question à la fois (Comparaison entre des groupes témoins et traités).
3-Quasi expérimentale:Entre descriptive et expérimentale ex: avec des arbres adultes je ne peux pas travailler dans une serre. Utiliser lors de contrainte qui empêche le modèle expérimentale dans son milieu naturel.
Dans un échantillonnage aléatoire simple que peut-on retrouver? Il est fait par quoi et c’est le quoi?
Des groupes, c’est fait par ordinateur et c’est le meilleur.
Parlez de l’échantillonnage stratifié
Les échantillons doivent tomber de façon précises ou presque dans différente partie ex: Échantillon au Québec, il doit y avoir des échantillon dans toute les régions
Parlez des échantillonnage de deuxième degré?
Je fait un premier échantillonnage aléatoire et après je joint des éléments qui sont à côté ou lié au premier ex:Je fait un premier échan. aléa. pour les sapin et après je rajoute les arbres qui poussent autour des sapins.
Avantage d’échantillonnage systématique et en quiconce
Tous sont représentés et répartie également
Quand il y a périodicité d’un phénomène l’échantillonnage systématique n’est pas approprié pourquoi?
Car il peut-être toujours sur le même point ex: dune de sable au 13 pied tombe toujours sur les plante sur le bout de la dune.
Quel sont les deux choix de sélection aléatoire simple?
1-Avec remise:Il peut-être choisis plusieurs fois.
2-Sans remise: Il ne peut pas être choisi de nouveau (c’est habituellement le cas)
Nommez les 7 étapes du processus d’échantillonnage?
1-Définir l'univers 2-Identifier les éléments 3-Méthode d'échantillonnage 4-nombre d'échantillon 5-taille d'échantillon 6-sélection des éléments 7-Réalisation du travail
Qu’est-ce une série statistique simple?
Une seule variable observée pour un ensemble d’éléments.
Qu’est-ce qu’une série de statistique double?
Ensemble d’élément à observer
Que montre un tableau de distribution de fréquences?
Comment les données d’une variable se répartissent dans différentes classe de valeurs ou différentes catégories
Quel est le types de variable à deux états?
Binaire:0 et 1 ou présence et abscence
Quel est le type de variable à plusieurs états?4
1-Nominale:1.1-Variables qualitatives
1.2-Données classifiées en catégories mutuellement exclusive,
1.3- L’ordre des catégories n’est pas considéré
1.4- La distance entre les classes est ignorée
ex:Le sexe (M-F), L’état d’un malade (sain-malade)
la Couleur
2-Ordinale:2.1-Variables qualitatives
2.2-Données classifiées en rang
2.3- Le critère de classification est connu
2.4-La distance entre les classe n’est pas connue
ex: Amélioration des patients (nulle, moyenne…)
Stade de développement [bébé, enfant, ado
3-Échelle de variation par intervalle:3.1-Variables quantitatives
3.2-La distance qui sépare deux données ou deux classes est connue
3.3- La position du zéro est arbitraire
ex:Degré Celsius ou Fahrenheit
Phénomène cyclique (date-heure-point cardinaux)
4-Échelle de variation Relative:4.1-Variables quantitatives
4.2-L’intervalle est connu et des rapports peuvent être déterminés
4.3-Le zéro = 0
4.4-Discrète ou continue
ex:Degré Kelvin
Nombre d’entité
Mesure: longueur,
Superficie, volume, capacité, masse, durée, densité, pression
Définir le type de variable pour le temps nécessaire pour répondre à un sondage?
Variable quantitative avec une échelle relative
Définir le type de variable pour La propension de vote pour un partie politique?
Variable qualitative nominale
Définir le type de variable pour l’appréciation d’un vin
Variable qualitative ordinale (bon, pas bon)
Définir le type de variable pour le taux d’anxiété d’une personne?
Variable qualititative ordinale (un peu, moyen, beaucoup)
Ou nominale binaire (Pas stressé, beaucoup etc)
Nommez les types de représentations graphique?6
1-En bâton 2-Polygone de fréquence 3-de part de tarte 4-à moustache 5-Histogramme 6-courbe de fréquence
Le diagramme en bâton est bon pour quoi?
Pour les variables quantitatives et qualitatives (on ne peu pas avoir 50,2 élèves)
Que représente-on sur l’abscisse (l’axe horizontale x)?
La valeur de la variable discontinue (ou discrète) ou la catégorie de la variable qualitative.
Que représente-on sur l’ordonnée (l’axe verticale y)?
Les effectifs de classe, les fréquences relatives ou les fréquence cumulées.
Décrivez l’histogramme?2
1-Il utilise des variables quantitatives continues
2-Rectangle dont les bases sont égales à l’intervalle de la classe et les hauteurs à l’effectif de la classe (ni) ou à la fréquence relative (fi)
Décrivez l’histogramme de fréquence?3
Permet d’examiner trois caractéristiques de la distribution de fréquence:
1-La forme (aplatie, pointu etc)
2-Les valeurs de tendance centrale (Valeur ou catégorie plus représenté)
3-Variabilité des valeurs (étendue de la variation, nombre de catégorie)
Le polygone de fréquence convient à quoi?
Aux variables quantitatives continue
Le diagramme à moustache sert pour quoi?7
1-Les variables quantitatives
2-Permet de représenter la médiane
3-L’écart interquatile
4-L’étendue de la distribution
5-Les valeurs exceptionnelles
6-Moustache courte:Distribution moins éparpillée
7-Moustache longue:Distribution plus éparpillée
À quoi sert le diagramme circulaire (à tarte)?2
1-Variable quantitative dont la somme est de 100%
2-Subdivise un cercle en secteur dont l’angle est proportionnel à l’effectif de la catégorie
Pourquoi faut-il faire l’élaboration des données?3
1-Pour bien organiser les mesures récoltées
2-Pour bien représenter les mesures( donner un message simple et rapidement)
3-Comprendre les phénomènes.
Comment peut-on utilises une base de donner?4
1-À la mains
2-La calculatrice
3-avec Excel
4-Avec des programme spécifique de stsatistique
Quel sont les 3 phases pour procéder avec les données?
1ère phase: 1-Formulation d'une hypothèse 2-Planification de l'expérience 3-Préparation de l'expérience 4-Récolte de donné 2ième phase: 1-Organisation des données 2-Élaboration des données 3ième phase: 1-Compréhension et interprétation des résultats 2-Acceptation ou refus des hypothèses
Décrire le type de variables Qualitative?
1-Nominale :décrit un nom ou une catégorie. Contrairement à une variable ordinale, les noms ou les catégories possibles ne suivent pas un ordre naturel. Le sexe et le genre de logement en sont des exemples.)
2-Ordinale:est une variable dite catégorique dans laquelle les catégories possibles peuvent être classées dans un ordre spécifique ou dans un ordre naturel quelconque. Dans le tableau 2, la variable « comportement » est ordinale parce que la catégorie « Excellent » est meilleure que la catégorie « Très bon », etc. On n’y trouve un certain ordre naturel, mais celui-ci est limité par le fait que nous ne savons pas dans quelle mesure le comportement « Excellent » est meilleur que le comportement « Très bon ».
Décrire le type de variables Quantitative (relative)?
1-Variable Discrète: C’est une valeur que l’on peut compter précisément ex:Le nombre de chien…
2-Variable Continue:Plusieurs valeurs entre un certain intervalle (4,34566, plusieurs décimale) Ex:Le temps de réalisation d’une tâche, la taille, le poids d’une personne,
la vitesse d’une voiture.
Comment fait -on la classification des données?
En groupe homogènes (voir l’exemple dans mon cahier sur la sensibilité de la peau.
Désavantage de la classification homogène en colonne?
Très long à lire et fichier trop lourd
Avantage de la classification homogène en colonne?6
1-Une seule ligne pour nommer les variables (titre de colonne)
2-Facile pour la production des graphiques
3-Facile pour regrouper des données
4-On peut mettre plusieurs variables ensemble
5-L’ordre n’est pas important, on peut ajouter des données n’importe quand et avoir des résultats préliminaires.
6-Les colonnes sont les variable et les lignes les observations des ces variables
La description des séries statiques se fait par quoi?3
Et sert à quoi?
Les paramètres de:1-Position
2-dispersion
3-forme
Ils servent à décrire des séries statistique
Quels sont les paramètres de position?3
1-La moyenne(-x)
2-La médiane (Me)
3-Le mode (Mo)
Qu’est-ce que la moyenne et sa formule?
1-Donnée qui représente le centre d’équilibre d’une distribution
2-Lorsqu’il est question de la moyenne d’un échantillon, le symbole x¯¯¯ est souvent utilisé.
Par contre, lorsqu’on fait référence à la moyenne d’une population, on utilisera la lettre grecque μ.
3-Sommes de toutes les données divisé par le nombre de données
Qu’est-ce que la Médiane et sa formule?
1-Mesure de tendance centrale qui indique le centre de la série de données. En d’autres mots, c’est la valeur qui sépare une distribution ordonnée en deux groupes qui contiennent le même nombre de données.
2- Si n est un nombre impair, alors n+1/2 sera un nombre entier et on pourra aller chercher directement la médiane.
3-Si n est un nombre pair, alors n+1/2 sera un nombre décimal. Dans ce cas, on détermine la médiane en faisant la moyenne des données centrales de la distribution.
Qu’est-ce que le Mode?
1-Le mode Pour les variables qualitatives ou quantitative discrètes, est la valeur ou la modalité dont l’effectif est le plus élevé. En d’autres mots, le mode correspond à la donnée qui est la plus fréquente. Pour une variable quantitative continue, on divise celle-ci en classes.
2-La classe modale est l’intervalle de valeurs dont l’effectif est le plus élevé. Pour avoir une estimation du mode, il suffit de prendre la donnée centrale de la classe modale.
Où se situerons les paramètres de position dans une distribution symétrique?
Presque tous à la même place
Où se situerons les paramètres de position dans une distribution asymétrique à droite?
1-Le mode est au début où le graphique est plus haut
2-La médiane est au centre
3- La moyenne plus à droite où le graphique est plus bas
Où se situerons les paramètres de position dans une distribution asymétrique gauche?
1-Le mode est à la fin où le graphique est plus haut
2-La médiane est au centre
3- La moyenne plus à gauche où le graphique est plus bas
Qu’est ce que le percentile?
Chacune des valeurs qui divisent les données triées en ordre croissant en 100 part égales de sorte que chaque partie représente 1/100 de l’échantillon de la population. Si les deux parties sont d’égale importance il sagi de la médiane
Qu’est ce que le premier quartile?
Le 1er quartile sépare les 25 % inférieurs des données. C’est si la première partie comporte 25% des valeurs
Qu’est ce que le troisième quartile?
Le 3e quartile (75%) sépare les 25 % supérieurs des données. C’est s’il y à 75% des valeurs
Qu’est ce qu’un quartile?
un quartile est chacune des trois valeurs qui divisent les données triées en quatre parts égales, de sorte que chaque partie représente 1/4 de l’échantillon de population.
Qu’est ce que le deuxième quartile?
C’est la médiane (50%) de la série ;
Dans le paramètre de dispersion, que représente l’étendue de la variable?
Représente la variabilité ou l’étendue des différentes valeurs que peut prendre une variable.
Qu’est ce que l’étendue?
L’étendue est la différence entre la valeur maximale et la valeur minimale du caractère statistique.
étendue(d) = xmax-xmin
Dans le paramètre de dispersion, que représente la variance?6
1-La variance et l’écart type sont similaire, mais la variance est au carré et pas l’écart type.
2-On utilise habituellement s2 pour des échantillons ou σ2, pour la population.
3- Ce définie comme la moyenne du carré des écarts à la moyenne des valeurs de la distribution.
4-Si tous les xi sont égaux, la variance est nulle puisque tous les termes composant la somme des distances quadratiques sont nuls.
5-La variance augmente au fur et à mesure que la variabilité augmente, elle mesure donc la variabilité des données.
6-Pour mesurer la variance il faut disposer d’au moins deux observations.
Dans le paramètre de dispersion, que représente l’écart type?
C’est la racine carré de la variance σ2 ou S2
Dans le paramètre de dispersion, que représente le coefficient de variation CV? (se rappeler de cette formule)3
1- C’est le rapport de l’écart-type à la moyenne. Plus la valeur du coefficient de variation est élevée, plus la dispersion autour de la moyenne est grande. Il est généralement exprimé en pourcentage. Sans unité, il permet la comparaison de distributions de valeurs dont les échelles de mesure ne sont pas comparables.
2-Ce coefficient n’a aucune unité. Utiliser avec les variables quantitatives à échelle de variation relative (vrai zéro)
3-CV= 100*sx/_x (s représente l’écart-type de l’échantillon et _x la moyenne de l’échantillon
Dans le paramètre de dispersion, que représente l’écart interfactile?2
1-L’écart interfactile est la distance séparant un fractile (percentile) de son complément.
2-L’écart interfactile le plus utilisé est l’écart interquartile
Dans le paramètre de la forme, à quoi sert le coefficient d’asymétrie ? Et quel sont ses propriétés? (skewness en anglais)2
1-Mesurer le manque de symétrie d’une distribution (moment de 3e ordre, symbole: a3)
2-Propriété:
Pour une distribution symétrique: a3=0
Pour une distribution allongée vers la droite: a3»0
Pour une distribution allongée vers la gauche : a3«0
Dans le paramètre de la forme, à quoi sert le coefficient d’aplanissement? (Kurtosis en anglais). Et quel sont ses propriétés?2
1-Mesure le degré d’applanissement d’une distribution (moment de 4e ordre, symbole:a4
2-Propriété:
Pour une distribution normale: a4=0
Pour une distribution leptokurtique (plus pointue que la courbe normale):a4»0
Pour une distribution platikurtique (plus aplatit que la courbe normale): a4«0
Les principes d’inductions sont basée sur quoi?
Sur le respect des lois de la probabilité de distribution théorique des données.
Plus mon échantillon est gros, plus j’ai de une courbe comment?
Régulière en forme de cloche et plus il y a de chance de convergence vers une loi.
Quel sont les caractéristique d’une loi normale?6
1-forme de cloche 2-symétrie 3-infinie 4-point d'inflexion (changement de concavité) changement de côté 5-moyenne:sommet 6-Écart type: Aplatissement
La loi normale s’appelle la loi de?
Loi de Gauss Laplace N(m, Q)
Pour simplifier la loi normale on utilise quoi?
La loi normale centrée-réduite afin de calculer les probabilité
Pour avoir une idées objective d’un résultat, il faut interpréter les résultat en vérifiant le seuil de 0,05, si le P= est plus petit que 0,05 ou plus grand , le test est comment?
Si le P= est plus petit que 0,05:Le test est significatif
Si le P= est plus grand que 0,05: Le test est non significatif
Pourquoi utiliser l’intervalle de confiance?
Car les valeurs des paramètres utilisées dans la statistique descriptive (moyenne, variance, etc.) sont calculées à partir d’un échantillon aléatoire représentant les populations statistiques
Quel sont les intervalles de confiance d’un paramètre?2
1-Intervalle à l’intérieur duquel peut se situer la vrai valeur du paramètre de la population
2-Estimé en fonction d’un coefficient de risque à qui représente la probabilité de se tromper lorsqu’on affirme que la valeur du paramètre dans la population statistique, se situe à l’intérieur de l’intervalle donnée
Parlez du coefficient de risque a (alpha)?3
1-Par convention: a=0,05 ou 0,01 ou 0,001.
2-Plus le Alpha est petit plus je suis certain de mon résultat donc=0,001
3-La moyenne de la population ce situe entre l’intervalle de l’alpha soit 0,05 si je veux plus toucher la moyenne j’utilise 0,001
Plus j’augmente l’écart type plus mon intervalle de confiance sera comment?
Large
Définition de la formulation des hypothèses statistiques?
C’est un énoncé, une affirmation concernant les caractéristiques (valeurs des paramètres, forme de la distribution des observations ) d’une population
Il y a deux hypothèses statistiques?3
1-L’hypothèse principale:Ho=C’est l’hypothèse nulle. Ho=l’histograme= (égale) à la lois normale
2-L’hypothèse alternative: H1= C’est l’hypothèse contraire à Ho. H1+l’histograme (n’égale pas) la lois normale
Si l’une est vrai l’autre doit-être rejetée
3-Toujours dire oui c’est vrai mais avec t’elle possibilité d’erreur
Qu’est-ce que le test statistique?
Procédure qui permet de décider si Ho doit être accepté ou rejeté au profit de H1
Qu’est-ce que le test d’hypothèse?2
1-Test statistique et région critique d’un test.
2-La zone d’acceptation de H0 a une taille relative égale à 1-a et la zone de rejet aussi appelée région critique à une taille relative égale à a
Le risque d’erreur est déterminé par un test d’erreur qui comporte deux risque d’erreurs de décision expliquez?5
1-Erreur de type 1: rejette Ho alors cette hypothèse est vrai, probabilité a
2-Erreur de type 2: Accepte Ho alors qu’elle est fausse, probabilité B
3- On connaît toujours le risque a puisque c’est déterminé par le test
4-Dans bien des cas on ne connaît pas le risque B. Il peut-être déterminé par une analyse de puissance (power analyse) qui devrait être calculé avec d’autre type d’analyse
5-En résumé: Décisions
États de Ho–Ne pas rejeter Ho–Rejeter Ho
Ho est vrai– Bonne décision-E1=erreur de type 1 ou a
Ho fausse–E2=erreur de type 2 ou B-Bonne décision
Test unilatérale et bilatérale dépend de quoi?
De la région critique considérée
Décrivez le test bilatérale
Bilatérale (two-tailed)= La région critique se trouve de chaque côté de la distribution de la statistique
Quand on ne peu pas orienter notre hypothèse c’est bilatérale
Décrivez le test unilatérale?
unilatérale (one-tailed)=La région critique n’est définie que d’un côté de la distribution de la statistique (soi à gauche ou à droite)
Nommez et décrivez les deux types d’échantillonnage?2
1-Indépendant (échantillonnage aléatoire des éléments) il n’y a aucun lien entre les éléments.
2-Apparié=Si les éléments du premier échantillon sont associés aux éléments du deuxièmes échantillon. Les échantillons appariés forment n paires d’él`éments ex: Deux échantillons qui sont mesurée 2 fois comme donner un médicament dans le temps.
Qu’est-ce qu’un test paramétrique?
Basé sur la loi normale
Qu’est-ce qu’un test non paramétrique?
La loi de la distribution n’est pas connue ou est différente de la loi normale
Parlez de la loi normale?
Elle s’applique aux variables quantitatives continues
La probabilité d’observer une valeur comprise entre -1,96 écart type et + 1,96 écart type autour de la moyenne est de combien?
95%
La probabilité d’observer une valeur comprise entre -1 écart type et +1 écart type autour de la moyenne est de combien?
68%
La moyenne d’une variable normale centrée réduite est égale à?
0
L’écart type d’une variable normale centrée réduite est égale à?
1
Si il y a plus de 50 données on prend quel test de normalité?
Kolmogorov-Smirnov
Si il y a moins de 50 données on prend quel test de normalité?
Shapiro-Wilk
Pour vérifier si la courbe suit la loi normale ou non. On fait le test de normalité. Pour interpréter le test de normalité on utile le seuil de normalité de 0,05 lorsque le résultat est en haut de 0,05 cela veux dire quoi?
Qu’il est non significatif donc les données suivent la courbe de la loi normale. L’histogramme de la distribution de fréquence n’est pas différent de la courbe normale
Pour interpréter le test de normalité on utile le seuil de normalité de 0,05 lorsque le seuil est en bas de 0,05 cela veux dire quoi?
Qu’il est significatif donc les données ne suivent pas la courbe de la loi normale.Notre distribution est statiquement différent de la loi normale