Examen 1 Flashcards

1
Q

3 définition de la statistique

A

1-Mathématique de l’expérimentation
2-Ensemble de méthode à partir des quelles on recueille, organise, résume, présente et analyse des données afin d’en tirer des conclusions et de prendre des décisions.
3-Étude scientifique des données numériques décrivant les variations naturelles.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Distinguer le mot statistique4

A

1-Domaine scientifique (les trois définitions déjà vue)
2-Une statistique=Une quantité, un paramètre.
3-Statistique estimée=moyenne, variance
4-Des statistiques=Des données ex: quantité de neige…

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Pourquoi utiliser la statistique?4

A
À cause de la très grande variabilité:
1- Intrinsèque du matériel biologique
2-génétique entre les individus
3-due au développement des individus
4-Des réactions d'un même individu à différents moments
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quel effort doit-on faire en statistique?

A

L’abstraction :passer d’une sorte de recherche à une autre. ex: Absence ou présence d’oiseaux dans une région, pourrait être pareil a des personnes qui ont ou non la dépression.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Définition d’élément2

A

1-Unité qui composent une population
2-Synonymes: Objet, individu, unité d’échantillonnage, sujet, événement, comportement, localité, parcelle, observation, prélèvement, entité…

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Définition de population?

A

Ensemble des éléments visés en principe, par une problèmatique scientifique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Définition d’inférence?4

A

1-Porter un jugement sur un ensemble vaste (population statistique) à partir d’un sous-ensemble (l’échantillon) avec l’application des lois de probabilités.
2-Passer de l’échantillon à la population.
3-Pour qu’il y ai une bonne inférence statique l’échantillon doit-être représentatif et précis pour mesurer la caractéristique de la population.
4- L’inférence permet d’estimer ou de déterminer le résultat dans la population le plus près de la réel réalité possible

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Définition de recensement?

A

Tout les sujet de la population sont examinés.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Définition d’échantillonnage?4

A

1-Une partie des sujets de la population sont examinés.
2-Plusieurs échantillons peuvent être constitués.
3-L’échantillon en lui-même n’est pas intéressant, ce sont les conclusions sur la population que l’on peut en tirer de son observation qui en fait l’intérêt=inférence
4-L’échantillonnage aléatoire et exhaustif (recensement) sont deux bonnes façons.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quel sont les facteurs qui influencent la précision de l’inférence?2

A

1-La représentativité de l’échantillon (méthode d’échantillonnage).
2-Taille de l’échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

La taille de l’échantillon est un compromis entre le degré de précision à atteindre et le budget de l’enquête ainsi que le temps qu’on à sur?3

A

1-Variabilité des caractéristiques (phénomènes) que l’on mesure.
2-La taille de la population (plus l’échantillon est gros, plus il se rapproche de la réalité).
3-Les méthodes d’échantillonnage et d’estimation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Définition d’échantillon?2

A

1-Partie de la population sur lequel je vais faire des mesures (observation).
2-Échantillon représentatif:Qui reflète fidèlement la complexité et la composition de la population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Définition d’échantillon aléatoire?2

A

1- Il doit être représentatif de la population dont il est extrait.
2-Si il y a 1000 étudiants qui ont une chance sur 1000 d’être sélectionner. Donc chaque élément de la population a une probabilité connue et non nulle d’appartenir à l’échantillon.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Définition d’échantillon aléatoire simple?

A

Prélèvement au hasard et de façon indépendante, d’un certain nombre n d’élément de la population statistique de N éléments= Chaque élément de la population doit avoir la même probabilité d’être sélectionné.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Définition de variable?2

A

1-Toute caractéristique mesurable ou observable sur un élément d’échantillonnage (var. propre) ou sur son environnement (var. associée).
2-Synonyme:Descripteur, caractère, attribut, trait, profile, item, stimulus (en étude du comportement).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quel sont les deux types de statistique?

A

1-Descriptive.

2-Inférentielle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

À quoi sert la statistique descriptive (ou exploratoire)?3

A

1-Décrire une variable, un lien entre variable, un tableau de chiffres.
2-Visualiser grâce à des représentations adaptées un ensemble de données complexes.
3-Résumer une série de valeur par des indices.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

À quoi sert la statistique inférentielle?4

A

1-Généraliser un résultat observé sur un échantillon à toute la population.
2-Réfuter une hypothèse grâce à l’utilisation de critères fiables et contrôlables.
3-Prévoir un résultat numérique à partir d’un échantillon.
4-Estimer des paramètres auxquels on n’a pas accès.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Nommez les deux grand types de constructions/méthodes?

A

1-Les tests hypothèses.

2-Modèles mathématique: Prévision mathématique ou non (Les modèle sont des construction mathématique ou non).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Quels sont les deux choses à retenir en statistique?

A

1-Exactitude (justesse): Écart d’une série de mesures de contrôle par rapport à la valeur vraie.
2-Précision: Variabilité de mesures de contrôle répétées. (C’est pour ça qu’il faut montrer pas seulement la moyenne mais les variations qui existe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Pourquoi les statistiques et probabilités ne sont pas intuitives?6

A

1-Car on a tendance à passer aux conclusions.
2-Tendance à être trop confiant.
3-Voire des structures dans les données aléatoires.
4-Coïncidence sont fréquentes mais elles ne peuvent pas être prédites.
5-Tendance à ignorer les explications alternatives.
6-Dupés par la régression vers la moyenne ex: Les parents qui sont grands on tendance à avoir des enfants plus petits qu’eux et les parents qui sont petits des enfants plus grands qu’eux.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Qu’est ce que l’inflation?

A

Le dollar qui perd de la valeur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

En statistique la question est de savoir si toutes les erreurs ne sont pas voulues et s’il n’y a pas de l’abus pour jouer avec les résultat dû à quoi?5

A
1-Mauvais échantillonnage.
2-Petit échantillons.
3-Graphique déformés et pictographies.
4-Questions surchargées.
5-Corrélation et cause-effet.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

La distribution bimodale est affectée par quoi?

A

Par exemple le sexe mâle/femelle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

S’il y a des données exceptionnelles que doit-on faire?4

A

1-Vérifier la mesure, pourquoi elles sont exceptionnelles. Si on la rejette expliquer pourquoi. Si on la garde démontrer pourquoi.
2-Tenir compte de la variation au tour de la moyenne.
3-Vérifier si la distribution des données est normales, est-elle symétrique? Si non est-elle lié à d’autre facteur.
4-Exploration des données: Combien de zéro?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Quels question doit-on se pauser pour les Intervalles de confiance et pourquoi?3

A

1-Est-ce que cette augmentation est vérifiable statistiquement?
2-Est-ce qu’elle a un impact au niveau pratique pour moi?
3-Car même si c’est statistiquement vrai, ça ne veut pas dire que dans la vie réelle cela est pratique.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Pourquoi les scientifiques n’apprécient pas les graphiques en 3D?

A

Car il sont difficile à lire et biaisés dans la vision

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Les graphique à tartes (circulaire), peuvent servir pour la vente d’un produit mais pas pour?

A

Les années, car il servent à montrer des proportions dont la sommes est de 100%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

De quel façon ne faut-il pas interpréter les graphique?

A

De la cause à effet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Les surfaces de graphique peuvent visuellement quoi?

A

Nous induire en erreur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Quel sont les trois points d’introduction à la démarche scientifique?3

A

1-La question: L’objectif d’une recherche est de répondre à une question
2-La problématique: C’est le pourquoi
3-l’hypothèse:Proposition liée à la définition de la problématique qui peut être vérifiée par une recherche

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Sur quel shéma doit-on se baser pour émettre un hypothèse?10

A

1-Quel sorte d’approche
2-Quel élément
3-Quel population statistique
4-Quel variable
5-Quel plan et stratégie d’échantillonnage (définir comment je vais choisir les personnes)
6-Quel type de traitement je vais utiliser(placebo etc)
7-Quel méthode analyse et statistique je veux faire (Au début je dois savoir quelle expérience je veux faire pour savoir quel méthode je vais appliquer
8-Faire la préparation (mettre tout en place, faire une collecte de données, faire le traitement informatique et interpréter)
9-Interpréter les résultats
10-conclusion avec nouvelle question pour repartir une nouvelle expérience.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Nommez les trois types d’expérience scientifique?3

A

1-Descriptive: Obtenir une image aussi précise et fidèle que possible d’une situation ou d’un phénomène particulier (dresser un bilan, définir quelque chose)
2-Expérimentale:Observer dans des conditions contrôlées l’effet de la variation d’une ou plusieurs variables sur l’état d’un phénomène étudié. Travailler avec une question à la fois (Comparaison entre des groupes témoins et traités).
3-Quasi expérimentale:Entre descriptive et expérimentale ex: avec des arbres adultes je ne peux pas travailler dans une serre. Utiliser lors de contrainte qui empêche le modèle expérimentale dans son milieu naturel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Dans un échantillonnage aléatoire simple que peut-on retrouver? Il est fait par quoi et c’est le quoi?

A

Des groupes, c’est fait par ordinateur et c’est le meilleur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Parlez de l’échantillonnage stratifié

A

Les échantillons doivent tomber de façon précises ou presque dans différente partie ex: Échantillon au Québec, il doit y avoir des échantillon dans toute les régions

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Parlez des échantillonnage de deuxième degré?

A

Je fait un premier échantillonnage aléatoire et après je joint des éléments qui sont à côté ou lié au premier ex:Je fait un premier échan. aléa. pour les sapin et après je rajoute les arbres qui poussent autour des sapins.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Avantage d’échantillonnage systématique et en quiconce

A

Tous sont représentés et répartie également

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Quand il y a périodicité d’un phénomène l’échantillonnage systématique n’est pas approprié pourquoi?

A

Car il peut-être toujours sur le même point ex: dune de sable au 13 pied tombe toujours sur les plante sur le bout de la dune.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Quel sont les deux choix de sélection aléatoire simple?

A

1-Avec remise:Il peut-être choisis plusieurs fois.

2-Sans remise: Il ne peut pas être choisi de nouveau (c’est habituellement le cas)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Nommez les 7 étapes du processus d’échantillonnage?

A
1-Définir l'univers
2-Identifier les éléments
3-Méthode d'échantillonnage
4-nombre d'échantillon
5-taille d'échantillon
6-sélection des éléments
7-Réalisation du travail
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

Qu’est-ce une série statistique simple?

A

Une seule variable observée pour un ensemble d’éléments.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

Qu’est-ce qu’une série de statistique double?

A

Ensemble d’élément à observer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
43
Q

Que montre un tableau de distribution de fréquences?

A

Comment les données d’une variable se répartissent dans différentes classe de valeurs ou différentes catégories

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
44
Q

Quel est le types de variable à deux états?

A

Binaire:0 et 1 ou présence et abscence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
45
Q

Quel est le type de variable à plusieurs états?4

A

1-Nominale:1.1-Variables qualitatives
1.2-Données classifiées en catégories mutuellement exclusive,
1.3- L’ordre des catégories n’est pas considéré
1.4- La distance entre les classes est ignorée
ex:Le sexe (M-F), L’état d’un malade (sain-malade)
la Couleur

2-Ordinale:2.1-Variables qualitatives
2.2-Données classifiées en rang
2.3- Le critère de classification est connu
2.4-La distance entre les classe n’est pas connue
ex: Amélioration des patients (nulle, moyenne…)
Stade de développement [bébé, enfant, ado

3-Échelle de variation par intervalle:3.1-Variables quantitatives
3.2-La distance qui sépare deux données ou deux classes est connue
3.3- La position du zéro est arbitraire
ex:Degré Celsius ou Fahrenheit
Phénomène cyclique (date-heure-point cardinaux)

4-Échelle de variation Relative:4.1-Variables quantitatives
4.2-L’intervalle est connu et des rapports peuvent être déterminés
4.3-Le zéro = 0
4.4-Discrète ou continue
ex:Degré Kelvin
Nombre d’entité
Mesure: longueur,
Superficie, volume, capacité, masse, durée, densité, pression

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
46
Q

Définir le type de variable pour le temps nécessaire pour répondre à un sondage?

A

Variable quantitative avec une échelle relative

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
47
Q

Définir le type de variable pour La propension de vote pour un partie politique?

A

Variable qualitative nominale

48
Q

Définir le type de variable pour l’appréciation d’un vin

A

Variable qualitative ordinale (bon, pas bon)

49
Q

Définir le type de variable pour le taux d’anxiété d’une personne?

A

Variable qualititative ordinale (un peu, moyen, beaucoup)

Ou nominale binaire (Pas stressé, beaucoup etc)

50
Q

Nommez les types de représentations graphique?6

A
1-En bâton
2-Polygone de fréquence
3-de part de tarte
4-à moustache
5-Histogramme
6-courbe de fréquence
51
Q

Le diagramme en bâton est bon pour quoi?

A

Pour les variables quantitatives et qualitatives (on ne peu pas avoir 50,2 élèves)

52
Q

Que représente-on sur l’abscisse (l’axe horizontale x)?

A

La valeur de la variable discontinue (ou discrète) ou la catégorie de la variable qualitative.

53
Q

Que représente-on sur l’ordonnée (l’axe verticale y)?

A

Les effectifs de classe, les fréquences relatives ou les fréquence cumulées.

54
Q

Décrivez l’histogramme?2

A

1-Il utilise des variables quantitatives continues
2-Rectangle dont les bases sont égales à l’intervalle de la classe et les hauteurs à l’effectif de la classe (ni) ou à la fréquence relative (fi)

55
Q

Décrivez l’histogramme de fréquence?3

A

Permet d’examiner trois caractéristiques de la distribution de fréquence:
1-La forme (aplatie, pointu etc)
2-Les valeurs de tendance centrale (Valeur ou catégorie plus représenté)
3-Variabilité des valeurs (étendue de la variation, nombre de catégorie)

56
Q

Le polygone de fréquence convient à quoi?

A

Aux variables quantitatives continue

57
Q

Le diagramme à moustache sert pour quoi?7

A

1-Les variables quantitatives
2-Permet de représenter la médiane
3-L’écart interquatile
4-L’étendue de la distribution
5-Les valeurs exceptionnelles
6-Moustache courte:Distribution moins éparpillée
7-Moustache longue:Distribution plus éparpillée

58
Q

À quoi sert le diagramme circulaire (à tarte)?2

A

1-Variable quantitative dont la somme est de 100%

2-Subdivise un cercle en secteur dont l’angle est proportionnel à l’effectif de la catégorie

59
Q

Pourquoi faut-il faire l’élaboration des données?3

A

1-Pour bien organiser les mesures récoltées
2-Pour bien représenter les mesures( donner un message simple et rapidement)
3-Comprendre les phénomènes.

60
Q

Comment peut-on utilises une base de donner?4

A

1-À la mains
2-La calculatrice
3-avec Excel
4-Avec des programme spécifique de stsatistique

61
Q

Quel sont les 3 phases pour procéder avec les données?

A
1ère phase:
1-Formulation d'une hypothèse
2-Planification de l'expérience
3-Préparation de l'expérience
4-Récolte de donné
2ième phase:
1-Organisation des données
2-Élaboration des données
3ième phase:
1-Compréhension et interprétation des résultats
2-Acceptation ou refus des hypothèses
62
Q

Décrire le type de variables Qualitative?

A

1-Nominale :décrit un nom ou une catégorie. Contrairement à une variable ordinale, les noms ou les catégories possibles ne suivent pas un ordre naturel. Le sexe et le genre de logement en sont des exemples.)
2-Ordinale:est une variable dite catégorique dans laquelle les catégories possibles peuvent être classées dans un ordre spécifique ou dans un ordre naturel quelconque. Dans le tableau 2, la variable « comportement » est ordinale parce que la catégorie « Excellent » est meilleure que la catégorie « Très bon », etc. On n’y trouve un certain ordre naturel, mais celui-ci est limité par le fait que nous ne savons pas dans quelle mesure le comportement « Excellent » est meilleur que le comportement « Très bon ».

63
Q

Décrire le type de variables Quantitative (relative)?

A

1-Variable Discrète: C’est une valeur que l’on peut compter précisément ex:Le nombre de chien…
2-Variable Continue:Plusieurs valeurs entre un certain intervalle (4,34566, plusieurs décimale) Ex:Le temps de réalisation d’une tâche, la taille, le poids d’une personne,
la vitesse d’une voiture.

64
Q

Comment fait -on la classification des données?

A

En groupe homogènes (voir l’exemple dans mon cahier sur la sensibilité de la peau.

65
Q

Désavantage de la classification homogène en colonne?

A

Très long à lire et fichier trop lourd

66
Q

Avantage de la classification homogène en colonne?6

A

1-Une seule ligne pour nommer les variables (titre de colonne)
2-Facile pour la production des graphiques
3-Facile pour regrouper des données
4-On peut mettre plusieurs variables ensemble
5-L’ordre n’est pas important, on peut ajouter des données n’importe quand et avoir des résultats préliminaires.
6-Les colonnes sont les variable et les lignes les observations des ces variables

67
Q

La description des séries statiques se fait par quoi?3

Et sert à quoi?

A

Les paramètres de:1-Position
2-dispersion
3-forme
Ils servent à décrire des séries statistique

68
Q

Quels sont les paramètres de position?3

A

1-La moyenne(-x)
2-La médiane (Me)
3-Le mode (Mo)

69
Q

Qu’est-ce que la moyenne et sa formule?

A

1-Donnée qui représente le centre d’équilibre d’une distribution
2-Lorsqu’il est question de la moyenne d’un échantillon, le symbole x¯¯¯ est souvent utilisé.
Par contre, lorsqu’on fait référence à la moyenne d’une population, on utilisera la lettre grecque μ.
3-Sommes de toutes les données divisé par le nombre de données

70
Q

Qu’est-ce que la Médiane et sa formule?

A

1-Mesure de tendance centrale qui indique le centre de la série de données. En d’autres mots, c’est la valeur qui sépare une distribution ordonnée en deux groupes qui contiennent le même nombre de données.
2- Si n est un nombre impair, alors n+1/2 sera un nombre entier et on pourra aller chercher directement la médiane.
3-Si n est un nombre pair, alors n+1/2 sera un nombre décimal. Dans ce cas, on détermine la médiane en faisant la moyenne des données centrales de la distribution.

71
Q

Qu’est-ce que le Mode?

A

1-Le mode Pour les variables qualitatives ou quantitative discrètes, est la valeur ou la modalité dont l’effectif est le plus élevé. En d’autres mots, le mode correspond à la donnée qui est la plus fréquente. Pour une variable quantitative continue, on divise celle-ci en classes.
2-La classe modale est l’intervalle de valeurs dont l’effectif est le plus élevé. Pour avoir une estimation du mode, il suffit de prendre la donnée centrale de la classe modale.​

72
Q

Où se situerons les paramètres de position dans une distribution symétrique?

A

Presque tous à la même place

73
Q

Où se situerons les paramètres de position dans une distribution asymétrique à droite?

A

1-Le mode est au début où le graphique est plus haut
2-La médiane est au centre
3- La moyenne plus à droite où le graphique est plus bas

74
Q

Où se situerons les paramètres de position dans une distribution asymétrique gauche?

A

1-Le mode est à la fin où le graphique est plus haut
2-La médiane est au centre
3- La moyenne plus à gauche où le graphique est plus bas

75
Q

Qu’est ce que le percentile?

A

Chacune des valeurs qui divisent les données triées en ordre croissant en 100 part égales de sorte que chaque partie représente 1/100 de l’échantillon de la population. Si les deux parties sont d’égale importance il sagi de la médiane

76
Q

Qu’est ce que le premier quartile?

A

Le 1er quartile sépare les 25 % inférieurs des données. C’est si la première partie comporte 25% des valeurs

77
Q

Qu’est ce que le troisième quartile?

A

Le 3e quartile (75%) sépare les 25 % supérieurs des données. C’est s’il y à 75% des valeurs

78
Q

Qu’est ce qu’un quartile?

A

un quartile est chacune des trois valeurs qui divisent les données triées en quatre parts égales, de sorte que chaque partie représente 1/4 de l’échantillon de population.

79
Q

Qu’est ce que le deuxième quartile?

A

C’est la médiane (50%) de la série ;

80
Q

Dans le paramètre de dispersion, que représente l’étendue de la variable?

A

Représente la variabilité ou l’étendue des différentes valeurs que peut prendre une variable.

81
Q

Qu’est ce que l’étendue?

A

L’étendue est la différence entre la valeur maximale et la valeur minimale du caractère statistique.

étendue(d) = xmax-xmin

82
Q

Dans le paramètre de dispersion, que représente la variance?6

A

1-La variance et l’écart type sont similaire, mais la variance est au carré et pas l’écart type.
2-On utilise habituellement s2 pour des échantillons ou σ2, pour la population.
3- Ce définie comme la moyenne du carré des écarts à la moyenne des valeurs de la distribution.
4-Si tous les xi sont égaux, la variance est nulle puisque tous les termes composant la somme des distances quadratiques sont nuls.
5-La variance augmente au fur et à mesure que la variabilité augmente, elle mesure donc la variabilité des données.
6-Pour mesurer la variance il faut disposer d’au moins deux observations.

83
Q

Dans le paramètre de dispersion, que représente l’écart type?

A

C’est la racine carré de la variance σ2 ou S2

84
Q

Dans le paramètre de dispersion, que représente le coefficient de variation CV? (se rappeler de cette formule)3

A

1- C’est le rapport de l’écart-type à la moyenne. Plus la valeur du coefficient de variation est élevée, plus la dispersion autour de la moyenne est grande. Il est généralement exprimé en pourcentage. Sans unité, il permet la comparaison de distributions de valeurs dont les échelles de mesure ne sont pas comparables.
2-Ce coefficient n’a aucune unité. Utiliser avec les variables quantitatives à échelle de variation relative (vrai zéro)
3-CV= 100*sx/_x (s représente l’écart-type de l’échantillon et _x la moyenne de l’échantillon

85
Q

Dans le paramètre de dispersion, que représente l’écart interfactile?2

A

1-L’écart interfactile est la distance séparant un fractile (percentile) de son complément.
2-L’écart interfactile le plus utilisé est l’écart interquartile

86
Q

Dans le paramètre de la forme, à quoi sert le coefficient d’asymétrie ? Et quel sont ses propriétés? (skewness en anglais)2

A

1-Mesurer le manque de symétrie d’une distribution (moment de 3e ordre, symbole: a3)
2-Propriété:
Pour une distribution symétrique: a3=0
Pour une distribution allongée vers la droite: a3»0
Pour une distribution allongée vers la gauche : a3«0

87
Q

Dans le paramètre de la forme, à quoi sert le coefficient d’aplanissement? (Kurtosis en anglais). Et quel sont ses propriétés?2

A

1-Mesure le degré d’applanissement d’une distribution (moment de 4e ordre, symbole:a4
2-Propriété:
Pour une distribution normale: a4=0
Pour une distribution leptokurtique (plus pointue que la courbe normale):a4»0
Pour une distribution platikurtique (plus aplatit que la courbe normale): a4«0

88
Q

Les principes d’inductions sont basée sur quoi?

A

Sur le respect des lois de la probabilité de distribution théorique des données.

89
Q

Plus mon échantillon est gros, plus j’ai de une courbe comment?

A

Régulière en forme de cloche et plus il y a de chance de convergence vers une loi.

90
Q

Quel sont les caractéristique d’une loi normale?6

A
1-forme de cloche
2-symétrie
3-infinie
4-point d'inflexion (changement de concavité) changement de côté
5-moyenne:sommet
6-Écart type: Aplatissement
91
Q

La loi normale s’appelle la loi de?

A

Loi de Gauss Laplace N(m, Q)

92
Q

Pour simplifier la loi normale on utilise quoi?

A

La loi normale centrée-réduite afin de calculer les probabilité

93
Q

Pour avoir une idées objective d’un résultat, il faut interpréter les résultat en vérifiant le seuil de 0,05, si le P= est plus petit que 0,05 ou plus grand , le test est comment?

A

Si le P= est plus petit que 0,05:Le test est significatif

Si le P= est plus grand que 0,05: Le test est non significatif

94
Q

Pourquoi utiliser l’intervalle de confiance?

A

Car les valeurs des paramètres utilisées dans la statistique descriptive (moyenne, variance, etc.) sont calculées à partir d’un échantillon aléatoire représentant les populations statistiques

95
Q

Quel sont les intervalles de confiance d’un paramètre?2

A

1-Intervalle à l’intérieur duquel peut se situer la vrai valeur du paramètre de la population
2-Estimé en fonction d’un coefficient de risque à qui représente la probabilité de se tromper lorsqu’on affirme que la valeur du paramètre dans la population statistique, se situe à l’intérieur de l’intervalle donnée

96
Q

Parlez du coefficient de risque a (alpha)?3

A

1-Par convention: a=0,05 ou 0,01 ou 0,001.
2-Plus le Alpha est petit plus je suis certain de mon résultat donc=0,001
3-La moyenne de la population ce situe entre l’intervalle de l’alpha soit 0,05 si je veux plus toucher la moyenne j’utilise 0,001

97
Q

Plus j’augmente l’écart type plus mon intervalle de confiance sera comment?

A

Large

98
Q

Définition de la formulation des hypothèses statistiques?

A

C’est un énoncé, une affirmation concernant les caractéristiques (valeurs des paramètres, forme de la distribution des observations ) d’une population

99
Q

Il y a deux hypothèses statistiques?3

A

1-L’hypothèse principale:Ho=C’est l’hypothèse nulle. Ho=l’histograme= (égale) à la lois normale
2-L’hypothèse alternative: H1= C’est l’hypothèse contraire à Ho. H1+l’histograme (n’égale pas) la lois normale
Si l’une est vrai l’autre doit-être rejetée
3-Toujours dire oui c’est vrai mais avec t’elle possibilité d’erreur

100
Q

Qu’est-ce que le test statistique?

A

Procédure qui permet de décider si Ho doit être accepté ou rejeté au profit de H1

101
Q

Qu’est-ce que le test d’hypothèse?2

A

1-Test statistique et région critique d’un test.
2-La zone d’acceptation de H0 a une taille relative égale à 1-a et la zone de rejet aussi appelée région critique à une taille relative égale à a

102
Q

Le risque d’erreur est déterminé par un test d’erreur qui comporte deux risque d’erreurs de décision expliquez?5

A

1-Erreur de type 1: rejette Ho alors cette hypothèse est vrai, probabilité a
2-Erreur de type 2: Accepte Ho alors qu’elle est fausse, probabilité B
3- On connaît toujours le risque a puisque c’est déterminé par le test
4-Dans bien des cas on ne connaît pas le risque B. Il peut-être déterminé par une analyse de puissance (power analyse) qui devrait être calculé avec d’autre type d’analyse
5-En résumé: Décisions
États de Ho–Ne pas rejeter Ho–Rejeter Ho
Ho est vrai– Bonne décision-E1=erreur de type 1 ou a
Ho fausse–E2=erreur de type 2 ou B-Bonne décision

103
Q

Test unilatérale et bilatérale dépend de quoi?

A

De la région critique considérée

104
Q

Décrivez le test bilatérale

A

Bilatérale (two-tailed)= La région critique se trouve de chaque côté de la distribution de la statistique
Quand on ne peu pas orienter notre hypothèse c’est bilatérale

105
Q

Décrivez le test unilatérale?

A

unilatérale (one-tailed)=La région critique n’est définie que d’un côté de la distribution de la statistique (soi à gauche ou à droite)

106
Q

Nommez et décrivez les deux types d’échantillonnage?2

A

1-Indépendant (échantillonnage aléatoire des éléments) il n’y a aucun lien entre les éléments.
2-Apparié=Si les éléments du premier échantillon sont associés aux éléments du deuxièmes échantillon. Les échantillons appariés forment n paires d’él`éments ex: Deux échantillons qui sont mesurée 2 fois comme donner un médicament dans le temps.

107
Q

Qu’est-ce qu’un test paramétrique?

A

Basé sur la loi normale

108
Q

Qu’est-ce qu’un test non paramétrique?

A

La loi de la distribution n’est pas connue ou est différente de la loi normale

109
Q

Parlez de la loi normale?

A

Elle s’applique aux variables quantitatives continues

110
Q

La probabilité d’observer une valeur comprise entre -1,96 écart type et + 1,96 écart type autour de la moyenne est de combien?

A

95%

111
Q

La probabilité d’observer une valeur comprise entre -1 écart type et +1 écart type autour de la moyenne est de combien?

A

68%

112
Q

La moyenne d’une variable normale centrée réduite est égale à?

A

0

113
Q

L’écart type d’une variable normale centrée réduite est égale à?

A

1

114
Q

Si il y a plus de 50 données on prend quel test de normalité?

A

Kolmogorov-Smirnov

115
Q

Si il y a moins de 50 données on prend quel test de normalité?

A

Shapiro-Wilk

116
Q

Pour vérifier si la courbe suit la loi normale ou non. On fait le test de normalité. Pour interpréter le test de normalité on utile le seuil de normalité de 0,05 lorsque le résultat est en haut de 0,05 cela veux dire quoi?

A

Qu’il est non significatif donc les données suivent la courbe de la loi normale. L’histogramme de la distribution de fréquence n’est pas différent de la courbe normale

117
Q

Pour interpréter le test de normalité on utile le seuil de normalité de 0,05 lorsque le seuil est en bas de 0,05 cela veux dire quoi?

A

Qu’il est significatif donc les données ne suivent pas la courbe de la loi normale.Notre distribution est statiquement différent de la loi normale