Stats bloc 1 Flashcards

Question

Dans quel cas est-ce qu'on fait des classes pour les tableaux?

Answer 1

Quand c'est une variable quantitative discrète et qu'il y a plus de 15 valeurs différentes Quand c'est une variable quantitative continue

Answer 2

1. Calculer l'étendue 2. Nombre approximatif de classes selon la règle de Sturges (1 + 3,3log n) 3. Largeur des classes (E/nbr de classes) 4. Choisir borne inférieure de la première classe 5. Construire des belles classes *S'assurer que toutes les valeurs sont incluses

Answer 3

entre 5 et 15 classes

Answer 4

Diagramme circulaire: - pour mettre de l'avant les fréquences relatives (%) - surtout nominales Diagramme à bandes verticales: - Bandes larges qui ne se touchent pas - pas de flèches au bout de l'axe des x si c'est pas des nombres - Pour les variables ordinales surtout

Answer 5

Diagramme à bâtons: pour les variables quantitatives discrètes à échelle d'intervalle ou de rapport Histogramme, polygone de fréquences et ogive: pour variables quantitatives regroupées en classes *Dans l'histogramme, l'air de la bande = fréquence d'une valeur, pas nécessairement la hauteur Polygone de fréquence: - même aire que l'histogramme - Quand on veut superposer plusieurs distributions (comparer) Ogive: - Pour les répartitions cumulées - Permet d'estimer rapidement des quantiles

Answer 6

On les obtient par des opérations arithmétiques - proportions - pourcentages - taux - ratios - indices

Answer 7

On les obtient par des opérations arithmétiques - proportions et pourcentages - taux - ratios (entiers) - indices

Answer 8

lettres grecques quand on parle de la population et des lettres latines quand on parle d'échantillons

Answer 9

p ou pi = taille du sous-ensemble/ taille de l'échantillon ou la population S'exprime en nombre à virgule ou en pourcentage Quand on l'interprète, mettre les qui? quoi? quand? ou?

Answer 10

Le taux est une un cas particulier des proportions exprimé par rapport à une puissance de 10 taux: taille du sous-ensemble/ taille de l'échantillon ou population *10^... (pour 1, pour 10, pour cent. pour 1000, etc)

Answer 11

C'est un rapport entre deux sous-ensemble exprimé avec des nombres entiers R.E. = taille du sous-ensemble/taille de la pop ou de l'échantillon *k k est l'entier le plus petit qui permet d'avoir un ratio entier à 0,1 près

Answer 12

- Études exploratoires (moins cher) - Quand la population étudiée est homogène - Quand l'expérimentation comporte des risques pour la santé - Quand c'est impossible d'avoir une base de sondage (une liste de la population)

Answer 13

Différence entre deux quantités | A - B

Answer 14

Différence entre deux quantités | qté B - qté A

Answer 15

Le rapport entre la variation absolue et la quantité initiale (qté B - qté A)/ qté A *100% *résultats en pourcentage!! Toujours mentionner si augmentation ou diminution, lieu, moment, qui, etc.

Answer 16

rapport entre la valeur actuelle d'un bien et la valeur de référence du même bien *100 (pas %) (2002=100, 2002 = valeur de référence) comme indice synthétique, mais pour 1 produit/élément Permet de suivre l'évolution de la valeur d'un bien dans le temps ou selon un lieu de référence

Answer 17

indice synthétique = Σ (indice élémentaire * pondération) ex: indice des prix à la consommation Supérieur à 100 = augmentation

Answer 18

- Mode - Médiane - Moyenne

Answer 19

La valeur qui revient le plus souvent Mo = réponse et les unités Interprétation: qui? quoi? quand? où? mot clé : Le plus grand nombre de... Une pluralité... Le plus populaire... (si c'est des trucs que les gens aiment/choisissent) Classe modale si on a juste des données en classes

Answer 20

Avantages: - Facile à comprendre/ déterminer/ interpréter - Pas influencé par données extrêmes - Significatif quand une valeur ressort vrm Inconvénients: - peu significatif quand peu de données - Peu être influencé par choix des classes quand il y a des classes - Pas stable d'un échantillon à l'autre - Pas vraiment une mesure de tendance centrale quand plusieurs modes

Answer 21

La valeur centrale d'une suite croissante de valeurs Me = réponse et unités C'est la (n ou N + 1)/2 e valeur *placer les valeurs en ordre croissant fréquence relative cumulée = 50% Avec classes: 1. Trouver la classe médiane 2. Me = valeur inférieure de la classe médiane + ... 3. cbm de % dans la classe? nbr de % dans la classe/ x = fréquence relative que représente la classe/ étendue de la classe

Answer 22

Avantages: - Provient de la notion simple de centre - Ne dépend pas de la valeur des données, mais de leur position donc pas affectée par les données extrêmes

Answer 23

Avantages: - Provient de la notion simple de centre - Ne dépend pas de la valeur des données, mais de leur position donc pas affectée par les données extrêmes - Peu influencée par le choix des classes Inconvénient: - Ne tient pas compte de la valeur des données - ne possède aucune propriété algébrique

Answer 24

C'est la somme de toutes les valeurs/(n ou N) | Symbole: x barre pour échantillon et μ pour la population

Answer 25

C'est la somme de toutes les valeurs/(n ou N) Symbole: x barre pour échantillon et μ pour la population Pour les classes: on substitue les valeurs par la valeurs de milieu de classe Mot clé: en moyenne

Answer 26

Avantages: - Tient compte de toutes les données et de leurs valeurs - Bonnes propriétés algébriques - Valeur relativement stable d'un échantillon à l'autre Inconvénients: - Sensible aux valeurs extrêmes - Difficile à calculer si classes ouvertes

Answer 27

- Premier choix: moyenne - Si trop de données extrêmes: médiane - Si une valeur vraiment plus présente : mode - Si données concernent une variable qualitative à échelle nominale ou ordinale : mode

Answer 28

- Étendue - La variance - L'écart type (comment les données sont regroupées autour de la moyenne) - Le coefficient de variation (mesure de dispersion relative à la grandeur de la moyenne

Answer 29

- Quand moyenne fait à partir de données de milieu de classe | - Quand pour l'étendue, borne supérieure de la dernière classe - borne inférieurs de la première classe

Answer 30

Avantages: - Facile à calculer et interpréter - Permet de se faire rapidement une idée de la dispersion des données Inconvénients: - Peut varier grandement d'un échantillon à l'autre - Ne dépend que des deux valeurs extrêmes qui sont souvent des données exceptionnelles Symbole : E

Answer 31

Racine carré de la variance Symbole: s (échantillon) ou σ (population) Sur la calculatrice : sx ou σx (valeur, fréquence data) Estimer (≈) en remplaçant les valeurs de chaque classe par les milieux de classes au besoin

Answer 32

C'est la moyenne des carrés des écarts à la moyenne (le carré de l'écart type) Symbole: s2 (échantillon) ou σ2 (population)

Answer 33

Avantages: - Se prête facilement aux opérations algébriques - Relativement stable d'un échantillon à l'autre Inconvénients: - Calcul lourd - Sensible aux valeurs extrême - Interprétation non immédiate - Doit être utilisé avec d'autres mesures pour prendre du sens (relativiser l'écart type) ex: un écart type de 10 nous dit rien juste comme ça Il faut savoir si l'examen était sur 10, sur 100, etc

Answer 34

Permet d'exprimer la grandeur de l'écart type par rapport à la moyenne (en pourcentage) C.V = σ/μ *100% = s/x barre *100% Si C.V. ≤ les unités statiques = groupe homogène Si C.V. > les unités statistiques = groupe hétérogène Toujours dire si homogène ou hétérogène *stable = homogène

Answer 35

- Quantiles - Rangs - Cote Z Sert à situer une donnée dans la distribution à laquelle elle appartient

Answer 36

Quantiles: - Quartiles (Q) - Quintiles (V) - Déciles (D) - Centiles (C) Attention, tout divisé en quarts pour les quartiles S'interprètent : k % ou au moins k% (mettre ne C, en pourcentages) des unités stats ont ... ou moins

Answer 37

(0 à 25%) Q1 (25% à 50%) Q2 (50% à 75%) Q3 (75% à 100%)

Answer 38

D1 à D9 D4 = C40 *Si on arrive exactement à 40% dans le pourcentage cumulé, donnée entre celle-ci et la prochaine

Answer 39

un peu comme la médiane avec les classes | (≈)

Answer 40

C'est le nombre d'écart-types qui séparent une valeur de la moyenne (des valeurs de cette même variable) Z = (x - μ)/σ *Pas d'unités, bin unités = écarts type (si Z > 0, plus grand que la moyenne, si Z < 0, plus petit que la moyenne)

Answer 41

- Elle n'a pas d'unités - La moyenne des cotes Z = tjrs 0, peu importe la variables étudiée - L'écart type des cotes Z = tjrs 1, peu importe la variable étudiée

Answer 42

Distribution de ... SELON variable 1 PAR RAPPORT à variable 2, date et où

Answer 43

À partir d'un tableau de contigence (2 variables) *Dans un tableau de distribution conditionnelle, toujours des pourcentages selon Y par rapport à X

Answer 44

Quand les moyennes sont très différentes ou les unités pas les mêmes pcq un écart type a des unités (pas la cote Z)!!