Stats bloc 1 Flashcards

1
Q

Qu’est-ce que la méthode scientifique?

A

ensemble d’étapes permettant d’acquérir de nouvelles connaissances fiables et objectives

«elle peut être reproduite par quiconque pour arriver aux mêmes résultats

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quelles sont les étapes de la méthode scientifique?

A
  1. Identifier la problématique et préciser la question de recherche
  2. Hypothèse de recherche
  3. Opérationnaliser les concepts
  4. Choisir la technique d’observation/collecte et déterminer instruments de mesure
  5. Effectuer observations/ collecte (recueille données brutes)
  6. Traiter et organiser les données
  7. Analyser et interpréter les données
  8. Diffuser les résultats
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Que comprend la 3e étape de la méthode scientifique, soit opérationnaliser les concepts?

A

Clarifier les termes utilisés dans l’hypothèse de recherche

Raffiner l’hypothèse en précisant le sens du lien présumé entre les variables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quels symboles représentent la taille d’une population et d’un échantillon?

A

Taille de la population = N

Taille de l’échantillon = n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quel symbole représente une variable statistique?

A

N’importe quelle lettre majuscule

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce qu’une modalité (valeur)?

A

Un état ou une valeur que peut prendre une variable

Les modalités sont les réponses possibles à un sondage ou un recensement (numérique ou non)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quels sont les 4 types de variables?

A

Qualitative nominale. qualitative ordinale, quantitative discrète, quantitative continue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelles sont les 4 échelles de mesure?

et les calculs possibles

A

Échelle nominale (égalités)
Échelle ordinale (égalités et ordonnances) ex: tranches d’âge
Échelle d’intervalle (égalité, ordonnance, somme, différence) → zéro arbitraire ex: météo
Échelle de rapport (égalité, ordonnance, somme, différence, multiplication, division) → zéro = absence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Pourquoi est-il pertinent de faire un sondage plutôt qu’un recensement ? (6)

A
  • Population est trop grande
  • Une partie de la population est difficilement accessible
  • Recensement est souvent trop long
  • Trop coûteux
  • Trop de recensement peut devenir un fardeau pour la population
  • le méthode peut être destructrice
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelles sont les 4 méthodes d’échantillonnage aléatoire?

A
  • échantillonnage aléatoire simple
  • échantillonnage systématique
  • échantillonnage stratifié
  • échantillonnage par grappes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelles sont les 4 méthodes d’échantillonnage non aléatoire?

A
  • échantillonnage à l’aveuglette
  • échantillonnage de volontaires
  • échantillonnage par quotas
  • échantillonnage au jugé
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quelles méthodes représentent mieux la population entre les méthodes probabilistes (aléatoires) ou les non probabilistes (non aléatoires)?

A

Les méthodes aléatoire ou probabilistes parce que les autres sont nécessairement un peu biaisées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Comment fonctionne la méthode d’échantillonnage aléatoire simple?

Quels sont les avantages et désavantages?

A
  1. avoir une liste de tous les individus de la population
  2. décider de n (taille de l’échantillon)
  3. Choisir n nombres entre 1 et N au hasard
  4. Constituer l’échantillon avec les individus portant les numéros choisis
    ex: pige avec remise

Avantages:

  • Simple
  • Échantillon représentatif de la population

Désavantages:

  • Il faut avoir une liste complète de toutes les unités statistiques de la population (à jour)
  • Peut être long si c’est pas par ordinateur
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comment fonctionne la méthode d’échantillonnage systématique?

Quels sont les avantages et désavantages?

A
  1. Avoir la liste de tous les individus de la population numérotée de 1 à N
  2. Décider la taille de n
  3. Calculer le pas de sondage (N/n)
  4. Choisir au hasard un nombre de départ entre 1 et N
  5. Parcourir la population et sélectionner systématiquement l’échantillon

Avantages:

  • Sélection d’un seul nombre aléatoire
  • Rapide
  • Bonne répartition de l’échantillonnage dans la base de sondage

Désavantages:

  • Il faut avoir une liste complète de toutes les unités statistiques de la population (à jour)
  • Fonctionne pas vraiment pour les phénomènes périodiques
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Comment fonctionne la méthode d’échantillonnage stratifié?

Quels sont les avantages et désavantages?

A
  1. Avoir une liste de tous les individus
  2. Subdiviser la population en strates pertinentes
  3. Déterminer le proportion que chaque strate occupe dans la population
  4. Décider la taille de n
  5. Déterminer le nombre d’individus de chaque strates dans l’échantillon pour respecter les proportions
  6. Choisir les individus de chaque strate par échantillonnage aléatoire simple

Avantages:
- L’échantillon représente bien les caractéristiques de la population

Désavantages:

  • Il faut connaître chacune des caractéristiques de la population
  • Il peut être difficile de rejoindre les individus de certaines strates peu nombreuses
  • Souvent très coûteux
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Comment fonctionne la méthode d’échantillonnage par grappes?

Quels sont les avantages et désavantages?

A
  1. Subdiviser la population en grappes hétérogènes de tailles semblables
  2. Décider de la taille de n
  3. Déterminer le nombre de grappes qu’il faudra choisir
  4. Choisir ce nombre de grappe par échantillonnage aléatoire simple

Avantages:
- Réduit les déplacements et les coûts si la population est sur un grand territoire

Désavantages:

  • Si les grappes son constituées d’unités statistiques homogènes, l’échantillon ne représentera pas bien la population
  • Fonctionne juste si chaque groupe est aussi diversifié que la population

*Marche mieux pour des éléments pas reliés au milieux ex: les réflexes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Comment fonctionne la méthode d’échantillonnage à l’aveuglette?

Dans quel cas est-ce que c’est pertinent?

Dans quel cas est-ce que les résultats pourraient peut-être être généralisés à la population au complet?

A

Quand on sélectionne les individus de l’échantillon de façon arbitraire
ex: les gens qui passent à un coin de rue

Bon usage:
- Journalistes qui veulent avoir une idée des différentes opinions sur un sujet d’actualité

Désavantage:
Comme toutes les méthodes non-aléatoire, ça ne peut pas être généralisé à la population

En fait, peut être généralisé si la population est très très homogène

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Comment fonctionne la méthode d’échantillonnage de volontaires?

Quand est-ce que cette méthode est pertinente?

Dans quel contexte est-ce que cette méthode est impertinente?

A

C’est quand on fait appel à des volontaires

Pertinent quand?

  • La recherche nécessite beaucoup d’implication de la part des participants
  • L’échantillon est très semblable à la population
    ex: la réaction du corps à un médicament

Impertinent quand on veut l’avis des gens parce que l’échantillon va être constitué de gens avec juste des avis extrêmes (échantillon d’individus polarisés)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Comment fonctionne la méthode d’échantillonnage par quotas?

Quand est-ce que cette méthode est pertinente/ avantages?

A

Comme stratifiée, mais on sélectionne de façon non aléatoire les individus dans les strates

Pertinent quand/ avantages:

  • Dans les enquêtes d’opinions et les études de marché
  • rapide et peu coûteux

Ça peut marcher si les strates choisies sont celles qui ont une influence sur les résultats parce qu’on s’assure que tout le monde est représenté

Risque si la caractéristique des strates est trop différente est qu’on va avoir une homogénéité dans l’échantillon qui n’est pas dans la population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Comment fonctionne la méthode d’échantillonnage au jugé?

Quand est-ce que cette méthode est pertinente?

Dans quel contexte est-ce que cette méthode est impertinente?

A

Quand on sélectionne les individus d’un échantillon en se basant sur un certain jugement qu’on a au sujet de la composition de la population et en tentant de s’y conformer (strates selon ton jugement?)

DEMANDE L’AVIS D’UN EXPERT pour que ça représente à peu près la population

Pertinent:

  • Dans le cadre d’une étude préparatoire comme tests préalables de questionnaires
  • rapide et peu coûteux

Résultats valides seulement si la personne qui a constitué l’échantillon a une idée juste et non-biaisé de la population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Quelles sont les informations que l’on doit absolument retrouver dans le titre d’un tableau ou d’un graphique?

A
Mot clé (ex: distribution/répartition)
Qui? (unité statistique, insinuer si échantillon ou population et taille de celui-ci)
Où?
SELON
Quoi? (variable étudiée)
Quand?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Que doit-on mettre en plus du titre et du graphique/tableau?

A

La source (en-bas)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Pour quelle variable est-ce que l’on ne fait jamais de colonne de pourcentage cumulé?

A

Qualitative nominale parce qu’il n’y a pas d’ordre

placée en ordre alphabétique dans tableau

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Comment place-t-on les variables qualitatives nominales dans un tableau?

A

en ordre alphabétique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Dans quel cas est-ce qu’on fait des classes pour les tableaux?

A

Quand c’est une variable quantitative discrète et qu’il y a plus de 15 valeurs différentes

Quand c’est une variable quantitative continue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Comment établit-on des classes?

A
  1. Calculer l’étendue
  2. Nombre approximatif de classes selon la règle de Sturges (1 + 3,3log n)
  3. Largeur des classes (E/nbr de classes)
  4. Choisir borne inférieure de la première classe
  5. Construire des belles classes

*S’assurer que toutes les valeurs sont incluses

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Combien de classes sont appropriées pour les tableaux?

A

entre 5 et 15 classes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Quelles sont représentations graphiques possibles pour les variables qualitatives?

Quand est-ce qu’on favorise chacune d’elles?

A

Diagramme circulaire:

  • pour mettre de l’avant les fréquences relatives (%)
  • surtout nominales

Diagramme à bandes verticales:

  • Bandes larges qui ne se touchent pas
  • pas de flèches au bout de l’axe des x si c’est pas des nombres
  • Pour les variables ordinales surtout
29
Q

Quelles sont les représentations graphiques possibles pour les variables quantitatives?

A

Diagramme à bâtons:
pour les variables quantitatives discrètes à échelle d’intervalle ou de rapport

Histogramme, polygone de fréquences et ogive:
pour variables quantitatives regroupées en classes

*Dans l’histogramme, l’air de la bande = fréquence d’une valeur, pas nécessairement la hauteur

Polygone de fréquence:

  • même aire que l’histogramme
  • Quand on veut superposer plusieurs distributions (comparer)

Ogive:

  • Pour les répartitions cumulées
  • Permet d’estimer rapidement des quantiles
30
Q

Quelles sont les données construites et comment les obtient-on de façon générale ?

A

On les obtient par des opérations arithmétiques

  • proportions
  • pourcentages
  • taux
  • ratios
  • indices
31
Q

Quelles sont les données construites et comment les obtient-on de façon générale ?

A

On les obtient par des opérations arithmétiques

  • proportions et pourcentages
  • taux
  • ratios (entiers)
  • indices
32
Q

Quelles sont les règles générales des symboles pour les mesures?

A

lettres grecques quand on parle de la population et des lettres latines quand on parle d’échantillons

33
Q

Comment calcule-t-on une proportion?

À quoi servent-elles?

A

p ou pi = taille du sous-ensemble/ taille de l’échantillon ou la population

S’exprime en nombre à virgule ou en pourcentage

Quand on l’interprète, mettre les qui? quoi? quand? ou?

34
Q

Qu’est-ce qu’un taux?

Comment les calcule-t-on?

A

Le taux est une un cas particulier des proportions exprimé par rapport à une puissance de 10

taux: taille du sous-ensemble/ taille de l’échantillon ou population *10^… (pour 1, pour 10, pour cent. pour 1000, etc)

35
Q

Qu’est-ce qu’un ratio entier?

Comment les calcule-t-on?

A

C’est un rapport entre deux sous-ensemble exprimé avec des nombres entiers

R.E. = taille du sous-ensemble/taille de la pop ou de l’échantillon *k

k est l’entier le plus petit qui permet d’avoir un ratio entier à 0,1 près

36
Q

Dans quelles situations peut-il être pertinent de prendre les méthodes d’échantillonnage non-aléatoire?

A
  • Études exploratoires (moins cher)
  • Quand la population étudiée est homogène
  • Quand l’expérimentation comporte des risques pour la santé
  • Quand c’est impossible d’avoir une base de sondage (une liste de la population)
37
Q

Qu’est-ce qu’une variation absolue?

A

Différence entre deux quantités

A - B

38
Q

Qu’est-ce qu’une variation absolue?

A

Différence entre deux quantités

qté B - qté A

39
Q

Qu’est-ce qu’une variation relative?

A

Le rapport entre la variation absolue et la quantité initiale
(qté B - qté A)/ qté A *100%

*résultats en pourcentage!!

Toujours mentionner si augmentation ou diminution, lieu, moment, qui, etc.

40
Q

Qu’est-ce qu’un indice élémentaire?

A

rapport entre la valeur actuelle d’un bien et la valeur de référence du même bien *100 (pas %)
(2002=100, 2002 = valeur de référence)

comme indice synthétique, mais pour 1 produit/élément

Permet de suivre l’évolution de la valeur d’un bien dans le temps ou selon un lieu de référence

41
Q

Qu’est-ce qu’un indice synthétique?

A

indice synthétique = Σ (indice élémentaire * pondération)

ex: indice des prix à la consommation

Supérieur à 100 = augmentation

42
Q

Quelles sont les mesures de tendance centrales?

A
  • Mode
  • Médiane
  • Moyenne
43
Q

Qu’est-ce que le mode?

Comment l’interprète-t-on?

A

La valeur qui revient le plus souvent
Mo = réponse et les unités

Interprétation: qui? quoi? quand? où? mot clé :
Le plus grand nombre de…
Une pluralité…
Le plus populaire… (si c’est des trucs que les gens aiment/choisissent)

Classe modale si on a juste des données en classes

44
Q

Quels sont les avantages et désavantages du mode?

A

Avantages:

  • Facile à comprendre/ déterminer/ interpréter
  • Pas influencé par données extrêmes
  • Significatif quand une valeur ressort vrm

Inconvénients:

  • peu significatif quand peu de données
  • Peu être influencé par choix des classes quand il y a des classes
  • Pas stable d’un échantillon à l’autre
  • Pas vraiment une mesure de tendance centrale quand plusieurs modes
45
Q

Qu’est-ce que la médiane?

Comment se calcule-t-elle avec les classes?

A

La valeur centrale d’une suite croissante de valeurs

Me = réponse et unités
C’est la (n ou N + 1)/2 e valeur
*placer les valeurs en ordre croissant

fréquence relative cumulée = 50%

Avec classes:

  1. Trouver la classe médiane
  2. Me = valeur inférieure de la classe médiane + …
  3. cbm de % dans la classe?

nbr de % dans la classe/ x = fréquence relative que représente la classe/ étendue de la classe

46
Q

Quels sont les avantages et désavantages du mode?

A

Avantages:

  • Provient de la notion simple de centre
  • Ne dépend pas de la valeur des données, mais de leur position donc pas affectée par les données extrêmes
47
Q

Quels sont les avantages et désavantages du mode?

A

Avantages:

  • Provient de la notion simple de centre
  • Ne dépend pas de la valeur des données, mais de leur position donc pas affectée par les données extrêmes
  • Peu influencée par le choix des classes

Inconvénient:

  • Ne tient pas compte de la valeur des données
  • ne possède aucune propriété algébrique
48
Q

Qu’est-ce que la moyenne?

A

C’est la somme de toutes les valeurs/(n ou N)

Symbole: x barre pour échantillon et μ pour la population

49
Q

Qu’est-ce que la moyenne?

A

C’est la somme de toutes les valeurs/(n ou N)
Symbole: x barre pour échantillon et μ pour la population

Pour les classes: on substitue les valeurs par la valeurs de milieu de classe

Mot clé: en moyenne

50
Q

Quels sont les avantages et inconvénients de la moyenne?

A

Avantages:

  • Tient compte de toutes les données et de leurs valeurs
  • Bonnes propriétés algébriques
  • Valeur relativement stable d’un échantillon à l’autre

Inconvénients:

  • Sensible aux valeurs extrêmes
  • Difficile à calculer si classes ouvertes
51
Q

Comment choisit-on la mesure de tendance centrale?

A
  • Premier choix: moyenne
  • Si trop de données extrêmes: médiane
  • Si une valeur vraiment plus présente : mode
  • Si données concernent une variable qualitative à échelle nominale ou ordinale : mode
52
Q

Quelles sont les mesures de dispersion?

A
  • Étendue
  • La variance
  • L’écart type
    (comment les données sont regroupées autour de la moyenne)
  • Le coefficient de variation (mesure de dispersion relative à la grandeur de la moyenne
53
Q

ATTENTION À QUAND ON MET LE = OU LE ≈

A
  • Quand moyenne fait à partir de données de milieu de classe

- Quand pour l’étendue, borne supérieure de la dernière classe - borne inférieurs de la première classe

54
Q

Quels sont les avantages et inconvénients de l’étendue?

A

Avantages:

  • Facile à calculer et interpréter
  • Permet de se faire rapidement une idée de la dispersion des données

Inconvénients:

  • Peut varier grandement d’un échantillon à l’autre
  • Ne dépend que des deux valeurs extrêmes qui sont souvent des données exceptionnelles

Symbole : E

55
Q

Qu’est-ce que l’écart-type ?

A

Racine carré de la variance

Symbole: s (échantillon) ou σ (population)

Sur la calculatrice : sx ou σx (valeur, fréquence data)

Estimer (≈) en remplaçant les valeurs de chaque classe par les milieux de classes au besoin

56
Q

Qu’est-ce que la variance?

symbole

A

C’est la moyenne des carrés des écarts à la moyenne (le carré de l’écart type)

Symbole: s2 (échantillon) ou σ2 (population)

57
Q

Quels sont les avantages et inconvénients de l’écart type?

A

Avantages:

  • Se prête facilement aux opérations algébriques
  • Relativement stable d’un échantillon à l’autre

Inconvénients:

  • Calcul lourd
  • Sensible aux valeurs extrême
  • Interprétation non immédiate
  • Doit être utilisé avec d’autres mesures pour prendre du sens (relativiser l’écart type)

ex: un écart type de 10 nous dit rien juste comme ça
Il faut savoir si l’examen était sur 10, sur 100, etc

58
Q

Qu’est-ce que le coefficient de variation?

A

Permet d’exprimer la grandeur de l’écart type par rapport à la moyenne (en pourcentage)

C.V = σ/μ *100% = s/x barre *100%

Si C.V. ≤ les unités statiques = groupe homogène
Si C.V. > les unités statistiques = groupe hétérogène

Toujours dire si homogène ou hétérogène
*stable = homogène

59
Q

Que sont les mesures de positions?

À quoi servent-elles?

A
  • Quantiles
  • Rangs
  • Cote Z

Sert à situer une donnée dans la distribution à laquelle elle appartient

60
Q

Que sont les quantiles?

Comment s’interprète les quantiles?

A

Quantiles:

  • Quartiles (Q)
  • Quintiles (V)
  • Déciles (D)
  • Centiles (C)

Attention, tout divisé en quarts pour les quartiles

S’interprètent : k % ou au moins k% (mettre ne C, en pourcentages) des unités stats ont … ou moins

61
Q

Combien y a-t-il de quartiles?

A

(0 à 25%) Q1 (25% à 50%) Q2 (50% à 75%) Q3 (75% à 100%)

62
Q

Combien y a-t-il de déciles?

V2 = ?

A

D1 à D9

D4 = C40

*Si on arrive exactement à 40% dans le pourcentage cumulé, donnée entre celle-ci et la prochaine

63
Q

Comment calcule-t-on un estimation d’un quantile à partir de classes?

A

un peu comme la médiane avec les classes

(≈)

64
Q

Qu’est-ce que la cote Z?

Comment la calcule-t-on?

A

C’est le nombre d’écart-types qui séparent une valeur de la moyenne (des valeurs de cette même variable)

Z = (x - μ)/σ

*Pas d’unités, bin unités = écarts type

(si Z > 0, plus grand que la moyenne, si Z < 0, plus petit que la moyenne)

65
Q

Pourquoi la cote Z est utile pour comparer des valeurs de variables différentes?
(son principal avantage)

A
  • Elle n’a pas d’unités
  • La moyenne des cotes Z = tjrs 0, peu importe la variables étudiée
  • L’écart type des cotes Z = tjrs 1, peu importe la variable étudiée
66
Q

Quels 2 mots importants trouve-t-on dans le titre d’un tableau conditionnel?

A

Distribution de … SELON variable 1 PAR RAPPORT à variable 2, date et où

67
Q

À partir de quoi se fait un tableau de distribution conditionnelle?

A

À partir d’un tableau de contigence (2 variables)

*Dans un tableau de distribution conditionnelle, toujours des pourcentages

selon Y par rapport à X

68
Q

Quand est-ce que l’on favorise le coefficient de variation par rapport à l’écart type?

A

Quand les moyennes sont très différentes ou les unités pas les mêmes

pcq un écart type a des unités (pas la cote Z)!!