Cours 1 - introduction aux notions de base Flashcards

1
Q

Pourquoi étudier les statistiques? 3 raisons principales (C,D,C)

A

C’est un outil fondamental qui appuie :
1) Le développement des connaissances (à partir des données)
2) La prise de décisions, (decisions, politiques, et pratiques qui s’appuient sur des données probantes, “data-driven”)
3) La présentation/communication efficace (dans les médias, conférences,
etc.)
d’une grande quantité de données.

  • 4) Pensée critique (critiquer le travail des autres) Connaître les statistiques est essentiel afin de développer une pensée critique par rapport aux connaissances, décisions, et communications présentées.
    Identifier le “junk science” (science bidon)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Définitions : Statistiques

A

branche des mathématiques qui s’intéresse à l’acquisition, l’organisation, l’analyse, l’interprétation, et la présentation des données.
À l’aide des données et des outils statistiques, on peut répondre à des questions de recherche.
Les outils statistiques permettent de prendre des questions mieux informées à partir de nos données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Définitions : Données

A

Informations actuelles à propos d’individus recueillies à l’aide de sondages ou études de toutes sortes qui peuvent être représentées par des symboles ou des nombres.
Les données sont des éléments fondamentaux des statistiques

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Définitions : Population et Echantillon

A
  • Population: Une collection complète d’individus ou d’individus potentielles
  • Échantillon: Un sous-ensemble d’individus tirées d’une population
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Définitions : Statistiques Descriptive

A

l’ensemble des techniques numériques (tendance centrale et dispersion, étendues, corrélations) et graphiques (histogramme, diagrammes, etc.) qui permettent de résumer et visualiser des données. - Décrit les choses actuelles., moyenne de groupe par exemple.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Définitions : Statistiques

A

l’ensemble des outils (une variété de tests et d’estimations) qui permettent de généraliser les propriétés d’un échantillon à une population à partir des données de l’échantillon (estimation, prédiction, prise de décision). – Inférence à la population, l’échantillon sera la représentation de la population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quelles sont les deux branches des statistiques?

A

Statistique inférentielle et descriptives.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Définition: rencensement

A

est un échantillon de la même taille que la population.
◦ Par exemple, le recensement Canadien recueille des données sur la population Canadienne entière. Un recensement peut être juste pour une classe complète, si on précise que la population est la classe d’analyse quantitative h2020 avec le prof; lundi apres midi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce que les observations potentielle et les observations actuelle

A
  • Habituellement, les populations sont très grandes et il n’est pas concrètement possible de recueillir les données pour une population entière (observations potentielles).
  • Habituellement, les échantillons sont relativement petits et nous possédons des données (observations actuelles).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Définition: Variable

A

Une variable est une propriété qui peut décrire quelqu’un ou quelque chose pouvant prendre plusieurs valeurs différentes. C’est à partir de la variable qu’on prend les données

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Les données : Qualitative

A

Qualitative: la donnée est un mot, lettre ou code numérique, qui ne sert seulement à classifier. Ex: programme d’étude, un diagnostic, sexe, profession, etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Les données : Quantitative

A

Quantitative: la donnée est un nombre qui représente une quantité, grandeur, ou un décompte. Elles peuvent être A) continues ou B) discrètes. Ex: revenu annuel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Les données : Les rangs

A

la donnée est un chiffre qui représente une position relative (1er, 2e,3e, etc.), entre qualitatif et quantitatif. Ex: rang dans une course, ordre de naissance, etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Dans les variables quantitatives, qu’est-ce que les variables quantitatives CONTINUE ?

A

la variable peut prendre n’importe quelle valeur sur l’échelle. Seule la précision de la mesure limite le nombre de décimales (on arrondit)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Dans les variables quantitatives, qu’est-ce que les variables quantitatives DISCRÈTE? Cas spéciaux de la psychologie?

A

la variable peut seulement prendre (nombre entier) certaines valeurs isolées sur l’échelle, nombres entiers seulement. Ex. Tout décompte (nombre de personnes).

Cas spéciaux: des variables quantitatives discrètes pouvant prendre un grand nombre de valeurs possibles (au moins une vingtaine) peuvent être analysées comme s’ils étaient des variables continues.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Définition: Variable observable (qu’elle soit quantitative ou qualitative)

A

peut être mesurée directement, toute grandeur. Ex: taille, poids, vitesse, temps, décompte, couleur, etc.

Les variables latentes/observables peuvent être quantitatives, qualitatives, ou des rangs.

17
Q

Définition: Variable latentes (qu’elle soit quantitative ou qualitative)

A

ne peut pas être directement mesurée; on l’infère à partir de variables observables. Ex : Habiletés visuospatiale, extraversion, qualité de vie

Les variables latentes/observables peuvent être quantitatives, qualitatives, ou des rangs.

18
Q

Définition : La variable indépendante

A

est manipulée par le chercheur (assignée, sa valeur est spécifiée d’avance) ex: donner le placebo ou le médicament. La VI est qualitative. Elle pourrait être quantitative, mais cela changerait le type d’analyse statistique.

Dans un contexte de régression, la/les variable(s) indépendante(s) (X) prédisent la variable dépendante (Y)

19
Q

Définition : La variable dépendante

A

est mesurée par le chercheur (ne peut pas être spécifiée d’avance, avant de l’avoir mesurée). Ex: on l’obtient par la variable indépendante. La VD est quantitative.
Elle pourrait être qualitative, mais cela changerait le type d’analyse statistique.

Dans un contexte de régression, la/les variable(s) indépendante(s) (X) prédisent la variable dépendante (Y)

20
Q

Comment savoir si une variable est confondante?

A

Une variable est confondante si elle influence ou pourrait influencer nos variables mesurées dans l’étude. Une variable confondante peut être mesurée ou non. Ex : comorbidité, âge

21
Q

Théorie de Stevens : niveau de mesure

A

Le niveau de mesure (donne le niveau de complexité ou échelle de mesure) décrit l’information contenue dans un type de donnée.

a) Spécifie à quel point la donnée (nombre, mot ou symbole) représente une propriété;
b) Détermine quelles opérations arithmétiques on peut effectuer avec un ensemble de données.

c) Toutes les propriétés d’un niveau inférieur sont comprises dans un niveau supérieur.
On peut transformer une variable d’un niveau supérieur à inférieur, mais pas l’inverse, car il y a perte d’information lorsqu’on descend de niveau.

22
Q

Quels sont les 4 types de niveau de mesures, du moins au plus complex?

A

Nominale (qualitative)
Ordinale (rang)
Intervalle (quantitative)
De rapport (quantitative)

23
Q

Niveau de mesure : Nominale (4 propriétés)

A

◦ La propriété unique de la mesure est la classification/ l’appartenance à un groupe.
◦ Opérations mathématiques permises: =, ≠
◦ La tendance centrale importante est le mode
◦ Utile pour classifier / créer des groupes, mais également comme variable d’intérêt (avec des effectifs

24
Q

Niveau de mesure : Ordinale

A

◦ Reflètent un ordre relatif, sans différence de degrés (la différence entre les données ex: oui pt et non; mais encore un débat) entre les données.
◦ Opérations mathématiques possibles: >,

25
Q

Niveau de mesure: Intervalle

A

◦ Intervalles égaux : les écarts de grandeur égaux à n’importe quel point sur l’échelle sont de grandeur égale; par exemple, 20⁰ C– 10⁰ C= 30⁰ C – 20⁰ C
◦ Opérations mathématiques possibles: +, -
◦ Calcul de moyenne et variance permise.

26
Q

Niveau de mesure: De rapport

A

◦ Zéro absolu: valeur à laquelle l’échelle est nulle, par exemple 0⁰ C ne signifie pas une absence de température, mais 0 kg signifie une absence de masse.
◦ Opérations mathématiques possibles: +, -; et on ajoute multiplication et division pour rapport.
◦ Calcul de moyenne et variance permise.

27
Q

Comment créer de nouvelles variables? Quels sont les deux méthodes ?

A

Méthode 1: Conversion en réduisant le niveau de complexité (avec une perte d’information) Ex : Variable “rang” créé en descendant de niveau.

Méthode 2: Opération mathématique à l’intérieur du même niveau (avec une perte de précision). Ex : variable “temps moyen”, nous perdons la précision que nous avons en connaissant le temps pour compléter chaque test individuellement. Toutefois, cela peut être plus utile et pratique d’analyser une variable (“temps moyen” au lieu de deux.

28
Q

Quel est le dilleme avec les mesures en psychologie et les échelles de Likert?

A

Strictement parlant, puisuq’elle sont non mesurable directement, celles-ci seraient des mesures ordinales

Cependant, on présume que les intervalles sont approximativement égaux et on les considère comme des mesures à intervalles

29
Q

Niveaux de mesure – 3 critiques (Théorie de likert acceptée en psychologie, mais critiquée par les statisticiens)

A
  1. Limiter les transformations mathématiques permises aux données va à l’encontre des pratiques courantes en statistiques dans le reste du domaine scientifique.
  2. La classification des niveaux de mesure est trop stricte pour être appliquée aux échelles de mesures réelles (trop d’exemples “entre- deux”.
  3. Trop d’échelles de mesures qui pourraient être analysées en tant qu’échelles à intervalles devraient être analysées en tant qu’échelles ordinales, ce qui obligerait l’utilisation de statistiques non-paramétriques moins puissantes (échelles de Likert).