cours 1 Flashcards

1
Q

statistique définitions

A
  1. Ensemble des méthodes qui ont pour objet la collecte, le traitement, et l’interprétation des données à l’aide des mathématiques appliquées.
  2. Ensemble des données concernant une catégorie de faits, un phénomène ou un groupe d’individus (ex: le taux de natalité d’une population).
  3. Variable aléatoire qui est fonction des observations et construite à partir d’un échantillon (ex: paramètre observé mais non contrôlé).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

dans quel domaine est ce que les biostatistiques jouent un rôle important

A

transformer les données numériques en information (moyenne, corrélation);
traiter l’information pour dégager des faits (tests statistiques);
améliorer la compréhension des systèmes (interprétation);
émettre des prédictions et prendre des décisions (modèles).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

à quoi servent les stat

A

À mesurer la variabilité:

Variabilité génétique entre sujets (individus)
Variabilité due au développement (ontogénétique)
Variabilité due au moment (temporelle)

Variabilité stochastique (aléatoire)
Variabilité déterministique (prédictible)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

comment étudier la variabilité d’un phénomène

A

en répétant l’expérience dans les mêmes conditions ou la loi d’un phénomène (relation, tendance) en faisant varier les conditions de l’expérience ou de l’observation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

élément/ unité d’observation

A

Unité qui compose la population d’intérêt. C’est une entité concrète définie a priori, identifiable sans ambiguïté et dénombrable, sur laquelle on mesure ou observe un ou plusieurs traits.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

vrai ou faux
Il peut y avoir des éléments primaires, secondaires, tertiaires si ceux-ci sont imbriqués (emboîtés, hiérarchisés).

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

population statistique

A

Totalité des observations individuelles sur laquelle portent les inférences statistiques et existant n’importe où dans une aire d’échantillonnage aux limites spatiotemporelles clairement spécifiées.
Collection d’éléments possédant au moins une caractéristique commune et exclusive, permettant de la déterminer et de la distinguer sans ambiguïté de tout autre, de laquelle on extrait un échantillon et sur laquelle portent les inférences statistiques.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

comment peut être la population statistique

A

fini ou infinie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

à quoi servent les critères d’inclusion/ exclusion

A

ils permettent de distinguer une population statistique d’une autre.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

inférence statistique

A

opération logique qui consiste à porter un jugement sur un ensemble vaste (la population statistique) à partir d’un sous-ensemble (l’échantillon) en tenant pour acquis la validité d’application de certaines lois de probabilités.

C’est le processus inverse de la déduction, utilisée en statistique descriptive pour connaître les caractéristiques d’un échantillon.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

population cible

A

ensemble sur lequel devraient porter les conclusions de l’étude en l’absence de toute contrainte.

La généralisation des résultats à la population cible fait appel au seul jugement du scientifique.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

vrai ou faux
Souvent l’échantillonnage peut couvrir entièrement la population cible.

A

faux

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

à quoi fait appel la généralisation des résultats de l’échantillon à la population statistique

A

à l’inférence statistique.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

échantillon

A

Fragment d’un ensemble prélevé pour juger de cet ensemble.

Collection d’éléments prélevés d’une façon particulière au sein de la population statistique afin de tirer des conclusions sur cette dernière.

Fraction d’une population statistique sur laquelle des mesures (ou observations) sont effectuées dans le but de connaître les propriétés de cette population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

échantillonnage exhaustif

A

recensement
utile pour les maladies rares

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

fraction d’échantillonnage

A

fE = n/N
Effectif de la population statistique (N) : nombre d’éléments total
Effectif de l’échantillon (n) : égal au nombre d’éléments qui constitue l’échantillon
peut aller de 1 à N

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

tirage aléatoire

A

Pour généraliser les résultats d’une
étude à la population statistique,
l’échantillon doit être représentatif
de cette population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

échantillon représentatif

A

échantillon
qui reflète fidèlement la complexité et
la composition de la population statistique.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

familles de méthodes qui assurent la représentativité

A
  • Mélange des éléments
  • Échantillonnage probabiliste
  • Sélection par quota des éléments
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

échantillonnage probabiliste

A

échantillonnage dont chaque élément de la population statistique a une probabilité connue et non nulle d’appartenir à l’échantillon.

Donne un échantillon aléatoire.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

types d’échantillonnage aléatoire

A

Aléatoire simple
Systématique
À probabilités inégales
Stratifié
Par degré

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

échantillonnage aléatoire simple

A

Prélever au hasard et de façon indépendante n unités d’échantillonnage dans une population de N éléments.

Chaque élément a la même probabilité d’être échantillonné P(n) = n/N

Chacun des échantillons possibles de taille n possède la même probabilité d’être constitué.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

variables

A

Toute caractéristique mesurable ou observable sur un élément d’échantillonnage (variable) ou sur son environnement (variable associée ou covariable).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

types de variables

A

quantitatives et qualitatives

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

variable qualitative

A

facteur avec plusieurs niveaux/catégories, ordonnés ou non

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

variable quantitative

A

peut être mesuré ou quantifié

27
Q

variable aléatoire

A

variable dont la valeur est le résultat d’un processus aléatoire (stochastique). Pour un élément donné, la valeur précise prise par une variable aléatoire n’est pas connue avant qu’une observation n’ait été faite par opposition à variable contrôlée.

28
Q

variable aléatoire discrète

A

Ne peut prendre qu’un nombre fini de valeurs.

29
Q

variable aléatoire continue

A

Peut prendre toutes les valeurs d’un intervalle fini ou non

30
Q

échelle de variation

A

Système de classement de variable

31
Q

échelle de variation nominale

A

classement en catégories (qualitatives) collectivement exhaustives et mutuellement exclusives. Sur cette échelle, l’ordre des catégories et les distances existant entre elles sont ignorées.

32
Q

échelle de variation ordinale

A

classement en rang ou en catégories ordonnées. La distance entre deux catégories adjacentes n’est pas connue et peut varier.

33
Q

échelle de variation par intervalle

A

classement d’une variable quantitative dont la valeur nulle (le 0) est arbitraire. La distance qui sépare deux données ou catégories est connue.

34
Q

échelle de variation relative

A

classement d’une variable dont le 0 n’occupe pas une position arbitraire et signifie la nullité ou l’absence. Peut prendre toutes les valeurs d’un intervalle fini ou non.

35
Q

type de variable qualitative ou catégorielle

A

Binaires (2 modalités)
Multiples (>2 modalités)
Non-ordonnées (échelle nominale)
Ordonnées (intervalles variables entre les catégories)

36
Q

type de variable semi quantitative

A

(échelle ordinale ou de rang)

37
Q

type de variable quantitative

A

intervalles connus entre les classes)
discontinue ou continue

38
Q

variable contrôlée

A

variable dont la valeur est déterminée par la personne expérimentatrice et connue de façon précise.

39
Q

variable dépendante ou explicative

A

variables qui expliquent au moins en partie les variations du phénomène étudié, celles dont on recherche l’influence

40
Q

variable dépendante ou réponse

A

variables qu’on cherche à comprendre ou à prévoir les variations ou la réalisation dans le maximum de situations possibles.

41
Q

plan d’échantillonnage

A
  1. FORMULATION DES OBJECTIFS ET DES HYPOTHÈSES
  2. CHOIX DU TYPE D’ÉTUDE
  3. CHOIX DE LA POPULATION
  4. CHOIX DU SCHÉMA
  5. CHOIX DES VARIABLES ET DES FACTEURS
  6. CHOIX DU PLAN D’EXPÉRIENCE/ÉCHANTILLONNAGE
  7. CHOIX DE LA MÉTHODE D’ÉCHANTILLONNAGE
  8. DISPOSITIFS DE MESURES OU D’ÉVALUATION
  9. CHOIX DE L’ANALYSE STATISTIQUE – THÈME DE BIO106
  10. BONNES PRATIQUES STATISTIQUES ET MÉTHODOLOGIQUES
42
Q

paradoxe de Simpson

A

lorsque une tendance présente dans différents groupes de données disparait ou même s’inverse lorsque les groupes sont combinés

43
Q

3 types d’approche

A

exploratoire
confirmative
pilote

44
Q

approche exploratoire

A

pour générer des hypothèses de travail à vérifier plus tard

45
Q

approche confirmative

A

pour confirmer une hypothèse ou un concept

46
Q

approche pilote

A

(ou étude de validité de concept ou étude méthodologique): vérifier si une idée nouvelle est appuyée par quelques éléments, ou pour préparer le protocole d’une étude confirmative.

47
Q

étude expérimentale

A

expérimentation, travailler sur un système simplifié dans lequel on fait varier les niveaux d’une ou quelques variables pour observer les effets sur
des groupes identiques d’unités expérimentales (=éléments primaires).

Excellent pour établir relations de cause à effet (bonne validité interne, faible validité externe ou in Natura)

48
Q

étude observationnelle

A

description d’un système en fonction.

Mesurer le phénomène d’intérêt sur des unités d’échantillonnage aléatoires ainsi que l’ensemble des variables décrivant la situation

Difficile de vérifier des relations cause à effet (faible validité interne, mais bonne validité externe ou in Natura)

49
Q

choix de l’élément

A

Guidé par la question d’intérêt.

50
Q

que peut créer l’échantillonnage des éléments

51
Q

biais

A

c’est l’erreur systématique. Il y a biais lorsque les estimations d’un paramètre à partir des différentes combinaisons d’unités d’échantillonnage qu’il est possible de former sont systématiquement au-dessus ou au-dessous de la valeur de la population statistique.

52
Q

types de biais

A

Biais de sélection
Erreurs de couverture
Erreurs de réponse
Erreurs de non-réponse

53
Q

biais de sélection

A

Résulte d’une sélection non-aléatoire des unités
d’échantillonnage

54
Q

erreur de couverture

A

provient d’une mauvaise définition de la pop. statistique

55
Q

erreur de réponse

A

causée par une mauvaise mesure des éléments.

56
Q

erreur de non réponse

A

résulte de la non-détection d’individus présents au sein d’une unité d’échantillonnage.

57
Q

erreur de l’échantillonnage

A

C’est une erreur aléatoire (pas systématique) donc difficile à contrôler

58
Q

sources d’erreurs d’échantillonnage

A

temporelle, spatiale, ou due à l’échantillonnage (l’estimation d’un paramètre va varier en fonction de la combinaison des éléments échantillonnés, même si l’échantillon est représentatif).

59
Q

quand est ce que l’erreur d’échantillonnage est nulle

A

seulement quand l’échantillonnage est exhaustif (recensement).

60
Q

précision

A

quantifie le niveau de variation (dispersion) entre les estimations obtenues suite à plusieurs échantillonnages de la population statistique.

La précision d’une estimation est influencée par les diverses sources d’erreurs d’échantillonnage.

61
Q

justesse

A

résulte d’une absence de biais.

62
Q

exactitude

A

est à la fois affectée par les biais et les erreurs d’échantillonnage. Exact = juste + précis

63
Q

pour éviter les biais :

A

Randomisation: assignation aléatoire d’un traitement antibiotiques à plusieurs groupes de souris.

Réplication: on répète chacun des niveaux du traitement pour avoir plusieurs unités d’échantillonnage soumises aux mêmes conditions.

64
Q

pour accroître la précision :

A

Réplication: on répète chacun des niveaux du traitement pour avoir plusieurs unités d’échantillonnage soumises aux mêmes conditions.

Contrôle de la variation (par la stratification, la mesure de covariables)