Séance 3 Flashcards
La compilation de données consiste a :
essentiellement a organiser, analyser et présenter des données
Rôle de la compilation de donnée : (5)
Observer des tendances
Trier l’essentiel
Quantifier des données
Améliorer la performance
Obtenir un format de présentation claire et intuitive
Qu’est-ce que la distribution des données ?
La manière dont les valeurs d’un ensemble de données se répartissent. Cela permet de voir comment les réponses sont organisées et sont présentées sous forme de graphique.
La distribution des données (suite) permet de voir quoi sur un graphique? (3)
Les valeurs fréquentes. Est-ce qu’il semble y avoir une tendance ?
Est-ce qu’il y a des valeurs rares très différentes des autres (aberrent)
La tendance générale
L’analyse de donné c’Est quoi? consiste a quoi?
Processus d’Examen, de transformation et de modélisation de données pour en extraite des informations utilises, des conclusions et des tendances.
L’analyse de données consiste à «faire parler» les résultats et de faire des liens.
À partir des données d’un registre, vous devez être en mesure de déterminer et mesurer :
Taux de variation (a) par la régression linéaire
Moyenne arithmétique sur une période
La proportion à un instant donné
En pratique, le résultat des données ne donne jamais une droite (nuage de point)parfaite donc :
c’est pourquoi on fait une régression linéaire qui consiste a tracer une ligne droite qui représente aux mieux la tendance linéaire des données
Le coefficient de détermination mesure et indique quoi?
R2 est un coefficient de détermination d’une régression linéaire qui mesure la variance. Sa valeur se situe entre 0 et 1.
-En gros, R2 nous indique jusqu’à quel point la régression est représentative de la réalité
Qu’est-ce que la variance ?
mesure qui quantifie la dispersion des valeurs d’un ensemble de données par rapport a leur moyenne
𝑆𝑖 𝑅^2≥0,9
les valeurs suivent plutôt une tendance linéaire
𝑆𝑖 𝑅^2≤0,9,
les valeurs ne suivent pas vraiment une tendance linéaire
ATTENTION:
COMMENCEZ TOUJOURS PAR REGARDER LA DISTRIBUTION DES DONNÉES!!!!!!!
La proportion :
Comparer deux données à un instant précis. (fraction ou pourcentage)
La donnée A est X % plus haute/basse comparativement à la donnée B.
Les limites de l’analyse de données : (4)
Biais de sélection : est-ce que j’ai analyser les bons registre?
Biais de confirmation : Tendance a analyser de manière a confirmer l’hypothèse
Biais de mesure : Utiliser la mauvaise méthode de mesure pour analyser les données
Qualité des données : Est-ce que les registres sont bien remplis?
Différente entre controle et assurance de la qualité:
Controle = procédure, inspection, formation, registre (appliquer les normes)
Assurance de la qualité : Standards, Normes, Ligne directrices, Seuil minimal (définir les normes)