Echantillonage a travers l'analyse de stup Flashcards
Def saisie
l’entièreté des éléments saisis. Elle peut être constituée d’une seule population ou de plusieurs populations (ex : plusieurs pacsons, fingers, …)
Def trace
= specimen: un élément individuel d’une population que l’on ne choisit pas (par exemple une seule pilule, le prélèvement d’un résidu d’incendie,… ). On ne sait pas si la trace est représentative du tout. Le spécimen est généralement unique, non contrôlé et donc imparfait.
Def echantillon
une unité ou une série d’unités d’une population définie. On choisit l’échantillon pour avoir une information sur l’ensemble de la variation de la source. Représentatif statistiquement et homogène. Effectué dans le cadre du matériel de comparaison ou d’études de population
def prelevement
une partie prélevée d’un spécimen ou d’un échantillon pour analyse
def population
: collections d’échantillons ; elle peut être homogène ou inhomogène
Quels sont les buts de l’echantillonage?
- Réduire le nombre d ’analyses (temps, argent)
- Réduire la charge de travail
- Conserver le maximum d’information (question initiale)
- Représentativité !!!
Qunad une technique d’echantillonage representatif peut etre utilise?
peut etre effectue sur une pop d’unite ayant des caracteristique physique externes definit comme similaire tel que la taille, forme, logo –> premiere classification
A quel question doivent repondre la procedure d’echantillonage
- Les propriétés de l’échantillon sélectionné reflètent celles de la population de laquelle il est issu
- Chaque unité de la population a une chance égale d’être sélectionnée (sélection aléatoire, pas toujours évident avec de grandes saisies).
quels sont les 2 types de strategie?
-arbirtraire
-statistique
expliquer les avantages et les desaventage de l’echantillonage arbitraire
souvent utilisé en pratique et fonctionne bien dans plusieurs cas de figure. Cependant il n’a pas de bases scientifiques et peut fournir un grand nombre d’échantillons lors de grandes saisies.
Donner les differentes facon de mener un echantillonage arbitraire?
1) Tous : n=N, on est 100% de la composition de la population mais la taille de l’échantillon est vite excessive, surtout avec de grandes populations.
2) 0.05N=n, 0.01N=n, etc : c’est une approche simple mais on peut toujours avoir trop d’analyse à faire.
3) La racine de N ça va mais si vraiment très petite population, trop petit échantillon.
4) On en prend 20 de base et ensuite on applique un facteur pour en prendre tant de ce qui reste, mais on peut quand même arriver à un nombre excessif.
5) Recherche de compromis
–> N<x et x< N < y et N > y
recommande par l’ONU mais peut devenir exessif pour grande population
6) On en analyse 1, minimaliste, mais pas forcément insuffisant, si la question de savoir s’il y a présence de produit stupéfiant, et que la première pilule qu’on analyse en contient, ok !
Definir les avantages et les desaventage l’approche statistique
avantage fondé sur une approche fréquentiste ou bayésienne, permet de quantifier à quel point l’échantillon est représentatif de l’ensemble, mesure de représentativité
desavantage: Se base sur des présupposés pas forcément vrais dans le cas d’espèce, puisqu’on ne connaît pas la composition.
Donner les differents echantillonages statistique
-approche frequentiste
-approche bayesienne
Definir l’approche frequentiste
Distribution hypergéométrique
–>
La plus largement employée d’un point de vue fréquentiste. La probabilité qu’un échantillon de taille n contienne X positifs (unités contenant des substances illicites), sachant la taille de la population N contenant N1 positifs est donné par une formule
–> se referer au tableau de distribution hypergéométrique présentant le nombre d’échantillons à analyser pour garantir à un niveau de confiance de 95% à 99% qu’au moins une proportion k*100% de stupéfiant soit présente dans la population échantillonnée, en stipulant que tous les échantillons contiennent des stupéfiants.
ex: supposons une population contenant 100 paquets. Pour garantir (avec un niveau de confiance à 95%) qu’au moins 90% des paquets contiennent des stupéfiants il faut sélectionner 23 unités et que toutes se révèlent positives.
Cette approche est donc limitée en cas d’hétérogénéité. C’est une approche qualitative
Si il y’a ds neg, il faut analyser plus, mais a partir de 100, moins d’impact
distribution binomiale
–>
Approximation de lhypergéométrique, ok pour de grandes populations
Definir l’approche bayesienne
Approche qualitative. La loi bayésienne prend en considération la connaissance a priori de la population à échantillonner, ce que ne fait pas l’approche fréquentiste. Ainsi trois cas de figure peuvent être extraits dans la pratique. Ces cas de figures, considérés comme la connaissance a priori, permettent de modéliser les distributions (distribution BETA)
–> tableau avec a et b qui augmente en fonction de la confiance a priori
–> approche qualitative