Introduction à l'inférence statistique Flashcards
Qu’est-ce que l’inférence statistique ?
Processus qui permet de généraliser ce qui a été observé à l’échelle de l’échantillon à l’échelle de la population statistique.
Qu’est-ce que l’inférence de nature probabiliste ?
Inférence statistique où on suppose que les paramètres d’intérêt sont inconnus, mais fixes dans le temps et l’espace (relativement à la période de l’échantillonnage). Cette approche se base sur ce qui est attendu si on pouvait échantillonner de la même façon et avec le même effort un très grand nombre de fois une même population.
Qu’est-ce que l’intervalle de confiance et comment on l’interprète ?
Le processus donnant lieu à un intervalle de confiance pour toute statistique estimée à partir d’un échantillon dans le but d’une inférence est tel qu’il fait en sorte que 95% des intervalles obtenues lorsqu’il est répété un grand nombre de fois, contiendront la vraie valeur du paramètre de la population.
Pourquoi est-ce qu’une intervalle de confiance ne veut pas dire qu’il y ait 95% de chances que la vrai valeur se trouve à l’intérieur de l’intervalle ?
La valeur d’un paramètre étant fixe selon le cadre fréquentiste, il est inconcevable qu’un paramètre ait 95% des chances de se trouver entre les bornes et 5% de se trouver à l’extérieur. Il est dans les bornes ou non
Comment on calcule un intervalle de confiance ?
En utilisant une estimation du degré d’incertitude avec lequel le paramètre d’intérêt a été estimé.
x_ =/- t dl,alpha/2 * erreur type
Quelle est la différence entre une fonction de masse et de densité de probabilité (d)?
Les fonctions de masse sont associées à des lois de probabilités discrètes alors que les fonction de densité sont associées à des lois de probabilités continues.
- Les fonctions de masse donnent donc la probabilité que peut prendre chaque valeur d’une variable aléatoire discrète (binomiale et Poisson)
- Il est impossible de dire la probabilité que peut prendre une valeur continue puisque celle-ci tend vers 0
Qu’est-ce qu’une fonction de répartition (de probabilité cumulative) (p) ?
Elle renvoie la probabilité que la variable aléatoire soit plus petite ou égale à une valeur particulière.
Qu’est-ce qu’une fonction quantile (q) ?
À l’inverse d’une fonction de répartition, une fonction quantile renvoie la valeur que prend une variable aléatoire au sein d’une distribution de probabilité pour un niveau de probabilité cumulative donné.
Pourquoi la distribution de t de Student a-t-elle été créée ?
Afin de pallier au fait que les méthodes permettant de calculer des intervalles de confiance et d’effectuer des tests statistiques supposaient l’utilisation d’échantillon de grandes tailles. Par exemple, la normalité nécessite des estimations de la moyenne et de l’écart type de la population, puis à faible taille d’échantillon, la dispersion augmente grandement. Il s’ensuit que la distribution des variables aléatoires à petite taille d’échantillon n’est pas tout à fait normale. La distribution de t de Student intègre cette source d’incertitude via le concept d’erreur type et de degrés de liberté.
Quel est un degré de liberté ?
Le concept de degré de liberté réfère au nombre d’unités d’informations indépendantes contenues dans un échantillon de taille n et qui peuvent être utilisées pour estimer un paramètre.
Quel est l’influence d n sur la distribution de t ?
À mesure que le nombre de degrés de liberté augmente, les queues de la distribution s’amenuisent au profit de portion centrale. Le gonflement des queues pour de faibles tailles d’échantillons
reflète l’incertitude associée à l’estimation des moyennes dans ces conditions.
Quel est l’influence de n sur l’étendue des intervalles de confiance ?
Plus la précision de l’estimation de la moyenne est faible, plus l’intervalle de confiance sera grande. Alors, plus le phénomène possède une grande variance plus son erreur type sera élevé.