Expert I Statistics (11, only in math 20-2 not math 20-1), Expert I Statistiques (11, seulement en maths 20-2 et non en maths 20-1) Flashcards

1
Q

What is the definition of mean in statistics?

Quelle est la définition de la moyenne en statistique ?

A

The mean is the average of a set of numbers calculated by adding them together and dividing by the number of values.

La moyenne est la moyenne d’un ensemble de nombres calculée en les additionnant et en les divisant par le nombre de valeurs.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

True or False: The median is the middle value in a set of numbers when arranged in numerical order.

Vrai ou faux : La médiane est la valeur centrale d’un ensemble de nombres classés par ordre numérique.

A

True

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

What is the range of a data set?

Qu’est-ce que l’étendue d’un ensemble de données ?

A

The range is the difference between the largest and smallest values in a data set.

L’étendue est la différence entre la plus grande et la plus petite valeur d’un ensemble de données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

What is the formula for calculating standard deviation?

Quelle est la formule de calcul de l’écart-type ?

A

The standard deviation is calculated by taking the square root of the variance.

L’écart-type est calculé en prenant la racine carrée de la variance.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

What does the term ‘outlier’ refer to in statistics?

Que signifie le terme “valeur aberrante” en statistique ?

A

An outlier is a data point that differs significantly from other observations in a data set.

Une valeur aberrante est un point de données qui diffère de manière significative des autres observations d’un ensemble de données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

What is the mode of a data set?

Quel est le mode d’un ensemble de données ?

A

The mode is the value that appears most frequently in a data set.

Le mode est la valeur qui apparaît le plus fréquemment dans un ensemble de données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

What is the formula for calculating variance?

Quelle est la formule de calcul de la variance ?

A

Variance is calculated by taking the average of the squared differences from the mean.

La variance est calculée en prenant la moyenne des différences au carré par rapport à la moyenne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

What is the purpose of hypothesis testing in statistics?

Quel est l’objectif des tests d’hypothèse en statistique ?

A

Hypothesis testing is used to determine if there is enough evidence to reject a null hypothesis.

Le test d’hypothèse est utilisé pour déterminer s’il existe suffisamment de preuves pour rejeter une hypothèse nulle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

What is the difference between a population and a sample in statistics?

Quelle est la différence entre une population et un échantillon en statistiques ?

A

A population includes all members of a specified group, while a sample is a subset of the population used for analysis.

Une population comprend tous les membres d’un groupe donné, tandis qu’un échantillon est un sous-ensemble de la population utilisé pour l’analyse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

What is the central limit theorem?

Qu’est-ce que le théorème de la limite centrale ?

A

The central limit theorem states that the distribution of sample means approaches a normal distribution as the sample size increases.

Le théorème de la limite centrale stipule que la distribution des moyennes d’un échantillon se rapproche d’une distribution normale lorsque la taille de l’échantillon augmente.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

What is the purpose of a confidence interval in statistics?

Quel est l’objectif d’un intervalle de confiance en statistique ?

A

A confidence interval is used to estimate the range within which the true population parameter is likely to fall.

Un intervalle de confiance est utilisé pour estimer la fourchette dans laquelle le paramètre réel de la population est susceptible de se situer.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

What is the difference between correlation and causation?

Quelle est la différence entre corrélation et causalité ?

A

Correlation indicates a relationship between two variables, while causation implies that one variable directly influences the other.

La corrélation indique une relation entre deux variables, tandis que la causalité implique qu’une variable influence directement l’autre.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

What is a p-value in hypothesis testing?

Qu’est-ce qu’une valeur p dans les tests d’hypothèse ?

A

A p-value is the probability of obtaining results as extreme as the observed data, assuming the null hypothesis is true.

Une valeur p est la probabilité d’obtenir des résultats aussi extrêmes que les données observées, en supposant que l’hypothèse nulle est vraie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

What is a Type I error in hypothesis testing?

Qu’est-ce qu’une erreur de type I dans les tests d’hypothèse ?

A

A Type I error occurs when the null hypothesis is rejected when it is actually true.

Une erreur de type I se produit lorsque l’hypothèse nulle est rejetée alors qu’elle est vraie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

What is a Type II error in hypothesis testing?

Qu’est-ce qu’une erreur de type II dans les tests d’hypothèse ?

A

A Type II error occurs when the null hypothesis is accepted when it is actually false.

Une erreur de type II se produit lorsque l’hypothèse nulle est acceptée alors qu’elle est fausse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

What is the formula for calculating the coefficient of determination (R-squared)?

Quelle est la formule pour calculer le coefficient de détermination (R-carré) ?

A

R-squared is calculated as the square of the correlation coefficient between two variables.

Le R au carré est calculé comme le carré du coefficient de corrélation entre deux variables.

17
Q

What is the purpose of a scatter plot in statistics?

Quel est l’objectif d’un diagramme de dispersion en statistique ?

A

A scatter plot is used to visualize the relationship between two variables in a data set.

Un diagramme de dispersion est utilisé pour visualiser la relation entre deux variables dans un ensemble de données.

18
Q

What is the difference between a dependent and independent variable in statistics?

Quelle est la différence entre une variable dépendante et une variable indépendante dans les statistiques ?

A

A dependent variable is the outcome being measured, while an independent variable is the factor that is being manipulated.

Une variable dépendante est le résultat mesuré, tandis qu’une variable indépendante est le facteur manipulé.

19
Q

What is the formula for calculating the coefficient of correlation?

Quelle est la formule pour calculer le coefficient de corrélation ?

A

The coefficient of correlation is calculated by dividing the covariance of two variables by the product of their standard deviations.

Le coefficient de corrélation est calculé en divisant la covariance de deux variables par le produit de leurs écarts types.

20
Q

What is the purpose of regression analysis in statistics?

Quel est l’objectif de l’analyse de régression en statistique ?

A

Regression analysis is used to analyze the relationship between two or more variables and predict future outcomes.

L’analyse de régression est utilisée pour analyser la relation entre deux ou plusieurs variables et prédire les résultats futurs.

21
Q

What is the difference between a one-tailed and two-tailed test in hypothesis testing?

Quelle est la différence entre un test unilatéral et un test bilatéral dans les tests d’hypothèse ?

A

In a one-tailed test, the rejection region is on only one side of the distribution, while in a two-tailed test, it is on both sides.

Dans un test unilatéral, la région de rejet se trouve d’un seul côté de la distribution, alors que dans un test bilatéral, elle se trouve des deux côtés.

22
Q

What is the formula for calculating the margin of error in a confidence interval?

Quelle est la formule pour calculer la marge d’erreur dans un intervalle de confiance ?

A

The margin of error is calculated by multiplying the critical value by the standard error.

La marge d’erreur est calculée en multipliant la valeur critique par l’erreur standard.

23
Q

What is the purpose of ANOVA (Analysis of Variance) in statistics?

Quel est l’objectif de l’ANOVA (analyse de la variance) en statistique ?

A

ANOVA is used to analyze differences among three or more groups by comparing variances.

L’ANOVA est utilisée pour analyser les différences entre trois groupes ou plus en comparant les variances.

24
Q

What is the difference between a null hypothesis and an alternative hypothesis?

Quelle est la différence entre une hypothèse nulle et une hypothèse alternative ?

A

The null hypothesis assumes no effect or difference, while the alternative hypothesis suggests that there is an effect or difference.

L’hypothèse nulle suppose qu’il n’y a pas d’effet ou de différence, tandis que l’hypothèse alternative suggère qu’il y a un effet ou une différence.

25
Q

What is the formula for calculating the z-score of a data point?

Quelle est la formule pour calculer le score z d’un point de données ?

A

The z-score is calculated as the difference between the data point and the mean divided by the standard deviation.

Le score z est calculé comme la différence entre le point de données et la moyenne divisée par l’écart-type.

26
Q

What is the formula for calculating the z-score of a data point?

Quelle est la formule pour calculer le score z d’un point de données ?

A

The z-score is calculated as the difference between the data point and the mean divided by the standard deviation.

Le score z est calculé comme la différence entre le point de données et la moyenne divisée par l’écart-type.