Unidad 1: Tratamiento de Datos Flashcards

1
Q

Procesos y Variabilidad

A

Un proceso es un conjunto de etapas, ordenadas con cierta lógica, para obtener resultados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Conceptos fundamentales que intervienen en un problema “Estadístico”

A

La o las características de interés y el conjunto para el cual se requieren obtener conclusiones.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Población

A

La población es el conjunto de todos los elementos bajo estudio. Una población puede ser finita o infinita y el método de estudio es exhaustivo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Unidad elemental

A

A cada uno de los elementos que componen la población se lo denomina unidad elemental. La UE es ¿A quién estudio?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Variable

A

Una variable es cualquier característica que puede tomar diferentes valores o categorías en la unidades elementales. Para identificar una variable debemos preguntarnos ¿A qué estudio?. Se dividen en dos categorías:
- Cualitativas
- Cuantitativas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Variable cualitativas

A

Clasifica a las unidades elementales en categorías o niveles.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Variables Cuantitativas

A

Le asigna a cada unidad elemental un número. Se pueden clasificar en discretas o continuas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Variables Cuantitativas Discretas

A

El conjunto de valores posibles es finito o infinito numerable, y se asocia a un subconjunto de números enteros Z. NO EXISTE VALOR ENTREMEDIO DE ELLOS

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Variables Cuantitativas Continuas

A

El conjunto de valores posibles es un intervalo o conjunto de intervalos de números reales R. Entre dos valores cualesquiera puede existir un valor entremedio de ellos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Muestra

A

Una muestra es un subconjunto de elementos de la población bajo estudio. Su tamaño o cantidad de elementos se simbolizarán con a letra “n”. Sus métodos de estudio son por muestras aleatorias, probabilísticas o conveniencia).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Parámetro

A

Cualquier medida que resuma información de la población se denomina Parámetro

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Estadístico

A

Se denomina estadístico a cualquier medida que resuma información de una muestra.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Análisis descriptivo de los datos

A

Son tablas, gráficos o indicadores que se usan para resumir y/o presentar un conjunto de datos, sean estos de una muestra o de una población finita.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Análisis inferencial de los datos

A

Son intervalos de confianza y/o pruebas de hipótesis que permiten extender las conclusiones de una muestra a la población, con riesgos controlados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Características de una variable cualitativa: Frecuencia Absoluta (nK)

A

El número de elementos que pertenecen a cada clase recibe el nombre de frecuencia absoluta (nK)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Características de una variable cualitativa: Frecuencia Relativa (fK)

A

El cociente entre la frecuencia absoluta y el número total de observaciones recibe el nombre de frecuencia relativa (fK)

17
Q

Características de una variable cualitativa: Representación gráfica

A

-Gráfico circular (Torta)
- Gráfico de barras
- Diagrama de Pareto

18
Q

Características de una variable cuantitativa Discreta: Frecuencia Absoluta acumulada (NK)

A

Es la cantidad de elementos correspondientes a valores de la variable menores o iguales a xK

19
Q

Características de una variable cuantitativa Discreta: Frecuencia Relativa acumulada (NK)

A

Es la proporción de elementos cuyo valor de la variable es menor o igual que xK

20
Q

Características de una variable cuantitativa Discreta: Representación gráfica

A
  • Gráfico de bastones
  • Tablas
21
Q

Características de una variable cuantitativa Continua

A
  • Tallo y Hoja
22
Q

Características de una variable cuantitativa Continua: Representación gráfica

A
  • Histograma
  • Polígono de frecuencias acumuladas
  • Gráficos de serie de tiempo
  • Tablas
23
Q

Medidas de Posición

A
  • Media
  • Moda
  • Mediana
  • Cuartiles
  • Percentiles
24
Q

Media aritmética o Promedio

A

No coincide necesariamente con un valore de la variable. Es el valor medio de los valores de la variable.
Si se trata de una población se utiliza la letra griega μ.

25
Q

Moda

A

Es el valor de la variable con mayor frecuencia.

26
Q

Mediana

A

Es el mínimo valor de la variable que acumula, por lo menos, el 50% de las observaciones ordenadas en forma creciente.

27
Q

Cuartiles y Percentiles

A

Se definen de forma similar a la mediana, pero en vez de acumular el 50% acumulan el valor indicando (cuartil 1 q1=25%, cuartil 2 q2=50%,.., percentil 1 p1= 1%, etc).
Si se trata de una población se puede utilizar letras mayúsculas para su simbología.

28
Q

Comparación de media, mediana y moda

A

Si la media, mediana y moda coinciden es una distribución simétrica.
Si no coinciden se les llama distribuciones Asimétricas.
Si todos los datos se acumulan en la izquierda del gráfico, entonces es una distribución asimétrica a la derecha.
Si todos los datos se acumulan a la derecha del gráfico, entonces, es una distribución asimétrica a la izquierda.

29
Q

Medidas de dispersión

A

Estas medidas dan información de la variabilidad o el alejamiento que tienen los datos entre sí.
Si las medidas de dispersión son altas, entonces significa que existe mucha dispersión.
Las medidas de dispersión son:
- Rango
- Varianza Muestral
- Desvío estándar muestral
- Recorrido Intercuartílico
- Coeficiente de Variación

30
Q

Medidas de dispersión: Rango

A

Es la diferencia entre el mayor y menor de las observaciones. Se simboliza con la letra r

31
Q

Medidas de dispersión: Varianza Muestral

A

Es el promedio, aproximado, de los cuadrados de las diferencias entre los valores de las observaciones y su correspondiente media aritmética.
Se simboliza en un estadístico como : (s)^2.
Se simboliza en un parámetro como: (σ)^2

32
Q

Medidas de dispersión: Desvío Estándar Muestral

A

Es la raíz cuadrada positiva de la varianza.
Se simboliza con la letra s.

33
Q

Medidas de dispersión: Recorrido Intercuartílico

A

Es la diferencia entre el cuartil 3 y el cuartil 1.
Se simboliza como: riq.

34
Q

Medidas de dispersión: Coeficiente de Variación

A

Es el cociente entre el desvío estándar y la media aritmética.
Se simboliza como cv si es una muestra o CV si es una población.

35
Q

Regla empírica

A

Si un conjunto de datos tiene una distribución aproximadamente simétrica y de forma campanular (se le llama distribución normal) verifica lo siguiente en cuanto a porcentaje de datos que pertenecen, aproximadamente, a cada intervalo:

media+-k*desvío estándar

media +- 1desvío estándar = 68% de los datos
media +- 2
desvío estándar = 95% de los datos
media +- 3*desvío estándar = 99.7% de los datos

36
Q

Detección de valores anómalos o muy extremos

A

Hay ocasiones que un conjunto contiene observaciones muy alejadas del resto. Para determinar si estas observaciones son anomalas o no es observar si se aleja demasiado de la media.
Para determinar si z o Z es muy grande hay que tener en cuenta la regla empírica, que indica que el 100% de los datos se cubren, aproximadamente, con 3 desvíos de la media. Esto significa que z puede considerarse grande si es mayor a 3.

37
Q

Diagrama de caja

A

Se utiliza para representar la distribución de los datos de variables cuantitativas. El mismo se realiza a partir de los cuartiles junto con el rango.