Estadística descriptiva Flashcards
Cuáles son las escalas de tipo numérico
Escalas de intervalo y escalas de razón
Escala nominal
Los números funcionan como “etiquetas” que identifican o clasifican al objeto.
Trata con variables no numéricas (no cuantitativas)
Ejemplo:
- Leve
- Moderado
- Severo
Escala ordinal
Es la medición que permite la clasificación y orden de los datos sin establecer el grado de variación entre ellos.
Ejemplo:
- Totalmente satisfecho
- Satisfecho
3.Insatisfecho
- Totalmente satisfecho
Propiedades de la escala ordinal
Además de identificar y describir la magnitud, la escala ordinal suele mostrar el rango relativo de variables.
Las propiedades del intervalo no se conocen.
Se miden atributos no numéricos como frecuencia, satisfacción, felicidad, etc.
Además de la información proporcionada por la escala nominal, la escala ordinal identifica el rango de las variables.
Utilizando esta escala, los encuestadores pueden analizar el grado de acuerdo o desacuerdo de los encuestados con respecto a la pregunta realizada.
Características de la escala nominal
Características de la escala nominal
En una escala nominal, una variable se divide en dos o más categorías, por ejemplo, de acuerdo / en desacuerdo, si / no, etc. Es un mecanismo de medición en el que la respuesta a una pregunta en particular puede caer en cualquier categoría.
La escala nominal es de naturaleza cualitativa, lo que significa que los números se usan únicamente para categorizar o identificar objetos. Por ejemplo, en el fútbol, ¿has notado que los jugadores tienen un número en su camiseta? (cada uno tiene un número diferente). La realidad es que estos números no tienen nada que ver con la capacidad de los jugadores, sin embargo, pueden ayudar a identificar al jugador.
En una escala nominal, los números no definen las características relacionadas con el objeto, lo que significa que cada número se asigna a un objeto aleatorio o por decisión propia. El único aspecto permitido relacionado con los números en una escala nominal es que sirven para “contar”. Si volvemos al ejemplo de la clasificación de hombres y mujeres, 1 siendo hombres y 2 siendo mujeres, los números nos servirán para saber cuántos hombres (1) hay y cuántas mujeres (2) hay.
Variables continuas
Son variables continuas las que pueden adoptar un número teóricamente infinito de valores a lo largo de un continuo (ejemplo: talla, peso).
Variables discretas
on discretas cuando solo son posibles un número finito de valores (ejemplo: número de hijos de una pareja; esta variable no puede tener fracciones).
En qué escalas se miden las variables discretas y continuas
Las variables discretas pueden medirse en cualquier escala, aunque habitualmente se medirán en escalas nominales u ordinales, mientras que las variables continuas solo pueden medirse en escalas de intervalos y de razones.
Escala de intervalo
Es una escala numérica en la que conocemos tanto el orden como las diferencias exactas entre los valores.
Ej. Celsius
El cero es convencional o arbitrario.
Escalas de razón
Arroja el valor exacto entre las unidades y también tienen un cero absoluto, lo que permite aplicar una amplia gama de estadísticas tanto descriptivas como inferenciales.
Los datos de escala de razón pueden ser multiplicados y divididos, esta es una de las principales diferencias entre los datos de escala de razón y los datos de una escala de intervalo, los cuales solo pueden ser sumados y restados.
En los datos de escala de razón, la diferencia entre 1 y 2 es la misma que la diferencia entre 3 y 4, pero también aquí 4 es el doble que 2. Esta comparación es imposible en los datos de escala de intervalo.
Tablas simples
Relaciona una columna de categorías con una o más columnas de datos.
Tabla de frecuencias
Las columnas representan diversos conceptos y en una de ellas se presenta información sobre el número de veces (frecuencia) de cierto fenómeno.
Tabla de doble entrada
La información se clasifica simultáneamente por medio de dos criterios.
Tablas de contingencia
Se crean dos filas y dos columnas para representar datos categóricos en términos de conteos de frecuencia.
Permite medir la interacción entre dos variables para conocer una serie de información “oculta” de gran utilidad para comprender con mayor claridad los resultados de una investigación.
Marca de clase
Constituida por el punto medio del intervalo de clase. Se calcula sumando los dos límites del intervalo y dividiéndolos entre dos.
Frecuencia acumulada de la clase
Ees el número resultante de sumar la frecuencia de la clase 1 con la frecuencia de las clases que la anteceden.
Denotada como fi
Frecuencia relativa de la clase
Es el cociente entre la frecuencia absoluta (fi) y el número total de datos.
Muestra la proporción del número de casos que se han presentado en el intervalo I, respecto al total de los casos en la investigación.
Frecuencia acumulada relativa de la clase
Cociente entre la frecuencia acumulada de la clase I y el número total de datos.
Frecuencias absolutas y relativas
Es el número que indica cuántas veces el valor de una variable de medición (dato) se presenta en la muestra.
Esta frecuencia dividida entre el tamaño de la muestra da la frecuencia relativa correspondiente.
Histograma de frecuencias
Es un gráfico de rectángulos con su base en el eje horizontal o x).
Su anchura es igual si se busca representar comportamiento de variable discreta y anchura proporcional a la longitud de intervalo en variables continuas.
La altura está ubicada en el eje de las ordenadas ( o y) y corresponde a la frecuencia de las clases.
Ejemplo de tabla y pasos 1 y 2
Ejemplo de tabla paso 3 y 4
Ejemplo de tabla paso 5
Ejemplo de tabla paso 6
Tipos de gráficos
- Diagrama de barras
- Diagrama circular
3.Pictograma y cartograma
- Diagrama en escalera
Diagrama de barras
Permite comparar proporciones de cada una de las partes respecto del todo; usando valores absolutos, proporcionales o porcentajes.
Diagrama circular
Muestra la importancia relativa de las diferentes partes que componen un total.
Desventajas de gráfica circular o pastel
- Requiere cálculos adicionales
- Es más dificil comparar segmentos de un círculo que comparar alturas de un diagrama de barras.
- No da información de magnitudes absolutas.
Pictograma
Se toma como unidad una silueta o símbolo que sea representativo del fenómeno a estudiar
Cartograma
Utiles en estudios de carácter geográfico.
Diagrama en escalera
Se usa para representar frecuencias acumuladas
Gráficas para distribución de frecuencias agrupadas en clases
- Histograma
- Polígono de frecuencias
- Ojivas
Polígono de frecuencias
Normalmente sirve para representar una serie temporal para analizar evolución de los datos.
Ojivas
Utiliza frecuencias acumuladas. Cuando se desea conocer cuántas observaciones se acumulan hasta diferentes valores de las variables.
Ejemplo de gráfico de columnas
Ejemplo de gráfico de barras
Ejemplo de gráfico circular o de pastel
Medidas de posición
Aquellas que definen o informar del valor de datos que ocupan lugares importantes en la distribución
Def. Técnica: Las medidas de posición son indicadores estadísticos que permiten resumir los datos en uno solo, o dividir su distribución en intervalos del mismo tamaño.
Ej. Promedio
Tipos de medida de posición
Tendencia no central y central
Medidas de tendencia central
Indican datos representativos de una distribución y que se ubican en el centro.
Ej. La media aritmética, la mediana y la moda.
Media artimética
Es el promedio y se obtiene sumando los datos y dividiendo el total entre el número de datos.
Determina cómo repartir un total entre N observaciones si el reparto es a partes iguales.
Ejemplo de media artimética
Mediana
Es el valor que divide la distribución en dos partes iguales.
Qué se hace si la media es impar
Se promedia los dos datos medios.
Moda
El dato más frecuente de nuestro conjunto.
Si hay dos datos iguales, no tiene moda.
Si hay dos datos con valor más frecuente, se afirma como bimodal.
Cuártiles
Divide los datos en tres cuártiles.
Q1 divide la distribución en dos partes o 25%.
Q2 asimila la mediana y divide la distribución en dos partes iguales.
Q3 divide la distribución en dos partes y la de la izquierda agrupa el 75% de los datos más pequeños y la parte derecha el 25% de los más grandes.
Funciona cuando son muchos datos.
Medidas de dispersión
Def. Técnica: Las medidas de dispersión tratan, a través del cálculo de diferentes fórmulas, de arrojar un valor numérico que ofrezca información sobre el grado de variabilidad de una variable.
Rango
Varianza
Desviación estándar
Coeficiente de variación
Rango
Diferencia entre el dato mayor y el dato menor.
Fórmula de rango
Ejemplos de varianza y desviación estándar
Tabla de ejemplo de desviaciones de datos parte 1
Tabla de ejemplo de desviaciones de datos parte 2
Varianza
Problemas de la varianza
Fórmula de la desviación estándar de una muestra
Ejemplo de coeficiente de variación
Fórmula de coeficiente de relación
Clase
Cada de uno de los subconjuntos en los que dividimos nuestros datos.
Número de clases
Definidos con base en el número total de datos.
Ancho de clase
Límite de clase
Punto en el que termina una clase y comienza la siguiente
Problema de datos que caen en límite de su clase
Fórmula de la Mediana
Formula de la Moda o Modo