Métodos de análisis de datos: apuntes Flashcards
Estadistica Descriptiva
A partir de una masa de datos, la Estadı́stica Descriptiva nos permite describir la situación analizada. Para ello se utilizan métodos de reducción de la masa de datos, cálculo de promedios, dispersión o tendencias, que nos permiten sacar conclusiones de
estos datos.
Definición de poblacion
Población es el conjunto de entes (personas, animales o cosas) sobre los que se va a llevar a cabo la investigación estadı́stica
Definicion de elemento
Elemento es cada uno de los componentes de la población (pueden ser simples o com-
puestos).
Definición de tamaño de la población
Tamaño de la población es el número de elementos que la componen
Definición de caracteres
Caracteres son las cualidades o rasgos comunes a toda la población que vamos a estudiar.
Pueden ser cuantitativos (variables) o cualitativos (atributos)
Definición variable discreta y variable continua
Discreta: Diremos que una variable estadı́stica es discreta si dados dos valores distintos de
la variable, entre ellos no puede haber más que un número finito de valores de la variable, por muy alejados que estén entre sı́. Por ejemplo: número de hijos.
Continuas: Diremos que una variable estadı́stica es continua si, dados dos valores distintos de
la variable, entre ellos hay infinitos posibles valores de la variable, por muy próximos que estén entre sı́. Por ejemplo: peso, tiempo.
Definición y ejemplo de variables callitativas, nominales y ordinales.
Por otra parte, dentro de los atributos (también llamados variables cualitativas), cabe
distinguir dos categorı́as: los atributos que son simples nombres y/o categorı́as (atributos
categóricos) y los atributos ordinales que además permiten algún tipo de ordenación.
Por ejemplo, el estado civil es un atributo categórico, mientras que el grado de satis-
facción o el nivel de estudios son atributos ordinales.
Casos de aplicaciones de la Estadı́stica Descriptiva y de la Inferencia Estadı́stica.
Si la población es pequeña y podemos obtener datos de todos los elementos de la misma, lo que haremos será un análisis descriptivo (Estadı́stica Descriptiva).
Pero, si la población es muy grande (infinita o tan grande que no podemos abordarla en
su totalidad), no nos queda más remedio que tomar una ((muestra representativa)), analizar dicha muestra y luego estudiar bajo qué condiciones podemos extender los resultados obtenidos con la muestra a toda la población o si podemos inferir algún resultado para la población. En esto consiste la Inferencia Estadı́stica.
Nombrar las 4 escalas de medición
1 - Escala nominal
2 - Escala ordinal
3 - Escala de intervalo
4 - Escala de razón (proporción o cociente)
Definición y calculo del rango
Para agrupar los datos en intervalos o clases, debemos comenzar determinando el recorrido o rango de la variable, que se define como la diferencia entre el mayor y el menor valor de la variable.
Re = máx x i − mı́n x i
Intervalos, rango y amplitud
Este recorrido se divide entonces en intervalos. Lo más cómodo para el tratamiento pos-
terior de la distribución es que los intervalos sean de amplitud constante, pues entonces:
Re= número de intervalos × amplitud, lo cual permite deducir.
- el número de intervalos, si fijamos la amplitud
- la amplitud, si fijamos el número de intervalos.
Calculo de intervalo por raiz cuadrada
Cuando no existen otras indicaciones, un valor comúnmente aceptado es un número próximo a raı́z cuadrada de N (siendo N el número total de observaciones)
Definición de marca de clase
Para facilitar el manejo matemático de los intervalos, es preciso considerar un valor concreto de la variable como representante de cada intervalo. Generalmente se toma como tal el valor central del intervalo, y se le denomina marca de clase
Definción de standarizacion por tasa
Otro tipo de razones, que se usan más que las anteriores, son las tasas. Todos hemos oı́do hablar de tasas de nacimiento, de mortalidad, de divorcios, etc…
Ası́ como en las razones se comparan el número de casos de un subgrupo o categorı́a con
los de otro subgrupo, las tasas indican comparaciones entre el número de casos reales y el número de casos potenciales.
Las tasas suelen darse en términos de 1000 casos potenciales (es decir, se multiplica
por mil el resultado del cociente)
Definición de Tasa de cambio o variación
Otro tipo de tasa muy utilizado es la tasa de cambio o tasa de variación (por- centual) que suele utilizarse para comparar un valor de una población en dos instantes diferentes de tiempo
Uso y caracteristicas de los Graficos de barra
Este tipo de gráfico, se utiliza para representar valores o frecuencias. Podemos representas.
a) para cada caso, el valor observado de la variable.
b) para cada valor de la variable, su frecuencia.
Uso y caracteristicas de los Graficos de sectores
Es un gráfico en el que el área de cada sector representa la frecuencia relativa de cada
valor de la variable, respecto al total.
Es útil para visualizar las diferencias de las frecuencias, entre las distintas categorı́as.
Uso y caracteristicas de los Histogramas
Cuando tenemos distribuciones agrupadas, sobre el eje horizontal se dibujan los inter- valos y sobre cada uno de ellos se levanta un rectángulo cuya área sea proporcional a la frecuencia absoluta dentro del intervalo.
Uso y caracteristicas de los Histogramas de datos categóricos
En algunas ocasiones el histograma también se utiliza para representar la frecuencia (absoluta, relativa o acumulada) de cada uno de los valores observados de la variable, como si fuese un gráfico de barras.
Definición de Caracteristicas
En el caso de las variables cuantitativas, es posible reducir aún más estas distribucio-
nes, valiéndonos de unos pocos números que describan o caractericen a las distribuciones
de frecuencias. Estos números, que reciben el nombre de caracterı́sticas, nos indican los
rasgos más importantes de las distribuciones de frecuencias
Clasificaciones de las Caracteristicas (Medidas)
1 - Medidas de posición: a) Centrales: media aritmética, mediana y moda. b) No centrales: cuantiles. 2 - Medidas de dispersión 3 - Medidas de asimetrı́a. 4 - Medidas de apuntamiento.