Introducción al Análisis Estadístico Flashcards
Población
Es la colección de posibles individuos (personas, animales, objetos, etc.) sobre los que se realizaunestudio.
Muestra
Es un subconjunto de la población. Para que sea representativa necesita conservar las característicaspropiasdelapoblación.
Marco
Listadetodoslosindividuos.
PoblaciónEstadística
Es el conjunto de todas las posibles observaciones de la característica a estudiar.
TambiénseleconocecomoespaciomuestralΩ
MuestraEstadística
Esunsubconjuntodelapoblaciónestadísticatomadaaleatoriamente.
VariableAleatoria
Es la característica a estudiar, la cual no se puede asegurar el valor a obtener si se
observaapesardeconocerelconjuntodeposiblesvaloresquesepuedenobtener.
Parámetros
Es la representación de cada una de las características sobre la que se realiza una inferencia.
Serepresentaconletrasgriegas.
Estadístico:
Es la función (ecuación matemática) de los datos muestrales que nos ayuda a inferenciar.
Existen diferentes tipos de estadísticos, por ejemplo, de medidas centrales, de medidas de dispersión, de distribuciones, etc. Se representa con letras latinas y minúsculas. También se le conoceconelnombredeestimador.
Experimento
Es el proceso por el cual se obtiene una observación. Cuando un experimento se lleva a cabo
nos puede llevar a obtener uno o varios resultados a los que se les conoce como evento. Se representaconletraslatinasymayúsculas.
nferenciaEstadística
Es la realización de afirmaciones válidas acerca de la población con base a la
informacióncontenidayobtenidadelamuestra.
Probabilidad
Eslaposibilidadoprobabilidaddeobtenerlosvaloresdelascaracterísticasdelapoblación.
Nominal
Cada observación está en una categoría. No existe orden, ni distancia predeterminada entre las categorías. Noesposiblerealizaroperacionesmatemáticasconlasobservacionesobtenidas.
distancia determinada entre una categoría y otra.
Ordinal
Cada observación pertenece a una sola categoría, pero existe orden predeterminado. No existe distancia determinada entre una categoría y otra. No es posible realizar operaciones matemáticas.
Intervalo
Se tiene determinado el orden y la distancia entre las categorías.
Si es posible realizar operaciones matemáticas con las observaciones.
Existe el cero y su ubicación depende de la unidad.
Proporción
Existe orden y distancia determinada entre las categorías. Es posible realizar operaciones matemáticas.
Pie
Nos da una representación simple porcentual o absoluta de las frecuencias de las observaciones.
Barras
Es una representación que muestra las frecuencias relativas o absolutas de las observaciones.
DiagramadePuntos
Es una representación puntual, es muy parecida al histograma pero no construye
clases.Esútilsilasrespuestassondiscretasyrepetidas.
DiagramadeÁrbol
Es una representación de las posibles combinaciones entre las características de las
observaciones.
DiagramadeTalloyHoja
Es una representación que nos muestra la posible distribución de los datos y al
mismo tiempo nos permite comparar dos conjuntos de datos. Si los datos son continuosesnecesariodiscretizarlavariable.
Histograma
Es una representación que ayuda a intuir una distribución de las observaciones (discretos o continuos). La distribución de las observaciones es un poco sensible a la formación de clases.
PolígonodeFrecuencias
Eslaunióndelasmarcasdeclases(puntosmediosdelasclases)deunhistograma.
Ojiva
Eslarepresentacióndelasfrecuenciasacumuladasdelconjuntodeobservaciones.
Diagrama de Caja y Brazos
Es una representación donde fácilmente se distingue el máximo, el mínimo, los
cuartiles, la media, los puntos atípicos. También nos ayuda a saber la concentración de los datos (sesgo). Nos muestra la posible distribución de las observaciones. Las observaciones son cuantitativas, ya sean discretas o continuas.
DiagramadeDispersión
Eslarepresentacióndedosvariablesenelplanocartesiano.
Media
Es un estadístico estructurado como la suma de las observaciones dividida entre el total de las observaciones. Es muy sensible a la presencia de observaciones atípicas. Es un valor único y representaatodaslasobservacionesdemaneraequitativa.
Mediana
Es el estadístico que está representado como el valor que se ubica en el centro de las observaciones ordenadas. No siempre es igual a una observación y puede ser el promedio de
dos observaciones. No es sensible a la presencia de observaciones atípicas y no representa demaneraequitativalosvaloresdelasobservaciones.
Moda
Es el estadístico que se representa por el valor de las observaciones que se presenta con mayorfrecuencia,sinembargopuedenoexistirmoda,existirunamodaovarias.
Media de clases
Es menos exacta que la media aritmética debido a que pierde información al utilizar el punto.mediodelasclasescomorepresentantedelasobservacionesqueestánendichasclases.
Medianadeclases
Eselpuntomediodeaquellaclasequecontienealafrecuenciaacumuladadel50%.
Moda de clases
Es la clase que presenta mayor frecuencia, sin embargo puede no existir moda, existir una modaovarias.
MediaGeométrica
Eslamediautilizadaparaconocerunatasapromediodecambio
Amplitud
Esladiferencianuméricaentrelosvaloresextremosdelasobservaciones.
Varianza
Incluye a todas las observaciones y mide la variabilidad al cuadrado con respecto a la media aritmética.
Desviación estándar
Es la medida de variabilidad utilizada, debido a que está en las mismas unidades que las
observaciones
Coeficiente de variación
Es una medida relativa que permite comparar la variabilidad entre dos conjuntos de
observacionesdiferentes
Varianzadeclases
Eslavariabilidadentrelasclases.
Percentiles
Son las medidas que permiten ubicar a una observación con respecto al conjunto de
observaciones ordenadas. Se les conoce como percentiles. Las más utilizadas son los cuartilesprimero25%,segundo50%ytercero75%.