Probabilidad Flashcards
Son utilizadas para conocer la forma que se distribuyen los datos de una muestra o una población
Medidas de tendencia central
El promedio de los valores, puede verse afectada cuando hay valores muy pequeños o muy grandes. Debe analizarse con algunos otros parámetros para conocer el comportamiento real de los datos.
Media
Es el valor que más se repite en nuestro conjunto de datos
Moda
Es el valor que se encuentra en el centro de los datos cuando estos están ordenados de menor a mayor. Cuando tenemos un número par de datos, se toman los dos centrales y se promedian
Mediana
También conocido como asimetría. Es medida de forma y nos indica cuando nuestros datos están más cargados hacia uno de los lados. Cuando hay más datos del lado derecho este es izquierdo. Cuando hay más datos del lado izquierdo, este es derecho
Sesgo
Las___son de gran utilidad para calcular las medidas de tendencia central. Para datos agrupados se tiene la condición de que dicha agrupación no permite conservar los valores originales, y los cálculos serán aproximados
Tablas de frecuencia
DATOS AGRUPADOS. es similar pero en este requerimos las marcas de clase y la cantidad de datos que caen dentro del intervalo (frecuencia)
Media
DATOS AFRUPADOS. Se divide el núm de datos entre dos y a partir de esto se definen criterios especiales para cada caso, de acuerdo con la posición donde cae el valor calculado
Mediana
DATOS AFRUPADOS. Se debe encontrar el intervalo que tenga mayor frecuencia absoluta para, con ese dato y elmjsk de una fórmula, encontrar el valor estimado de esta
Moda
También conocidas como medidas de variabilidad y sin estadísticos que permiten saber que tan dispersos están los datos
Medidas de dispersión
Principales medidas de dispersión
Rango o recorrido, desviación estándar, varianza
Es la distancia entre el valor máximo y mínimo de los datos. Aunque nos da una referencia de la dispersión, no podemos saber el comportamiento de los datos dentro de dichos límites,
Rango o recorrido
Es la medida de dispersión de mayor importancia pues, entre mayor sea su valor, significa que hay mayor dispersión
Desviación estándar
Es el cuadrado de la desviación estándar
Varianza
Nos ayudan junto con las medidas de tendencia central a comprender el comportamiento de los datos y saber si son adecuados para el fenómeno que estamos estudiando
Medidas de dispersión
Resultan de dividir la cantidad de datos entre un número específico, de tal manera que cada división contenga la misma cantidad de valores
Medidas de posición (cuantiles)
Si dividimos los datos en 100 partes, obtenemos
Percentiles
Gráfico que muestra donde se ubica cada par ordenado formado
Or la relación entre el valor del eje x con el valor del eje y
Diagrama de dispersión
Se calcula para dos variables cuantitativas cuyo valor se utiliza para el cálculo del parámetro de correlación (r)
Covarianza
Cuando al graficar los puntos de dos variables se encuentra una tendencia a alinearse en una dirección. La — positiva indica una relación directa, la negativa indica una relación inversa
Correlación
Es una técnica estadística que tiene como objetivo encontrar un modelo matemático que describa cómo se relacionan dos variables
Regresión lineal simple
Se utiliza cuando hemos probado que un par de variables cuantitativas presentan una correlación fuerte y buscamos encontrar la ecuación que lo represente
Regresión lineal simple
Es un procedimiento con el que se encuentran los coeficientes requeridos en el modelo lineal para así formar la ecuación que describa la relación entre las variables dependientes e independientes.
Método de mínimos cuadrados ordinarios (MCO)
Criterios que permite. Determinar cuando debemos aceptar o rechazar un planteamiento, denominado hipótesis, con base en los datos analizados.
Pruebas de hipótesis
Indicador de aceptación o rechazo de H0 (hipótesis nula): entre más pequeño sea, mayor es la evidencia para rechazar H0
El valor p
Valor general ente en porcentaje, representa el grado de confianza con la que se obtiene el resultado. Tiene asociado un valor crítico que divide la zona de rechazo y de aceptación de la hipótesis nula.
Nivel de confianza (1-a)
Entre más grande sea el valor de estos, la curva se asemejará más a una distribución normal
Grados de libertad.
Es una prueba no para métrica que se utiliza para contrastar valores poblacionales y muéstrales de variables nominales,es para probar su independencia
Prueba ji-cuadrada
Clasifica ,os. Adores observados y esperados de la variable a probar, correspondiente a los grupos estudiados, así como los totales de cada columna y renglón
Tabla de contingencia
Es una tabla que concentra los valores de probabilidad asociados a los grados de libertad y que indica el. Alcor crítico donde se divide la zona de aceptación y rechazo
Tabla de valores críticos