te amo chatgpt Flashcards
que reprsenta la varianza
La varianza en estadística es una medida que describe la dispersión o la diferencia entre cada punto de datos y la media de un conjunto de datos. Representa qué tan dispersos están los valores con respecto a la media.
como se interpreta la varianza?
Una varianza alta indica que los valores están más dispersos alrededor de la media, mientras que una varianza baja sugiere que los valores están más cerca de la media, es decir, menos dispersos.
que es khi^2
utiliza para evaluar si existe una relación significativa entre dos variables categóricas en un conjunto de datos. Es especialmente útil para determinar si hay una asociación entre dos variables nominales o categóricas y para evaluar la independencia entre ellas.
como se interpreta chi cuadrado
Si el valor de chi
calculado es grande y supera un umbral crítico lo que indica que hay una asociación significativa entre las dos variables. si el valor
es pequeño, se acepta la hipótesis nula, indicando que las variables son independientes.
como se interpreta la desviación típica?
describe la cantidad de dispersión o variabilidad en un conjunto de datos. Es una medida de cuánto se alejan, en promedio, los valores individuales de la media del conjunto de datos.
como se interpreta la desviación típica?
Una desviación estándar grande indica que los valores individuales del conjunto de datos están más dispersos alrededor de la media, mientras que una desviación estándar pequeña indica que los valores están más cerca de la media, es decir, menos dispersos.
pq la pregunta De vez en cuando elijo restaurantes con menús italianos, asiáticos, latinoamericanos, etc.” donde el entrevistado tenía que escoger de 1 a 5, 1 estando muy de acuerdo, 5, muy en desacuerdo y 7, no sabe y 8, no contesta. es una variable ordinal?
as respuestas se ordenan en una escala numérica, pero no tienen una diferencia constante o definida entre ellas. Las categorías reflejan un orden, pero no se puede asumir que la diferencia entre, por ejemplo, “muy de acuerdo” y “de acuerdo” sea la misma que entre “de acuerdo” y “neutral”.
como se calcula la dispersión
Rango:
Varianza: Es la media de los cuadrados de las desviaciones de cada punto de datos con respecto a la media. Se calcula sumando los cuadrados de las diferencias entre cada dato y la media, y luego dividiendo por el número total de datos.
Desviación estándar: Es la raíz cuadrada de la varianza. Proporciona una medida de dispersión en las mismas unidades que los datos originales, lo que facilita la interpretación en relación con la media.
Rango intercuartílico (RIC): Es la diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1) de los datos cuando están ordenados de menor a mayor. .
como se calcula la dispersión?
calcula la varianza
Calcula la desviación estándar: Obtén la desviación estándar para ambas distribuciones que deseas comparar.
Compara los valores: Si una distribución tiene una desviación estándar mayor que la otra, generalmente se considera que esa distribución es más dispersa. Esto significa que los valores en esa distribución tienden a estar más alejados de la media en comparación con la otra distribución.
para que tipo de varibles se puede utilizar la varianza?
cuantitativos
porque es mejor la desviación estandard o típica para medir la variabilidad?
La raíz cuadrada nos devuelve a la escala original de las unidades de la variable, lo que facilita la interpretación, al contrario que la variabilidad que se mide en unidades al cuadrado.
gráficas para variables cuantitativos
Histogramas:
Gráfico de barras:
Diagrama de caja y bigotes (Boxplot):
Gráfico de dispersión:
Gráfico de líneas:
Diagrama de frecuencia acumulativa:
gráficos para variables cualitativos
Gráfico de barras:
Gráfico de sectores o pie:
Diagrama de frecuencias: .
curva de lorenz
La curva de Lorenz es una representación gráfica en un diagrama que muestra la acumulación ordenada de la frecuencia de una variable (p) en relación con la población (q). Se utiliza principalmente para representar la distribución de la riqueza, especialmente con índices como el de Gini.
índex de gini
cáculo para asociación en variables de intervalo
correlación, covarianza t regresión
interpretación correlación
0 <|𝑟4)| ≤ 0,2: associació molt feble
- 0,2 ≤|𝑟4)| ≤ 0,4: associació feble
- 0,4 ≤|𝑟4)| ≤ 0,6: associació moderada
- 0,6 ≤|𝑟4)| ≤ 0,8: associació forta
- 0,8 ≤|𝑟4)| ≤ 1: associació molt forta
cosas a tener en cuenta cuando se calcula la correlación
. El análisis de correlación se aplica a variables cuantitativas.
. La correlación lineal se centra específicamente en relaciones lineales entre variables y no captura otras formas de relaciones, como las curvilíneas.
la correlación es sensible a los valores atípicos
La correlación proporciona información sobre la relación entre dos variables, pero no explica completamente cada variable por sí sola. Para entender mejor la naturaleza de las variables y su relación, es esencial considerar información adicional, como las medias y las desviaciones estándar de cada variable.*
asociación en variables nominales
chi cuadrado i lamba
estadística descriptiva
describir y resumir características básicas de un conjunto de datos. Su objetivo principal es organizar, resumir y presentar los datos de manera informativa y comprensible.
incluye medidas de tendencia central, medidas de dispersión y tablas de frecuencia
circulo de wallace
teoria
hipótesis
observación empirica
generalización empirica
ruptura epistemológicas
maneras de romper el conocimiento
-distributiva
-estructural
-dialectica
modelo
Un modelo es una representación (numérica o geométrica) de un proceso o un sistema para simular algún aspecto del mundo. Los modelos son:
-Herramientas para reducir la incertidumbre.
-Herramientas para conocer lo que no sabemos.
-Necesariamente simplificaciones del mundo real.
-Usuarios de datos empíricos u observaciones.
-Dependientes de la teoría.
los modelos se usan para
-Entendre patrons, intercanvis o relacions entre subjectes i objectes.-
-Fer prediccions a partir dels supòsits, sobre evolucions futures,
estadística
Podemos definir la estadística como la disciplina que se encarga de recopilar y analizar datos numéricos. Forma parte de los procesos de observación, análisis y generalización en la investigación científica.
fenómenos sociales
agentes sociales
cualidades
proceso de análisis estadístico
preguntar
generar datos
analizar
interpretar
operaciones estadísticas
esclar
medir
contar
calcular
las escalas deben ser
exhaustivas o exolentes
variables Pertorbadores
variables no incloses en el model, però expliquen els valors de la variable explicada o dependent
variables aleatorias
variables que encara no estan incloses al model, no produeixen desviaments i tenen efectes sobre les variables explicade