Cuanti Flashcards
Como se calcula Z
x-promedio /desviación estandar
Las dos ramas de la estadística usadas aquí son
descriptiva e inferencial
El error tipo 1 es
rechazar la hipótesis nula (cuando en realidad es v)
El error tipo 2 es
aceptar la hipótesis nula (cuando en realidad es F)
Las correlaciones van de 0 a 1. V o F
Falso, van de -1 a 1, incluyendo el 0
Una correlación de 0.6 es una correlación alta V o F
Falso, una correlación 0.6 es mediana. De 0.8 o más es grande. 0.2 o 0.3 es pequeña
La prueba T se ocupa para
Comparar si el promedio de 2 grupos es diferente o no
V o F La prueba T permite trabajar con muestras grandes
F. Solo permite trabajar con muestras pequeñas de menos de 30 individuos. La prueba Z se ocupa para muestras grandes
Para qué sirve el ANOVA
para comparar 3 o más variables, se analiza la varianza y se comparaba su variabilidad entre los grupos con la variabilidad intragrupal
Qué hace la prueba chi cuadrado
Evalúa la relación entre dos o más variables categóricas (nominales u ordinales).
Evalúa qué tanto se alejan los datos observados en una muestra de una distribución teórica, es decir, si los datos observados se ajustan a lo esperado teóricamente.
Si aceptamos la hipótesis nula decimos que las frecuencias observadas se ajustan a las esperadas (esto es, no hay diferencias entre lo observado y lo esperado acorde
a la hipótesis nula).
- Usado para analizar tablas de cruce de variables.
- La Hipótesis nula es que las variables no se asocian.
Es evaluar si la variabilidad en una está asociada con la variabilidad en otra.
Qué hace el análisis de regresión simple
sirve para predecir una variable, sabiendo cómo se comporta la otra
Cuál es la diferencia entre un parámetro y un estadígrafo
Un parámetro es de la población, mientras que un estadígrafo es de la muestra. (verificar)
Cuál alfa indica una alta consistencia interna
0.8 hacia arriba
Para que sirve la estadística inferencial
Hacer predicciones
Explica los 4 niveles de medición
1 Nominal: solo variables sin orden
2 Ordinal: existe jerarquía
3 intervalar: además existen intervalos
4 razón: junto a lo anterior, se ocupa un cero absoluto
Definición de variable y constante
Característica que al ser medida en distintas circunstancias (contextos, personas) asume distintos valores. Si una característica no asume distintos valores dentro de la medición, hablamos de una constante.
Qué 2 tipos de variables existen
Discretas y continuas
Menciona 4 formas de presentar los datos
1 Tabla se síntesis de resultados
2 Tabla de frecuencias
3 Tabla de intervalos
4 Graficación
Existen 5 importantes sets de técnicas estadísticas que sirven al propósito de describir en una distribución:
(1) Medidas de Tendencia central, (2) Medidas de posición, (3) Simetría (4) “Puntudez” de la distribución, (5) Medidas de dispersión
Menciona 4 medidas de tendencia central
Moda, mediana, promedio, valores extremos
Menciona 4 medidas de posición
Percentiles, deciles, cuartiles, mediana
Qué significa una asimetría negativa y cómo la identificarías en un Boxplot y en un plano
Menos concentración de datos en números bajos. Cola izquierda. Q2 y Q3 más cercanos.
Qué significa una asimetría positiva y cómo la identificarías en un Boxplot y en un plano
o Positiva: “sesgo positivo”, menos concentración de datos positivos, menos presentes esos valores. Cola derecha. Q1 y Q2 más cercanos
Qué es la kurtosis
“Puntudez” de la distribución en comparación con una curva normal (kurtosis = 0). Distribuciones con kurtosis positiva son más puntiagudas (menos distribución de datos), y distribuciones con kurtosis negativa son más redondas (más distribución de datos).
Menciona para qué sirven las medidas de dispersión y 4 tipos
Sirven para indicar qué tan indicadas son las medidas de tendencia central para representar una muestra.
1 Rango (puntaje máx-min)
2 Rango intercuartil (q3-q1)
3 Desviación estándar (El promedio de las diferencias o desviaciones respecto del promedio
de la distribución)
4 Varianza
Qué es la estadística
Modelos para “modelar” el mundo usando distribución de datos.
o Ciencia que se ocupa de la recolección, análisis, presentación e interpretación de datos
Una herramienta o tecnología que nos permitirá usar datos para responder preguntas en psicología..
La estadística es un lenguaje que comunica información basada en datos cuantitativos. Se necesita rigurosidad para llegar a buenas conclusiones
La estadística descriptiva ocupa a la estadística inferencial para hacer predicciones V o F
Falso. Porque la estadística inferencia ocupa la estadística descriptiva para realizar procesos que permiten determinar el comportamiento de la población
Hombre y mujer son ejemplos de nivel de medición a Nominal b Ordinal c Intervalar d Razón
a nominal
NSE o Nivel educacional son ejemplos de nivel de medición a Nominal b Ordinal c Intervalar d Razón
b ordinal, solo ordena
Al medir actitudes o personalidad, el nivel de medición correspondería a: a Nominal b Ordinal c Intervalar d Razón
Intervalar
Las mediciones que permiten suma y resta son a Nominal b Ordinal c Intervalar d Razón
c y d
Medir el ingreso es un nivel de medición a Nominal b Ordinal c Intervalar d Razón
d
Las mediciones que permiten hacer proporciones o razones son a Nominal b Ordinal c Intervalar d Razón
d de razón
Nmemotecnia para niveles de medición
NOIR Nominal Ordinal Intervalar de Razón
Definición de variable
Característica que al ser medida en distintas circunstancias (contextos, personas) asume distintos valores
Ejemplo de variables discretos y continuas
Discretas: número de hijos
Continuas: promedio en preguntas de likert
Qué 4 formas existen de mostrar la información
Tabla de síntesis de resultados
Tabla de frecuencias
Tabla de intervalos
Graficación
Cómo se puede representar información continua
Histograma (gráfico con tabla de intervalos ) o bien tala de intervalos
Definición de Rango
Puntaje máximo - puntaje mínimo
Estimador vs parámetro
Un estimador es un indicador calculable a partir de una muestra, mientras que un parámetro describe una población
Ley de los grandes números
Al repetir muchas veces un experimento, en idénticas condiciones, el cociente entre el número de veces que aparece un resultado (suceso) y el número total de veces que se realiza el experimento tiende a un número fijo. La probabilidad es entonces esa frecuencia relativa.
Menciona 3 formas de distribución de probabilidad continua
1 Distribución uniforme
2 Distribución Exponencial
3 Distribución normal
Qué es la distribución Muestral
Es la distribución de todas las muestras posibles con un “n” determinado. Se aproxima a una curva normal a medida que el “n” aumenta. La distribución muestral es lo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una población. Su estudio permite calcular la probabilidad que se tiene, dada una sola muestra, de acercarse al parámetro de la población.
Teorema del límite central dice
El teorema dice: si yo sacara infinitas muestras del mismo tamaño, el promedio de esas muestras sería igual al promedio de la población
Error estándar es
La diferencia entre el parámetro y el estadígrafo, también llamado error típico
Qué es un intervalo de confianza
Un rango donde se encuentra el parámetro. Lo más probable es que el parámetro poblacional no sea un valor único, sino un segmento continuo donde en cualquier punto de ese rango se encuentre el valor verdadero del parámetro que se está estimando (no se conoce por eso se estima).
Qué es un intervalo de confianza (definición 2)
a un par o varios pares de números entre los cuales se estima que estará cierto valor desconocido respecto de un parámetro poblacional con un determinado nivel de confianza.
Cuáles son los 2 supuestos de una investigación
1 muestras aleatorias
2 Observaciones independientes (Los puntajes de una persona no influyen directamente en los puntajes de otra) se rompe, por ejemplo, cuando se hace el estudio en 2 personas que están muy relacionadas.
Qué son las hipótesis unilaterales
fijan la zona de rechazo a un lado de la distribución muestral. Acá se puede decir que el valor es igual, menor o mayor a α porque la zona de rechazo se encuentra en uno de los dos extremos de la distribución, hay direccionalidad. Ej. Si se rechaza la hipótesis nula, el valor es < α.
Qué son las hipótesis bilaterales
fijan la zona de rechazo a ambos lados de la distribución muestral (ej. 0,025 a cada lado). Acá solo se puede decir que el valor es igual o distinto de α, ya que, al estar la zona de rechazo a ambos lados de la distribución, no hay direccionalidad.
Zona de aceptación vs zona de rechazo
Zona de Aceptación (ZA): El conjunto de valores muestrales con los que aceptamos la H0. Corresponde a 1- α. *en el gráfico, lo blanco; Zona de Rechazo (ZR): El conjunto de valores muestrales con los que rechazamos la H0. Son los valores que están fuera del intervalo, cuando esto ocurre las diferencias entre grupos son significativas. Si están en el intervalo, no. Corresponde a α. (cuando es bidireccional, cada esquina es α/2). *en el gráfico, lo celeste
T student
Está diseñada para comparar si el promedio de dos grupos es diferente.
Cuando el valor T lleva a aceptar la hipótesis nula
Si el valor de “t observado” supera el umbral, se rechaza la H0; el T teórico es el umbral
grados de libertad
mientras más n, más grados de libertad, y por ende aumenta la posibilidad de encontrar el parámetro
Para qué se ocupa el ANOVA
para comparar más de dos condiciones experimentales a través de la varianza intragrupal
ANOVA VS PRUEBA T
Anova sirve para cuando queremos comparar más de dos condiciones experimentales, la prueba t se limita a 2. Además, muchas variables categóricas simplemente tienen más de dos grupos (ej. carrera, comuna)
Cuáles son los 5 supuestos de la prueba T (y de anova)
- Los datos pertenecen a una población con distribución normal.
- Las varianzas de las poblaciones son relativamente iguales (homogeneidad de varianza).
- Los puntajes son independientes.
- Presencia de datos cuantitativos (al menos Intervalar).
- Homocedasticidad de las varianza:
Qué es la Varianza
diferencia respecto de algún promedio ya sea grupal o general. ANOVA permite descomponer y analizar la razón entre variabilidad inter-grupo y variabilidad intra-grupo.
Varianza Total
Varianza explicada (variación entre los grupos) + Varianza no explicada (variación dentro de los grupos)
Qué son los grados de libertad en ANOVA
número de observaciones independientes que se requieren o necesarias para estimar un parámetro.
Qué es la prueba de Tukey o Post hoc Tukey
Es una comparación múltiple de promedios. No considera los intervalos de confianza que contienen el 0. Toma la varianza de ANOVA y a partir de ello compara las variables para detectar cuáles muestran diferencias significativas
Se requiere un Anova para hacer un Tukey V o F
V
Chi cuadrado
Evalúa la relación entre dos o más variables categóricas (nominales u ordinales).
Qué evalúa el Chi Cuadrado
Evalúa qué tanto se alejan los datos observados en una muestra de una distribución teórica, es decir, si los datos observados se ajustan a lo esperado teóricamente. Se
Cuáles son los chipuestos del Chi cuadrado
La muestra es aleatoria. Las observaciones son independientes. El N es suficiente: las frecuencias esperadas deben ser mayores a 5 (aunque hay correcciones cuando esto no se cumple).