Cuanti Flashcards

1
Q

¿Para qué se usa la T-student?

A

Está diseñada para comparar si el promedio de dos grupos es diferente. La ocupamos cuando necesitamos realizar la estimación de un parámetro o un contraste de hipótesis cuando se desconoce la desviación estándar de la población (desconocemos la varianza

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

¿Qué entrega la T-student?

A

Entrega un valor observado (de la muestra), que se compara con el teórico (la tabla, que indica el comportamiento de la población) para ver las diferencias [Obtenemos dos muestras y evaluamos qué tan diferentes son los promedios.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿Cómo es la distribución T-student?

A

Es una distribución teórica continua y simétrica, con una media igual a cero (0). Su varianza en cambio es mayor que 1. El área total bajo la curva o distribución es igual a 1. Al igual que la distribución normal estandarizada, tiene una forma de campana.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

¿Qué son los grados de libertad para t-student?

A

El único parámetro de la distribución t-Student es el número de grados de libertad. (Hay una distribución t diferente para cada valor de grados de libertad. La distribución t se aproxima a la distribución normal a medida que aumentan los grados de libertad. Más “n”, más grados de libertad, mayor inferencia y, por ende, aumenta la posibilidad de encontrar el parámetro, puedo decir con “libertad” que es una aproximación acertada).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

¿Para qué muestras se puede usar la t-student?

A
  1. Para una muestra: Evaluar si el promedio es distinto a un valor específico.
  2. Para muestras dependientes: Dos mediciones en la misma muestra. Evaluar si el promedio de una variable es diferente del promedio de otra variable. Calculamos la diferencia en el puntaje para cada caso, el promedio de las diferencias y la desviación estándar de las diferencias. Ocupamos la fórmula y vemos la probabilidad de obtener ese valor t (o uno mayor).

Para muestras independientes: La misma medición en dos muestras distintas. La varianza de la diferencia entre dos variables independientes es igual a la suma de sus varianzas Por lo tanto, podemos simplemente sumar el error estándar de cada muestra. Esta fórmula sólo es correcta cuando los N son iguales para ambos grupos. En caso contrario, simplemente hacemos

una suma ponderada por n, o más exactamente, en base a los grados de libertad (n - 1).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿Qué es el coeficiente de correlación (r)?

A

Es un estimador de la correlación que existe en la población r (rho). Al igual que con la media, podemos encontrar la probabilidad de obtener una correlación determinada si la hipótesis nula fuera correcta (hipótesis nula > no hay relación > r = 0). Si en la población existe una relación determinada entre dos variables, la mayoría de las muestras van a mostrar dicha relación. Es decir, la distribución muestral de r tiende a ser una distribución normal (entre -1 y 1) a medida que el “n” de la muestra aumenta. Por lo tanto, podemos usar la distribución t.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

¿Que es la prueba ANOVA?

A
  • Evalúa la relación entre una variable categórica y una variable numérica, por ejemplo, “comparar el promedio de varias poblaciones”.
  • Se analiza la varianza, en vez de los promedios. → se compara la variabilidad entre los grupos con la variabilidad intragrupal.
  • Solo entrega información respecto a si hay diferencias entre los grupos, en general.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

¿Qué se diferencia la prueba t de ANOVA?

A

Prueba t vs. ANOVA → Anova sirve para cuando queremos comparar más de dos condiciones experimentales, la prueba t se limita a 2. Además, muchas variables categóricas simplemente tienen más de dos grupos (ej. carrera, comuna)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

¿Qué indica la homecedasticidad?

A

indica que las varianzas de los grupos comparados (los niveles del factor) son estadísticamente equivalentes. Para comprobarla se hace una prueba Levene que es básicamente un ANOVA de los residuales intra-grupo. Si se cumple el supuesto NO debería haber diferencias entre los grupos, en otras palabras, si el supuesto se cumple, esta prueba debe ACEPTAR la H0. En caso de haber heterocedasticidad (no cumplir con la homocedasticidad), se puede analizar los datos usando la razón de Welch, que ajusta los cálculos del ANOVA en relación a las diferencias de varianza y tamaño muestral detectadas, afectando el valor final de F y los grados de libertad del cálculo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

¿Qué puede hacer ANOVA en cuanto a la varianza?

A

ANOVA permite descomponer y analizar la razón entre variabilidad inter-grupo y variabilidad intra-grupo.

  1. Variabilidad intra-grupo: Distancia de los puntajes de cada sujeto respecto del promedio de su grupo.
  2. Variabilidad inter-grupo: Distancia de los promedios de cada grupo respecto del gran promedio total.
  3. Variabilidad Total: Corresponde a la distancia que existe entre su puntaje y el gran promedio total. La variabilidad total se descompone en: La distancia entre el promedio del grupo del sujeto y el promedio total. La distancia entre el puntaje del sujeto y su respectivo promedio grupal. *k=grupos; i=casos (personas). *La diferencia intra-grupal=error (esto porque debería ser homogénea).
  • Varianza explicada (variación entre los grupos) + Varianza no explicada (variación dentro de los grupos) = Varianza total.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

¿Qué es la distribución F?

A

Se desprende desde ANOVA)

  • Al comparar la media de cuadrados (MC) que puede ser atribuida al modelo con la media residual de cuadrados, se obtiene una proporción que sigue una distribución F.
  • Prueba F es la distribución, que permite contrastar la variabilidad atribuible a los individuos vs la variabilidad atribuible a condiciones experimentales.

F es cercano a 0 → variabilidad entre grupos pequeña y una variabilidad intragrupo grande. Si F es muy grande es al revés.

  • F < 1 → el error es más grande que lo explicado, la varianza del error > que la varianza intergrupal
  • F = 1 → error y lo explicado miden lo mismo
  • F > 1→ lo explicado es más grande que el error.

(Debemos evaluar la probabilidad que ese valor f ocurra cuando se cumple la H nula del ANOVA)

  • Aumenta F → las diferencias son significativas (se debe comprobar con el P value) es muy probable que haya diferencias en los grupos. Va a significar que hay menos error, la varianza explicada es grande.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

¿Qué son los grados de libertad?

A

Número de observaciones independientes que se requieren o necesarias para estimar un parámetro. (Gl = [número de observaciones independientes] – [número de parámetros estimados])

  • Mientras más grande sea el valor de F, menor será el área bajo la curva → La probabilidad de encontrar la razón de variabilidades cuando vienen de la misma población es extremadamente pequeña.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

¿Qué es el tamaño del efecto?

A

Podemos dividir la suma de cuadrados entre grupos por la suma de cuadrados total, y obtenemos el porcentaje de varianza explicada por la pertenencia a los grupos (r2).

r = 0.1 > Relación pequeña > r2 = 0.01 > 1% r = 0.3 > Relación mediana > r2 = 0.09 > 9% r = 0.5 > Relación fuerte > r2 = 0.25 > 25%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

¿Qué es el prueba de Tukey?

A

es una comparación múltiple de promedios. No considera los intervalos de confianza que contienen el 0.

  • Tukey compara los pares de niveles de la variable independiente para detectar cuales de ellos muestran diferencias estadísticamente significativas. Toma la varianza de la ANOVA y a partir de ello hace las comparaciones. En cada comparación la hipótesis nula es que los niveles que están siendo comparados no son estadísticamente distintos. Hace todas las posibles comparaciones posibles. *Recordar: Si contiene cero en el intervalo, no es significativo, si no si lo es.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

¿Que es el Chi cuadrado (x2)?

A
  • Evalúa la relación entre dos o más variables categóricas (nominales u ordinales).
  • Evalúa qué tanto se alejan los datos observados en una muestra de una distribución teórica, es decir, si los datos observados se ajustan a lo esperado teóricamente. Se puede evaluar las hipótesis acerca de proporciones poblacionales considerando las distancias (o diferencia o ajuste) entre las frecuencias observadas y las frecuencias esperadas o supuestas para cada categoría (acorde a la hipótesis nula). Entre más grande, más probabilidad de asociación de variables.
  • Las frecuencias esperadas al azar se pueden calcular multiplicando la frecuencia total de la columna y de la fila, dividiendo por el N total. Básicamente consiste en evaluar cuánto se alejan las frecuencias observadas de las esperadas. Si aceptamos la hipótesis nula decimos que las frecuencias observadas se ajustan a las esperadas (esto es, no hay diferencias entre lo observado y lo esperado acorde a la hipótesis nula).
  • La fórmula para el estadístico x2 es básicamente sumar las diferencias (al cuadrado) y dividir por la frecuencia esperada.
  • Las diferencias corresponden a la distribución aleatoria x2 que se basa

en la distribución normal. Para evaluar la significación estadística de x2 observado debemos comparar dicho valor con el que se obtiene de la distribución (tabla) de x2, que indica la probabilidad de ocurrencia de dicho valor con ciertos grados de libertad.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

¿Cuales son los supuestos de chi cuadrado?

A

La muestra es aleatoria. Las observaciones son independientes. El N es suficiente: las frecuencias esperadas deben ser mayores a 5 (aunque hay correcciones cuando esto no se cumple).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

¿Cual es una limitación importante de chicuadrado?

A

Una limitación importante es que no indica dónde están las diferencias. A diferencia del coeficiente de r de Pearson, x2 no indica la magnitud de la relación, solo indica si están o no asociadas las variables (por ser variables nominales u ordinales).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

¿Qué es el cruce de variables?

A

El cruce de variables o tabla de contingencia permite determinar el comportamiento simultáneo de dos variables. Para ello se hace una tabla donde una variable está en las filas y la otra en las columnas. La combinación de ambas variables se produce en las celdas de la tabla. La H0 postula que las celdas son iguales.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

¿Qué es la asociación de variables?

A

Es evaluar si la variabilidad en una está asociada con la variabilidad en otra. Podemos ver cómo se “combinan” los puntajes de cada una de mis variables independientes con la variable dependiente, por medio de dispersogramas. En un dispersiograma cada punto refleja la combinación de ambos puntajes para cada sujeto.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

¿Qué es la covarianza?

A

Mide la variación conjunta de dos variables, pero es afectada por los cambios de unidades de medida. La co-variación significa que un cambio en x (Vi), co-varía con un cambio en y (Vd).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

¿Qué es la correlación?

A

Estandariza la covarianza. Se estandariza para que no haya problema de interpretación. [r = Coeficiente de Pearson]. Una correlación entre dos variables tiene n – 2 grados de libertad. Sólo sirve para distribuciones lineales.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

¿Qué es el tamaño de la relación?

A

Dado que es una medida estandarizada, el signo indica la dirección de la relación (positiva/directa o negativa/inversa). El valor indica el monto o magnitud de la relación (desde ausencia de relación, débil o fuerte). Para ver la significancia, t es el estimador/ el error estándar del estimador.

Los valores posibles para una correlación van entre -1 (correlación perfecta negativa) y +1 (correlación perfecta positiva). Si la relación es más fuerte, x es mejor predictor de y.

  • Ausencia de relación lineal = 0
  • Relación pequeña ≥ 0.1
  • Relación mediana ≥ 0.3
  • Relación fuerte ≥ 0.5
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

¿Qué es la varianza explicada?

A

Si las variables están relacionadas, quiere decir que tienen varianza en común. Cuántos cambios en “x” (Vi) influye en “y” (Vd). A mayor r, más varianza explicada (en común) hay.

  • r = 0.1 > Relación pequeña > r2 = 0.01 > 1%
  • r = 0.3 > Relación mediana > r2 = 0.09 > 9%
  • r = 0.5 > Relación fuerte > r2 = 0.25 à 25%
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

¿Para qué sirve el análisis de regresión lineal simple?

A

Sirve para predecir una variable, sabiendo cómo se comporta la otra. Esto lo hace a partir de la recta de regresión, en torno a la cual, se ajustan los datos con las distancias cuadráticas mínimas. Esta recta (línea) de regresión representa la mejor solución estimada para predecir los datos (variable dependiente) a partir de la variable independiente.*El hacer predicción no significa hacer una relación causal entre dos variables.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

¿Que es la Línea/recta de mejor ajuste?

A

se define como aquella que hace mínima la suma de los cuadrados de las desviaciones de las observaciones reales con respecto a ella misma. Puede ser considerada la recta promedio considerando todos los pares de observaciones

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

¿Qué nos puede decir el análisis de correlación, en cuanto a si una variable es dependiente o no?

A

El análisis de correlación, si bien dice si las variables son o no independientes, no dice nada más acerca de eso o en qué sentido son o no independientes/dependientes.

  • El chi cuadrado detecta una tendencia de si hay o no una dependencia.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

¿Cual es la ecuación de regresión simple?

A

y = α + βx + error (error de estimación de predicción).

Y → variable de respuesta (variable que se quiere predecir). Variable dependiente. X → Variable explicativa (variable predictora). Variable independiente

β → Pendiente de la recta.

α → Constante (punto en que la recta corta al eje y).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

¿Como puede estar el valor de B en la ecuación de la recta?

A
  1. Estandarizado: Se interpreta igual que una correlación (representa cuántas desviaciones estándar cambia y cuando x aumenta una desviación estándar). En una regresión simple (con un predictor) b estandarizado es igual a la correlación entre las variables (más correlación, mayor precisión en la predicción). B estandarizado = valor estimado / error típico.
  2. No estandarizado: Se interpreta en las unidades originales de las variables: Puede tener cualquier valor, y representa cuántos puntos cambia y cuando x aumenta en un punto (en variables dicotómicas, como el género, tiene más sentido usar el b no estandarizado).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

¿Qué es el coeficiente de determinación R2 ?

A

En la regresión simple es igual al cuadrado del coeficiente de correlación de Pearson y expresa la proporción de la varianza de la variable dependiente que se encuentra explicada por la variable independiente. R2 = 1- (Suma cuadrado de los residuos / Suma cuadrado total).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

¿Qué es el R2 Corregido?

A

Corrección realizada a R2 teniendo en cuenta el número de casos (un bajo número de casos en la muestra podría generar un R2 «inflado» no representativo de la muestra población) y de variables independientes (para el caso de la regresión simple siempre es una sola). Este es el coeficiente que concretamente se considera dado que ya viene con la corrección del tamaño muestral.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

¿Qué es el error típico de estimación?

A

Representa la variabilidad del ajuste no explicada por la recta de regresión, entre menor es su valor mejor es el ajuste realizado por ésta.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

¿Cuales son los coeficientes de regresión no estandarizados?

A
  • Constante: Constituye el valor inicial de la recta de regresión ó B0 a partir desde puntuaciones directas. Es el intercepto de la recta.
  • Coeficiente correspondiente a B1 «nombre de la variable independiente»: Corresponde a la pendiente de la línea de regresión o B1 , lo que en concreto indica cuánto cambia en promedio la VD por cada unidad que cambia la VI
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

¿Cuales son los coeficientes de regresión estandarizados?

A
  • Beta o coeficientes de regresión lineal estandarizados: Definen la ecuación de regresión una vez que los puntajes directos u observados de ambas variables son transformados en puntuaciones típicas o estandarizadas. Corresponde a cuántas desviaciones estándar cambia la VD cuando la VI cambia en 1 desviación etándar. β1= B1 (Sx/ Sy). Igualdad solo válida para la regresión simple= Coeficiente β1= R (Coeficiente de correlación de Pearson entre las variables). También mantiene el signo que informa acerca de la dirección de la relación.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

¿Qué es la regresión múltiple?

A

Las bases son las mismas que para la regresión simple, pero existen k (n° variables) variables independientes para predecir la variable dependiente. Se puede observar que existen varias variables independientes que afectan la variable dependiente. [cómo afecta el deporte (vi) e ingesta calórica (vi) en el peso corporal (vd)]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

¿Qué es la multicolinealidad?

A

● Cuando dos variables son independientes entre sí, r=0.

● Este supuesto hace referencia en que no existe una relación lineal entre ninguna de las variables independientes consideradas para llevar a cabo la regresión múltiple. Entonces puede existir multicolinealidad parcial o perfecta cuando existen altas correlaciones entre una o más variables independientes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

¿Qué es la validez?

A

El grado en que evidencia y teoría respaldan las interpretaciones de puntajes de pruebas para sus usos propuestos. Apunta al grado de evidencia que tenemos para respaldar las inferencias que queremos hacer en base a un instrumento de medición. En los estándares, uno no válida una prueba, sino que valida la interpretación de los resultados. La validez no es una propiedad del instrumento, sino de las inferencias que se hacen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

¿Qué es la ecuanimidad?

A
  • Una prueba que es ecuánime refleja el mismo constructo para todos quienes respondan la prueba y sus puntajes tienen el mismo significado para toda la población de interés. Una prueba ecuánime no da ventajas o desventajas a algunos individuos debido a características irrelevantes al constructo de interés
  • Ecuanimidad como ausencia de sesgo: el sesgo ocurre cuando una prueba favorece o perjudica a grupos examinados. Existe sesgo cuando para un mismo nivel del atributo que se está midiendo, dos grupos o personas obtienen puntuaciones distintas. Controla los sesgos intencionados.
  • Una evaluación o prueba ecuánime mide para todos los grupos de evaluados un atributo de interés, permitiendo interpretar los resultados con igual validez para todos ellos.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

¿Qué es la precisión/confiabilidad?

A
  • Apunta al nivel de incertidumbre que está asociado con las mediciones que son generadas por un instrumento de medición
  • Toda medición tiene un cierto nivel de error asociado. Una medición está incompleta sin su nivel de error asociado. El error de medición reduce la confianza que se puede tener en los resultados de una medición y, por ende, en la confiabilidad/precisión de los puntajes.
  • Asociado a la consistencia de los puntajes en mediciones repetidas y refiere a una forma particular de cuantificar esta consistencia de los puntajes, es decir, al coeficiente de confiabilidad en la teoría de puntaje verdadero.
  • Se puede expresar en términos de la razón entre la variabilidad de nuestras mediciones y la variabilidad total (variabilidad observada entre las mediciones + variabilidad asociada al error).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

¿Qué es la variabilidad de una medición?

A
  • Idealmente queremos que la variabilidad en las mediciones sea mucho más grande que la variabilidad

asociada al error de medición. En otras palabras, queremos que la variabilidad atribuible a nuestras mediciones de cuenta de la mayor parte de la variabilidad total.

  • Variabilidad total = variabilidad observada entre las mediciones + variabilidad asociada al error.
  • Si la variabilidad entre mediciones es mayor que la de error: la división de estos componentes se acerca a 1.
  • Si la variabilidad entre mediciones es menor que la de error: la división de estos componentes se acerca a 0.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

¿Qué es la alfa de cronbach?

A
  • Es un indicador de confiabilidad que se basa en la proporción de variabilidad que se puede atribuir a las mediciones (en oposición a la variabilidad de error). En base a este indicador es posible calcular el error de medición promedio de un instrumento.Es un indicador indirecto de la precisión de un instrumento. No dice nada sobre la validez, sólo de confiabilidad/precisión. Este indicador varía entre 0 y 1. En psicología se suele usar un margen de bajo 0.75. Es muy importante ver que los ítems midan lo mismo, es decir, revisar si hay algo invertido.

▪ 0 = toda la variabilidad está asociada al error.

▪ 1 = no hay nada de variabilidad asociada al error.

  • El cálculo de la proporción de variabilidad entre mediciones, o en términos más técnicos la variabilidad asociada al modelo: 1 - proporción asociada al error.
  • Una “corrección” asociada al número total de preguntas. Noten que si N es muy grande esta parte de la fórmula es prácticamente 1.
  • Aumenta cuando la inter-correlación entre los ítems aumenta. Por lo tanto aumenta cuando todos los ítems miden el mismo constructo.

▪ ≥ .90: Excelente

▪ 0.7 a 0.9: Bueno

▪ 0.6 a 0.7: Aceptable

▪ 0.5 a 0.6: Pobre

▪ < 0.5 Muy Pobre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

¿Qué es la correlación interclase?

A

Medida de consistencia para datos continuos. Se aplica para ver el grado de asociación entre distintas observaciones de un mismo fenómeno. Esto es, tratamos de evaluar un mismo objeto o sujeto, desde distintas perspectivas, de modo que necesitamos evaluar la consistencia entre estas observaciones.

La consistencia surge entonces como alternativa a la concordancia que puedan tener los datos respecto a algún “estándar de oro”, y ambas estrategias se usan para determinar concordancia entre dos mediciones.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

¿Cuales son los modelos de Correlación interclase?

A
  1. Modelo de efectos aleatorios de una vía: Cada caso es evaluado por un conjunto de evaluadores que fueron seleccionados al azar de una población más grande de posibles evaluadores.
  2. Modelo de efectos aleatorios de dos vías: Cada caso es evaluado por el mismo conjunto de evaluadores seleccionados al azar.
  3. Modelo de efectos mixtos de dos vías: Cada caso es evaluado por un conjunto de evaluadores considerados expertos o elegidos intencionalmente.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
43
Q

¿Cuales son los criterios de correlación interclase?

A
  1. Número de evaluaciones, o “tipo”:
  • Simple: se considera solo la medida de un evaluador.
  • Promedio de medidas: se promedian las medidas de k evaluadores para cada sujeto.
  1. Selección de “Definición”: ¿Consistencia o Acuerdo Absoluto?
  • Acuerdo absoluto: Determina si distintos evaluadores dan al mismo caso la misma evaluación, implica modelar errores sistemáticos y errores residuales aleatorios (en R: absolute agreement)
  • Consistencia: Evalúa si se puede igualar la medida de un evaluador a la evaluación de otro evaluador más un error sistemático. Intenta cancelar el error sistemático y solo dejar el residual (en R: consistency).

▪ ICC < .5.: Confiabilidad pobre

▪ .5 ≤ ICC < .75: Confiabilidad Moderada

▪ .75 ≤ ICC ≤ .9: Buena Confiabilidad

▪ .9 ≤ ICC : Confiabilidad excelente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
44
Q

¿Qué es la estadística?

A

Modelos para “modelar” el mundo usando distribución de datos. Ciencia que se ocupa de la recolección, análisis, presentación e interpretación de datos. Una herramienta o tecnología que nos permitirá usar datos para responder preguntas en psicología. La estadística es un lenguaje que comunica información basada en datos cuantitativos. Se necesita rigurosidad para llegar a buenas conclusiones.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
45
Q

¿Qué significa “medición” en cuanti?

A

Proceso mediante el cual los científicos representan propiedades por medio de números.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
46
Q

¿Cuál es la diferencia entre estadística descriptiva e inferencial?

A

La estadística descriptiva sirve para sintetizar o resumir, describir y caracterizar los datos obtenidos a partir de un conjunto de observaciones. Y permite ver cómo se distribuye la respuesta a una pregunta/variable. En cambio, la estadística inferencial utiliza la información de la estadística descriptiva para realizar procesos que permiten determinar el comportamiento de la población que es representada por la muestra. Permite hacer predicciones sobre el comportamiento de las variables en la población.

47
Q

¿Qué es la inferencia en cuanti?

A

La inferencia es un proceso de generalización de lo que se obtuvo en la muestra. Pero para hacer esto necesitamos que la muestra siga parámetros que la vuelvan apropiada para ser representativa. Si no sigue estos parámetros podemos llegar a altos niveles de error. La mayor parte del tiempo no conocemos los parámetros de la población, por ende, se hace predicción.

48
Q

¿Qué son los niveles de medición y cuáles son los niveles de medición?

A

Indica la propiedad numérica que una variable puede tener (y por lo tanto los códigos usados para sus valores). Los niveles de medición son: nominal, ordinal intervalar y de razón (ej: ingreso monetario).

49
Q

¿Qué es una variable?

A

Característica que al ser medida en distintas circunstancias (contextos, personas) asume distintos valores. Si una característica no asume distintos valores dentro de la medición, hablamos de una constante

50
Q

¿Qué es una variable discreta?

A

No incluye todos los valores dentro de un rango, tiene un conjunto limitado de valores posibles (ejemplos: pregunta likert de 1 a 5, o la cantidad de hermanos que tiene un participante).

51
Q

¿Qué es una variable continua?

A

Incluye todos los valores posibles dentro de un rango. Esto no es común en ciencias sociales, pero en la práctica cuando tenemos una gran cantidad de valores posibles es mejor tratarlos como continuos (ejemplos: promedio de varias preguntas likert de 1 a 5, o tiempos de reacción)

52
Q

¿Qué significa la distribución de una variable?

A

Frecuencia relativa (comparativa) de los valores de una variable. Permite asignar probabilidades de ocurrencia de distintos valores.

53
Q

¿Para qué tipo de variable es la distribución normal? ¿Y la binomial?

A

La normal se usa con variables continuas y con las discretas la binomial (uno de dos resultados)

54
Q

¿Qué es una proporción?

A

Es una relación entre dos magnitudes. Va entre 0 a 1. Es la razón que existe en la frecuencia de aparición de una variable y el total de casos.

55
Q

¿Cuáles son algunas de las técnicas estadísticas para medir una distribución de variables?

A

Medida de tendencia central tales como la moda, mediana y promedio, medidas de posición tales como percentil, cuartil, mediana, medidas de asimetría (skewness), kurtosis (puntudez) y medidas de dispersión o variabilidad.

56
Q

¿Qué es skewness?

A

Es el grado en que la distribución de una variable se aparta de la simetría. En una distribución normal el valor de skewness es 0. Puede tener valores positivos o negativos y mientras más se aleja del cero, más probable que la distribución sea asimétrica.

57
Q

¿Cuáles son las medidas de tendencia central y en qué consisten?

A

Moda (valor que se repite más. Cuando la variable es continua –con muchos niveles– podemos calcular un intervalo modal. El rango donde se concentran la mayoría de los puntajes. Una variable puede ser bimodal), mediana (es el valor que divide a la distribución por la mitad) y promedio (representa al puntaje que equilibra las distancias o diferencias con los puntajes observados).

58
Q

¿Cuáles son las medidas de posición y en qué consisten?

A

Percentiles: Cuando dividimos una distribución en 100 partes. (100%). Deciles: Cuando dividimos una distribución en 10 partes. (10%). Cuartiles: Cuando dividimos una distribución en 4 partes. (25%). Mediana: Cuando dividimos una distribución en 2 partes. (20%).

59
Q

¿Cómo se divide una distribución al calcular los cuartiles de esta? ¿Qué indica cada cuartil?

A

Q1: es el punto que divide la distribución entre el 25% inferior y 75% superior. Q2: es la mediana, divide en el 50% inferior y 50% superior. Q3: divide entre el 75% inferior y 25% superior. No existe Q4.

60
Q

¿Cómo se ve en un gráfico la asimetría negativa y positiva?

A

La simetría es 0 cuando la distribución es simétrica; mayor a 0 cuando es positiva y menor a 0 cuando es negativa. Importa la dirección. Negativa: Menos concentración de datos en números bajos. Cola hacia la izquierda. Q2 y Q3 más cercanos. Positiva: “sesgo positivo”, menos concentración de datos positivos-altos, menos presentes esos valores. Cola hacia la derecha. Q1 y Q2 más cercanos.

61
Q

¿Qué pueden indicar la mediana y el promedio sobre la simetría de la distribución?

A

Si la mediana y el promedio tienen un valor similar la distribución no es tan asimétrica.

62
Q

¿Cómo se ve la kurtosis en un gráfico?

A

Es la “puntudez” de la distribución en comparación con una curva normal (kurtosis = 0); representa el nivel de elevación de una distribución. Distribuciones con kurtosis positiva son más puntiagudas (menos distribución de datos), y distribuciones con kurtosis negativa son más redondas (más distribución de datos).

63
Q

¿Cuáles son las medidas de dispersión o variabilidad?

A

Rango: puntaje máximo – puntaje mínimo, Rango intercuartil: Q3 – Q1, Desviación Estándar y Varianza.

64
Q

¿Qué es una desviación estándar? ¿Y qué implica para una variable?

A

Es el promedio de las diferencias o desviaciones respecto del promedio de la distribución. Considera todos los valores de la distribución. Se utiliza el promedio como punto de referencia para determinar cuánto se desvían los valores de este punto. Si el valor de la desviación es más grande, significa que hay más dispersión, más distancia entre los datos, más heterogénea.

65
Q

¿Qué es una varianza?

A

Son las variaciones al cuadrado respecto al promedio de la distribución (Se usa para solucionar el resultado 0 que da de promediar cada puntaje respecto del promedio. Por lo que para poder interpretar los datos debemos regresarlos a la escala original, esto es, desviación estándar).

66
Q

¿Cómo se relacionan la varianza y la desviación estándar?

A

La desviación estándar es la raíz cuadrada de la varianza.

67
Q

¿Qué es un estimador?

A

Un estimador [al igual que el promedio o desviación estándar (X, ds)] es un valor calculable a partir de los datos de una muestra. Nos da información acerca de los valores probables del parámetro y podemos analizar la calidad de esa información.

68
Q

¿Cuáles son los dos tipos de estimaciones y en qué consisten?

A

Puntuales: por ejemplo, promedio muestral como estimador de promedio poblacional (parámetro). Intervalares: rango de valores entre los que podría encontrarse el parámetro.

69
Q

¿Cuáles deberían ser las características de un estimador?

A

el estimador debería ser: insesgado, consistente y eficiente.

70
Q

¿Qué es un parámetro?

A

Un parámetro es un indicador numérico que describe el comportamiento de una variable en la población. Usualmente son desconocidos, podemos estimarlo a partir de los datos obtenidos de una muestra representativa de esta población.

71
Q

¿Cómo se calcula el rango intercuartil (RIC)?

A

Sacando la diferencia entre el cuartil 3 y el cuartil 1.

72
Q

¿Cómo se calculan los límites superiores e inferiores de un boxplot?

A

Superior: cuartil 3 + (1,5RIC). Inferior: cuartil 1 + (1,5RIC).

73
Q

¿Qué dice la Ley de los grandes números?

A

Al repetir muchas veces un experimento, en idénticas condiciones, el cociente entre el número de veces que aparece un resultado (suceso) y el número total de veces que se realiza el experimento tiende a un número fijo. La probabilidad es entonces esa frecuencia relativa. Por ejemplo, si yo aumento el número de ensayos (lanzo la moneda 10 veces), aun cuando la probabilidad teórica dice que debe salir sello 0.5 de las veces, la probabilidad de tener el resultado se va acercando más a la teórica solo cuando aumenta la cantidad de ensayos. Esto, dado que por azar puede que en una acotada cantidad de ensayos aparezca más cara que sello.

74
Q

¿Qué son los resultados elementales?

A

Todos los posibles resultados de un experimento.

75
Q

¿Qué es el espacio muestral?

A

Conjunto de todos los resultados elementales.

76
Q

¿Qué es la distribución de probabilidad?

A

Conjunto de probabilidades asignadas al conjunto de valores de la variable aleatoria (X). Son aplicables a situaciones en que “desconocemos” su verdadera distribución, pero podemos suponer que se asemejan a una determinada distribución teórica para tomar decisiones en relación a la probabilidad observada de un evento cualquiera. La suma de todas las probabilidades es 1.

77
Q

¿Cuáles son los tipos de distribución de probabilidad continua?

A

Distribución uniforme, exponencial y normal.

78
Q

¿En qué consiste la distribución uniforme?

A

Tiene una configuración rectangular y se describe por sus valores mínimo y máximo. La media y mediana son iguales y no tienen moda. Todas las frecuencias y probabilidades son las mismas.

79
Q

¿En qué consiste la distribución exponencial?

A

Describe el tiempo entre eventos que ocurren en secuencia. Estos suceden independientemente a un ritmo constante por unidad o duración de tiempo. Tiene un sesgo positivo con un parámetro de ritmo. La media y la desviación estándar son iguales y son reciprocas.

80
Q

¿En qué consiste una distribución normal?

A

Es la distribución más útil y utilizada de las distribuciones de probabilidades. Es frecuente que un gran número de variables aleatorias continuas se distribuyan normalmente. Lo más común es utilizar la distribución normal estandarizada que como su nombre lo indica permite estandarizar todas las demás distribuciones normales haciéndolas comparables entre sí. Es simétrica respecto de su media, y las colas de la curva normal se extienden indefinidamente en cualquier dirección. Tiene un promedio 0 y desviación estándar 1.

81
Q

¿Qué porcentajes tiene la campana de Gauss en los intervalos: mi (μ)-2 desviaciones estándar (ds), mi-2ds, mi-ds,mi y la otra mitad en suma?

A

2,15%; 13,6%; 34,1%; 34,1%; 13,6% y 2,15%.

82
Q

¿Qué sucede con el promedio y la desviación estándar si se pasan los puntajes brutos de una variable a puntajes Z?

A

Al pasar a puntajes Z, el promedio es 0 y la desviación estándar, 1.

83
Q

¿Qué son los puntajes Z?

A

Indica a que cantidad de desvíos estándar por encima o por debajo de la media se encuentra dicha observación (positivo o negativo); nos permiten estimar porcentajes de la distribución normal bajo, sobre o entre valores de la curva.

84
Q

¿Se transforma la variable en normal si paso los valores a puntaje Z?

A

No

85
Q

¿Puedo transformar a Z una variable que no se distribuye de manera normal en la población?

A

Sí, pero los porcentajes que se estimen no van a ser precisos porque se basan en una distribución teórica que no corresponde a la distribución que tiene la variable en la muestra o en la población.

86
Q

¿Cómo se calcula el puntaje Z?

A

Z = valor de una variable – mi / varianza. Z= valor de una variable – promedio / desviación estándar.

87
Q

¿Qué es la distribución muestral y qué permite estudiar?

A

Es la distribución de todas las muestras posibles con un “n” determinado. Se aproxima a una curva normal a medida que el “n” aumenta. La distribución muestral es lo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una población. Su estudio permite calcular la probabilidad que se tiene, dada una sola muestra, de acercarse al parámetro de la población.

88
Q

¿En qué consiste el Teorema del límite central?

A

Si se extraen muestras aleatorias de tamaño “n” de una población con media (“u” = mi) y varianza (v 2), la distribución muestral de los promedios: tendrá una distribución aproximadamente normal, con un promedio igual a “u” y varianza igual a v 2 /n, a medida que el “n” aumenta. Esto no requiere que la distribución en la población sea normal. Es decir, es más probable obtener valores más cercanos al verdadero valor de lo que se está midiendo si se tienen varias muestras. El teorema dice: si yo sacara infinitas muestras del mismo tamaño, el promedio de esas muestras sería igual al promedio de la población.

89
Q

¿Qué datos se necesitan tener para estimar el parámetro de una población?

A

La curva normal (si se aumenta el N, podemos utilizar lo que sabemos de la curva normal para hacer inferencias sobre la población), el promedio (el promedio de cualquier distribución muestral es igual al de la población) y el error estándar o típico (la desviación estándar de la distribución muestral, llamada “error estándar”, disminuye a medida que el “n” aumenta).

90
Q

¿Puedes estimar un intervalo de un parámetro?

A

Sí, pueden estimar un rango de valores entre los que podría estar nuestro parámetro. De hecho, hay una fórmula para estimar un intervalo de confianza.

91
Q

¿Qué son los intervalos de confianza?

A

Donde se encuentra el parámetro. Son un rango aproximado en donde se puede encontrar los valores que se estén buscando. Lo más probable es que el parámetro poblacional no sea un valor único, sino un segmento continuo donde en cualquier punto de ese rango se encuentre el valor verdadero del parámetro que se está estimando (no se conoce por eso se estima). Podemos saber qué tanto se desviarán de ese valor el 95% de las muestras posibles, generando un intervalo de confianza. La probabilidad de obtener una muestra cuyo intervalo de confianza no incluya “u” es 0,05 (2,5% sobre-estimando y 2,5% sub-estimando el promedio de la población).

92
Q

¿Qué significa que una muestra tenga un intervalo de confianza de 95?

A

Significa que el 95% de las muestras van a contener el promedio de la población.

93
Q

¿Qué sucede si aumenta el intervalo de confianza?

A

Mientras más aumenta mi intervalo, mayor es la probabilidad de que el parámetro se encuentre en este rango, sin embargo, perdemos precisión.

94
Q

¿Qué es incorrecto decir si yo estimo un intervalo de confianza del 95%?

A

Es incorrecto decir que existe un 95% de confianza que el valor del parámetro se ubique entre los valores del intervalo. Es parcialmente correcto decir que el intervalo de confianza podría contener el valor del parámetro.

95
Q

¿Qué es una hipótesis estadística y cuáles son los dos tipos de esta?

A

Es la proposición acerca de uno o más parámetros poblacionales y se puede plantear una hipótesis nula (H0) o una hipótesis alternativa (H1).

96
Q

¿En qué consiste una hipótesis nula?

A

Siempre es una hipótesis de igualdad, que postula que no hay diferencias entre los grupos (reales y teóricos), la correlación es igual a 0, el promedio es igual al punto medio de la escala, etc. Es la que se somete a prueba. Apunta a un valor fijo de un parámetro. Su aceptación (se acepta o rechaza) implica tomar una decisión específica con respecto a la hipótesis científica. Se va a estimar como verdadera cuando se encuentre el parámetro dentro de los límites de la zona de aceptación (0.95), cuando se encuentra en las zonas de rechazo, decimos que hay diferencias.

97
Q

¿Cuáles son los valores convencionales del error tipo 1?

A

0,05 y 0,01 (aún más improbable).

98
Q

¿En qué consiste una hipótesis alternativa?

A

Simplemente lo contrario a la hipótesis nula al postular que sí hay diferencias entre los grupos, la correlación es distinta de 0, el promedio es diferente al punto medio de la escala, etc. Usualmente representa estadísticamente a la hipótesis científica del estudio. Representa la única opción razonable en caso de rechazar la hipótesis nula. No se somete a estudio, solo lo hace la H0

99
Q

¿Cuál es el supuesto de la investigación con respecto a la hipótesis nula?

A

El supuesto es que es correcta. A no ser que midamos a la población completa, nunca vamos a saber si la hipótesis nula es correcta o no. La idea es suponer que la hipótesis nula es correcta, y calcular la probabilidad de obtener una diferencia igual o mayor por azar. En caso de que la probabilidad sea muy baja (menor a 0.05), decimos que los resultados son “estadísticamente significativos” y rechazamos la hipótesis nula.

100
Q

¿A qué refiere el nivel de significación?

A

Es importante fijar un punto a partir del cual vamos a considerar que los resultados pueden ser suficientemente diferentes de mi hipótesis nula como para considerar que las diferencias son significativas más allá del azar.

101
Q

¿Qué es la “zona de aceptación” en relación con las hipótesis estadísticas?

A

El conjunto de valores muestrales con los que aceptamos la H0. Corresponde alfa-1.

102
Q

¿Qué es la “zona de rechazo” en relación con las hipótesis estadísticas?

A

El conjunto de valores muestrales con los que rechazamos la H0. Son los valores que están fuera del intervalo, cuando esto ocurre las diferencias entre grupos son significativas. Corresponde a alfa o (cuando es bidireccional) alfa/2.

103
Q

¿Cuáles son las direcciones que puede tener las hipótesis estadísticas gráficamente?

A

Pueden tener dirección unilateral o sin dirección. Depende de si son hipótesis unilaterales: fijan la zona de rechazo a un lado de la distribución muestral o hipótesis bilaterales: fijan la zona de rechazo a ambos lados de la distribución muestral (ej. 0,025 a cada lado).

104
Q

¿Cuál es el error tipo 1 (alpha)?

A

Rechazar la hipótesis nula, cuando es verdadera y en realidad obtuvimos los resultados por pura casualidad, ya que las variables no estaban relacionadas en la población. Dicho de otro modo: encontrar diferencias cuando en realidad no las hay (un error de inferencia).

105
Q

¿En qué consiste el error tipo 2 (beta)?

A

Es aceptar la hipótesis nula cuando no es verdadera. Concluir que no existen diferencias cuando sí las hay. El error tipo II depende del tamaño del efecto que estamos buscando.

106
Q

Con respecto a los errores, ¿qué sucede cuando se aumenta el N de la muestra?

A

Aumentar el “n” de la muestra permite tener un menor error tipo I y un menor error tipo II, porque se disminuye el error estándar.

107
Q

¿Qué es el poder estadístico?

A

Es la diferencia entre el promedio de los dos grupos dividido por la desviación estándar. Probabilidad de detectar un efecto significativo cuando realmente existe. Puede ser pequeño (0,2-0,3), mediano (0,5) o grande (0,8 o más). Se recomienda un poder de 0,8. Se calcula como 1-beta: probabilidad de rechazar la Ho cuando esta es falsa.

108
Q

¿Qué sucede si se disminuye alfa?

A

Se aumenta la zona de aceptación, pero la capacidad de verificar un efecto disminuye. Disminuir alfa es disminuir la potencia.

109
Q

¿Cuál es la lógica a seguir para contrastar una hipótesis?

A

1) Formular una hipótesis sustantiva, 2) elegir una prueba estadística, 3) formular una hipótesis nula y una hipótesis alternativa, 4) elegir el nivel de significación estadística (alfa), 5) calcular el estimador correspondiente o el intervalo de confianza, 6) contrastar: comparar la probabilidad asociada al estimador con valor alfa, comparar Z/t observado con Z/t crítico, compara el estadígrafo con el intervalo de confianza (está incluido) y 7) decidir respecto de la hipótesis nula y alternativa.

110
Q

¿De qué sirve la distribución teórica T-student?

A

Está diseñada para comparar si el promedio de dos grupos es diferente. La ocupamos cuando necesitamos realizar la estimación de un parámetro o un contraste de hipótesis cuando se desconoce la desviación estándar de la población (desconocemos la varianza) o tenemos muestras pequeñas. Entrega un valor observado (de la muestra), que se compara con el teórico (la tabla, que indica el comportamiento de la población) para ver las diferencias. En suma, obtenemos dos muestras y evaluamos qué tan diferentes son los promedios. Si los grupos son iguales en la población (hipótesis nula), es esperable que en la mayoría de los casos la diferencia va a ser cercana a cero.

111
Q

¿En qué se parece la distribución t con la distribución normal y cómo se calcula?

A

La distribución t se parece a la normal en tanto tiene una forma semejante a este (simétrica), pero tiene una densidad diferente. Se calcula según grados de libertad (familia de distribuciones). Es mejor siempre usar la distribución de t si no se conoce que es normal.

112
Q

¿Qué sucede con la hipótesis nula si el valor de “t observado” supera el umbral?

A

Se rechaza.

113
Q

¿Qué es el coeficiente de correlación (r)?

A

Es un estimador de la correlación que existe en la población r (rho). Al igual que con la media, podemos encontrar la probabilidad de obtener una correlación determinada si la hipótesis nula fuera correcta (hipótesis nula > no hay relación > r = 0). Si en la población existe una relación determinada entre dos variables, la mayoría de las muestras van a mostrar dicha relación. Es decir, la distribución muestral de r tiende a ser una distribución normal (entre -1 y 1) a medida que el “n” de la muestra aumenta. Por lo tanto, podemos usar la distribución t.