Métodos de Investigación Cuantitativa Flashcards

1
Q

¿A qué refieren la estadística descriptiva y la estadística inferencial?

A
  1. Estadística descriptiva: Analiza variables en la muestra, no generaliza ni estima, sólo describe. Sirve para sintetizar o resumir los datos obtenidos a partir de un conjunto de observaciones.
  2. Estadística inferencial: Infiere las variables en la población, habla de lo que no conoce. Requiere de la descriptiva, ya que utiliza la información de la estadística descriptiva para realizar procesos que permiten, dentro de ciertos rangos de confianza, determinar el comportamiento de la población que es representada por la muestra. Tiene un grado de error, ya que estima/infiere acerca de lo que no conoce.

La estadística inferencial nos permite hacer afirmaciones probabilísticas respecto a los parámetros poblacionales.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

¿Qué son las variables discretas y las variables continuas?

A
  1. Discretas: No incluye todos los valores dentro de un rango, tiene un conjunto limitado de valores posibles (ejemplos: pregunta likert de 1 a 5, o la cantidad de hermanos que tiene un participante).
  2. Continuas: Incluye todos los valores posibles dentro de un rango. Esto no es común en ciencias sociales, pero en la práctica cuando tenemos una gran cantidad de valores posibles es mejor tratarlos como continuos (ejemplos: promedio de varias pregunta likert de 1 a 5, o tiempos de reacción).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Verdadero o Falso:

Los gráficos permiten una comprensión global más inmediata, mientras las tablas una revisión más detallada.

A

Verdadero.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Verdadero o Falso:

Las frecuencias son datos absolutos.

A

Verdadero.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Verdadero o Falso:

Es relativamente sencillo comparar los resultados de dos tablas con un N total de respuestas diferente.

A

Falso.

Para comparar los resultados de dos tablas con un N total de respuestas diferente, se utilizan medidas estandarizadas, esto es, transformaciones de los puntajes originales a escalas que sean las mismas en todas las tablas (y que permiten la comparación).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿Cuáles son las medidas que estandarizan los puntajes?

A

Proporción (p) y Porcentaje (%).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

¿Para qué sirven las tablas de intervalos?

A

Sirven para evaluar la distribución de una variable continua. Recodifican la variable continua para que tenga menos valores posibles. Hay que construir suficientes intervalos para poder aproximar una curva, pero no demasiados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

¿Cuáles son las Medidas de Tendencia Central?

A
  1. Moda: Es el valor que se repite más (puntaje de mayor frecuencia).
  2. Mediana: El valor que divide a la distribución por la mitad.
  3. Promedio: Representa al puntaje que equilibra las distancias o diferencias con los puntajes observados.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Verdadero o Falso:

El promedio es más afectado por los puntajes medios de la distribución.

A

Falso.

Es más afectado por los puntajes extremos de la distribución.

Ejemplo de prueba: Se tiene un grupo de 10 árboles, la mayoría de ellos mide entre 10 y 15 metros, sin embargo, hay uno que mide 50 metros. La media de altura de los árboles es de 15,7 metros. En este caso el promedio no estaría representando correctamente la tendencia central porque hay un caso extremo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

¿De qué sirven las medidas de posición?

A

Permiten ubicar una persona dentro de una distribución de puntajes y simplificar una distribución.

Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos (percentiles, por ejemplo).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Verdadero o Falso:

El boxplot es ideal para visualizar inmediatamente el comportamiento de una variable: tendencia central, dispersión y la asimetría de la distribución.

A

Verdadero.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Verdadero o Falso:

La asimetría negativa de una distribución refiere a cuando el montículo se encuentra a la izquierda.

A

Falso.

La asimetría negativa de una distribución refiere a cuando la cola está a la izquierda, y la positiva cuando su cola está a la derecha.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Verdadero o Falso:

Asimetría negativa: moda<mediana<promedio.

Asimetría positiva: promedio<mediana<moda.

A

Falso.

Es al revés.

Asimetría negativa: promedio<mediana<moda.

Asimetría positiva: moda<mediana<promedio.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Verdadero o Falso:

Distribuciones con kurtosis positiva son más puntiagudas, y distribuciones con kurtosis negativa son más redondas.

A

Verdadero.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Verdadero o Falso:

Una distribución homogénea tiene menor dispersión, menos variabilidad.

A

Verdadero.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

¿Cuáles son las medidas de dispersión?

A
  1. Rango: diferencia entre el valor máximo y el mínimo de una población o muestra estadística.
  2. Varianza: representa la variabilidad de una serie de datos respecto a su media.
  3. Desviación estándar: El promedio de las diferencias o desviaciones respecto del promedio de la distribución.
  4. Coeficiente de variación: se obtiene de dividir la desviación típica entre el valor absoluto de la media del conjunto y por lo general se expresa en porcentaje.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Verdadero o Falso:

Mientras más heterogénea sea una distribución, mayores serán las desviaciones respecto del promedio

A

Verdadero.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

¿Qué es el error de muestreo?

A

El error de muestreo es la diferencia entre el estadígrafo de la muestra y el parámetro de la población correspondiente.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Verdadero o Falso:

Hay un gran error de muestreo asociada a la moda de la muestra.

A

Verdadero.

La moda de una muestra no es una estimación muy confiable de su moda de población a menos que el tamaño de la muestra sea extremadamente grande. Por lo que hay un gran error de muestreo asociada a la moda de la muestra.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Verdadero o Falso:

La media de la muestra tiene un error de muestreo menor que la moda o la mediana, por lo que tiende a ser preferida para fines inferenciales.

A

Verdadero.

Además, tiene más facilidad para un tratamiento estadístico posterior que la mediana o la moda, ya que está definida algebraicamente.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Verdadero o Falso:

Si la distribución es marcadamente heterogénea o marcadamente homogénea, la suma de sus valores de desviación de la media es cero.

A

Verdadero.

Esto es cierto para todas las distribuciones de todas las diferentes formas y de todos los tamaños, es decir, la sumatoria de los valores es igual a 0. Obviamente, esto no puede usarse para reflejar la variabilidad.

Por ello se utiliza la suma de todos los valores de desviación al cuadrado de una distribución es un número positivo (varianza; cuya raíz cuadrada es la desviación estándar).

22
Q

¿Qué es la probabilidad?

A

Es un valor entre cero y uno, inclusive, que describe la posibilidad relativa (oportunidad o casualidad) de que ocurra un evento.

23
Q

Verdadero o Falso:

Para sumar probabilidades se debe proseguir del siguiente modo:

P(A o B) = P(A) +P(B)

A

Falso.

P(A o B) = P(A) +P(B) - P(A y B)

24
Q

¿Cuáles son las características fundamentales de una distribución normal?

A

Tiene forma de campana y posee una sola cima en el centro de la distribución. La media aritmética, la mediana y la moda son iguales y se localizan en el centro de la distribución. El área total bajo la curva es de 1. Es simétrica respecto de la media. Distribución asintótica, ósea las colas de la curva se extienden indefinidamente en ambas direcciones

25
Q

Verdadero o Falso:

Al pasar a puntajes Z, el promedio es 0 y la desviación estándar es 1, exhibiendo una distribución normal estandarizada.

A

Verdadero.

26
Q

¿Qué es el Teorema del Límite Central (TLC)?

A

Sin importar la distribución de la variable en la población, la distribución muestral tiende a aproximarse a una curva normal. Por lo tanto, podemos utilizar lo que sabemos de la curva normal para hacer inferencias sobre la población.

El teorema del límite central indica que la suma de variables aleatorias tiende a seguir una distribución normal, aun cuando las variables originales no estuvieran normalmente distribuidas. Es decir, si parto de cualquier tipo de distribución y saco muestras, y obtengo un promedio, y hago una distribución en base a esos promedios, esta será una distribución normal. Indicando que la suma de variables aleatorias (aun cuando estas no sean normales), va a generar una variable aleatoria normalmente distribuida.

27
Q

¿Qué son los Intervalos de confianza?

A

Es el rango de valores posibles donde se espera se ubique el parámetro, que se calcula a partir de la información de la muestra y de los conceptos asociados al TLC.

28
Q

¿Qué es la Hipótesis Nula (H0) y la Hipótesis Alternativa (H1)?

A

Hipótesis Nula (H0): Siempre es una hipótesis de igualdad. No hay diferencias entre los grupos, la correlación es igual a 0. Es la que se somete a prueba.

Hipótesis Alternativa (H1): Simplemente lo contrario a la hipótesis nula. Sí hay diferencias entre los grupos, la correlación es distinta de 0. Se interpreta en dirección contraria a la H0. No se somete a estudio, solo lo hace la H0.

29
Q

Verdadero o Falso:

El supuesto de la investigación es que la hipótesis nula es correcta.

A

Verdadero.

El supuesto de la investigación es que la hipótesis nula es correcta. A no ser que midamos a la población completa, nunca vamos a saber si la hipótesis nula es correcta o no. La idea es suponer que la hipótesis nula es correcta, y calcular la probabilidad de obtener una diferencia igual o mayor por azar. En caso de que la probabilidad sea muy baja (menor a 0.05), decimos que los resultados son “estadísticamente significativos” y rechazamos la hipótesis nula.

30
Q

Describa Error tipo I (Alpha) y Error tipo II (Beta).

A

Error tipo 1 (Alpha): Rechazar la hipótesis nula, cuando en realidad obtuvimos los resultados por pura casualidad, ya que las variables no estaban relacionadas en la población.

Error tipo 2 (Beta): Concluir que no existe una relación entre las variables cuando en realidad esta relación sí estaba presente en la población.

En resumen:
Error 1: encontrar diferencias cuando en realidad no las hay, rechazar la H0 cuando es verdadera.

Error 2: decir que la H0 es verdadera, cuando no lo es.

31
Q

¿A qué prueba corresponde esta definición?:

“Está diseñada para comparar si el promedio de dos grupos es diferente. Obtenemos dos muestras y evaluamos qué tan diferentes son los promedios “.

A

Prueba T.

32
Q

¿A qué prueba corresponde esta definición?:

“Prueba de hipótesis con variables cuyos valores son categorías, como preferencias religiosas o color de pelo”.

A

Chi Cuadrado.

33
Q

¿Cuáles son los tipos de Prueba T?

A
  1. Para una muestra: Evaluar si el promedio es distinto a un valor específico.
  2. Para muestras dependientes: Dos mediciones en la misma muestra. Evaluar si el promedio de una variable es diferente del promedio de otra variable.
  3. Para muestras independientes: La misma medición en dos muestras distintas.
34
Q

Verdadero o Falso:

El coeficiente de correlación r va de 0 a 1.

A

Falso.

Toma valores de -1 a 1.

35
Q

Verdadero o Falso:

La Prueba T entrega información respecto a la relación entre dos variables, una categórica dicotómica y una cuantitaiva. Se evalúa si existen diferentes entre promedios de solo dos grupos.

A

Verdadero.

36
Q

Verdadero o Falso:

Si existen diferencias entre 3 o más grupos, analizamos la varianza mediante ANOVA. Esta evalúa la relación entre dos variables: una categórica con más de dos grupos y una cuantitativa.

A

Verdadero.

37
Q

¿Cuándo rechazar la hipótesis nula?

A

Cuando el p-value sea menor a 0,05.

38
Q

Verdadero o Falso:

Si el intervalo de confianza contiene el 0, existen diferencias significativas.

A

Falso.

Si el intervalo de confianza contiene el 0, no existen diferencias significativas.

Si el intervalo de confianza no contiene el 0, existen diferencias significativas.

39
Q

Si ANOVA se realiza con más de dos grupos, ¿cómo podemos saber entre cuáles grupos existen diferencias?

A

Usamos las pruebas POST HOC.

40
Q

¿Qué hace el Post-hoc Tukey?

A

Compara todos los pares de niveles para detectar cuáles de ellos muestran diferencias estadísticamente significativas.

41
Q

¿Qué evalúa el Chi cuadrado?

A

Evalúa la relación entre dos o más variables categóricas (nominales u ordinales).

Evalúa qué tanto se alejan los datos observados en una muestra de una distribución teórica, es decir, si los datos observados se ajustan a lo esperado teóricamente.

42
Q

Verdadero o Falso:

La ausencia de correlación expresada con el coeficiente de Pearson, no implica la ausencia de una relación entre las variables, solo indica la ausencia de una correlación lineal.

A

Verdadero.

43
Q

Si las variables están relacionadas, quiere decir que tienen varianza en común. Es decir, a mayor r, más varianza explicada (en común) hay.

¿Cuáles son los tipos de relaciones?

A
  1. Pequeña: r = 0.1
  2. Mediana: r = 0.3
  3. Fuerte: r = 0.5
44
Q

¿Qué es el alfa de Cronbach?

A

Un coeficiente de consistencia interna, que funciona como indicador de confiabilidad que se basa en la proporción de variabilidad que se puede atribuir a las mediciones.

Varía entre 0 y 1.

Cero: indica que toda la variabilidad está asociada al error.

Uno: indica que no hay nada de variabilidad asociada al error.

45
Q

¿Para qué sirve la regresión lineal?

A

Sirve para predecir una variable, sabiendo cómo se comporta la otra.

46
Q

Verdadero o Falso:

El Histograma permite visualizar cómo están distribuidos los datos en una variable cuantitativa discreta.

A

Falso.

El Histograma permite visualizar cómo están distribuidos los datos en una variable cuantitativa continua.

47
Q

Verdadero o Falso:

Una puntuación Z indica a qué cantidad de desvíos estándar se encuentra dicha observación por encima o por debajo de la media (dependiendo si es puntuación positiva o negativa).

A

Verdadero.

Los puntajes Z representan la diferencia entre el puntaje de una persona y el promedio de la distribución, en unidades de desviación estándar.

48
Q

¿Qué valores puede adoptar la desviación estándar (SD)?

[Pregunta prueba 1]

A

La desviación estándar cuantifica el grado de dispersión, este solo puede tomar valores positivos en caso que exista algún grado de dispersión, o el valor cero cuando no existe dispersión (todos los valores son iguales).

49
Q

¿Cuál de los siguientes factores generaría intervalos de confianza más amplios?

  1. Un aumento del error estándar.
  2. Una disminución del tamaño de la muestra.
  3. Un aumento del nivel de confianza.
  4. Una disminución del promedio poblacional.

[Pregunta prueba 2]

A

1, 2 y 3.

50
Q

Respecto a la prueba t de Student, ¿cuál de las siguientes afirmaciones es correcta?

I. Se utiliza para estimar un parámetro cuando se desconoce la desviación estándar de la población.

II. Es un mejor estimador de diferencias entre promedios que la distribución normal estándar cuando las muestras son grandes.

III. Se puede utilizar para contrastar hipótesis sobre las diferencias entre los promedios de dos muestras diferentes.

[Pregunta prueba 2]

A

I y III.

51
Q

Verdadero o Falso:

La distribución normal está determinada por el promedio y la varianza.

A

Verdadero.

Al cambiar los parámetros podemos generar distintas curvas normales, con mayor o menor dispersión y con promedios más altos o bajos.

52
Q

Verdadero o Falso:

La prueba T es lo mismo que la Z solo que la información viene de la muestra y no de la población

A

Verdadero.

¿Qué ocurre si no sabemos la desviación estándar?
Reemplazamos la DS de la población con la DS de la muestra y ya no es una distribución muestral, sino una distribución t.