Métodos de Investigación Cuantitativa Flashcards
Mencione 2 aportes generales de la estadística a la generación de conocimiento
el resumen de un conjunto grande de información (estadística descriptiva) y la extensión de las conclusiones que se observan en ciertos sujetos, a otros sujetos que no han sido observados (estadística inferencial).
En resumen: Estadística descriptiva y estadística inferencial.
V/F. La elaboración de la pregunta de investigación siempre debe anteceder a la observación de datos estadísticos
F. Hay situaciones en que la pregunte surge tras constatar datos estadísticos.
**
Fue éste el camino seguido por Durkheim (1994 [1897]) quien, al observar que las tasas de suicidio de diferentes comunidades aparecían muy disímiles, postuló que, más allá de las razones particularísimas que cada persona podría tener para llegar al suicidio, debía haber otros factores, de orden social, que determinaran los suicidios. Va así a preguntarse qué elementos distintivos de las comunidades pueden explicar que en unas el suicidio sea más frecuente que en otras
Definición de Unidad de Análisis:
entes individuales acerca de los que se analizan sus cualidades.
Definición de Variable
una característica de las unidades de análisis que puede asumir diferentes valores en cada una de ellas
Las categorías son valores que pueden asumir las variables. Con respecto a ellas (categorías), mencione 2 características mínimas que deben cumplir
1) Exclusión mutua: cada categoría excluya a todas las demás
2) Exhaustividad: que agoten todas las posibilidades de variación, es decir, que todos los valores posibles estén contemplados
¿Qué es medir según la teoría representacional?
asignar números a los objetos según cierta regla, de manera que los números asignados en la medición no representan propiamente cantidades, sino relaciones.
¿Qué niveles de medición se pueden asignar a una variable?
Son 4: Nominal, Ordinal, Intervalar y Proporcional (discreto y continuo)
¿Cuáles son las medidas de tendencia central?
Son la media, mediana y moda.
¿En qué situación la moda, mediana y media tienen el mismo valor?
Distribución normal
¿Qué sucede con las medidas de tendencia central si todas las variables tienen un mismo valor?
Media y Mediana coinciden y no existe moda
¿Qué se entiende por error de muestreo?
Es la diferencia entre el estadígrafo de la muestra y el parámetro de la población correspondiente
¿Cuál medida de tendencia central es menos sensible al error de muestreo?
la mediana
¿Cuáles son las medidas de variabilidad?
el rango, la varianza y la desviación estándar
V o F.
Sólo en el caso de las distribuciones simétricas la sumatoria de las desviaciones positivas y negativas respecto de la media es = 0
F.
En todas las muestras siempre la suma de las desviaciones de la media es = 0
¿Para qué se utiliza la suma de cuadrados de las desviaciones de la media de una distribución cualquiera?
Es una manera de cuantificar la totalidad de la variabilidad en un conjunto de valores. Dado que el cuadrado de un número nunca adquiere un valor negativo, la sumatoria realizada de esta forma evita llegar inevitablemente a un valor = 0.
¿Cómo se obtiene la varianza de una muestra?
Se encuentra dividiendo la suma de cuadrados entre N (N° de observaciones).
¿Cómo se obtiene la desviación estándar?
Es la raíz cuadrada de la varianza, tiene mayor utilidad descriptiva que la varianza.
¿Cuál es la diferencia entre un estadígrafo y un parámetro?
El estadígrafo es una medida descriptiva inherente a la muestra, en cambio, el parámetro es inherente a la población. Por lo tanto, el estadígrafo no sesgado se debiera corresponder con el parámetro y el error de muestreo se puede considerar como la distancia entre los valores del estadígrafo y los del parámetro.
¿Qué es la confiabilidad en estadística?
Representa la estabilidad y consistencia del estadígrafo como una estimación del correspondiente parámetro de la población
¿Cómo se obtiene el valor de frecuencia relativa de una variable?
Se divide su frecuencia en el N° de casos
Un histograma que representa datos cuantitativos se asemeja mucho a un gráfico de barras que representa datos cualitativos ¿En qué se diferencian?
Por lo general los datos cuantitativos se miden con escalas continuas, no discretas, por lo que los histogramas no tienen las barras separadas, sino que adyacentes.
A qué autor pertenece esta cita: “Medición se define como la asignación de numerales a objetos o eventos de acuerdo a ciertas reglas”
N.R. Campbell
¿Qué rol cumple la estadística inferencial?
Calcular la probabilidad de que algo ocurra en el futuro
Tres conceptos clave según Lind, D. A., Marchal, W. G. & Wathen, S. A. (2015) para hablar de Probabilidad
EXPERIMENTO Proceso que induce a que ocurra una y sólo una
de varias posibles observaciones.
RESULTADO Resultado particular de un experimento
EVENTO Conjunto de uno o más resultados de un experimento
Cuál es la fórmula clásica de probabilidad?
probabilidad de un evento= Número de resultados favorables/Número total de posibles resultados
Cuál es la fórmula de la probabilidad empírica?
Número de veces que el evento ocurre/ Número total de observaciones
***
A diferencia de la probabilidad clásica la empírica se basa en la cantidad de veces que el evento ocurrió en el pasado
Cual es la fórmula de la regla general de la adición para una probabilidad?
P(A o B) = P(A) +P(B) - P(A y B)
Cuál es la fórmula de la regla general de la multiplicación de una probabilidad?
P(A y B) = P(A)P(B|A)
Cómo es la formula de permutaciones?
nPr = n! dividido (n – r)!
***
Donde n representa el total de objetos y r el total de objetos seleccionados.
IMPORTANTE: N! SIGNIFICA “ N FACTORIAL”, es decir:
N( N-1)(N-2)(N- 3).. –> POR EJ: 4!= 4 X 3 X 2 X 1
Cuáles son las 3 familias de distribuciones de probabilidad continua?
la distribución de probabilidad uniforme, la de probabilidad normal y la de probabilidad exponencial
Para un conjunto de sucesos que se agrupan en una distribución normal ¿Cuál es la probabilidad de que ocurra un evento del conjunto que se encuentre a la izquierda de la media?
0,5
¿Qué es la estadística descriptiva y la estadística inferencial?
Estadística descriptiva: Analiza variables en la muestra, no generaliza ni estima, sólo describe. Sirve para sintetizar o
resumir los datos obtenidos a partir de un conjunto de observaciones.
Estadística inferencial: utiliza la información de la estadística descriptiva para realizar procesos que permiten, dentro de ciertos rangos de confianza, determinar el comportamiento de la población que es representada por la muestra. Tiene un grado de error, ya que estima/infiere acerca de lo que no conoce.
No incluye todos los valores dentro de un rango, tiene un conjunto limitado de valores posibles.
¿A qué tipo de variable corresponde la descripción anterior?
Variable discreta
Incluye todos los valores posibles dentro de un rango. Esto no es común en ciencias sociales, pero en la práctica cuando tenemos una gran cantidad de valores posibles es mejor tratarlos como continuo.
¿A qué tipo de variable corresponde la descripción anterior?
Variable continua.
Gráfico de tabla de intervalos. Visualiza la distribución de una variable continua.
¿A que tipo de gráfico corresponde la descripción anterior?
Histograma.
¿Qué gráfico se usa para las tablas de frecuencia?
Gráfico de Barras. También se puede usar el de torta.
¿Cómo se ordenan las medidas de tendencia central cuando hay una asimetría negativa?
Promedio < Mediana < Moda
¿Cómo se ordenan las medidas de tendencia central cuando hay una asimetría positiva?
Moda < Mediana < Promedio
V o F
La desviación estándar de la distribución muestral, llamada “error estándar”, disminuye a medida que el “n” aumenta
Verdadero
El error muestral es inversamente proporcional al tamaño de la muestra.
¿Cuándo se rechaza la hipótesis nula?
En caso de que la probabilidad sea muy baja (menor a 0.05), decimos que los resultados son “estadísticamente significativos” y rechazamos la hipótesis nula.
En relación a la hipótesis nula ¿Qué es un error tipo 1 (alpha)?
Encontrar diferencias cuando en realidad no las hay (un error de inferencia). En otras palabras, rechazar la H0 cuando es verdadera.
*Falso Positivo.
En relación a la hipótesis nula ¿Qué es un error tipo 2 (BETA)?
Decir que la H0 es verdadera, cuando no lo es.
*Falso Negativo.
¿Qué significa que una distribución sea bimodal?
Significa que tiene dos modas
¿Cómo se calcula Z?
(X - Promedio) / Desviación Estándar
Las dos ramas de la estadística usadas aquí son:
- Estadística Descriptiva
2. Estadística Inferencial
V o F
Las correlaciones van de 0 a 1.
Falso.
Las correlaciones van de -1 a 1.
Valores de una relación débil, mediana y fuerte:
- Relación Débil/Pequeña: X es igual o mayor a 0.1
- Relación Mediana: X es igual o mayor a 0.3
- Relación Fuerte: X es igual o mayor a 0.5
¿Qué es operacionalizar?
En el diseño de investigación, especialmente en psicología, la operacionalización es un proceso de definición de la medición de un fenómeno que no se puede medir directamente, aunque su existencia se infiere de otros fenómenos.
*En términos aún mas simples, operacionalizar es cuantificar un fenómeno.
¿Qué es una variable y que es una constante?
Variable: es algo que al ser medido en distintas circunstancias asume distintos valores.
Constante: es algo que no asumen distintos valores dentro de la medición.
¿Cuáles son las escalas de medición cualitativas? (Variables Discretas)
Nominales y Ordinales.
¿Cuáles son las escalas de medición cuantitativas? (Variables Continuas)
Intervalo y de razón.
¿Cuáles son los estadísticos que pueden ser usados con una escala nominal?
Frecuencia y Moda
¿Cuáles son los estadísticos que pueden ser usados con una escala ordinal?
Frecuencia, Moda, Mediana y Percentiles.
¿Cuáles son los estadísticos que pueden ser usados con una escala intervalar?
Frecuencia, moda, mediana, percentiles, promedio, desviación estándar y correlaciones.
¿Cuáles son los estadísticos que pueden ser usados con una escala de razón?
Frecuencia, moda, mediana, percentiles, promedio, desviación estándar, correlaciones y coeficiente de variación.
¿Qué es la proporción?
La proporción es la frecuencia de aparición de un valor de la variable (f) dividido el total de casos.
- La proporción tiene valores que van de 0 a 1.
- La suma de todas las proporciones es igual a 1.
¿Qué gráfico permite comparar los valores del cruce de dos variables categóricas?
El gráfico de barras agrupados
¿Qué tipo de gráfico se usa para determinar la distribución de una variable dentro de otra variable?
Gráficos Apilados.
¿Qué tipo de gráfico permite mostrar tendencias o patrones en los datos?
Gráficos de Línea.
*A su vez, permiten comparar tendencias entre grupos.
¿Qué tipo de gráfico permite visualizar la distribución entre el cruce de dos variables continuas?
Dispersiograma.
*Los dispersiogramas son útiles para ver la asociación entre las variables (“cuando una aumenta, la otra…”)
**Los dispersiogramas se asocian a los análisis correlacionales.
¿Qué permiten las medidas de posición?
Las medidas de posición permiten dividir una distribución en partes iguales. (Mediana y Percentiles).
Son indicadores numéricos que buscan determinar el valor
más representativo de una distribución.
¿A qué concepto alude la frase anterior?
Medidas de Tendencia Central.
¿Qué medida de tendencia central representa al puntaje que equilibra las distancias o diferencias de los puntajes observados?
Promedio (Media)
*Si sumo todas las distancias sobre el promedio (positivas) y bajo el promedio (negativas) el resultado obtenido es cero.
V o F.
Los puntajes de cualquier distribución numérica pueden ser
representados en unidades de desviación estándar.
Verdadero.
Los puntajes de cualquier distribución numérica pueden ser
representados en unidades de desviación estándar.
V o F.
La desviación estándar no permite realizar comparaciones entre grupos.
Falso.
La desviación estándar es un punto de referencia para realizar comparaciones entre grupos.
¿Qué permite el puntaje Z?
El puntaje Z permite estandarizar los puntajes de una muestra a partir del promedio y la desviación estándar. Es por ello que el puntaje Z también permite comparar valores de variables medidas
en escalas distintas.
¿Qué es la muestra?
La muestra es un subconjunto de la población a la cual tenemos acceso y a partir de la cual podemos inferir características de la población.
V o F
La distribución muestral no se aproxima a una curva normal a
medida que el n aumenta.
Falso.
La distribución muestral si se aproxima a una curva normal a
medida que el n aumenta.
V o F.
Muy pocos estudios evalúan a toda su población de interés, pero
a partir de una muestra determinada uno puede hacer inferencias hacia la población.
Verdadero.
¿Qué plantea el teorema del límite central sobre el promedio?
El TLC plantea que el promedio de la distribución muestral será aproximadamente igual al promedio poblacional.
¿Cuál es la formula del error estándar?
El error estándar es la desviación estándar de la
población (σ), dividida por la raíz cuadrada de el tamaño de las muestras.
¿Qué es el intervalo de confianza?
Es el rango de valores en el que puede estar el promedio poblacional.
*Se calcula a partir del promedio de una muestra y un margen de error determinado.
Si el nivel de significancia es de de 0.05, ¿Cuándo se acepta y cuando se rechaza la hipótesis nula?
a) si X > 0.05 se acepta la hipótesis nula
b) si X < 0.05 se rechaza la hipótesis nula
¿Qué evalúa el ANOVA?
El ANOVA evalúa la relación entre una variable categórica y una variable cuantitativa.
*El ANOVA compara el promedio de varias poblaciones
V o F
ANOVA solo nos entrega información respecto a si hay
diferencias entre los grupos en general.
Verdadero.
ANOVA solo nos entrega información respecto a si hay
diferencias entre los grupos en general.
V o F
El ANOVA solo se puede hacer cuando una variable discreta tiene dos categorías.
Falso.
El ANOVA se hace cuando una variable discreta tiene tres o más categorías.
¿Con que variables se realiza la prueba chi-cuadrado?
El chi-cuadrado se realiza para evaluar la posible relación de dos variables categóricas.
V o F
La prueba chi-cuadrado evalúa qué tanto se alejan los datos de una distribución teórica, es decir, si los datos observados se ajustan a lo esperado teóricamente.
Verdadero.
¿Cuál es el análisis/ prueba para evaluar el grado de asociación entre dos variables categóricas?
Chi-cuadrado
¿Cuál es el análisis/prueba para evaluar la asociación entre dos variables numéricas/continuas?
Covarianza: Mide la variación conjunta de dos variables.
Coeficiente de Pearson: Estandariza la covarianza.
*Ø La correlación es la covarianza estandarizada.
V o F
Dado que la correlación es una medida estandarizada, el signo indica la dirección de la relación (positiva o negativa). Mientras que el valor indica la magnitud de la relación (ausencia de relación, débil o fuerte).
Verdadero.
Dado que la correlación es una medida estandarizada, el signo indica la dirección de la relación (positiva o negativa). Mientras que el valor indica la magnitud de la relación (ausencia de relación, débil o fuerte).
V o F
En la correlación se puede evaluar cómo una variable independiente influye sobre una variable dependiente.
Falso.
Correlación no es causalidad.
¿Qué es una correlación espuria?
Dos variables están matemáticamente asociadas, pero no existe
causalidad ni asociación directa entre ellas.
V o F
La asociación entre dos variables no se puede entender como varianza compartida.
Falso
La asociación entre dos variables se puede entender como varianza compartida.
¿Para qué sirve la regresión lineal? *Regresión simple
La regresión lineal sirve para predecir los valores de una variable, a partir del comportamiento de otra.
V o F
La suma de residuos cuadrados es menor para la línea de regresión que para cualquier otra línea recta que pudiera dibujarse a través del enjambre de datos.
Verdadero
La suma de residuos cuadrados es menor para la línea de regresión que para cualquier otra línea recta que pudiera dibujarse a través del enjambre de datos.