Semana 8 Flashcards

1
Q

Campana de Gauss

A

Linea base representa la variable continue
En una curva normal la media=moda=mediana

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Propiedades de Campana de Gauss

A

f(x) nunca es 0, asíntota
la propia curva representa 99.4% de la data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Pruebas de Normalidad

A
  • Kolmogorov-Smirnoff:
    Prueba no paramétrica para encontrar dist normal. Muestras grandes
  • Saphiro y Wilk
    Prueba no paramétrica para encontrar dist normal. Muestra chica (menos de 50)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Asimetría

A

Asimetría hacia la izquiera - Negativa
(y<-0.5)
Simetría
(-0.5 < y < 0.5)
Asimetría hacia la derecha - Positiva
(0.5 < y)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Curtósis

A

Leptocúrtiva - alta
(0.5 < y)
Mesocúrtica
(-0.5 < y < 0.5)
Platicúrica - baja
(y < -0.5)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Puntaje Z

A

Zi = xi - xmean / desv estándar

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Probabilidad Frecuentista

A

numero de veces que ocurre un evento / numero total de posibles resultados

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Función de Densidad

A
  • Área bajo la curva
  • Datos concentrados
  • Variable continua
  • Dist normal
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Función de Probabilidad

A
  • Variable discreta
  • Ve probabilidades
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Ensayo de Bernoulli

A

Un experimento aleatorio en el que solo se pueden obtener 2 resultados
O hay éxito o fracaso

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Parámetro

A

Valor numérico que describe una característica de una población. Normalmente representada con caracteres del alfabeto griego

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Estadístico

A

Valor numérico que describe una característica de una muestra.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Estimador

A

Estadístico utilizado para estimar el valor de su parámetro correspondiente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Intervalo de Confianza

A

Representa la confianza que tenemos el la representatividad de nuestra muestra
lim inf < media < lim sup

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Desviación Estándar (EE)

A

Usualmente es solo desviación est/raiz de la muestra
- Si es población finita, después se multiplica por (N-n)/(N-1) y DESPUES recien sacas la raiz

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

N 90%

A

@ 0.10
Z 1.64

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

N 95%

A

@ 0.05
Z 1.96

18
Q

N 99%

A

@ 0.01
Z 2.58

19
Q

Distribución Z Ingredientes

A
  • Media de la Muestra
  • Desviación estándar de la población
  • Tamaño de la Muestra
    *Datos se comportan como dist normal est z
20
Q

Dist Z Método

A
  1. Apunta tus datos
  2. Desviación Estándar / Raiz de n (muestra)
  3. Multiplica por valor NC Z
  4. Súmalo o réstalo de la media
21
Q

Distribución T Ingredientes

A
  • Media de la Muestra
  • Desviación Estándar de la Muestra
  • Tamaño de la Muestra
  • Datos se comportan como dist t
22
Q

Dist T Método

A
  1. Apunta tus datos
  2. Desviación Estándar / Raiz de n-1 (muestra)
  3. Multiplica por valor NC T
  4. Súmalo o réstalo de la media
23
Q

Proporción Ingredientes

A
  • Proporción de la muestra o de la población
  • Tamaño de la muestra
    *Datos se comparten como dist normal est z
24
Q

Proporción Método

A
  1. Proporcion*(1-proporción)
  2. Divide entre muestra
  3. Saca la raíz de eso
  4. Multiplica por z
  5. Resta o suma a la media para lim sup y lim inf
25
Tamaño de la Muestra
1. Multiplica z^2 y sd^2 2. Divídelos entre error^2 SI TIENES MUESTRA FINITA: 3. 1/ (1/n) + (1/N) *n = respuesta de 2 N = población finita
26
Tipos de Gráfica
- Cajas y Bigotes - Tallos y Hojas - Q-Q
27
Cajas y Bigotes
muestran posición pero no densidad. Valores atípicos: Valores que están fuera de bigotes pero aún en data set. No pueden medir más/menos de 1.5*RIC Valores externos: Completamente fuera de los límites, superando 3x al RIC
28
Tallos y Holas
Método para organizar gráficamente un conjunto de valores Muestra distribución de datos Mantiene los datos originales Si lo giramos 90 grados se vuelve un histograma
29
Q-Q
Deriva del diagrama de dispersión y compara la distribución de datos para encontrar un factor en común Se usa para comparar la distribución de una variable de análisis con una distribución normal para ver si ambos coinciden en la normalidad Para confirmar si es normal se hace a ojo pero sino se pueden usar algunas pruebas
30
Población
Conjunto total de individuos o elementos bajo estudio. Comparten una o varias características
31
Muestra
Subconjunto representativo de población basado en el cual se realizarán inferencias
32
Unidad de Análisis
El elemento o la persona que será observado o medida
33
Unidad Muestral
La unidad que va a ser observada y muestreada. Usada para acceder a la unidad de análisis. elemento de la muestra
34
Marco Muestral
Lista de todas las unidades muestrales
35
Procesos de Muestreo
Directo → tienes acceso a la información directamente Indirecto → tienes que dar vueltas para acceder la info
36
Razones de Muestreo
- Recursos limitados como tiempo y plata - Escasez de muestra (un trastorno puede ser muy inusual) - Prueba destructiva (investigar causa daño, no puedes matar a todos) - Homogeneidad (todos son tan parecidos que con uno sabes todo) - Puede ser más exacto, hay menos márgen de error como personas no capacitadas
37
Muestreo probabilistico vs no probabilistico
Probabilistico: Cada elemento de una población tienen la misma probabilidad de ser elegido No probabilístico: No se conoce la población de que cada elemento de la población sea elegido. Se selecciona basado a un criterio en concreto
38
Aleatorio
Completamente aleatorio
39
Aleatorio Sistemático
Se eligen elementos de una persona usando un intervalo constante, y después aleatorio
40
Estratificado
Población se divide en subgrupos distintivos excluyentes llamados estratos y después de ellos se elige aleatoriamente
41
Conglomerado
Población se divide en grupos no excluyentes y se seleccionan algunos de cada grupo para estar en la muestra