Datos y análisis de datos Flashcards

1
Q

¿Qué son los datos?

A

Es la colección, hechos y cifras en bruto y desorganizados, contiene materia prima que no tiene ningún significado. Se mide en bits y bytes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

¿Qué es la información?

A

Es el resultado después de que los datos han sido estructurados para convertirlos en algo que sea más confiable, proporciona el contexto para los datos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿Qué es el conocimiento?

A

Cuando se puede derivar más significado de la información para lograr un objetivo establecido. Ejemplo de la información meteorológica

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

¿Qué es la sabiduría?

A

Se deriva del conocimiento y es cuando el conocimiento se puede aplicar en acción. Hacer preguntas “por qué” para tomar decisiones. Predecir olas de calor

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

¿Qué es la pirámide DIKW?

A

Es un diagrama que representa la relación entre los datos, la información, el conocimiento y la sabiduría

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿Cuáles son los tipos de datos?

A

Datos financieros
Datos médicos
Datos meteorológicos
Datos geográficos
Datos científicos
Metadatos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

¿Qué son los datos financieros?

A

Consisten en información relacionada con las finanzas de un negocio

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

¿Qué son los datos médicos?

A

Los recopilados, analizados y almacenados durante una atención médica

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

¿Ejemplos de datos de un ministerio de salud?

A

Censos demográficos, Mortalidad, natalidad, registros de cáncer basados en la población, datos rutinarios, encuestas poblacionales

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

¿Qué son los datos meteorológicos?

A

Instrumentos que recopilan datos sobre el clima

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

¿Qué son los datos geográficos?

A

Datos geoespaciales, se refieren a los datos relacionados con el posicionamiento de un objeto en un espacio geográfico. Utilizan el GPS

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

¿Cómo funciona el GPS?

A

Es un sistema de radionavegación de EEUU que proporciona datos sobre el posicionamiento a través de coordenadas de altitud, latitud y longitud. Es un archivo con extensión .loc

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

¿Cuáles son las aplicaciones del GPS?

A

Agricultura: Con ayuda del GIS (Sistema de Información Geográfico) ha sido posible la aplicación de la cultura de precisión al acopiar datos geoespaciales sobre los suelos, plantas y animales

Medio ambiente: Se hacen estudios de las zonas más impenetrables para evaluar la flora y fauna, topografía, etc. para después gestionar programas como el control de operaciones mineras o derrames de petróleo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

¿Qué son los datos científicos?

A

Investigaciones llevadas a cabo por científicos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

¿Qué son los metadatos?

A

Es el almacenamiento de datos sobre los datos que se están almacenando. Conjunto de datos que describen y brindan inf sobre otros datos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

¿Ejemplos de metadatos?

A

Página web (cantidad de imágenes, texto, videos, lenguaje de programación), vídeo (formato, duración, tasa de bits, fecha de grabación y edición), imagen (nombre del propietario de la cámara, ubicación GPS, fecha y hora, etc.) y documento (nombre del autor, fecha de creación y de modificación, número de palabras, copyright)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

¿Qué es la minería de datos (data mining)

A

Es el proceso de encontrar patrones y anomalías dentro de grandes conjuntos de datos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

¿Cómo es el proceso de la minería de datos?

A
  1. Conjuntos de datos
  2. Pre-procesamiento
  3. Clasificación
  4. Bases de datos
  5. Estadísticas
  6. Análisis
  7. Evaluación
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

¿Qué es la coincidencia de datos (data matching)?

A

Es el proceso de comparar dos conjuntos de datos con el objetivo de encontrar datos sobre la misma entidad. Como comparar los precios de un mismo producto en distintos sitios.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

¿Cuáles son las etapas del ciclo de vida de los datos?

A
  1. Creación de datos
  2. Almacenamiento
  3. Uso
  4. Preservación
  5. Destrucción
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

¿En qué consiste la creación de datos?

A

Se crean a través de la entrada manual de datos o automáticamente por medio del uso de sensores.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

¿En qué consiste el almacenamiento?

A

Se almacenan y protegen al nivel apropiado de seguridad y configuración de acceso

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

¿En qué consiste el uso?

A

Se procesan, analizan o comparten con otros, se requieren sistemas IT para su uso

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

¿En qué consiste la preservación de datos?

A

Después del análisis de datos, se preservan por la organización para apoyar el análisis, también se pueden reutilizar en el futuro.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

¿En qué consiste la destrucción de datos?

A

Una vez que se termine el período de retención acordado, los datos deben ser destruidos.

26
Q

¿Cuáles son las categorías en la etapa de creación de datos?

A

Datos primarios: Dato original recopilado en el primer momento
Datos secundarios: Dato que ya ha sido recopilado por alguien más

27
Q

¿Qué son las bases de datos?

A

Almacenan grandes volúmenes de datos a través de tablas

28
Q

¿Cuál es la estructura de las bases de datos?

A

Tabla
Entidades: Estudiantes
Atributos: Edad

29
Q

¿Qué es una base de datos relacional?

A

Es una base de datos que tiene más de una tabla vinculadas por su clave principal

30
Q

¿Cuáles son los métodos para mejorar la precisión de datos en una base de datos?

A

Validación: Solo se pueden introducir datos válidos (adecuados) al establecer longitud de campo, tipos de datos, usar máscaras de entrada, etc.

Verificación: Comprobar que los datos introducidos son los datos que se desean. Existen dos métodos: Doble intrada (introducir una contraseña dos veces) y tener una segunda persona que verifique los datos visualmente.

31
Q

¿Qué es una consulta?

A

Son las búsquedas en las bases de datos. Se diseñan para que la inf sea atractiva al usuario

32
Q

¿Cuáles son las categorías estándar de información?

A

Información pública: nombre, dirección de una organización
Información confidencial: datos bancarios
Información sensible: datos biométricos
Información personal: étnia

33
Q

¿Qué es la visualización de datos?

A

Es el proceso por el cual los conjuntos de datos se convierten en representaciones visuales como gráficas, infografías, etc

34
Q

¿Qué es la encriptación?

A

Es el proceso de convertir datos legibles en ilegibles para evitar el acceso no autorizado. Un algoritmo transforma la inf en cifrado ilegible, para descifrarlo se usa una llave llamada texto sin formato.

35
Q

¿Cuáles son los tipos de encriptación?

A

Encriptación de clave simétrica y asimétrica

36
Q

¿Qué es la encriptación de clave simétrica?

A

La clave para codificar y decodificar los datos es la misma. Se usa el estándar de cifrado avanzado (AES)

37
Q

¿Qué es la encriptación de clave pública (asimétrica)?

A

Usa dos claves diferentes para codificar y decodificar los datos.
Clave pública y privada: Un usuario puede cifrar un mensaje utilizando su clave pública, pero sólo usted puede leerlo. Cuando recibe el mensaje, lo descifra utilizando la clave privada.

38
Q

¿Cuáles son los protocolos de seguridad de datos?

A

Secure Socket Layer (SSL)
Transport Layer Security (TLS)

39
Q

¿Qué es Secure Socket Layer (SSL)?

A

Es un protocolo de desarrollo para enviar inf de forma segura a través de internet al usar un enlace cifrado entre un servidor web y un navegador

40
Q

¿Qué es Transport Layer Security (TLS)?

A

Es una versión mejorada de SSL brinda seguridad entre las aplicaciones cliente y servidor

41
Q

¿Funcionamiento de la encriptación de clave pública?

A

Remitente (laptop) –>clave pública (cifrado) –> clave privada (descifrado) –> destinatario (laptop)

42
Q

¿Qué es el enmascaramiento de datos (data masking)?

A

Es un método que mantiene los datos confidenciales privados. Reemplaza los datos confidenciales por datos ficticios al anonimizarlos.

43
Q

¿Qué es el borrado de datos?

A

Es la destrucción de datos al final de su ciclo de vida. Se utilizan dos métodos: método físico y método en software

44
Q

¿Qué es el blockchain?

A

Utiliza un libro mayor compartido en el proceso de registro de transacciones, lo que permite el comercio y seguimiento de cualquier cosa de valor como derechos de autor.

45
Q

¿Cómo funciona el blockchain?

A

Cuando se produce una transacción, se registra como un bloque de datos, cada bloque forma una cadena de datos, cada bloque adicional refuerza al bloque anterior lo que dificulta la manipulación de la transacción
Bloquear-Libro-Distribución-Transacción-Confirmación-Prueba de trabajo-Recompensa de bloque

46
Q

¿Qué es el Big Data?

A

Describe grandes volúmenes de datos que pueden ser estructurados o no estructurados

47
Q

¿Cuáles son las características del big data?

A
  • Volumen: Grandes volúmenes de datos que se crean diario
  • Velocidad: A la que se generan, recopilan y analizan los datos
    -Variedad: de tipos y formatos de datos
    -Veracidad: Precisión y calidad de los datos que se recopilan
48
Q

¿Cuál es la función del big data?

A

Se procesan los grandes conjuntos de datos para identificar tendencias y patrones a fin de mejorar el servicio al cliente, etc.

49
Q

¿Cómo se recopilan los datos de manera ética?

A

No debe haber una recopilación excesiva de datos y se debe obtener el consentimiento, se debe considerar qué datos se recopilan para evitar conjuntos de datos sesgados

50
Q

Almacenamiento de datos ¿Qué es la privacidad de datos?

A

La capacidad de las personas para controlar su información personal y cómo y en qué medida se comparte con otros

51
Q

¿Qué es la fiabilidad e integridad de datos?

A

Fiabilidad: Datos que son completos y precisos

Integridad: Es la confiabilidad de datos y si han sido comprometidos

52
Q

¿Cuáles son los problemas que conducen a datos poco fiables?

A
  1. Datos sesgados
  2. Virus y malware
  3. Fiabilidad y validez de las fuentes
  4. Datos obsoletos
  5. Error humano y falta de precisión
53
Q

¿Qué son los datos sesgados?

A

Uso de conjuntos de datos sesgados o al sesgo de los humanos al seleccionar los datos

54
Q

¿Qué son el virus y el malware?

A

Son amenazas externas que corrompen la integridad de los datos.
Malware: Es cualquier código de software que daña la computadora o a sus usuarios
Virus: Código malicioso que secuestra el software legítimo para hacer daño.

55
Q

¿Qué es la fiabilidad y validez de las fuentes?

A

Los datos pueden generarse a partir de varias fuentes en línea; si estas fuentes no han sido evaluadas, pueden utilizar datos poco fiables

56
Q

¿Qué son los datos obsoletos?

A

Los datos cambian, si estos no se actualizan se convierte en poco fiables

57
Q

¿Qué es el error humano y la falta de precisión?

A

Cualquier forma de entrada manual de datos es propensa a errores humanos. Los usuarios pueden eliminar accidentalmente archivos, moverlos o incluso olvidar el nombre del archivo y dónde se guardó.

58
Q

¿Cuáles son los riesgos éticos en el uso de datos?

A

Los delincuentes cibernéticos ocultan su identidad, el cyberbullying

59
Q

¿Qué deben hacer las organizaciones en el archivo y almacenamiento de datos?

A

Deben cumplir con las regulaciones locales de protección de datos sobre la retención y seguridad de los datos archivados.

60
Q

¿Cuáles son los tres aspectos clave de la privacidad?

A

Libertad de intrusión
Control de información sobre sí mismo
Libertad de vigilancia

61
Q

¿Qué es GDPR?

A

Reglamento General de Protección de Datos: Legislación diseñada para armonizar las leyes de privacidad de datos en toda la UE

62
Q

¿Cuáles son los 7 principios de GDPR?

A
  • Legalidad, equidad y transparencia
  • Limitación de la finalidad
    -Minimización de datos
  • Precisión: Mantener los datos actualizados y corregirlos.
  • Limitación de almacenamiento
  • Integridad y confidencialidad
  • Rendición de cuentas