Ciência de Dados Flashcards

1
Q

📌 Aprendizado Supervisionado (Supervised Learning)

1️⃣ O que é o Aprendizado Supervisionado?

A

O aprendizado supervisionado é uma técnica de inteligência artificial (IA) e machine learning (ML) na qual um algoritmo aprende a partir de um conjunto de dados rotulado. Ou seja, os exemplos usados para treinamento já possuem a resposta correta associada.

✅ Exemplo: Um modelo de reconhecimento de imagens é treinado com milhares de fotos de cães e gatos, onde cada imagem tem um rótulo (“cachorro” ou “gato”). O algoritmo aprende a identificar os padrões de cada animal e pode classificar novas imagens corretamente.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

📌 Aprendizado Supervisionado (Supervised Learning)

2️⃣ Para que serve o Aprendizado Supervisionado?

A

O aprendizado supervisionado é usado para fazer previsões e classificações com alta precisão em diversos setores, como:

📌 Reconhecimento de padrões – Identificação de rostos, objetos ou caracteres (OCR).
📌 Diagnósticos médicos – Classificação de doenças com base em exames.
📌 Detecção de fraudes – Identificação de transações suspeitas em bancos.
📌 Previsão de vendas e preços – Modelos que analisam tendências de mercado.

✅ Exemplo: Um banco usa aprendizado supervisionado para detectar fraudes em cartões de crédito. O modelo é treinado com milhões de transações, onde algumas são rotuladas como “fraude” e outras como “legítima”.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

📌 Aprendizado Supervisionado (Supervised Learning)

3️⃣ Como funciona o Aprendizado Supervisionado?

A

O aprendizado supervisionado segue três etapas principais:

1️⃣ Treinamento:
🔹 O modelo recebe um conjunto de dados rotulado (entrada + saída esperada).
🔹 Ele aprende a identificar padrões que relacionam as entradas com as saídas corretas.

2️⃣ Validação:
🔹 O modelo é testado com novos dados para ajustar os parâmetros e evitar erros.

3️⃣ Predição:
🔹 Depois de treinado, o modelo pode classificar ou prever novos dados com base no que aprendeu.

Principais Algoritmos Usados:
✅ Regressão Linear – Previsão de valores contínuos (exemplo: preço de casas).
✅ Árvores de Decisão – Classificação baseada em regras hierárquicas.
✅ Redes Neurais – Modelos inspirados no cérebro humano para reconhecer padrões complexos.

✅ Exemplo Prático:
Uma loja online quer prever quais clientes irão comprar um novo produto. Ela usa dados de compras anteriores (idade, histórico de compras, renda) para treinar um modelo de aprendizado supervisionado, que pode indicar a probabilidade de um novo cliente fazer uma compra.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

📌 Aprendizado Não-Supervisionado (Unsupervised Learning)

1️⃣ O que é o Aprendizado Não-Supervisionado?

A

O aprendizado não-supervisionado é um tipo de inteligência artificial (IA) e machine learning (ML) em que o algoritmo aprende sozinho sem receber respostas corretas ou rótulos nos dados. Ele analisa grandes quantidades de informações e encontra padrões ocultos, grupos e relações sem intervenção humana.

✅ Exemplo: Um algoritmo recebe milhares de fotos de animais sem saber quais são cachorros, gatos ou cavalos. Ele identifica padrões visuais semelhantes e agrupa imagens parecidas, mesmo sem saber seus nomes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

📌 Aprendizado Não-Supervisionado (Unsupervised Learning)

2️⃣ Para que serve o Aprendizado Não-Supervisionado?

A

Ele é usado para encontrar estruturas ocultas em dados complexos, ajudando em tarefas como:

📌 Segmentação de clientes – Empresas agrupam consumidores com base em comportamento e preferências.
📌 Detecção de anomalias – Bancos e seguradoras identificam atividades fraudulentas analisando padrões incomuns.
📌 Agrupamento de documentos e textos – Motores de busca organizam artigos e notícias automaticamente.
📌 Compressão de dados – Algoritmos como PCA reduzem a quantidade de variáveis sem perder informação.

✅ Exemplo: Um site de streaming usa aprendizado não-supervisionado para sugerir filmes, analisando padrões de visualização e agrupando usuários com gostos semelhantes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

📌 Aprendizado Não-Supervisionado (Unsupervised Learning)

3️⃣ Como funciona o Aprendizado Não-Supervisionado?

A

Diferente do aprendizado supervisionado, que usa dados rotulados, o aprendizado não-supervisionado trabalha com dados sem rótulos e busca organizar as informações por conta própria. Ele usa dois métodos principais:

1️⃣ Agrupamento (Clustering):
📌 O algoritmo identifica grupos naturais dentro dos dados.
📌 Não há respostas pré-definidas, apenas padrões de semelhança.
✅ Exemplo: Um banco usa clustering para separar clientes em grupos de “alto risco” e “baixo risco”, analisando histórico financeiro.

2️⃣ Redução de Dimensionalidade:
📌 O algoritmo remove variáveis desnecessárias para tornar os dados mais simples e eficientes.
📌 Técnicas como PCA (Principal Component Analysis) reduzem o número de colunas em um conjunto de dados sem perder informações essenciais.
✅ Exemplo: No processamento de imagens médicas, PCA reduz a complexidade dos dados para facilitar diagnósticos rápidos.

Principais Algoritmos Usados:
✅ K-Means – Divide dados em grupos com base na similaridade.
✅ DBSCAN – Detecta padrões e ruídos em grandes volumes de dados.
✅ Autoencoders – Usados em redes neurais para aprendizado profundo (Deep Learning).

✅ Exemplo Prático:
Uma empresa quer segmentar clientes para campanhas de marketing. O modelo analisa hábitos de compra, faixa etária e preferências e os agrupa em perfis de consumidores sem precisar de rótulos pré-definidos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

📌 Redes Neurais Artificiais (Artificial Neural Networks - ANN)

1️⃣ O que são Redes Neurais Artificiais?

A

As Redes Neurais Artificiais (RNA) são modelos computacionais inspirados no funcionamento do cérebro humano. Elas são compostas por unidades chamadas neurônios artificiais, que trabalham em conjunto para processar informações e aprender padrões complexos a partir de dados.

✅ Exemplo: Assim como o cérebro humano aprende a reconhecer rostos observando características repetidas, uma rede neural pode aprender a identificar objetos em imagens analisando milhares de exemplos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

📌 Redes Neurais Artificiais (Artificial Neural Networks - ANN)

2️⃣ Para que servem as Redes Neurais Artificiais?

A

As RNAs são utilizadas em aprendizado de máquina (Machine Learning) e inteligência artificial (IA) para resolver problemas complexos, como:

📌 Reconhecimento de imagens – Detectar rostos, placas de trânsito, células cancerígenas em exames médicos.
📌 Processamento de linguagem natural (NLP) – Tradução automática, chatbots e reconhecimento de voz.
📌 Previsões financeiras – Análise de tendências e investimentos na bolsa de valores.
📌 Veículos autônomos – Processamento de sensores para tomada de decisões automáticas.

✅ Exemplo: O Google Tradutor usa redes neurais para entender e traduzir frases de um idioma para outro com alta precisão.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

📌 Redes Neurais Artificiais (Artificial Neural Networks - ANN)

3️⃣ Como funcionam as Redes Neurais Artificiais?

A

As RNAs são formadas por camadas de neurônios artificiais, que recebem informações, processam e geram saídas. Elas aprendem ajustando pesos das conexões entre os neurônios.

Arquitetura Básica de uma Rede Neural:
🔹 Camada de Entrada (Input Layer) – Recebe os dados brutos (imagens, textos, números, etc.).
🔹 Camadas Ocultas (Hidden Layers) – Processam e extraem padrões dos dados por meio de cálculos matemáticos.
🔹 Camada de Saída (Output Layer) – Gera a resposta final (por exemplo, classificar uma imagem como “gato” ou “cachorro”).

Etapas do Funcionamento:
1️⃣ Treinamento: A rede recebe dados de entrada e ajusta os pesos das conexões neurais para minimizar erros.
2️⃣ Ativação dos neurônios: Cada neurônio soma as entradas e aplica uma função de ativação para decidir se transmite a informação adiante.
3️⃣ Ajuste por erro (Backpropagation): Se o modelo errar, ele ajusta os pesos para melhorar a precisão.

✅ Exemplo Prático:
Uma rede neural treinada para reconhecer escrita manual recebe imagens de letras e aprende a identificar padrões de cada caractere. Com o tempo, consegue reconhecer qualquer letra escrita à mão com alta precisão.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

IA Generativa

1️⃣ O que é a IA Generativa?

A

A IA Generativa é um tipo de inteligência artificial que aprende padrões a partir de grandes volumes de dados e, em vez de apenas classificar ou analisar informações, ela gera novos conteúdos com base nesse aprendizado.

Ela é baseada em redes neurais profundas, como Modelos Generativos Adversariais (GANs) e Transformers, que permitem criar outputs altamente realistas.

✅ Exemplo: O ChatGPT é um modelo de IA Generativa que pode responder perguntas, escrever artigos e criar histórias baseando-se no que aprendeu com milhões de textos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

IA Generativa

2️⃣ Para que serve a IA Generativa?

A

A IA Generativa tem aplicações amplas e está revolucionando diversos setores:

📌 Produção de Conteúdo – Criação automática de textos, roteiros, artigos e postagens para redes sociais.
📌 Geração de Imagens e Vídeos – Ferramentas como DALL·E e MidJourney criam artes digitais a partir de descrições textuais.
📌 Assistência em Programação – Modelos como GitHub Copilot geram códigos automaticamente para desenvolvedores.
📌 Simulação e Treinamento – IA Generativa é usada para criar ambientes virtuais em jogos e treinar sistemas autônomos.
📌 Personalização e Automação – Empresas utilizam IA para criar experiências personalizadas em e-commerce, recomendando produtos e serviços de forma mais inteligente.

✅ Exemplo: Uma empresa de marketing usa IA Generativa para criar anúncios personalizados em larga escala, ajustando textos e imagens para diferentes públicos-alvo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

IA Generativa

3️⃣ Como funciona a IA Generativa?

A

A IA Generativa funciona por meio de redes neurais profundas que aprendem padrões a partir de um grande conjunto de dados. O processo pode ser dividido em três etapas principais:

1️⃣ Treinamento com Grandes Conjuntos de Dados
🔹 O modelo de IA é alimentado com bilhões de exemplos (textos, imagens, códigos, músicas, etc.).
🔹 Durante essa fase, ele aprende padrões, estilos e estruturas linguísticas.

2️⃣ Aprendizado e Ajuste por Machine Learning
🔹 O modelo passa por refinamentos usando técnicas como aprendizado supervisionado e autoaprendizado.
🔹 Ele ajusta pesos neurais para melhorar a precisão na geração de novos conteúdos.

3️⃣ Geração de Conteúdo Baseado em Entrada do Usuário
🔹 Quando um usuário faz um pedido (prompt), a IA cria uma resposta ou um conteúdo novo baseado no que aprendeu.
🔹 Técnicas como Transformers e GANs permitem que os resultados sejam coerentes e inovadores.

✅ Exemplo Prático:
Se um designer gráfico quer criar um logotipo para uma nova empresa, ele pode fornecer descrições à IA Generativa, que cria várias versões automaticamente. Isso economiza tempo e aumenta a criatividade.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

📌 Processamento de Linguagem Natural (PLN - NLP, em inglês)

1️⃣ O que é o Processamento de Linguagem Natural (PLN)?

A

O PLN é um campo da inteligência artificial que combina linguística computacional e aprendizado de máquina para permitir que computadores entendam e processem textos e falas humanos de maneira eficiente.

Ele permite que os computadores interpretem significados, identifiquem emoções e até gerem respostas automáticas, tornando a comunicação entre humanos e máquinas mais natural.

✅ Exemplo: O Google Tradutor usa PLN para traduzir textos de um idioma para outro, analisando a estrutura da frase para produzir uma tradução coerente.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

📌 Processamento de Linguagem Natural (PLN - NLP, em inglês)

2️⃣ Para que serve o Processamento de Linguagem Natural?

A

O PLN tem aplicações em diversos setores, trazendo eficiência, automação e melhoria na comunicação entre humanos e máquinas. Ele é utilizado para:

📌 Assistentes virtuais e chatbots – Siri, Alexa e Google Assistente usam PLN para entender comandos de voz e responder perguntas.
📌 Análise de sentimentos – Empresas analisam comentários em redes sociais para identificar opiniões sobre seus produtos.
📌 Tradução automática – Ferramentas como DeepL e Google Tradutor convertem textos para diferentes idiomas.
📌 Reconhecimento de fala – Tecnologias como o speech-to-text transcrevem falas em tempo real (usado em legendas automáticas).
📌 Resumos automáticos – Algoritmos extraem as partes mais importantes de um texto, facilitando a leitura rápida de notícias e documentos.

✅ Exemplo: Um banco usa PLN para automatizar o atendimento ao cliente, permitindo que um chatbot resolva dúvidas sem a necessidade de intervenção humana.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

📌 Processamento de Linguagem Natural (PLN - NLP, em inglês)

3️⃣ Como funciona o Processamento de Linguagem Natural?

A

O PLN funciona através de diversas técnicas de inteligência artificial e aprendizado de máquina. Ele transforma texto ou fala em dados estruturados que o computador pode processar.

Etapas do PLN:
1️⃣ Tokenização: O texto é dividido em palavras ou frases menores (tokens) para análise.
2️⃣ Lematização e Stemização: Redução das palavras à sua forma base para evitar variações (exemplo: “correndo” → “correr”).
3️⃣ Análise Sintática: O algoritmo analisa a estrutura da frase para entender sua gramática e significado.
4️⃣ Reconhecimento de Entidades: Identificação de nomes, locais, datas e outros elementos importantes no texto.
5️⃣ Modelos de Aprendizado de Máquina: Uso de Redes Neurais e Transformers para prever e gerar linguagem natural.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

📌 Processamento de Linguagem Natural (PLN - NLP, em inglês)

Técnicas avançadas de PLN:

A

✅ Modelos Transformers: Como GPT (ChatGPT) e BERT, que conseguem gerar textos coerentes e responder perguntas complexas.
✅ Word Embeddings: Representação vetorial de palavras para capturar semântica e contexto.
✅ Redes Neurais Recorrentes (RNN) e LSTMs: Modelos que lidam com sequências de palavras para prever significados.

✅ Exemplo Prático:
O Gmail usa PLN para sugerir respostas automáticas com base no contexto do e-mail recebido. Se alguém perguntar “Podemos marcar uma reunião amanhã?”, o sistema pode sugerir respostas como “Sim, estou disponível” ou “Que horas?”.

17
Q

Big Data

1️⃣ O que é Big Data?

A

Big Data é o conjunto massivo de dados estruturados e não estruturados, gerados em alta velocidade e grande variedade, que exigem técnicas avançadas de processamento e análise para extração de valor.

✅ Exemplo: O Google processa trilhões de buscas por dia, coletando dados sobre tendências, preferências e comportamento dos usuários.

18
Q

Big Data

2️⃣ Para que serve o Big Data?

A

Big Data serve para tomada de decisões estratégicas e análises avançadas, transformando grandes volumes de dados em insights valiosos. Ele é usado para:

📌 Prever tendências de mercado – Empresas analisam dados de compra para ajustar estoques e prever demanda.
📌 Personalização e recomendações – Netflix sugere filmes com base no histórico do usuário.
📌 Detecção de fraudes – Bancos usam Big Data para identificar transações suspeitas em tempo real.
📌 Análises médicas e genômicas – Hospitais processam milhões de exames para prever doenças.
📌 Monitoramento de redes sociais – Empresas analisam sentimentos do público sobre suas marcas.

✅ Exemplo: O Spotify usa Big Data para analisar milhões de músicas e criar playlists personalizadas para cada usuário.

19
Q

Big Data

3️⃣ Como funciona o Big Data?

A

O Big Data segue os 5 Vs:

1️⃣ Volume: Gigantesca quantidade de dados coletados diariamente.
2️⃣ Velocidade: Processamento em tempo real ou quase instantâneo.
3️⃣ Variedade: Dados de diversas fontes (textos, imagens, vídeos, sensores).
4️⃣ Veracidade: Filtragem de dados para garantir confiabilidade.
5️⃣ Valor: Transformação dos dados brutos em insights estratégicos.

Processo de Funcionamento:
🔹 Coleta: Dados vêm de redes sociais, sensores, dispositivos IoT, sites, etc.
🔹 Armazenamento: Uso de tecnologias como Hadoop, Data Lakes e bancos NoSQL.
🔹 Processamento: Algoritmos de Machine Learning e IA analisam os dados.
🔹 Visualização: Dashboards e relatórios ajudam na tomada de decisão.

✅ Exemplo Prático:
Um supermercado usa Big Data para prever a demanda de produtos. Ao analisar milhões de compras e dados climáticos, a IA sugere aumentar o estoque de sorvetes durante uma onda de calor.

20
Q

Visão Computacional

1️⃣ O que é Visão Computacional?

A

A Visão Computacional é um campo da Inteligência Artificial (IA) que permite que máquinas analisem, interpretem e compreendam imagens e vídeos, imitando a capacidade humana de enxergar e processar informações visuais.

Ela combina técnicas de Machine Learning (ML), redes neurais e processamento de imagens para identificar padrões e objetos automaticamente.

✅ Exemplo: O sistema de reconhecimento facial do seu celular usa visão computacional para desbloquear a tela ao identificar seu rosto.

21
Q

Visão Computacional

2️⃣ Para que serve a Visão Computacional?

A

A visão computacional tem inúmeras aplicações em diferentes setores:

📌 Reconhecimento facial – Usado para segurança em smartphones e controle de acessos.
📌 Veículos autônomos – Carros autônomos da Tesla usam câmeras e IA para identificar obstáculos e sinais de trânsito.
📌 Saúde e medicina – Algoritmos analisam exames de imagem (raios-X, tomografias) para detectar doenças.
📌 Indústria e automação – Câmeras monitoram linhas de produção para identificar defeitos em produtos.
📌 Monitoramento e segurança – Sistemas de vigilância inteligente detectam atividades suspeitas em tempo real.

✅ Exemplo: Em aeroportos, a visão computacional é usada para reconhecimento facial na imigração, agilizando o processo de embarque.

22
Q

Visão Computacional

3️⃣ Como funciona a Visão Computacional?

A

A visão computacional segue um fluxo de captura, processamento e interpretação de imagens, utilizando técnicas avançadas de IA e aprendizado profundo (Deep Learning).

Etapas do Funcionamento:
1️⃣ Aquisição da Imagem:
🔹 A câmera ou sensor captura a imagem ou vídeo.

2️⃣ Pré-processamento:
🔹 Ajuste de brilho, contraste, remoção de ruídos e normalização dos dados.

3️⃣ Extração de Características:
🔹 O sistema identifica bordas, formas, cores e padrões na imagem.

4️⃣ Classificação e Decisão:
🔹 Redes neurais analisam a imagem e classificam objetos ou padrões.

Principais Tecnologias Utilizadas:
✅ Redes Neurais Convolucionais (CNNs) – Modelos especializados para processar imagens.
✅ YOLO (You Only Look Once) – Algoritmo para detecção de objetos em tempo real.
✅ OpenCV – Biblioteca de código aberto para processamento de imagens.

✅ Exemplo Prático:
Os carros autônomos utilizam câmeras e sensores para reconhecer pedestres, sinais de trânsito e outros veículos. A visão computacional processa essas informações e envia comandos para o carro frear ou acelerar automaticamente.

23
Q

Deep Learning – O Cérebro Artificial das Máquinas

1️⃣ O que é Deep Learning?

A

O Deep Learning (Aprendizado Profundo) é uma subárea da Inteligência Artificial (IA) que utiliza redes neurais profundas para processar grandes volumes de dados e aprender padrões complexos automaticamente.

Diferente dos métodos tradicionais de Machine Learning, o Deep Learning aprende sozinho sem necessidade de intervenção humana para extrair características dos dados.

✅ Exemplo: O ChatGPT usa Deep Learning para entender perguntas e gerar respostas coerentes, aprendendo com bilhões de textos.

24
Q

Deep Learning – O Cérebro Artificial das Máquinas

2️⃣ Para que serve o Deep Learning?

A

O Deep Learning é utilizado em tarefas que exigem grande capacidade de reconhecimento de padrões e tomada de decisões automatizadas, como:

📌 Visão Computacional – Identificação de rostos, placas de trânsito e objetos em imagens.
📌 Processamento de Linguagem Natural (PLN) – Compreensão de textos, chatbots e traduções automáticas.
📌 Carros Autônomos – Interpretação de sensores e câmeras para navegação sem motorista.
📌 Detecção de Fraudes – Bancos usam Deep Learning para identificar transações suspeitas em tempo real.
📌 Saúde e Diagnósticos – Algoritmos analisam exames médicos para detectar doenças com alta precisão.

✅ Exemplo: O Google Fotos usa Deep Learning para identificar e classificar automaticamente imagens de pessoas, locais e objetos.

25
Deep Learning – O Cérebro Artificial das Máquinas 3️⃣ Como funciona o Deep Learning?
O Deep Learning funciona através de Redes Neurais Artificiais Profundas, compostas por várias camadas de neurônios artificiais que processam os dados em etapas. Principais Componentes: 🔹 Camada de Entrada: Recebe os dados brutos (imagens, textos, áudio). 🔹 Camadas Ocultas: Processam e aprendem padrões automaticamente. 🔹 Camada de Saída: Gera a resposta final (exemplo: identificar um rosto ou prever um resultado). Processo de Funcionamento: 1️⃣ Treinamento com Big Data: 📌 A rede neural recebe milhões de exemplos para aprender padrões. 2️⃣ Ajuste de Pesos (Backpropagation): 📌 O algoritmo ajusta os pesos das conexões neurais para reduzir erros. 3️⃣ Predição e Tomada de Decisão: 📌 Após treinado, o modelo pode reconhecer padrões novos e tomar decisões automaticamente. Principais Algoritmos de Deep Learning: ✅ Redes Neurais Convolucionais (CNNs): Usadas para reconhecimento de imagens. ✅ Redes Neurais Recorrentes (RNNs): Ideais para análise de textos e áudio. ✅ Transformers: Modelos avançados para PLN (exemplo: ChatGPT, Google Bard). ✅ Exemplo Prático: O Tesla Autopilot usa Deep Learning para interpretar câmeras e sensores, identificando pedestres, placas e semáforos para tomar decisões de direção.
26
Mineração de Dados (Data Mining) – Extraindo Valor dos Dados 1️⃣ O que é Mineração de Dados?
A Mineração de Dados é o processo de explorar grandes volumes de dados para identificar padrões, relações e tendências ocultas. Ela combina técnicas de inteligência artificial (IA), estatística e aprendizado de máquina para transformar dados brutos em informações valiosas. ✅ Exemplo: Um e-commerce analisa os hábitos de compra dos clientes e descobre que quem compra notebooks também compra mochilas para laptop. Essa informação pode ser usada para estratégias de marketing.
27
Mineração de Dados (Data Mining) – Extraindo Valor dos Dados 2️⃣ Para que serve a Mineração de Dados?
A mineração de dados é usada para: 📌 Prever tendências de mercado – Empresas analisam padrões de compra para antecipar demandas. 📌 Segmentação de clientes – Bancos e varejistas identificam perfis de consumidores e criam campanhas personalizadas. 📌 Detecção de fraudes – Instituições financeiras analisam transações para encontrar atividades suspeitas. 📌 Recomendações personalizadas – Plataformas como Netflix e Spotify sugerem conteúdos com base no histórico do usuário. 📌 Análise médica – Hospitais identificam fatores de risco para doenças analisando milhões de prontuários. ✅ Exemplo: O Facebook analisa interações e sugere amigos ou conteúdos com base nos padrões de conexão dos usuários.
28
Mineração de Dados (Data Mining) – Extraindo Valor dos Dados 3️⃣ Como funciona a Mineração de Dados?
O processo de mineração de dados segue 5 etapas principais: 1️⃣ Coleta de Dados: 🔹 Os dados são extraídos de diversas fontes: bancos de dados, redes sociais, sensores IoT, logs de sites, etc. 2️⃣ Pré-processamento e Limpeza: 🔹 Removem-se dados duplicados, inconsistentes ou irrelevantes para melhorar a qualidade da análise. 3️⃣ Aplicação de Algoritmos de Mineração: 🔹 Técnicas como aprendizado de máquina e estatística são aplicadas para encontrar padrões. 4️⃣ Identificação de Padrões e Tendências: 🔹 Modelos identificam regras ocultas nos dados, como correlações e anomalias. 5️⃣ Interpretação e Tomada de Decisão: 🔹 As descobertas são transformadas em insights estratégicos para empresas e organizações. ✅ Exemplo Prático: Supermercados utilizam mineração de dados para analisar quais produtos são comprados juntos. Descobre-se que fraldas e cervejas são frequentemente compradas no mesmo dia por pais de bebês. Como estratégia, colocam esses produtos próximos para aumentar as vendas. Principais Técnicas de Mineração de Dados ✅ Classificação: Identifica categorias nos dados (exemplo: clientes de alto e baixo risco em bancos). ✅ Agrupamento (Clustering): Separa os dados em grupos similares (exemplo: segmentação de clientes). ✅ Regras de Associação: Descobre padrões de compra e hábitos de consumo. ✅ Detecção de Anomalias: Encontra comportamentos incomuns, como fraudes financeiras.