Mineração de Dados Flashcards
O minerador de dados examina _____ __ _____ em busca de _____ __________ para uma organização.
O minerador de dados examina bases de dados em busca de dados relevantes para uma organização.
Mineração de dados também é chamado de:
Data Mining e Prospecção de Dados.
A mineração de dados trata-se processo de explorar _______ ___________ de dados à procura de ________ ____________.
A mineração de dados trata-se processo de explorar grande quantidade de dados à procura de padrões consistentes.
PARA FIXAR
Uma história real sobre mineração de dados
Uma empresa britânica supostamente especializada em consultoria política conseguiu obter de forma ilegal dados sobre mais de oitenta milhões de usuários do Facebook sem seus consentimentos.
Esses dados foram utilizados em vários países para verificar o perfil desses eleitores e influenciar suas opiniões no intuito de ajudar políticos a vencerem eleições. Por meio de consultas às páginas curtidas, data de nascimento, cidade, sexo, etc, uma aplicação de mineração de dados conseguiu traçar perfis psicológicos dessas pessoas e criar campanhas ou propagandas direcionadas de forma mais eficaz para influenciar em suas convicções políticas. Zuckerberg teve que ir ao Congresso dos EUA para esclarecer como o Facebook reagiu ao vazamento de dados de 87 milhões de pessoas pela consultoria política Cambridge Analytica e como a empresa trabalha para proteger os dados de seus usuários.
Há suspeitas de que a empresa britânica teria sido utilizada para ajudar Donald Trump a vencer as eleições presidenciais norte-americanas de 2016.
PARA FIXAR
A mineração de dados possibilita, por exemplo,
que companhias aéreas prevejam quem perderá um voo; é capaz de informar a grandes lojas de departamento quem possivelmente está grávida; ajuda médicos a identificarem infecções fatai ; e impressionantemente podem ser utilizadas até para prever - por meio de dados celulares - possíveis massacres em diversos países.
Mineração de dados nada mais é do que a aplicação de técnicas ____________ capazes de pesquisar uma quantidade _______ de dados em busca de ________ impossíveis de serem detectados por _____ _______.
Mineração de dados nada mais é do que a aplicação de técnicas estatísticas capazes de pesquisar uma quantidade gigante de dados em busca de padrões impossíveis de serem detectados por seres humanos.
CERTO OU ERRADO;
Os padrões encontrados em uma mineração de dados não são baseados na intuição humana.
CERTO! São baseados no que os dados sugerem.
PARA FIXAR
Os cientistas de dados do Spotify podem estar interessados em descobrir o perfil de pessoas que curtem rock medieval e sugerir músicas de gêneros similares. Poderia ser analisando padrões de gravadoras, reviews publicados na Internet, parcerias entre músicos, idade, localização e grupo de amigos do ouvinte, entre outros fragmentos de informação sobre cada usuário.
Muitas vezes encontrará um padrão específico.
PARA FIXAR
Encontrando os padrões dentro de uma mineração de dados, em muitos casos você encontrará correlações que são acidentais e em outros casos você encontrará correlações, mas não conseguirá explicá-las
Ex de correlações: Spotfy sugerir um gênero parecido com o que o ouvinte escuta ou sugerir um rapper com o mesmo estilo do preferido.
Ex onde não há correlações: Uma rede varejista, por exemplo, descobriu que a venda de colírios aumentava na véspera de feriados.
Uma das 16 definições de Data Mining:
Data Mining é uso de _______, _______, _________ e ___________ para organizar uma grande quantidade de dados ______ para identificar padrões de comportamentos em determinados ________.
Uma das 16 definições de Data Mining:
Data Mining é uso de teorias, métodos, processos e tecnologias para organizar uma grande quantidade de dados brutos para identificar padrões de comportamentos em determinados públicos.
Palavras-chave: teorias; métodos; processos; tecnologias; organizar dados brutos; padrões de comportamentos
Uma das 16 definições de Data Mining:
Data Mining é o processo de explorar grande quantidade de dados para extração ___-_______ de informação _________ desconhecida.
Uma das 16 definições de Data Mining:
Data Mining é o processo de explorar grande quantidade de dados para extração não-trivial de informação implícita desconhecida.
Palavras-chave: exploração; informação implícita desconhecida.
Uma das 16 definições de Data Mining:
Data Mining é a categoria de ___________ de análise denominada ____-___ e que permite ao usuário avaliar tendências e padrões ___ __________ entre os dados.
Uma das 16 definições de Data Mining:
Data Mining é a categoria de ferramentas de análise denominada open-end e que permite ao usuário avaliar tendências e padrões não conhecidos entre os dados.
Palavras-chave: ferramenta de análise; open-end; tendências e padrões.
Uma das 16 definições de Data Mining:
Data Mining é o processo de descoberta de novas ___________, ________ e __________ entre as informações de uma empresa, por meio da análise de grandes quantidades de dados armazenados em bancos de dados usando técnicas de reconhecimento de _______, ____________ e ___________.
Uma das 16 definições de Data Mining:
Data Mining é o processo de descoberta de novas correlações, padrões e tendência entre as informações de uma empresa, por meio da análise de grandes quantidades de dados armazenados em bancos de dados usando técnicas de reconhecimento de padrões, estatísticas e matemáticas.
Palavras-chave: descoberta; correlações; padrões; tendências; reconhecimento de padrões; estatística; matemática.
Uma das 16 definições de Data Mining:
Data Mining constitui em uma técnica para a exploração e análise de dados, visando descobrir _______ e ______, a princípio _______, importantes à aplicação.
Uma das 16 definições de Data Mining:
Data Mining constitui em uma técnica para a exploração e análise de dados, visando descobrir padrões e regras, a princípio ocultos, importantes à aplicação.
Palavras-chave: exploração e análise de dados; padrões; regras; ocultos.
Uma das 16 definições de Data Mining:
Data Mining é o conjunto de ferramentas que permitem ao usuário avaliar __________ e ________ ___ __________ entre os dados. Esses tipos de ferramentas podem utilizar técnicas avançadas de computação como redes _______, _________ _________ e ______ ________ (_____), dentre outras.
Data Mining é o conjunto de ferramentas que permitem ao usuário avaliar tendências e padrões não conhecidos entre os dados. Esses tipos de ferramentas podem utilizar técnicas avançadas de computação como redes neurais, algoritmos genéticos e lógica nebulosa (_____), dentre outras.
Palavras-chave: tendências; padrões; redes neurais; algoritmos genéticos; lógica nebulosa.
Uma das 16 definições de Data Mining:
Data Mining é o conjunto de ___________ e ________ de mineração de dados que têm por objetivo buscar a ______________ e o ____________ (_____________) de dados, bem como identificar _______.
Uma das 16 definições de Data Mining:
Data Mining é o conjunto de ferramentas e técnicas de mineração de dados que têm por objetivo buscar a classificação e o agrupamento (clusterização) de dados, bem como identificar padrões.
Palavras-chave: classificação; agrupamento; clusterização; padrões
Uma das 16 definições de Data Mining:
Data Mining é o processo de explorar grandes quantidades de dados à procura de padrões consistentes com o intuito de detectar relacionamentos sistemáticos entre _________ e novos ____________ de dados.
Uma das 16 definições de Data Mining:
Data Mining é o processo de explorar grandes quantidades de dados à procura de padrões consistentes com o intuito de detectar relacionamentos sistemáticos entre variáveis e novos subconjuntos de dados.
Palavras-chave: padrões; relacionamentos
Uma das 16 definições de Data Mining:
Data Mining consiste em explorar um conjunto de dados visando a extrair ou a ajudar a evidenciar _______, como regras de ___________ ou sequências _________, para detectar _______________ entre estes.
Uma das 16 definições de Data Mining:
Data Mining consiste em explorar um conjunto de dados visando a extrair ou a ajudar a evidenciar padrões, como regras de associação ou sequências temporais, para detectar relacionamentos entre estes.
Palavras-chave: exploração; padrões; regras; associação; sequência temporal; detecção
Uma das 16 definições de Data Mining:
Data Mining são ferramentas que utilizam diversas técnicas de natureza ___________, como a análise de _____________ (_______ ________), que tem como objetivo agrupar, em diferentes conjuntos de dados, os elementos identificados como _____________ entre si, com base nas _______________ analisadas.
Uma das 16 definições de Data Mining:
Data Mining são ferramentas que utilizam diversas técnicas de natureza estatística, como a análise de conglomerados (cluster analysis), que tem como objetivo agrupar, em diferentes conjuntos de dados, os elementos identificados como semelhantes entre si, com base nas características analisadas.
Palavras-chave: estatística; análise de conglomerados; agrupamento
Uma das 16 definições de Data Mining:
Data Mining é o conjunto de técnicas que, envolvendo métodos ___________ e ____________, __________ e princípios de ____________ __________, tem o objetivo de descobrir _______________ ______________ entre dados armazenados em repositórios de grandes volumes e concluir sobre _______ __ _____________ de clientes de uma organização.
Uma das 16 definições de Data Mining:
Data Mining é o conjunto de técnicas que, envolvendo métodos matemáticos e estatísticos, algoritmos e princípios de inteligência artificial, tem o objetivo de descobrir relacionamentos significativos entre dados armazenados em repositórios de grandes volumes e concluir sobre padrões de comportamento de clientes de uma organização.
Palavras-chave: métodos matemáticos e estatístico; inteligência artificial; relacionamentos; padrões; comportamentos
Uma das 16 definições de Data Mining:
Data Mining é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de __________ ou sequências _________, para detectar ________________ ____________ entre variáveis, detectando assim novos ____________ de dados.
Uma das 16 definições de Data Mining:
Data Mining é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos significativos entre variáveis, detectando assim novos subconjuntos de dados.
Palavras-chave: métodos matemáticos e estatístico; inteligência artificial; relacionamentos; padrões; comportamentos.
Uma das 16 definições de Data Mining:
Data Mining é o processo de identificar, em dados, padrões _______, _____, potencialmente _____ e, ao final, ______________.
Uma das 16 definições de Data Mining:
Data Mining é o processo de identificar, em dados, padrões válidos, novos, potencialmente úteis e, ao final, compreensíveis.
Palavras-chave: padrões; utilidade
Uma das 16 definições de Data Mining:
Data Mining é um método _____________ que permite extrair informações a partir de ______ __________ de dados.
Uma das 16 definições de Data Mining:
Data Mining é um método computacional que permite extrair informações a partir de grande quantidade de dados.
Uma das 16 definições de Data Mining:
Data Mining é o processo de explorar grandes quantidades de dados à procura de _______ ____________, como regras de ___________ ou sequências _________.
Uma das 16 definições de Data Mining:
Data Mining é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais.
Uma das 16 definições de Data Mining:
Data Mining é o processo de analisar de maneira ____-__________ grandes bancos de dados para encontrar _______ _____.
Uma das 16 definições de Data Mining:
Data Mining é o processo de analisar de maneira semi-automática grandes bancos de dados para encontrar padrões úteis.
Palavras-chave: padrões
ATENÇÃO: Sobre esse ponto, há uma polêmica: alguns examinadores consideram que é de forma automática e outros consideram que é de forma semiautomática. Por vezes, examinadores de uma mesma banca possuem entendimentos diferentes. Levar para a prova que pode ser automática ou semiautomática e – caso essa questão venha a ser cobrada – já se preparar para possíveis recursos.
RESUMO DE DATA MINING DE ACORDO COM AS 16 DEFINIÇÕES QUE JÁ CAÍRAM EM PROVA
Data Mining – Mineração de Dados – é um conjunto de processos, métodos, teorias, ferramentas e tecnologias open-end utilizadas para explorar, organizar e analisar de forma automática ou semi-automática2uma grande quantidade de dados brutos com o intuito de identificar, descobrir, extrair, classificar e agrupar informações implícitas desconhecidas, além de avaliar correlações, tendências e padrões consistentes de comportamento potencialmente úteis – como regras de associação ou sequências temporais – de forma não-trivial por meio de técnicas estatísticas e matemáticas, como redes neurais, algoritmos genéticos, inteligência artificial, lógica nebulosa, análise de conglomerados (clusters), entre outros.
CERTO OU ERRADO:
A utilização é obrigatoriamente utilizada em conjunto com Data Warehouses.
ERRADO! Em regra, é usada com Data Warehouses mas NÃO É OBRIGATÓRIO. Pode ser usado com bando de dados relacionais.
Para dar conta da imensa quantidade de dados a serem analisados, a mineração de dados necessita, por vezes, utilizar processamento:
paralelo.
As ferramentas de mineração geralmente utilizam uma arquitetura:
- cliente/servidor (mais comum)
- arquitetura web.
CERTO OU ERRADO:
Não é necessário ser um grande analista de dados para utilizar essas ferramentas de mineração
CERTO! Usuários podem fazer pesquisas sem necessariamente saber detalhes da tecnologia ou de programação.
A mineração de dados pode ser aplicada a uma grande variedade de contextos de tomada de decisão de negócios a fim de obter:
vantagens competitivas estratégicas.
A mineração de dados pode ser aplicada a uma grande variedade de contextos de tomada de decisão de negócios a fim de obter vantagens
competitivas estratégicas. Em particular, é recomendado a algumas áreas de ganhos significativos, como:
Marketing, Finanças, Manufatura e Saúde.
Há dois diferentes tipos de mineração de dados:
(1) diagnóstica: utilizada para entender os dados e/ou encontrar causas de problemas;
(2) preditiva: utilizada para antecipar comportamentos futuros;
ATENÇÃO
As provas vão insistir em afirmar que a mineração de dados só pode ocorrer em bancos de dados muito grades como Data Warehouses, mas isso é falso – apesar de comum, não é obrigatório;
É possível possível realizar a mineração de dados de bases de dados não estruturadas?
SIM!!!
CERTO OU ERRADO:
No ambiente organizacional, devido à grande quantidade de dados, não é recomendado o emprego de data mining para atividades ligadas a marketing.
ERRADO! É recomendável.
A Mineração de Dados faz parte de um processo muito maior de descoberta de conhecimento chamada:
KDD (Knowledge Discovery in Databases – Descoberta de Conhecimento em Bancos de Dados).O
O que significa a sigla KDD?
Knowledge Discovery in Databases ou Descoberta de Conhecimento em Bancos de Dados.
O processo de descoberta de conhecimento de banco de dados (KDD) compreende cinco fases:
(1) Seleção;
(2) Pré-processamento;
(3) Transformação;
(4) Data Mining;
(5) Interpretação e Avaliação
alguns autores possuem avaliações um pouco diferentes
PARA FIXAR
O processo de descoberta de conhecimento no banco de dados é __________ e _________, envolvendo várias etapas com muitas ________ tomadas pelo usuário.
O processo de descoberta de conhecimento no banco de dados é interativo e iterativo, envolvendo várias etapas com muitas decisões tomadas pelo usuário.
Iteração = repetitivo
A primeira etapa da descoberta de conhecimento no banco de dados (KDD) é selecionar um ________ __ _____ de diversas _____, ou se concentrar em um ___________ __ _________ ou ________ __ _____, no qual a descoberta será realizada.
A primeira etapa da descoberta de conhecimento no banco de dados (KDD) é selecionar um conjunto de dados de diversas bases, ou se concentrar em um subconjunto de variáveis ou amostras de dados, no qual a descoberta será realizada.
Com a seleção de dados relevantes no processo descoberta de conhecimento no banco de dados, a segunda etapa será o ___-______________ dos dados.
Operações básicas incluem _______, remoção de _____, eliminação de ___________, decidir estratégias para lidar com ______ __ _____ ________, entre outros.
Com a seleção de dados relevantes na descoberta de conhecimento no banco de dados, a segunda etapa será o pré-processamento dos dados.
Operações básicas incluem limpeza, remoção de erros, eliminação de redundância, decidir estratégias para lidar com campos de dados ausentes, entre outros.
Com os dados pré-processados no processo de descoberta de conhecimento no banco de dados, passamos à terceira fase, à etapa de _____________, em que os dados são _____________ e ____________ em formas ____________ à mineração, ____________-__ e __________-__.
Com os dados pré-processados na descoberta de conhecimento no banco de dados, passamos à terceira fase, à etapa de transformação, em que os dados são enriquecidos e consolidados em formas apropriadas à mineração, sumarizando-os e agregando-os.
Com os dados transformados, passamos à quarta etapa do processo de descoberta de conhecimento no banco de dados que é a de __________ __ _____. Utilizam-se __________ e ________ para extrair possíveis _______ ______ de dados.
Com os dados transformados, passamos à quarta etapa do processo de descoberta de conhecimento no banco de dados que é a de mineração de dados. Utilizam-se algoritmos e técnicas para extrair possíveis padrões úteis de dados.
Feita a mineração de dados chegamos na última fase do processo de descoberta de conhecimento no banco de dados, que é a de _____________. Diversos padrões serão _____________ e _________ em busca de ________ realmente ______________ e _____, além de suas possíveis ___________ ou ______________.
Feita a mineração de dados chegamos na última fase do processo de descoberta de conhecimento no banco de dados, que é a de interpretação. Diversos padrões serão interpretados e analisados em busca de padrões realmente interessantes e úteis, além de suas possíveis explicações ou interpretações.
A técnica de pré-processamento possui alguns objetivos principais:
- melhorar a qualidade dos dados
- diminuir a ambiguidade das expressões linguísticas
- diminuir a quantidade de dados a ser processado
- estruturar as informações como tuplas; e
- melhorar a eficiência da mineração de dados.
Eslmari Navathe, renomado autor de bancos de dados, considera que o KDD não possui cinco etapas e sim contempla seis etapas:
1) Seleção de dados: Dados sobre itens ou categorias são selecionados.
2) Limpeza de dados: Dados são corrigidos ou eliminados dados incorretos.
3) Enriquecimento de dados: Dados são melhorados com fontes de informações adicionais.
4) Transformação de dados: Dados são reduzidos por meio de sumarizações, agregações e discretizações.
5) Mineração de dados: Padrões úteis são descobertos.
6) Exibição de dados: Informações descobertas são exibidas ou relatórios são construídos
discretizações: variáveis numéricas são convertidas em classes ou categorias
CERTO OU ERRADO:
O objetivo das técnicas de pré-processamento de dados é preparar os dados brutos para serem analisados sem erros de incompletudes, inconsistências e ruídos.
CERTO!
QUESTÃO DE PROVA
O processo de extração de informações de bases de dados é conhecido como descoberta de conhecimento em banco de fados, em inglês Knowledge Discovery in Databases (KDD). Segundo Fayyad, tal processo é constituído pelas etapas na seguinte ordem:
a) seleção – pré-processamento – transformação – mineração de dados – avaliação.
b) limpeza dos dados – seleção – transformação – mineração de dados – conhecimento.
c) mineração de dados –interpretação – avaliação.
d) projeção – seleção – mineração de dados - avaliação – conhecimento.
**a) seleção – pré-processamento – transformação – mineração de dados – avaliação. **
Segundo Navathe, a Mineração de Dados costuma ser executada com alguns objetivos finais ou aplicações. De um modo geral, esses objetivos se encontram nas seguintes classes:
Previsão, Identificação, Classificação ou Otimização.
isso significa que você pode utilizar a mineração de dados com o objetivo que podem ser divididos nas seguintes classes: previsão, identificação, classificação e otimização
MNEMÔNICO PICO
No objetivo da mineração de dados PREVISÃO, a mineração de dados pode mostrar como certos atributos dos dados se ____________ __ ______. Um de seus objetivos é prever ______________ _______ baseado em ______________ ________.
No objetivo da mineração de dados PREVISÃO , a mineração de dados pode mostrar como certos atributos dos dados se comportarão no futuro. Um de seus objetivos é prever comportamentos futuros baseado em comportamentos passados.
Exemplo: análise de transações de compras passadas para prever o que os consumidores
comprarão futuramente sob certos descontos, quanto volume de vendas uma loja gerará em
determinado período e se a exclusão de uma linha de produtos gerará mais lucros. Em tais
aplicações, a lógica de negócios é usada junto com a mineração de dados. Em um contexto científico, certos padrões de onda sísmica podem prever um terremoto com alta probabilidade.
No objetivo da mineração de dados IDENTIFICAÇÃO, padrões de dados podem ser usados para identificar a existência de um ____, um ______ ou uma _________.
No objetivo da mineração de dados IDENTIFICAÇÃO, padrões de dados podem ser usados para identificar a existência de um item, um evento ou uma atividade.
Por exemplo: intrusos tentando quebrar um sistema podem ser identificados pelos programas por eles executados, arquivos por eles acessados ou pelo tempo de CPU por sessão aberta. Em aplicações biológicas, a existência de um gene pode ser identificada por sequências específicas de nucleotídeos em uma cadeia de DNA. A área conhecida como autenticação é uma forma de identificação. Ela confirma se um usuário é realmente um usuário específico ou de uma classe autorizada, e envolve uma comparação de parâmetros, imagens ou sinais contra um banco de dados.
No objetivo da mineração de dados CLASSIFICAÇÃO, a mineração de dados pode ___________ os dados de modo que diferentes classes ou categorias possam ser identificadas com base em ___________ __ __________.
No objetivo da mineração de dados CLASSIFICAÇÃO, a mineração de dados pode particionar os dados de modo que diferentes classes ou categorias possam ser identificadas com base em combinações de parâmetros.
Por exemplo: os clientes em um supermercado podem ser categorizados em compradores que buscam desconto, compradores com pressa, compradores regulares leais, compradores ligados a marcas conhecidas e compradores eventuais. Essa classificação pode ser usada em diferentes análises de transações de compra de cliente como uma atividade pós-mineração. Às vezes, a classificação baseada em conhecimento de domínio comum é utilizada como uma entrada para decompor o problema de mineração e torná-lo mais simples (Ex: alimentos saudáveis, alimentos de festa ou alimentos de lanche escolar são categorias distintas nos negócios do supermercado. Faz sentido analisar o relacionamento dentro e entre categorias como problemas separados ). Essa categorização pode servir para codificar os dados corretamente antes de submetê-los a mais mineração de dados.*
No objetivo da mineração de dados OTIMIZAÇÃO, um objetivo relevante da mineração de dados pode ser otimizar o uso de _________ _________, como _____, ______, ________ ou _________ e maximizar _________ __ _____ como ______ ou ______ sob determinado conjunto de restrições. Como tal, esse objetivo da mineração de dados é semelhante à ______ ________, usada em problemas de pesquisa operacional, que lida com otimização sob restrições.
No objetivo da mineração de dados OTIMIZAÇÃO, um objetivo relevante da mineração de dados pode ser otimizar o uso de recursos limitados, como tempo, espaço, dinheiro ou materiais e maximizar variáveis de saída como vendas ou lucros sob determinado conjunto de restrições. Como tal, esse objetivo da mineração de dados é semelhante à função objetiva, usada em problemas de pesquisa operacional, que lida com otimização sob restrições.
CERTO OU ERRADO:
Para a realização de prognósticos por meio de técnicas de mineração de dados, parte-se de uma série de valores existentes obtidos de dados históricos bem como de suposições controladas a respeito das condições futuras, para prever outros valores e situações que ocorrerão e, assim, planejar e preparar as ações organizacionais.
CERTO! Prognóstico ou previsão partem dados históricos para prever situações futuras
Tarefas consistem na:
especificação do que estamos querendo buscar nos dados.
o que?
AS BANCAS GERALMETE CONCEITUAM TAREFAS E TÉCNICA COMO A MESMA COISA
Técnicas consistem na:
especificação de como descobrir os padrões.
como?
AS BANCAS GERALMETE CONCEITUAM TAREFAS E TÉCNICA COMO A MESMA COISA
Podemos dividir tarefas e técnicas em três categorias:
- Predição/Previsão
- Associação
- Agrupamento/Clusterização
PARA FIXAR
A técnica de Predição/Previsão busca descrever a ________ de ocorrências _______ de certos eventos com base nos acontecimentos ________;
A técnica de Predição/Previsão busca descrever a natureza de ocorrências futuras de certos eventos com base nos acontecimentos passados;
A técnica de Associação busca descobrir relacionamentos entre _________ correlacionando a presença de um item com uma _____ __ _______ para outro ________ __ __________;
A técnica de Associação busca descobrir relacionamentos entre variáveis correlacionando a presença de um item com uma faixa de valores para outro conjunto de variáveis;
A técnica de Agrupamento/Clusterização __________ dados em __________ ___________ _____________ com características ___________.
A técnica de Agrupamento/Clusterização particiona dados em segmentos previamente desconhecidos com características semelhantes.
Uma Técnica de Aprendizado Supervisionado é aquela que necessita de __________ ou _________ com um ___ ______.
Uma Técnica de Aprendizado Supervisionado é aquela que necessita de supervisão ou interação com um ser humano.
Uma Técnica de Aprendizado Não Supervisionado não necessita de supervisão ou interação com um:
ser humano.
No aprendizado supervisionado, um ser humano alimenta o algoritmo com categorias de dados de _____ de tal forma que o algoritmo aprenda como classificar os dados de entrada nas categorias de dados de _____ ___-_________.
No aprendizado supervisionado, um ser humano alimenta o algoritmo com categorias de dados de saída de tal forma que o algoritmo aprenda como classificar os dados de entrada nas categorias de dados de saída pré-definidas.
PARA FIXAR
Note que, na imagem, já foi definido quais serão as categorias de saída (OUTPUT), logo o algoritmo irá receber os dados brutos de entrada, irá processá-los e aprenderá a classificá-los em cada uma das categorias de saída que eu defini inicialmente. Se um ser humano interferiu com o algoritmo pré-definindo nas categorias de saída do algoritmo (no 1 da imagem), o algoritmo utilizou um aprendizado supervisionado porque ele aprendeu a categorização, mas com o auxílio de um ser humano.
Na imagem a direita há um conjunto de pontinhos e o algoritmo (no 2 da imagem) , que por si só interpreta esses dados de entrada em busca de similaridades, padrões e características em comum, realiza o processamento e ele mesmo os categoriza sem nenhuma interferência humano durante o processo