Machine Learning Flashcards
O que é Aprendizado Supervisionado?
É uma abordagem de aprendizado de máquina onde os algoritmos são treinados com um conjunto de dados rotulados, isto é, dados que possuem a resposta correta.
Quais são os dois principais tipos de tarefas no Aprendizado Supervisionado?
Regressão e Classificação.
O que é Regressão?
É uma tarefa de aprendizado supervisionado onde o objetivo é prever valores contínuos, como preços de casas ou temperaturas.
O que é Classificação?
É uma tarefa de aprendizado supervisionado onde o objetivo é atribuir categorias aos dados, como detecção de spam ou diagnóstico médico.
O que é Regressão Linear?
É um algoritmo de aprendizado supervisionado que ajusta uma linha reta aos dados para prever valores contínuos.
O que é Regressão Logística?
É um algoritmo de aprendizado supervisionado que estima a probabilidade de uma amostra pertencer a uma classe binária.
O que são Máquinas de Vetores de Suporte (SVM)?
São algoritmos de aprendizado supervisionado que separam as classes com a maior margem possível.
O que são Redes Neurais (Deep Learning)?
São modelos de aprendizado supervisionado que utilizam camadas de neurônios artificiais para aprender padrões complexos.
O que é uma Árvore de Decisão?
É uma estrutura de ramificação usada para tomar decisões com base em regras extraídas dos dados.
O que é k-Nearest Neighbors (k-NN)?
É um algoritmo de aprendizado supervisionado que classifica uma amostra com base nos k pontos de dados mais próximos.
O que é o Naive Bayes?
É um algoritmo de aprendizado supervisionado baseado na probabilidade Bayesiana para classificação.
Quais são alguns exemplos de tarefas de Regressão?
Previsão de preços de casas e previsão de temperaturas.
Quais são alguns exemplos de tarefas de Classificação?
Detecção de spam e diagnóstico médico (doença ou não).
O que é Aprendizado Não Supervisionado?
É uma abordagem de aprendizado de máquina onde os algoritmos encontram padrões ou estrutura nos dados sem rótulos de resposta.
Quais são os dois principais tipos de tarefas no Aprendizado Não Supervisionado?
Agrupamento (Clustering) e Redução de Dimensionalidade
O que é Agrupamento (Clustering)?
É uma tarefa de aprendizado não supervisionado que envolve a organização de dados em grupos (clusters) de itens similares.
O que é Redução de Dimensionalidade?
É uma tarefa de aprendizado não supervisionado que visa reduzir o número de variáveis sob consideração, extraindo as características mais importantes.
O que é K-means?
É um algoritmo de agrupamento que particiona os dados em k clusters, onde cada ponto pertence ao cluster com o centroide mais próximo.
O que é DBSCAN (Density-Based Spatial Clustering of Applications with Noise)?
É um algoritmo de agrupamento que forma clusters com base na densidade de pontos de dados, identificando ruídos e pontos isolados.
O que é Agrupamento Hierárquico?
É um algoritmo de agrupamento que constrói uma hierarquia de clusters, geralmente visualizada como uma árvore ou dendrograma.
O que é Análise de Componentes Principais (PCA)?
É uma técnica de redução de dimensionalidade que transforma os dados para um novo espaço de características com menos dimensões, preservando a variância máxima.
O que é Análise de Agrupamentos?
É uma técnica de aprendizado não supervisionado usada para encontrar subgrupos naturais em um conjunto de dados.
O que são Redes Neurais Autoencoder?
São um tipo de rede neural utilizada para aprender uma representação eficiente (codificação) dos dados, frequentemente usada para redução de dimensionalidade.
Qual é a principal diferença entre Aprendizado Supervisionado e Não Supervisionado?
No aprendizado supervisionado, os algoritmos são treinados com dados rotulados, enquanto no aprendizado não supervisionado, os algoritmos encontram padrões sem rótulos.
O que é um cluster?
Um grupo de pontos de dados que são mais semelhantes entre si do que aos pontos de outros grupos.
Quais são os principais benefícios do Aprendizado Não Supervisionado?
Identificação de padrões ocultos nos dados e redução da dimensionalidade para simplificar a análise.
O que é um dendrograma?
Uma representação em árvore das operações de fusão ou divisão em agrupamento hierárquico
Como o PCA preserva a variância dos dados?
Transformando os dados para um novo espaço de características com menos dimensões, maximizando a variância mantida.