KNN Flashcards
O que é o K-Nearest Neighbors (KNN)?
O KNN é um algoritmo de aprendizado supervisionado que classifica novas observações com base nas K observações de treinamento mais próximas, medindo a distância entre elas.
Como o KNN determina a classe de uma nova observação?
O KNN atribui a nova observação à classe mais frequente entre suas K observações mais próximas.
O que são as fronteiras de decisão no KNN?
As fronteiras de decisão no KNN podem ser bastante complexas. No caso do 1NN, essas fronteiras são poliedros convexos centrados em cada observação do conjunto de treinamento, formando o Diagrama de Voronoi.
Quais são as etapas principais no processo de classificação com KNN?
Definir o valor de K.
Calcular as distâncias entre a observação de teste e todas as observações de treinamento.
Ordenar as distâncias e considerar os K vizinhos mais próximos.
Classificar a observação na classe de maior frequência entre os K vizinhos.
Por que o KNN é considerado um algoritmo lazy?
O KNN é considerado um algoritmo lazy porque não cria uma função de discriminação durante a fase de treinamento; em vez disso, faz predições calculando distâncias na fase de teste.
Quais são os aspectos positivos do KNN?
Não paramétrico, não faz suposições sobre os dados.
Versátil, funciona bem com dados não lineares.
Eficaz para pequenos conjuntos de dados.
Quais são os aspectos negativos do KNN?
Calcula todas as distâncias, o que é computacionalmente caro para grandes datasets.
Ineficaz para grandes conjuntos de dados devido a limitações de tempo e eficiência.
Precisa de algoritmos alternativos para grandes datasets.
O que é KNN com Distância Ponderada (WKNN)?
É um aperfeiçoamento do KNN onde a contribuição de cada vizinho é ponderada pela sua distância até a observação de interesse, dando maior peso aos vizinhos mais próximos.
Como a escolha de K afeta o desempenho do KNN?
Um K muito pequeno pode causar overfitting e instabilidade.
Um K muito grande pode ser afetado por alta variabilidade.
K é geralmente definido via validação cruzada para obter o melhor desempenho.