11. Bioinformática Flashcards
1
Q
Clustering - Basics
A
Clustering
Cluster
Classificadores
Matriz de Expressão
Distâncias:
- Manhattan
- Euclideana
Correlação de Pearson
2
Q
Clustering Hierárquico
A
> > Bottom-up (Aglomerativo)
> > Top-down (Divisivo)
Métodos aglomerativos:
- Single link
- Complete link
- Average link
- Centroide
3
Q
Clustering de partição (K-means)
A
4
Q
Validação de clusters
A
Índice externo N11 N10 N01 N00
Índice interno
Coeficiente de silhueta
5
Q
Classificação
A
Métodos Estatísticos
-Fórmula de Bayes
Métodos geométricos
-K-NN (nearest neighbours)
6
Q
Análise de Componente Principal (PCA)
A
- Reduz dimensionalidade dos dados
- % de variância de cada componente principal (PC) permitem definir o número de PC’s necessários