3. Assembly-4. Anotação do genoma-5. Genómica Comparativa -6. Transcritómica Flashcards
3. Assembly 4. Anotação do genoma 5. Genómica Comparativa 6. Transcriptómica
3.1. Reference Guided Assembly
De novo assembly
[Definition]
Reads -> Contigs -> Scaffolds (paired-end reads)
Problemas devem-se a:
- gaps
- falta de consenso
- contigs mal organizados
- regiões repetidas alinhadas como se fossem iguais
Polishing/finishing
Depois de compilar toda a informação é provável que esta não corresponda à totalidade do genoma do organismo OU que não tenha a qualidade desejada. Quais são as principais razões para esta disparidade?
- Gaps (descontinuidade entre scaffolds)
- Falta de consenso (regiões de baixa qualidade e bases ambíguas)
- Erros da polimerase –> usar mais cópias
- Contigs incorretamente organizados
- Regiões repetidas no genoma que são alinhadas como se estivessem no mesmo local –> usar reads maiores
- Anotação do genoma
Como se determina a localização das regiões codificantes?
Localizar ORF’s - Open Reading Frames:
1- Procurar codões START
- Procurar regiões reguladoras a montante da ORF
- Tendência do uso de determinados codões (raros vs frequentes)
- Tendência do uso de C ou G como terceira base do codão
- Usar BLASTP para confirmar que as regiões encontradas codificam proteínas. Se sim correspondem a genes
- Genómica Comparativa
Def.
- Anotação e análise da estrutura do genoma
- Análise de SNP’s
- Critérios para escolher SNP’s
- -Vantagens de usar reads vs contigs
- -Razões para reads não alinharem com a referência
- Genómica Comparativa
Que diferenças se podem obter através da anotação e análise da estrutura do genoma?
Usa-se o genoma de 2 espécies próximas, sendo uma delas (já anotada) a referência para anotar outra.
Neste caso, usa-se as proteínas descritas na referência para confirmar as previsões informáticas feitas para o genoma em estudo.
BLAST
- Baixa resolução
- Permite identificar grandes rearranjos
Análise de SNPs
Téncica de resolução elevada que consegue detetar alterações em apenas um nucleótido
Reads (muito pequenas) são comparadas com o genoma de referência
Foco deve ser em SNP’s não silenciosos em que ocorram em seuqências codificantes
- Transcritómica
Estudo do transcritoma - conjunto de todos os RNA’s produzidos pela célula em determinadas condições
Técnicas:
- Northern Blot (marcação radioativa)
- PCR quantitativo - real time reverse transcription PCR (mRNA -> cDNA)
> > Arrays de DNA
RNA-Seq
- Trancritómica
Arrays de DNA
Def: um array ou chip de DNA é uma superfície que contêm sondas fixas (estas vão hibridar com o DNA). Dependendo da superfície utilizada podem-se chamar microarrays ou macroarrays.
Macro vs Micro
Spotted DNA Arrays
Chips de elevada densidade de oligonucleótidos
RNA-Seq
- Preparação da biblioteca
- Sequenciação
- Análise dos dados
< Contribuição para a anotação >
Vantagens (6)