Unidade 2 - Transcriptómica Flashcards
O que é o transcriptoma?
Conjunto completo de RNA da célula, tecido ou outra amostra biológica.
O que é a transcriptómica?
É a área que examina o transcriptoma, com foco nos níveis de expressão do mRNA (RNA mensageiro).
Fornece uma compreensão dos padrões de expressão genética, funções celulares, mecanismos de doença e terapêuticas.
Quais são as áreas de aplicações da transcriptómica?
- Biotecnologia
- Diagnóstico
- Desenvolvimento de medicamentos
- Estudos do microbioma
- etc
Qual o tamanho máximo de um RNA de tamanho curto?
< 200 bases
Qual o tamanho mínimo de um RNA de tamannho longo?
> 200 bases
Como se minimiza a degradação do RNA?
- Minimizando os atrasos entre o momento da colheita e do isolamento do RNA
- Congelar a -80ºC (no caso de não se fazer isolamento de RNAse)
- Usar reagentes, equipamento, etc, livres de RNAse
- Isolar o RNA em locais livres de RNA
- Usar luvas, trabalhar rápido e eficientemente
- Usar inibidores de RNAse e reagentes estabilizadores de RNA
Para que serve a eletroforese no controlo de qualidade do RNA?
- Deteção da degradação do RNA (nódoas ou padrões de escada)
- Avaliar a pureza (deteta contaminantes como o DNA)
Como se avalia a pureza do RNA?
- Eletroforese (DNA)
- Espetroscopia de razão A260/A230 (sais, fenol, carboidratos, moléculas orgânicas) - razão > 2 = amostra livre de contaminação
- Espetroscopia de razão A260/A280 (proteínas) - razão > 2 = amostra livre de contaminação proteica
O que significa a sigla “RIN”?
RNA Integrity Number
Número de Integridade do RNA
Para que serve o RIN?
Métrica usada para avaliar a qualidade e integridade de amostras de RNA.
Importante para métodos como o RNA-seq e análise de expressão genética
Qual é a escala do RIN?
1 a 10
1 = má qualidade
10 = boa qualidade
1-6 = Isto é RNA?
7-10 = Aceitável para RNA-seq
Que sistemas (software/hardware) existem para ver picos de RNA ribossomal (rRNA)?
- Agilent 2100 Bioanalyzer
- Agilent TapeStation 4200
Como funcionam os sistemas “Agilent 2100 Bioanalyzer” e “Agilent TapeStation 4200”?
Usam tecnologia de eletroforese microfluídica para separar o RNA por tamanho, permitindo ver picos de rRNA (por eletroferograma) e detetar a degradação de produtos de RNA.
Numa eletroforese de RNA com RIN 10, onde aparecem os picos?
pico 18S -> 41 seg
pico 28S -> 48 seg
Qual é o processo para a criação das bibliotecas para RNA-seq?
- Fragmentação do RNA
- Transcrição reversa para cDNA
- Ligação dos adaptadores
- Amplificação por PCR
Com que métodos se verifica a qualidade das bibliotecas e a sua adequação para sequenciamento?
- qPCR (PCR em tempo real)
- eletroforese capilar
- quantificação fluorométrica
Que ferramentas são usadas para controlar a qualidade dos dados gerados pelas plataformas NGS?
- FastaQC
- MultiQC
O que é o mapeamento e alinhamento de sequências?
É a determinação da localização genómica a que uma leitura corresponde, e alinhamento das leituras curtas de RNA-seq contra um genoma de referência.
O alinhamento normalmente usa um genoma de referência?
Sim
Como são apresentados os dados após o alinhamento?
Numa matriz de leituras por gene:
- linhas (nome de genes)
- colunas (amostras)
Que plataformas existem para fazer o alinhamento das leituras?
HISAT2
BWA
TopHat
STAR
Que elementos são necessários para fazer o alinhamento de leituras?
- Leituras de sequências não tratadas (.fastq ou .fq)
- Genoma de referência (.fa)
- Ficheiro de anotação (.gtf ou .gff)
Que genomas humanos de referência existem?
Assembly GRCh38 - hg38
Assembly GRCh37 - hg19
(são diferentes)
Qual o primeiro passo da análise de dados RNA-seq?
Fazer um gráfico com os dados.
Que formas existem de representar os dados RNA-seq? (Que tipo de gráficos)
- PCA (principal component analysis)
- MDS (multidimensional scaling)
- Matrizes de distância
- Análise diferencial da expressão genética - gráficos vulcão; heatmaps
Quais são as vantagens da PCA?
- Facilita a leitura dos dados
- Retém os dados e as variações mais importantes
- Corrige para um efeito-batch
- Faz o ajuntamento de amostras
- Identifica outliers
Para que são úteis as matrizes de distância?
- Redução da dimensionalidade
- Clustering hierárquico
- Quantificação de semelhanças e diferenças
- Controlo de qualidade das amostras
Para que serve a análise diferencial da expressão genética (DE)?
Para perceber como os níveis de expressão genética se alteram entre diferentes tratamentos e condições.
DE ajuda na identificação de genes que estão up-regulated e down-regulated sob condições específicas
Que softwares existem para análise DE?
- Cuffdiff
- DESeq2
- EdgeR
- limma-voom
Qual é a utilidade de um gráfico vulcão?
Identificar rapidamente mudanças significantes em grandes quantidades de dados compostos por dados em réplicas.
Especialmente útil para comparar duas condições para encontrar diferenças significativas. Ex.: saudável vs doente; controlo vs teste.
O que está representado em cada eixo de um gráfico vulcão?
Eixo xx - significância da expressão genética
Eixo yy - magnitude da expressão genética
O que significa cada uma das cores apresentadas num gráfico vulcão?
Cada ponto representa um transcrito/gene.
Vermelho - genes up-regulated
Verde - genes down-regulated
Cinzento - genes que não são expressos diferencialmente
O que são heatmaps? Qual a sua utilidade na análise DE?
Heatmaps são gráficos de dados representados por cores.
São úteis porque fornecem uma identificação rápida e intuitiva de correlações, padrões, etc
Que parâmetros de análise DE são definidos pelo utilizador?
- Método de normalização
- Nº mín de CPM (contagens por milhão) por nº mín de amostras
- Software/ferramenta de análise DE
- FCT (fold change threshold)
- Correção ou não dos p-value
O que é a análise GO (oncologia genética)?
Método usado para interpretar dados transcriptómicos de larga escala em termos dos processos biológicos, função molecular e componentes celulares associadas aos conjuntos de genes ou aos produtos
Para que serve a plataforma HISAT2?
Fazer alinhamento de sequências.
Para que serve a plataforma BWA?
Fazer alinhamento de sequências.
Para que serve a plataforma TopHat?
Fazer alinhamento de sequências.
Para que serve a plataforma STAR?
Fazer alinhamento de sequências.