HC1 Flashcards

Question 1

Q

Databanken voor genen, genomen en variatie

Question 2

Q

Databanken voor gen en eiwitexpressie

Question 3

Q

Databanken voor eiwitsequenties, families en motieven

Answer

A

InterPro, Pfam, UniProt

Question 4

Q

Databanken voor reacties, interacties en pathways

Answer

A

IntAct, Reactome, MetaboLights

Question 5

Q

Databanken voor literatuur en ontologieën

Answer

A

PubMed, Ontology

Question 6

Q

Waarom gebruiken we bio databases?

Answer

A

info opzoeken
sequenties vergelijken
voorspellingen doen
IPA
Metadata analyse

Question 7

Q

Wat is IPA?

Answer

A

Ingenuity Pathway Analysis —> geeft veel meer info dan enkel de sequentie of expressie van bv. P53, komt in vele pathways voor

Question 8

Q

Welke structuren heeft een gen?

Answer

A

Intron/exon, promotor, coding region, eiwit…

Question 9

Q

Hoe weet ik of er een actief gen mogelijk is in mijn genoomsequentie of hoe bepalen we het aantal mogelijke genen in een genoom?

Answer

A

Hypothetisch gen = nog niet aangetoond in lab, maar op basis van data output zou het wel betrokken zijn.

Question 10

Q

Wat is het verschil tussen primaire en secundaire databases?

Answer

A

Primair = experimentele data = sequenties of structuren met geassocieerde “annotatie” informatie = bv. organisme, functie, ziekte mutatie…

Secundair = afgeleide data = bekomen uit analyse van primaire data = bv. patronen, profielen zoals de meest geconderveerde delen van multiple alignments, knipplaats restrictie enzym…

Nu: databanken volledig geïntegreerd met elkaar

Question 11

Q

Meest gebruikte integrale sites?

Answer

A

Genbank: NCBI = Amerikaans initiatief

EBI = Europees initiatief

—> uitwisseling van data tussen NCBI en EBI

Question 12

Q

Welke verschillende file formaten zijn er?

Answer

A

Genbank = volledige entry in databank

FASTA = ID lijn gevolgd door sequentie (nummering kan en mag)

Raw = enkel sequentie ( soms mag nummering)

Question 13

Q

Databases kunnen hun typisch eigen formaat hebben maar essentieel en elke database zijn:

Answer

A

Unique identifier of accession code

Name of depositor

Literature references

Deposition date

The real date

Question 14

Q

Wat is SwissProt?

Answer

A

Protein Database
Data komen van bv. translaties van DNA-sequenties (van EMBL Database), direct ingediend door onderzoekers…
Invoegen door ong. 200 Annotatie experts wereldwijd
Keyword-organised flatfile

Question 15

Q

Wat is RefSeq?

Answer

A

= Reference Sequence —> voor een natuurlijk voorkomend DNA, mRNA of eiwit is afgeleid van publieke databanken
Een gevalideerde sequentie
Varianten/mutante sequenties worden bepaald tov de RefSeq (bv. A in RefSeq maar je ziet T in andere, mutante sequentie)

Question 16

Q

Annotatie

Answer

A

Databases bevatten zogenaamde “annotated sequences”:

Allerlei informatie over de sequentie wordt toegevoegd aan de ruwe sequentiedata.
Deze informatie wordt in “annotation lines” weergegeven.

—> cross-linking van informatie in alle DB!
(Vanuit positie altijd doorklikken —> bv. van DNA-sequentie naar eiwitsequentie)

Question 17

Q

Voorbeelden van databanken?

Answer

A

PubMed
Mesh
OMIM
…

Question 18

Q

Wat is PubMed?

Answer

A

Databank van publicaties
Zoeken kan in allerlei velden (topic, auteur, keywords…)
Gecontroleerd bevragen via Mesh databank (lijst van gespecifieerde zoekwoorden en te verwachten output)

Question 19

Q

Wat is Mesh?

Answer

A

Om zoektermen goed te definiëren: alle termen onder gegeven zoekterm wordt ook gegeven —> je kan indien gewenst verfijnen als je merkt dat er nog te veel info instaat (en omgekeerd)

Question 20

Q

Wat is OMIM?

Answer

A

Online Mendelian Inheritance in Man
Info over humane genen en hun correlatie met ziekten
Lijst van bevindingen, artikels en links naar referenties, het gen, mRNA en eiwitsequenties
Links naar aanverwante websites, bv. Mutatiedatabanken

Question 21

Q

Uniek of niet?

naam
accession number

Answer

A

Naam = niet-uniek

Accession number = uniek

Brainscape's Knowledge GenomeTM

HC1 Flashcards

Brainscape's Knowledge Genome^TM