HC 1 - Integrative Omics Flashcards
hoorcollege 1
Methodologisch reductionisme
Proberen het systeem in individuele delen en interacties te verklaren
> probleem: in de biologie lastig transponeerbaar
Systeembiologie
Holistische aanpak, alle gereduceerde componenten worden samengebracht en kijken hoe deze samenwerken (interacties tussen systemen)
In silico is een belangrijk model voor systeembiologie door de complexiteit ervan voor het meten. Waarop is in silico gebaseerd?
Op voorspellingen aan de hand van data
Waarom is reductionisme nodig voor de systeembiologie
Validatie is nodig op reductionistisch niveau
> systeembiologie is strict afhankelijk van reductionistisch onderzoek om de details van bezittingen voor reconstructie van systemen.
Methodologisch reductionisme; inductieve redenatie
Vanuit geobserveerde experimentele data > algemene aanname > toepassen op niet geobserveerde fenomen
- vaker kwalitatief onderzoek
Welke aanname is belangrijk bij inductieve redenatie?
Dat de data leidend is
Deductieve redenatie
Op basis van een theorie een hypothese maken en een experiment opzetten die de hypothese al dan niet falsificeert.
-Popper: hypothese kan nooit geverifieerd worden alleen maar gefalsificeert
-Hoe meer tests de hypothese overleeft zonder falsificatie, hoe aannemelijker
Conjecture
Uit een patroon op basis van correlatie een hypothese opstellen > hiermee kun je geen causaliteit aantonen, daarvoor moet perturbatie worden gedaan (experiment nodig)
Verschil conjecture en theorie
Conjecture: op basis van correlatiepatroon
Theorie: op basis van test of vooringenomen kennis
Traditionele onderzoeksmethode (eerste dimensie)
-Hypothese-gedreven deductie
-Occam’s Razor
Occam’s Razor
De meest simpele verklaring voor een fenomeen is meestal de juiste, op deze manier wordt in de eerste dimensie nieuwe hypotheses en experimenten opgesteld
Data-mining-inspired induction (tweede dimensie onderzoeksmethode)
- Data verkrijgen en uit de patronen een hypothese opstellen > alleen correlatie aantonen
-Omics approach: data interpretatie naar een hoger niveau tillen om nieuwe inzichten op zichzelf te onthullen
-Next-level inductive reasoning (enige keer dat dit goed is)
Correlatie kan nooit de causaliteit vervangen: wat is er nodig om causaliteit aan te tonen?
Real life setting experiment (kan niet met computers) > bv knockouts
Wat word er als eerste gedaan bij tweede dimensie onderzoek?
Cellijnen maken en omics data verkrijgen om hierover een hypothese met klinische impact te vormen op basis van correlaties en validatie ervan via real life experiment
> bv multiple myeloma cellen met hyperactieve pathway > Akt remt FOXO via fosforylatie (kern uit) en FOXO activeert genen voor anti-deling > aantonen causaliteit in experiment (knockout Crispr-Cas9) > hypothese: FOXO fosforylatie veroorzaakt Akt hyperactivatie > transcriptomics uitvoeren met FOXO ko en Akt inhibitor combinatiegroepen
Gene set enrichment analysis (GSEA) bij transcriptomics (genexpressie)
Genen worden gerangschikt op verschil tussen de fenotypes die worden getest, bovenin komen dan dus genen met hoge associatie met het fenotype (leading edge subset)
> lijst aflopen en kijken of je een gen tegenkomt die hoort bij een proces bv glycolyse en dan een positieve waarde noteren, kom je een ander tegen dan negatieve waarde: running sum statistics
> plot de running sum: ES (enrichment) values
> normaliseren voor gene set size: NES waarden
> de cutoff: FDR (proportion of false positives): <0.25, resultaat 3/4 betrouwbaar
Een pathway kan bij elkaar veel invloed hebben op het fenotype ondanks
Lage individuele differentiewaarden in genexpressie
Clinical relevance bepalen van een set genen (bv FOXO dependent genes)
-Clusteren op basis van genexpressie, in alle X dimensies voor Y aantal genen wordt algemene gelijkenis tussen patients bepaald
K-means clustering machine learning
Verdeling maken op basis van de genen > de meest gelijke patients samenvoegen
1. Random aantal (k) means worden geselecteerd in de data
2. k clusters worden geassocieerd met dichstbijzijnde mean
3. centroid van elk van de k clusters worden de nieuwe means
4. convergence door stap 2 en 3 te herhalen.
Wat wordt er gedaan na clinical relevance bepalen?
De patients bepalen die het meeste baat hebben bij de behandeling en deze meenemen in een clinical trial met remmers
GSEA kan … identificeren
upgereguleerde pathways
Stel GSEA ontdekt dat IGF1 pathway is upgereguleerd bij de remmers voor de Akt (kinase, die FOXO fosforyleert). Wat nu?
Nieuwe hypothese, en combinatie therapie met IGF1R remmers
Synergie
Een effect dat ontstaat door een combinatie van toepassingen
Third dimension of scientific method: Allochtonous reasoning
-Wisselwerking tussen wiskunde
-Allochtonous: buiten de comfortzone van iemand
Stappenplan allochtonous reasoning
- Identificeren van fenomeen van interesse
- Data verzamelen (kan omics) (data-mining-inspired)
- Systeem simpel proberen te maken (afhankelijkheidsdiagram maken)
- Maken boxes and arrows diagram van fenomeen en context
- Bepaal hoe elke component wiskundig kan worden omgezet (halfwaardetijd, expressiewaardes)
- Parameters bepalen voor voorspelling > formules maken > voorspellen hoe een cel reageert in silico
- wiskundige resultaten terugvertalen: wat betekent het in biologie?
Nadeel in silico
Er is niet genoeg data beschikbare van basale concepten (halfwaardetijd bv) om het wiskundig op te kunnen stellen
Nadeel oversimplificeren
Het is niet meer de waarheid
Eis aan de parameters in silico
Ze moeten experimenteel gemeten of gefit kunnen worden
Parameter fitting
De parameters moeten het beste passen bij de twee uitkomsten die je hebt (voor en na-value > miljoenen scenario’s waaruit de computer de beste kiest > kan ook biologisch onmogelijk zijn: nadeel)
Overfitting en underfitting bij parameter fitting
-Overfitting: meer parameters dan gerechtvaardigd door de data > noise is geïnterpreteerd als een structuur > violation Occam’s Razor.
-Underfitting: er missen parameters
Waarom in silico?
Omdat een systeem te complex kan zijn om in vitro te simuleren
> bv germinal center reacties in het veroorzaken van lymfoom > zijn er targets te onderscheiden?
Wat zijn master regulator transcriptiefactoren?
De TF’s die genexpressie bepalen en worden bepaald door cellulaire interacties > dit bepaalt het fenotype
Wat wordt er gedaan met het afhankelijkheidsdiagram?
Er worden differentiaalvergelijkingen opgesteld op basis van afhankelijkheidsdiagrem (pijlenschema) op basis van literatuur, dit is puur hypothetisch.
> parameters zoeken die eindwaarden kunnen voorspellen door het toepassen op de beginwaarden
> parameters kunnen veranderen want de differentiaalvergelijkingen en cosntanten zijn fictief en voorspellingen
In silico wordt gebruikt om met een complex systeem …
een hypothese te ontwikkelen om die in vitro/ in vivo te testen
Multidimensionele onderzoeksmethode: wat te doen met resultaten en probleem van inductie
-Biologische kennis is nodig voor observatie, experimentatie en interpretatie
> nieuwe onderzoeksvraag maken (langzaam en biased door persoonlijke hypothese uit literatuur)
> uit big data/mathemathische modelling / allochtone redenatie: verkrijgen geen universele waarheid: acceptatie van inductieve redenatie
Alle dimensies van onderzoek kunnen … worden gebruikt
synergetisch
Principe agent-based modelling
Representeren van discrete biologische processen als gecompartimentiseerd (spatiaal gedefinieerde) modellen –> emulatie
> interacties met omgeving simuleren: in silico model van een cel in context
> modelleren single cell behavior in bv GC environment (waar klasseswitch en affiniteitsmaturatie plaatsvindt in lymfeknoop)
Voordelen synergetische blending (multidimensionele onderzoek), nadelen aparte dimensies
-Dimensie 1: filosofisch clean maar confounded door aannames
-Dimensie 2: handig voor grote ruimes exploreren maar kan geen universele waarheid bieden
-Dimensie 3: precies en falsificeerbaar, snel en goedkoop, maar geen sterke standaard opererende procedures
Wet-lab perspective en gneeric recommendations
- start met big data
- bepaal associaties en correlaties
- mathematisch: filteren fake correlaties
- iteratief (ga terug naar 1)
- overlevende associaties zijn kandidaten voor verdere experimentele/computionele testing
wet lab perspective; de uiteindelijk overlevende hypotheses meoten getest worden voor validiteit in conventionele experimenten