גנומיקה Flashcards
genomics
תחום מחקר של גנים וגנומים והאינטראקציות בגנים
ביואנפורמטיקה
שימוש בשיטו חישוביות לניתוח דאטא ביולגי
human genome project:
what found, how did it
מה מצאו:
- מצוא שיש 20 עד 21 אלף גנים בגנום וזה הייתה אכזבה כי זה אותו מסםר כמו עכברים. חשבו שהיה לנו סביבות 50 אלף
- יש הרבה מאוד אזורים חוזרניים, כלומר חוזרים על עצמם.
איך ריצפו:
בשיטת shotgun sequencing
shotgun sequencing
לוקחים את הגנום וחותכים אותו למקטעים קצרים ולכל חתיכה עושים cloning
מחדירים מקטע קצר של הדנא לתוך הפלסמיד וכך מגדילים את כמות הדנא. המכונות ריצוף צריכים הרבה חלקים של אותו חתיכה לעשות ריצוף. ולאחר מכן הן עושים assembly.
כלומר מרכיבים את חתיכות הדנא בחזרה. ובשביל זה צרחך מסיפק חפיפה בין החלקים. ובכך שיש הרבה חלקים שחוזרים על עצמם בדנא נוצר בעיה.
the 5 V of big data
1) volume: amount of data, needs to all be saved somewhere
2) variety: different types, human, virus, bacteria, all different genoms
3) velocity: how fast the data is made and can be מנותח
4) variability: sometimes doesnt read and gives something shouldnt be there
5) veracity: how accurate is the data
מה אנחנו יכולים לרצף
כל דבר שהוא דנא. כלומר חיידקים, ארכיא, אאוקריוטיים, וגם רנא (אבל זה בדרך כלל מרצםים על ידי המרה שלו לדנא)
מטע גנומקיה
לא מרצפים ארגניזם מבויים אלה כל מה שנמצא בסביבה מסוימת. גרגיר של אבק, טיפה של מים, גרגר של חול או אדמה.
דוג:
- acid mine drainage: has a very acidic ph and they found bacteria and arcae that live there/
- uranium contaminated soil: same and every found a bacteria that “breathes” uranium.
- human microbiome: 1 to 3 kg of our body is bacteria. have more bacteria than cells (about 1.3 times more)/ they help our immune system recognize bad bacteria. brain doesnt have bacteria but still effected by them for example seratonin made in the מעי from bacteria.. (check the microbiom with a bit of skin or poop)
how to find genes (2 ways)
1) de novo:
מחפשים קודני התחלה (start)
וקודוני סוף (stop)
עוברים על כל מסגרת הקריאה האפשריות ובודקים את המרחק ביניהם. כי אמיתית לרוב ארוך יותר מ20
**ריצוף של רנא יכול לעזור להבין אם גן מבוטא. לא כל הגנים מתחילים בקודון של ההתחלה ומסיימים בקודון סוף
2) homology based: using Blast
מחפשים דמיון של אזורים לאזורים שאנו יודעים שהם גנים. הbalst זה אלגוריתם שמשבווה ונותן דמיון לפי צבע
(אדום ורוד, ירוק, כחול, ושחורח)
כאשר שחור הכי לא דומה.
איך מוציאים את תפקידם של גנים
1) if found in blast something very similiar that we know what it does will most likely be something similiar to that or something involved in that process.
2) if didnt find in blast do motifs searching:
לדוגמה אם אתר מסוים בחלבון יעבור גליקוליזה- התווסף סוכר על גבי איזשהי חומצה אמינית בחלבון אנו יודעים לזהות.
צריך שהדבר הראשון היה N
שזה אספרגין וזה אות שמייצגת לנו אחת מהחומצות האמיניות. אחריו צרכיך להיות חמצה אמינית חוך מפרולין {P}
הסבר הבא הו סרין או טריאונין [ST]
משמעות [ ] זה או.
וקראים למוטיב הזה nasa
**אבל לפעמים היה שם את המוטיב אבל זה לא היה נכון
- מוטיב נוסף זה NLS
והוא אמר אם חלבון מסויים נכנס לגרעין או לא.
3)לחפש את הפרטנרים של הגנים:
כמו מי החברים שלך אני יודעת מי אתה. יכול להיות דרך פרטנר ישר, לדוגמה חלבונים שעוברים אינטראקציה פיזית, נוגעים זה בזה. ויכולים להיות חברים באינטרקציה גנטית. עושים מפה, לוקחים אחד מוחקים בודקים, את הגן השני מוחקים בודקים, ואז את שתי הגנים. אם קורה משהו שונה שלא קרה בכל אחד בנפרד אז יש אינטרקציה בין הגנים. וזה נקראה אינטרקציה גנטית. עושין את זה להרבה גנים ומקבלים קלסטרים ולפי זה אפשר גם לשייך גנים.
system biology
מנסים לראות אחרי שרצפנו ברמת המערכת.
אפקטים רפואיים
-יש היום ריצוף של סרטנים. של אותו סרטן באנשים אחרים ובסרטנים שונים לגמרה. גילו שלרוב יש מוטציה משותפת אבל לא אצל כולם ולא בכל סוג.
-personalized precision medicine:
כל בן אדם הוא שונה, קצב מטבולי שונה, גנים שונים. שיום אחד הרופא הקבל את הגנום שלנו ויוכל להחליט לפי זה על המינון ואיזה תרופה.
comparing genoms
- C value paradox
- למה יש פער אינטואטיבי
-גוגדל הגנום לא מועיד על רמת מורכבות.
-c value paradox:
כמעט אין קשר בין גודל הגנום לבין מספר הגנים בגנום. לבני אדם יש גנום מאוד גול אבל רק 20 אלף גנים. אין קשר בין גודל הגנום לבין מורכבות של הארגניזם. לאורז יש פי שניים גנים משל האדם והרבה פחות בסיסים.
פער:
-בכל האאוקריוטיים יש שחבור
חלופי, כלום גן אחג מייצר כמה תעתיקים. אם נספור בבני אדם את מספר התעתיקים השונים האפשריים יש הרבה יותר מ21 אלף.
-none coding dna
-בבני אדם רק 1.5 אחוז מהגנום זה האקסונים, שזה מה שארחי על הגנים. 20 אחוז אינטרונים -(לא חשובים), 5 אחוז פרומוטורים ואנהנסורים שנותנים בקרה והשאר שזה כמעת חצי זה junk או טרנספוזונים.
**neutralists say junk is junk, sekectionists say that natural selection left it so must be important.
uniwue noncoding dna
-non repetitive areas that arnt genes, just there
transposable elements
נהוג לחלק לשני סוגים: 1) transposons: cut and paste or copy and past. 2) retrotransposons: copy and paste יש להם שלב של רנא. זה דנא שהופף לרנא ומחדש לדנא ונכנס למקום בגנום.
-selfish parasites
-לא טובים אבל לא רעים לנו. דומים לוירוסים בזה שמוצאים תא אם דנא נכנסים ומתרבים בתוחו.
-לרטרו טרנספוזונים קוראים הרבה פעמים endogenous retroviruses.
ואחת ההיפוטזות לאיך שנהיו
וירוסים זה שהיו רטרו וירוסים ומצאו דרך לצאת מהתא.
-בגנום אנושי הרוב הם מתים, דפקטיבים. ובמהלך החיים יכול להיות עליה.
בעיות בטרנפוזומים:
1) כל פעם שאנחנו מעתיקים את התא אנחנו מעתיקים את 3 מילאירד הבסיסים שלנו שחלק גדול מהם הם טרנספוזונים וזה עולה הרבה אנרגיה.
2) יכולים לכנס לתוך אמצע של גן.
**אקסונים הם לא טרנספוזונים אך כנראה שאינטרונים הומצאו על ידי טרנספוזונים, כךומר שייר של טרנספוזון עתיק.
-יש לנו מערכת הגנה נגדם בדומא למה שיש נגד וירוסים.
***מגדילים את השונות הגנתית ויכול לעזור לפעמים. לדוגמה אינטרונים.
משפחות של גנים
בגנים של אווקריוטיים יש משפחות של גנים. זה אוספים של גנים שנעים בין דומים מאוד זה לזה או זהים. חלק קרובות וחלק מפוזרות. דוגמה זה גלובינים.
-גלובינים מתחלקים לשתי משפחות אלפה ובטא. אלפה זה על כרומוזום 16 ובטא על כרומוזום 11. מרכיבים לנו את ההמגלובין שנושא חמצן על כדוריות דם אדומות מרחבי הגוף שלנו. מבטאים בשלבים שונים של ההתפתחות העוברית. לא זהים אבל מאוד דומים.
-יתרון הוא שהגוף לא יצטרך לייצר כל פעם גן חדש ויש לנו גן שעובר נוכל לעתיק אותו עם שינויים קטנים ושהוא בעצם ישמש לפונקציה קצת אחרת.