סטטיסטיקה Flashcards
relative risk
P1 - הסתברות לחלות בקרב החשופים
P2 - הסתברות לחלות בקרב הלא חשופים
RR=P1/P2
RR=1 - החשיפה לא משפיעה על הסיכון לחלות
RR>1 - החשיפה היא גורם סיכון לחלות
RR<1 - החשיפה היא גורם מגן מפני המחלה
odds ratio
ניתן לחשב גם במחקר רטרוספקטיבי (ולא רק פרוספקטיבי כמו RR)
P - הסתברות שהאירוע קרה
1-P - ההסתברות שאירוע לא קרה
Odd = P/1-P
נעשה את זה פעמיים - פעם אחת בחשופים, פעם שניה בלא חשופים.
OR - odd חשופים/odd לא חשופים
אבל במקום החישוב המסובך, אם מסדרים את הנתונים בטבלה שנראית ככה:
לא חולים חולים חשופים a b לא חשופים c d
אז החישוב יוצא:
OR=ad/bc
מה ההבדל בין פרמטר לאומדן?
מעניין אותנו לדעת דברים כמו - ממוצע, שונות, סטיית תקן, פרופרוציה, RR, OR
באוכלוסיה זה נקרא פרמטרים. כשאנחנו מעריכים את הפרמטרים האלה במדגם שלקחנו מהאוכלוסיה - זה נקרא אומדן או סטטיסטי.
התפלגות ממוצע המדגם
כאשר בוחרים מדגמים שונים נקבל תוצאות שונות לממוצע המדגים שנעות סביב הערך האמיתי באוכלוסיה.
אם ניקח דוגמא של גובה שהוא ערך שמתפלג נורמלית - גם
ממוצע המדגם שמעריך את הגובה יתפלג נורמלית.
מרכז ההתפגות של ממוצע הגובה במדגם הוא הגובה האמיתי באוכלוסיה.
ככל שגודל המדגם גדול יותר -הטעות קטנה יותר = משמע הממוצע במדגם יתקרב לממוצע באוכלוסיה.
במקרה שההתפלגות של מה שמודדים לא נורמלית, ממוצע המדגם עדיין מתפלג נורמלית כל עוד גודל המדגם הוא מספיק גדול - כלל האצבע הוא שמספיק גדול זה 30 ומעלה.
אמידה נקודתית לעומת אמידה באמצעות אינטרוול
אמידה נקודתית - למשל עבור ממוצע יתבצע ע”י חישוב הממוצע למדגם - שיהוו אמודן של הממוצע באוכלוסיה.
אמידה ע”י אינטרוול - במקום לתת אומדן נקודתית ניתן לתת טווח של ערכים - רווח סמך. בהתפלגות נורמלית 68% מהנתונים נמצאים בסטיית תקן אחת מהממוצע, ו95% במחרחק 2 סטיות תקן.
ברווח סמך של 95% אנחנו נותנים טווח של 2 סטיות תקן, והסיכון שהרווח לא כולל את הממוצע האמיתי באוכלוסיה הוא 5% - 2.5% שיהיה גבוה יותר ו2.5% שיהיה נמוך יותר.
P value
הערך שלו מגידר לנו מה ההסתברות שהתוצאה שיצאה לנו במדגם מוסברת ע”י אקראיות המדגם - אם הסיכוי שהדבר מודגם ע”י אקראיות המדגם הוא גבוה לא נוכל לדחות את השערת האפס. אך אם הוא נמוך - נדחה את השערת האפס ונקבל את ההשערה האלטרנטיבית - H1
השערת האפס היא ההשעה שרוצים לדחות בדרך כלל ומתייחסת למצב של אין הבדל או אין אפקט. ההשערה האלטרנטיבית H1 שוללת את H0
טעויות בבדיקת השערות
יש 4 אפשרויות:
השערת האפס נכונה באוכלוסיה, וגם הסקנו מהמדגם שהשערת האפס נכונה - אין טעות
השערת האפס נכונה באוכלוסיה, אבל הסקנו מהמדגם שההשערה האלטרנטיבית נכונה - טעות מסוג 1 - הסיכוי לכך הוא אלפא - שווה בדרך כלל ל0.05 או לכל ערך אחר שנגדיר שהוא רמת המובהקות של המחקר.
ההשערה האלטרנטיבית היא הנכונה באוכלוסיה , אבל על פי המדגם הסקנו שהשערת האפס נכונה - טעות מסוג 2 - הסיכוי לכך הוא בטא.
ההשערה האלטרנטיבית היא הנכונה באוכלוסיה, וזה גם מה שהסקנו מהמדגם - הסיכוי לכך הוא 1 פחות בטא - מכונה העוצמה של המחקר.
מה משפיע על העוצמה של המחקר?
- גודל המדגם - ככל שהמדגם יותר גדול הוא יהיה קרוב יותר למציאות - השונת תהיה קטנה יותר - בטא תהיה קטנה יותר ולכן העוצמה עולה.
- גודל האפקט - ככל שגודל האפקט שאנחנו חושבים שקרה בהשערה האלטרנטיבית גדול יותר - שטח החפיפה בין ההתפלגויות של השערת האפס וההשערה האלטרנטיבית קטן יותר ואז בטא תהיה קטנה יותר - העוצמה תהיה גדולה יותר.
רמת המובהקות אלפא - אם מגדילים את רמת המובהקות (כלומר מגדילים את ההסתברות לקבל את תוצאת המחקר כאשר היא לא נכונה) בתמורה - נרוויח את העלאת העוצמה.
שונות - ככל שהתופעה מפוזרת יותר - כלומר שונות יותר גדולה יש חפיפה בין העקומות של השערת האפס וההשערה האלטרנטיבית - ונקבל עוצמה קטנה יותר.
ברירת המחדל של העוצמה ושל אלפא
ברירת המחדל של העוצמה היא 80% ושל אלפא - 0.05
צריך לדעת מה האפקט של התופעה וסטיית התקן של התופעה מראש - מהספרות
ולפי הידיעה של כל הנ”ל, נקבע את גודל המדגם הדרוש לצורך קיום של אלפא 5 ובטא 80%
משתנה קטגוריאלי או נומינאלי
משתנה שמתחלק בין קבוצות שונות כאשר בין הקבוצות אין היררכיה - לדוגמא ערי מגורים
משתנה אורדינאלי
משתנה שמחלק את המשתנים בין קבוצות שונות אך יש
משמעות וסדר לקטגוריות - למשל דירוג שביעות רצון.
אין חשיבות למרווחים בין הקבוצות השונות
משתנה כמותי
מדרג את המשתנים על פי סדר, כאשר הרווח בין המשתנים הוא חשוב - לדוגמא שנות לימוד.
יכול להיות רציף כמו גובה או בדיד כמו מס נפשות במשפחה
מבחן סטטיסטי פרמטרי לעומת אפרמטרי
מבחן פרמטרי מתבצע על משתנה כמותי שניתן להניח שמתפלג נורמלית.
אם 2 ההנחות האלה לא מתקיימות נבצע מבחן אפרמטרי
מבחנים סטטיסטיים למשתנים קטגוריאליים
- OR
- RR
- חי בריבוע
- פישר/ likelihood ratio
מבחנים סטטיסטיים למשתנים רציפים או אורדינאליים
- מתאם פירסון כאשר ניתן להניח נורמליות והמשתנים כמותיים. זהו מבחן בו מחשבים את מקדם המתאם של פירסון - נע בין מינוס 1 ל-1, מעיד גם על כיוון הקשר וגם על עוצמת הקשר.
- מתאם ספירמן - כאשר המדגם קטן מדי ולא ניתן להניח נורמליות או כאשר המשתנים הם אודינאליים. ספירמן הוא מדד קשר אפרמטרי ומבוסס על הדרגות של הערכים במקום על הערכים עצמם. גם מתאם ספירמן נותן מקדם מתאם עם טווח של בין מינוס 1 ל-1.