סטטיסטיקה היסקית Flashcards
מה בודקים בבדיקת השערות? וכיצד?
האם אוכלוסיית המחקר שמיוצגת במדגם זהה לאוכלוסייה כללית שהפרמטר הרלבנטי שלה ידוע
ההשוואה שנערכת היא בין ממוצע המדגם לממוצע האוכלוסייה הכללית, לפיכך התפלגות הדגימה הרלבנטית תהיה התפלגות של ממוצעי מדגמים
בדיקת השערות
השערת האפס H0
השערה ניסויית H1
עבור כל שאלת מחקר יש לנסח שתי השערות מנוגדות
השערת האפס - האוכלוסייה הנחקרת אינה נבדלת מהאוכלוסייה הכללית, ההבדל שנמצא הינו מקרי
השערה ניסויית - האוכלוסייה הנחקרת נבדלת מהאוכלוסייה הכללית והיא בעלת פרמטרים שונים
התפלגות הדגימה
כלי סטטיסטי - התפלגות ערכי סטטיסטי מסוים שחושב אין סוף מדגמים בגודל N
מתוך אוכלוסייה מסוימת
תכונות ההתפלגות:
תוחלת - תוחלת התפלגות הדגימה שווה לתוחלת האוכלוסייה
שונות - התפלגות של הממוצעים הייתה צרה יותר מהתפלגות של האוכלוסייה: עבור כל גודל מדגם הגדול מ1, שונות התפלגות הדגימה תהיה קטנה משונות האוכלוסייה.
ככל שאני מגדילה את N
השונות קטנה: שונות ההתפלגות הדגימה קטנה פי N
טעות תקן - סטיות התקן של התפלגות הדגימה והיא מושפעת מ2 גורמים:
טעות תקן תלויה בערכה של סטיות התקן באוכלוסייה, ככל שס”ת קטנה יותר אז טעות התקן קטנה יותר.
טעות התקן מושפעת מגודל המדגם. ככל שגודל המדגם גדול יותר אז טעות התקן קטנה יותר
גודל המדגם - לפחות 30
השפעות גודל המדגם:
ככל שN
גדל, כל איקס גג פוטנציאלי יהיה קרוב יותר לתוחלת.
ככל שגודל המדגם יגדל, שונות התפלגות הדגימה תקטן
אומד עקבי
אומד יוגדר כעקבי כאשר הסיכוי שאומדן ספציפי המחושב במדגם יהיה קרוב לממוצע האוכלוסייה גדל ככל שגודל המדגם מתקרב לגודל האוכלוסייה
אומד חסר הטיה
אומד יוגדר כחסר הטיה אם התוחלת שלו תהיה שווה לפרמטר הנאמד.
מבחן זד לבדיקת השערות - Z
שלבי התהליך
א. הנחות, דגימה ואיסוף נתונים - בשביל ביצוע מבחן זד דרושים נתוני מדגם ונתוני אוכלוסייה, צריך להתקיים גם הנחות בסיסיות: המדגם נדגם באופן מקרי, לכן ניתן להניח שהוא מייצג את האוכלוסייה.
התפלגות המשתנה הנחקר באוכלוסייה נורמלית, או שהמדגם גדול או שווה ל30 לכן נניח שהתפלגות הדגימה של הממוצע מתפלגת נורמלית.
ב. ניסוח השערות וכיוון השערות - מטרת המחקר לבדוק את הטענה שהמדגם מייצג את האוכלוסייה שונה מהאוכלוסייה הכללית, לכן מנוסחות 2 השערות: טענת החוקר נכונה או שגויה. במידה ולא ניתן להניח על כיוון ההבדל מראש, השערת הניסוי תהיה השערה דו צדדית.
ג. רמת מובהקות ורמת ביטחון - ההחלטה אם לדחות את השערת האפס או לא, מתבצעת באמצעות בחירת רמת מובהקות.
רמת ביטחון - ערך המשלים לרמת המובהקות שנקבעה לפני הניסוי
ד. ביצוע המבחן - בניית התפלגות הדגימה, קביעת אזורי דחייה ואי דחייה
ערך קריטי
הערך הקריטי מהווה את הגבול של אזור הדחיייה, הערך שכל ממוצע קיצוני ממנו יביא לדחיית השערת האפס.
בציון תקן קריטי - בהשערה דו צדדית שני ציוני התקן הקריטיים יהיו שווים בערכם המוחלט שכן התפלגות הדגימה היא סימטרית והשטחים שמעבר להם שווים זה לזה.
מהו הערך הקריטי בציוני תקן בהשערה חד זנבית שמאלית?
Z = -1.65
מהו הערך הקריטי בציוני תקן בהשערה חד זנבית ימנית?
Z = 1.65
מהו הערך הקריטי בציוני תקן בהשערה דו זנבית?
Z = 1.96
והתחתון
Z = -1.96
טעות מסוג ראשון
דחיית השערת האפס למרות שהייתה נכונה
טעות מסוג שני
לא דחיתי את השערת האפס למרות שהיא לא נכונה
גורמים המשפיעים על עוצמת המבחן
א. רמת מובהקות - היחס בין הסיכוי לטעות מסוג ראשון לסיכוי לטעות מסוג שני הוא יחס הפוך. ככל שנקטין את אלפא נגדיל את בטא אך לא להיפך.
כשאני מגדילה את אלפא - הסיכוי לפספס נמוך ועוצמת המבחן תגדל
ב. גודל האפקט - ככל שהאפקט גדול יותר, בטא קטנה יותר ועוצמת המבחן גדלה.
ג. טעות התקן - ככל שטעות תקן קטנה התפלגויות הופכות לצרות יותר ומובחנות יותר.
טעות התקן מושפעת מסטיית התקן באוכלוסייה וגודל המדגם