סטטיסטיקה היסקית Flashcards

1
Q

מה בודקים בבדיקת השערות? וכיצד?

A

האם אוכלוסיית המחקר שמיוצגת במדגם זהה לאוכלוסייה כללית שהפרמטר הרלבנטי שלה ידוע

ההשוואה שנערכת היא בין ממוצע המדגם לממוצע האוכלוסייה הכללית, לפיכך התפלגות הדגימה הרלבנטית תהיה התפלגות של ממוצעי מדגמים

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

בדיקת השערות
השערת האפס H0
השערה ניסויית H1

A

עבור כל שאלת מחקר יש לנסח שתי השערות מנוגדות

השערת האפס - האוכלוסייה הנחקרת אינה נבדלת מהאוכלוסייה הכללית, ההבדל שנמצא הינו מקרי

השערה ניסויית - האוכלוסייה הנחקרת נבדלת מהאוכלוסייה הכללית והיא בעלת פרמטרים שונים

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

התפלגות הדגימה

A

כלי סטטיסטי - התפלגות ערכי סטטיסטי מסוים שחושב אין סוף מדגמים בגודל N
מתוך אוכלוסייה מסוימת

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

תכונות ההתפלגות:

A

תוחלת - תוחלת התפלגות הדגימה שווה לתוחלת האוכלוסייה

שונות - התפלגות של הממוצעים הייתה צרה יותר מהתפלגות של האוכלוסייה: עבור כל גודל מדגם הגדול מ1, שונות התפלגות הדגימה תהיה קטנה משונות האוכלוסייה.
ככל שאני מגדילה את N
השונות קטנה: שונות ההתפלגות הדגימה קטנה פי N

טעות תקן - סטיות התקן של התפלגות הדגימה והיא מושפעת מ2 גורמים:
טעות תקן תלויה בערכה של סטיות התקן באוכלוסייה, ככל שס”ת קטנה יותר אז טעות התקן קטנה יותר.
טעות התקן מושפעת מגודל המדגם. ככל שגודל המדגם גדול יותר אז טעות התקן קטנה יותר

גודל המדגם - לפחות 30

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

השפעות גודל המדגם:

A

ככל שN
גדל, כל איקס גג פוטנציאלי יהיה קרוב יותר לתוחלת.

ככל שגודל המדגם יגדל, שונות התפלגות הדגימה תקטן

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

אומד עקבי

A

אומד יוגדר כעקבי כאשר הסיכוי שאומדן ספציפי המחושב במדגם יהיה קרוב לממוצע האוכלוסייה גדל ככל שגודל המדגם מתקרב לגודל האוכלוסייה

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

אומד חסר הטיה

A

אומד יוגדר כחסר הטיה אם התוחלת שלו תהיה שווה לפרמטר הנאמד.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

מבחן זד לבדיקת השערות - Z
שלבי התהליך

A

א. הנחות, דגימה ואיסוף נתונים - בשביל ביצוע מבחן זד דרושים נתוני מדגם ונתוני אוכלוסייה, צריך להתקיים גם הנחות בסיסיות: המדגם נדגם באופן מקרי, לכן ניתן להניח שהוא מייצג את האוכלוסייה.
התפלגות המשתנה הנחקר באוכלוסייה נורמלית, או שהמדגם גדול או שווה ל30 לכן נניח שהתפלגות הדגימה של הממוצע מתפלגת נורמלית.

ב. ניסוח השערות וכיוון השערות - מטרת המחקר לבדוק את הטענה שהמדגם מייצג את האוכלוסייה שונה מהאוכלוסייה הכללית, לכן מנוסחות 2 השערות: טענת החוקר נכונה או שגויה. במידה ולא ניתן להניח על כיוון ההבדל מראש, השערת הניסוי תהיה השערה דו צדדית.

ג. רמת מובהקות ורמת ביטחון - ההחלטה אם לדחות את השערת האפס או לא, מתבצעת באמצעות בחירת רמת מובהקות.
רמת ביטחון - ערך המשלים לרמת המובהקות שנקבעה לפני הניסוי

ד. ביצוע המבחן - בניית התפלגות הדגימה, קביעת אזורי דחייה ואי דחייה

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

ערך קריטי

A

הערך הקריטי מהווה את הגבול של אזור הדחיייה, הערך שכל ממוצע קיצוני ממנו יביא לדחיית השערת האפס.
בציון תקן קריטי - בהשערה דו צדדית שני ציוני התקן הקריטיים יהיו שווים בערכם המוחלט שכן התפלגות הדגימה היא סימטרית והשטחים שמעבר להם שווים זה לזה.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

מהו הערך הקריטי בציוני תקן בהשערה חד זנבית שמאלית?

A

Z = -1.65

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

מהו הערך הקריטי בציוני תקן בהשערה חד זנבית ימנית?

A

Z = 1.65

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

מהו הערך הקריטי בציוני תקן בהשערה דו זנבית?

A

Z = 1.96
והתחתון
Z = -1.96

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

טעות מסוג ראשון

A

דחיית השערת האפס למרות שהייתה נכונה

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

טעות מסוג שני

A

לא דחיתי את השערת האפס למרות שהיא לא נכונה

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

גורמים המשפיעים על עוצמת המבחן

A

א. רמת מובהקות - היחס בין הסיכוי לטעות מסוג ראשון לסיכוי לטעות מסוג שני הוא יחס הפוך. ככל שנקטין את אלפא נגדיל את בטא אך לא להיפך.
כשאני מגדילה את אלפא - הסיכוי לפספס נמוך ועוצמת המבחן תגדל
ב. גודל האפקט - ככל שהאפקט גדול יותר, בטא קטנה יותר ועוצמת המבחן גדלה.
ג. טעות התקן - ככל שטעות תקן קטנה התפלגויות הופכות לצרות יותר ומובחנות יותר.

טעות התקן מושפעת מסטיית התקן באוכלוסייה וגודל המדגם

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

מתי מבצעים מבחן טי או מבחן זד

A

מבחן זד מבצעים כשנתון לי הממוצע וסטיית התקן. אך לרוב סטיית התקן של האוכלוסייה אינה ידועה. במצב בו שונות האוכלוסייה וסטיית התקן אינן ידועות, המבחן הסטטיסטי המתאים הוא מבחן טי.

17
Q

התפלגות טי

A

משפחה של התפלגויות סימטריות עם ממוצע אפס ושונות קצת יותר גדולה מ1

18
Q

שונות של מי גדולה יותר ? טי או זד?

A

שונות ההתפלגות בטי גדולה יותר. עבור אותה רמת מובהקות אצטרך לעשות שימוש בערך קריטי קיצוני יותר.
אם ערך הטי שלי קיצוני יותר, קשה לי יותר לקבל תוצאה מובהקת ועוצמת המבחן נמוכה יותר בהשוואה לזד

19
Q

מבחן טי לשני מדגמים

A

מבחן טי לשני מדגמים מאפשר הסקה סטטיסטית כאשר לא ידוע ממוצע האוכלוסייה.

20
Q

מבחן טי לשני מדגמים בלתי תלויים

A

מבחן זה משמש להשוואת ממוצעי שתי אוכלוסיות שאינן תלויות זו בזו ושהתוחלות שלהן אינן ידועות. במבחן זה כל אחת מהקבוצות מייצגת אוכלוסייה אחרת. במבחן טי הפרמטר שייבחן הוא הפרש הממוצעים בין שתי האוכלוסיות ואם ההפרש שונה מאפס אז האוכלוסיות נבדלות זו מזו בממוצעיהן.

21
Q

מבחן טי למדגמים תלויים או מזווגים

A

מאפשר הסקה סטטיסטית כשסטיית התקן וממוצע האוכלוסייה אינם ידועים. אולם במבחן זה נערכת השוואה תצפיות בשתי קבוצות, כאשר לכל תצפית בקבוצה אחת יש תצפית מקבילה בקבוצה השנייה. לפיכך, המדידה במבחן זה עוסקת בממוצע ההפרשים בין כל זוג תצפיות.

22
Q

רווח בר סמך

A

מספק אומדן לתוחלת האוכלוסייה ברמת ביטחון מסוימת

23
Q

גורמים המשפיעים על גודלו של רווח הסמך

A

ממוצע המדגם - משפיע על מרכז רווח הסמך, הרווח נבנה באופן סימטרי סביב הממוצע. גודל הרווח, כלומר הטווח שנבנה מסביב לממוצע המדגם תלוי בטעות התקן ורמת הביטחון.

רמת הביטחון - ישפיע על כמה הרווח שלי רחב או צר. ככל שרמת הביטחון גדולה יותר ערך הזד גדול יותר ורווח הסמך יגדל

סטיות התקן באוכלוסייה - ככל שסטיית התקן באוכלוסייה קטנה יותר, רווח הסמך יקטן. סטיית תקן קטנה יותר באוכלוסייה מעידה למעשה על התפלגות דגימה צרה יותר, בצורה שמעלה את הסבירות לקבל במקרה ממוצע מדגם הקרוב יותר לתוחלת האוכלוסייה

גודל המדגם - ככל גדול יותר, טעות התקן קטנה יותר ורווח הסמך יקטן

23
Q

גורמים המשפיעים על גודלו של רווח הסמך

A

ממוצע המדגם - משפיע על מרכז רווח הסמך, הרווח נבנה באופן סימטרי סביב הממוצע. גודל הרווח, כלומר הטווח שנבנה מסביב לממוצע המדגם תלוי בטעות התקן ורמת הביטחון.

רמת הביטחון - ישפיע על כמה הרווח שלי רחב או צר. ככל שרמת הביטחון גדולה יותר ערך הזד גדול יותר ורווח הסמך יגדל

סטיות התקן באוכלוסייה - ככל שסטיית התקן באוכלוסייה קטנה יותר, רווח הסמך יקטן. סטיית תקן קטנה יותר באוכלוסייה מעידה למעשה על התפלגות דגימה צרה יותר, בצורה שמעלה את הסבירות לקבל במקרה ממוצע מדגם הקרוב יותר לתוחלת האוכלוסייה

24
Q

האם כשהתוצאה לא מובהקת (נופלת באיזור הדחייה) הרווח מכיל את התוחלת או לא?

A

הרווח לא מכיל את התוחלת מאחר וזהו מדגם קיצוני.
כשהממוצע קיצוני אקבל רווח שלא מכיל את התוחלת

25
Q

מדד די של כהן

A

מדד לגודל אפקט המתאים למערך עם קבוצה אחת או שתיים. כלומר עבור המבחנים הסטטיסיטים, מבחני זד וטי למדגם בודד, למדגמים בלתי תלויים ומזווגים, כהן די יהיה המדד לחישוב גודל האפקט.

26
Q

מתי משתמשים במבחנים א-פרמטריים?

A

כשהמשתנה התלוי בסולם שמי או סדר ולא ניתן לחשב עבורו את המדדים שונות וממוצע.

כשלא ניתן להניח את ההנחות הדרושות לקיום המבחן הפרמטרי.