סטטיסטיקה תיאורית Flashcards
סולם שמי/נומינלי
משתנה שלערכיו אין כלל משמעות כמותית או של גודל יחסי. לא ניתן לומר שערך מסוים הינו גדול או קטן לעומת ערך אחר. מסיבה זו, ערכיו של משתנה שמי לרוב יצוינו במילים למשל - צבע שיער : שחור, צהוב, כתום
סולם סדר/אורדינלי
משתנה שאין לו משמעות כמותית והוא אינו נמדד באמצעות יחידות מדידה אבסולוטיות בדומה לסולם שמי, אולם ערכיו מבטאים גודל יחסי. במשתני סדר ניתן לומר כי ערך מסוים הוא יותר או פחות מערך אחר, אל לא ניתן לומר
בכמה יותר או פחות.
למשל- דירוג רמת החיבה לממתקים ; אוהב, אוהב מאוד וכו’
סולם רווח
במשתנים מסולם רווח יש משמעות כמותית לא רק לערכים עצמם, אלא גם להפרשים ביניהם. הערכים בסולם זה נמדדים באמצעות יחידות מדידה אבסולוטיות ולכן לרווחים שבין הערכים ישנה משמעות קבועה.
דוגמה - טמפרטורה
סולם יחס/מנה
לערכים במשתנה מסולם יחס/מנה יש משמעות כמותית. ההפרשים ביניהם קבועים וגם היחס ביניהם הוא בעל משמעות. ההבדל בין סולם יחס/מנה ובין סולם רווח טמון בכך שבסולם יחס/מנה ניתן לדבר על יחס בין ערכים. הבדל זה נובע מכך שבסולם יחס/מנה נקודת האפס היא קבועה ומוחלטת ומייצגת את היעדר התופעה הנמדדת.
שכיח (MODE)
הערך הנפוץ ביותר בהתפלגות. השכיח ניתן לחישוב עבור כל סוגי הסולמות ועבור משתנים איכותיים וכמותיים כאחד.
חציון (MEDIAN)
החציון הוא הערך המחלק את ההתפלגות לשניים, כך שמחצית הערכים שווים לו או גדולים ממנו, ומחציתם שווים לו או קטנים ממנו. החציון ניתן לחישוב מסולם סדר ומעלה. כלומר עבור משתנים כמותיים
אמצע הטווח (MID-RANGE)
אמצע הטווח הוא הממוצע שבין הערך הגבוה ביותר בהתפלגות והערך הנמוך ביותר בהתפלגות
ממוצע (MEAN)
הממוצע הוא סכום כל הערכים בהתפלגות חלקי מספר האיברים. הוא מדד מיקום מרכזי והוא מושפע ומכל הערכים בהתפלגות.
הערות לגבי ממוצע
הממוצע הינו הערך שסכום הסטיות של ערכי הסדרה ממנו שווה לאפס, כלומר סכום ההפרשים בין הממוצע לערכים הגדולים ממנו שווה בדיוק לסכום ההפרשים בין הממוצע לערכים הקטנים ממנו.
לא ניתן לחשב ממוצע בהתפלגות בעלת מחלקות פתוחות
הממוצע אינו בהכרח ערך הקיים בהתפלגות
אחוז השגיאות
ערכו של מדד פיזור זה נקבע לפי אחוז התצפיות בהתפלגות שאינן שייכות לקטגוריה השכיחה ביותר. הוא משמש בעיקר עבור משתנים איכותיים
טווח (RANGE)
הטווח שווה למרחק שבין הערך הגבוה ביותר בהתפלגות ובין הערך הנמוך ביותר בה. מכיוון שהטווח מתייחס להפרש בין ערכים, הוא מחייב ערכים כמותיים וניתן לחישוב על משתנה כמותי מסולם רווח או יחס/מנה
שונות וסטיית תקן
שונות ההתפלגות מוגדרת כממוצע ריבועי הסטיות של ערכי ההתפלגות מהממוצע. השונות מתארת את מידת הפיזור של הערכים בהתפלגות סביב הממוצע שלהם, כלומר היא מתארת עד כמה ערכי ההתפלגות קרובים או רחוקים מהממוצע. בשביל לחשב את השונות יש לחשב קודם את ממוצע ההתפלגות ולאחר מכן לסכום יחד את המרחק הריבועי של כל הערכים מהממוצע, ומחלקים במספר הערכים (תצפיות)
סטיית תוקן הינה שורש של השונות
מקדם ההשתנות CV
מכיוון שגודלה של סטיית התקן תליו בסדר גודל של הערכים בהתפלגות, ההשוואה בין סטיות תקן שונות מהתפלגויות שונות היא חסרת משמעות, אלא אם מדובר בהתפלגויות ערכים באותם סדרי גודל.
מקדם ההשתנות הוא מדד פיזור הפותר את בעיית השוואת השונות/סטיית התקן בין ההתפלגויות השונות בכך שהוא מנטרל את השפעת סדר הגודל של ערכי הממוצעים על סטיות התקן ומאפשר להשוות בין פיזורים שונים של התפלגויות בעלות ערכים בסדרי גודל שונים. על מנת לחשב את מקדם ההשתנות יש לחל’ את סטיית התקן של ההתפלגות בממוצע שלה.
ציון תקן Z
ציון תקן הוא מדד מיקום יחסי הממקם את ערכי ההתפלגות ביחס לממוצע ההתפלגות במונחים של סטיות תקן. באמצעות ציוני תקן ניתן לקבוע האם תצפית מסוימת הינה גבוהה מהממוצע או נמוכה ממנו ומה המרחק ביניהם במונחים של סטיות תקן.
מחשבים זאת כך: ציון התקן של תצפית מסוימת פחות הממוצע של ההתפלגות חלקי סטיית תקן
חידודים נוספים על ציון תקן
ציון תקן שלילי משמעו שהציון הגולמי נמוך מהממוצע
ציון תקן חיובי משמעו שהציון הגולמי גבוה מהממוצע
עבור ציון השווה לממוצע נקבל ציון תקן 0